ES2634621T3 - Aparato y procedimiento para generar una señal de audio o imagen codificada o para descodificar una señal de audio o imagen codificada en presencia de transitorios utilizando una parte de superposición múltiple - Google Patents

Aparato y procedimiento para generar una señal de audio o imagen codificada o para descodificar una señal de audio o imagen codificada en presencia de transitorios utilizando una parte de superposición múltiple Download PDF

Info

Publication number
ES2634621T3
ES2634621T3 ES14706528.8T ES14706528T ES2634621T3 ES 2634621 T3 ES2634621 T3 ES 2634621T3 ES 14706528 T ES14706528 T ES 14706528T ES 2634621 T3 ES2634621 T3 ES 2634621T3
Authority
ES
Spain
Prior art keywords
window
frame
windows
block
window function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES14706528.8T
Other languages
English (en)
Inventor
Christian Helmrich
Jérémie Lecomte
Goran MARKOVIC
Markus Schnell
Bernd Edler
Stefan REUSCHL
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2634621T3 publication Critical patent/ES2634621T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3002Conversion to or from differential modulation
    • H03M7/3044Conversion to or from differential modulation with several bits only, i.e. the difference between successive samples being coded by more than one bit, e.g. differential pulse code modulation [DPCM]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

Aparato para generar una señal codificada de audio o imagen en presencia de transitorios, que comprende: un controlador de secuencia de ventanas (808) para generar una información de secuencia de ventanas (809) para segmentar en ventanas una señal de audio o imagen, la información de secuencia de ventanas que indica una primera función ventana (1500) para generar una primera trama de valores espectrales, una segunda función ventana (1502) y al menos una tercera función ventana (1503) para generar una segunda trama de valores espectrales que tiene una primera y una segunda partes, en donde la primera función ventana (1500), la segunda función ventana (1502) y la una o más terceras funciones ventana se superponen dentro de una zona de superposición múltiple (1300); un preprocesador (802) para segmentar en ventanas (902) un segundo bloque de muestras correspondiente a la segunda función ventana y una o más terceras funciones ventana que utilizan una función ventana auxiliar (1100) para obtener un segundo bloque de muestras segmentadas en ventanas, y para preprocesar (904) el segundo bloque de muestras segmentadas en ventanas utilizando una operación de plegamiento de una parte del segundo bloque que se superpone con un primer bloque en la parte de superposición múltiple (1300) para obtener un segundo bloque preprocesado de muestras segmentadas en ventanas que tienen una parte modificada de superposición múltiple; un convertidor espectral (804) para aplicar una transformadas de introducción de aliasing (906) al primer bloque de muestras utilizando la primera función ventana (1500) y obtener la primera trama de valores espectrales, para aplicar otra transformada de introducción de aliasing a una primera parte del segundo bloque preprocesado de muestras segmentadas en ventanas utilizando la segunda función ventana (1502) y obtener una primera parte de valores espectrales de la segunda trama, y para aplicar otra o más transformadas de introducción de aliasing a una segunda parte del segundo bloque preprocesado de muestras segmentadas en ventanas utilizando una o más terceras funciones ventana (1503) y obtener una segunda parte de valores espectrales de la segunda trama; y un procesador (806) para procesar la primera trama y la segunda trama y obtener tramas codificadas de la señal de audio o imagen.

Description

DESCRIPCION
Aparato y procedimiento para generar una senal de audio o imagen codificada o para descodificar una senal de audio o imagen codificada en presencia de transitorios utilizando una parte de superposicion multiple 5
[0001] La presente invention se refiere al procesamiento de senales de audio o imagen y, en particular, a la codification o descodificacion de senales de audio o imagen en presencia de transitorios.
[0002] Los esquemas de codificacion de voz y audio actuales en el dominio de la frecuencia basados en FFT 10 superpuestas o la transformada discreta del coseno modificada (MDCT) ofrecen cierto grado de adaptation a las
caracterlsticas de senales no estacionarias. Los codecs de uso general estandarizados en MPEG, concretamente, MPEG-1 Layer 3 mejor conocido como MP3, MPEG-4 (HE-) AAC [1] y, mas recientemente, MPEG-0 xHE-AAC (USAC), as! como el codec Opus/Celt especificado por el IETF [2], permiten la codificacion de una trama utilizando una entre al menos dos longitudes de transformada diferentes - una longitud de transformada larga M para el paso 15 de senales estacionarias, u 8 transformadas cortas de longitud M/8 cada una. En el caso de los codecs MPEG, la conmutacion de transformadas largas a cortas y de cortas a largas (tambien conocido como conmutacion de bloques) requiere la utilization de transformadas de transition con ventanas asimetricas, es decir, una ventana de inicio y una ventana de finalization, respectivamente. Estas formas de transformadas, junto con otras formas conocidas de la tecnica anterior, se representan en la Figura 16. Debe observarse que la pendiente de 20 superposicion lineal es meramente ilustrativa y varla en su forma exacta. Las posibles formas de las ventanas se dan en el estandar AAC [1] y en la section 6 de [3].
[0003] Dado que, si la trama siguiente se va a codificar con transformadas cortas por un codificador MPEG, la trama actual debe codificarse con una transformada transitoria de inicio, se hace evidente que un codificador
25 implementado segun una de las normas MPEG antes mencionadas requiere por lo menos una longitud de trama de anticipation. Sin embargo, en aplicaciones de comunicacion de bajo retardo, es deseable minimizar o incluso evitar esta trama adicional por adelantado. Con este fin se han propuesto dos modificaciones al paradigma de la codificacion de proposito general. Una de ellas, adoptada por ejemplo en Celt [2], consiste en reducir la superposicion de la transformada larga a la de la transformada corta para evitar las ventanas de transicion 30 asimetricas. La otra modification que se utiliza, por ejemplo, en los esquemas de codificacion MPEG-4 (Enhanced) Low Delay AAC, es inhabilitar la conmutacion a transformadas mas cortas y, en lugar de ello, basarse en una herramienta de codificacion del modelado del ruido temporal (TNS) [4] que opera los coeficientes de la transformada larga para minimizar la propagation temporal del error de codificacion alrededor de los transitorios.
35 [0004] Ademas, al igual que xHE-AAC, Low Delay AAC permite la utilizacion de dos anchos de superposicion
de trama - la superposicion por defecto del 50% para la entrada estacionaria, o una superposicion reducida (similar a la superposicion corta de las transformadas de transiciones) para las senales no estacionarias. La superposicion reducida limita eficazmente la extension de tiempo de una transformada y, por lo tanto, su error de codificacion en el caso de cuantizacion de los coeficientes.
40
[0005] La patente US 2008/0140428A1 cedida a Samsung Electronics Co., as! como las patentes US 5502789 y 5819214 cedidas a Sony Corp., describen unidades de determination del tamano de transformada o del tamano de ventana adaptable a la senal. Sin embargo, las unidades de transformador controladas por dichas unidades de determinacion del tamano de transformador o dicha ventana operan en valores de subbandas QMF o
45 LOT (lo que implica que los sistemas descritos emplean tanto bancos de filtros en cascada como transformadas) en contraposition a trabajar directamente con la senal de entrada en el dominio del tiempo de la banda completa, como en el presente caso. Ademas, en 2008/0140428A1 no se describen detalles sobre la forma o control de la superposicion de la ventana, y en 5819214 vienen las formas de superposicion, es decir, son el resultado de la salida de la unidad de determinacion del tamano de transformada, lo cual es lo contrario a lo que propone la 50 realizacion preferida de la presente invencion.
[0006] La patente US 2010/0076754A 1 cedida a France Telecom sigue la misma motivation que la presente invencion, concretamente, ser capaz de realizar conmutacion de la longitud de transformada en escenarios de codificacion de comunicacion para mejorar la codificacion de segmentos de senal transitorios y hacerlo sin un
55 codificador extra de anticipacion. Sin embargo, mientras que dicho documento revela que el objetivo de bajo retardo se logra evitando ventanas de transicion de una longitud de transformada y posprocesando la senal reconstruida en el descodificador (desventajosamente mediante amplification de partes de la senal descodificada y, por lo tanto, el error de codificacion), la presente invencion propone una modificacion sencilla de la ventana de transicion de un sistema de la tecnica anterior que se introducira a continuation, de manera que se puede minimizar la anticipacion
adicional del codificador y se puede evitar el posprocesamiento especial del descodificador (arriesgado).
[0007] La transformada de transicion a la que se ha de aplicar una modificacion inventiva es la ventana de
inicio descrita en dos variantes de la patente US 5848391 cedida a Fraunhofer-Gesellschaft eV y Dolby Laboratories 5 Licensing Corp. as! como, de forma ligeramente diferente, en la patente US 2006/0122825A 1 cedida a Samsung Electronics Co. La Figura 16 muestra estas ventanas de inicio y revela que la diferencia entre las ventanas de Fraunhofer/Dolby y Samsung es la presencia de un segmento que no se superpone, es decir, una zona de la ventana que tiene un valor maximo constante que no pertenece a ninguna pendiente de superposicion. Las ventanas de Fraunhofer/Dolby presentan una "parte no superpuesta que tiene una longitud", las ventanas de Samsung no. Se
10 puede concluir que un codificador con la menor cantidad de anticipacion adicional, pero utilizando la conmutacion de transformada de la tecnica anterior puede realizarse empleando la estrategia de ventana de transicion de Samsung. Con dichas transformadas, una anticipacion igual al ancho de superposicion entre las transformadas cortas es suficiente para conmutar completamente de transformadas largas a cortas antes de una senal transitoria.
15 [0008] Informacion adicional sobre la tecnica anterior puede encontrarse en los documentos WO 90/09063 o
"Coding of audio signals with overlap block transform and adaptive window functions", Frequenz, Band 43, setiembre de 1989, paginas 2052 a 2056, o bien en AES Convention Paper 4929, "MPEG-4 Low Delay Audio Coding based on the AAC Codec", E. Allamanche, et al., 106 Convention, 1999.
20 [0009] Sin embargo, en funcion de la longitud de la transformada corta, la anticipacion puede permanecer
bastante grande y no debe evitarse. La Figura 17 ilustra el resultado de la conmutacion de bloques durante la situacion de entrada en el peor de los casos, es decir, la presencia de un transitorio repentino al inicio de la zona de anticipacion, que a su vez comienza al final de la pendiente larga, es decir, en la zona de superposicion en las tramas. De acuerdo con las estrategias de la tecnica anterior, al menos uno de los dos transitorios representados
25 alcanza la transformada de transicion. En un sistema de codificacion con perdida que utiliza un codificador sin anticipacion adicional - un codificador que no "ve el transitorio que viene" - esta condition provoca la propagation temporal del error de codificacion hasta el comienzo de la pendiente larga e incluso cuando se utiliza TNS, es probable que un ruido de pre-eco sea audible en la senal descodificada.
30 [0010] Las dos soluciones de anticipacion antes mencionadas tienen sus desventajas. La reduction de la
superposicion de las transformadas largas por un factor de hasta 8, por un lado, como se hace en el codificador Celt, limita severamente la eficacia (es decir, la ganancia de codificacion, la compactacion espectral) sobre el material de entrada estacionario, especialmente altamente tonal. Por otro lado, la prohibition de las transformadas cortas como en el Low Delay AAC (Enhanced) reduce el resultado de los codecs en transitorios fuertes con duraciones mucho
35 menores que la longitud de trama, lo que a menudo conduce a ruido de pre-eco o posteco audible, incluso cuando se utiliza TNS.
[0011] Por lo tanto, los procedimientos de determination de secuencia de ventanas de la tecnica anterior son suboptimos con respecto a flexibilidad debido a las longitudes de ventana restringidas, son suboptimos con respecto
40 al retardo requerido debido a los perlodos de anticipacion transitorios mlnimos requeridos, son suboptimos con respecto a la calidad de audio debido a pre-ecos o postecos, son suboptimos con respecto a la eficacia debido al preprocesamiento adicional potencialmente necesario que utiliza funcionalidades adicionales aparte de los procedimientos de segmentation en ventanas con determinadas ventanas, o son suboptimos con respecto a la flexibilidad y eficacia debido a la necesidad potencial de cambiar un raster de tramas/bloques en presencia de un
45 transitorio.
[0012] Un objetivo de la presente invention es proporcionar un concepto mejorado de
codificacion/descodificacion de audio que proporcione un resultado mejorado con respecto a, al menos uno, de los inconvenientes de la tecnica anterior.
50
[0013] Este objetivo se consigue mediante un aparato para codificar una senal de audio o imagen de la reivindicacion 1, un aparato para descodificar una senal de audio o imagen de la reivindicacion 17, un procedimiento para codificar una senal de audio o imagen de la reivindicacion 32, un procedimiento de descodificacion de una senal de audio o imagen de la reivindicacion 33, o un programa informatico de la reivindicacion 34.
55
[0014] La presente invencion se basa en el hallazgo de que, utilizando una parte de superposicion multiple, se obtiene un concepto de conmutacion de bloques de retardo particularmente bajo en presencia de transitorios.
[0015] Los aspectos de la presente invencion se basan en el hallazgo de que, para que un codec de audio o
imagen de bajo retardo sea capaz de aproximarse a la calidad de codificacion de codecs de proposito general, es util mantener un alto porcentaje de superposicion entre las transformadas largas durante las entradas de senal estacionaria y permitir la conmutacion instantanea a superposiciones y transformadas mas cortas en partes de senal de audio o imagen que rodean a senales no estacionarias. Ademas, es deseable permitir una flexibilidad algo mayor 5 que ofrecer solo una eleccion binaria con respecto al ancho de superposicion y, adicionalmente o alternativamente con respecto a las longitudes de las transformadas, de manera que el ancho de superposicion o las longitudes de la(s) transformada(s) dentro de una trama se puedan adaptar con precision en base a la ubicacion de un posible transitorio dentro de la zona temporal de la trama con el fin de minimizar pre-ecos u otros artefactos.
10 [0016] En una realizacion, un detector de ubicacion de transitorio esta configurado para identificar la
ubicacion de un transitorio dentro de una zona de anticipacion de transitorios de una trama y, en base a la ubicacion del transitorio dentro de la trama, se selecciona una ventana especlfica entre un grupo de al menos tres ventanas, donde estas tres ventanas son diferentes con respecto a sus longitudes de superposicion con las ventanas adyacentes correspondientes. De este modo, la primera ventana tiene una longitud de superposicion mayor que la 15 segunda ventana y la segunda ventana tiene una longitud de superposicion mayor que la longitud de superposicion de la tercera ventana y la tercera ventana puede, de forma alternativa, tener tambien una superposicion cero, es decir, no superposicion. La ventana especlfica se selecciona en base a la ubicacion de transitorios de manera que una de las dos ventanas superpuestas adyacentes en el tiempo tenga los coeficientes de la primera ventana en la ubicacion del transitorio y la otra de las dos ventanas superpuestas adyacentes en el tiempo tenga los coeficientes 20 de segunda ventana en la ubicacion del transitorio, en el que los segundos coeficientes son al menos nueve veces mayores que los primeros coeficientes. De este modo, se asegura que la ubicacion de transitorios sea, con respecto a la primera ventana, suficientemente suprimida y que el transitorio sea, con respecto a la segunda ventana, suficientemente capturado. En otras palabras y, preferentemente, la ventana anterior ya esta en valores cercanos a cero en la ubicacion de transitorios donde se ha detectado el transitorio y la segunda ventana tiene coeficientes de 25 ventana cercanos o iguales a uno en esta zona de modo que, durante al menos una parte del transitorio, el transitorio se suprime en la ventana anterior y no se suprime en la ventana posterior o siguiente.
[0017] En un ejemplo, las longitudes de superposicion son diferentes por factores enteros, de manera que la segunda longitud de superposicion es, por ejemplo, igual a la mitad de la tercera longitud de superposicion y la
30 tercera longitud de superposicion es igual a la mitad de la segunda longitud de superposicion, o es diferente de la segunda longitud de superposicion por un factor diferente pero es mayor o igual a, al menos 64 muestras, o es mayor o igual a, al menos 32, muestras o es mayor o igual a, al menos incluso, 16 muestras de audio o imagen.
[0018] La seleccion de ventana obtenida a partir de la ubicacion de transitorios se transmite junto con las 35 tramas de la senal de audio o imagen de manera que un descodificador pueda seleccionar las ventanas de slntesis
correspondientes en llnea con la seleccion de codificador de las ventanas de analisis, asegurandose de que el codificador y el descodificador estan sincronizados durante toda la operacion de codificacion/ descodificacion.
[0019] En un ejemplo, un dispositivo de segmentacion en ventanas controlable, un convertidor, un detector de 40 ubicacion de transitorios y un controlador forman un aparato para codificar y el convertidor aplica cualquiera de las
transformadas de introduccion de aliasing conocidas tales como una MDCT (transformada discreta del coseno modificada), un DST (transformada discreta del seno modificada), o cualquier otra transformadas similar. En el lado del descodificador, un procesador coopera con un convertidor controlable para convertir una secuencia de bloques de valores espectrales en una representation en el dominio del tiempo utilizando un procesamiento de suma de 45 superposicion de acuerdo con secuencias de ventanas indicadas por la information de una ventana recibida en el descodificador.
[0020] En funcion de la implementation, se puede implementar una conmutacion de longitud de una transformada ademas de la seleccion de superposicion de la transformada, de nuevo en base a la ubicacion de
50 transitorios dentro de la trama. Mediante la implementacion de una section de superposicion multiple en la que al menos tres ventanas se superponen entre si, se logra un concepto de codec de retardo muy bajo que, de nuevo, reduce sustancialmente el retardo de anticipacion de transitorios requerido con respecto a conceptos anteriores. En una implementacion adicional, se prefiere realizar en primer lugar una seleccion de superposicion y, posteriormente, adoptar una decision de longitud de transformada para determinar un codigo de superposicion para cada trama. De 55 forma alternativa, la decision de conmutacion de longitud de transformada puede hacerse independientemente de la decision de ancho de superposicion y, sobre la base de estas dos decisiones, se determina un codigo de superposicion. Basandose en el codigo de superposicion de una trama actual y el codigo de superposicion de una trama anterior, se realiza una seleccion de secuencia de ventanas para un transitorio especlfico, en base a la cual un codificador, as! como un descodificador, funcionan sincronizados entre si.
[0021] En un aspecto principal de la invencion, un controlador de secuencia de ventanas, un preprocesador y un convertidor espectral conjuntamente constituyen un aparato para generar una senal codificada, en la que tres ventanas tienen una parte de superposicion multiple. Esta parte de superposicion multiple en la que no solo dos
5 ventanas, como en la tecnica anterior, sino tres ventanas se superponen entre si, permite un concepto de retardo muy bajo por el hecho de que el retardo requerido debido a la anticipacion transitoria se reduce aun mas. Un descodificador correspondiente esta formado por un procesador descodificador, un convertidor de tiempo y un posprocesador. El posprocesador y el preprocesador realizan operaciones adicionales de segmentacion en ventanas utilizando una misma ventana auxiliar en el lado del codificador y en el lado del descodificador, de modo que se 10 puede obtener una implementacion eficaz particularmente en dispositivos moviles o dispositivos de bajo coste en los que se requiere el almacenamiento en una ROM o RAM lo mas pequeno posible.
[0022] Las realizaciones preferidas se basan en una secuencia de ventanas especlfica y una interaccion especlfica de ventanas que tienen diferentes longitudes, de manera que una ventana de longitud corta se "coloca"
15 en el transitorio con el fin de evitar pre-ecos o postecos largos. Para asegurarse de que la parte de superposicion multiple no da lugar a artefactos de audio o imagen, el preprocesador en el lado del codificador realiza una operacion de segmentacion en ventanas utilizando la funcion ventana auxiliar y una operacion de preprocesamiento utilizando una operacion de plegamiento para obtener una superposicion multiple modificada que, a continuacion, se transforma en el dominio espectral utilizando una transformada de introduccion de aliasing. En el lado del 20 descodificador, se configura un posprocesador correspondiente para realizar una operacion de despliegue posterior a las transformadas correspondientes en la representation temporal y, despues de la operacion de despliegue, una operacion se segmentacion en ventanas utilizando la funcion ventana auxiliar y una funcion que anade una superposicion final con un bloque precedente de muestras originadas por una operacion basada en ventanas con una ventana larga.
25
[0023] A diferencia de los sistemas de codification existentes, que emplean solo una selection binaria de ancho de superposicion de transformadas (grande/maximo o pequeno), la realization propone un conjunto de tres anchos de superposicion a partir de los cuales un codificador puede elegir una base por trama (u opcionalmente, por transformada): superposicion maxima, superposicion media o superposicion minima. La superposicion maxima
30 podrla ser igual a la longitud de la trama como para las transformadas largas en AAC, es decir, el 50% de superposicion, pero tambien podrla equivaler a la mitad de la longitud de la trama, es decir, el 33% de superposicion o menos.
[0024] En consecuencia, la superposicion minima podrla indicar un ancho de superposicion de cero, es decir, 35 sin superposicion, pero tambien podrla representar un superposicion superior a cero de un numero muy pequeno de
muestras de tiempo o milisegundos, como demostrara dicha realizacion preferida. Finalmente, la superposicion media podrla ser, pero no necesariamente tiene que ser, la mitad de la superposicion maxima.
[0025] En particular, se define una unidad de determination de ancho de superposicion que selecciona para 40 cada trama (u, opcionalmente, para cada transformadas dentro de una trama) una de los tres anchos de
superposicion posibles. Mas precisamente, dicha unidad de determinacion de ancho de superposicion tiene como entrada la salida de una unidad de detection de transitorios para identificar con suficiente precision la position de un transitorio dentro de la trama actual (u, opcionalmente, dentro de una transformada en la trama actual) y obtener un ancho de superposicion de manera que se consigan al menos uno de los dos objetivos:
45
- El ancho se elige de manera que solo una de las transformadas superpuestas contiene el transitorio.
- Se suprimen en gran medida los pseudotransitorios debido al modelado TNS del error de codificacion con aliasing en el tiempo.
50 [0026] En otras palabras, el ancho de superposicion se determina con el objetivo de impedir la distorsion del
pre-eco o posteco alrededor de un transitorio codificado perceptualmente situado en la trama dada. Debe observarse que es posible un cierto grado de libertad con respecto a los medios para determinar la ubicacion exacta del transitorio. El tiempo o Indice de subbloque que designa una ubicacion de transitorios podrla ser igual al inicio (comienzo) de esa ubicacion de transitorio, como en una realizacion preferida, pero tambien podrla ser la ubicacion 55 de la energla o amplitud maxima, o el centro de energla, del transitorio.
[0027] Ademas, a diferencia de los esquemas de codificacion de la tecnica anterior que obtienen las
superposiciones entre-transformadas instantaneas a partir de la seleccion dada de longitudes de transformada para un par de tramas (es decir, el ancho de superposicion viene a continuacion de la salida de una unidad de
determinacion del tamano de transformada), en determinadas condiciones que se examinaran a continuacion, controlar u obtener la longitud o longitudes de las transformadas que se utilizaran para una trama particular utilizando el ancho de superposicion atribuida a esa trama y, opcionalmente, el ancho de superposicion de la trama anterior (es decir, el tamano de la transformada va detras de la unidad de determinacion del ancho de 5 superposicion).
[0028] Una mejora de los esquemas de conmutacion de bloques de la tecnica anterior es una modification ventajosa de las transformadas transitorias de la Figura 16, que permite que la anticipation adicional del codificador necesaria para un funcionamiento con calidad estable durante las senales no estacionarias se reduzca a la mitad.
10 Como se ha expuesto anteriormente, las ventanas de inicio propuestas por Fraunhofer/ Dolby o por Samsung se caracterizan por la presencia o ausencia, respectivamente, de una "parte no superpuesta que tiene una longitud". La realization va incluso mas alla y permite que las pendientes de superposicion izquierda y derecha de la ventana de transition se extiendan entre si. En otras palabras, la transformada de transition modificada presenta una zona de "doble superposicion" de longitud no cero en la que se superpone tanto con la transformada larga de la trama 15 anterior como con la siguiente transformada corta. La forma resultante de la transformada de transicion de la invention se ilustra en la Figura 13. En comparacion con la ventana de transicion de Samsung que se muestra en la Figura 17, esta claro que al permitir una zona de "superposicion doble" en la transformada, la pendiente de superposicion corta en el extremo derecho de la transformada puede desplazarse a la izquierda por (y por lo tanto la anticipacion necesaria del codificador se puede reducir por) la mitad del ancho de superposicion de la transformada 20 corta. La longitud reducida de dicha ventana de transicion modificada presenta tres ventajas cruciales que facilitan la implementation, especialmente en dispositivos moviles:
El kernel de la transformada, es decir, la longitud del vector de coeficientes resultante de la transformada superpuesta en tiempo/frecuencia (preferentemente MDCT), es exactamente la mitad del ancho de la zona de 25 superposicion entre dos transformadas largas. Dado el hecho de que dicho ancho de superposicion largo generalmente es igual a la longitud de la trama o la mitad de la longitud de la trama, esto implica que la ventana de transicion de la invencion y las ventanas cortas subsiguientes encajan perfectamente en la matriz de la trama y que todos los tamanos de transformadas del codec resultante estan relacionados con un factor de potencia de dos enteros, como se ve en la Figura 13.
30
- Ambas ubicaciones de transitorios representadas en la Figura 17 y de nuevo en la Figura 13 se encuentran fuera de la transformada de transicion, por lo que una dispersion temporal del error de codification debido a los transitorios puede restringirse dentro de la extension de las dos primeras ventanas cortas despues de la transformada. Por lo tanto, contrariamente a los esquemas Fraunhofer/Dolby y Samsung de la tecnica anterior, es improbable que se
35 produzca ruido pre-eco audible alrededor de los transitorios cuando se usa la estrategia de conmutacion de bloques de la invencion de la Figura 13.
- Tanto el codificador como el descodificador pueden utilizar las mismas ventanas para las transformadas directa e inversa. En un dispositivo de comunicacion que realiza tanto codificacion como descodificacion, solo se necesita almacenar un conjunto de datos de ventana en la ROM. Ademas, tambien se puede evitar un preprocesamiento o
40 posprocesamiento especial de la senal, que requerirla un programa ROM y/o RAM adicional.
[0029] Tradicionalmente, las ventanas de transicion con un segmento de "superposicion doble" como en la presente invencion no se han utilizado en la codificacion de voz o audio o imagen, lo mas probablemente porque se pensaba que violaban ciertos principios que aseguran una reconstruction de forma de onda perfecta en ausencia de
45 cuantizacion de los coeficientes de las transformadas. Sin embargo, es posible reconstruir exactamente la entrada cuando se utiliza la transformada de transicion de la invencion y, ademas, no se requiere posprocesamiento especial en el lado del descodificador como en la propuesta de France Telecom.
[0030] Como nota adicional, vale la pena enfatizar que la utilization de dicha ventana de transicion de la 50 invencion se puede controlar por medio de la unidad de determinacion del ancho de superposicion de la invencion en
lugar de, o ademas de, una unidad de determinacion de la longitud de la transformada.
[0031] Posteriormente, se analizan e ilustran con mas detalle las realizaciones preferidas de la presente invencion. Ademas, se hace referencia particular a las reivindicaciones dependientes en las que se definen otras
55 realizaciones.
[0032] Ademas, la memoria descriptiva ilustra concretamente un aspecto relacionado con la conmutacion de superposicion adaptable a la ubicacion de transitorios, particularmente con respecto a las Figs. 1 a 7. Un aspecto principal de la invencion relacionado con la parte de superposicion multiple se ilustra y se describe con respecto a
las Figs. 8a a 15f. Estos aspectos individuales se pueden implementar independientemente unos de otros, es decir, la conmutacion de superposicion se puede aplicar sin una zona de superposicion multiple, o bien la zona de superposicion multiple puede aplicarse sin conmutacion de superposicion adaptable a la ubicacion de transitorios. Sin embargo, en una realizacion, ambos aspectos se combinan ventajosamente dando como resultado un concepto 5 de codificacion/descodificacion que tiene una conmutacion de superposicion adaptable a la ubicacion de transitorios y una zona de superposicion multiple. Dicho concepto puede ser adicionalmente mejorado por un procedimiento de conmutacion de longitud de transformada, que de nuevo depende de una ubicacion de transitorios en una zona de anticipacion de transitorios de una trama. La conmutacion de longitud de transformada puede realizarse en funcion de la determinacion del ancho de superposicion o independiente de la conmutacion de superposicion.
10
[0033] La presente invencion no solo es util para senales de audio, sino que tambien es util para senales de video, fotos o, generalmente, senales de imagen. Por ejemplo, en la codificacion de imagenes fijas, o las llamadas tramas I en AVC, o tecnologlas mas o menos avanzadas, la presente invencion puede aplicarse para evitar artefactos de bloqueo. Un transitorio en el campo de imagen serla un borde afilado y una trama corresponderla, por
15 ejemplo, a un macrobloque. Preferentemente, la imagen se codifica bidimensionalmente utilizando una transformada de introduccion de aliasing y la superposicion espacial correspondiente. Esto reduce los artefactos de bloqueo, por un lado, y reduce cualquier otro artefacto causado por partes transitorias, es decir, partes con bordes afilados, por otro lado. Por lo tanto, la description subsiguiente se aplica igualmente a las senales de imagen, aunque no se indique especlficamente a lo largo de la descripcion
20
[0034] A continuation, se describen realizaciones y aspectos con respecto a los dibujos adjuntos en los que:
la Fig. 1a ilustra un aparato para codificar en el contexto de un aspecto de conmutacion de superposicion; la Fig. 1b ilustra un aparato para descodificar el aspecto de la conmutacion de superposicion;
25 la Fig. 2a ilustra una secuencia de ventanas con superposicion total entre ventanas adyacentes;
la Fig. 2b ilustra una secuencia de ventanas con superposicion media entre dos ventanas adyacentes; la Fig. 2c ilustra una secuencia de ventanas con un cuarto de superposicion entre ventanas adyacentes y una superposicion media entre ventanas adyacentes y una superposicion total posterior entre ventanas adyacentes; las Figs. 3a y 3c e ilustran diferentes anchos de superposicion en diferentes ubicaciones de transitorios para una 30 realizacion con una longitud de transformada de 20 ms tal como en TCX 20;
las Figs. 4a a 4g ilustran una selection de longitudes de superposicion de transformadas para una longitud de transformadas de 10 ms tal como TCX 10 en funcion de una ubicacion de transitorios; las Figs. 5a a 5c ilustran una codificacion de un ancho de superposicion;
la Fig. 6a ilustra una codificacion del ancho de superposicion y la longitud de la transformada en base a la 35 ubicacion de transitorios;
la Fig. 6b ilustra una tabla de decisiones de longitud de transformadas;
la Fig. 7 ilustra diferentes secuencias de ventanas dependientes de los codigos de superposicion anteriores y actuales;
la Fig. 8a ilustra un codificador en el contexto de una parte de superposicion multiple en una realizacion de la 40 presente invencion;
la Fig. 8d ilustra un descodificador para el aspecto de la parte de superposicion multiple en una realizacion de la presente invencion;
la Fig. 9a ilustra un procedimiento segun una realizacion preferida que ilustra el lado del codificador; la Fig. 9b ilustra un diagrama de flujo de un procedimiento preferido realizado en el lado del codificador;
45 la Fig. 10a ilustra una realizacion de un procedimiento en el lado del descodificador;
la Fig. 10b ilustra una realizacion adicional de un procedimiento realizado en el lado del descodificador; la Fig. 11a ilustra operaciones realizadas en el lado del codificador de una realizacion; la Fig. 11b ilustra operaciones realizadas por un descodificador en una realizacion de la presente invencion; las Figs. 12a y 12b ilustran una realizacion adicional de procedimientos a realizar en el lado del 50 codificador/descodificador en el contexto del aspecto de superposicion multiple de la invencion;
la Fig. 13 ilustra diferentes secuencias de ventanas que tienen ambas una parte de superposicion multiple;
la Fig. 14a ilustra una secuencia de ventanas que tiene una longitud de transformada conmutada en funcion de la
ubicacion de transitorios;
la Fig. 14b ilustra una secuencia de ventanas adicional que tiene una parte de superposicion multiple;
55 las Figs. 15a a 15f ilustran diferentes secuencias de ventanas y las partes de anticipacion correspondientes y pre- ecos;
la Fig. 16 ilustra formas de ventanas de la tecnica anterior; y
la Fig. 17 ilustra las secuencias de ventanas de la tecnica anterior formadas por las formas de ventana de la Fig. 16.
[0035] La Fig. 1 ilustra un aparato para codificar una senal de audio 100. El aparato para codificar una senal de audio comprende un dispositivo de segmentation en ventanas controlable 102 para segmentar en ventanas la senal de audio 100 y proporcionar una secuencia de bloques de muestras segmentadas en ventanas en 103. El descodificador comprende ademas un convertidor 104 que convertir la secuencia de bloques de las muestras
5 segmentadas en ventanas 103 en una representation espectral que comprende una secuencia de tramas de valores espectrales indicados en 105. Ademas, se proporciona un detector de ubicacion de transitorios 106. El detector esta configurado para identificar la ubicacion de un transitorio en una zona de anticipation de transitorios dentro de una trama. Ademas, un controlador 108 que controla el dispositivo de segmentacion en ventanas controlable esta configurado para aplicar una ventana especlfica que tiene una longitud de superposition especificada a la senal de 10 audio 100 en respuesta a una ubicacion identificada del transitorio que se ilustra en 107. Ademas, el controlador 108 esta configurado, en una realization, para proporcionar information de ventana 112 no solo al dispositivo de ventanas controlable 102, sino tambien a una interfaz de salida 114 que proporciona, en su salida, la senal de audio codificada 115. La representacion espectral que comprende la secuencia de tramas de valores espectrales 105 se introduce en un procesador de codification 110, que puede realizar cualquier tipo de operation de codification tal 15 como una operacion de prediction, una operacion de modelado de ruido temporal, una operacion de cuantizacion preferentemente con respecto a un modelo psicoacustico o, al menos con respecto a principios psicoacusticos, o puede comprender una operacion de codificacion de reduction de redundancia tal como una operacion de codificacion Huffman o una operacion de codificacion aritmetica. La salida del procesador de codificacion 110 se envla, a continuation, a la interfaz de salida 114 y la interfaz de salida 114 proporciona finalmente la senal de audio 20 codificada que tiene asociada, a cada trama codificada, una determinada informacion de ventana 112.
[0036] El controlador 108 esta configurado para seleccionar la ventana especlfica a partir de un grupo de al menos tres ventanas. El grupo comprende una primera ventana que tiene una primera longitud de superposicion, una segunda ventana que tiene una segunda longitud de superposicion y una tercera ventana que tiene una tercera
25 longitud de superposicion o ninguna superposicion. La primera longitud de superposicion es mayor que la segunda longitud de superposicion y la segunda longitud de superposicion es mayor que una superposicion cero. La ventana especlfica se selecciona con el dispositivo de segmentacion en ventanas controlable 102 en base a la ubicacion de transitorios de manera que una de las dos ventanas superpuestas adyacentes en el tiempo tenga los coeficientes de la primera ventana en la ubicacion del transitorio y la otra de las dos ventanas superpuestas adyacentes en el tiempo 30 tenga los coeficientes de segunda ventana en la ubicacion del transitorio y los segundos coeficientes son al menos nueve veces mayores que los primeros coeficientes. Esto asegura que el transitorio es sustancialmente suprimido por la primera ventana que tiene los primeros coeficientes (pequenos) y el transitorio no es demasiado afectado por la segunda ventana que tiene los coeficientes de la segunda ventana. Preferentemente, los coeficientes de la primera ventana son iguales a 1 dentro de una tolerancia de mas/menos 5%, tal como entre 0,95 y 1,05, y los 35 segundos coeficientes de la ventana son, preferentemente, iguales a 0 o al menos menores que 0,05. Los coeficientes de ventana tambien pueden ser negativos y, en este caso, las relaciones y las cantidades de los coeficientes de ventana estan relacionadas con la magnitud absoluta.
[0037] La Fig. 2a ilustra una secuencia de ventanas con primeras ventanas solamente y las primeras 40 ventanas tienen la primera longitud de superposicion. Particularmente, la ultima trama tiene asociada una primera
ventana 200, la trama actual tiene una ventana asociada 202 y la tercera o siguiente trama tiene asociada una ventana 204. En esta realizacion, las ventanas adyacentes se superponen en un 50%, es decir, una longitud total. Ademas, las tramas se colocan con respecto a las ventanas con el fin de identificar que parte de la senal de audio es procesada por una trama. Esto se explica haciendo referencia a la trama actual La trama actual tiene una parte 45 izquierda 205a y una parte derecha 205b. Correspondientemente, la ultima trama tiene una parte derecha 204b y una parte izquierda 204a. De forma analoga, la trama siguiente tiene una parte izquierda 206a y una parte derecha 206b. Izquierda/derecha se refiere a antes en el tiempo y despues en el tiempo, como se ilustra en la Fig. 2a. Cuando se genera la trama actual de valores espectrales, se utilizan las muestras de audio obtenidas con la segmentacion en ventanas con la ventana 202. Las muestras de audio provienen de las partes 204b a 206a.
50
[0038] Como se conoce en la tecnica del procesamiento MDCT, en general, el procesamiento que utiliza una transformada de introduction de aliasing, esta transformada de introduction de aliasing se puede separar en una etapa de plegamiento y una etapa de transformada subsiguiente que utiliza una determinada transformada de introduccion de no aliasing. En la Fig. 2a, por ejemplo, la section 204b se pliega dentro de la section 205a y la
55 seccion 206a se pliega dentro de la seccion 205b. El resultado de la operacion de plegamiento, es decir, la combination ponderada de 205a, 204b, por un lado, y 206a y 205b, se transforman a continuacion en el dominio espectral utilizando una transformada tal como una transformada DCT. En el caso de una MDCT, se aplica una transformada DCT IV.
[0039] Posteriormente, esto se ejemplifica con referenda a la MDCT, pero pueden procesarse otras
transformadas de introduccion de aliasing de una manera analoga y similar. Como una transformada superpuesta, la MDCT es un poco inusual en comparacion con otras transformadas relacionadas con Fourier, ya que tiene la mitad 5 de salidas que entradas (en lugar del mismo numero). En particular, es una funcion lineal F: R2N -> RN (donde R indica el conjunto de numeros reales). Los 2N numeros reales x0, ..., x2N-1 se transforman en los N numeros reales X0, ..., XN-1 segun la formula:
10
imagen1
imagen2
(El coeficiente de normalizacion frente a esta transformada, aqul la unidad, es una convencion arbitraria y difiere entre los tratamientos. Solo el producto de las normalizaciones de la MDCT y la IMDCT, a continuation, esta restringido).
15 Transformada inversa
[0040] La MDCT inversa se conoce como la IMDCT. Debido a que hay diferentes numeros de entradas y salidas, a primera vista puede parecer que la MDCT no debe ser invertible. Sin embargo, la invertibilidad perfecta se logra anadiendo las IMDCT superpuestas de los bloques de superposition adyacentes en el tiempo, haciendo que
20 los errores se anulen y se recuperen los datos originales. Esta tecnica se conoce como Cancelation de Aliasing en el Dominio del Tiempo (TDAC).
[0041]
formula 25
(Al igual que para la DCT-IV, una transformada ortogonal, la inversa tiene la misma forma que la transformada directa.)
30
[0042] En el caso de una MDCT segmentada en ventanas con la normalizacion habitual de ventanas (vease
mas adelante), el coeficiente de normalizacion frente a la IMDCT debe multiplicarse por 2 (es decir, convertirse en 2/N).
35 [0043] En aplicaciones tlpicas de compresion de senal, las propiedades de las transformadas se mejoran
adicionalmente utilizando una funcion ventana wn (n = 0, ..., 2N-1) que se multiplica con xn e yn en las formulas MDCT y IMDCT, arriba, con el fin de evitar discontinuidades en los llmites n = 0 y 2N, haciendo que la funcion transcurra suavemente a cero en esos puntos. (Esto es, segmentamos en ventanas los datos antes de la MDCT y despues de la IMDCT). En principio, x e y podrlan tener diferentes funciones ventana, y la funcion ventana tambien
40 podrla cambiar de un bloque al siguiente (especialmente para el caso en el que se combinan bloques de datos de diferentes tamanos), pero por simplicidad consideramos el caso comun de funciones ventana identicas para bloques del mismo tamano.
La IMDC transforma N numeros reales X0, ..., XN-1 en 2N numeros reales y0, ..., y2N-1 segun la
imagen3
[0044] La transformada permanece invertible (es decir, funciona la TDAC), para una ventana simetrica wn =
45 w2N-1-n, siempre que w satisfaga la condition de Princen-Bradley:
imagen4
se utilizan varias funciones ventana. Una ventana que produce una forma conocida como transformada superpuesta
modulada [3] [4] se da con
imagen5
5 y se utiliza para MP3 y MPEG-2 AAC, y
imagen6
para Vorbis. AC-3 utiliza una ventana obtenida a partir de Kaiser-Bessel (KBD) y MPEG-4 AAC tambien puede usar 10 una ventana KBD.
[0045] Tenga en cuenta que las ventanas aplicadas a la MDCT son diferentes de las ventanas utilizadas para
algunos otros tipos de analisis de senales, ya que deben cumplir la condicion Princen-Bradley. Una de las razones de esta diferencia es que las ventanas MDCT se aplican dos veces, tanto para la MDCT (analisis) como para la 15 IMDCT (slntesis).
[0046] Como puede verse mediante la inspection de las definiciones, para N par, la MDCT es esencialmente
equivalente a una dCT-IV, donde la entrada se desplaza segun N/2 y dos N-bloques de datos se transforman a la vez. Examinando esta equivalencia mas cuidadosamente, se pueden obtener facilmente propiedades importantes 20 como la TDAC.
[0047] Para definir la relation exacta con la DCT-IV, debe tener en cuenta de que la DCT-IV corresponde a
condiciones limltrofes par/impar alternantes: par en el llmite izquierdo (alrededor de n=-1/2), impar en el llmite derecho (alrededor de n=N-1/2) y as! sucesivamente (en lugar de llmites periodicos como para una DFT). Esto se 25 deduce de las identidades y. De este modo, si las entradas
imagen7
30
COS
n
(
N v
2iV-n-l +
n
2;
*+I]
. 2)
= - cos
n
(
i V,
1
Y
n+—| k+-
NV 2 A 2)
y
[0048] Por lo tanto, si las entradas son una matriz x de longitud N, podemos imaginar extendiendo esta matriz
a (x, -xR, -x, xR, ...) y as! sucesivamente, donde xR indica x en orden inverso.
35 [0049] Consideremos una MDCT con 2N entradas y N salidas, donde dividimos las entradas en cuatro
bloques (a, b, c, d) de tamano N/2. Si desplazamos estos N/2 a la derecha (a partir del termino +N/2 en la definition MDCT), entonces (b, c, d) se extienden mas alla del final de las N entradas DCT-IV, por lo que debemos " plegarlos" segun las condiciones limltrofes descritas anteriormente.
40 [0050] Por lo tanto, la MDCT de 2N entradas (a, b, c, d) es exactamente equivalente a una DCT-IV de las N
entradas: (-cR-d, a-bR), donde R indica inversion igual que arriba.
[0051] Esto se ejemplifica para la funcion basada en ventana 202 en la Fig. 2a; a es la parte 204b, b es la
parte 205a, c es la parte 205b y d es la parte 206a.
[0052] (De esta manera, cualquier algoritmo para calcular la DCT-IV puede aplicarse trivialmente a la MDCT). De forma similar, la formula de la iMDCT anterior es precisamente 1/2 de la DCT-IV (que es su propia inversa), donde la salida se extiende (a traves de las condiciones limltrofes) a una longitud 2N y se desplaza hacia atras N/2 a
5 la izquierda. La DCT-IV inversa simplemente devolverla las entradas (-cR-d, a-bR) de arriba. Cuando esto se extiende a traves de las condiciones limltrofes y se desplaza, se obtiene:
IMDCT(MDCT(a, b, c, d)) = (a-bR, b-aR, c+dR, d+cR) / 2.
10 De este modo, la mitad de las salidas de IMDCT son redundantes, como b-aR = -(a-bR) R, y tambien para los dos ultimos terminos. Si agrupamos la entrada en bloques mayores A, B de tamano N, donde A= (a, b) y B = (c, d), podemos escribir este resultado de una manera mas simple:
IMDCT(MDCT(A, B)) = (A-AR, B+BR) / 2
15
Ahora se puede entender como funciona la TDAC. Supongamos que se calcula la MDCT del bloque 2N (B, C), adyacente en el tiempo y superpuesto un 50%. La IMDCT producira entonces, de forma analoga al anterior: (B-BR, C+CR)/2. Cuando esto se agrega con el anterior resultado de la IMDCT en la superposicion media, los terminos invertidos se cancelan y se obtiene simplemente B, recuperando los datos originales.
20
[0053] El origen del termino "cancelacion de aliasing en el dominio del tiempo" ahora esta claro. La utilizacion de datos de entrada que se extienden mas alla de los llmites de la DCT-IV logica hace que los datos sean aliasados de la misma manera que las frecuencias mas alla de la frecuencia de Nyquist son alias con las frecuencias mas bajas, excepto que este aliasing ocurre en el dominio del tiempo en lugar del dominio de la frecuencia: no podemos
25 distinguir las contribuciones de a y bR a la MDCT de (a, b, c, d) o, de manera equivalente, al resultado de la IMDCT (MDCT (a, b, c, d)) = (a -bR, b-aR, c+dR, d+cR)/2. Las combinaciones c-dR, y as! sucesivamente, tienen precisamente los signos correctos para que las combinaciones se cancelen cuando se anaden.
[0054] Para el N impar (que rara vez se usa en la practica), N/2 no es un entero por lo que la MDCT no es 30 simplemente una permutacion de cambio de una DCT-IV. En este caso, el desplazamiento adicional de la mitad de
una muestra significa que la MDCT/IMDCT se convierte en equivalente a la DCT-III/II y el analisis es analogo al anterior.
[0055] Hemos visto anteriormente que la MDCT de 2N entradas (a, b, c, d) es equivalente a una DCT-IV de 35 las N entradas (-cR-d, a-bR). La DCT-IV esta disenada para el caso en que la funcion en el llmite derecho es impar
y, por lo tanto, los valores cerca del llmite derecho son cercanos a 0. Si la senal de entrada es lisa, este es el caso: los componentes mas a la derecha de a y bR son consecutivos en la secuencia de entrada (a, b, c, d), y por lo tanto su diferencia es pequena. Veamos la mitad del intervalo: si reescribimos la expresion anterior como (-cR-d, a-bR) = (-d, a) - (b, c) R, el segundo termino, (b, c) R, forma una transicion suave en el medio. Sin embargo, en el primer
40 termino, (-d, a), hay una discontinuidad potencial donde el extremo derecho de -d se encuentra con el extremo
izquierdo de a. Esta es la razon para usar una funcion ventana que reduce los componentes cercanos a los llmites de la secuencia de entrada (a, b, c, d) hacia 0.
[0056] Por encima, se probo la propiedad TDAC para la MDCT ordinaria, mostrando que la adicion de IMDCT 45 de bloques adyacentes en el tiempo en su superposicion media recupera los datos originales. El razonamiento de
esta propiedad inversa para la ventana MDCT es solo un poco mas complicado.
[0057] Considere la superposicion de conjuntos consecutivos de 2N entradas (A, B) y (B, C), para los bloques
A, B, C de tamano N. Recuerde desde arriba que cuando se realiza la MDCT y la IMDCT de (A, B) y (B, C) y se
50 anaden en su superposicion media, obtenemos (B + Br) 12 + (B - Br) I 2 = B, los datos originales. Ahora
supongamos que multiplicamos tanto las entradas MDCT como las salidas IMDCT por una funcion basada en ventana de longitud 2N. Igual que antes, asumimos una funcion basada en ventana simetrica, que es por lo tanto de la forma (W, Wr) donde W es un vector de longitud N y R indica inversion como antes. Entonces la condicion de Princen-Bradley puede escribirse como W + W2r = (1, 1, ...), con los cuadrados y las adiciones realizadas en el 55 sentido de los elementos.
[0058] Por lo tanto, en lugar de realizar la MDCT (A, B), se realiza la MDCT (WA, WrB) con todas las multiplicaciones realizadas en el sentido de los elementos. Cuando se realiza la IMDCT de esto y se multiplica de
nuevo (en el sentido de los elementos) por la funcion ventana, la ultima N-mitad se convierte en:
WR(WRB+{ WrB)r)= Wr (WrB+WBr)=W£ b+wwrbr
5 [0059] (Tenga en cuenta que ya no tenemos la multiplicacion por 1/2, porque la normalizacion IMDCT difiere
por un factor de 2 en el caso de ventanas.)
[0060] De forma similar, la MDCT con ventana y la IMDCT de (B, C) producen en su primera N-mitad:
10
Cuando uno anade estas dos mitades juntas, se recuperan los datos originales.
[0061] En un procedimiento similar, la siguiente trama se calcula utilizando las partes 205b, 206a, 206b y la primera parte de la siguiente trama de la Fig. 2a. Por lo tanto, las ventanas 200, 202, 204 corresponden a la funcion ventana que tiene una primera longitud de superposicion de las tres ventanas con las diferentes longitudes de superposicion utilizadas por el dispositivo de segmentacion en ventanas controlable 102 de la Fig. 1a. Como se ha indicado, la Fig. 2a ilustra una situation en la que no se detectan transitorios en la ultima trama, la trama actual y la trama siguiente y, especlficamente, en la zona de anticipation de cada trama indicada por el punto 207 en la ultima trama, 208 en la trama actual y 209 en la trama siguiente. La Fig. 2b ilustra una situacion, en la que se detectan transitorios en las posiciones transitorias 210, 211, 212, 213. Debido al hecho de que, por ejemplo, se detecta una position de transitorios en 210 y debido al hecho de que 210 esta en la zona de anticipacion que comienza en 207 para la ultima trama, el controlador 108 determina que se realice una conmutacion desde la primera ventana 201 a una ventana adicional 215. Debido a los transitorios adicionales 211 y, en particular, 212/213 que se encuentran en la siguiente zona de anticipacion, la trama actual se procesa adicionalmente utilizando la segunda ventana 216 con la segunda longitud de superposicion. De este modo, la ventana 215 es una especie de ventana de inicio que cambia desde la ventana con la primera longitud de superposicion indicada en 201 a la segunda ventana que tiene la segunda longitud de superposicion. Tal como se ilustra, la segunda longitud de superposicion solo se extiende sobre ocho espacios y, por lo tanto, es solo la mitad de longitud que la primera longitud de superposicion. Debido al hecho de que en la zona de anticipacion que comienza en 209, ya no se detecta ningun transitorio, se realiza una conmutacion de nuevo a la ventana larga 201 mediante una especie de "ventana de parada 217". De nuevo, se observa que la longitud de superposicion ilustrada en 218 en la trama actual, por un lado, y entre la trama actual y la trama siguiente, por otro lado, que esta indicada en 218 es la mitad de larga que la longitud de superposicion en la Fig. 2a para la primera ventana que tiene 16 espacios ilustrados.
[0062] Por lo tanto, la ventana con superposicion media se utiliza para los transitorios que se detectan en las zonas de detection 1 y 6. Como se ilustra en 219, dicha zona de detection comprende dos espacios. De este modo, el intervalo de anticipacion esta separado en preferentemente ocho espacios. Por otra parte, sin embargo, se puede realizar una subdivision mas gruesa o mas fina. Sin embargo, en las realizaciones preferidas, la zona de anticipacion esta subdividida en al menos cuatro espacios y, preferentemente, subdividida en ocho espacios como se ilustra en 2b y 2c y otras figuras.
[0063] Como se ilustra, la segunda ventana 216 tiene una superposicion media en ambos lados, mientras
que la ventana 215 tiene una superposicion media en el lado derecho y tiene una superposicion total en el lado
45 izquierdo y la ventana 217 tiene una superposicion media en el lado izquierdo y una superposicion total en el lado derecho.
[0064] Se hace referencia a la Fig. 2c. La Fig. 2c ilustra una situacion en la que el detector de transitorios detecta, en la zona de anticipacion que comienza en el centro de la ultima trama, que hay un transitorio en la
50 segunda zona de deteccion de transitorios 222. De este modo, se realiza un cambio a un cuarto de superposicion para asegurarse de que el transitorio 223 solo esta "disperso" dentro de la ventana 224, pero no esta incluido en la zona definida por la ventana 201 ni en la zona definida por la ventana 225. Ademas, se indica una secuencia, en la que se realiza una conmutacion desde un cuarto de superposicion en la ultima trama y la trama actual a una superposicion media entre la trama actual y la trama siguiente, y vuelve a la superposicion total entre la trama 55 siguiente y la siguiente y la trama siguiente. Esto se debe a los transitorios detectados. En la zona de anticipacion que comienza en 208, se detectan transitorios en la parte una y en la parte seis mientras se detectan transitorios en la parte dos y en la parte cinco entre la ultima trama 207 y la trama actual 208.
15
20
25
30
35
40
imagen8
[0065] Asl, la Fig. 2c ilustra una secuencia de ventanas, en la que se ilustra la primera ventana 201 que tiene toda o la primera longitud de superposicion, en la que se utiliza una segunda ventana que tiene la segunda longitud de superposicion indicada en 218, en la que la segunda ventana puede ser, por ejemplo, la ventana 225 o la ventana
5 226 y, en la que se ilustra una tercera ventana que tiene una tercera longitud de superposicion como tiene la ventana 224 o la ventana 225 que tiene, en su lado izquierdo, la longitud de superposicion pequena 229. Por lo tanto, se ilustra una secuencia de ventanas que cambia de una superposicion total a un cuarto de superposicion y despues a una superposicion media y luego a una superposicion total. Por lo tanto, la primera ventana que tiene la primera longitud de superposicion puede ser una ventana asimetrica que tiene una superposicion diferente de la 10 primera superposicion en un lado y que tiene la primera longitud de superposicion en el otro lado. De forma alternativa, sin embargo, la primera ventana tambien puede ser una ventana que tiene la primera longitud de superposicion en ambos lados como se ilustra en 216 en la Fig. 2b. Ademas, la segunda ventana que tiene la segunda longitud de superposicion puede ser una ventana simetrica que tiene la segunda longitud de superposicion en ambos lados o puede ser una ventana asimetrica que tiene la segunda longitud de superposicion en un lado y 15 que tiene, en el otro lado, la primera longitud de superposicion o la tercera longitud de superposicion o cualquier otra longitud de superposicion. Finalmente, la tercera ventana que tiene la tercera longitud de superposicion puede ser una ventana simetrica que tiene la tercera longitud de superposicion en ambos lados o puede ser una ventana que tiene la tercera longitud de superposicion en un lado y que tiene una longitud de superposicion diferente en el otro lado.
20
[0066] Posteriormente, se ilustran otras realizaciones con respecto a las figuras siguientes. Generalmente, la deteccion del transitorio y su ubicacion pueden realizarse, por ejemplo, utilizando un procedimiento o un procedimiento similar al detector de transitorios descrito en la patente US 6.826.525 B2, pero tambien se pueden utilizar otros detectores de transitorios.
25
[0067] La unidad de deteccion de transitorios identifica la presencia y, si es aplicable, la ubicacion del inicio del transitorio mas fuerte en la nueva parte de senal de una trama dada, es decir, excluyendo la zona de superposicion entre la trama actual y la anterior. La resolucion del Indice que describe la ubicacion de transitorios es, en las figuras siguientes, 1/8 de la longitud de la trama, por lo que el intervalo de Indice es de Oto 7. En las figuras
30 posteriores, los subbloques con Indices 0, ..., 7 representan los 20 ms mas nuevos de una senal de dominio en el tiempo que se utilizan para la codificacion en la trama actual.
[0068] Las Figs. 3a-3c ilustran la selection del ancho de superposicion de transformadas para una longitud de transformada ejemplar ms, es decir, para una longitud de transformada de TCX20.
35
[0069] En la Fig. 3a, ningun transitorio esta presente en la trama actual. Por lo tanto, se detecta una superposicion total 300.
[0070] La Fig. 3b, por el contrario, ilustra una situation en la que se detecta un transitorio en el septimo 40 subbloque de manera que el controlador 108 de la Fig. 1a. selecciona una superposicion media 302. Ademas, la Fig.
3c ilustra la situacion en la que se detecta un transitorio en el sexto subbloque y, por lo tanto, el controlador establece una superposicion minima 304. De este modo, el detector de ubicacion de transitorios 106 detecta si hay un transitorio y, si no, se selecciona el ancho de superposicion o el primer ancho de superposicion 300. Sin embargo, cuando existe un transitorio en el septimo subbloque determinado por el detector de ubicacion de 45 transitorios 106 de la Fig. 1a, a continuation, la segunda longitud de superposicion 302, preferentemente la mitad de la primera longitud de superposicion 300, es establecida por el controlador y cuando el transitorio esta en el subbloque 6, entonces se establece una superposicion minima. La Fig. 3c muestra adicionalmente la situacion en la que, en lugar del hecho de que el transitorio se detecta en la position 6 o 7, se mantiene sin embargo la longitud de la transformada. De este modo, las longitudes de las transformadas de las ventanas 301a, 301b o 303a o 303b son 50 identicas e iguales a la primera ventana que tiene la longitud de superposicion mas larga ilustrada en la Fig. 3a en 301a y 301b. Como se mostrara mas adelante, se prefiere no solo controlar la longitud de superposicion, sino tambien controlar asimismo la longitud de las transformadas, especificamente en situaciones en las que el transitorio se detecta en otros subbloques. Por lo tanto, el ancho de superposicion entre la actual y la siguiente ventana transformada depende de la ubicacion del transitorio. Sin embargo, la superposicion entre la ventana transformada 55 actual y la anterior se determino al procesar la trama anterior.
[0071] Posteriormente, se hace referencia a la Fig. 4a a 4g con el fin de mostrar la seleccion de la longitud de superposicion de transformada durante 10 ms de longitud de transformada, es decir, TCX10. Si, por ejemplo, un codec esta limitado a una longitud de transformada de 10 ms, se elige la superposicion entre dos ventanas TCX10
de manera que los pseudotransitorios debido al modelado TNX del error de codificacion con aliasing en el tiempo se suprimen en gran medida. Ademas, se minimiza la dispersion del transitorio a mas de cinco bloques anteriores y a mas de cinco subsiguientes. Es decir, es el pre-eco y el posteco estan limitados a 12,5 ms. La eleccion de la superposicion se basa en la ubicacion de transitorios.
5
[0072] la Fig. 4a ilustra una situacion en la que se detecta un transitorio en el cero o primer subbloque. A continuacion, se eligen las "primeras ventanas" 401, 402, que tienen la longitud de superposicion maxima o primera 403. Ademas, con fines ilustrativos, se ilustra una superposicion total de TCX20 con la ventana anterior y con la siguiente ventana como referencia en 404. De este modo, la "superposicion total" corresponde al 50% de la ventana
10 401, 402 o corresponde al 33% de la ventana TCX20 301 a, 301 b, por ejemplo. Asl, la longitud de superposicion 300 en la Fig. 3a y 403 en la Fig. 4a son identicas.
[0073] La Fig. 4b ilustra una situacion en la que se detecta un transitorio en el segundo subbloque y el controlador controla luego la secuencia de ventanas de manera que se elige una superposicion minima 404
15 correspondiente a la "tercera longitud de superposicion" ilustrada en 229 de la Fig. 2c. De este modo, se seleccionan las ventanas 406, 407 que son, en esta realizacion, ventanas asimetricas que tienen la longitud de superposicion corta correspondiente a la "segunda ventana" en el lenguaje de la Fig. 1a y 1b. Ademas, cuando se detecta el transitorio en el tercer subbloque, se selecciona la segunda longitud de superposicion 405. De este modo, las ventanas 408, 409 corresponden a la tercera ventana que tiene la tercera longitud de superposicion 405, pero son 20 ventanas asimetricas.
[0074] Ademas, como se ilustra en la Fig. 4d, se determina la longitud total de superposicion cuando el transitorio esta en la parte de transitorio 4 y, por lo tanto, las ventanas seleccionadas en esta situacion son las ventanas 401, 402 ilustradas en la Fig. 4a. Cuando se elige la superposicion de manera que en una de las
25 transformadas superpuestas contenga un transitorio como se ilustra, el caso en el que el transitorio esta en el segundo o tercer subbloque es como se ilustra en la Fig. 4f o 4g, respectivamente. Los casos, cuando el transitorio esta en el cero o primer subbloque, se tratan por separado, asl como los casos, cuando el transitorio esta en el cuarto o quinto subbloque. Por lo tanto, se hace referencia a la Fig. 4e que ilustra la situacion, en la que el transitorio esta en el subbloque cero, se obtiene una secuencia de ventanas como se ilustra en la Fig. 4e, donde hay una 30 superposicion media 405 y que conmuta de nuevo a la superposicion total 403. Esto se obtiene mediante la secuencia de ventanas formada por la ventana de inicio 408 y la ventana de parada 409 y otra ventana de longitud normal 402.
[0075] La Fig. 4f, por otra parte, ilustra la situacion en la que el transitorio esta en el primer subbloque de 35 manera que se selecciona una longitud corta o una tercera longitud de superposicion 404, lo que es posible gracias
a la ventana de inicio 406 y a la ventana de parada 407 que va seguida por una ventana de superposicion total 402. De este modo, la ventana 408 o 409 en la Fig. 4e ilustra la segunda ventana que tiene la segunda longitud de superposicion 405 y las ventanas 406 y 407 corresponden a la tercera ventana que tiene la tercera longitud de superposicion 404".
40
[0076] La Fig. 4g ilustra una situacion en la que el transitorio se detecta en el cuarto subbloque. Esta situacion se refleja mediante una primera ventana 401 que tiene una longitud de superposicion total 403 y una segunda ventana 409 que tiene una longitud de superposicion media 405 y otra segunda ventana 414 que tiene la segunda longitud de superposicion 405. Sin embargo, el lado derecho de la ventana 414 depende de la longitud de
45 superposicion determinada para la siguiente trama, es decir, en la siguiente zona de anticipacion que comienza en el instante de tiempo indicado con el numero de referencia 415.
[0077] Asl, las Figs. 4a a 4g ilustran la situacion en la que se determina la longitud de superposicion de
manera que el transitorio se situa solamente dentro de una ventana que se asegura por el hecho de que, en la
50 ubicacion del transitorio, por ejemplo, en el subbloque 4, los coeficientes de ventana de la ventana 414 son iguales a 0 y los coeficientes de ventana de la ventana 409 son iguales a 1.
[0078] Posteriormente, se hace referencia a una realizacion preferida, en la que la longitud de transformada se obtiene del ancho de superposicion. Las Figs. 5a, 5b, 5c ilustran tres longitudes de superposicion 403, 405, 404
55 diferentes, donde la longitud de superposicion total esta determinada por dos primeras ventanas indicadas en 501 y 502. Ademas, la longitud de superposicion media se obtiene mediante dos segundas ventanas que tienen la segunda longitud de superposicion ilustrada en 503 y 504 y la tercera longitud de superposicion 404 se obtiene mediante dos terceras ventanas 505 y 506 que tienen la tercera longitud de superposicion 404. La superposicion total se codifica, preferentemente, utilizando un bit "0", la superposicion media se codifica utilizando una
combinacion de bits "11" y la superposicion minima se codifica utilizando la combinacion de bits "10".
[0079] De este modo, esta codificacion es util cuando se determina el ancho de superposicion y se puede utilizar una seleccion de longitud de transformada cuando se puede usar TCX-20 y una combinacion de tramas TCX-
5 5 y TCX-10.
[0080] A diferencia de los esquemas de codificacion de la tecnica anterior que obtienen las superposiciones entre-transformadas instantaneas a partir de la seleccion dada de longitudes de transformada para un par de tramas (es decir, el ancho de superposicion viene a continuacion de la salida de la determinacion de longitud de
10 transformada), una realizacion preferida de la presente invencion se refiere a un sistema de codificacion que puede controlar u obtener la longitud o longitudes de las transformadas que se utilizaran para una trama particular utilizando el ancho de superposicion atribuido a esa trama y, opcionalmente, el ancho de superposicion de la trama anterior (es decir, la longitud de transformada va despues de la unidad de determinacion del ancho de superposicion, o bien, con respecto a la Fig. 1 a, mediante la cooperacion del detector de ubicacion de transitorios 106 y el 15 controlador 108). La Fig. 6a ilustra una tabla de codificacion y la Fig. 6b ilustra una tabla de decisiones correspondiente. En las Figs. 5a, 5b y 5c, la llnea completa representa la mitad derecha de la ventana de la ultima transformada en la trama actual y la llnea discontinua representa la mitad izquierda de la ventana de la primera transformadas en la trama siguiente.
20 [0081] La Fig. 6a ilustra una codificacion de la superposicion y la longitud de la transformada en base a la
ubicacion de transitorios. En particular, la decision de transformada corta/larga se codifica utilizando 1 bit como se indica en la columna 600 y la superposicion con la primera ventana de la trama siguiente se codifica utilizando el codigo de longitud variable con 1 o 2 bits como se ilustra en la columna 602. El codigo para la decision de transformada corta/larga 600, por una parte, y el codigo binario para el ancho de superposicion de la columna 602, 25 se concatenan para obtener el denominado codigo de superposicion en la columna 603. Ademas, la superposicion con la primera ventana de la siguiente trama esta determinada por el controlador 108 en funcion del Indice de posicion del transitorio de la columna 604 segun lo determinado con el detector de transitorios 106. A diferencia de las ilustraciones anteriores, el Indice de posicion de transitorios tiene un intervalo de anticipation incrementado que comienza en dos espacios anteriores indicados por -1 y - 2 y para esta situation, ademas, se senala la 30 superposicion total en esta realizacion.
[0082] Por lo tanto, la superposicion total se indica para "no transitorios" o una ubicacion de transitorios entre -2 y 1. Ademas, la columna 605 senala una superposicion media para las posiciones de transitorios 2 y 3 y 7 y senala la superposicion minima para las posiciones de transitorios 4, 5, 6.
35
[0083] Por lo tanto, el Indice "-2" en la Fig. 6a significa que habla un transitorio en la trama anterior en la posicion 6 y "-1" significa que habla un transitorio en la trama anterior en la posicion 7. Como se ha indicado, "ninguno" significa que no se detecto ningun transitorio en la zona de anticipacion de transitorios.
40 [0084] Como se ha detallado, la decision de transformada corta/larga y el ancho de superposicion se
codifican conjuntamente utilizando el codigo de superposicion. El codigo de superposicion consiste en 1 bit para una decision de transformada corta/larga y en el codigo binario para el ancho de superposicion codificado con 1 o 2 bits. El codigo es un codigo de longitud variable en el que se detecta automaticamente donde comienza una palabra de codigo y termina la palabra de codigo anterior. Los codigos para la decision de transformada corta/larga y para el 45 ancho de superposicion se definen en la Fig. 6a. Por ejemplo, cuando la decision de transformada corta/larga da 1 y se selecciona la superposicion minima, es decir, un codigo binario es igual a 10, el codigo de superposicion es 110.
[0085] Ademas, la Fig. 6a ilustra la situacion en la que se toma una decision de transformada corta para
todas las posiciones de transitorios entre -2 y 5 y se elige una transformada larga si no hay ningun transitorio o el 50 transitorio esta en la posicion 6 o 7. Asl, la Fig. 6a ilustra la situacion en la que el detector de ubicacion de transitorios puede detectar un cierto transitorio en una determinada posicion y, cuando son independientes entre si o en paralelo, se puede determinar la decision de transformada corta/larga y la superposicion con la primera ventana de la trama siguiente, es decir, se puede obtener el codigo de superposicion total 603. Se hace hincapie en que los expertos en la tecnica comprenderan que pueden usarse otros codigos para codificar diferentes transformadas 55 cortas/largas y diferentes superposiciones. Ademas, se pueden determinar y senalar mas de dos, es decir, tres o incluso mas longitudes de transformadas y, a la vez, se pueden determinar y codificar tambien mas de tres superposiciones tales como cuatro o cinco longitudes de superposicion diferentes. Todo esto determinado es, por ejemplo, en respuesta a un detector de ubicacion de transitorios que funciona sobre, al menos cuatro divisiones diferentes por trama, o bien, como en la realizacion, operando en ocho divisiones por trama o, para una decision
mas fina, operando en aun mas divisiones, como dieciseis divisiones de una trama.
[0086] Basandose en el codigo de superposicion para la trama actual y para la trama anterior, se toma una decision para una combination de la longitud de transformadas a utilizar, como se ilustra en la Fig. 6b. Asi, la Fig. 6b
5 ilustra la decision de una longitud de transformadas basada en el codigo de superposicion anterior y el codigo de superposicion actual. Por ejemplo, si el codigo de superposicion anterior y el codigo de superposicion actual son ambos "00", se utiliza una ventana tal como 401. Si el codigo de superposicion anterior era 10 y el codigo de superposicion actual es 00, entonces se selecciona la misma ventana. Sin embargo, si el codigo anterior es 111, es decir, un codigo de superposicion media y el codigo de superposicion actual es 00, entonces se selecciona, por 10 ejemplo, la ventana 409 de la Fig. 4c. Para un codigo de superposicion anterior de 110 y el codigo de superposicion actual 00, se selecciona de nuevo una transformada larga, pero con una ventana similar a la ventana 407, y la misma situation se observa para un codigo de superposicion anterior de 010 y el codigo de superposicion actual de 00, es decir, se selecciona la ventana 407 de la Fig. 4f. Finalmente, para un codigo de superposicion anterior 011 y para el codigo de superposicion actual 00, se selecciona una ventana tal como 409 en la Fig. 4e.
15
[0087] Se seleccionan otras ventanas para otras combinaciones y esto se ilustra especificamente con respecto a la Fig. 7. Asi, la Fig. 7 ilustra algunas de las combinaciones de longitudes de transformadas junto con la ubicacion de transitorios en la trama actual y con los codigos de superposicion para la trama actual y para las tramas anteriores. 110/010 - 111 en la Fig. 7 significa que el codigo de superposicion anterior es 110 o 010 y el codigo de
20 superposicion actual es 111. La Fig. 7 ilustra, por tanto, diferentes combinaciones. Por ejemplo, la imagen superior izquierda de la Fig. 7 ilustra una superposicion minima al inicio de una secuencia de dos transformadas TCX-5 y una transformada TCX-10 siguiente que tiene la superposicion total. Contrariamente a esto, la imagen debajo de esta imagen ilustra una superposicion minima seguida de cuatro ventanas TCX-5, donde la cuarta ventana de las ventanas TCX-5 tiene una superposicion media y asi sucesivamente. De este modo, los numeros de referencia 700, 25 701 ilustran una secuencia de dos TCX-5 o dos ventanas cortas seguidas de una ventana media. De forma similar, los numeros de referencia 702, 703, 704, 705, 706, 707 ilustran una situacion con cuatro longitudes de transformadas cortas o transformadas "TCX-5" mientras que los numeros de referencia 708, 709, 710, 711 ilustran la situacion en la que hay, en el primer tiempo, es decir, al inicio de la secuencia, una ventana de longitud de transformada media tal como una ventana TXC 10 seguida de dos ventanas de longitud de transformada corta o 30 TCX-5. Las secuencias 700 a 711 en la Fig. 7 pueden ser introducidas por otras secuencias de este tipo o por ventanas de longitud de transformada larga o TCX-20 que tienen superposiciones diferentes tales como superposiciones cortas en 700, 702 por ejemplo, una superposicion media en 704 o superposiciones largas en 708 o 710, por ejemplo. Al mismo tiempo, la secuencia puede ir seguida por otras secuencias de este tipo o puede ir seguida por TCX-20, es decir, ventanas de transformadas largas, pero con una longitud de superposicion diferente. 35 De este modo, la secuencia 700 termina, por ejemplo, con una superposicion larga y la secuencia 702, por ejemplo, termina con una superposicion media o la secuencia 706, por ejemplo, termina con una longitud de superposicion pequena.
[0088] Como se ilustra en la Fig. 1a, la information de ventana, es decir, el codigo de superposicion 603 de la 40 Fig. 6a que se ilustra en 112 en la Fig. 1a se puede asociar a cada trama codificada mediante una interfaz de salida
114.
[0089] Ademas, la transformada aplicada en el convertidor 104 puede ser una MDCT o una MDST o una transformada de introduction de aliasing diferente que se caracteriza por el hecho de que el numero de valores
45 espectrales en un bloque de valores espectrales es menor que el numero de muestras segmentadas en ventanas en un bloque de muestras segmentadas en ventanas introducidas en la transformada o, con respecto al lado del descodificador, en el que el numero de muestras de salida en el dominio del tiempo es mayor que el numero de valores espectrales introducidos en dicha transformada inversa o de reduction de aliasing.
50 [0090] Como se ilustra en todas las Figs. 2 a 7, se mantiene un raster de trama constante. De este modo, el
controlador 108 garantiza que, aunque se realice una conmutacion a longitudes de transformadas mas cortas, como se ilustra, por ejemplo, en la Fig. 7, siempre se mantiene el mismo raster de trama constante. Esto se asegura utilizando solo estas ventanas especificas que siempre dan como resultado una longitud de transformada similar para cada clase de ventanas en el contexto del tamano de superposicion correcto. De este modo, se define que 55 cada longitud de transformada TCX-5 tiene dicha zona de superposicion y una zona constante entre las dos zonas de superposicion que la transformada da como resultado N/4 valores espectrales, donde N es el numero de valores espectrales dentro de una trama. La forma y el tamano y, concretamente, las longitudes de superposicion de las ventanas de transformadas TCX 20 se disenan asimismo de tal manera que esta ventana da como resultado N muestras espectrales posteriores a la transformada.
[0091] La Fig. 1c ilustra una implementation preferida en el lado del descodificador del convertidor controlable 158. En particular, el convertidor controlable 158 comprende un convertidor de tiempo- frecuencia 170, un dispositivo de segmentation en ventanas de slntesis conectado posteriormente 172 y un sumador de
5 superposiciones final 174. Especlficamente, el convertidor de tiempo-frecuencia realiza la transformada tal como una transformada DCT-IV y una operation de despliegue posterior de modo que la salida del convertidor de tiempo- frecuencia 170 tiene, para una ventana primera o larga, 2N muestras mientras que la entrada en el convertidor de tiempo-frecuencia era, por ejemplo, de N valores espectrales. Por otro lado, cuando la entrada en el convertidor de tiempo-frecuencia es de N/8 valores espectrales, la salida es de N/4 valores en el dominio del tiempo para una 10 operacion MDCT, de manera ejemplar.
[0092] A continuation, la salida del convertidor de tiempo-frecuencia 170 se introduce en un dispositivo de segmentacion en ventanas de slntesis que aplica la ventana de slntesis que es, preferentemente, exactamente la misma que la ventana en el lado del codificador. De este modo, cada muestra es, antes de que se realice una suma
15 de superposition, segmentada en dos ventanas de modo que la "ventana total" resultante es un cuadrado de los coeficientes de ventana correspondientes de modo que se cumple la condition de Princen-Bradley como se ha analizado anteriormente.
[0093] Finalmente, el sumador de superposicion 174 realiza la suma de superposicion correcta 20 correspondiente para obtener finalmente la senal de audio descodificada en la salida 175. En particular, el
convertidor de tiempo-frecuencia 170, el dispositivo de segmentacion en ventanas de slntesis 172 y el sumador de superposicion 174 son controlables y estan controlados, por ejemplo, mediante el codigo de superposicion 603 analizado en el contexto de la Fig. 6a, o bien mediante cualquier otra information relativa a la situation analizada en el contexto de la Fig. 6b. Sin embargo, preferentemente, se determina la longitud de transformada correspondiente 25 para el convertidor de tiempo-frecuencia en base al codigo de superposicion anterior y al codigo de superposicion actual utilizando la tabla de decision de longitud de transformada. Ademas, el tamano/forma de la ventana tambien se determina basandose en el codigo de superposicion anterior y un codigo de superposicion actual, y lo mismo es cierto para el sumador de superposicion de modo que el sumador de superposicion aplica la superposicion maxima, la superposicion media o la superposicion minima senalada.
30
[0094] De este modo, se prefiere que el controlador 180 en el descodificador de la Fig. 1 c reciba los codigos de superposicion, es decir, el codigo de superposicion anterior 606 y el codigo de superposicion actual 607 y determine, a partir de esta informacion, la superposicion y la ventana para el bloque de valores espectrales.
35 [0095] De este modo, se determina cada ventana y el tamano de transformada correspondiente asociado con
la ventana. En las realizaciones preferidas en las que se utiliza una MDCT como transformada y se utiliza una MDCT inversa para la transformada inversa, el tamano de ventana es dos veces la longitud de transformada, o bien la longitud de transformada es la mitad del tamano de ventana.
40 [0096] La Fig. 1d ilustra una realization adicional de la presente invention implementada con un dispositivo
movil donde el dispositivo movil comprende, por una parte, un codificador 195 y, por otra parte, un descodificador 196. Ademas, segun una realizacion preferida de la presente invencion, tanto el codificador 105 como el descodificador 106 recuperan la misma informacion de ventana desde una unica memoria 197, puesto que las ventanas utilizadas en el codificador 195 y las ventanas utilizadas en el descodificador 196 son identicas entre si. De 45 este modo, el descodificador tiene una memoria de solo lectura 197 o una memoria de acceso aleatorio o, en general, cualquier memoria 197 en la que se almacena solo un unico conjunto de secuencias de ventanas o ventanas para su uso tanto en el codificador como en el descodificador. Esto es ventajoso por el hecho de que los diferentes coeficientes de ventana para las diferentes ventanas no tienen que ser almacenados dos veces, con un conjunto para el codificador y un conjunto para el descodificador. En su lugar, debido al hecho de que, segun la 50 presente invencion, se utilizan ventanas y secuencias de ventanas identicas en el codificador y el descodificador, solo se tiene que almacenar un unico conjunto de coeficientes de ventana. Por lo tanto, la utilization de memoria del dispositivo movil de la invencion que se ilustra en la Fig. 1d se reduce sustancialmente con respecto a un concepto diferente en el que el codificador y el descodificador tienen ventanas diferentes o en el que se realiza cierto posprocesamiento con procesamiento distinto aparte de las operaciones basadas en ventanas.
55
[0097] Posteriormente, se hace referencia a una realizacion preferida adicional con respecto a la realizacion de conmutacion de transformada/longitud transformada.
[0098] El esquema de codification adaptable a la longitud de superposicion y transformada descrito
anteriormente se implemento en el modelo de excitacion de transformada codificada (TCX) del codificador LD- USAC, una variante de bajo retardo de xHE-AAC [5] con una longitud de trama de 20 ms y probado a 48 kbit/s mono. En este punto de configuracion, LD-USAC funciona solo en modo TCX con una longitud de 512 muestras y una superposicion de 256 muestras, es decir, un 33% durante condiciones de entrada (pseudo) estacionarias. El 5 codificador incluye una unidad de deteccion de transitorios, cuya salida es introducida a una unidad de determinacion de longitud de transformada y a la unidad de determinacion del ancho de superposicion de la invencion. Se dispone de tres longitudes de transformadas para la codificacion: una longitud TCX-20 con 512 coeficientes MDCT, una longitud TCX-10 con 256 coeficientes MDCT y una longitud especial TCX-5 con 128 coeficientes MDCT. En consecuencia, se puede utilizar y transmitir por trama uno de los tres anchos de 10 superposicion: superposicion maxima de 256 muestras basicas (10 ms), superposicion media de 128 muestras basicas (5 ms) y superposicion minima de 16 muestras (0,6 ms). Para cada trama se deben seleccionar las longitudes de transformadas de manera que la suma de las longitudes de todas las transformadas en esa trama sea igual a la longitud de la trama basica, es decir, 512 muestras.
15 [0099] En una realizacion preferida del sistema de codificacion de la invencion, el codificador funciona de la
siguiente manera:
1. La unidad de deteccion de transitorios identifica la presencia y, si es aplicable, la ubicacion del inicio del transitorio mas fuerte en la nueva parte de senal de una trama dada (es decir, excluyendo la zona de superposicion entre la
20 trama actual y la anterior). La resolucion del Indice que describe la ubicacion de transitorios es 1/8 de la longitud de trama, por lo que el rango del Indice es 0, ..., 7.
2. Si no se ha detectado ningun transitorio, o si el indice de ubicacion de transitorio es 6 o 7, la trama afectada se codifica utilizando la transformada TCX-20 por decision de la unidad de determinacion de longitud de transformada.
25 De lo contrario, se utiliza una combinacion de transformadas TCX-10 y/o TCX-5: 2x TCX-10 o 4x TCX-5, o bien, TCX-10 seguido de 2x TCX-5, o bien, 2x TCX-5 seguido de TCX-10.
3. La unidad de determinacion del ancho de superposicion controla en este punto las formas de superposicion de las transformadas utilizadas dentro de la trama actual (excluyendo la superposicion ya elegida con la ultima trama)
30 segun los objetivos enumerados anteriormente, de tal manera que se seleccionan las superposiciones mas largas posibles que no violan dichos objetivos. En particular, si una trama es TCX-20 y el indice de ubicacion de transitorio es 6 o 7, la unidad de superposicion devuelve una superposicion media o minima, respectivamente. Si no hay ninguna senal estacionaria en una trama, se utiliza superposicion maxima.
35 4. Ademas, si una combinacion TCX-10/-5 ha sido devuelta por la unidad de determinacion de longitud de transformada para la trama (no estacionaria), la unidad de determinacion del ancho de superposicion controla la composicion exacta de las longitudes de transformada en esa trama. En particular, si se utiliza la superposicion maxima tanto en la trama anterior como en la trama actual, se aplican 2x tCX-5 seguido de un TCX-10 en la trama actual, siendo la primera de las transformadas TCX-5 la transformada de transition de la invencion con 40 superposicion doble. Si el ancho de superposicion de la ultima trama o la trama actual es menor que el maximo, tambien se utiliza una de las configuraciones mixtas TCX-10/-5. Si tanto la trama ultima como la trama actual tienen menos que la superposicion maxima, se utiliza 4x TCX-5.
5. El codificador ahora procede a segmentar en ventanas la senal y las MDCT reales para la trama. Debe tenerse 45 especial cuidado con respecto al orden de las operaciones basadas en ventanas en presencia de la ventana de transicion de doble superposicion de la invencion a fin de lograr una reconstruction perfecta despues de la descodificacion. El resto del proceso de codificacion es similar al de xH E-AAC. Opcionalmente se aplica TNS a las transformadas individuales y se puede realizar el agrupamiento de dos conjuntos de coeficientes MDCT TCX-5 en un conjunto de coeficientes (entrelazados) de tipo TCX-10 para guardar information lateral. Para cada trama, se 50 transmite al descodificador un valor de ancho de superposicion, asi como un indicador de 1 bit que indica TCX-20 o codificacion no TCX-20.
[0100] Al igual que el codificador, el descodificador apropiado segun la realizacion preferida presenta una
unidad de determinacion de ancho de superposicion que interpreta los valores de ancho de superposicion 55 transmitidos para controlar la longitud y la segmentacion en ventanas de las MDCT inversas de modo que el codificador y el descodificador estan totalmente sincronizados con respecto a las transformadas utilizadas. Como en el codificador, el orden de las operaciones basadas en ventanas y plegamiento despues de cada MDCT es critico para obtener una reconstruccion de la senal perfecta.
[0101] Posteriormente, se analiza e ilustra una realizacion adicional de la invention en el contexto de las Figs. 8 a 15f. Este aspecto, que tambien se denomina "aspecto de superposition multiple", se puede combinar con la forma de realizacion de conmutacion de ancho de superposicion y longitud de transformada analizada con respecto a las Figs. 1 a 7, o bien se puede implementar por separado de este aspecto.
5
[0102] Un lado del codificador de la invencion se ilustra en la Fig. 8a y un lado del descodificador se ilustra en la Fig. 8b. En particular, el aparato para generar una senal codificada o el codificador ilustrado en la Fig. 8a comprende un controlador de secuencia de ventanas para generar una information de secuencia de ventanas 809 enviada, por ejemplo, a un preprocesador 802, un convertidor espectral 804, o una interfaz de salida 810 como se
10 ilustra en la Fig. 8a. La informacion de secuencia de ventanas indica una primera funcion ventana para generar una primera trama de valores espectrales, una segunda funcion ventana y una o mas terceras funciones ventana para generar una segunda trama de valores espectrales. La primera funcion ventana, la segunda funcion ventana y la una o mas terceras funciones ventana se superponen dentro de una zona de superposicion multiple.
15 [0103] Esta zona de superposicion multiple se ilustra, por ejemplo, en 1300 en la Fig. 13 o la Fig. 14b o la
Fig. 15e o la Fig. 15f. Por lo tanto, en esta zona de superposicion multiple 1300, al menos tres funciones ventana, es decir, la primera funcion ventana con respecto a la Fig. 15f ilustrada en 1500, la segunda funcion ventana 1502 y la tercera funcion ventana 1503, se superponen entre si dentro de la zona de superposicion multiple 1300. Tambien puede haber una superposicion superior, como una superposicion de cuatro, cinco o incluso mas ventanas. De 20 forma alternativa, la Fig. 15e ilustra la situation en la que una tiene de nuevo la primera funcion ventana 1500, la segunda funcion ventana 1502 pero ahora cuatro terceras funciones ventana 1503 a diferencia de una unica funcion ventana 1503 de la Fig. 15f.
[0104] Con el fin de manejar correctamente esta zona de superposicion multiple que da como resultado una 25 reduction significativa del retardo necesario en la zona de anticipation de transitorios, se proporciona un
preprocesador 102. El preprocesador esta configurado para segmentar en ventanas un segundo bloque de muestras correspondiente a la segunda ventana y la una o mas terceras funciones ventana utilizando una funcion ventana auxiliar para obtener un segundo bloque de muestras segmentadas en ventanas. Ademas, el preprocesador esta configurado para preprocesar el segundo bloque de muestras de ventanas utilizando una operation de plegamiento 30 de una parte del segundo bloque que se superpone con el primer bloque en la parte de superposicion multiple para obtener un segundo bloque preprocesado de muestras segmentadas en ventanas que tienen una parte de superposicion multiple modificada. Ademas, un convertidor espectral 804 esta configurado para aplicar una transformada de introduction de aliasing en el primer bloque de muestras utilizando la primera ventana para obtener la primera trama de valores espectrales. Ademas, el convertidor espectral esta configurado para aplicar una 35 transformada de introduccion de aliasing a una primera parte del segundo bloque preprocesado de muestras segmentadas en ventanas utilizando la segunda ventana para obtener una primera parte de muestras espectrales de una segunda trama y aplicar la transformada de introduccion de aliasing a una segunda parte del segundo bloque preprocesado de muestras segmentadas en ventanas utilizando la una o mas terceras funciones ventana para obtener una segunda parte de muestras espectrales de la segunda trama. Ademas, se proporciona un procesador 40 806 indicado como "procesador de codification" dentro del codificador de la Fig. 8a para procesar la primera trama y la segunda trama de valores espectrales y obtener las tramas codificadas de la senal de audio en la salida 807 del bloque 806. De este modo, el procesador de codificacion puede ser identico o diferente del procesador de codificacion 110 de la Fig. 1a y puede realizar cualquiera de las bien conocidas MPEG o AMR o cualquier otra caracterlstica de codificacion en la tecnica.
45
[0105] Posteriormente, se hace referencia a la Fig. 13. La Fig. 13 ilustra una vez mas la segunda mitad de la primera funcion ventana 1500, la segunda funcion ventana 1502 y, en la segunda imagen de la Fig. 13, dos terceras funciones ventana 1503. Al contrario, la ilustracion superior de la Fig. 13 ilustra de nuevo una primera funcion ventana 1500, una segunda funcion ventana 1502 y, a diferencia de, por ejemplo, la Fig. 15f y ligeramente similar a
50 la Fig. 15e, cuatro terceras funciones ventana 1503. De forma alternativa, el numero de terceras funciones ventana tambien puede ser tres, cinco, mas o menos.
[0106] Ademas, la Fig. 13 ilustra adicionalmente una situacion con una primera funcion ventana 1500', una segunda funcion ventana diferente 1502' y la misma tercera funcion ventana 1503. La diferencia entre 1500 y 1500'
55 es que la longitud de superposicion de las funciones 1500' y 1502 'es la mitad con respecto a las ventanas 1500, 1502. De este modo, la situacion de las funciones ventana 1500 'y 1502' es que la longitud de superposicion es una superposicion media ilustrada en 218, por ejemplo, en la Fig. 2d, mientras que la longitud de superposicion total corresponde a una trama completa como, por ejemplo, la que se ilustra en 203 en la Fig. 2a o la Fig. 13. Por lo tanto, las funciones ventana 1500 'y 1502' ilustradas en esta figura representan una combination del aspecto de
superposicion multiple y el aspecto de determinacion de ancho de superposicion.
[0107] Con el fin de explicar mejor el procedimiento del preprocesador 802 en el lado del codificador, se hace referencia a la ilustracion de la Fig. 11a, por un lado, y a los diagramas de flujo en la Fig. 9a, 9b, por otro lado. Con
5 respecto al descodificador, se hace referencia a las ilustraciones correspondientes en la Fig. 8b, Figs. 10a, 10b y la ilustracion de la Fig. 11 b. Ademas, el codificador se ilustra tambien en la Fig. 12a y el descodificador se ilustra en la Fig. 12b.
[0108] En particular, la Fig. 11a ilustra nuevamente la primera funcion ventana 1500 y al menos una parte de 10 la segunda funcion ventana 1502 y cuatro terceras funciones ventana 1503 o una unica tercera funcion ventana
1503. En particular, la Fig. 11a ilustra adicionalmente la funcion ventana auxiliar 1100. La funcion ventana auxiliar 1100 tiene una primera parte 1100a que coincide con la primera parte ascendente 1500a de la primera funcion ventana 1500. Ademas, la funcion ventana auxiliar 1100 tiene una segunda parte sin superposicion 1100b que tiene, preferentemente, coeficientes de ventana igual a la unidad y una tercera parte 1100c que corresponde a una parte 15 descendente o decreciente o una parte derecha de una o mas terceras funciones ventana. De este modo, la funcion ventana auxiliar 1100 cubre la segunda mitad de trama anterior ilustrada en 1102, la primera mitad de la trama actual i indicada por 1103, la segunda mitad de la trama actual i indicada por 1104 y la primera parte pequena 1105 cubierta por la parte de funcion ventana auxiliar 1100c. Como se desprende claramente de la Fig. 11a, la funcion ventana auxiliar se trata como una "secuencia de ventanas de inicio" o corresponde a dicha "secuencia de ventanas 20 de inicio", como si en la trama i + 1 se tuviera que introducir una secuencia de ventanas cortas. No obstante, es importante destacar que una secuencia de ventanas cortas ya se ha introducido en la trama actual en lugar de en la trama siguiente i + 1.
[0109] La funcionalidad del preprocesador se ilustra a continuacion en la Fig. 11 a. El preprocesador 25 preprocesa el segundo bloque de muestras de ventanas obtenidas con la segmentacion de ventanas utilizando la
funcion ventana auxiliar que utiliza una operacion de votacion indicada como "alias de inicio de plegamiento, trama i". De este modo, la parte mas izquierda del segundo bloque de muestras segmentadas en ventanas indicadas por 1110 se pliega hacia dentro. Esta parte 1110 es la parte del segundo bloque de muestras segmentadas en ventanas que se superponen con la primera funcion ventana anterior 1500, es decir, la parte del segundo bloque de muestras 30 segmentadas en ventanas que corresponde al perlodo de tiempo 1102 y que se encuentra en la trama anterior i - 1. Debido al hecho de que esta operacion de plegamiento de la parte 1110 influye ahora en la zona de superposicion 1300, la operacion de plegamiento realizada por el preprocesador da como resultado una parte modificada de superposicion multiple. En este punto, el convertidor espectral aplica la operacion ilustrada en la llnea de la fig. 11a indicada como "aliases de plegamiento interno". En particular, el convertidor espectral aplica una transformada de 35 introduccion de aliasing al primer bloque de muestras utilizando la primera funcion ventana que se ilustra para la trama i - 1. La transformada de introduccion de aliasing comprende la operacion de plegamiento ilustrada en 1120 y la subsiguiente, por ejemplo, la transformada DCT-IV indicada en 1122. Para ello, se requiere la primera funcion ventana 1500 a fin de obtener la forma antes de la operacion de plegamiento 1120 para la trama i - 1. Ademas, el convertidor espectral aplica la transformada de introduccion de aliasing a la primera parte indicada por el punto 1131 40 en la Fig. 11 a. Esto se realiza utilizando la segunda funcion ventana 1502 y, en particular, la parte derecha de la segunda funcion ventana 1502. Esta operacion da como resultado una primera parte de muestras espectrales de una segunda trama obtenida por la transformada 1132, donde la transformada 1132 representa, una vez mas, una operacion DCT-IV que constituye, junto con la correspondiente operacion de plegamiento, pero ahora solo en la parte de superposicion derecha del bloque 1131, la transformada de introduccion de aliasing.
45
[0110] Ademas, el convertidor espectral esta configurado para aplicar la transformada de introduccion de aliasing a una segunda parte 1133 del segundo bloque preprocesado 1130 utilizando la una o mas terceras funciones ventana 1503 para obtener una segunda parte 1135 de muestras espectrales de la segunda trama. Por lo tanto, con el fin de obtener la segunda parte 1135 de muestras espectrales, se pueden aplicar cuatro transformadas
50 N/8 DCT-IV o una unica transformada DCT-IV N/2. El numero de transformadas y las longitudes dependen del numero de terceras funciones ventana. Generalmente, la longitud, la transformada o el numero de muestras espectrales en la segunda parte 1135 es igual al numero de muestras espectrales en una trama menos la longitud de la transformada 1132 y el resultado se divide, a continuacion, por el numero de terceras funciones ventana utilizadas.
55
[0111] Por lo tanto, el preprocesador 802 es generalmente operativo para la segmentacion en ventanas 902 (Figura 9a) de la senal de audio utilizando la funcion ventana auxiliar 1100 para obtener el segundo bloque de muestras segmentadas en ventanas. A continuacion, el procesador 904 aplica, preferentemente, la operacion de plegamiento indicada en 1110 en la Fig. 11a para obtener el segundo bloque preprocesado de muestras
segmentadas en ventanas con la parte de superposicion multiple modificada 1300. A continuation, el convertidor 906 aplica las transformadas utilizando la primera, segunda y tercera funciones ventana para obtener la primera trama de valores espectrales 1122, la primera parte 1132 de la segunda trama y la segunda parte 1135 de la segunda trama o trama i en la notation de la Fig. 11 a.
5
[0112] En la realization preferida, ilustrada con respecto a la Fig. 9b, se determina la funcion ventana auxiliar 910 haciendo referencia a la primera funcion ventana y, ejemplarmente seleccionando, como primera parte 1100a de la funcion ventana auxiliar 1100, la primera parte 1500a de la primera funcion ventana. Ademas, se determina la parte sin superposicion 1100b (se toman los coeficientes de ventana de uno para la longitud correspondiente) y se
10 determina entonces la tercera parte 1100c, de nuevo ejemplarmente, tomando la segunda parte de la funcion ventana corta.
[0113] A continuacion, se segmenta en ventanas 912 la senal de audio con esta funcion ventana auxiliar en la relation correcta con la anterior o primera trama i - 1 ilustrada en la Fig. 11 a. A continuacion, como se ilustra en 914
15 en la Fig. 9b, la parte izquierda 1110 y, preferentemente, la parte derecha 1111 se pliegan. En la etapa 916, se realiza un plegamiento de las partes superpuestas ilustradas en las llneas sombreadas en el punto e) o f) en la zona interna. Ademas, como se ilustra en 918, si hay mas terceras funciones ventana como en la Fig. 11a subimagen e), entonces tambien se realiza el plegamiento de partes superpuestas de las terceras funciones ventana. Sin embargo, si solo hay una unica tercera funcion ventana como se ilustra en la Fig. 11a, subimagen f), entonces el control 20 procede desde la etapa 916 a 920 directamente sin la etapa 918. En la etapa 920, las operaciones DCT se realizan utilizando los kernels DCT mas cortos que el kernel DCT de la primera trama. El kernel DCT de la subimagen e) es, para la segunda funcion ventana, N/2, y para las terceras funciones ventana, N/8. Contrariamente a esto, cuando solo hay una sola tercera funcion ventana, entonces el kernel de la transformada es igual a N/2 para la segunda funcion ventana y es igual a N/2 para la unica tercera funcion ventana.
25
[0114] Por lo tanto, queda claro que la zona de superposicion multiple 1300 se segmenta en ventanas dos veces. La primera segmentation en ventanas es realizada por la primera parte 1100a de la ventana auxiliar y la segunda segmentacion en ventanas es realizada por la segunda mitad de la primera tercera funcion ventana 1503 como se ilustra en la subimagen e) o f) de la Fig. 11 a.
30
[0115] Se hace referencia a la Fig. 13 de nuevo. Como se ha analizado en el contexto de la Fig. 1a o en el contexto de la Fig. 8a, el controlador de secuencia de ventanas genera las formas de ventana especlficas. En una realizacion, el controlador de secuencia de ventanas esta configurado para comprender el detector de ubicacion de transitorios 106. Cuando se detecta un transitorio en las partes de detection de transitorios 0 o 1, entonces el
35 codificador es controlado para entrar en el modo de parte de superposicion multiple de modo que estos transitorios indicados en 1305 se limitan a quedar solamente dentro de una unica tercera ventana o dentro de dos terceras ventanas adyacentes. Especlficamente, el transitorio izquierdo 1305 esta confinado para quedar en la primera funcion ventana corta solamente, donde el transitorio derecho de los transitorios 1305 se encuentra entre la primera a tercera funciones ventana. Sin embargo, cuando se determina que los transitorios estan situados en una zona 40 diferente de 0, tal como en la zona 1, 2, 3, mas o menos, entonces se puede realizar un procesamiento sin la zona de superposicion multiple, por ejemplo, de manera similar a lo analizado en el contexto de la Fig. 6a, Fig. 6b, Fig. 7, mas o menos.
[0116] Sin embargo, contrariamente a esto, el procesamiento de la zona de superposicion multiple tambien 45 se puede realizar en el contexto de la aplicacion de conmutacion de ventana, en el que, cuando se detecta un
transitorio, se puede conmutar un conjunto aun mayor de ventanas cortas para la trama actual, de manera que, preferentemente, dentro de un mismo bloque o raster de trama, se utiliza una ventana larga o un numero especificado de ventanas cortas para la segmentacion en ventanas. La primera ventana corresponde a la ventana 1500, por ejemplo, en la Fig. 13, la segunda ventana corresponde a la ventana 1502 y se realiza una conmutacion, 50 sin tener que hacer referencia a una determinada ubicacion de transitorios, a un numero de terceras funciones ventana solamente cuando en cualquier parte de la trama actual se detecta un transitorio sin saber exactamente donde se encuentra el transitorio dentro de la trama.
[0117] Sin embargo, se prefiere, con el fin de mantener el numero de terceras funciones ventana tan 55 pequeno como sea posible, que la conmutacion en el modo de parte de superposicion multiple y la conmutacion
adicional de la superposicion de transformadas y la selection de longitud de transformada se lleve a cabo en funcion de la ubicacion especlfica del transitorio dentro de la trama, es decir, en una entre, preferentemente, cuatro o incluso ocho partes diferentes de una trama, o de una parte de tiempo correspondiente a una trama, donde esta parte de tiempo es entonces igual a la mitad del tamano de una ventana larga, tal como una ventana larga 1500 de la Fig. 13.
Preferentemente, la parte de superposicion multiple, como puede verse en la Fig. 13, esta situada antes de un inicio 208 (ilustrado en la Fig. 2 por un lado y la Fig. 13 por otro lado) de la zona de anticipacion.
[0118] En el lado del descodificador, se realiza un procesamiento analogo. En una realizacion de un aparato 5 para descodificar una senal de audio codificada 821, que comprende una primera trama codificada y una segunda
trama codificada, un procesador de descodificacion 824 de la Fig. 8b es necesario para procesar la primera trama codificada y la segunda trama codificada y obtener una primera trama de valores espectrales y una segunda trama de valores espectrales, la primera trama y la segunda tramas que comprenden partes de aliasing. Un convertidor de tiempo 826 esta conectado al procesador decodificado 824 y el convertidor de tiempo 826 esta configurado para 10 aplicar una transformada a esta primera trama utilizando una primera funcion ventana para obtener un primer bloque de muestras. Ademas, el convertidor de tiempo 826 esta configurado para aplicar la transformada a una primera parte de la segunda trama utilizando una segunda funcion ventana y para aplicar la transformada a una segunda parte de la segunda trama utilizando una o mas terceras funciones ventana para obtener el segundo bloque de las muestras. Como se ha analizado en el contexto de la Fig. 1a, la primera funcion ventana 1500, la segunda funcion 15 ventana 1502 y la una o mas terceras funciones ventana 1503 conjuntamente tienen una zona de superposicion multiple 1300.
[0119] Ademas, el descodificador comprende un posprocesador 828 para posprocesar el segundo bloque de muestras utilizando una operacion de despliegue y obtener un segundo bloque de muestras posprocesadas que
20 tiene una parte del segundo bloque de muestras que se superpone con el primer bloque de muestras en la zona de superposicion multiple. Ademas, el posprocesador 828 esta configurado para segmentar en ventanas el segundo bloque de muestras posprocesadas utilizando la funcion ventana auxiliar analizada en el contexto de la Fig. 8a y la Fig. 11a. El posprocesador 828 realiza una suma de superposicion del segundo bloque de muestras procesadas segmentado en ventanas y el primer bloque de muestras para obtener la senal de audio descodificada indicada en 25 829 de la Fig. 8b o en el bloque 175 de la Fig. 1 c. Asl, basicamente, el posprocesador 828 de la Fig. 8b puede tener la funcionalidad del dispositivo de segmentacion en ventanas de slntesis 172 con respecto a la funcion ventana auxiliar y el sumador de superposicion 174.
[0120] Posteriormente, se analiza la funcionalidad del posprocesador en cooperacion con el convertidor de 30 tiempo con respecto a la ilustracion de la Fig. 11b que ilustra un procesamiento inverso con respecto a la Fig. 11 una
ilustracion del codificador. La primera trama de valores espectrales 1142 se introduce en una transformada inversa 1161 de tamano N y la primera parte 1152 de la segunda trama se introduce en una transformada inversa N/2 1162 y en funcion del numero de terceras funciones ventana, la segunda parte 1155 de la segunda trama o bien se introduce en cuatro transformadas cortas N/8 1163 o una unica transformada N/2 1162 similar a la primera parte 35 1152 de la segunda trama.
[0121] Este procedimiento es realizado por el convertidor de tiempo. El convertidor de tiempo utiliza adicionalmente la primera funcion ventana para realizar la segmentacion en ventanas junto con una operacion de despliegue realizada antes que se ilustra en 1170 en la Fig. 11 b. Ademas, la segunda funcion ventana se utiliza
40 cuando se aplican los procedimientos a la primera parte 1152 ilustrada en 1172. Especlficamente, se realiza el despliegue especlficamente de la parte mas derecha 1173 de la segunda funcion ventana y se realiza la segunda segmentacion en ventanas posterior, mientras que, en el lado izquierdo de la trama, no se realiza ningun despliegue interno. Ademas, la transformada realiza un despliegue especlfico y subsiguiente segmentacion en ventanas y la suma de superposicion adicional no solo con la primera parte 1152 de la segunda trama, sino tambien con la 45 segunda parte 1155 de la segunda trama como se ilustra en 1172 en la Fig. 11 b. Si solo hay una unica tercera funcion ventana ilustrada en la subimagen f) de la Fig. 11b, entonces solo se realiza una unica operacion de despliegue de ambos lados junto con la segmentacion en ventanas, utilizando la parte derecha de la segunda funcion ventana y la parte izquierda de la tercera funcion ventana y la posterior suma de superposicion dentro del intervalo de superposicion 1174.
50
[0122] Despues, el posprocesador aplica el posprocesamiento utilizando la operacion de despliegue ilustrada en 1175 con la primera parte del resultado del procedimiento en 1172 para obtener una parte 1176a que se extiende en la trama anterior y, preferentemente, 1176b que se extiende en la trama siguiente. A continuacion, se realiza la segmentacion en ventanas con la parte desplegada 1176a, 1176b y, por supuesto, con la parte dentro de la trama
55 actual i utilizando la funcion ventana auxiliar para obtener el estado ilustrado en 1175. A continuacion, se realiza una suma de superposicion final del segundo bloque de muestras posprocesadas segmentadas en ventanas con la funcion ventana auxiliar y el primer bloque de muestras, en y dentro del intervalo de superposicion 1180 para obtener la senal de audio descodificada final correspondiente a este intervalo de superposicion 1180. Ademas, este procedimiento da lugar adicionalmente a una parte posterior de muestras de senal de audio descodificadas 1181
debido al hecho de que no hay superposicion y la seccion siguiente 1182 se obtiene mediante la superposicion con la parte correspondiente de una funcion ventana para la trama i + 1, que sigue a la trama i en el tiempo.
[0123] De este modo, como se ilustra en la Fig. 10a, el procedimiento del lado del descodificador comprende 5 aplicar 1000 una transformada a la primera trama utilizando la primera funcion ventana y aplicar 1010 la
transformada a la primera parte de la segunda trama utilizando la segunda funcion ventana y aplicar 1020 la transformada a la segunda parte de la segunda trama utilizando la tercera o terceras funciones ventana. A continuacion, en la etapa 1030 se realiza una operation de despliegue y en la etapa 1040 se realiza una segmentation en ventanas utilizando la funcion ventana auxiliar y, finalmente, en la etapa 1050 se realiza una suma 10 de superposicion del segundo bloque posprocesado segmentado en ventanas y el primer bloque para obtener la senal de audio descodificada al final del procesamiento ilustrado, por ejemplo, en la Fig. 11b.
[0124] Como se ilustra en la Fig. 10b, las realizaciones preferidas comprenden realizar una operacion de DCT inversa para cada parte de la segunda trama, es decir, realizar varias operaciones de DCT con longitudes mas
15 cortas con respecto a la trama anterior i - 1, donde se utilizo una ventana larga 1500. En la etapa 1070 se realiza un despliegue de las partes de aliasing internas como la operacion ilustrada en 1172 y el despliegue es, preferentemente, una replica en el llmite correspondiente ilustrado como llneas verticales en la llnea indicada por 1172 en la Fig. 11 b. A continuacion, en la etapa 1080, se lleva a cabo una segmentacion en ventanas utilizando la segunda y tercera funciones ventana dentro del bloque 1184 y la posterior suma de superposicion del resultado de la 20 segmentacion en ventanas dentro del bloque se realiza como se ilustra en 1090. Entonces, como se indica en 192, se realiza un despliegue de la derecha/izquierda o, dicho de otro modo, de las partes de aliasing anterior/posterior del resultado de la suma de superposicion con el fin de obtener la parte 1176a que se extiende en la trama anterior y la parte 1176b que se extiende en la trama siguiente. Sin embargo, la representation en 1175 solo es posterior a la segmentacion en ventanas que utiliza la funcion ventana auxiliar ilustrada en 1094. A continuacion, en la etapa 1906, 25 se realiza una superposicion con el primer bloque de muestras posterior a la segmentacion en ventanas que utiliza la funcion ventana auxiliar.
[0125] Posteriormente, se hace referencia a la Fig. 12a y la Fig. 12b. El punto a en la Fig. 12a corresponde al procedimiento de la primera llnea de la fig. 11 a. El procedimiento en la subimagen b) corresponde al procedimiento
30 realizado en la segunda y tercera llneas de la Fig. 11a y los procedimientos ilustrados en el punto c) de la Fig. 12a corresponden a los procedimientos de las dos ultimas llneas de la Fig. 11a. De forma analoga, la representacion del lado del descodificador corresponde a la Fig. 12b. En particular, las dos primeras llneas de la Fig. 11b corresponden a la subimagen f) de la Fig. 12b. La tercera y cuarta llneas corresponden al punto e) de la Fig. 12b y la ultima llnea de la Fig. 12b corresponde a la ultima llnea de la Fig. 11b.
35
[0126] La Fig. 14a ilustra una situation en la que el controlador de secuencia de ventanas en el lado del codificador o los elementos 824, 826, 828 del lado del descodificador estan configurados para conmutar entre una situacion de no superposicion multiple como en la Fig. 14a y una situacion de superposicion multiple ilustrada en la Fig. 14b. Por lo tanto, cuando se detecta un transitorio en la parte de transitorios 0, un procedimiento es no aplicar la
40 parte de superposicion multiple, sino conmutar a ventanas cortas de superposicion unica TCX-10 a partir de ventanas TCX-20. Preferentemente, sin embargo, se realiza una conmutacion a una parte de superposicion multiple aplicando una secuencia de ventanas que comprende la primera ventana 1400, la segunda ventana 1402 y una o, en la realization de la Fig. 14b, dos terceras ventanas 1403.
45 [0127] Las superposiciones y tamanos de la ventana de la Fig. 14b son algo diferentes de la ilustracion de la
Fig. 13, pero queda claro que los procedimientos generales con respecto al lado del codificador en la Fig. 11a o el lado del descodificador en la Fig. 11 b tienen lugar de la misma manera.
[0128] Posteriormente, se analiza la Fig. 15. Especlficamente, la Fig. 15 ilustra, como las cajas negras, una
50 anticipation de detection de transitorios 1590 y la duration del pre-eco resultante 1595. La Fig. 15a ilustra una secuencia tradicional High-Efficiency-AACtype que comprende una ventana de inicio largo, ocho ventanas cortas, una ventana de parada larga y as! sucesivamente. La anticipacion necesaria es alta y asciende a N + N/2 + N/16, pero el pre-eco 1595 es pequeno. De forma analoga, la Fig. 15b ilustra un procedimiento tradicional de deteccion de transitorios AAC low delay-type que da como resultado una secuencia de ventanas que comprende una secuencia 55 larga, una ventana de inicio largo, una ventana con superposicion baja y una ventana de parada larga. La anticipacion de deteccion de transitorios es la misma que en la Fig. 15a, pero la duracion del pre-eco es mas larga que en la Fig. 15a. Por otra parte, sin embargo, la eficacia es mayor debido al hecho de que cuando se utilizan ventanas mas cortas, la eficacia de la velocidad binaria es menor.
[0129] La Fig. 15c y 15d ilustran una implementacion del High-Efficiency AAC o un procedimiento de AAC-low delay con una anticipacion reducida de detection de transitorios de N/16 muestras y solo se muestran secuencias largas posibles con una anticipacion reducida de deteccion de transitorios de N/l6 muestras. Si la secuencia consiste en una ventana larga, una ventana larga, una ventana de inicio largo, una ventana de parada larga, y as!
5 sucesivamente, como se ilustra en la Fig. 15d, solo el posteco se reduce en comparacion con la Fig. 15c, pero el pre-eco 1595 es el mismo. Por lo tanto, la Fig. 15c, d, ilustran una anticipacion corta similar a las Figs. 15e y 15f de la invention. Si ahora se implementa la parte de superposition multiple como en las Figs. 15c y 15e, entonces solo se pueden utilizar secuencias como en esas figuras, pero cualquier conmutacion a una ventana corta no es posible. De este modo, la parte de superposicion multiple permite conmutar a ventanas cortas para reducir los pre- 10 ecos/postecos, o utilizar un retardo de anticipacion corto, o ambas caracterlsticas para reducir el retardo y reducir los pre y post-ecos.
[0130] La Fig. 15e ilustra una secuencia de High-Efficiency AAC con una deteccion reducida de transitorios frente a las N/16 muestras y la zona de superposicion multiple preferida 1300. La secuencia comprende una ventana
15 larga, otra ventana larga 1500, otra secuencia de inicio 1502, cuatro secuencias cortas 1503 y una ventana de parada larga 1504. Como queda claro, la anticipacion es pequena, as! como lo es el pre-eco. Se obtiene una situation similar para la Fig. 15f que ilustra una configuration similar a la de la Fig. 15e, pero con solo una unica tercera funcion ventana en lugar de cuatro secuencias cortas.
20 [0131] Aunque la presente invencion se ha descrito en el contexto de diagramas de bloques en los que los
bloques representan componentes de hardware reales o logicos, la presente invencion tambien puede implementarse mediante un procedimiento implementado por ordenador. En este ultimo caso, los bloques representan las etapas del procedimiento correspondientes en las que estas etapas representan las funcionalidades realizadas por bloques de hardware logico o flsico correspondientes.
25
[0132] Aunque se han descrito algunos aspectos en el contexto de un aparato, es evidente que estos
aspectos tambien representan una description del procedimiento correspondiente, donde un bloque o dispositivo se corresponde con una etapa del procedimiento o una caracterlstica de una etapa del procedimiento. De forma analoga, los aspectos que se describen en el contexto de una etapa del procedimiento tambien representan una 30 descripcion de un bloque correspondiente o un punto o caracterlstica del aparato correspondiente. Algunas o todas las etapas del procedimiento se pueden ejecutar con (o utilizando) un aparato de hardware, como, por ejemplo, un microprocesador, un ordenador programable o un circuito electronico. En algunas realizaciones, una o mas de las etapas mas importantes del procedimiento se pueden ejecutar con dicho aparato.
35 [0133] La serial codificada o transmitida de la invencion se puede almacenar en un medio de
almacenamiento digital o se puede transmitir con un medio de transmision tal como un medio de transmision inalambrico o un medio de transmision por cable como Internet.
[0134] En funcion de ciertos requisitos de implementacion, las realizaciones de la invencion se pueden
40 implementar en hardware o en software. La implementacion puede realizarse utilizando un medio de
almacenamiento digital, por ejemplo, un disquete, un DVD, un Blu-Ray, un CD, una ROM, una PROM, una EPROM, una EEPROM o una memoria FLASH, que tiene senales de control legibles electronicamente y almacenadas en el mismo, que coopera (o es capaz de cooperar) con un sistema informatico programable de tal manera que se lleve a cabo el procedimiento respectivo. Por lo tanto, el medio de almacenamiento digital puede ser legible mediante 45 ordenador.
[0135] Algunas realizaciones segun la invencion comprenden un soporte de datos que tiene senales de control legibles electronicamente y que son capaces de cooperar con un sistema informatico programable, de tal manera que se lleve a cabo uno de los procedimientos descritos en este documento.
50
[0136] En general las realizaciones de la presente invencion se pueden implementar como un producto de
programa informatico con un codigo de programa, siendo el codigo de programa operativo para llevar a cabo uno de
los procedimientos cuando el producto de programa informatico se ejecuta en un ordenador. El codigo de programa se puede almacenar, por ejemplo, en un soporte legible por maquina.
55
[0137] Otras realizaciones comprenden el programa de ordenador para llevar a cabo uno de los procedimientos descritos en este documento, almacenado en un soporte legible por maquina.
[0138] En otras palabras, una realization del procedimiento de la invencion es, por lo tanto, un programa
informatico que tiene un codigo de programa para realizar uno de los procedimientos descritos en este documento cuando el programa informatico se ejecuta en un ordenador.
[0139] Las realizaciones anteriormente descritas son meramente ilustrativas de los principios de la presente 5 invencion. Se entiende que las modificaciones y variaciones de las disposiciones y los detalles descritos en este
documento seran evidentes para otros expertos en la tecnica. La intencion es, por lo tanto, estar limitado solo por el alcance de las reivindicaciones de patente inminentes y no por los detalles especlficos presentados a modo de descripcion y las explicaciones de las realizaciones de este documento.
10 Referencias
[0140]
[1] International Organization for Standardization, ISO/IEC 14496-3 2009, "Information Technology - Coding of audio- 15 visual objects - Part 3 Audio," Geneva, Switzerland, Aug. 20096.
[2] Internet Engineering Task Force (IETF), RFC 6716, "Definition of the Opus Audio Codec," Proposed Standard, Sep. 2012. Disponible en llnea en
http://tools.ietf.org/html/rfc6716.
20 [3] C. R. Heimrich, "On the Use of Sums of Sines in the Signal Windows," in Proc. of the 13th Int. Conference on Digital Audio Effects (DAFx-10), Graz, Austria, Sep. 2010.
[4] J. Herre y J. D. Johnston, "Enhancing the Performance of Perceptual Audio Coders by Using Temporal Noise Shaping (TNS)," in Proc. 101 st AES Convention, LA, USA, Nov. 1996
25
[5] M. Neuendorf y col., "MPEG Unified Speech and Audio Coding - The ISO/MPEG Standard for High-Efficiency Audio Coding of All Content Types," in Proc 132nd Convention of the AES, Budapest, Hungary, Apr. 2012. Tambien aparecera en el Journal de la AES, 2013.

Claims (30)

  1. REIVINDICACIONES
    1. Aparato para generar una senal codificada de audio o imagen en presencia de transitorios, que
    comprende:
    5
    un controlador de secuencia de ventanas (808) para generar una information de secuencia de ventanas (809) para segmentar en ventanas una senal de audio o imagen, la informacion de secuencia de ventanas que indica una primera funcion ventana (1500) para generar una primera trama de valores espectrales, una segunda funcion ventana (1502) y al menos una tercera funcion ventana (1503) para generar una segunda trama de valores 10 espectrales que tiene una primera y una segunda partes, en donde la primera funcion ventana (1500), la segunda funcion ventana (1502) y la una o mas terceras funciones ventana se superponen dentro de una zona de superposition multiple (1300);
    un preprocesador (802) para segmentar en ventanas (902) un segundo bloque de muestras correspondiente a la segunda funcion ventana y una o mas terceras funciones ventana que utilizan una funcion ventana auxiliar (1100) 15 para obtener un segundo bloque de muestras segmentadas en ventanas, y para preprocesar (904) el segundo bloque de muestras segmentadas en ventanas utilizando una operation de plegamiento de una parte del segundo bloque que se superpone con un primer bloque en la parte de superposicion multiple (1300) para obtener un segundo bloque preprocesado de muestras segmentadas en ventanas que tienen una parte modificada de superposicion multiple;
    20 un convertidor espectral (804) para aplicar una transformadas de introduction de aliasing (906) al primer bloque de muestras utilizando la primera funcion ventana (1500) y obtener la primera trama de valores espectrales, para aplicar otra transformada de introduccion de aliasing a una primera parte del segundo bloque preprocesado de muestras segmentadas en ventanas utilizando la segunda funcion ventana (1502) y obtener una primera parte de valores espectrales de la segunda trama, y para aplicar otra o mas transformadas de introduccion de aliasing a una 25 segunda parte del segundo bloque preprocesado de muestras segmentadas en ventanas utilizando una o mas terceras funciones ventana (1503) y obtener una segunda parte de valores espectrales de la segunda trama; y un procesador (806) para procesar la primera trama y la segunda trama y obtener tramas codificadas de la senal de audio o imagen.
    30 2. Aparato de la reivindicacion 1,
    en el que la segunda funcion ventana (1502) tiene una primera parte (1100a) que se superpone con la primera funcion ventana (1500),
    en el que la una o mas terceras funciones ventana (1503) tienen una segunda parte (1111) que se superpone con 35 una cuarta funcion ventana que sigue a una o mas terceras funciones ventana (1503), y
    en el que el preprocesador (802) esta configurado para aplicar la funcion ventana auxiliar (1100), teniendo la funcion ventana auxiliar una primera parte (1100a) similar a la primera parte de la segunda funcion ventana y teniendo una tercera parte (1100c) similar a la segunda parte de una o mas terceras funciones ventana, en la que una segunda parte de la funcion
    40 ventana auxiliar se extiende entre la primera parte y la tercera parte.
  2. 3. Aparato de la reivindicacion 2,
    en el que la funcion ventana auxiliar tiene la segunda parte (1100b) correspondiente a una segunda parte de una o 45 mas funciones ventana (1503), o
    en el que la segunda parte (1100b) tiene coeficientes de ventana mayores de 0,9 o que son la unidad, o en el que la longitud de la segunda parte es tal que el segundo bloque preprocesado de muestras segmentadas en ventanas da como resultado un numero de valores espectrales identicos al numero de valores espectrales en la primera trama.
    50
  3. 4. Aparato segun una de las reivindicaciones precedentes,
    en el que el controlador de secuencia de ventanas (808) esta configurado para generar la informacion de secuencia de ventanas (809) de tal manera que la segunda funcion ventana (1502), o la una o mas terceras funciones ventana 55 (1503) tienen un tamano o duration inferior a un tamano o duration de la primera funcion ventana (1500).
  4. 5. Aparato segun una de las reivindicaciones precedentes,
    en el que el preprocesador (802) esta configurado para utilizar, como funcion ventana auxiliar, una funcion ventana
    de inicio (1100) de manera que un numero de valores espectrales obtenidos mediante la transformacion del segundo bloque de muestras segmentadas en ventanas para obtener la segunda trama es igual a un numero de valores espectrales de la primera trama.
    5 6. Aparato segun una de las reivindicaciones precedentes,
    en el que el convertidor espectral (804) esta configurado para segmentar en ventanas el primer bloque de muestras utilizando la primera funcion ventana y obtener un primer bloque de muestras segmentadas en ventanas y aplicar la transformada de introduccion de aliasing en el primer bloque de muestras segmentadas en ventanas.
    10
  5. 7. Aparato segun una de las reivindicaciones precedentes,
    en el que el convertidor espectral (804) esta configurado para segmentar en ventanas la primera parte del segundo bloque preprocesado utilizando una segunda parte de la segunda funcion ventana, en el que una primera parte de la 15 segunda funcion ventana no se utiliza para segmentar en ventanas y para aplicar la transformada de introduccion de aliasing a una primera parte segmentada en ventanas del segundo bloque preprocesado.
  6. 8. Aparato segun una de las reivindicaciones precedentes,
    20 en el que el convertidor espectral (804) esta configurado para segmentar en ventanas la segunda parte del segundo bloque preprocesado utilizando la una o mas terceras funciones ventana excepto una segunda parte de la tercera funcion ventana o una segunda parte de una tercera funcion ventana ultima en el tiempo o en el espacio.
  7. 9. Aparato de una de las reivindicaciones precedentes,
    25
    en el que el preprocesador (802) esta configurado para realizar, en el plegamiento, una inversion en el tiempo o en el espacio de la parte y la suma ponderada de una parte invertida en el tiempo o el espacio con una parte, con la se ha plegado la parte del segundo bloque.
    30 10. Aparato de una de las reivindicaciones precedentes,
    en el que el preprocesador (802) esta configurado para utilizar adicionalmente una operation de plegamiento adicional de una parte del segundo bloque que se superpone con una cuarta funcion ventana que sigue a una o mas terceras funciones ventana en el tiempo o en el espacio para obtener el segundo bloque preprocesado de muestras 35 segmentadas en ventanas.
  8. 11. Aparato segun una de las reivindicaciones precedentes,
    en el que el convertidor espectral (804) esta configurado para realizar una operacion de transformada discreta del 40 coseno modificada (MDCT) o una operacion de transformada discreta del seno modificada (MDST).
  9. 12. Aparato segun una de las reivindicaciones precedentes,
    en el que el convertidor espectral (804) esta configurado para realizar la operacion MDCT o MDST aplicando una 45 operacion de plegamiento para reducir un numero de muestras y una posterior transformada discreta del coseno u operacion de transformada discreta del seno en el numero reducido de muestras.
  10. 13. Aparato segun una de las reivindicaciones precedentes,
    50 en el que el controlador de secuencia de ventanas (808) comprende un detector de transitorios (106) para detectar una ubicacion de transitorios en una zona de anticipation de la primera trama, y en el que el controlador de secuencia de ventanas (808) esta configurado para generar la information de secuencia de ventanas (809) en respuesta a una detection de ubicacion de transitorios en la zona de anticipacion o en una parte especlfica de la zona de anticipacion, y
    55 en el que el controlador de secuencia de ventanas (808) esta configurado para generar otra informacion de secuencia que indica una secuencia de primeras ventanas superpuestas, cuando el transitorio no se detecta en la zona de anticipacion, o se detecta en una parte de la zona de anticipacion diferente de la parte especlfica.
  11. 14. Aparato de una de las reivindicaciones precedentes,
    en el que la parte especlfica es un cuarto de un inicio de un centro de la trama actual.
  12. 15. Aparato de una de las reivindicaciones 13 o 14,
    5
    en el que la parte de superposicion multiple esta situada, en el tiempo o en el espacio, antes de un inicio de la zona de anticipacion, o una parte de la zona de anticipacion en la primera trama.
  13. 16. Aparato de una de las reivindicaciones 13 o 14,
    10
    en el que el controlador de secuencia de ventanas (808) esta configurado para seleccionar una ventana especlfica entre un grupo de al menos tres ventanas en funcion de una ubicacion de transitorios (107), comprendiendo el grupo de al menos tres ventanas una primera ventana (201) que una primera longitud de superposicion (203), una segunda ventana (225) que tiene una segunda longitud de superposicion (218), y una tercera ventana (222) que 15 tiene una tercera longitud de superposicion (229) o ninguna superposicion, en el que la primera longitud de superposicion es mayor que la segunda longitud de superposicion y en el que la segunda longitud de superposicion es mayor que la tercera longitud de superposicion o mayor que una superposicion cero, en el que la ventana especlfica se selecciona en base a la ubicacion de transitorios de manera que una de dos ventanas superpuestas consecutivas tenga los primeros coeficientes de ventana en la ubicacion del transitorio y la otra de las dos ventanas 20 superpuestas consecutivas tiene segundos coeficientes de ventana en la ubicacion del transitorio, en el que los segundos coeficientes de ventana son, al menos, nueve veces mayores que los primeros coeficientes de ventana.
  14. 17. Aparato para descodificar una senal codificada de audio o imagen en presencia de transitorios, que comprende una primera trama codificada y una segunda trama codificada, que comprende:
    25
    un procesador (824) para procesar la primera trama codificada y la segunda trama codificada y obtener una primera trama de valores espectrales y una segunda trama de valores espectrales, la primera y segunda tramas comprendiendo una parte de aliasing;
    un convertidor de tiempo (826) para aplicar una transformada a la primera trama de valores espectrales utilizando 30 una primera funcion ventana (1500) y obtener un primer bloque de muestras, para aplicar otra transformada a una primera parte de la segunda trama de valores espectrales utilizando una segunda ventana (1502), y para aplicar otra o mas transformadas a una segunda parte de la segunda trama de valores espectrales utilizando una o mas terceras funciones ventana (1503) y obtener un segundo bloque de muestras,
    en el que la primera funcion ventana (1500), la segunda funcion ventana (1502) y la tercera funcion ventana forman 35 una zona de superposicion multiple (1630); y
    un posprocesador (828) para posprocesar el segundo bloque de muestras utilizando una operacion de plegamiento y obtener un segundo bloque de muestras posprocesadas que tiene una parte del segundo bloque de muestras que se superpone con el primer bloque de muestras en la zona de superposicion multiple, para segmentar en ventanas el segundo bloque de muestras utilizando una funcion ventana auxiliar (1100), y para sumar la superposicion en el 40 segundo bloque de muestras posprocesadas segmentadas en ventanas y el primer bloque de muestras y obtener una senal de audio o imagen descodificada (1180).
  15. 18. Aparato de la reivindicacion 17,
    45 en el que la aplicacion de la transformada comprende realizar una suma de superposicion (1172) de una primera parte del segundo bloque de muestras y una segunda parte del segundo bloque de muestras para obtener el segundo bloque de muestras.
  16. 19. Aparato de la reivindicacion 18,
    50
    en el que la operacion de plegamiento comprende replicar muestras con respecto a un borde del segundo bloque de muestras.
  17. 20. Aparato de las reivindicaciones 17 a 19,
    55
    en el que el convertidor de tiempo (826) esta configurado para utilizar exactamente una tercera funcion ventana (1503) y una longitud de la tercera funcion ventana es tal que un numero de valores espectrales igual al 50% del numero de valores espectrales de la primera trama son transformados y un resultado es segmentado en ventanas con la tercera funcion ventana, o en el que el convertidor de tiempo esta configurado para usar exactamente dos
    terceras ventanas y una longitud de la tercera ventana es tal que un numero de valores espectrales igual a 1/8 del numero de valores espectrales de la primera trama son transformados, o en el que el convertidor de tiempo esta configurado para utilizar exactamente una tercera ventana y la longitud de la tercera ventana es tal que un numero de valores espectrales igual a 1/4 del numero de valores espectrales de la primera trama son transformados, o para 5 utilizar exactamente cuatro terceras ventanas y la longitud de una tercera ventana es tal que un numero de valores espectrales es igual a 1/8 del numero de valores espectrales de la primera trama.
  18. 21. Aparato de una de las reivindicaciones 17 a 20,
    10 en el que la senal de audio o imagen codificada comprende una indicacion de ventana (603) asociada a la primera y segunda tramas codificadas,
    en el que el aparato comprende ademas una interfaz (820) para extraer y analizar la indicacion de ventana; y en el que el convertidor de tiempo o el posprocesador (828) estan configurados para ser controlados por la indicacion de ventana y aplicar una forma de ventana indicada o longitud de ventana o longitud de transformada.
    15
  19. 22. Aparato de una de las reivindicaciones 17 a 21,
    en el que la segunda funcion ventana (1502) tiene una primera parte (1100a) que se superpone con la primera funcion ventana (1500), en el que una o mas funciones ventana tercera tienen una segunda parte (1111) que se 20 superpone con una cuarta funcion ventana que sigue a la o mas terceras funciones ventana (1503), y en el que el posprocesador esta configurado para aplicar la funcion ventana auxiliar (1100), teniendo la funcion ventana auxiliar una primera parte (1100a) similar a la primera parte de la segunda funcion ventana, y teniendo una tercera parte (1100c) similar a la segunda parte de una o mas terceras funciones ventana, en el que una segunda parte de la funcion ventana auxiliar se extiende entre la primera parte y la tercera parte.
    25
  20. 23. Aparato de una de las reivindicaciones 17 a 22,
    en el que la funcion ventana auxiliar tiene la segunda parte (1100b) correspondiente a una segunda parte de una o mas terceras funciones ventana (1503), o en el que la segunda parte (1100b) tiene coeficientes de ventana mayores 30 de 0,9 o que son la unidad, o en el que la longitud de la segunda parte es tal que el segundo bloque preprocesado de muestras segmentadas en ventanas da como resultado un numero de valores espectrales identicos al numero de valores espectrales en la primera trama.
  21. 24. Aparato de una de las reivindicaciones 17 a 23,
    35
    en el que la informacion de secuencia de ventanas (809) es tal que la segunda funcion ventana (1502) o la una o mas terceras funciones ventana (1503) tienen un tamano o duracion inferior al tamano o duracion de la primera funcion ventana (1500).
    40 25. Aparato de una de las reivindicaciones 17 a 23,
    en el que el posprocesador esta configurado para utilizar, como funcion ventana auxiliar, una funcion ventana de inicio (1100) que es tal que un numero de valores espectrales obtenidos mediante la transformacion del segundo bloque de muestras segmentadas en ventanas para obtener la segunda trama, es igual a un numero de valores 45 espectrales de la primera trama.
  22. 26. Aparato de una de las reivindicaciones 17 a 24,
    en el que el convertidor de tiempo esta configurado para realizar una suma de superposicion de la primera parte del 50 segundo bloque de muestras y una segunda parte del segundo bloque de muestras utilizando una segunda parte de la segunda funcion ventana, en el que una primera parte de la segunda funcion ventana no se utiliza.
  23. 27. Aparato de una de las reivindicaciones 17 a 26,
    55 en el que el convertidor de tiempo esta configurado para realizar una suma de superposicion de la primera parte del segundo bloque de muestras utilizando la una o mas terceras funciones ventana excepto una segunda parte de la tercera funcion ventana o una segunda parte de una tercera funcion ventana ultima en el tiempo o en el espacio.
  24. 28. Aparato de una de las reivindicaciones 17 a 27,
    en el que el posprocesador esta configurado para utilizar adicionalmente otra operacion de plegamiento de una parte del segundo bloque que se superpone con una cuarta funcion ventana que sigue a una o mas terceras funciones ventana en el tiempo o en el espacio.
    5
  25. 29. Aparato de una de las reivindicaciones 17 a 28,
    en el que el convertidor de tiempo esta configurado para aplicar la transformada utilizando una operacion DCT inversa o una operacion DST inversa y una operacion posterior de despliegue.
    10
  26. 30. Aparato de una de las reivindicaciones 17 a 29,
    en el que el convertidor de tiempo esta configurado para aplicar la transformada de manera que un transitorio de la senal de audio o imagen descodificada este situado en el tiempo o en el espacio posterior a la zona de 15 superposicion multiple o este situado en una parte de tiempo o espacio no cubierta por la segunda funcion ventana.
  27. 31. Aparato de una de las reivindicaciones 17 a 30,
    en el que la primera parte de la segunda trama comprende n/2 valores espectrales y en el que la segunda parte de la 20 segunda trama comprende cuatro bloques que tienen n/8 valores espectrales, o un solo bloque que tiene n/2 valores espectrales, o dos bloques para valores espectrales.
  28. 32. Procedimiento para generar una senal codificada de audio o imagen en presencia de transitorios, que comprende:
    25
    generar (808) una informacion de secuencia de ventanas (809) para segmentar en ventanas una senal de audio o imagen, la informacion de secuencia de ventanas que indica una primera funcion ventana (1500) para generar una primera trama de valores espectrales, una segunda funcion ventana (1502) y al menos una tercera funcion ventana (1503) para generar una segunda trama de valores espectrales que tienen una primera y una segunda partes, en el 30 que la primera funcion ventana (1500), la segunda funcion ventana (1502) y la una o mas terceras funciones ventana se superponen dentro de una zona de superposicion multiple (1300);
    segmentar en ventanas (902) un segundo bloque de muestras correspondiente a la segunda funcion ventana y la una o mas terceras funciones ventana que utilizan una funcion ventana auxiliar (1100) para obtener un segundo bloque de muestras segmentada en ventanas, preprocesar (904) el segundo bloque de muestras segmentadas en 35 ventanas utilizando una operacion de plegamiento de una parte del segundo bloque que se superpone con un primer bloque en la zona de superposicion multiple (1300) y obtener un segundo bloque preprocesado de muestras segmentadas en ventanas que tienen una parte de superposicion multiple modificada;
    aplicar (804) una transformada de introduccion de aliasing (906) al primer bloque de muestras utilizando la primera funcion ventana (1500) para obtener la primera trama de valores espectrales, aplicar otra transformada de 40 introduccion de aliasing a una primera parte del segundo bloque preprocesado de muestras segmentadas en ventanas utilizando la segunda funcion ventana (1502) para obtener una primera parte de valores espectrales de la segunda trama, y aplicar otra o mas transformadas de introduccion de aliasing a una segunda parte del segundo bloque preprocesado de muestras segmentadas en ventanas utilizando uno o mas terceras funciones ventana (1503) para obtener una segunda parte de valores espectrales de la segunda trama; y procesar (806) la primera 45 trama y la segunda trama para obtener tramas codificadas de la senal de audio o imagen.
  29. 33. Procedimiento para descodificar una senal codificada de audio o imagen en presencia de transitorios, que comprende una primera trama codificada y una segunda trama codificada, que comprende:
    50 procesar (824) la primera trama codificada y la segunda trama codificada para obtener una primera trama de valores espectrales y una segunda trama de valores espectrales, la primera y segunda tramas comprendiendo una parte de aliasing;
    aplicar (826) una transformada a la primera trama de valores espectrales utilizando una primera funcion ventana (1500) para obtener un primer bloque de muestras, aplicar otra transformada a una primera parte de la segunda 55 trama de valores espectrales utilizando una segunda funcion ventana (1502), y aplicar otra o mas transformadas a una segunda parte de la segunda trama de valores espectrales utilizando una o mas terceras funciones ventana (1503) para obtener un segundo bloque de muestras,
    en el que la primera funcion ventana (1500), la segunda funcion ventana (1502) y la tercera funcion ventana forman una zona de superposicion multiple (1630); y
    posprocesar (828) el segundo bloque de muestras utilizando una operacion de despliegue para obtener un segundo bloque de muestras posprocesadas que tiene una parte del segundo bloque de muestras que se superpone con el primer bloque de muestras en la zona de superposicion multiple, segmentar en ventanas el segundo bloque de muestras que se ha posprocesado utilizando una funcion ventana auxiliar (1100) y sumar la superposicion del 5 segundo bloque de muestras posprocesado segmentado en ventanas y el primer bloque de muestras para obtener una senal de audio o imagen descodificada (1180).
  30. 34. Programa informatico para realizar, cuando se ejecuta en un ordenador o un procesador, el
    procedimiento de la reivindicacion 32 o el procedimiento de la reivindicacion 33.
    10
ES14706528.8T 2013-02-20 2014-02-20 Aparato y procedimiento para generar una señal de audio o imagen codificada o para descodificar una señal de audio o imagen codificada en presencia de transitorios utilizando una parte de superposición múltiple Active ES2634621T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361767115P 2013-02-20 2013-02-20
US201361767115P 2013-02-20
PCT/EP2014/053287 WO2014128194A1 (en) 2013-02-20 2014-02-20 Apparatus and method for generating an encoded signal or for decoding an encoded audio signal using a multi overlap portion

Publications (1)

Publication Number Publication Date
ES2634621T3 true ES2634621T3 (es) 2017-09-28

Family

ID=50179586

Family Applications (2)

Application Number Title Priority Date Filing Date
ES14706529T Active ES2736309T3 (es) 2013-02-20 2014-02-20 Aparato y procedimiento para codificar o descodificar una señal de audio utilizando una superposición que depende de una ubicación de transitorios
ES14706528.8T Active ES2634621T3 (es) 2013-02-20 2014-02-20 Aparato y procedimiento para generar una señal de audio o imagen codificada o para descodificar una señal de audio o imagen codificada en presencia de transitorios utilizando una parte de superposición múltiple

Family Applications Before (1)

Application Number Title Priority Date Filing Date
ES14706529T Active ES2736309T3 (es) 2013-02-20 2014-02-20 Aparato y procedimiento para codificar o descodificar una señal de audio utilizando una superposición que depende de una ubicación de transitorios

Country Status (20)

Country Link
US (7) US10354662B2 (es)
EP (4) EP2959481B1 (es)
JP (2) JP6175148B2 (es)
KR (2) KR101764726B1 (es)
CN (5) CN110232929B (es)
AR (2) AR094845A1 (es)
AU (2) AU2014220722B2 (es)
BR (2) BR112015019543B1 (es)
CA (2) CA2900437C (es)
ES (2) ES2736309T3 (es)
HK (2) HK1218988A1 (es)
MX (2) MX348505B (es)
MY (2) MY185210A (es)
PL (2) PL2959481T3 (es)
PT (2) PT2959481T (es)
RU (2) RU2625560C2 (es)
SG (2) SG11201506542QA (es)
TR (1) TR201910956T4 (es)
TW (2) TWI550599B (es)
WO (2) WO2014128197A1 (es)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2830058A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Frequency-domain audio coding supporting transform length switching
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
EP2980795A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
EP2980791A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Processor, method and computer program for processing an audio signal using truncated analysis or synthesis window overlap portions
FR3024581A1 (fr) 2014-07-29 2016-02-05 Orange Determination d'un budget de codage d'une trame de transition lpd/fd
EP3107096A1 (en) 2015-06-16 2016-12-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Downscaled decoding
WO2017050398A1 (en) * 2015-09-25 2017-03-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for signal-adaptive switching of the overlap ratio in audio transform coding
EP3182411A1 (en) 2015-12-14 2017-06-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an encoded audio signal
ES2768052T3 (es) * 2016-01-22 2020-06-19 Fraunhofer Ges Forschung Aparatos y procedimientos para codificar o decodificar una señal de audio multicanal usando sincronización de control de trama
JP6976277B2 (ja) * 2016-06-22 2021-12-08 ドルビー・インターナショナル・アーベー 第一の周波数領域から第二の周波数領域にデジタル・オーディオ信号を変換するためのオーディオ・デコーダおよび方法
US10210874B2 (en) * 2017-02-03 2019-02-19 Qualcomm Incorporated Multi channel coding
EP3382701A1 (en) 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using prediction based shaping
EP3382700A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using a transient location detection
EP3616196A4 (en) * 2017-04-28 2021-01-20 DTS, Inc. AUDIO ENCODER WINDOW AND TRANSFORMATION IMPLEMENTATIONS
US11450339B2 (en) 2017-10-06 2022-09-20 Sony Europe B.V. Audio file envelope based on RMS power in sequences of sub-windows
EP3483879A1 (en) * 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
TWI681384B (zh) * 2018-08-01 2020-01-01 瑞昱半導體股份有限公司 音訊處理方法與音訊等化器
WO2020094263A1 (en) * 2018-11-05 2020-05-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and audio signal processor, for providing a processed audio signal representation, audio decoder, audio encoder, methods and computer programs
CN113747157A (zh) * 2019-03-09 2021-12-03 杭州海康威视数字技术股份有限公司 进行编码和解码的方法、解码端、编码端和***
WO2021027773A1 (en) * 2019-08-10 2021-02-18 Beijing Bytedance Network Technology Co., Ltd. Subpicture size definition in video processing
EP4032290A4 (en) 2019-10-18 2022-11-30 Beijing Bytedance Network Technology Co., Ltd. SYNTAX CONSTRAINTS IN REPORTING SUBPICTURE PARAMETER SETS
CN112803959B (zh) * 2019-11-13 2022-05-10 瑞昱半导体股份有限公司 收发电路与应用于收发电路的信号处理方法
US11942078B2 (en) 2021-02-26 2024-03-26 International Business Machines Corporation Chunking and overlap decoding strategy for streaming RNN transducers for speech recognition

Family Cites Families (73)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4920426A (en) * 1986-11-10 1990-04-24 Kokusai Denshin Denwa Co., Ltd. Image coding system coding digital image signals by forming a histogram of a coefficient signal sequence to estimate an amount of information
DE3902948A1 (de) 1989-02-01 1990-08-09 Telefunken Fernseh & Rundfunk Verfahren zur uebertragung eines signals
WO1991005412A1 (de) * 1989-10-06 1991-04-18 Telefunken Fernseh Und Rundfunk Gmbh Verfahren zur übertragung eines signals
US5502789A (en) 1990-03-07 1996-03-26 Sony Corporation Apparatus for encoding digital data with reduction of perceptible noise
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
JP3186307B2 (ja) 1993-03-09 2001-07-11 ソニー株式会社 圧縮データ記録装置及び方法
US5701389A (en) * 1995-01-31 1997-12-23 Lucent Technologies, Inc. Window switching based on interblock and intrablock frequency band energy
KR0154387B1 (ko) 1995-04-01 1998-11-16 김주용 음성다중 시스템을 적용한 디지탈 오디오 부호화기
JP3552811B2 (ja) * 1995-09-29 2004-08-11 三菱電機株式会社 ディジタル映像信号符号化装置および復号化装置
US5848391A (en) * 1996-07-11 1998-12-08 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Method subband of coding and decoding audio signals using variable length windows
US6131084A (en) 1997-03-14 2000-10-10 Digital Voice Systems, Inc. Dual subframe quantization of spectral magnitudes
DE19736669C1 (de) * 1997-08-22 1998-10-22 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erfassen eines Anschlags in einem zeitdiskreten Audiosignal sowie Vorrichtung und Verfahren zum Codieren eines Audiosignals
JP2000000247A (ja) 1998-06-15 2000-01-07 Yoshihiro Adachi ウルトラ ラグ スクリュー
US6173255B1 (en) 1998-08-18 2001-01-09 Lockheed Martin Corporation Synchronized overlap add voice processing using windows and one bit correlators
DE10000934C1 (de) * 2000-01-12 2001-09-27 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Bestimmen eines Codierungs-Blockrasters eines decodierten Signals
JP2002118517A (ja) * 2000-07-31 2002-04-19 Sony Corp 直交変換装置及び方法、逆直交変換装置及び方法、変換符号化装置及び方法、並びに復号装置及び方法
JP4596197B2 (ja) 2000-08-02 2010-12-08 ソニー株式会社 ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体
AU2001284910B2 (en) * 2000-08-16 2007-03-22 Dolby Laboratories Licensing Corporation Modulating one or more parameters of an audio or video perceptual coding system in response to supplemental information
FR2822980B1 (fr) * 2001-03-29 2003-07-04 Ela Medical Sa Procede de traitement de donnees d'electogrammes d'un dispositif medical implantable actif pour l'aide au diagnostic par un praticien
MXPA03010237A (es) * 2001-05-10 2004-03-16 Dolby Lab Licensing Corp Mejoramiento del funcionamiento de transitorios en sistemas de codificacion de audio de baja tasa de transferencia de bitios mediante la reduccion del pre-ruido.
US7460993B2 (en) 2001-12-14 2008-12-02 Microsoft Corporation Adaptive window-size selection in transform coding
EP1394772A1 (en) 2002-08-28 2004-03-03 Deutsche Thomson-Brandt Gmbh Signaling of window switchings in a MPEG layer 3 audio data stream
AU2003208517A1 (en) 2003-03-11 2004-09-30 Nokia Corporation Switching between coding schemes
US7325023B2 (en) 2003-09-29 2008-01-29 Sony Corporation Method of making a window type decision based on MDCT data in audio encoding
DE10345996A1 (de) 2003-10-02 2005-04-28 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Verarbeiten von wenigstens zwei Eingangswerten
WO2005073959A1 (en) * 2004-01-28 2005-08-11 Koninklijke Philips Electronics N.V. Audio signal decoding using complex-valued data
CN1934619B (zh) * 2004-03-17 2010-05-26 皇家飞利浦电子股份有限公司 音频编码
US8744862B2 (en) * 2006-08-18 2014-06-03 Digital Rise Technology Co., Ltd. Window selection based on transient detection and location to provide variable time resolution in processing frame-based data
US7630902B2 (en) * 2004-09-17 2009-12-08 Digital Rise Technology Co., Ltd. Apparatus and methods for digital audio coding using codebook application ranges
US7937271B2 (en) 2004-09-17 2011-05-03 Digital Rise Technology Co., Ltd. Audio decoding using variable-length codebook application ranges
CN101061533B (zh) * 2004-10-26 2011-05-18 松下电器产业株式会社 语音编码装置和语音编码方法
KR100668319B1 (ko) * 2004-12-07 2007-01-12 삼성전자주식회사 오디오 신호의 변환방법 및 장치와 오디오 신호에적응적인 부호화방법 및 장치, 오디오 신호의 역변환 방법및 장치와 오디오 신호에 적응적인 복호화 방법 및 장치
US7386445B2 (en) 2005-01-18 2008-06-10 Nokia Corporation Compensation of transient effects in transform coding
WO2006091139A1 (en) * 2005-02-23 2006-08-31 Telefonaktiebolaget Lm Ericsson (Publ) Adaptive bit allocation for multi-channel audio encoding
RU2409874C9 (ru) * 2005-11-04 2011-05-20 Нокиа Корпорейшн Сжатие звуковых сигналов
JP2007304258A (ja) * 2006-05-10 2007-11-22 Matsushita Electric Ind Co Ltd オーディオ信号符号化およびその復号化装置、方法ならびにプログラム
US7987089B2 (en) 2006-07-31 2011-07-26 Qualcomm Incorporated Systems and methods for modifying a zero pad region of a windowed frame of an audio signal
DE102006051673A1 (de) 2006-11-02 2008-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale
GB2443832B (en) 2006-11-14 2010-08-18 Schlumberger Holdings Method and system of deploying one or more optical fiber waveguides in conjunction with a pipeline
JP2008129250A (ja) * 2006-11-20 2008-06-05 National Chiao Tung Univ Aacのためのウィンドウ切り替え方法およびm/s符号化の帯域決定方法
KR20080053739A (ko) 2006-12-11 2008-06-16 삼성전자주식회사 적응적으로 윈도우 크기를 적용하는 부호화 장치 및 방법
RU2444071C2 (ru) * 2006-12-12 2012-02-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Кодер, декодер и методы кодирования и декодирования сегментов данных, представляющих собой поток данных временной области
FR2911228A1 (fr) 2007-01-05 2008-07-11 France Telecom Codage par transformee, utilisant des fenetres de ponderation et a faible retard.
FR2911227A1 (fr) * 2007-01-05 2008-07-11 France Telecom Codage par transformee, utilisant des fenetres de ponderation et a faible retard
RU2459283C2 (ru) * 2007-03-02 2012-08-20 Панасоник Корпорэйшн Кодирующее устройство, декодирующее устройство и способ
EP2015293A1 (en) * 2007-06-14 2009-01-14 Deutsche Thomson OHG Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain
US9495971B2 (en) * 2007-08-27 2016-11-15 Telefonaktiebolaget Lm Ericsson (Publ) Transient detector and method for supporting encoding of an audio signal
JP5327982B2 (ja) * 2008-03-25 2013-10-30 旭化成ケミカルズ株式会社 エラストマー組成物及びエアバッグ装置の収納カバー
US8447591B2 (en) 2008-05-30 2013-05-21 Microsoft Corporation Factorization of overlapping tranforms into two block transforms
CA2730196C (en) * 2008-07-11 2014-10-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and discriminator for classifying different segments of a signal
RU2515704C2 (ru) 2008-07-11 2014-05-20 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Аудиокодер и аудиодекодер для кодирования и декодирования отсчетов аудиосигнала
AU2013200680B2 (en) 2008-07-11 2015-01-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder and decoder for encoding and decoding audio samples
MX2011000375A (es) * 2008-07-11 2011-05-19 Fraunhofer Ges Forschung Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada.
EP2144171B1 (en) * 2008-07-11 2018-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder for encoding and decoding frames of a sampled audio signal
CA2730355C (en) 2008-07-11 2016-03-22 Guillaume Fuchs Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme
EP2144230A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
CA2699316C (en) * 2008-07-11 2014-03-18 Max Neuendorf Apparatus and method for calculating bandwidth extension data using a spectral tilt controlled framing
BRPI0910784B1 (pt) * 2008-07-11 2022-02-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. Codificador e decodificador de áudio para estruturas de codificação de sinais de áudio amostrados
US8380498B2 (en) 2008-09-06 2013-02-19 GH Innovation, Inc. Temporal envelope coding of energy attack signal by using attack point location
KR101315617B1 (ko) 2008-11-26 2013-10-08 광운대학교 산학협력단 모드 스위칭에 기초하여 윈도우 시퀀스를 처리하는 통합 음성/오디오 부/복호화기
US9384748B2 (en) * 2008-11-26 2016-07-05 Electronics And Telecommunications Research Institute Unified Speech/Audio Codec (USAC) processing windows sequence based mode switching
US8457975B2 (en) 2009-01-28 2013-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program
BRPI1005300B1 (pt) * 2009-01-28 2021-06-29 Fraunhofer - Gesellschaft Zur Forderung Der Angewandten Ten Forschung E.V. Codificador de áudio, decodificador de áudio, informações de áudio codificado e métodos para codificar e decodificar um sinal de áudio com base em uma informação de áudio codificado e em uma informação de áudio de entrada.
EP2234103B1 (en) * 2009-03-26 2011-09-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Device and method for manipulating an audio signal
US8725503B2 (en) * 2009-06-23 2014-05-13 Voiceage Corporation Forward time-domain aliasing cancellation with application in weighted or original signal domain
US8892427B2 (en) * 2009-07-27 2014-11-18 Industry-Academic Cooperation Foundation, Yonsei University Method and an apparatus for processing an audio signal
WO2011042464A1 (en) 2009-10-08 2011-04-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-mode audio signal decoder, multi-mode audio signal encoder, methods and computer program using a linear-prediction-coding based noise shaping
KR101137652B1 (ko) 2009-10-14 2012-04-23 광운대학교 산학협력단 천이 구간에 기초하여 윈도우의 오버랩 영역을 조절하는 통합 음성/오디오 부호화/복호화 장치 및 방법
CN102770912B (zh) * 2010-01-13 2015-06-10 沃伊斯亚吉公司 使用线性预测滤波的前向时域混叠消除
CN102222505B (zh) * 2010-04-13 2012-12-19 中兴通讯股份有限公司 可分层音频编解码方法***及瞬态信号可分层编解码方法
PL3451333T3 (pl) * 2010-07-08 2023-01-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Koder wykorzystujący kasowanie aliasingu w przód
EP2860729A4 (en) 2012-06-04 2016-03-02 Samsung Electronics Co Ltd METHOD AND DEVICE FOR AUDIO CODING, METHOD AND DEVICE FOR AUDIO DECODING, AND MULTIMEDIA DEVICE EMPLOYING THEM
KR20140075466A (ko) 2012-12-11 2014-06-19 삼성전자주식회사 오디오 신호의 인코딩 및 디코딩 방법, 및 오디오 신호의 인코딩 및 디코딩 장치

Also Published As

Publication number Publication date
US11682408B2 (en) 2023-06-20
EP2959481B1 (en) 2017-04-26
MX348506B (es) 2017-06-14
US10354662B2 (en) 2019-07-16
CN105074819B (zh) 2019-06-04
EP3525207A1 (en) 2019-08-14
KR101764725B1 (ko) 2017-08-03
BR112015019270A8 (pt) 2019-11-12
TW201443878A (zh) 2014-11-16
AU2014220722A1 (en) 2015-10-08
US20170323650A1 (en) 2017-11-09
EP2959482A1 (en) 2015-12-30
CN105378835B (zh) 2019-10-01
US20200294517A1 (en) 2020-09-17
EP2959481A1 (en) 2015-12-30
AU2014220725A1 (en) 2015-10-08
KR20150126864A (ko) 2015-11-13
WO2014128194A1 (en) 2014-08-28
SG11201506543WA (en) 2015-09-29
ES2736309T3 (es) 2019-12-27
PT2959482T (pt) 2019-08-02
JP2016513283A (ja) 2016-05-12
BR112015019543B1 (pt) 2022-01-11
BR112015019270B1 (pt) 2021-02-17
US9947329B2 (en) 2018-04-17
EP4375996A2 (en) 2024-05-29
PL2959481T3 (pl) 2017-10-31
JP6175148B2 (ja) 2017-08-02
CA2900437C (en) 2020-07-21
TW201447868A (zh) 2014-12-16
AU2014220722B2 (en) 2016-09-15
CN110047498A (zh) 2019-07-23
US20190371346A1 (en) 2019-12-05
CN110232929B (zh) 2023-06-13
BR112015019270A2 (pt) 2017-07-18
JP6196324B2 (ja) 2017-09-13
CN105074819A (zh) 2015-11-18
MX2015010596A (es) 2015-12-16
CN110232929A (zh) 2019-09-13
EP2959482B1 (en) 2019-05-01
HK1219343A1 (zh) 2017-03-31
US10832694B2 (en) 2020-11-10
TWI550599B (zh) 2016-09-21
BR112015019543A2 (pt) 2017-07-18
US10685662B2 (en) 2020-06-16
US20160050420A1 (en) 2016-02-18
JP2016507788A (ja) 2016-03-10
CN110097889B (zh) 2023-09-01
US20210065725A1 (en) 2021-03-04
HK1218988A1 (zh) 2017-03-17
US20230282221A1 (en) 2023-09-07
MY173774A (en) 2020-02-20
KR20150120477A (ko) 2015-10-27
PL2959482T3 (pl) 2019-10-31
CA2900437A1 (en) 2014-08-28
KR101764726B1 (ko) 2017-08-14
CA2901186C (en) 2018-02-20
MX348505B (es) 2017-06-14
US11621008B2 (en) 2023-04-04
WO2014128197A1 (en) 2014-08-28
US20160078875A1 (en) 2016-03-17
TR201910956T4 (tr) 2019-08-21
SG11201506542QA (en) 2015-09-29
AR096576A1 (es) 2016-01-20
MY185210A (en) 2021-04-30
RU2015139596A (ru) 2017-03-27
RU2626666C2 (ru) 2017-07-31
PT2959481T (pt) 2017-07-13
TWI550600B (zh) 2016-09-21
RU2015139597A (ru) 2017-03-27
CN110097889A (zh) 2019-08-06
MX2015010595A (es) 2015-12-16
CN110047498B (zh) 2023-10-31
RU2625560C2 (ru) 2017-07-14
CN105378835A (zh) 2016-03-02
AU2014220725B2 (en) 2016-11-17
AR094845A1 (es) 2015-09-02
CA2901186A1 (en) 2014-08-28

Similar Documents

Publication Publication Date Title
ES2634621T3 (es) Aparato y procedimiento para generar una señal de audio o imagen codificada o para descodificar una señal de audio o imagen codificada en presencia de transitorios utilizando una parte de superposición múltiple