ES2383217T3 - Codificador, descodificador y métodos para codificar y descodificar segmentos de datos que representan una corriente de datos de dominio de tiempo - Google Patents

Codificador, descodificador y métodos para codificar y descodificar segmentos de datos que representan una corriente de datos de dominio de tiempo Download PDF

Info

Publication number
ES2383217T3
ES2383217T3 ES07856467T ES07856467T ES2383217T3 ES 2383217 T3 ES2383217 T3 ES 2383217T3 ES 07856467 T ES07856467 T ES 07856467T ES 07856467 T ES07856467 T ES 07856467T ES 2383217 T3 ES2383217 T3 ES 2383217T3
Authority
ES
Spain
Prior art keywords
time domain
data
frequency domain
encoded
blocks
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES07856467T
Other languages
English (en)
Inventor
Ralf Geiger
Max Neuendorf
Yoshikazu Yokotani
Nikolaus Rettelbach
Juergen Herre
Stefan Geyersberger
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2383217T3 publication Critical patent/ES2383217T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/31Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7847Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content
    • G06F16/7864Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content using domain-transform features, e.g. DCT or wavelet transform coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/2368Multiplexing of audio and video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/238Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
    • H04N21/2383Channel coding or modulation of digital bit-stream, e.g. QPSK modulation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/266Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
    • H04N21/2662Controlling the complexity of the video stream, e.g. by scaling the resolution or bitrate of the video stream based on the client capabilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • H04N21/4341Demultiplexing of audio and video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/438Interfacing the downstream path of the transmission network originating from a server, e.g. retrieving encoded video stream packets from an IP network
    • H04N21/4382Demodulation or channel decoding, e.g. QPSK demodulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Databases & Information Systems (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

Aparato para descodificar segmentos de datos que representan una corriente de datos de dominio detiempo, codificándose uno o más segmentos de datos en el dominio de tiempo, codificándose uno o mássegmentos de datos en el dominio de frecuencia teniendo bloques de datos sucesivos que representan bloquessucesivos y superpuestos de las muestras de datos de dominio de tiempo, comprendiendo el aparato:un descodificador de dominio de tiempo para descodificar un segmento de datos que se codifica en eldominio de tiempo;un procesador para procesar los segmentos de datos que se codifican en el dominio de frecuencia y losdatos de salida del descodificador de dominio de tiempo para obtener bloques de datos de dominio detiempo de tal manera que bloques de datos de dominio de tiempo obtenidos basándose en segmentos dedatos posteriores que se codifican en el dominio de frecuencia se superponen; yde tal manera que bloques de datos de dominio de tiempo consecutivos de los que uno se codifica en eldominio de frecuencia y de los que uno se codifica en el dominio de tiempo se superponen; yun combinador de superposición/suma para combinar los bloques de datos de dominio de tiemposuperpuestos para obtener los segmentos de datos descodificados de la corriente de datos de dominio detiempo;en el que el combinador de superposición/suma está adaptado para aplicar pesos según funcionesventana de síntesis a bloques de datos de dominio de tiempo superpuestos,en el que la función ventana de síntesis está adaptada a un tamaño de una región de superposición debloques de datos de dominio de tiempo superpuestos consecutivos,en el que una ventana con un tamaño de superposición reducido se aplica a un bloque de datos dedominio de tiempo codificado en el dominio de frecuencia cuando se cambia del dominio de frecuencia aldominio de tiempo;en el que un tamaño de una región de superposición de dos bloques de datos de dominio de tiempoconsecutivos que se codifican en el dominio de frecuencia es mayor que un tamaño de una región desuperposición de dos bloques de datos de dominio de tiempo consecutivos de los cuales uno se codificaen el dominio de frecuencia y uno se codifica en el dominio de tiempo.

Description

Codificador, descodificador y métodos para codificar y descodificar segmentos de datos que representan una corriente de datos de dominio de tiempo
La presente invención se refiere al campo de la codificación, en la que se utilizan diferentes características de datos que van a codificarse para tasas de codificación, como por ejemplo, en codificación de vídeo y audio.
Las estrategias de codificación del estado de la técnica pueden hacer uso de características de una corriente de datos que va a codificarse. Por ejemplo, en codificación de audio, se utilizan modelos perceptivos a fin de comprimir los datos de origen casi sin disminuir la calidad y la degradación perceptibles cuando vuelven a reproducirse. Los esquemas de codificación de audio perceptivos modernos, tales como, por ejemplo, MPEG-2/4 AAC (MPEG = Moving Pictures Expert Group (Grupo experto en imágenes en movimiento), AAC = Advanced Audio Coding (Codificación de audio avanzada), cf. Generic Coding of Moving Pictures and Associated Audio: Advanced Audio Coding, Norma Internacional 13818-7, ISO/IEC JTC1/SC29/WG11 Moving Pictures Expert Group, 1997, pueden utilizar bancos de filtros tales como, por ejemplo, la transformada de coseno discreta modificada) (MDCT), para representar la señal de audio en el dominio de frecuencia.
En el dominio de frecuencia la cuantificación de los coeficientes de frecuencia puede llevarse a cabo según un modelo perceptivo. Tales codificadores pueden proporcionar una excelente calidad de audio perceptivo para tipos generales de señales de audio como, por ejemplo, música. Por otra parte, los codificadores de voz modernos tales como por ejemplo, ACELP (ACELP = Algebraic Code Excited Linear Prediction (Predicción lineal excitada por código algebraico)), utilizan un enfoque predictivo y, de esta manera, pueden representar la señal de audio/voz en el dominio de tiempo. Tales codificadores de voz pueden modelar las características del proceso de producción de voz humana, es decir, del tracto vocal humano y, por consiguiente, logran un excelente rendimiento para señales de voz a bajas tasas de bits. Por el contrario, los codificadores de audio perceptivo no logran el nivel de rendimiento ofrecido por los codificadores de voz para señales de voz codificadas a bajas tasas de bits y el uso de codificadores de voz para representar señales de audio/música en general da como resultado significativos deterioros de calidad. Los conceptos convencionales proporcionan una combinación estratificada en la cual siempre se encuentran activos todos los codificadores parciales, es decir, los codificadores de dominio de tiempo y de dominio de frecuencia, y la señal de salida final se calcula combinando las contribuciones de los codificadores parciales para una trama de tiempo procesada dada. Un ejemplo popular de codificación estratificada es la codificación de voz/audio escalable MPEG-4 con un codificador de voz como capa base y una capa de mejoramiento basada en banco de filtros, cf. Bernhard Grill, Karlheinz Brandenburg, “A Two-or Three-Stage Bit-Rate Scalable Audio Coding System”, Número de preimpresión 4132, 99ª Convención de AES (Septiembre 1995).
Los codificadores de dominio de frecuencia convencionales pueden hacer uso de bancos de filtros MDCT. La MDCT se ha convertido en un banco de filtros dominante para codificadores de audio perceptivo convencionales debido a sus ventajosas propiedades. Por ejemplo, puede proporcionar una atenuación transversal suave entre los bloques de procesamiento. Incluso si una señal en cada bloque de procesamiento se altera de manera diferente, por ejemplo, debido a la cuantificación de coeficientes espectrales, no se presentan artefactos de bloqueo debidos a transiciones bruscas de bloque a bloque debido a operaciones de superposición/suma a las que se ha aplicado la función ventana. La MDCT utiliza el concepto de anulación de solapamiento de dominio de tiempo (TDAC).
La MDCT es una transformada relativa a Fourier basándose en la transformada de coseno discreta tipo IV, con la propiedad adicional de estar solapada. Está diseñada para llevarse a cabo en bloques consecutivos de un conjunto de datos mayor, en donde los bloques posteriores se superponen de manera que la última mitad de un bloque coincide con la primera mitad del siguiente bloque. Esta superposición, además de una calidad de compactación de energía de la DCT, hace a la MDCT especialmente atractiva para aplicaciones de compresión de señal, dado que ayuda a evitar que dichos artefactos sean producto de los límites de bloque. Como transformada solapada, la MDCT no es muy habitual, comparada con otras transformadas relativas a Fourier, porque tiene la mitad de salidas que de entradas, en lugar del mismo número. En particular, 2N números reales se transforman en N números reales, donde N es un entero positivo.
La MDCT inversa también se conoce como IMDCT. Debido a que existen diferentes números de entradas y salidas, a primera vista puede parecer que la MDCT no debería poder invertirse. Sin embargo, se logra una capacidad de inversión perfecta agregando las IMDCT superpuestas de bloques superpuestos posteriores, provocando la anulación de los errores y la recuperación de los datos originales, es decir, logrando la TDAC.
Con esto, el número de valores espectrales en la salida de un banco de filtros es igual al número de valores de entrada de dominio de tiempo en su entrada, lo que también se denomina muestreo crítico.
Un banco de filtros de MDCT proporciona una selectividad de alta frecuencia y permite una alta ganancia de codificación. Las propiedades de la superposición de bloques y el muestreo crítico pueden lograrse utilizando la técnica de anulación de solapamiento de dominio de tiempo, cf. J. Princen, A. Bradley, “Analysis/Synthesis Filter Bank Design Based on Time Domain Aliasing Cancellation”, IEEE Trans. ASSP. ASSP-34 (5): 1153-1161, 1986. La figura 4 ilustra estos efectos de una MDCT. La figura 4 muestra una señal de entrada MDCT en términos de un impulso a lo largo de un eje 400 de tiempo en la parte superior. La señal 400 de entrada se transforma entonces mediante dos bloques de función ventana y MDCT consecutivos, en donde las ventanas 410 se ilustran debajo de la señal 400 de entrada en la figura 4. Las señales a las que se ha aplicado la función ventana individuales transformadas de vuelta se despliegan en la figura 4 mediante las líneas 420 y 425 de tiempo.
Después de la MDCT inversa, el primer bloque produce una componente 420 de solapamiento con signo positivo, el segundo bloque produce una componente 425 de solapamiento con la misma magnitud y un signo negativo. Las componentes de solapamiento se anulan entre sí después de la suma de las dos señales 420 y 425 de salida como se muestra en la salida 430 final en la parte inferior de la figura 4. En “Extended Adaptive Multi-Rate – Wideband (AMR-WB+) códec”, 3GPP TS 26.290V6.3.0, 2005-06, Especificación Técnica, se especifica el códec AMR-WB+ (AMR-WB = Ancho de banda de tasa múltiple adaptativo). Según la sección 5.2, el algoritmo de codificación en el núcleo del códec AMR-WB+ se basa en un modelo híbrido ACELP/TCX (TCX = Transform coded Excitation (Excitación codificada por transformada). Para cada bloque de una señal de entrada, el codificador decide, o bien en modo de bucle abierto o de bucle cerrado, qué modelo de codificación, es decir, ACELP o TXC, es mejor. El modelo ACELP es un codificador predictivo de dominio de tiempo más adecuado para señales de voz y transitorias. El codificador AMR-WB se utiliza en modos ACELP. Alternativamente, el modelo TCX es un codificador basado en transformada y es más apropiado para muestras de música típicas.
Específicamente, el AMR-WB+ utiliza una transformada de Fourier discreta (DFT) para el modo de codificación por transformada TCX. A fin de permitir una transición suave entre bloques adyacentes, se utiliza función ventana y superposición. Estas función ventana y superposición son necesarias tanto para transiciones entre diferentes modos de codificación (TCX/ACELP) como para tramas de TCX consecutivas. Por tanto, la DFT conjuntamente con la función ventana y la superposición, representan un banco de filtros que no está muestreado críticamente. El banco de filtros produce más valores de frecuencia que el número de nuevas muestras de entrada, cf. figura 4 en 3GPP TS 26.290V6.3.0 (3GPP = Third Generation Partnership Project (Proyecto de sociedad de tercera generación), TS = Technical Specification (Especificación técnica)). Cada trama de TCX utiliza una superposición de 1/8 de la longitud de trama que es igual al número de nuevas muestras de entrada. Por consiguiente, la longitud correspondiente de la DFT es 9/8 de la longitud de trama.
Considerando el banco de filtros de DFT no muestreado críticamente en TXC, es decir, el número de valores espectrales en la salida del banco de filtros es mayor que el número de valores de entrada de dominio de tiempo en su entrada, este modo de codificación de dominio de frecuencia es diferente de los códecs de audio tales como AAC (AAC = Advanced Audio Coding (Codificación de audio avanzada)), que utiliza una MDCT, una transformada solapada críticamente muestreada.
El códec Dolby E se describe en Fielder, Louis D.; Todd, Craig C., “The Design of a Video Friendly Audio Coding System for Distributing Applications”, Número de documento 17-008, The AES 17th International Conference: High-Quality Audio Coding, y Fielder, Louis D.; Davidson, Grant A., “Audio Coding Tools for Digital Television Distribution”, Número de preimpresión 5104, 108ª Convención del AES (Enero 2000). El códec Dolby E utiliza el banco de filtros de MDCT. En el diseño de esta codificación, se puso especial atención en la posibilidad de llevar a cabo edición en el dominio de codificación. Para lograr esto, se utilizan ventanas especiales sin solapamiento. En los límites de estas ventanas es posible una atenuación transversal uniforme o empalme de diferentes partes de señal. En los documentos antes referidos, se señala, por ejemplo, cf. Sección 3 de “The Design of a Video Friendly Audio Coding System for Distribution Applications”, que esto no sería posible simplemente utilizando las ventanas de MDCT habituales que introducen el solapamiento de dominio de tiempo. Sin embargo, también se describe que la eliminación del solapamiento se logra a costa de un mayor número de coeficientes de transformada, lo que indica que el banco de filtros resultante ya no tiene la propiedad de muestreo crítico.
El documento EP 1 396 844 A1 describe una compresión de audio con pérdidas y sin pérdidas unificada. El esquema de compresión de audio con pérdidas y sin pérdidas unificada combina compresión de audio con pérdidas y sin pérdidas dentro de una misma señal de audio. El enfoque emplea codificación sin pérdidas mezclada de una trama de transición entre tramas de codificación con pérdidas y sin pérdidas para producir transiciones sin interrupciones. La codificación sin pérdidas mezclada realiza una transformada solapada y una transformada solapada inversa para producir una trama de dominio de pseudotiempo plegada y a la que se ha aplicado la función ventana de manera apropiada, que entonces puede codificarse sin pérdidas. La codificación sin pérdidas mezclada también puede aplicarse a tramas que presentan un rendimiento de compresión con pérdidas malo.
Información de antecedentes técnicos adicional se facilita, por ejemplo, en el ártículo “Optimal Time Segmentation for Overlap-Add Systems with Variable Amount of Window Overlap” de O.A. Niamut y R. Heusdens (publicado en: IEEE Signal Processing Letters, Vol 12, n.o 10, octubre de 2005). Información de antecedentes técnicos adicional se facilita en los documentos US 2006/0247928 A1, US 6.226.608 B1, US 2005/0071402 A1 y US 5.987.407.
El objetivo de la presente invención es proporcionan un concepto más eficaz para codificar y descodificar segmentos de datos.
El objetivo se logra entre otros mediante un aparato de descodificación según la reivindicación 1, un método de descodificación según la reivindicación 25, un aparato para generar una corriente de datos codificados según la reivindicación 27 y un método para generar una corriente de datos codificados según la reivindicación 40.
La presente invención se basa en el hallazgo de que puede utilizarse un concepto de codificación y descodificación más eficaz utilizando codificadores, respectivamente descodificadores de dominio de tiempo y de dominio de frecuencia combinados. El problema del solapamiento de tiempo puede combatirse eficazmente transformando los datos de dominio de tiempo al dominio de frecuencia en el descodificador y combinando los datos de dominio de frecuencia transformados resultantes con los datos de dominio de frecuencia descodificados recibidos. Las sobrecargas pueden reducirse adaptando las regiones de superposición de ventanas superpuestas que se aplican a los segmentos de datos a cambios de dominio de codificación. El uso de ventanas con regiones de superposición más pequeñas puede ser beneficioso cuando se utiliza codificación de dominio de tiempo, respectivamente, cuando se cambia de o a codificación de dominio de tiempo.
Las realizaciones pueden proporcionar un concepto de codificación y descodificado de audio universal que logra un rendimiento mejorado para ambos tipos de señales de entrada tales como, las señales de voz y las señales de música. Las realizaciones pueden aprovecharse de la combinación de múltiples enfoques de codificación, por ejemplo, conceptos de codificación de dominio de tiempo y de dominio de frecuencia. Las realizaciones pueden combinar eficazmente conceptos de codificación basados en banco de filtros y basados en dominio de tiempo en un solo esquema. Las realizaciones pueden dar como resultado un códec combinado que puede ser capaz, por ejemplo, de cambiar entre un códec de audio para contenido de audio de tipo música y un códec de voz para contenido de tipo voz. Las realizaciones pueden utilizar este cambio frecuentemente, especialmente para contenido mezclado.
Las realizaciones de la presente invención pueden proporcionar la ventaja de que no se produce ningún artefacto de cambio. En las realizaciones, la cantidad de datos de transmisión adicionales o muestras codificadas adicionalmente, para un proceso de cambio puede minimizarse a fin de evitar una eficacia reducida durante esta fase de operación. Con esto, el concepto de combinación cambiada de codificadores parciales es diferente del de la combinación estratificada en la que siempre están activos todos los codificadores parciales. A continuación se describirán realizaciones de la presente invención en detalle utilizando las figuras adjuntas, en las cuales:
la figura 1a muestra una realización de un aparato de descodificación;
la figura 1b muestra otra realización de un aparato de descodificación;
la figura 1c muestra otra realización de un aparato de descodificación;
la figura 1d muestra otra realización de un aparato de descodificación;
la figura 1e muestra otra realización de un aparato de descodificación;
la figura 1f muestra otra realización de un aparato de descodificación;
la figura 2a muestra una realización de un aparato de codificación;
la figura 2b muestra otra realización de un aparato de codificación;
la figura 2c muestra otra realización de un aparato de codificación;
la figura 3a ilustra las regiones de superposición cuando se cambia entre codificación de dominio de frecuencia y de dominio de tiempo para la duración de una ventana;
la figura 3b ilustra las regiones de superposición cuando se cambia entre codificación de dominio de frecuencia y codificación de dominio de tiempo para una duración de dos ventanas;
la figura 3c ilustra múltiples ventanas con diferentes regiones de superposición;
la figura 3d ilustra la utilización de ventanas con diferentes regiones de superposición en una realización; y
la figura 4 ilustra la anulación de solapamiento de dominio de tiempo cuando se utiliza MDCT.
La figura 1a muestra un aparato 100 para descodificar segmentos de datos que representan una corriente de datos de dominio de tiempo, codificándose un segmento de datos en un dominio de tiempo o en un dominio de frecuencia, codificándose un segmento de datos en el dominio de frecuencia teniendo bloques de datos sucesivos que representan bloques sucesivos y superpuestos de muestras de datos de dominio de tiempo. Esta corriente de datos, por ejemplo, podría corresponder a una corriente de audio, en la que algunos de los bloques de datos se codifican en el dominio de tiempo y otros se codifican en el dominio de frecuencia. Los bloques o segmentos de datos que se han codificado en el dominio de frecuencia pueden representar muestras de datos de dominio de tiempo de bloques de datos superpuestos.
El aparato 100 comprende un descodificador 110 de dominio de tiempo para descodificar un segmento de datos que se codifica en el dominio de tiempo. Además, el aparato 100 comprende un procesador 120 para procesar el segmento de datos que se codifica en el dominio de frecuencia y datos de salida del descodificador 110 de dominio de tiempo para obtener bloques de datos de dominio de tiempo superpuestos. Además, el aparato 100 comprende un combinador 130 de superposición/suma para combinar los bloques de datos de dominio de tiempo superpuestos para obtener los segmentos de datos descodificados de la corriente de datos de dominio de tiempo.
La figura 1b muestra otra realización del aparato 100. En las realizaciones, el procesador 120 puede comprender un descodificador 122 de dominio de frecuencia para descodificar segmentos de datos que se codifican en el dominio de frecuencia para obtener segmentos de datos de dominio de frecuencia. Además, en realizaciones, el procesador 120 puede comprender un convertidor 124 de dominio de tiempo a dominio de frecuencia para convertir los datos de salida del descodificador 110 de dominio de tiempo para obtener segmentos de datos de dominio de frecuencia convertidos.
Además, en realizaciones, el procesador 120 puede comprender un combinador 126 de dominio de frecuencia para combinar los segmentos de dominio de frecuencia y los segmentos de datos de dominio de frecuencia convertidos para obtener una corriente de datos de dominio de frecuencia. El procesador 120 puede comprender además un convertidor 128 de dominio de frecuencia a dominio de tiempo para convertir la corriente de datos de dominio de frecuencia en bloques de datos de dominio de tiempo superpuestos que a continuación pueden combinarse mediante el combinador 130 de superposición/suma.
Las realizaciones pueden utilizar un banco de filtros de MDCT como, por ejemplo, el utilizado en MPEG-4 AAC, sin ninguna modificación, especialmente sin abandonar la propiedad de muestreo crítico. Las realizaciones pueden proporcionar una eficacia de codificación óptima. Las realizaciones pueden lograr una transición suave a un códec de dominio de tiempo compatible con las ventanas de MDCT establecidas al tiempo que no introducen ningún artefacto de cambia y solamente una mínima sobrecarga.
Las realizaciones pueden mantener el solapamiento de dominio de tiempo en el banco de filtros e introducir de manera intencionada un solapamiento de dominio de tiempo correspondiente en las partes de señal codificadas por el códec de dominio de tiempo. Por tanto, las componentes resultantes del solapamiento de dominio de tiempo pueden anularse entre sí de la misma manera que lo hacen para dos tramas consecutivos de los espectros de MDCT.
La figura 1c ilustra otra realización de un aparato 100. Según la figura 1c, el descodificador 122 de dominio de frecuencia puede comprender una etapa 122a de recuantificación. Además, el convertidor 124 de dominio de tiempo a dominio de frecuencia puede comprender un banco de filtros modulado en coseno, una transformada solapada extendida, un banco de filtros de bajo retardo o un banco de filtros polifase. La realización mostrada en la figura 1c ilustra que el convertidor 124 de dominio de tiempo a dominio de frecuencia puede comprender una MDCT 124a.
Además, la figura 1c representa que el combinador 126 de dominio de frecuencia puede comprender un sumador 126a. Como se muestra en la figura 1c, el convertidor 128 de dominio de frecuencia a dominio de tiempo puede comprender un banco de filtros modulado en coseno, respectivamente una MDCT 128ª inversa. La corriente de datos que comprende el segmento de datos codificado de dominio de tiempo y codificado de dominio de frecuencia, puede generarse por un codificador lo que se detallará adicionalmente a continuación. El cambio entre la codificación de dominio de frecuencia y la codificación de dominio de tiempo puede lograrse codificando algunas partes de la señal de entrada con un codificador de dominio de frecuencia y algunas partes de señal de entrada con un codificador de dominio de tiempo. La realización del aparato 100 representado en la figura 1c ilustra la estructura de principio de un aparato 100 para descodificar correspondiente. En otras realizaciones, la recuantificación 122a y la transformada 128a de coseno discreta modificada inversa pueden representar un descodificador de dominio de frecuencia.
Como se indica en la figura 1c para partes de señal, cuando el descodificador 110 de dominio de tiempo toma el mando, la salida de dominio de tiempo del descodificador 110 de dominio de tiempo puede transformarse mediante la MDCT 124a directa. El descodificador de dominio de tiempo puede utilizar un filtro de predicción para descodificar los datos codificados de dominio de tiempo. En este caso, puede introducirse cierta superposición en la entrada de la MDCT 124a y, por tanto, cierta sobrecarga. A continuación se describirán realizaciones que reducen o minimizan esta sobrecarga.
En principio, la realización mostrada en la figura 1c comprende también un modo de operación en el que ambos códecs pueden operar en paralelo. En realizaciones, el procesador 120 puede estar adaptado para procesar un segmento de datos que se codifica en paralelo en el dominio de tiempo y en el dominio de frecuencia. De esta manera, la señal puede codificarse parcialmente en el dominio de frecuencia y parcialmente en el dominio de tiempo, de manera similar a un enfoque de codificación estratificada. Las señales resultantes se suman entonces en el dominio de frecuencia, comparando el combinador 126 de dominio de frecuencia. No obstante, las realizaciones pueden llevar a cabo un modo de operación que es cambiar exclusivamente entre los dos códecs y solamente tener preferiblemente un número mínimo de muestras en las que ambos códecs están activos a fin de obtener la eficacia mejor posible.
En la figura 1c, la salida del descodificador 110 de dominio de tiempo se transforma mediante la MDCT 124a, seguida de la MDCT 128a. En otra realización, estas dos etapas pueden combinarse ventajosamente en una sola etapa a fin de reducir la complejidad. La figura 1d ilustra una realización de un aparato 100 que ilustra este enfoque. El aparato 100 mostrado en la figura 1d ilustra que el procesador 120 puede comprender un calculador 129 para calcular los bloques de datos de dominio de tiempo superpuestos basándose en los datos de salida del descodificador 110 de dominio de tiempo. El procesador 120 o el calculador 129 pueden estar adaptados para reproducir una propiedad, respectivamente, una propiedad de superposición del convertidor 128 de dominio de frecuencia a dominio de tiempo basándose en los datos de salida del descodificador 110 de dominio de tiempo, es decir, el procesador 120 o el calculador 129 pueden reproducir una característica de superposición de los bloques de datos de dominio de tiempo similar a una característica de superposición producida mediante el convertidor 128 de dominio de frecuencia a dominio de tiempo. Además, el procesador 120 o el calculador 129 pueden estar adaptados para reproducir el solapamiento de dominio de tiempo similar al solapamiento de dominio de tiempo introducido por el convertidor 128 de dominio de frecuencia a dominio de tiempo basándose en los datos de salida del descodificador de dominio de tiempo 110.
El convertidor 128 de dominio de frecuencia a dominio de tiempo puede entonces estar adaptado para convertir los segmentos de datos de dominio de frecuencia proporcionados por el descodificador 122 de dominio de frecuencia en bloques de datos de dominio de tiempo superpuestos. El combinador 130 de superposición/suma puede estar adaptado para combinar los bloques de datos proporcionados por el convertidor 128 de dominio de frecuencia a dominio de tiempo del calculador 129 para obtener los segmentos de datos descodificados de la corriente de datos de dominio de tiempo.
El calculador 129 puede comprender una etapa 129a de solapamiento de dominio de tiempo como se ilustra en la realización mostrada en la figura 1e. La etapa 129a de solapamiento de dominio de tiempo puede estar adaptada a los datos de salida de solapamiento de tiempo del descodificador de dominio de tiempo para obtener los bloques de datos de dominio de tiempo superpuestos.
Para los datos codificados de dominio de tiempo, una combinación de la MDCT y la IMDCT puede hacer que el proceso en las realizaciones sea mucho más sencillo tanto en estructura como en complejidad computacional dado que solamente el proceso de solapamiento de dominio de tiempo (TDA) permanece en las realizaciones. Este proceso eficaz puede basarse en varias observaciones. La MDCT a la que se ha aplicado la función ventana de los segmentos de entrada de 2N muestras puede descomponerse en tres etapas.
En primer lugar, la señal de entrada se multiplica por medio de una ventana de análisis.
En segundo lugar, el resultado se desdobla entonces de 2N muestras a N muestras. Para la MDCT, este proceso implica que el primer cuarto de las muestras se combina, es decir, se resta, en orden inverso en tiempo con el segundo cuarto de las muestras, y que el cuarto cuarto de las muestras se combina, es decir, se suma, con el tercer cuarto de las muestras en orden inverso en tiempo. El resultado es la señal muestreada de manera descendente con solapamiento en tiempo en el segundo y tercer cuarto modificado de la señal, que comprende N muestras.
En tercer lugar, la señal muestreada de manera descendente se transforma entonces, utilizando una transformada de tipo DCT ortogonal que correlaciona N muestras de entrada con N muestras de salida para formar la salida de MDCT final.
La reconstrucción de IMDCT a la que se ha aplicado la función ventana de una secuencia de entrada de N muestras espectrales puede descomponerse asimismo en tres etapas.
En primer lugar, la secuencia de entrada de N muestras espectrales se transforma, utilizando una transformada de tipo DCT inversa ortogonal que correlaciona N muestras de entrada con N muestras de salida.
En segundo lugar, los resultados desdoblados de N a 2N muestras mediante la escritura de los valores transformados de DCT inversa en el segundo y tercer cuarto de una memoria intermedia de salida de 2N muestras, llenando el primer cuarto con la versión inversa en tiempo e invertida del segundo cuarto, y el cuarto cuarto con una versión invertida en tiempo del tercer cuarto, respectivamente.
En tercer lugar, las 2N muestras resultantes se multiplican con la ventana de síntesis para formar la salida de IMDCT a la que se ha aplicado la función ventana.
Por tanto, la concatenación de la MDCT a la que se ha aplicado la función ventana y la IMDCT a la que se ha aplicado la función ventana puede llevarse a cabo eficazmente en las realizaciones mediante la secuencia de las etapas primera y segunda de la MDCT a la que se ha aplicado la función ventana y las etapas segunda y tercera de la IMDCT a la que se ha aplicado la función ventana. La tercera etapa de la MDCT y la primera etapa de la IMDCT pueden omitirse completamente en las realizaciones, debido a que son operaciones inversas entre sí y, por tanto, se anulan. Las etapas restantes pueden llevarse a cabo solamente en el dominio de tiempo y, por tanto, las realizaciones que utilizan este enfoque pueden ser sustancialmente bajas en complejidad computacional.
Para un bloque de MDCT e IMDCT consecutiva, la etapa segunda y tercera de la MDCT y la etapa segunda y tercera de la IMDCT pueden escribirse como una multiplicación con la siguiente matriz 2Nx2N dispersa.
-
10 0
-
1 10 0
0 01 1 0 01 1
En otras palabras, el calculador 129 puede estar adaptado para segmentar la salida del descodificador 110 de dominio de tiempo en segmentos de calculador que comprenden 2N muestras secuenciales, aplicando pesos a las 2N muestras según una función ventana de análisis, restando las primeras N/2 muestras en orden inverso a partir de las segundas N/2 muestras, y las últimas N/2 muestras en orden inverso a partir de las terceras N/2 muestras, invirtiendo las N/2 muestras segunda y tercera, reemplazando las primeras N/2 muestras con la versión inversa en tiempo e invertida de las segundas N/2 muestras, reemplazando las cuartas N/2 muestras con la versión inversa en tiempo de las terceras N/2 muestras y aplicando pesos a las 2N muestras según una función ventana de síntesis.
En otras realizaciones, el combinador 130 de superposición/suma puede estar adaptado para aplicar pesos según una función ventana de síntesis a bloques de datos de dominio de tiempo superpuestos proporcionados por el convertidor 128 de dominio de frecuencia a dominio de tiempo. Además, el combinador 130 de superposición/suma puede estar adaptado para aplicar pesos según una función ventana de síntesis que está adaptada al tamaño de una región de superposición de bloques de datos de dominio de tiempo superpuestos consecutivos.
El calculador 129 puede estar adaptado para aplicar pesos a las 2N muestras según una función ventana de análisis que está adaptada al tamaño de una región de superposición de bloques de datos de dominio de tiempo superpuestos consecutivos y el calculador puede estar adaptado además para aplicar pesos a las 2N muestras según una función ventana de síntesis que está adaptada al tamaño de la región de superposición.
En realizaciones, el tamaño de la región de superposición de dos bloques de datos de dominio de tiempo consecutivos que se codifican en el dominio de frecuencia, puede ser mayor que el tamaño de una superposición de dos bloques de datos de dominio de tiempo consecutivos, de los cuales uno se codifica en el dominio de frecuencia y uno se codifica en el dominio de tiempo.
En realizaciones, el tamaño de los segmentos de datos puede estar adaptado al tamaño de las regiones de superposición. Las realizaciones pueden tener una implementación eficaz de un procesamiento de MDCT/IMDCT combinado, es decir, un TDA de bloque que comprende las operaciones de aplicación de función ventana de análisis, de doblado y desdoblado y de aplicación de función ventana de síntesis. Además, en realizaciones, algunas de estas etapas pueden combinarse parcial o totalmente en una implementación real.
Otra realización de un aparato 100, como se muestra en la figura 1f, ilustra que el aparato 100 puede comprender además una derivación 140 para el procesador 120 y adaptando el combinador 130 de superposición/suma para evitar el procesador 120 y el combinador 130 de superposición/suma, cuando se presentan bloques de datos de dominio de tiempo consecutivos no superpuestos en segmentos de datos, que se codifican en el dominio de tiempo. Si se codifican múltiples segmentos de datos en el dominio de tiempo, es decir, puede no ser necesaria la conversión al dominio de frecuencia para descodificar segmentos de datos consecutivos, éstos pueden transmitirse sin ninguna superposición. Para estos casos, las realizaciones tal como se muestran en la figura 1f, pueden evitar el procesador 120 y el combinador 130 de superposición/suma. En realizaciones la superposición de bloques puede determinarse según las especificaciones AAC.
La figura 2a muestra una realización de un aparato 200 para generar una corriente de datos codificados basándose en una corriente de datos de dominio de tiempo, teniendo la corriente de datos de dominio de tiempo muestras de una señal. La corriente de datos de dominio de tiempo, por ejemplo, podría corresponder a una señal de audio que comprende secciones de voz y secciones de música o ambas al mismo tiempo. El aparato 200 comprende un procesador 210 de segmentos para proporcionar segmentos de datos a partir de la corriente de datos, teniendo dos segmentos de datos consecutivos una primera o una segunda región de superposición, siendo la segunda región de superposición más pequeña que la primera región de superposición. El aparato 200 comprende además un codificador 220 de dominio de tiempo para codificar un segmento de datos en el dominio de tiempo y un codificador 230 de dominio de frecuencia para aplicar pesos a muestras de la corriente de datos de dominio de tiempo de según una primera o una segunda función ventana para obtener un segmento de datos al que se ha aplicado la función ventana, estando adaptadas las funciones ventana primera y segunda a las regiones de superposición primera y segunda y para codificar el segmento de datos al que se ha aplicado la función ventana en el dominio de frecuencia.
Además, el aparato 200 comprende un analizador 240 de datos de dominio de tiempo para determinar una indicación de transmisión asociada con un segmento de datos y un controlador 250 para controlar el aparato de tal manera que para los segmentos de datos que tienen una primera indicación de transición los datos de salida del codificador 220 de dominio de tiempo se incluyen en la corriente de datos codificados y para los segmentos de datos que tienen una segunda indicación de transición los datos de salida del codificador 230 de dominio de frecuencia se incluyen en la corriente de datos codificados.
En las realizaciones, el analizador 240 de datos de dominio de tiempo, puede adaptarse para determinar la indicación de transición a partir de la corriente de datos de dominio de tiempo o a partir de los segmentos de datos proporcionados por el procesador 210 de segmentos. Estas realizaciones se indican en la figura 2b. En la figura 2b se ilustra que el analizador 240 de datos de dominio de tiempo puede acoplarse a la entrada del procesador 210 de segmentos a fin de determinar la indicación de transición a partir de la corriente de datos de dominio de tiempo. En otra realización, el analizador 240 de datos de dominio de tiempo puede acoplarse a la salida del procesador 210 de segmentos a fin de determinar la indicación de transición a partir de los segmentos de datos. En las realizaciones, el analizador 240 de datos de dominio de tiempo puede acoplarse directamente al procesador 210 de segmentos a fin de determinar la indicación de transición a partir de los datos proporcionados directamente por el procesador de segmentos. Estas realizaciones se indican mediante las líneas de puntos en la figura 2b.
En las realizaciones, el analizador 240 de datos de dominio de tiempo puede adaptarse para determinar una medida de transición, basándose la medida de transición en un nivel de transitoriedad en la corriente de datos de dominio de tiempo o en los segmentos de datos, en el que el indicador de transición puede indicar si el nivel de transitoriedad supera un umbral predeterminado.
La figura 2c muestra otra realización del aparato 200. En las realizaciones mostradas en la figura 2c el procesador 210 de segmentos puede adaptarse para proporcionar segmentos de datos con las regiones de superposición primera y segunda, el codificador 220 de dominio de tiempo puede adaptarse para codificar todos los segmentos de datos, el codificador 230 de dominio de frecuencia puede adaptarse para codificar todos los segmentos de datos a los que se ha aplicado la función ventana y el controlador 250 puede adaptarse para controlar el codificador 220 de dominio de tiempo y el codificador 230 de dominio de frecuencia de tal manera que para los datos de segmentos que tienen una primera indicación de transición los datos de salida del codificador 220 de dominio de tiempo se incluyen en la corriente de datos codificados y para los segmentos de datos que tienen una segunda indicación de transición los datos de salida del codificador 230 de dominio de frecuencia se incluyen en la corriente de datos codificados. En otras realizaciones, los datos de salida tanto del codificador 220 de dominio de tiempo como del codificador 230 de dominio de frecuencia pueden incluirse en la corriente de datos codificados. El indicador de transición puede indicar si un segmento de datos se encuentra o bien asociado o bien correlacionado con una señal de voz o con una señal de música. En las realizaciones, el codificador 230 de dominio de frecuencia puede utilizarse para más segmentos de datos tipo música y el codificador 220 de dominio de tiempo puede utilizarse para más segmentos de datos tipo voz. En las realizaciones, puede utilizarse la codificación paralela, por ejemplo, para una señal de audio tipo voz que tiene música de fondo.
En la realización representada en la figura 2c, son concebibles múltiples posibilidades para que el controlador 250 controle los múltiples componentes dentro del aparato 200. Las diferentes posibilidades se indican mediante líneas de puntos en la figura 2c. Por ejemplo, el controlador 250 podría acoplarse con el codificador 220 de dominio de tiempo y el codificador 230 de dominio de frecuencia a fin de seleccionar el codificador que debe producir una salida codificada basándose en la indicación de transición. En otra realización, el controlador 250 puede controlar un interruptor en las salidas del codificador 220 de dominio de tiempo y del codificador 230 de dominio de frecuencia.
En tal realización, tanto el codificador 220 de dominio de tiempo como el codificador 230 de dominio de frecuencia pueden codificar todos los segmentos de datos y el controlador 250 puede adaptarse para seleccionar mediante dicho interruptor que se encuentra acoplado a las salidas de los codificadores, el segmento de datos codificados que debe incluirse en la corriente de datos codificados, basándose en la eficiencia de codificación, respectivamente, la indicación de transición. En otras realizaciones, el controlador 250 puede adaptarse para controlar el procesador 210 de segmentos para proporcionar los segmentos de datos o bien al codificador 220 de dominio de tiempo o bien al codificador 230 de dominio de frecuencia. El controlador 250 también puede controlar el procesador 210 de segmentos a fin de establecer regiones de superposición para un segmento de datos. En otras realizaciones, el controlador 250 puede adaptarse para controlar un interruptor entre el procesador 210 de segmentos y el codificador 220 de dominio de tiempo, respectivamente, el codificador 230 de dominio de frecuencia. El controlador 250 podría entonces influir en el interruptor para dirigir los segmentos de datos o bien a uno de los codificadores, respectivamente, o a ambos. El controlador 250 puede adaptarse además para establecer las funciones ventana para el codificador 230 de dominio de frecuencia conjuntamente con las regiones de superposición y las estrategias de codificación.
Además, en las realizaciones, el codificador 230 de dominio de frecuencia puede adaptarse para aplicar pesos de funciones ventana según las especificaciones AAC. El codificador 230 de dominio de frecuencia puede adaptarse para convertir un segmento de datos al que se ha aplicado la función ventana al dominio de frecuencia para obtener un segmento de datos de dominio de frecuencia. Además, el codificador 230 de dominio de frecuencia puede adaptarse para cuantificar los segmentos de datos de dominio de frecuencia y, además, el codificador 230 de dominio de frecuencia puede adaptarse para evaluar los segmentos de datos de dominio de frecuencia, según un modelo perceptivo.
El codificador 230 de dominio de frecuencia puede adaptarse para utilizar un banco de filtros modulado en coseno, una transformada solapada extendida, un banco de filtros de bajo retardo o un banco de filtros polifase para obtener los segmentos de datos de dominio de frecuencia.
El codificador 230 de dominio de frecuencia puede adaptarse para utilizar una MDCT para obtener los segmentos de datos de frecuencia. El codificador 220 de dominio de tiempo puede adaptarse para utilizar un modelo predictivo para codificar los segmentos de datos.
En las realizaciones en las que una MDCT en el codificador 230 de dominio de frecuencia opera en un denominado modo de bloque largo, es decir, el modo de operación regular que se utiliza para codificar señales de entrada no transitorias, véanse las especificaciones AAC, la sobrecarga que se introduce mediante el proceso de cambio puede ser alta. Esto puede ser verdadero para los casos en los que solamente debe codificarse una trama, es decir, una tasa de longitud/trama de N muestras, utilizando el codificador 220 de dominio de tiempo en lugar del codificador 230 de dominio de frecuencia.
Después, todos los valores de entrada para la MDCT pueden tener que codificarse con el codificador 220 de dominio de tiempo, es decir, se encuentran disponibles 2N muestras en la salida del descodificador 110 de dominio de tiempo. Por tanto, podría introducirse una sobrecarga de N muestras adicionales. Las figuras 3a a 3d ilustran algunas regiones de superposición de segmentos concebibles, respectivamente aplicables a las funciones ventana. Las 2N muestras pueden tener que codificarse con el codificador 220 de dominio de tiempo a fin de reemplazar un bloque de datos codificados de dominio de frecuencia. La figura 3a ilustra un ejemplo, en el que los bloques de datos codificados de dominio de frecuencia utilizan una línea continua y los datos codificados de dominio de tiempo utilizan una línea de puntos. Debajo de las funciones ventana se representan segmentos de datos que pueden codificarse en el dominio de frecuencia (recuadros con líneas continuas) o en el dominio de tiempo (recuadros con líneas de puntos). A esta representación se hará referencia también en las figuras 3b a 3d.
La figura 3a ilustra el caso en el que los datos se codifican en el dominio de frecuencia interrumpidos por un segmento de datos que se codifica en el dominio de tiempo, y el segmento de datos después de codificarse de nuevo en el dominio de frecuencia. A fin de proporcionar los datos de dominio de tiempo que son necesarios para anular el solapamiento de dominio de tiempo evocado por el codificador 230 de dominio de frecuencia, al cambiar del dominio de frecuencia al dominio de tiempo, se requiere la mitad del tamaño de un segmento para la superposición, lo mismo se aplica para volver a cambiar del dominio de tiempo al dominio de frecuencia. Suponiendo que el segmento de datos codificados de dominio de tiempo en la figura 3a tiene un tamaño de 2N, entonces en su inicio y al final se superpone con los datos codificados de dominio de frecuencia mediante N/2 muestras.
En caso de que pueda codificarse más de una trama subsecuente utilizando el codificador 220 de dominio de tiempo, la sobrecarga para la sección codificada de dominio de tiempo permanece en N muestras. Como se ilustra en la figura 3b en donde dos tramas consecutivas se codifican en el dominio de tiempo y las regiones de superposición al inicio y al final del dominio de tiempo las secciones codificadas tienen la misma superposición explicada con respecto a la figura 3a. La figura 3b muestra la estructura de superposición en el caso de dos tramas codificadas con el codificador 220 de dominio de tiempo. Las 3N muestras tienen que codificarse con el codificador 220 de dominio de tiempo en este caso.
Esta sobrecarga puede reducirse en las realizaciones utilizando cambio de ventana, por ejemplo, según la estructura que se utiliza en AAC. La figura 3c ilustra una secuencia típica de ventanas arga, inicial, corta y de detención a medida que se utilizan en AAC. A partir de la figura 3c puede observarse que los tamaños de ventana, los tamaños de segmento de datos y, por consiguiente, el tamaño de las regiones de superposición, cambian con las diferentes ventanas. La secuencia representada en la figura 3c es un ejemplo de la secuencia mencionada anteriormente.
Las realizaciones no deben limitarse a ventanas del tamaño de las ventanas de AAC, sin embargo, las realizaciones se aprovechan de las ventanas con diferentes regiones de superposición y también de ventanas de diferentes duraciones. En las realizaciones, las transiciones hacia y desde ventanas cortas pueden utilizar una superposición reducida como, por ejemplo, la descrita en Bernd Edler, “Codierung von Audiosignalen mit überlappender Transformation und adaptiven Fensterfunktionen”, Frequenz, Vol. 43, n.º 9, pág. 252-256, septiembre de 1989 y Generic Coding of Moving Pictures and Associated Audio: Advanced Audio Coding, Estándar Internacional 13818-7, ISO/IEC JTC1/SC29/WG11 Moving Pictures Expert Group 1997, para reducir la sobrecarga para las transiciones hacia y desde las regiones codificadas de dominio de tiempo, como se ilustra en la figura 3d. La figura 3d ilustra cuatro segmentos de datos, de los cuales los primeros dos y el último se codifican en el dominio de frecuencia y el tercero se codifica en el dominio de tiempo. Cuando se cambia del dominio de frecuencia al dominio de tiempo, se utilizan ventanas diferentes con el tamaño de superposición reducido, reduciendo así la sobrecarga.
En las realizaciones, la transición puede basarse en las ventanas de inicio y detención idénticas a las utilizadas en AAC. Las ventanas correspondientes para las transiciones hacia y desde las regiones codificadas de dominio de tiempo son ventanas solamente con regiones pequeñas de superposición. Como consecuencia, la sobrecarga, es decir, el número de valores adicionales que van a transmitirse debido al proceso de cambio, disminuye sustancialmente. En general, la sobrecarga puede ser Nov1/2 para cada transición con la superposición de ventana de Nov1 muestras. Por tanto, una transición con la ventana común totalmente superpuesta como una AAC con Nov1 = 1024, incurre en una sobrecarga de 1024/2 = 512 muestras para la izquierda, es decir, la ventana de aparición gradual de imagen y de 1024/2 = 512 muestras para la derecha, es decir, la ventana de desvanecimiento de imagen, dando como resultado una sobrecarga total de 1024 (= N) muestras. La selección de una ventana superpuesta reducida como las ventanas de bloque corto AAC con Nov1 = 128, solamente da como resultado una sobrecarga total de 128 muestras.
Las realizaciones pueden utilizar un banco de filtros en el codificador 230 de dominio de frecuencia como, por ejemplo, el banco de filtros de MDCT ampliamente utilizado, sin embargo, también pueden utilizarse otras realizaciones con códecs de dominio de frecuencia basándose en otros bancos de filtros modulados en coseno. Esto puede comprender los derivados de la MDCT, tales como transformadas solapadas extendidas o bancos de filtros de bajo retardo así como bancos de filtros polifase, tales como, por ejemplo, el utilizado en los códecs de audio MPEG-1-Layer-1/2/3. En las realizaciones, la implementación eficaz de una operación de banco de filtros hacia delante/atrás puede tener en cuenta un tipo de ventana específico y utilizar doblado/desdoblado en el banco de filtros. Para cada tipo de banco de filtros modulado, la etapa de análisis puede implementarse eficazmente mediante una etapa de preprocesamiento y una transformada de bloque, es decir, tipo DCT o DEFT, para la modulación. En las realizaciones, la etapa de síntesis correspondiente puede implementarse utilizando la transformada inversa correspondiente y una etapa de posprocesamiento. Las realizaciones pueden utilizar solamente las etapas de pre y posprocesamiento para las partes de señal codificadas de dominio de tiempo.
Las realizaciones de la presente invención proporcionan la ventaja de que puede lograrse una mejor eficiencia de codificación, dado que el cambio entre un codificador 220 de dominio de tiempo y el codificador 230 de dominio de frecuencia pueden efectuarse introduciendo una sobrecarga muy baja. Solamente en secciones de señal de codificación de dominio de tiempo subsiguiente puede omitirse completamente la superposición en las realizaciones. Las realizaciones del aparato 100 permiten la descodificación correcta de la corriente de datos codificados.
Las presentes realizaciones proporcionan la ventaja de que puede lograrse una tasa de codificación más baja con la misma calidad, por ejemplo, de una señal de audio, respectivamente puede lograrse una calidad más alta con la misma tasa de codificación, dado que los codificadores respectivos pueden adaptarse a la transitoriedad en la señal de audio.
Dependiendo de ciertos requisitos de implementación de los métodos de la invención, los métodos de la invención pueden implementarse en hardware o en software. La implementación puede llevarse a cabo utilizando un medio de almacenamiento digital, en particular un disco, DVD o CD que tiene señales de control almacenadas electrónicamente, almacenadas en el mismo, que actúan conjuntamente con el sistema informático programable de tal manera que se realizan los métodos de la invención. Generalmente, la presente invención, es por tanto un producto de programa informático que tiene un código de programa almacenado en un soporte legible por máquina, siendo el código de programa operativo para llevar a cabo los métodos de la invención cuando el producto de programa informático se ejecuta en un ordenador. En otras palabras, los métodos de la invención, son por tanto un programa informático que tiene un código de programa para llevar a cabo al menos uno de los métodos de la invención cuando el programa informático se ejecuta en un ordenador.
Lista de referencias
100 aparato de descodificación 110 descodificador de dominio de tiempo 120 procesador 122 descodificador de dominio de frecuencia 122a recuantificación
124 convertidor de dominio de tiempo a dominio de frecuencia 124a transformada de coseno discreta modificada 126 combinador de dominio de frecuencia 126a sumador
128 convertidor de dominio de frecuencia a dominio de tiempo 128a transformada inversa de coseno discreta modificada 129 calculador 129a etapa de solapamiento de dominio de tiempo 130 combinador de superposición/suma 200 aparato de codificación 210 procesador de segmentos 220 codificador de dominio de tiempo 230 codificador de dominio de frecuencia 240 analizador de datos de dominio de tiempo 250 controlador
400 entrada de transformada de coseno discreta modificada
410 ventanas 420 primera ventana de salida de la transformada inversa de coseno discreta modificada 425 segunda ventana de salida de la transformada inversa de coseno discreta modificada
430 salida final

Claims (41)

  1. REIVINDICACIONES
    1. Aparato para descodificar segmentos de datos que representan una corriente de datos de dominio de tiempo, codificándose uno o más segmentos de datos en el dominio de tiempo, codificándose uno o más segmentos de datos en el dominio de frecuencia teniendo bloques de datos sucesivos que representan bloques sucesivos y superpuestos de las muestras de datos de dominio de tiempo, comprendiendo el aparato:
    un descodificador de dominio de tiempo para descodificar un segmento de datos que se codifica en el dominio de tiempo;
    un procesador para procesar los segmentos de datos que se codifican en el dominio de frecuencia y los datos de salida del descodificador de dominio de tiempo para obtener bloques de datos de dominio de tiempo de tal manera que bloques de datos de dominio de tiempo obtenidos basándose en segmentos de datos posteriores que se codifican en el dominio de frecuencia se superponen; y
    de tal manera que bloques de datos de dominio de tiempo consecutivos de los que uno se codifica en el dominio de frecuencia y de los que uno se codifica en el dominio de tiempo se superponen; y
    un combinador de superposición/suma para combinar los bloques de datos de dominio de tiempo superpuestos para obtener los segmentos de datos descodificados de la corriente de datos de dominio de tiempo;
    en el que el combinador de superposición/suma está adaptado para aplicar pesos según funciones ventana de síntesis a bloques de datos de dominio de tiempo superpuestos,
    en el que la función ventana de síntesis está adaptada a un tamaño de una región de superposición de bloques de datos de dominio de tiempo superpuestos consecutivos,
    en el que una ventana con un tamaño de superposición reducido se aplica a un bloque de datos de dominio de tiempo codificado en el dominio de frecuencia cuando se cambia del dominio de frecuencia al dominio de tiempo;
    en el que un tamaño de una región de superposición de dos bloques de datos de dominio de tiempo consecutivos que se codifican en el dominio de frecuencia es mayor que un tamaño de una región de superposición de dos bloques de datos de dominio de tiempo consecutivos de los cuales uno se codifica en el dominio de frecuencia y uno se codifica en el dominio de tiempo.
  2. 2.
    Aparato según la reivindicación 1, en el que el procesador comprende un descodificador de dominio de frecuencia para descodificar segmentos de datos que se codifican en el dominio de frecuencia para obtener segmentos de datos de dominio de frecuencia.
  3. 3.
    Aparato según la reivindicación 1, en el que el procesador está adaptado para procesar un segmento de datos que se codifica en el dominio de tiempo y en el dominio de frecuencia en paralelo.
  4. 4.
    Aparato según la reivindicación 2, en el que el procesador comprende un convertidor de dominio de tiempo a dominio de frecuencia para convertir los datos de salida del descodificador de dominio de tiempo para obtener segmentos de datos de dominio de frecuencia convertidos.
  5. 5.
    Aparato según la reivindicación 4, en el que el procesador comprende un combinador de dominio de frecuencia para combinar los segmentos de datos de dominio de frecuencia y los segmentos de datos de dominio de frecuencia convertidos para obtener una corriente de datos de dominio de frecuencia.
  6. 6.
    Aparato según la reivindicación 5, en el que el procesador comprende un convertidor de dominio de frecuencia a dominio de tiempo para convertir la corriente de datos de dominio de frecuencia en bloques de datos de dominio de tiempo superpuestos.
  7. 7.
    Aparato según la reivindicación 2, en el que el descodificador de dominio de frecuencia comprende además una etapa de recuantificación.
  8. 8.
    Aparato según la reivindicación 4, en el que el convertidor de dominio de tiempo a dominio de frecuencia comprende un banco de filtros modulado en coseno, una transformada solapada extendida, un banco de filtros de bajo retardo, un banco de filtros polifase o una transformada de coseno discreta modificada.
  9. 9.
    Aparato según la reivindicación 5, en el que el combinador de dominio de frecuencia comprende un sumador.
  10. 10.
    Aparato según la reivindicación 6, en el que el convertidor de dominio de frecuencia a dominio de tiempo comprende un banco de filtros modulado en coseno o una transformada inversa de coseno discreta modificada.
  11. 11.
    Aparato según la reivindicación 1, en el que el descodificador de dominio de tiempo está adaptado para utilizar un filtro de predicción para descodificar un segmento de datos codificado en el dominio de tiempo.
  12. 12.
    Aparato según la reivindicación 1, en el que el procesador comprende un calculador para calcular los bloques de datos de dominio de tiempo superpuestos basándose en los datos de salida del descodificador de dominio de tiempo.
  13. 13.
    Aparato según la reivindicación 12, en el que el calculador está adaptado para reproducir una propiedad de superposición del convertidor de dominio de frecuencia a dominio de tiempo basándose en los datos de salida del descodificador de dominio de tiempo.
  14. 14.
    Aparato según la reivindicación 13, en el que el calculador está adaptado para reproducir una característica de solapamiento de dominio de tiempo del convertidor de dominio de frecuencia a dominio de tiempo basándose en los datos de salida del descodificador de dominio de tiempo.
  15. 15.
    Aparato según la reivindicación 6, en el que el convertidor de dominio de frecuencia a dominio de tiempo está adaptado para convertir los segmentos de datos de dominio de frecuencia proporcionados por el descodificador de dominio de frecuencia en bloques de datos de dominio de tiempo superpuestos.
  16. 16.
    Aparato según la reivindicación 15, en el que el combinador de superposición/suma está adaptado para combinar los bloques de datos de dominio de tiempo superpuestos proporcionados por el convertidor de dominio de frecuencia a dominio de tiempo y el calculador para obtener segmentos de datos descodificados de la corriente de datos de dominio de tiempo.
  17. 17.
    Aparato según la reivindicación 8, en el que el calculador comprende una etapa de solapamiento de dominio de tiempo para los datos de salida de solapamiento de tiempo del descodificador de dominio de tiempo para obtener los bloques de datos de dominio de tiempo superpuestos.
  18. 18.
    Aparato según la reivindicación 12, en el que el calculador está adaptado para
    segmentar la salida del descodificador de dominio de tiempo en segmentos de calculador que comprenden 2N muestras secuenciales,
    aplicar pesos a las 2N muestras según una función ventana de análisis,
    restar las primeras N/2 muestras en orden inverso de las segundas N/2 muestras,
    agregar las últimas N/2 muestras en orden inverso a las terceras N/2 muestras,
    invertir la segunda y tercera N/2 muestras,
    reemplazar las primeras N/2 muestras con la versión inversa en tiempo e invertida de las segundas N/2 muestras, reemplazando las cuartas N/2 muestras con la versión inversa en tiempo de las terceras N/2 muestras, y aplicar pesos a las 2N muestras según una función ventana de síntesis.
  19. 19.
    Aparato según la reivindicación 6, en el que el combinador de superposición/suma está adaptado para aplicar pesos según una función ventana de síntesis a los bloques de datos de dominio de tiempo superpuestos proporcionados por el convertidor de dominio de frecuencia a dominio de tiempo.
  20. 20.
    Aparato según la reivindicación 19, en el que el combinador de superposición/suma está adaptado para aplicar pesos según una función ventana de síntesis que están adaptados a un tamaño de una región de superposición de los bloques de datos de dominio de tiempo superpuestos consecutivos.
  21. 21.
    Aparato según la reivindicación 20, en el que el calculador está adaptado para aplicar pesos a las 2N muestras según una función ventana de análisis que está adaptada a un tamaño de una región de superposición de los bloques de datos de dominio de tiempo superpuestos consecutivos y en el que el calculador está adaptado para aplicar pesos a las 2N muestras según una función ventana de síntesis que está adaptada al tamaño de la región de superposición.
  22. 22.
    Aparato según la reivindicación 1, en el que un tamaño de una región de superposición de dos bloques de datos de dominio de tiempo consecutivos que se codifican en el dominio de frecuencia, es mayor que un tamaño de una región de superposición de dos bloques de datos de dominio de tiempo consecutivos de los cuales uno se codifica en el dominio de frecuencia y uno se codifica en el dominio de tiempo.
  23. 23.
    Aparato según la reivindicación 1, en el que la superposición de bloques de datos se determina según las especificaciones AAC.
  24. 24.
    Aparato según la reivindicación 1, que comprende además una derivación para el procesador y el combinador de superposición/suma, estando adaptada la derivación para evitar el procesador y el combinador
    de superposición/suma cuando se presentan bloques de datos de dominio de tiempo consecutivos no superpuestos en los segmentos de datos que se codifican en el dominio de tiempo.
  25. 25.
    Método para descodificar segmentos de datos que representan una corriente de datos de dominio de tiempo, codificándose uno o más segmentos de datos en el dominio de tiempo, codificándose uno o más segmentos de datos en el dominio de frecuencia teniendo bloques de datos sucesivos que representan bloques sucesivos y superpuestos de las muestras de datos de dominio de tiempo, que comprende las etapas de:
    descodificar un segmento de datos que se codifica en el dominio de tiempo;
    procesar el segmento de datos que se codifica en el dominio de frecuencia y los datos de salida del descodificador de dominio de tiempo para obtener bloques de datos de dominio de tiempo superpuestos de tal manera que bloques de datos de dominio de tiempo obtenidos basándose en segmentos de datos posteriores que se codifican en el dominio de frecuencia se superponen; y
    de tal manera que bloques de datos de dominio de tiempo consecutivos de los que uno se codifica en el dominio de frecuencia y de los que uno se codifica en el dominio de tiempo se superponen; y
    combinar los bloques de datos de dominio de tiempo superpuestos para obtener los segmentos de datos descodificados de la corriente de datos de dominio de tiempo;
    en el que se aplican pesos según funciones ventana de síntesis a los bloques de datos de dominio de tiempo superpuestos,
    en el que la función ventana de síntesis está adaptada a un tamaño de una región de superposición de bloques de datos de dominio de tiempo superpuestos consecutivos,
    en el que una ventana con un tamaño de superposición reducido se aplica a un bloque de datos de dominio de tiempo codificado en el dominio de frecuencia cuando se cambia del dominio de frecuencia al dominio de tiempo;
    en el que un tamaño de una región de superposición de dos bloques de datos de dominio de tiempo consecutivos que se codifican en el dominio de frecuencia es mayor que un tamaño de una región de superposición de dos bloques de datos de dominio de tiempo consecutivos de los cuales uno se codifica en el dominio de frecuencia y uno se codifica en el dominio de tiempo.
  26. 26.
    Programa informático que tiene un código de programa para llevar a cabo el método según la reivindicación 25, cuando el código de programa se ejecuta en un ordenador.
  27. 27.
    Aparato para generar una corriente de datos codificados basándose en una corriente de datos de dominio de tiempo, teniendo la corriente de datos de dominio de tiempo muestras de una señal, comprendiendo el aparato:
    un procesador de segmentos para proporcionar segmentos de datos a partir de la corriente de datos;
    un codificador de dominio de tiempo para codificar un segmento de datos al que se ha aplicado la función ventana en el dominio de tiempo;
    un codificador de dominio de frecuencia para aplicar pesos a muestras de la corriente de datos de dominio de tiempo según una primera o segunda función ventana para obtener un segmento de datos al que se ha aplicado la función ventana, estando adaptadas las funciones ventana primera y segunda a regiones de superposición de diferentes longitudes, estando adaptado el codificador de dominio de frecuencia para codificar un segmento de datos al que se ha aplicado la función ventana en el dominio de frecuencia;
    un analizador de datos de dominio de tiempo para determinar una indicación de transición asociada con un segmento de datos; y
    un controlador para controlar el aparato de tal manera que para los segmentos de datos que tienen una primera indicación de transición, los datos de salida del codificador de dominio de tiempo se incluyen en la corriente de datos codificados y para los segmentos de datos que tienen una segunda indicación de transición, los datos de salida del codificador de dominio de frecuencia se incluyen en la corriente de datos codificados;
    en el que el controlador está adaptado para establecer las funciones ventana para el codificador de dominio de frecuencia, de tal manera que se utiliza una ventana con un tamaño de superposición reducido cuando se cambia del dominio de frecuencia al dominio de tiempo.
  28. 28.
    Aparato según la reivindicación 27, en el que el controlador está adaptado para establecer las funciones ventana para el codificador de dominio de frecuencia, de tal manera que un tamaño de una región de superposición de dos segmentos de datos a los que se ha aplicado la función ventana consecutivos que se codifican en el dominio de frecuencia, es mayor que un tamaño de una región de superposición de dos segmentos de datos a los que se ha aplicado la función ventana consecutivos, de los cuales uno se codifica en el dominio de frecuencia y uno se codifica en el dominio de tiempo
  29. 29.
    Aparato según la reivindicación 27 ó 28, en el que el analizador de datos de dominio de tiempo está adaptado para determinar la indicación de transición a partir de la corriente de datos de dominio de tiempo, de los segmentos de datos o a partir de los datos proporcionados directamente por el procesador de segmentos.
  30. 30.
    Aparato según la reivindicación 27 ó 28, en el que el analizador de datos de dominio de tiempo está adaptado para determinar una medición de transición, basándose la medición de transición en el nivel de transitoriedad en la corriente de datos de dominio de tiempo o en el segmento de datos, y en el que el indicador de transición indica si un nivel de transitoriedad supera un umbral predeterminado.
  31. 31.
    Aparato según la reivindicación 27 ó 28, en el que el procesador de segmentos está adaptado para proporcionar segmentos de datos con regiones de superposición de diferentes longitudes,
    el codificador de dominio de tiempo está adaptado para codificar los segmentos de datos,
    el codificador de dominio de frecuencia está adaptado para codificar los segmentos de datos a los que se ha aplicado la función ventana, y
    el controlador está adaptado para controlar el codificador de dominio de tiempo y el codificador de dominio de frecuencia de tal manera que para los segmentos de datos que tienen una primera indicación de transición los datos de salida del codificador de dominio de tiempo se incluyen en la corriente de datos codificados y para los segmentos de datos a los que se ha aplicado la función ventana que tienen una segunda indicación de transición los datos de salida del codificador de dominio de frecuencia se incluyen en la corriente de datos codificados.
  32. 32. Aparato según la reivindicación 27 ó 28, en el que el controlador está adaptado para controlar el procesador de segmentos para proporcionar los segmentos de datos o bien al codificador de dominio de tiempo
    o bien al codificador de dominio de frecuencia.
  33. 33.
    Aparato según la reivindicación 27 ó 28, en el que el codificador de dominio de frecuencia está adaptado para aplicar pesos de funciones ventana según las especificaciones AAC.
  34. 34.
    Aparato según la reivindicación 27 ó 28, en el que el codificador de dominio de frecuencia está adaptado para convertir un segmento de datos al que se ha aplicado la función ventana al dominio de frecuencia para obtener un segmento de datos de dominio de frecuencia.
  35. 35.
    Aparato según la reivindicación 34, en el que el codificador de dominio de frecuencia está adaptado para cuantificar el segmento de datos de dominio de frecuencia.
  36. 36.
    Aparato según la reivindicación 35, en el que el codificador de dominio de frecuencia está adaptado para evaluar el segmento de datos de dominio de frecuencia según un modelo perceptivo.
  37. 37.
    Aparato según la reivindicación 36, en el que el codificador de dominio de frecuencia está adaptado para utilizar un banco de filtros modulado en coseno, una transformada solapada extendida, un banco de filtros de bajo retardo o un banco de filtros polifase para obtener los segmentos de datos de dominio de frecuencia.
  38. 38.
    Aparato según la reivindicación 34, en el que el codificador de dominio de frecuencia está adaptado para utilizar una transformada de coseno discreta modificada para obtener los segmentos de datos de dominio de frecuencia.
  39. 39.
    Aparato según la reivindicación 27 ó 28, en el que el codificador de dominio de tiempo está adaptado para utilizar un filtro de predicción para codificar los segmentos de datos.
  40. 40.
    Método para generar una corriente de datos codificados basándose en una corriente de datos de dominio de tiempo, teniendo la corriente de datos de dominio de tiempo muestras de una señal, que comprende las etapas de:
    proporcionar segmentos de datos a partir de la corriente de datos;
    determinar una indicación de transición asociada con los segmentos de datos;
    codificar un segmento de datos en el dominio de tiempo, y
    aplicar pesos a las muestras de la corriente de datos de dominio de tiempo según una primera o una segunda función ventana para obtener un segmento de datos al que se ha aplicado la función ventana, estando adaptadas las funciones ventana primera y segunda a regiones de superposición de diferentes longitudes y codificando el segmento de datos al que se ha aplicado la función ventana en el dominio de 5 frecuencia; y
    controlar de tal manera que para los segmentos de datos que tienen una primera indicación de transición, los datos de salida que se codifican en el dominio de tiempo se incluyen en la corriente de datos codificados y para los segmentos de datos que tienen una segunda indicación de transición, los datos de salida que se codifican en el dominio de frecuencia se incluyen en la corriente de datos codificados;
    10 en el que las funciones ventana para la codificación de dominio de frecuencia se establecen de tal manera que se utiliza una ventana con un tamaño de superposición reducido cuando se cambia del dominio de frecuencia al dominio de tiempo o del dominio de tiempo al dominio de frecuencia.
  41. 41. Programa informático que tiene un código de programa para llevar a cabo el método según la reivindicación 40, cuando el código de programa se ejecuta en un ordenador.
ES07856467T 2006-12-12 2007-12-07 Codificador, descodificador y métodos para codificar y descodificar segmentos de datos que representan una corriente de datos de dominio de tiempo Active ES2383217T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US86967006P 2006-12-12 2006-12-12
US869670P 2006-12-12
PCT/EP2007/010665 WO2008071353A2 (en) 2006-12-12 2007-12-07 Encoder, decoder and methods for encoding and decoding data segments representing a time-domain data stream

Publications (1)

Publication Number Publication Date
ES2383217T3 true ES2383217T3 (es) 2012-06-19

Family

ID=39410130

Family Applications (1)

Application Number Title Priority Date Filing Date
ES07856467T Active ES2383217T3 (es) 2006-12-12 2007-12-07 Codificador, descodificador y métodos para codificar y descodificar segmentos de datos que representan una corriente de datos de dominio de tiempo

Country Status (20)

Country Link
US (8) US8818796B2 (es)
EP (1) EP2052548B1 (es)
JP (1) JP5171842B2 (es)
KR (1) KR101016224B1 (es)
CN (2) CN102395033B (es)
AT (1) ATE547898T1 (es)
AU (1) AU2007331763B2 (es)
BR (2) BRPI0718738B1 (es)
CA (1) CA2672165C (es)
ES (1) ES2383217T3 (es)
HK (2) HK1126602A1 (es)
IL (1) IL198725A (es)
MX (1) MX2009006201A (es)
MY (1) MY148913A (es)
NO (1) NO342080B1 (es)
PL (1) PL2052548T3 (es)
RU (1) RU2444071C2 (es)
TW (1) TWI363563B (es)
WO (1) WO2008071353A2 (es)
ZA (1) ZA200903159B (es)

Families Citing this family (73)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8630863B2 (en) * 2007-04-24 2014-01-14 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding audio/speech signal
WO2008151137A2 (en) * 2007-06-01 2008-12-11 The Trustees Of Columbia University In The City Of New York Real-time time encoding and decoding machines
WO2009006405A1 (en) 2007-06-28 2009-01-08 The Trustees Of Columbia University In The City Of New York Multi-input multi-output time encoding and decoding machines
EP2077551B1 (en) * 2008-01-04 2011-03-02 Dolby Sweden AB Audio encoder and decoder
ES2683077T3 (es) * 2008-07-11 2018-09-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada
MX2011000375A (es) 2008-07-11 2011-05-19 Fraunhofer Ges Forschung Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada.
WO2010003663A1 (en) * 2008-07-11 2010-01-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder for encoding frames of sampled audio signals
CA2871498C (en) * 2008-07-11 2017-10-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder and decoder for encoding and decoding audio samples
EP3002751A1 (en) 2008-07-11 2016-04-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder for encoding and decoding audio samples
WO2010003521A1 (en) 2008-07-11 2010-01-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and discriminator for classifying different segments of a signal
EP2144230A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
ES2401487T3 (es) * 2008-07-11 2013-04-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y procedimiento para la codificación/decodificación de una señal de audio utilizando un esquema de conmutación de generación de señal ajena
PT2146344T (pt) 2008-07-17 2016-10-13 Fraunhofer Ges Forschung Esquema de codificação/descodificação de áudio com uma derivação comutável
EP2339577B1 (en) * 2008-09-18 2018-03-21 Electronics and Telecommunications Research Institute Encoding apparatus and decoding apparatus for transforming between modified discrete cosine transform-based coder and hetero coder
FR2936898A1 (fr) * 2008-10-08 2010-04-09 France Telecom Codage a echantillonnage critique avec codeur predictif
EP2345030A2 (en) * 2008-10-08 2011-07-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-resolution switched audio encoding/decoding scheme
WO2010044593A2 (ko) 2008-10-13 2010-04-22 한국전자통신연구원 Mdct 기반 음성/오디오 통합 부호화기의 lpc 잔차신호 부호화/복호화 장치
KR101649376B1 (ko) * 2008-10-13 2016-08-31 한국전자통신연구원 Mdct 기반 음성/오디오 통합 부호화기의 lpc 잔차신호 부호화/복호화 장치
KR101315617B1 (ko) * 2008-11-26 2013-10-08 광운대학교 산학협력단 모드 스위칭에 기초하여 윈도우 시퀀스를 처리하는 통합 음성/오디오 부/복호화기
US9384748B2 (en) 2008-11-26 2016-07-05 Electronics And Telecommunications Research Institute Unified Speech/Audio Codec (USAC) processing windows sequence based mode switching
US8457975B2 (en) * 2009-01-28 2013-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program
EP2460158A4 (en) 2009-07-27 2013-09-04 METHOD AND APPARATUS FOR PROCESSING AUDIO SIGNAL
WO2011034377A2 (en) * 2009-09-17 2011-03-24 Lg Electronics Inc. A method and an apparatus for processing an audio signal
US20110087494A1 (en) * 2009-10-09 2011-04-14 Samsung Electronics Co., Ltd. Apparatus and method of encoding audio signal by switching frequency domain transformation scheme and time domain transformation scheme
KR101137652B1 (ko) * 2009-10-14 2012-04-23 광운대학교 산학협력단 천이 구간에 기초하여 윈도우의 오버랩 영역을 조절하는 통합 음성/오디오 부호화/복호화 장치 및 방법
PL2473995T3 (pl) * 2009-10-20 2015-06-30 Fraunhofer Ges Forschung Koder sygnału audio, dekoder sygnału audio, sposób dostarczania zakodowanej reprezentacji treści audio, sposób dostarczania dekodowanej reprezentacji treści audio oraz program komputerowy do wykorzystania w zastosowaniach z małym opóźnieniem
TWI430263B (zh) * 2009-10-20 2014-03-11 Fraunhofer Ges Forschung 音訊信號編碼器、音訊信號解碼器、使用混疊抵消來將音訊信號編碼或解碼之方法
IL295473B2 (en) 2010-07-02 2023-10-01 Dolby Int Ab After–selective bass filter
EP4398246A2 (en) * 2010-07-08 2024-07-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder using forward aliasing cancellation
KR101826331B1 (ko) * 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
CA2929800C (en) * 2010-12-29 2017-12-19 Samsung Electronics Co., Ltd. Apparatus and method for encoding/decoding for high-frequency bandwidth extension
US9071851B2 (en) 2011-01-10 2015-06-30 Qualcomm Incorporated Adaptively performing smoothing operations
WO2012109407A1 (en) 2011-02-09 2012-08-16 The Trustees Of Columbia University In The City Of New York Encoding and decoding machine with recurrent neural networks
EP2676268B1 (en) 2011-02-14 2014-12-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing a decoded audio signal in a spectral domain
TWI488176B (zh) * 2011-02-14 2015-06-11 Fraunhofer Ges Forschung 音訊信號音軌脈衝位置之編碼與解碼技術
TR201903388T4 (tr) 2011-02-14 2019-04-22 Fraunhofer Ges Forschung Bir ses sinyalinin parçalarının darbe konumlarının şifrelenmesi ve çözülmesi.
AR085895A1 (es) 2011-02-14 2013-11-06 Fraunhofer Ges Forschung Generacion de ruido en codecs de audio
TWI483245B (zh) * 2011-02-14 2015-05-01 Fraunhofer Ges Forschung 利用重疊變換之資訊信號表示技術
EP2676270B1 (en) * 2011-02-14 2017-02-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Coding a portion of an audio signal using a transient detection and a quality result
AU2012217215B2 (en) 2011-02-14 2015-05-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for error concealment in low-delay unified speech and audio coding (USAC)
RU2586838C2 (ru) 2011-02-14 2016-06-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Аудиокодек, использующий синтез шума в течение неактивной фазы
MY165853A (en) 2011-02-14 2018-05-18 Fraunhofer Ges Forschung Linear prediction based coding scheme using spectral domain noise shaping
EP3503098B1 (en) 2011-02-14 2023-08-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method decoding an audio signal using an aligned look-ahead portion
FR2977439A1 (fr) * 2011-06-28 2013-01-04 France Telecom Fenetres de ponderation en codage/decodage par transformee avec recouvrement, optimisees en retard.
US9286491B2 (en) 2012-06-07 2016-03-15 Amazon Technologies, Inc. Virtual service provider zones
US10075471B2 (en) 2012-06-07 2018-09-11 Amazon Technologies, Inc. Data loss prevention techniques
US9590959B2 (en) 2013-02-12 2017-03-07 Amazon Technologies, Inc. Data security service
US10084818B1 (en) 2012-06-07 2018-09-25 Amazon Technologies, Inc. Flexibly configurable data modification services
US9705674B2 (en) 2013-02-12 2017-07-11 Amazon Technologies, Inc. Federated key management
US10211977B1 (en) 2013-02-12 2019-02-19 Amazon Technologies, Inc. Secure management of information using a security module
US9608813B1 (en) 2013-06-13 2017-03-28 Amazon Technologies, Inc. Key rotation techniques
US9367697B1 (en) 2013-02-12 2016-06-14 Amazon Technologies, Inc. Data security with a security module
US9547771B2 (en) 2013-02-12 2017-01-17 Amazon Technologies, Inc. Policy enforcement with associated data
US9300464B1 (en) 2013-02-12 2016-03-29 Amazon Technologies, Inc. Probabilistic key rotation
US10210341B2 (en) * 2013-02-12 2019-02-19 Amazon Technologies, Inc. Delayed data access
US10467422B1 (en) 2013-02-12 2019-11-05 Amazon Technologies, Inc. Automatic key rotation
BR112015019543B1 (pt) 2013-02-20 2022-01-11 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Aparelho para codificar um sinal de áudio, descodificador para descodificar um sinal de áudio, método para codificar e método para descodificar um sinal de áudio
CN105556600B (zh) * 2013-08-23 2019-11-26 弗劳恩霍夫应用研究促进协会 用于混迭误差信号来处理音频信号的装置及方法
CN104681034A (zh) 2013-11-27 2015-06-03 杜比实验室特许公司 音频信号处理
US9397835B1 (en) 2014-05-21 2016-07-19 Amazon Technologies, Inc. Web of trust management in a distributed system
US9438421B1 (en) 2014-06-27 2016-09-06 Amazon Technologies, Inc. Supporting a fixed transaction rate with a variably-backed logical cryptographic key
US10116418B2 (en) 2014-08-08 2018-10-30 University Of Florida Research Foundation, Incorporated Joint fountain coding and network coding for loss-tolerant information spreading
US9866392B1 (en) 2014-09-15 2018-01-09 Amazon Technologies, Inc. Distributed system web of trust provisioning
KR101626280B1 (ko) * 2014-11-05 2016-06-01 주식회사 디오텍 합성음의 고조파 성분 제거 방법 및 장치
US10469477B2 (en) 2015-03-31 2019-11-05 Amazon Technologies, Inc. Key export techniques
CN108028876B (zh) * 2015-09-25 2019-07-23 美高森美半导体(美国)股份有限公司 声学回音路径改变检测装置和方法
WO2017050398A1 (en) * 2015-09-25 2017-03-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for signal-adaptive switching of the overlap ratio in audio transform coding
US10230388B2 (en) * 2015-12-30 2019-03-12 Northwestern University System and method for energy efficient time domain signal processing
WO2017161124A1 (en) * 2016-03-16 2017-09-21 University Of Florida Research Foundation, Incorporated System for video streaming using delay-aware fountain codes
WO2017161122A1 (en) * 2016-03-16 2017-09-21 University Of Florida Research Foundation, Incorporated System for live video streaming using delay-aware fountain codes
EP3276620A1 (en) * 2016-07-29 2018-01-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Time domain aliasing reduction for non-uniform filterbanks which use spectral analysis followed by partial synthesis
WO2018198454A1 (ja) * 2017-04-28 2018-11-01 ソニー株式会社 情報処理装置、および情報処理方法
US11467831B2 (en) * 2018-12-18 2022-10-11 Northwestern University System and method for pipelined time-domain computing using time-domain flip-flops and its application in time-series analysis

Family Cites Families (92)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5109417A (en) * 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
DE69026278T3 (de) * 1989-01-27 2002-08-08 Dolby Lab Licensing Corp Adaptiv Bitzuordnung für Audio-Koder und Dekoder
US5230038A (en) * 1989-01-27 1993-07-20 Fielder Louis D Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
DE3902948A1 (de) 1989-02-01 1990-08-09 Telefunken Fernseh & Rundfunk Verfahren zur uebertragung eines signals
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
US5327518A (en) * 1991-08-22 1994-07-05 Georgia Tech Research Corporation Audio analysis/synthesis system
SG45281A1 (en) 1992-06-26 1998-01-16 Discovision Ass Method and arrangement for transformation of signals from a frequency to a time domain
US5570455A (en) 1993-01-19 1996-10-29 Philosophers' Stone Llc Method and apparatus for encoding sequences of data
WO1995002288A1 (en) 1993-07-07 1995-01-19 Picturetel Corporation Reduction of background noise for speech enhancement
US5651090A (en) 1994-05-06 1997-07-22 Nippon Telegraph And Telephone Corporation Coding method and coder for coding input signals of plural channels using vector quantization, and decoding method and decoder therefor
US5615299A (en) 1994-06-20 1997-03-25 International Business Machines Corporation Speech recognition using dynamic features
TW271524B (es) 1994-08-05 1996-03-01 Qualcomm Inc
DE69515907T2 (de) 1994-12-20 2000-08-17 Dolby Lab Licensing Corp Verfahren und gerät zum anwenden von wellenformprädiktion auf teilbänder in einem perzeptiven kodiersystem
JP3158932B2 (ja) * 1995-01-27 2001-04-23 日本ビクター株式会社 信号符号化装置及び信号復号化装置
US5669484A (en) * 1996-01-24 1997-09-23 Paulson; Tom J. Protective cover for the mini-slide knob of dimmers with mini-slide knobs
US5809459A (en) 1996-05-21 1998-09-15 Motorola, Inc. Method and apparatus for speech excitation waveform coding using multiple error waveforms
US6134518A (en) * 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
KR100261253B1 (ko) 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치
US6064954A (en) 1997-04-03 2000-05-16 International Business Machines Corp. Digital audio signal coding
WO1999010719A1 (en) 1997-08-29 1999-03-04 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps
US6006179A (en) * 1997-10-28 1999-12-21 America Online, Inc. Audio codec using adaptive sparse vector quantization with subband vector classification
RU2214047C2 (ru) * 1997-11-19 2003-10-10 Самсунг Электроникс Ко., Лтд. Способ и устройство для масштабируемого кодирования/декодирования аудиосигналов
US6249766B1 (en) 1998-03-10 2001-06-19 Siemens Corporate Research, Inc. Real-time down-sampling system for digital audio waveform data
US6085163A (en) * 1998-03-13 2000-07-04 Todd; Craig Campbell Using time-aligned blocks of encoded audio in video/audio applications to facilitate audio switching
US6119080A (en) * 1998-06-17 2000-09-12 Formosoft International Inc. Unified recursive decomposition architecture for cosine modulated filter banks
US7272556B1 (en) * 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
US6188987B1 (en) 1998-11-17 2001-02-13 Dolby Laboratories Licensing Corporation Providing auxiliary information with frame-based encoded audio information
US6311154B1 (en) * 1998-12-30 2001-10-30 Nokia Mobile Phones Limited Adaptive windows for analysis-by-synthesis CELP-type speech coding
US6226608B1 (en) * 1999-01-28 2001-05-01 Dolby Laboratories Licensing Corporation Data framing for adaptive-block-length coding system
US6640209B1 (en) * 1999-02-26 2003-10-28 Qualcomm Incorporated Closed-loop multimode mixed-domain linear prediction (MDLP) speech coder
US6449592B1 (en) 1999-02-26 2002-09-10 Qualcomm Incorporated Method and apparatus for tracking the phase of a quasi-periodic signal
US7020285B1 (en) * 1999-07-13 2006-03-28 Microsoft Corporation Stealthy audio watermarking
US6604070B1 (en) 1999-09-22 2003-08-05 Conexant Systems, Inc. System of encoding and decoding speech signals
CA2310769C (en) * 1999-10-27 2013-05-28 Nielsen Media Research, Inc. Audio signature extraction and correlation
US6868377B1 (en) * 1999-11-23 2005-03-15 Creative Technology Ltd. Multiband phase-vocoder for the modification of audio or speech signals
FR2802329B1 (fr) 1999-12-08 2003-03-28 France Telecom Procede de traitement d'au moins un flux binaire audio code organise sous la forme de trames
JP3630609B2 (ja) 2000-03-29 2005-03-16 パイオニア株式会社 音声情報再生方法ならびに装置
US20020049586A1 (en) 2000-09-11 2002-04-25 Kousuke Nishio Audio encoder, audio decoder, and broadcasting system
US7010480B2 (en) 2000-09-15 2006-03-07 Mindspeed Technologies, Inc. Controlling a weighting filter based on the spectral content of a speech signal
US7020605B2 (en) * 2000-09-15 2006-03-28 Mindspeed Technologies, Inc. Speech coding system with time-domain noise attenuation
US7472059B2 (en) * 2000-12-08 2008-12-30 Qualcomm Incorporated Method and apparatus for robust speech classification
US6738739B2 (en) 2001-02-15 2004-05-18 Mindspeed Technologies, Inc. Voiced speech preprocessing employing waveform interpolation or a harmonic model
US7283954B2 (en) 2001-04-13 2007-10-16 Dolby Laboratories Licensing Corporation Comparing audio using characterizations based on auditory events
US6658383B2 (en) * 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals
US7333929B1 (en) * 2001-09-13 2008-02-19 Chmounk Dmitri V Modular scalable compressed audio data stream
JP3750583B2 (ja) 2001-10-22 2006-03-01 ソニー株式会社 信号処理方法及び装置、並びに信号処理プログラム
AU2003213439A1 (en) 2002-03-08 2003-09-22 Nippon Telegraph And Telephone Corporation Digital signal encoding method, decoding method, encoding device, decoding device, digital signal encoding program, and decoding program
US7366659B2 (en) 2002-06-07 2008-04-29 Lucent Technologies Inc. Methods and devices for selectively generating time-scaled sound signals
JP4022111B2 (ja) 2002-08-23 2007-12-12 株式会社エヌ・ティ・ティ・ドコモ 信号符号化装置及び信号符号化方法
US7295970B1 (en) 2002-08-29 2007-11-13 At&T Corp Unsupervised speaker segmentation of multi-speaker speech data
US7424434B2 (en) * 2002-09-04 2008-09-09 Microsoft Corporation Unified lossy and lossless audio compression
JP4676140B2 (ja) 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
JP3870880B2 (ja) 2002-09-04 2007-01-24 住友電装株式会社 導線と圧接端子との接続構造
JP2006503319A (ja) * 2002-10-14 2006-01-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 信号フィルタリング
AU2003295178A1 (en) 2002-12-19 2004-07-14 Koninklijke Philips Electronics N.V. Sinusoid selection in audio encoding
US7876966B2 (en) * 2003-03-11 2011-01-25 Spyder Navigations L.L.C. Switching between coding schemes
JP2004302259A (ja) 2003-03-31 2004-10-28 Matsushita Electric Ind Co Ltd 音響信号の階層符号化方法および階層復号化方法
KR101169596B1 (ko) 2003-04-17 2012-07-30 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 신호 합성
US7325023B2 (en) * 2003-09-29 2008-01-29 Sony Corporation Method of making a window type decision based on MDCT data in audio encoding
KR101106026B1 (ko) * 2003-10-30 2012-01-17 돌비 인터네셔널 에이비 오디오 신호 인코딩 또는 디코딩
WO2005055201A1 (en) 2003-12-01 2005-06-16 Aic A highly optimized method for modelling a windowed signal
FR2865310A1 (fr) 2004-01-20 2005-07-22 France Telecom Procede de restauration de partiels d'un signal sonore
US7516064B2 (en) * 2004-02-19 2009-04-07 Dolby Laboratories Licensing Corporation Adaptive hybrid transform for signal analysis and synthesis
US7596486B2 (en) * 2004-05-19 2009-09-29 Nokia Corporation Encoding an audio signal using different audio coder modes
US7649988B2 (en) * 2004-06-15 2010-01-19 Acoustic Technologies, Inc. Comfort noise generator using modified Doblinger noise estimate
KR100608062B1 (ko) 2004-08-04 2006-08-02 삼성전자주식회사 오디오 데이터의 고주파수 복원 방법 및 그 장치
WO2006046546A1 (ja) 2004-10-26 2006-05-04 Matsushita Electric Industrial Co., Ltd. 音声符号化装置および音声符号化方法
GB2420846B (en) * 2004-12-04 2009-07-08 Ford Global Technologies Llc A cooling system for a motor vehicle engine
US20070147518A1 (en) * 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
WO2006103586A1 (en) * 2005-03-30 2006-10-05 Koninklijke Philips Electronics N.V. Audio encoding and decoding
US7418394B2 (en) 2005-04-28 2008-08-26 Dolby Laboratories Licensing Corporation Method and system for operating audio encoders utilizing data from overlapping audio segments
US7571104B2 (en) 2005-05-26 2009-08-04 Qnx Software Systems (Wavemakers), Inc. Dynamic real-time cross-fading of voice prompts
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7546240B2 (en) 2005-07-15 2009-06-09 Microsoft Corporation Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition
KR100643310B1 (ko) 2005-08-24 2006-11-10 삼성전자주식회사 음성 데이터의 포먼트와 유사한 교란 신호를 출력하여송화자 음성을 차폐하는 방법 및 장치
US7953605B2 (en) 2005-10-07 2011-05-31 Deepen Sinha Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension
KR100647336B1 (ko) 2005-11-08 2006-11-23 삼성전자주식회사 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법
CN1963917A (zh) 2005-11-11 2007-05-16 株式会社东芝 评价语音的分辨力、说话人认证的注册和验证方法及装置
US7805297B2 (en) * 2005-11-23 2010-09-28 Broadcom Corporation Classification-based frame loss concealment for audio signals
EP1855436A1 (en) 2006-05-12 2007-11-14 Deutsche Thomson-Brandt Gmbh Method and apparatus for encrypting encoded audio signal
US8010352B2 (en) 2006-06-21 2011-08-30 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
US8036903B2 (en) 2006-10-18 2011-10-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system
DE102006051673A1 (de) 2006-11-02 2008-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale
KR101434198B1 (ko) * 2006-11-17 2014-08-26 삼성전자주식회사 신호 복호화 방법
KR100964402B1 (ko) 2006-12-14 2010-06-17 삼성전자주식회사 오디오 신호의 부호화 모드 결정 방법 및 장치와 이를 이용한 오디오 신호의 부호화/복호화 방법 및 장치
KR101334366B1 (ko) 2006-12-28 2013-11-29 삼성전자주식회사 오디오 배속 재생 방법 및 장치
KR100883656B1 (ko) 2006-12-28 2009-02-18 삼성전자주식회사 오디오 신호의 분류 방법 및 장치와 이를 이용한 오디오신호의 부호화/복호화 방법 및 장치
KR101403340B1 (ko) 2007-08-02 2014-06-09 삼성전자주식회사 변환 부호화 방법 및 장치
US8050934B2 (en) 2007-11-29 2011-11-01 Texas Instruments Incorporated Local pitch control based on seamless time scale modification and synchronized sampling rate conversion
KR101441896B1 (ko) 2008-01-29 2014-09-23 삼성전자주식회사 적응적 lpc 계수 보간을 이용한 오디오 신호의 부호화,복호화 방법 및 장치
US8364481B2 (en) 2008-07-02 2013-01-29 Google Inc. Speech recognition with parallel recognition tasks
EP2631906A1 (en) 2012-02-27 2013-08-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Phase coherence control for harmonic signals in perceptual audio codecs

Also Published As

Publication number Publication date
US20170249952A1 (en) 2017-08-31
US9355647B2 (en) 2016-05-31
US10714110B2 (en) 2020-07-14
WO2008071353A2 (en) 2008-06-19
US8818796B2 (en) 2014-08-26
US9043202B2 (en) 2015-05-26
BRPI0718738A8 (pt) 2018-10-16
ZA200903159B (en) 2010-07-28
US20230154475A1 (en) 2023-05-18
US11961530B2 (en) 2024-04-16
EP2052548B1 (en) 2012-02-29
TWI363563B (en) 2012-05-01
IL198725A (en) 2016-03-31
CN101589623A (zh) 2009-11-25
IL198725A0 (en) 2010-02-17
BRPI0718738A2 (pt) 2015-03-24
KR20090085655A (ko) 2009-08-07
NO342080B1 (no) 2018-03-19
CN102395033A (zh) 2012-03-28
NO20092506L (no) 2009-09-10
BR122019024992B1 (pt) 2021-04-06
TW200841743A (en) 2008-10-16
EP2052548A2 (en) 2009-04-29
HK1126602A1 (en) 2009-09-04
CA2672165A1 (en) 2008-06-19
US20200335117A1 (en) 2020-10-22
MY148913A (en) 2013-06-14
US9653089B2 (en) 2017-05-16
US8812305B2 (en) 2014-08-19
US20150179183A1 (en) 2015-06-25
CN101589623B (zh) 2013-03-13
CN102395033B (zh) 2014-08-27
US20140222442A1 (en) 2014-08-07
RU2444071C2 (ru) 2012-02-27
BRPI0718738B1 (pt) 2023-05-16
US20160225383A1 (en) 2016-08-04
KR101016224B1 (ko) 2011-02-25
ATE547898T1 (de) 2012-03-15
US20130282389A1 (en) 2013-10-24
WO2008071353A3 (en) 2008-08-21
AU2007331763B2 (en) 2011-06-30
CA2672165C (en) 2014-07-29
MX2009006201A (es) 2009-06-22
JP2010512550A (ja) 2010-04-22
RU2009117569A (ru) 2011-01-20
US20100138218A1 (en) 2010-06-03
HK1168706A1 (en) 2013-01-04
AU2007331763A1 (en) 2008-06-19
PL2052548T3 (pl) 2012-08-31
US11581001B2 (en) 2023-02-14
JP5171842B2 (ja) 2013-03-27

Similar Documents

Publication Publication Date Title
ES2383217T3 (es) Codificador, descodificador y métodos para codificar y descodificar segmentos de datos que representan una corriente de datos de dominio de tiempo
US11238874B2 (en) Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
KR101227729B1 (ko) 샘플 오디오 신호의 프레임을 인코딩하기 위한 오디오 인코더 및 디코더
RU2459282C2 (ru) Масштабируемое кодирование речи и аудио с использованием комбинаторного кодирования mdct-спектра
US20060173675A1 (en) Switching between coding schemes