MX2013009304A - Aparato y metodo para codificar una porcion de una señal de audio utilizando deteccion de un transiente y resultado de calidad. - Google Patents

Aparato y metodo para codificar una porcion de una señal de audio utilizando deteccion de un transiente y resultado de calidad.

Info

Publication number
MX2013009304A
MX2013009304A MX2013009304A MX2013009304A MX2013009304A MX 2013009304 A MX2013009304 A MX 2013009304A MX 2013009304 A MX2013009304 A MX 2013009304A MX 2013009304 A MX2013009304 A MX 2013009304A MX 2013009304 A MX2013009304 A MX 2013009304A
Authority
MX
Mexico
Prior art keywords
audio signal
coding algorithm
coding
transient
result
Prior art date
Application number
MX2013009304A
Other languages
English (en)
Inventor
Guillaume Fuchs
Christian Helmrich
Goran Markovic
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of MX2013009304A publication Critical patent/MX2013009304A/es

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/16Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • G10L19/107Sparse pulse excitation, e.g. by using algebraic codebook
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/13Residual excited linear prediction [RELP]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/69Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Un aparato para codificar una porción de señal de audio (10) para obtener una señal de audio codificada (26) para la porción de señal de audio que comprende un detector de transiente (12) para detectar si una señal de transiente se encuentra en la porción de señal de audio para obtener una detección del resultado de transiente (14), una etapa del codificador (16) para aplicar un primer algoritmo de codificación en la señal de audio, el primer algoritmo de codificación posee una primera característica, y para aplicar un segundo algoritmo de codificación en la señal de audio, el segundo algoritmo de codificación posee una segunda característica diferente a la primera característica, un procesador (18) para determinar que algoritmo de codificación da por resultado una señal de audio codificada con mejor aproximación a la porción de señal de audio con respecto al otro algoritmo de codificación para obtener un resultado de calidad (20), y un controlador (22) para determinar si la señal de audio codificada para la porción de señal de audio debe ser generada por el primer algoritmo de codificación o segundo algoritmo de codificación basado en la detección del resultado de transiente (14) y resultado de calidad (20).

Description

APARATO Y MÉTODO PARA CODIFICAR UNA PORCIÓN DE UNA SEÑAL DE AUDIO UTILIZANDO DETECCIÓN DE UN TRANSIENTE Y RESULTADO DE CALIDAD Memoria Descriptiva La presente invención se relaciona con la codificación de audio y, particularmente, con la codificación de audio conmutada, donde, para diferentes porciones de tiempo, la señal codificada se genera utilizando diferentes algoritmos de codificación.
Se conocen codificadores de audio conmutados que determinan diferentes algoritmos de codificación para diferentes porciones de la señal de audio. jUn ejemplo es el denominado codificador de banda ancha de múltiple velocidad i extendido adaptativo o codificador AMR-WB+ (por su sigla en inglés) definido en la Norma Internacional 3GPP TS 26.290 V6.1.0 2004-12. En esta especificación técnica, se describe el concepto de codificación, que se extiende a un codificador AMR-WB con base ACELP (sigla en inglés para Predicción Lineal de Código Algebraico) agregando TCX (sigla en inglés para Excitación Codificada Transformada), extensión de banda ancha, y estéreo. Los procesos del codificador de audio AMR-WB+ ingresan cuadros igual a 2048 muestras a una frecuencia de muestreo interna Fs. La frecuencia de muestreo interna se limita al rango de 12.800 a 38.400 Hz. Los 2048 cuadros de muestra se dividen en dos bandas de frecuencia iguales críticamente muestreadas. Se obtienen así dos supercuadros de 1024 muestras correspondientes a bandas de baja frecuencia (BF) y alta frecuencia (AF). Cada supercuadro se divide en cuatro cuadros de muestras 256. El muestreo en la velocidad de muestreo interna se obtiene utilizando un esquema de conversión de muestreo variable que re-muestrea la señal de entrada. Las señales de BF y AF se codifican utilizando dos diferentes métodos. La señal BF se codifica y decodifica utilizando el codificador/decodificador "núcleo", basado en el modo ACELP y TCX conmutado. En el modo ACELP, se utiliza el codificador AMR-WB estándar. La señal AF se codifica con relativamente pocos bits (16 bits/cuadro) utilizando el método de extensión de ancho de banda (BWE, por su sigla en inglés).
Los parámetros transmitidos desde el codificador al decodificador son bits seleccionados por modo, parámetros BF y parámetros de señal AF. Los parámetros para cada supercuadro de 1024 muestra se descomponen en cuatro paquetes de idéntico tamaño. Cuando la señal de entrada es estéreo, los canales izquierdo y derecho se combinan en mono-señales para la codificación ACELP-TCX, mientras que la codificación estéreo recibe ambos canales de entrada. En la estructura del decodificador AMR-WB+, las bandas BF y AF se decódifican por separado. Luego las bandas se combinan en un banco de filtro de síntesis. Si la salida se restringe a mono solamente, los parámetros estéreo se omiten y el decodificador opera en modo mono.
El codificador AMR-WB+ aplica análisis LP (sigla en inglés para Predicción Lineal) para los modos ACELP y TCX, al codificar la señal BF. Los coeficientes LP se interpolan en forma lineal en cada sub-cuadro de 64 muestras, la ventana de análisis LP es un medio coseno de longitud de 384 muestras. El modo de codificación se selecciona basado en un método de bucle cerrado de análisis-p r-síntesis. Sólo se consideran cuadros de 256 muestras para los cuadros ACELP, mientras que los cuadros de 256, 512 o 1024 muestras son posibles en el mqdo TCX. La codificación ACELP consiste en análisis y síntesis de predicción a largo plazo (LTP, por su sigla en inglés) y excitación de libro de códigos algebraica. ¡En el modo TCX, se procesa una señal perceptualmente ponderada en el dominio jde transformada. La señal ponderada por transformada de Fourier se cuantiza utilizando cuantización de cuadrícula dividida de múltiple ponderación (cuantización de vector algebraico). La transformada se calcula en 1024, 512 o 256 ventanas de muestreo. La señal de excitación se recupera por filtrado inverso de una señal ponderada cuantizada por filtro de ponderación inverso. Para determinar si una cierta porción de la señal de audio debe ser codificada utilizando el modo ACELP o modo TCX, se utiliza una selección de bucle cerrado o bucle abierto. En la selección de modo de bucle cerrado, se utilizan 11 pruebas sucesivas. Luego de una prueba, se realiza la selección de modo entre dos modos a comparar. El criterio de selección es la SNR segmental promedio (sigla en inglés para Relación Ruido-Señal) entre la señal de audio ponderada y la señal de audio ponderada sintetizada. Por lo tanto, el codificador realiza una complete codificación en ambos algoritmos de codificación, una completa decodificacióri de acuerdo con ambos algoritmos de codificación y, subsecuentemente, j los resultados de ambas operaciones codificación/decodificación se comparan có la señal original. Por lo tanto, para cada algoritmo de codificación, es decir ACELP por un lado y TCX por el otro, se obtiene un valor de la SNR segmental y se usa el algoritmo de codificación con mejor valor de la SNR segmental o mejor valor dej la SNR segmental promedio determinado sobre un cuadro promediando sobre l¡os valores de la SNR segmental para el sub-cuadro individual. 1 Otro esquema de codificación de audio conmutada es el denominado codificador USAC (USAC = Codificación de audio de Voz Unificada). Este i algoritmo de codificación se describe en ISO/IEC 23003-3. La estructura general se describe de la siguiente manera. Primero, existe un sistema de pre/póst procesamiento común de una unidad funcional de Envolvente MPEG para manejar un procesamiento estéreo o multi-canal y una unidad mejorada SBR que genera la representación paramétrica de las frecuencias de audio mayores de la señal de entrada. Luego, existen dos ramificaciones, una formada por una trayectoria j de herramienta de codificación de audio avanzada modificada (AAC, por su sigla! en inglés) y la otra formada por una trayectoria basada en la codificación I de predicción lineal (dominio LP o LPC), que a la vez presentan una representación í en dominio de frecuencia o representación en dominio de tiempo del LPC residual. Los espectros transmitidos para ambas, AAC y LPC, se representan en el domjnio MDCT que sigue al esquema de cuantización y codificación aritmética. La representación en dominio de tiempo usa un esquema de codificación ¡por excitación ACELP. Las funciones del decodificador consisten en encontrar la descripción del espectro de audio cuantizado o representación en dominiól de tiempo en la carga útil de secuencia de bits y decodificar los valores cuantizados y i demás información de reconstrucción. Por lo tanto, el codificador toma Idos decisiones. La primera decisión es realizar una clasificación de señal para el dominio de frecuencia versus decisión de modo de dominio de predicción lineal. La segunda decisión es determinar, dentro del dominio de predicción lineal (LPD), si una porción de señal debe ser codificada utilizando ACELP o TCX.
Para aplicar un esquema de codificación de audio conmutada en escenarios, donde se necesita bajo retardo, debe prestarse particular atención a las partes de codificación basadas en la transformada, ya que estas partes ;de codificación introducen un cierto retado que depende de la longitud de transformada y diseño de ventana. Por lo tanto, el concepto de codificación USAC no es adecuado para aplicaciones con bajo retardo debido a la ramificación 1 de codificación de AAC modificada con una longitud de transformada considerable y adaptación de longitud (conocida también como conmutación por bloqueo) que incluye ventanas transicionales.
Por otro lado, el concepto de codificación AMR-WB+ resultó problemático debido a que debe usarse la decisión del lado del codificador ACELP o TCX. ACELP provee una buena ganancia de codificación, pero puede resultar, en problemas de calidad de audio significantes cuando una porción de señal no es adecuada para el modo de codificación ACELP. Por ende, para razones de calidad, uno podrá inclinarse a usar TCX toda vez que la señal de entrada no contiene voz. Sin embargo, utilizando TCX en gran medida a baja tasa de bits traerá problemas de tasa de bits, ya que TCX provee una ganancia de codificación relativamente baja. Cuando por lo tanto se focaliza más en la ganancia de codificación, se podría usar ACELP toda vez posible, pro como ya se estableció antes, podría haber problemas de calidad de audio porque ACELP no es óptima, por ejemplo, para música y señales estacionarias similares.
El cálculo de la SNR segmental es una medición de calidad, que determina el mejor modo de codificación sólo basado en el resultado, es decir, si SNR entre la señal original o la señal codificada/decodificada es mejor, para utilizar el algoritmo de codificación que resulta en una mejor SNR. Sin embargo esto funciona siempre bajo restricciones en la tasa de bits. Por lo tanto, se descubrió que al utilizar solo una medición de calidad como, por ejemplo, la SNR segmental no siempre se obtiene el mejor compromiso entre calidad y tasa de bits.
El objetivo de la presente invención consiste en proveer un mejor concepto para la codificación de una porción de señal de audio.
Este objetivo se logra con un aparato para codificar una porción de señal de audio de acuerdo con la reivindicación 1 o un método para codificar una porción de señal de audio de acuerdo con la reivindicación 14.
La presente invención se basa en el principio que se puede obtener una mejor decisión entre un primer algoritmo de codificación adecuado para rhás porciones de señales transientes y un segundo algoritmo de codificación adecuado para más porciones de señales estacionarias adecuadas cuando la decisión no se basa sólo en una medición de calidad sino además, en un resultado de detección de transiente. Si bien la medición de calidad solo focaliza en el resultado de la cadena de codificación/decodificación con respecto a la señal original, el resultado de detección de transiente además recae en un análisis de la señal de audio de entrada original sola. Por lo tanto, se descubrió que una combinación de ambas mediciones, es decir, el resultado de calidad por un lado y el resultado de la detección de transiente por el otro para finalmente determinar si una porción de señal de audio debe ser codificada por la cual el algoritmo 'de codificación conduce a un mejor compromiso entre la ganancia de codificación por un lado y calidad de audio por el otro.
Un aparato para la codificación de una porción de señal de audio para obtener una señal de audio codificada para la porción de señal de audio comprende un detector de transiente para detectar si una señal de transíante se encuentra en la porción de señal de audio para obtener un resultado de detección de transiente. El aparato además comprende una etapa de codificador para realizar un primer algoritmo de codificación en la señal de audio, el primer algoritmo de codificación posee una primera característica, y para realizar! un segundo algoritmo de codificación en la señal de audio, el segundo algoritmo de codificación posee una segunda característica diferente a la primera característica. En una realización, la primera característica asociada con el primer algoritmo1 de codificación es más adecuada para una señal más transiente, y la segunda característica de codificación asociada con el segundo algoritmo de codificación es más adecuada para señales de audio más estacionarias. Por ejemplo, el primer algoritmo de codificación es un algoritmo de codificación ACELP y el segundo algoritmo de codificación es un algoritmo de codificación TCX que se basa en una transformada de coseno discreto modificada, una transformada FFT o cualquier transformada o banco de filtro. Además, un procesador determina, que algoritmo de codificación resulta en una señal de audio codificada mejor en aproximación a la porción de señal de audio para obtener un resultado de calidad. Además, se provee un controlador donde el controlador se configura para determinar si la señal de audio codificada para la porción de señal de audio la genera el primer algoritmo de codificación o el segundo algoritmo de codificación. De acuerdo con la invención, el controlador se configura para desarrollar esta determinación no sólo basada en el resultado de calidad sino además en la detección del resultado de transiente.
En una realización, el controlador se configura para determinar el segundo algoritmo de codificación, aunque el resultado de calidad indica una mejor calidad para el primer algoritmo de codificación, cuando el resultado de la detección de transiente indica una señal sin transiente. Además, el controlador se configura para determinar el primer algoritmo de codificación, aunque el resultado de calidad indica una mejor calidad para el segundo algoritmo de codificación, cuando el resultado de la detección de transiente indica una señal de transiente.
En otra realización, esta determinación, donde el resultado de transiente podrá negar el resultado de calidad, se mejora utilizando una función de histérésis i de modo que el segundo algoritmo de codificación sólo se determina cuando una cantidad de porciones de señal anteriores, para las cuales se ha determinado el primer algoritmo de codificación, es menor al número predeterminado. En forma análoga, el controlador se configura sólo para determinar el primer algoritmo de codificación cuando un número de porciones de señal anteriores, para las cuáles I se determinó el segundo algoritmo de codificación en el pasado, es menor al número predeterminado. Una ventaja del proceso de histérésis es que el número de cambios entre los modos de codificación se reduce para ciertas señales ¡de i entrada. Un cambio muy frecuente en puntos críticos en la señal podrá generar artefactos auditivos específicamente para baja tasa de bits. La probabilidad |de dichos artefactos se reduce al implementar la histéresis.
I En otra realización, el resultado de calidad es favorecido con respecto a la detección del resultado de transiente cuando el resultado de calidad indica una fuerte ventaja de calidad para un algoritmo de codificación. Luego, el algoritmo de codificación con mejor resultado de calidad que selecciona irrespectivamente de si la señal es otro lado, el resultado de la detección de transiente puede ser decisivo cuando la diferencia de calidad entre ambos algoritmos de codificación no es alta. Paral tal fin, se prefiere no sólo determinar un resultado de calidad binario, sino I un resultado de calidad cuantitativo. Un resultado de calidad binario sólo indicará que algoritmo de codificación resulta de mejor calidad, mientras que un resultado' de calidad cuantitativo no sólo determina que algoritmo de codificación resulta' de mejor calidad, sino que tan mejor es el correspondiente algoritmo de codificac ón. Por otro lado, se podrá usar un resultado cuantitativo de detección de transiente pero básicamente, un resultado binario de detección de transiente será suficiente. i Por lo tanto, la presente invención provee una particular ventaja pon i respecto al buen compromiso entre tasa de bits por un lado y calidad por el otro ya que, para señales transientes, el algoritmo de codificación con menor calidad es el elegido. Cuando el resultado de calidad favorece ej. Una decisión TCX, ! sin embargo se toma el modo ACELP, que podrá arrojar una calidad de aijjdio i ? I I levemente reducida pero al final, resulta con una mayor ganancia de codificación asociada utilizando el modo ACELP. ¡ se la au en señal codificada y decodificada nuevamente sino además la señal de entrada' a ¡ codificar en realidad se analiza con respecto a su característica de transiente yiel resultado del análisis de transiente se usa para influir en la decisión dé un i algoritmo adecuado para señales transientes o algoritmo adecuado para señales I estacionarias. ; Otras realizaciones de la presente invención se ilustran subsecuentemente i con referencia a los dibujos adjuntos, donde: ¦! La Fig. 1 ilustra un diagrama de bloque de un aparato para codificar porción de señal de audio de acuerdo con una realización; La Fig. 2 ilustra una tabla para dos diferentes algoritmos de codificación y ¡las • i señales para las cuales son adecuadas; La Fig. 3 ¡lustra una visión general de la condición de calidad, condición! de transiente y condición de histéresis, que podrán aplicarse en forma ' I independiente entre sí, pero que se aplican preferentemente! en forma conjunta; La Fig. 4 ¡lustra una tabla de estado que indica si se realiza un cambio o rio para diferentes situaciones; | La Fig. 5 ilustra un diagrama de flujo para determinar el resultado del transiente en una realización; La Fig. 6a ilustra un diagrama de flujo para determinar el resultado de calidad en una realización; La Fig. 6b ilustra más detalles en el resultado de calidad de la Fig. 6a; y La Fig. 7 ilustra un diagrama en bloque más detallado de un aparato de codificación de acuerdo con una realización.
La Fig. 1 ilustra un aparato para codificar una porción de señal de audio en una línea de entrada 10. La porción de señal de audio ingresa en un detector de transiente 12 para detectar si una señal de transiente se encuentra en la porción de señal de audio para obtener un resultado de detección de transiente en la líriea 14. Además, se provee una etapa del codificador 16 donde la etapa del codificador se configura para desarrollar un primer algoritmo de codificación en la señal de audio, el primer algoritmo de codificación posee una primera característica. Además, la etapa del codificador 16 se configura para desarrollar un segundo algoritmo de codificación en la señal de audio, donde el segundo algoritmo de codificación posee una segunda característica diferente a la primera característica.
Además, el aparato comprende un procesador 18 para determinar que algoritmo de codificación del primer y segundo algoritmo de codificación da por resultado una señal de audio codificada con mejor aproximación a la porción de la señal de audio original. El procesador 18 genera un resultado de calidad basado en la determinación en la línea 20. El resultado de calidad en la línea 20 yí la detección del resultado de transiente en la línea 14 ambos se proveen a ¡un controlador 22. El controlador 22 se configura para determinar si la señal de auclio codificada para la porción de señal de audio se genera por el primer algoritmo 'de codificación o segundo algoritmo de codificación. Para esta determinación, se utiliza no sólo el resultado de calidad 20, sino la detección del resultado de transiente 14. Además, una interfaz de salida 24 se provee en forma opcional donde la interfaz de salida emite una señal de audio codificada como, por ejemplo, una secuencia de bits o diferentes representaciones de una seña codificada en la línea 26.
En una implementación, donde la etapa del codificador 16 realiza un análisis mediante el proceso de síntesis, la etapa del codificador 16 recibe la misma porción de señal de audio y codifica una porción de esta señal de audio !por el primer algoritmo de codificación para obtener la primera representación codificada de la porción de señal de audio. Además, la etapa del codificádor genera una representación codificada de la misma porción de señal de aúdio utilizando el segundo algoritmo de codificación. Además, la etapa del codificador 16 comprende, en este análisis por proceso de síntesis, decodificadores para ambos el primer algoritmo de codificación y el segundo algoritmo de codificación. Un correspondiente decodificador decodifica la primera representación codificad utilizando un algoritmo de decodificación asociado con el primer algoritmo! de codificación. Además, un decodificador para realizar otro algoritmo de decodificación asociado con el segundo algoritmo de codificación se provee para que al final la etapa del codificador no sólo posea las dos representaciones codificadas para la misma porción de señal de audio, sino ademas las dos señales decodificadas para la misma porción de señal de audio original en la línea 10.
Estas dos señales decodificadas se proveen al procesador por la línea 28 y el procesador compara ambas representaciones decodificadas con la misma porción de señal de audio original obtenida por la entrada 30. Luego, un la SNR segmental para cada algoritmo de codificación es determinado. Este así denominado resultado de calidad provee, en una realización, no sólo una indicación del mejor algoritmo de codificación, es decir, una señal binaria si el primer algoritmo 'de codificación o el segundo algoritmo de codificación obtuvieron una mejor SI\IR. Además, el resultado de calidad indica una información cuantitativa, es decir, cuanto mejor, por ejemplo en dB, es el correspondiente algoritmo de codificación.
En esta situación, el controlador, cuando depende totalmente del resultado de calidad 20, acede a la etapa del codificador por la línea 32 para que la etapa del codificador dirija la ya almacenada representación codificad del correspondiente algoritmo de codificación a la interfaz de entrada 24 para que ésta representación codificada represente la correspondiente porción de señal de aúdio original en la señal de audio codificada.
Alternativamente, cuando el procesador 18 realiza un modo de bucle abierto para determinar el resultado de calidad, no es necesario aplicar ambos algoritmos de codificación a la misma porción de señal de audio porción. En cambio, el procesador 18 determina que algoritmo de codificación es mejor y, luego, la etapa del codificador 16 se controla por la línea 28 no sólo para aplicar el algoritmo de codificación indicado por el procesador y, luego esta representación codificada del algoritmo de codificación seleccionado se provee a la ¡nterfaz de salida 24 porj la línea 34. ! i Dependiendo de la implementación específica de la etapa del codificador 16, ambos algoritmos de codificación podrán operar en dominio de LPC. En este caso, como para ACELP como primer algoritmo de codificación y TCX como segundo algoritmo de codificación, se realiza un pre-procesamiento LPC común. Este pre-procesamiento LPC podrá comprender un análisis LPC de la porción de señal de audio, que determina los coeficientes LPC para la porción de señal jde audio. Luego, un filtro de análisis LPC se ajusta utilizando los coeficientes LPC determinados, y la señal de audio original se filtra mediante este filtro de análisis LPC. Luego, la etapa del codificador calcula una diferencia de muestras entre la i emisión del filtro de análisis LPC y señal de entrada de audio para calcular la señal residual LPC que se somete a un primer algoritmo de codificación o segundo algoritmo de codificación en modo de bucle abierto o a ambos algoritmosj de codificación en modo de bucle cerrado como se describe antes. Alternátivaméhte, el filtrado con el filtro LPC y la determinación de muestras de la señal residual podrá reemplazarse por la tecnología FDNS (= forma de ruido en dominio! de frecuencia) que se describe en la norma USAC.
La Fig. 2 ilustra una implementación preferida de la etapa del codificador.
Como primer algoritmo de codificación, se usa el algoritmo de codificación con característica de codificación CELP. Además, este algoritmo de codificación es más adecuado para señales transientes. El segundo algoritmo de codificación posee una característica de codificación que hace que el segundo algoritmo de codificación sea más adecuado para señales sin transiente. Por ejemplo, se usa un algoritmo de codificación con excitación de transformada como TCX y, ¡en particular, se prefiere un algoritmo de codificación TCX 20 con longitud de cuaáro I de 20 ms (la longitud de ventana podrá ser mayor por una superposición) que i determina el concepto de codificación ilustrado en la Fig. 1 particularmente adecuado para implementaciones de bajo retardo adecuadas necesarias en escenarios donde existen dos vías de comunicación como en aplicaciones telefónicas y, en particular, en aplicaciones de telefonía móvil o celular. 1 Sin embargo, la presente invención es además útil en otras combinaciones del primer y segundo algoritmo de codificación. Por ejemplo, el primer algoritmo de codificación más adecuado para señales transientes podrá comprehjder codificadores en dominio de tiempo conocidos como los codificadores usados en GSM (G.729) u otros codificadores en dominio de tiempo. El algoritmo de codificación sin señal de transiente, por otro lado, podrá ser un codificador en dominio de transformada conocido como MP3, AAC, AC3 u otra transformadá o algoritmo de codificación de audio basado en banco de filtro. Para üna implementacíón de bajo retardo, sin embargo, se prefiere la combinación! de ACELP por un lado y TCX por otro lado, donde, particularmente, el codificsjdor TCX puede basarse en un FFT o más preferentemente en un MDCT con una , í corta longitud de ventana. Por lo tanto, ambos algoritmos de codificación opéran i en el dominio LPC que se obtiene al transformar la señal de audio en dominio ILPC utilizando un filtro de análisis LPC. Sin embargo, el ACELP opera en dominio de tiempo LPC, y el codificador TCX opera en dominio de frecuencia LPC.
Subsecuentemente, una implementación preferida del controlador 22 dé' la Fig. 1 se analiza en el contexto de la Fig. 3. 1 Preferentemente, el cambio entre el primer algoritmo de codificación como ACELP y segundo algoritmo de codificación como TCX 20 se realiza utilizando tres condiciones. La primera condición es la condición de calidad representada por el resultado de calidad 20 de la Fig. 1. La segunda condición es la condición de transiente representada por la detección del resultado de transiente en la línea 14 de la Fig. 1 . La tercera condición es la condición de histéresis que confía en las decisiones del controlador 22 en el pasado, es decir, para porciones anteriores1 de la señal de audio. j La condición de calidad se implementa de modo que un cambio al un algoritmo de codificación de mejor calidad se realiza cuando la condición! de calidad indica una gran distancia de calidad entre el primer algoritmo de codificación y segundo algoritmo de codificación. Cuando, por ejemplo, ] se determina que un algoritmo de codificación tiene mejor funcionamiento que el otro algoritmo de codificación, por ejemplo, por una diferencia dB SNR, la condición de calidad determina un cambio o, dicho de otro modo, el algoritmo de codificación utilizado en realidad para la porción de señal de audio considerada en realdad irrespectivamente de una detección de transiente o situación de histéresis. i Cuando, sin embargo, la condición de calidad sólo indica una pequeña distancia de calidad entre ambos algoritmos de codificación como la distancia de calidad de una o menos diferencias dB SNR, podrá darse un cambio enj el algoritmo de codificación de menor calidad, cuando la detección del resultado ¡de transiente indica que el algoritmo de codificación de menor calidad se ajusta a la característica de la señal de audio, es decir, si la señal de audio es transiente o no. Cuando, sin embargo, la detección del resultado de transiente indica que el algoritmo de codificación de menor calidad no se ajusta a la característica dé la señal de audio, debe usarse un algoritmo de codificación de mayor calidad. Erj» el último caso, nuevamente, la condición de calidad determina el resultado, pero sólo cuando una combinación específica entre el algoritmo de codificación de mehor calidad y el transiente/situación estacionaria de la señal de audio no se ajustan juntas.
La condición de histéresis es particularmente útil en una combinación con la condición de transiente, es decir, el cambio al algoritmo de codificación de baja calidad se realiza sólo cuando una cantidad menor a los últimos N cuadros ha sido codificada con el otro algoritmo. En realizaciones preferidas, N es igual a cinco cuadros, pero otros valores preferentemente menores o iguales a N cuadros o porciones de señales, cada uno comprende un mínimo número de muestras arriba, por ej. podrán usarse 128 muestras.
La Fig. 4 ¡lustra una tabla de estado de cambios dependiendo de ciertas situaciones. La columna izquierda indica la situación donde el número de cuadros anteriores es mayor a N o menor a N para cada TCX o ACELP.
La última línea indica si existe una gran distancia de calidad para TCX o gran distancia de calidad para ACELP. En estos dos casos, que se reflejan en las dos primeras columnas, "X", indica que se ha realizado un cambio y "0" indica que no se ha realizado un cambio.
Además, las dos últimas columnas indican la situación cuando se determina una distancia de menor calidad para TCX y cuando se detecta una señal ! de transiente o cuando se determina una distancia de menor calidad para ACELP y la porción de señal se detecta como no transiente.
Las dos primeras líneas de las últimas dos columnas ambas indican que el e resultado de calidad es decisivo cuando el número de cuadros anteriores; es mayor a 10. Por lo tanto, cuando existe una fuerte indicación del pasado para un algoritmo de codificación, la detección de transiente no juega un rol.
Cuando, sin embargo, el número de cuadros anteriores codificados en uno de los dos algoritmos de codificación es menor a N, se realiza un cambio de TCX a ACELP indicado en el campo 40 para señales transientes. Además, como se i indica en el campo 41 , se realiza un cambio de ACELP a TCX aún cuando existe I una distancia de menor calidad en favor de ACELP por el hecho de contar con una señal sin transiente. Cuando el número de los últimos cuadros LCLP es menor a N el cuadro subsecuente es codificado con ACELP y, por lo tanto, no se necesita un cambio como se indica en el cambio 42. Cuando, además, el número de cuadros TCX es menor a N y cuando existe una distancia de menor calidad ara ACELP y la es no transiente, el cuadro actual se codifica utilizando TCX y, no se necesita un cambio como lo indica el campo 43. Por lo tanto, la influencia de la histéresis es claramente visible al comparar los campos 42, 43 con los cuatro campos arriba de estos dos campos.
Por lo tanto, la presente invención preferentemente tiene influencia en( la histéresis para la decisión de bucle cerrado mediante la emisión de un detector de transiente. Por lo tanto, no existe, como en AMR-WB+, una decisión de cerrado pura si se toma TCX o ACELP. En cambio, el cálculo de bucle cerrado ¡se ve influenciado por la detección del resultado de transiente, es decir, cada porción de señal de transiente se determina en la señal de audio. La decisión sobre si! se calcula un cuadro ACELP o TCX, por lo tanto no sólo depende de los cálculos de bucle cerrado, o, generalmente, el resultado de calidad, pero además depende de si se detecta un transiente o no.
En otras palabras, la histéresis para determinar que algoritmo ( de codificación debe usarse para el cuadro actual puede expresarse de la siguiente manera: Cuando el resultado de calidad para TCX es apenas menor al resultado de i calidad para ACELP, y cuando las porciones de señal actualmente consideradas o sólo el cuadro actual no es transiente, se usa TCX en vez de ACELP.
Cuando, por otro lado, el resultado de calidad para ACELP es apenas menor al resultado de calidad para TCX, y cuando el cuadro es transiente, se usa ACELP y no TCX. Preferentemente, se calcula la medida de planicidad cómo detección del resultado de transiente, que es un número cuantitativo. Cuando la planicidad es mayor a o igual a cierto valor, el cuadro se determina cómo transiente. Cuando, por otro lado, la planicidad es menor a este valor umbral, se determina que el cuadro no es transiente. Como valor umbral, la medidá de i planicidad de dos es la preferida, donde el cálculo de planicidad se describe en la Fig. 5 con mayor detalle.
Además, se prefiere una medición cuantitativa en cuento al resultado de calidad. Cuando se utiliza una medición SNR o, particularmente, una medición 'de la SNR segmental, el término "levemente menor" como se utilizó antes, podrá significar un dB menor. Por lo tanto, cuando SNRs para TCX y ACELP son más diferentes entre sí de otro modo, cuando la diferencia absoluta entre ambos valores de SNR es mayor a un dB, la condición de calidad de la Fig. 3 sola j determina el algoritmo de codificación para la actual porción de señal de audio. ; La decisión que se describe antes podrá además ser elaborada, cuando la i detección de transiente o emisión de histéresis o SNR de TCX o ACELP de cuadros pasados o anteriores se incluye en la condición sí. Por lo tanto, ! se construye una histéresis que, para una realización, se ilustra en la Fig. 3 como condición n° 3. Particularmente, la Fig. 3 ¡lustra la alternativa cuando la emisiórí de histéresis, es decir, la determinación para el pasado se usa para modificar la condición de transiente.
Alternativamente, otra condición de histéresis basada en anteriores TCX o ACELP-SNRs podrá comprender que una determinación para el algoritmó de codificación de menor calidad sólo se realiza cuando un cambio dé diferehcia SNR con respecto al cuadro anterior es menor a, por ejemplo, un valor umbral. Otra realización podrá comprender el uso de la detección del resultado de transiente para uno o más cuadros anteriores cuando la detección del resultado de transiente es un número cuantitativo. Un cambio entonces en el algoritmo de I codificación de menor calidad podrá, por ejemplo, sólo ser realizado cuando un cambio de detección cuantitativa del resultado de transiente del cuadro anterior al cuadro actual es, nuevamente, menor al valor umbral. Otras combinaciones de estas figuras para modificar la condición de histéresis 3 de la Fig. 3 puerJen i resultar útiles para obtener un mejor compromiso entre la tasa de bits por un ládo i y la calidad de audio por otro lado. , Además, la condición de histéresis como se ilustra en el contexto de la f g. 3 y como se describe antes podrá usarse en vez de o además de otra histéresis i que, por ejemplo, se basa en datos de análisis internos de los algoritmos1 de i codificación ACELP y TCX.
Subsecuentemente, se hace referencia a la Fig. 5 para ilustrarj la determinación preferida de la detección del resultado de transiente en la línea 14 de la Fig. 1.
En el paso 50, la señal de audio en dominio de tiempo como señal! de entrada PCM en la línea 10 se somete a un filtro paso alto para obtener una señal de audio filtrada con filtro paso alto. En el paso 52, el cuadro de la señal sométida a filtro paso alto que podrá ser igual a la porción de señal de audio se sub-dij/ide en una pluralidad de, por ejemplo, ocho sub-bloques. En el paso 54, sé calcula un valor de energía para cada sub-bloque. Este cálculo de energía podrá comprender una cuadratura de cada valor de muestra en el sub-bloque y juna subsecuente adición de las muestras elevadas al cuadrado con o sin promedioj. En el paso 56, se forman pares de sub-bloques adyacentes. Los pares podrán comprender un primer par formado por el primer y segundo sub-bloquej un segundo par formado por el segundo y tercer sub-bloque, un tercer par formado por el tercer y cuarto sub-bloque, etc. Además, un par formado por el último slib-bloque del cuadro anterior y primer sub-bloque del cuadro actual podrá también utilizarse. Alternativamente, podrán realizarse otras formas de pares como por ejemplo, formar pares del primer y segundo sub-bloque, del tercer y cuarto sub-bloque, etc. Luego como se establece en el bloque 56 de la Fig. 5, se selecciona el valor con mayor energía de cada par de sub-bloques y, como se establece e† el paso 58, dividido por el valor con menor energía del par de sub-bloques. Luego como se establece en el bloque 60 de la Fig. 5, se combinan todos los resultados del paso 58 para un cuadro. Esta combinación podrá consistir de una adición de resultados del bloque 58 y promedios donde el resultado de la adición se divide por el número de pares como ocho, cuando ocho pares por sub-bloqüe han ¿ido determinados en el bloque 56. El resultado del bloque 60 es la medición j de podrán usarse otros valores umbrales entre 1 ,5 y 3, pero se demostró que el válor umbral de dos brinda el mejor resultado.
Debe observarse que podrán usarse otros detectores de transiente. ¡Las señales del tansiente podrán además comprender señales de yoz.
Tradicionalmente, las señales transientes aplausos o castañuelas o voces explosivas i por los caracteres "p" o "t" o similares. Sin embargo, las vocales "a", "e", "i", "o", j"u" no son señales transientes en el enfoque clásico, ya que se caracterizan por glotales periódicos o pulsos de tono. Sin embargo, como las vocales representan además señales de voz, las vocales se consideran también como señales transientes para la presente invención. La detección de esas señales podrá realizarse además de o en forma alternativa al procedimiento de la Fig. 5, mediante detectores de voz que distinguen discurso de voz del discurso sin voz o I al evaluar metadatos asociados con una señal de audio y al indicar, a un i evaluador de metadatos, si la correspondiente porción es una porción transiente o I no-transiente.
Subsecuentemente, la Fig. 6a se describe para ilustrar la tercera forma de calcular el resultado de calidad en la línea 20 de la Fig. 1 , es decir, como el procesador 18 es preferentemente configurado.
En el bloque 61 , se describe un procedimiento de bucle cerrado donde, para cada pluralidad de posibilidades, una porción se codifica y decodifica utilizando el primer y segundo algoritmo de codificación. En el paso 63, se calcula una medición como la SNR segmental dependiendo de la diferencia de la señal de audio codificada y nuevamente de codificada y la señal original. Esta medición se calcula para ambos algoritmos de codificación.
Luego se calcula un la SNR segmental promedio utilizando la $NR segmental individual en el paso 65, y este cálculo se realiza para arribos algoritmos de codificación para que, al final, el paso 65 de por resultado dos diferentes valores SNR promedio para la misma porción de señal de audio. La diferencia entre estos valores de SNR segméntales para un cuadro se usa como resultado de calidad cuantitativo en la línea 20 de la Fig. 1.
La Fig. 6b ilustra dos ecuaciones, donde la ecuación superior se usa eri el bloque 63, y donde la ecuación inferior de usa en el bloque 65. xw representa la señal de audio ponderada, y xw representa la señal ponderada codificada y nuevamente decodificada.
El promedio realizado en el bloque 65 es un promedio sobre un cuadro, donde cada cuadro consiste en un número de subcuadros NSF, y donde cuatro dichos cuadros juntos forman un supercuadro. Por lo tanto, un supercuadro comprende 1024 muestras, un cuadro individual comprende 2056 y cada subcuadro, para los cuales se realiza la ecuación superior en la Fig. 6b o paso 63, comprende 64 muestras. En la ecuación superior del bloque 63, n es! el índice de número de muestra y N es el máximo número de muestras eri el subcuadro igual a 63 indicando que un subcuadro posee 64 muestras.
La Fig. 7 ilustra otra realización del aparato de codificación de la invención, similar a la realización de la Fig. 1 , y los mismos números de referencia indican similares elementos. Sin embargo, la Fig. 7 ilustra una representación ijiás detallada de la etapa del codificador 16, que comprende un pre-procesador 6a para realizar una ponderación y un análisis/filtrado LPC, y el bloque del pre-procesador 16a provee datos LPC en la línea 70 a la interfaz de salida; 24. Además, la etapa del codificador 16 de la Fig. 1 comprende el primer algoritmó de codificación en 16b y el segundo algoritmo de codificación en 16c que sori el algoritmo de codificación ACELP y algoritmo de codificación TCjX, respectivamente.
I Además, la etapa del codificador 16 podrá comprender un conmutador 16d conectado antes de los bloques 16d, 16c o un conmutador 16e conectado subsecuente a los bloques 16b, 16c, donde "antes" y "subsecuente" se refiererji a la dirección de flujo de la señal al menos con respecto al bloque 16a a 16e desde la parte superior a la inferior de la Fig. 7. El bloque 16d no estará presente en una decisión de bucle cerrado. En este caso, sólo el conmutador 16e estará presente, ya que ambos algoritmos de codificación 16b, 16c operan en una y la misma I porción de señal de audio y el resultado del algoritmo de codificación seleccionado serán tomados y dirigido a la interfaz de salida 24. '· Si, sin embargo, una decisión de bucle abierto u otra decisión se realiza antes que ambos algoritmos de codificación operen en una y la misma señal, el conmutador 16e no estará presente, pero el conmutador 16d estará presente, y cada porción de señal de audio será sólo codificada utilizando uno de los bloques 16b, 16c.
Además, particularmente para el modo bucle cerrado, las salidas de ambos bloques se conectan al bloque del procesador y controlador 18, 22 como lo indipan las líneas 71 , 72. El control del conmutador se realiza por las líneas 73, 74 desde el bloque del procesador y controlador 18, 22 a los conmutadores correspondientes 16d, 16e. Nuevamente, dependiendo de la implementación, solo una de las líneas 73, 74 estará allí típicamente.
La señal de audio codificada 26 por lo tanto, comprende, entre otros datos, el resultado de ACELP o TCX que típicamente tendrá redundancia en 1 la codificación además de codificación Huffman o codificación aritmética antes ¡de ingresar a la interfaz de salida 24. Además, los datos LPC 70 se proveen a' la interfaz de salida 24 para incluirlos en la señal de audio codificada. Además, se prefiere incluir una decisión con modo de codificación en la señal de audio codificada indicando al decodificador que la porción actual de la señal de audio1 es i una porción ACELP o TCX.
Aunque algunos aspectos se describen en el contexto de un aparato, resulta claro que estos aspectos representan además una descripción del correspondiente método, donde un bloque o dispositivo corresponde a un paso de método o rasgo del paso del método. En forma análoga, los aspectos que1 se describen en el contexto de un paso del método representan también una descripción de un bloque correspondiente o ítem o rasgo de un aparato correspondiente. 1 Dependiendo de ciertos requisitos de implementación, las realizaciones de la invención podrán implementarse en hardware o software. La implementación podrá realizarse utilizando un medio de almacenamiento digital, por ejemplo un disco blando, DVD, CD, ROM, PROM, EPROM, EEPROM o memoria FLASH, con i señales de control legibles en forma electrónica almacenadas en ellos, que cooperan (o pueden cooperar) con un sistema de computación programable como se aplica el respectivo método. i Algunas realizaciones de acuerdo con la invención comprenden de datos no transitorio con señales de control legibles en forma capaces de cooperar un sistema de computación programable como se aplica uno ? de los métodos que se describe en la presente. í I Generalmente, las realizaciones de la presente invención podrán I implementarse como producto de programa de computación con un código jde programa, el código de programa es operativo para aplicar uno de los métodos cuando el producto de programa de computación opera en una computadora.! El j código de programa podrá por ejemplo ser almacenado en un portador legible por i máquina.
Otras realizaciones comprenden el programa de computación para aplicar uno de los métodos que se describe en la presente, almacenado en Un portador legible por máquina.
En otras palabras, una realización del método de invención es, por lo tahto, i un programa de computación con un código de programa para aplicar uno dej los métodos que se describe en la presente, cuando el producto de programa! de í computación opera en una computadora.
Otra realización del método de invención es, por lo tanto, un portador de datos (o medio de almacenamiento digital o medio legible por computadora) 'que comprende, grabado en el mismo, el programa de computación para aplicar ¡uno de los métodos que se describe en la presente.
Otra realización del método de invención es, por lo tanto, una corriente de datos o secuencia de señales que representa el programa de computación para i I aplicar uno de los métodos que se describe en la presente. La corriente de datos o secuencia de señales podrá por ejemplo configurarse para ser transferida por una conexión de comunicación de datos, por ejemplo por Internet.
Otra realización comprende un medio de procesamiento, por ejemplo una computadora, o dispositivo lógico programable, configurado para o adaptado para aplicar uno de los métodos que se describe en la presente. ; Otra realización comprende una computadora con un programa ¡de computación instalado en ella para aplicar uno de los métodos que se en la presente.
En algunas realizaciones, un dispositivo lógico programable (por ejemploj un circuito predifundido de puerta programable en campo) podrá usarse para aplicar algunas o todas las funcionalidades de los métodos que se describen en la presente. En algunas realizaciones, un circuito predifundido de puerta programable en campo podrá cooperar con un microprocesador para aplicar uno de los métodos que se describe en la presente. Generalmente, los métodos; se i aplican preferentemente mediante un aparato de hardware.
Las realizaciones anteriores son solo ilustrativas de los principios dé la presente invención. Se entiende que podrán realizarse modificaciones y variaciones a las disposiciones y los detalles que se describen en ja presente i resultarán evidentes para los expertos en la técnica. Se intenta, por lo tanto, limitarse solo al alcance de las reivindicaciones de la patente y no a los detalles específicos presentados como descripción y explicación de las realizaciones de la presente. ;

Claims (1)

  1. I REIVINDICACIONES Habiendo así especialmente descripto y determinado la naturaleza de la presente invención y la forma como la misma ha de ser llevada a la práctica, ¡se I declara reivindicar como de propiedad y derecho exclusivo. 1 . Un aparato para codificar una porción de señal de audio (10) y obtener una i señal de audio codificada (26) para la porción de señal de audio, que comprende: un detector de transiente (12) para detectar si una señal de transiente' se i encuentra en la porción de señal de audio para obtener una detección ¡del resultado de transiente (14); una etapa del codificador (16) para realizar un primer algoritmo de codificación en la señal de audio, el primer algoritmo de codificación posee una primera característica, y para realizar un segundo algoritmo de codificación en la señal de audio, el segundo algoritmo de codificación posee una segunda característica diferente de la primera característica; un procesador (18) para determinar que algoritmo de codificación da jpor resultado una señal de audio codificada con mejor aproximación a la porción de señal de audio con respecto al otro algoritmo de codificación para obtener un resultado de calidad (20); y un controlador (22) para determinar si la señal de audio codificada pata la porción de señal de audio debe generarse por el primer algoritmo: de codificación o segundo algoritmo de codificación basado en la detección del resultado de transiente (14) y resultado de calidad (20). Un aparato de acuerdo con la reivindicación 1 , donde la etapa del codificador (16) se configura para utilizar un primer algoritmo de codificación más adecuado para señales transientes que el segundo algoritmo de codificación. El aparato de la reivindicación 2, donde el primer algoritmo de codificación es un algoritmo de codificación ACELP, y donde el segundo algoritmo ¡de codificación es un algoritmo de codificación por transformada. : El aparato de acuerdo con una de las reivindicaciones precedentes, dor¡ide el controlador (22) se configura para determinar el segundo algoritmo ; de codificación, aunque el resultado de calidad (20) indique una mejor calidad para el primer algoritmo de codificación, cuando la detección del resultado de transiente (14) indica una señal no-transiente. El aparato de acuerdo con una de las reivindicaciones precedentes, doi de el controlador (22) se configura para determinar el primer algoritmo j de codificación, aunque el resultado de calidad indique mejor calidad para el segundo algoritmo de codificación, cuando la detección del resultado! de transiente indica una señal transiente. El aparato de acuerdo con la reivindicación 4 o 5, donde el controlador (22) se configura para determinar el segundo algoritmo de codificación o primer algoritmo de codificación sólo cuando el resultado de calidad indique calidades diferentes entre los algoritmos de codificación, el cual es menor al valor de diferencia del valor umbral. i El aparato de acuerdo con la reivindicación 6, donde el valor umbral es igúal o menor a 3 dB, y donde el resultado de calidad para ambos algoritmos de codificación se calculan utilizando un cálculo SNR entre la señal de audio (10) y una versión codificada y nuevamente decodificada de la señal de i audio. El aparato de acuerdo con una de las reivindicaciones 4 a 7, donde1 el controlador (22) se configura para sólo determinar el segundo algoritmo ¡de codificación o primer algoritmo de codificación, cuando un número de porciones de señal anteriores para las cuales el primer o segundo algoritmo de codificación ha sido determinado es menos al número predeterminado. El aparato de acuerdo con la reivindicación 8, donde el controlador (22) se configura para utilizar un valor predeterminado menor a 10. El aparato de acuerdo con una de las reivindicaciones precedentes, el controlador (22) se configura para aplicar un proceso de histéresis pjara que el segundo algoritmo de codificación o primer algoritmo de codificación sólo se determine cuando el resultado de menor calidad indique una menor i calidad para el segundo algoritmo de codificación o primer algoritmo1 de i codificación, cuando un número de porciones de señales anteriores con el primer algoritmo de codificación o segundo algoritmo de codificación, respectivamente, es igual o menor a un número predeterminado, y cuando la detección del resultado de transiente indica un estado predefinido de1 los I dos posibles estados que comprenden non-transientes y transientes. 11. El aparato de acuerdo con una de las reivindicaciones precedentes, donde i el detector de transiente (12) se configura para aplicar los siguientes pasos: someter a filtro paso alto (50) la señal de audio para obtener un bloque de señal con filtro paso alto; subdividir (52) el bloque se señal sometido a filtro paso alto en una pluralidad de sub-bloques; calcular (54) una energía para cada sub-bloque; combinar (58) valores de energía para cada par de sub-bloques adyacentes para obtener un resultado para cada par; y combinar (60) el resultado de los pares para obtener la detección del resultado de transiente (1 ). 12. El aparato de acuerdo con una de las reivindicaciones precedentes, donde i la etapa del codificador (16) además comprende una etapa de filtrado LPC para determinar los coeficientes LPC de la señal de audio para filtrar la señal de audio utilizando un filtro de análisis LPC determinado por los coeficientes LPC para determinar una señal residual, donde el primer algoritmo de codificación o segundo algoritmo de codificación se aplica a la señal residual, y donde la señal de audio codificada además comprende información (70) en los coeficientes LPC. 13. El aparato de acuerdo con una de las reivindicaciones precedentes, dohde la etapa de codificación (16) comprende un conmutador (16d) conectado al primer algoritmo de codificación (16b) y segundo algoritmo de codificación (16c) o un conmutador (16e) conectado subsecuentemente al primer algoritmo de codificación (16b) y segundo algoritmo de codificación (16c), donde el conmutador (16d, 16e) es controlado por el controlador (22). j Un método para codificar una porción de señal de audio (10) para obtener una señal de audio codificada (26) para la porción de señal de audio, q!ue detectar (12) si una señal transiente se encuentra en la porción de señal de audio para obtener una detección del resultado de transiente (14); aplicar (16) un primer algoritmo de codificación en la señal de audioj el primer algoritmo de codificación posee una primera característica, y aplicar un segundo algoritmo de primera cara determinar (1 audio codific respecto al calidad (20); y ! determinar (22) si la señal de audio codificada para la porción de señal de audio debe generarse por el primer algoritmo de codificación o segundo algoritmo de codificación basado en la detección del resultado de transiente (14) y resultado de calidad (20). Un programa de computación con un código de programa para aplicar, cuando opera en una computadora, el método de codificación a una porción de señal de audio de acuerdo con la reivindicación 14. j
MX2013009304A 2011-02-14 2012-02-13 Aparato y metodo para codificar una porcion de una señal de audio utilizando deteccion de un transiente y resultado de calidad. MX2013009304A (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201161442632P 2011-02-14 2011-02-14
PCT/EP2012/052396 WO2012110448A1 (en) 2011-02-14 2012-02-13 Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result

Publications (1)

Publication Number Publication Date
MX2013009304A true MX2013009304A (es) 2013-10-03

Family

ID=71943603

Family Applications (1)

Application Number Title Priority Date Filing Date
MX2013009304A MX2013009304A (es) 2011-02-14 2012-02-13 Aparato y metodo para codificar una porcion de una señal de audio utilizando deteccion de un transiente y resultado de calidad.

Country Status (19)

Country Link
US (1) US9620129B2 (es)
EP (1) EP2676270B1 (es)
JP (1) JP5914527B2 (es)
KR (2) KR101562281B1 (es)
CN (1) CN103493129B (es)
AR (2) AR085217A1 (es)
AU (1) AU2012217216B2 (es)
BR (1) BR112013020588B1 (es)
CA (2) CA2827266C (es)
ES (1) ES2623291T3 (es)
MX (1) MX2013009304A (es)
MY (1) MY166006A (es)
PL (1) PL2676270T3 (es)
PT (1) PT2676270T (es)
RU (1) RU2573231C2 (es)
SG (1) SG192714A1 (es)
TW (1) TWI476760B (es)
WO (1) WO2012110448A1 (es)
ZA (1) ZA201306842B (es)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014118136A1 (en) 2013-01-29 2014-08-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for selecting one of a first audio encoding algorithm and a second audio encoding algorithm
US9715880B2 (en) 2013-02-21 2017-07-25 Dolby International Ab Methods for parametric multi-channel encoding
TWI713018B (zh) 2013-09-12 2020-12-11 瑞典商杜比國際公司 多聲道音訊系統中之解碼方法、解碼裝置、包含用於執行解碼方法的指令之非暫態電腦可讀取的媒體之電腦程式產品、包含解碼裝置的音訊系統
EP3000110B1 (en) * 2014-07-28 2016-12-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selection of one of a first encoding algorithm and a second encoding algorithm using harmonics reduction
TWI602172B (zh) 2014-08-27 2017-10-11 弗勞恩霍夫爾協會 使用參數以加強隱蔽之用於編碼及解碼音訊內容的編碼器、解碼器及方法
CN110998722B (zh) 2017-07-03 2023-11-10 杜比国际公司 低复杂性密集瞬态事件检测和译码
CN109389986B (zh) 2017-08-10 2023-08-22 华为技术有限公司 时域立体声参数的编码方法和相关产品
US10586546B2 (en) 2018-04-26 2020-03-10 Qualcomm Incorporated Inversely enumerated pyramid vector quantizers for efficient rate adaptation in audio coding
US10573331B2 (en) * 2018-05-01 2020-02-25 Qualcomm Incorporated Cooperative pyramid vector quantizers for scalable audio coding
CN110767243A (zh) * 2019-11-04 2020-02-07 重庆百瑞互联电子技术有限公司 一种音频编码方法、装置及设备
CN115881139A (zh) * 2021-09-29 2023-03-31 华为技术有限公司 编解码方法、装置、设备、存储介质及计算机程序
WO2024110562A1 (en) * 2022-11-23 2024-05-30 Telefonaktiebolaget Lm Ericsson (Publ) Adaptive encoding of transient audio signals

Family Cites Families (245)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS56135754A (en) 1980-03-26 1981-10-23 Nippon Denso Co Ltd Method of controlling current feeding time period at the time of acceleration
US4711212A (en) 1985-11-26 1987-12-08 Nippondenso Co., Ltd. Anti-knocking in internal combustion engine
BR9206143A (pt) 1991-06-11 1995-01-03 Qualcomm Inc Processos de compressão de final vocal e para codificação de taxa variável de quadros de entrada, aparelho para comprimir im sinal acústico em dados de taxa variável, codificador de prognóstico exitado por córdigo de taxa variável (CELP) e descodificador para descodificar quadros codificados
US5408580A (en) 1992-09-21 1995-04-18 Aware, Inc. Audio compression system employing multi-rate signal analysis
SE501340C2 (sv) 1993-06-11 1995-01-23 Ericsson Telefon Ab L M Döljande av transmissionsfel i en talavkodare
BE1007617A3 (nl) 1993-10-11 1995-08-22 Philips Electronics Nv Transmissiesysteem met gebruik van verschillende codeerprincipes.
US5657422A (en) 1994-01-28 1997-08-12 Lucent Technologies Inc. Voice activity detection driven noise remediator
US5784532A (en) 1994-02-16 1998-07-21 Qualcomm Incorporated Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system
US5684920A (en) 1994-03-17 1997-11-04 Nippon Telegraph And Telephone Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein
US5568588A (en) 1994-04-29 1996-10-22 Audiocodes Ltd. Multi-pulse analysis speech processing System and method
CN1090409C (zh) 1994-10-06 2002-09-04 皇家菲利浦电子有限公司 采用不同编码原理的传送***
JP3304717B2 (ja) 1994-10-28 2002-07-22 ソニー株式会社 ディジタル信号圧縮方法及び装置
US5537510A (en) 1994-12-30 1996-07-16 Daewoo Electronics Co., Ltd. Adaptive digital audio encoding apparatus and a bit allocation method thereof
SE506379C3 (sv) 1995-03-22 1998-01-19 Ericsson Telefon Ab L M Lpc-talkodare med kombinerad excitation
US5727119A (en) 1995-03-27 1998-03-10 Dolby Laboratories Licensing Corporation Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase
JP3317470B2 (ja) * 1995-03-28 2002-08-26 日本電信電話株式会社 音響信号符号化方法、音響信号復号化方法
US5659622A (en) 1995-11-13 1997-08-19 Motorola, Inc. Method and apparatus for suppressing noise in a communication system
US5890106A (en) 1996-03-19 1999-03-30 Dolby Laboratories Licensing Corporation Analysis-/synthesis-filtering system with efficient oddly-stacked singleband filter bank using time-domain aliasing cancellation
US5848391A (en) 1996-07-11 1998-12-08 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Method subband of coding and decoding audio signals using variable length windows
JP3259759B2 (ja) 1996-07-22 2002-02-25 日本電気株式会社 音声信号伝送方法及び音声符号復号化システム
JP3622365B2 (ja) 1996-09-26 2005-02-23 ヤマハ株式会社 音声符号化伝送方式
JPH10124092A (ja) 1996-10-23 1998-05-15 Sony Corp 音声符号化方法及び装置、並びに可聴信号符号化方法及び装置
US5960389A (en) 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission
JPH10214100A (ja) * 1997-01-31 1998-08-11 Sony Corp 音声合成方法
US6134518A (en) 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
JPH10276095A (ja) 1997-03-28 1998-10-13 Toshiba Corp 符号化器及び復号化器
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
JP3223966B2 (ja) 1997-07-25 2001-10-29 日本電気株式会社 音声符号化/復号化装置
US6070137A (en) 1998-01-07 2000-05-30 Ericsson Inc. Integrated frequency-domain voice coding using an adaptive spectral enhancement filter
DE69926821T2 (de) * 1998-01-22 2007-12-06 Deutsche Telekom Ag Verfahren zur signalgesteuerten Schaltung zwischen verschiedenen Audiokodierungssystemen
GB9811019D0 (en) 1998-05-21 1998-07-22 Univ Surrey Speech coders
DE19827704C2 (de) 1998-06-22 2000-05-11 Siemens Ag Verfahren zur zylinderselektiven Klopfregelung einer Brennkraftmaschine
US6173257B1 (en) 1998-08-24 2001-01-09 Conexant Systems, Inc Completed fixed codebook for speech encoder
US6439967B2 (en) 1998-09-01 2002-08-27 Micron Technology, Inc. Microelectronic substrate assembly planarizing machines and methods of mechanical and chemical-mechanical planarization of microelectronic substrate assemblies
SE521225C2 (sv) 1998-09-16 2003-10-14 Ericsson Telefon Ab L M Förfarande och anordning för CELP-kodning/avkodning
US6317117B1 (en) 1998-09-23 2001-11-13 Eugene Goff User interface for the control of an audio spectrum filter processor
US7272556B1 (en) 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
US7124079B1 (en) 1998-11-23 2006-10-17 Telefonaktiebolaget Lm Ericsson (Publ) Speech coding with comfort noise variability feature for increased fidelity
FI114833B (fi) 1999-01-08 2004-12-31 Nokia Corp Menetelmä, puhekooderi ja matkaviestin puheenkoodauskehysten muodostamiseksi
DE19921122C1 (de) 1999-05-07 2001-01-25 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals
WO2000075919A1 (en) 1999-06-07 2000-12-14 Ericsson, Inc. Methods and apparatus for generating comfort noise using parametric noise model statistics
JP4464484B2 (ja) 1999-06-15 2010-05-19 パナソニック株式会社 雑音信号符号化装置および音声信号符号化装置
US6236960B1 (en) 1999-08-06 2001-05-22 Motorola, Inc. Factorial packing method and apparatus for information coding
US6636829B1 (en) 1999-09-22 2003-10-21 Mindspeed Technologies, Inc. Speech communication system and method for handling lost frames
ATE341074T1 (de) 2000-02-29 2006-10-15 Qualcomm Inc Multimodaler mischbereich-sprachkodierer mit geschlossener regelschleife
DE10012956A1 (de) 2000-03-16 2001-09-20 Bosch Gmbh Robert Vorrichtung und Verfahren zur Regelung des Energieangebots für die Zündung einer Brennkraftmaschine
US6757654B1 (en) 2000-05-11 2004-06-29 Telefonaktiebolaget Lm Ericsson Forward error correction in speech coding
JP2002118517A (ja) 2000-07-31 2002-04-19 Sony Corp 直交変換装置及び方法、逆直交変換装置及び方法、変換符号化装置及び方法、並びに復号装置及び方法
FR2813722B1 (fr) 2000-09-05 2003-01-24 France Telecom Procede et dispositif de dissimulation d'erreurs et systeme de transmission comportant un tel dispositif
US6847929B2 (en) 2000-10-12 2005-01-25 Texas Instruments Incorporated Algebraic codebook system and method
CA2327041A1 (en) 2000-11-22 2002-05-22 Voiceage Corporation A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals
US6636830B1 (en) 2000-11-22 2003-10-21 Vialta Inc. System and method for noise reduction using bi-orthogonal modified discrete cosine transform
US20050130321A1 (en) 2001-04-23 2005-06-16 Nicholson Jeremy K. Methods for analysis of spectral data and their applications
US7136418B2 (en) 2001-05-03 2006-11-14 University Of Washington Scalable and perceptually ranked signal coding and decoding
KR100464369B1 (ko) 2001-05-23 2005-01-03 삼성전자주식회사 음성 부호화 시스템의 여기 코드북 탐색 방법
US20020184009A1 (en) 2001-05-31 2002-12-05 Heikkinen Ari P. Method and apparatus for improved voicing determination in speech signals containing high levels of jitter
US20030120484A1 (en) 2001-06-12 2003-06-26 David Wong Method and system for generating colored comfort noise in the absence of silence insertion description packets
DE10129240A1 (de) 2001-06-18 2003-01-02 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Verarbeiten von zeitdiskreten Audio-Abtastwerten
US6879955B2 (en) 2001-06-29 2005-04-12 Microsoft Corporation Signal modification based on continuous time warping for low bit rate CELP coding
US6941263B2 (en) 2001-06-29 2005-09-06 Microsoft Corporation Frequency domain postfiltering for quality enhancement of coded speech
US7711563B2 (en) 2001-08-17 2010-05-04 Broadcom Corporation Method and system for frame erasure concealment for predictive speech coding based on extrapolation of speech waveform
DE10140507A1 (de) 2001-08-17 2003-02-27 Philips Corp Intellectual Pty Verfahren für die algebraische Codebook-Suche eines Sprachsignalkodierers
KR100438175B1 (ko) 2001-10-23 2004-07-01 엘지전자 주식회사 코드북 검색방법
CA2365203A1 (en) 2001-12-14 2003-06-14 Voiceage Corporation A signal modification method for efficient coding of speech signals
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
JP3815323B2 (ja) 2001-12-28 2006-08-30 日本ビクター株式会社 周波数変換ブロック長適応変換装置及びプログラム
DE10200653B4 (de) 2002-01-10 2004-05-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Skalierbarer Codierer, Verfahren zum Codieren, Decodierer und Verfahren zum Decodieren für einen skalierten Datenstrom
US6646332B2 (en) 2002-01-18 2003-11-11 Terence Quintin Collier Semiconductor package device
CA2388358A1 (en) 2002-05-31 2003-11-30 Voiceage Corporation A method and device for multi-rate lattice vector quantization
CA2388439A1 (en) 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
CA2388352A1 (en) 2002-05-31 2003-11-30 Voiceage Corporation A method and device for frequency-selective pitch enhancement of synthesized speed
US7302387B2 (en) 2002-06-04 2007-11-27 Texas Instruments Incorporated Modification of fixed codebook search in G.729 Annex E audio coding
KR100462611B1 (ko) * 2002-06-27 2004-12-20 삼성전자주식회사 하모닉 성분을 이용한 오디오 코딩방법 및 장치
US20040010329A1 (en) 2002-07-09 2004-01-15 Silicon Integrated Systems Corp. Method for reducing buffer requirements in a digital audio decoder
DE10236694A1 (de) 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
US7299190B2 (en) 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
CA2469674C (en) 2002-09-19 2012-04-24 Matsushita Electric Industrial Co., Ltd. Audio decoding apparatus and method
WO2004034379A2 (en) 2002-10-11 2004-04-22 Nokia Corporation Methods and devices for source controlled variable bit-rate wideband speech coding
US7343283B2 (en) 2002-10-23 2008-03-11 Motorola, Inc. Method and apparatus for coding a noise-suppressed audio signal
US7363218B2 (en) 2002-10-25 2008-04-22 Dilithium Networks Pty. Ltd. Method and apparatus for fast CELP parameter mapping
KR100463419B1 (ko) 2002-11-11 2004-12-23 한국전자통신연구원 적은 복잡도를 가진 고정 코드북 검색방법 및 장치
KR100463559B1 (ko) 2002-11-11 2004-12-29 한국전자통신연구원 대수 코드북을 이용하는 켈프 보코더의 코드북 검색방법
KR100465316B1 (ko) 2002-11-18 2005-01-13 한국전자통신연구원 음성 부호화기 및 이를 이용한 음성 부호화 방법
KR20040058855A (ko) 2002-12-27 2004-07-05 엘지전자 주식회사 음성 변조 장치 및 방법
JP4191503B2 (ja) 2003-02-13 2008-12-03 日本電信電話株式会社 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム
AU2003208517A1 (en) 2003-03-11 2004-09-30 Nokia Corporation Switching between coding schemes
US7249014B2 (en) 2003-03-13 2007-07-24 Intel Corporation Apparatus, methods and articles incorporating a fast algebraic codebook search technique
US20050021338A1 (en) 2003-03-17 2005-01-27 Dan Graboi Recognition device and system
KR100556831B1 (ko) 2003-03-25 2006-03-10 한국전자통신연구원 전역 펄스 교체를 통한 고정 코드북 검색 방법
WO2004090870A1 (ja) 2003-04-04 2004-10-21 Kabushiki Kaisha Toshiba 広帯域音声を符号化または復号化するための方法及び装置
US7318035B2 (en) 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
DE10321983A1 (de) 2003-05-15 2004-12-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Einbetten einer binären Nutzinformation in ein Trägersignal
ATE486348T1 (de) 2003-06-30 2010-11-15 Koninkl Philips Electronics Nv Verbesserung der qualität von dekodierten audio mittels hinzufügen von geräusch
DE10331803A1 (de) 2003-07-14 2005-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Umsetzen in eine transformierte Darstellung oder zum inversen Umsetzen der transformierten Darstellung
US6987591B2 (en) 2003-07-17 2006-01-17 Her Majesty The Queen In Right Of Canada, As Represented By The Minister Of Industry Through The Communications Research Centre Canada Volume hologram
DE10345995B4 (de) 2003-10-02 2005-07-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines Signals mit einer Sequenz von diskreten Werten
DE10345996A1 (de) 2003-10-02 2005-04-28 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Verarbeiten von wenigstens zwei Eingangswerten
US7418396B2 (en) 2003-10-14 2008-08-26 Broadcom Corporation Reduced memory implementation technique of filterbank and block switching for real-time audio applications
US20050091044A1 (en) 2003-10-23 2005-04-28 Nokia Corporation Method and system for pitch contour quantization in audio coding
US20050091041A1 (en) 2003-10-23 2005-04-28 Nokia Corporation Method and system for speech coding
BR122018007834B1 (pt) 2003-10-30 2019-03-19 Koninklijke Philips Electronics N.V. Codificador e decodificador de áudio avançado de estéreo paramétrico combinado e de replicação de banda espectral, método de codificação avançada de áudio de estéreo paramétrico combinado e de replicação de banda espectral, sinal de áudio avançado codificado de estéreo paramétrico combinado e de replicação de banda espectral, método de decodificação avançada de áudio de estéreo paramétrico combinado e de replicação de banda espectral, e, meio de armazenamento legível por computador
EP1711938A1 (en) 2004-01-28 2006-10-18 Koninklijke Philips Electronics N.V. Audio signal decoding using complex-valued data
EP2770694A1 (en) * 2004-02-12 2014-08-27 Core Wireless Licensing S.a.r.l. Classified media quality of experience
DE102004007200B3 (de) 2004-02-13 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audiocodierung
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
FI118834B (fi) 2004-02-23 2008-03-31 Nokia Corp Audiosignaalien luokittelu
FI118835B (fi) * 2004-02-23 2008-03-31 Nokia Corp Koodausmallin valinta
WO2005086138A1 (ja) 2004-03-05 2005-09-15 Matsushita Electric Industrial Co., Ltd. エラー隠蔽装置およびエラー隠蔽方法
WO2005096274A1 (fr) 2004-04-01 2005-10-13 Beijing Media Works Co., Ltd Dispositif et procede de codage/decodage audio ameliores
GB0408856D0 (en) * 2004-04-21 2004-05-26 Nokia Corp Signal encoding
EP1747554B1 (en) 2004-05-17 2010-02-10 Nokia Corporation Audio encoding with different coding frame lengths
JP4168976B2 (ja) * 2004-05-28 2008-10-22 ソニー株式会社 オーディオ信号符号化装置及び方法
US7649988B2 (en) 2004-06-15 2010-01-19 Acoustic Technologies, Inc. Comfort noise generator using modified Doblinger noise estimate
US8160274B2 (en) * 2006-02-07 2012-04-17 Bongiovi Acoustics Llc. System and method for digital signal processing
US7630902B2 (en) * 2004-09-17 2009-12-08 Digital Rise Technology Co., Ltd. Apparatus and methods for digital audio coding using codebook application ranges
EP1792306B1 (en) * 2004-09-17 2013-03-13 Koninklijke Philips Electronics N.V. Combined audio coding minimizing perceptual distortion
KR100656788B1 (ko) 2004-11-26 2006-12-12 한국전자통신연구원 비트율 신축성을 갖는 코드벡터 생성 방법 및 그를 이용한 광대역 보코더
TWI253057B (en) 2004-12-27 2006-04-11 Quanta Comp Inc Search system and method thereof for searching code-vector of speech signal in speech encoder
US7519535B2 (en) 2005-01-31 2009-04-14 Qualcomm Incorporated Frame erasure concealment in voice communications
JP5420175B2 (ja) 2005-01-31 2014-02-19 スカイプ 通信システムにおける隠蔽フレームの生成方法
CN100593197C (zh) 2005-02-02 2010-03-03 富士通株式会社 信号处理方法和装置
US20070147518A1 (en) * 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
US8155965B2 (en) 2005-03-11 2012-04-10 Qualcomm Incorporated Time warping frames inside the vocoder by modifying the residual
AU2006232361B2 (en) 2005-04-01 2010-12-23 Qualcomm Incorporated Methods and apparatus for encoding and decoding an highband portion of a speech signal
JP4767069B2 (ja) 2005-05-02 2011-09-07 ヤマハ発動機株式会社 鞍乗型車両のエンジン制御装置及びそのエンジン制御方法
WO2006126843A2 (en) 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding audio signal
US7707034B2 (en) 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter
RU2296377C2 (ru) 2005-06-14 2007-03-27 Михаил Николаевич Гусев Способ анализа и синтеза речи
JP2008546341A (ja) 2005-06-18 2008-12-18 ノキア コーポレイション 非連続音声送信の際の擬似背景ノイズパラメータ適応送信のためのシステム及び方法
WO2006137425A1 (ja) 2005-06-23 2006-12-28 Matsushita Electric Industrial Co., Ltd. オーディオ符号化装置、オーディオ復号化装置およびオーディオ符号化情報伝送装置
FR2888699A1 (fr) 2005-07-13 2007-01-19 France Telecom Dispositif de codage/decodage hierachique
KR100851970B1 (ko) 2005-07-15 2008-08-12 삼성전자주식회사 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치
US7610197B2 (en) 2005-08-31 2009-10-27 Motorola, Inc. Method and apparatus for comfort noise generation in speech communication systems
RU2312405C2 (ru) 2005-09-13 2007-12-10 Михаил Николаевич Гусев Способ осуществления машинной оценки качества звуковых сигналов
US20070174047A1 (en) 2005-10-18 2007-07-26 Anderson Kyle D Method and apparatus for resynchronizing packetized audio streams
US7720677B2 (en) 2005-11-03 2010-05-18 Coding Technologies Ab Time warped modified transform coding of audio signals
US7536299B2 (en) 2005-12-19 2009-05-19 Dolby Laboratories Licensing Corporation Correlating and decorrelating transforms for multiple description coding systems
US8255207B2 (en) 2005-12-28 2012-08-28 Voiceage Corporation Method and device for efficient frame erasure concealment in speech codecs
WO2007080211A1 (en) 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
WO2007083931A1 (en) 2006-01-18 2007-07-26 Lg Electronics Inc. Apparatus and method for encoding and decoding signal
CN101371295B (zh) 2006-01-18 2011-12-21 Lg电子株式会社 用于编码和解码信号的设备和方法
US8032369B2 (en) * 2006-01-20 2011-10-04 Qualcomm Incorporated Arbitrary average data rates for variable rate coders
US7668304B2 (en) 2006-01-25 2010-02-23 Avaya Inc. Display hierarchy of participants during phone call
FR2897733A1 (fr) 2006-02-20 2007-08-24 France Telecom Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant
FR2897977A1 (fr) 2006-02-28 2007-08-31 France Telecom Procede de limitation de gain d'excitation adaptative dans un decodeur audio
US7556670B2 (en) 2006-03-16 2009-07-07 Aylsworth Alonzo C Method and system of coordinating an intensifier and sieve beds
US20070253577A1 (en) 2006-05-01 2007-11-01 Himax Technologies Limited Equalizer bank with interference reduction
EP1852848A1 (en) * 2006-05-05 2007-11-07 Deutsche Thomson-Brandt GmbH Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream
US7873511B2 (en) 2006-06-30 2011-01-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
JP4810335B2 (ja) 2006-07-06 2011-11-09 株式会社東芝 広帯域オーディオ信号符号化装置および広帯域オーディオ信号復号装置
JP5052514B2 (ja) 2006-07-12 2012-10-17 パナソニック株式会社 音声復号装置
WO2008007700A1 (fr) 2006-07-12 2008-01-17 Panasonic Corporation Dispositif de décodage de son, dispositif de codage de son, et procédé de compensation de trame perdue
US7933770B2 (en) 2006-07-14 2011-04-26 Siemens Audiologische Technik Gmbh Method and device for coding audio data based on vector quantisation
CN102592303B (zh) 2006-07-24 2015-03-11 索尼株式会社 毛发运动合成器***和用于毛发/皮毛流水线的优化技术
US7987089B2 (en) 2006-07-31 2011-07-26 Qualcomm Incorporated Systems and methods for modifying a zero pad region of a windowed frame of an audio signal
DE602007004502D1 (de) 2006-08-15 2010-03-11 Broadcom Corp Neuphasierung des status eines dekodiergerätes nach einem paketverlust
US7877253B2 (en) 2006-10-06 2011-01-25 Qualcomm Incorporated Systems, methods, and apparatus for frame erasure recovery
US8126721B2 (en) 2006-10-18 2012-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
DE102006049154B4 (de) 2006-10-18 2009-07-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodierung eines Informationssignals
US8041578B2 (en) 2006-10-18 2011-10-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
US8417532B2 (en) 2006-10-18 2013-04-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
US8036903B2 (en) 2006-10-18 2011-10-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system
EP3288027B1 (en) 2006-10-25 2021-04-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating complex-valued audio subband values
DE102006051673A1 (de) 2006-11-02 2008-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale
BRPI0718738B1 (pt) * 2006-12-12 2023-05-16 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Codificador, decodificador e métodos para codificação e decodificação de segmentos de dados representando uma corrente de dados de domínio de tempo
FR2911228A1 (fr) 2007-01-05 2008-07-11 France Telecom Codage par transformee, utilisant des fenetres de ponderation et a faible retard.
KR101379263B1 (ko) 2007-01-12 2014-03-28 삼성전자주식회사 대역폭 확장 복호화 방법 및 장치
FR2911426A1 (fr) 2007-01-15 2008-07-18 France Telecom Modification d'un signal de parole
US7873064B1 (en) 2007-02-12 2011-01-18 Marvell International Ltd. Adaptive jitter buffer-packet loss concealment
SG179433A1 (en) 2007-03-02 2012-04-27 Panasonic Corp Encoding device and encoding method
JP4708446B2 (ja) 2007-03-02 2011-06-22 パナソニック株式会社 符号化装置、復号装置およびそれらの方法
JP5596341B2 (ja) 2007-03-02 2014-09-24 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 音声符号化装置および音声符号化方法
DE102007063635A1 (de) * 2007-03-22 2009-04-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zur zeitlichen Segmentierung eines Videos in Videobildfolgen und zur Auswahl von Keyframes für das Auffinden von Bildinhalten unter Einbeziehung einer Subshot-Detektion
JP2008261904A (ja) 2007-04-10 2008-10-30 Matsushita Electric Ind Co Ltd 符号化装置、復号化装置、符号化方法および復号化方法
US8630863B2 (en) 2007-04-24 2014-01-14 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding audio/speech signal
ES2529292T3 (es) 2007-04-29 2015-02-18 Huawei Technologies Co., Ltd. Método de codificación y de decodificación
CN101388210B (zh) 2007-09-15 2012-03-07 华为技术有限公司 编解码方法及编解码器
PL2165328T3 (pl) 2007-06-11 2018-06-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodowanie i dekodowanie sygnału audio zawierającego część impulsową i część stacjonarną
US9653088B2 (en) 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
KR101513028B1 (ko) 2007-07-02 2015-04-17 엘지전자 주식회사 방송 수신기 및 방송신호 처리방법
US8185381B2 (en) 2007-07-19 2012-05-22 Qualcomm Incorporated Unified filter bank for performing signal conversions
CN101110214B (zh) 2007-08-10 2011-08-17 北京理工大学 一种基于多描述格型矢量量化技术的语音编码方法
US8428957B2 (en) 2007-08-24 2013-04-23 Qualcomm Incorporated Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands
ES2658942T3 (es) 2007-08-27 2018-03-13 Telefonaktiebolaget Lm Ericsson (Publ) Análisis espectral/síntesis de baja complejidad utilizando resolución temporal seleccionable
JP4886715B2 (ja) 2007-08-28 2012-02-29 日本電信電話株式会社 定常率算出装置、雑音レベル推定装置、雑音抑圧装置、それらの方法、プログラム及び記録媒体
US8566106B2 (en) 2007-09-11 2013-10-22 Voiceage Corporation Method and device for fast algebraic codebook search in speech and audio coding
CN100524462C (zh) 2007-09-15 2009-08-05 华为技术有限公司 对高带信号进行帧错误隐藏的方法及装置
US8576096B2 (en) 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
KR101373004B1 (ko) 2007-10-30 2014-03-26 삼성전자주식회사 고주파수 신호 부호화 및 복호화 장치 및 방법
CN101425292B (zh) 2007-11-02 2013-01-02 华为技术有限公司 一种音频信号的解码方法及装置
DE102007055830A1 (de) 2007-12-17 2009-06-18 Zf Friedrichshafen Ag Verfahren und Vorrichtung zum Betrieb eines Hybridantriebes eines Fahrzeuges
CN101483043A (zh) 2008-01-07 2009-07-15 中兴通讯股份有限公司 基于分类和排列组合的码本索引编码方法
CN101488344B (zh) * 2008-01-16 2011-09-21 华为技术有限公司 一种量化噪声泄漏控制方法及装置
DE102008015702B4 (de) 2008-01-31 2010-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals
EP2250641B1 (en) 2008-03-04 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for mixing a plurality of input data streams
US8000487B2 (en) 2008-03-06 2011-08-16 Starkey Laboratories, Inc. Frequency translation by high-frequency spectral envelope warping in hearing assistance devices
JP2009224850A (ja) 2008-03-13 2009-10-01 Toshiba Corp 無線通信装置
FR2929466A1 (fr) 2008-03-28 2009-10-02 France Telecom Dissimulation d'erreur de transmission dans un signal numerique dans une structure de decodage hierarchique
EP2107556A1 (en) 2008-04-04 2009-10-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio transform coding using pitch correction
US8879643B2 (en) 2008-04-15 2014-11-04 Qualcomm Incorporated Data substitution scheme for oversampled data
US8768690B2 (en) * 2008-06-20 2014-07-01 Qualcomm Incorporated Coding scheme selection for low-bit-rate applications
EP2144230A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
ES2683077T3 (es) 2008-07-11 2018-09-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada
AU2009267518B2 (en) 2008-07-11 2012-08-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme
CA2871268C (en) 2008-07-11 2015-11-03 Nikolaus Rettelbach Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program
RU2515704C2 (ru) 2008-07-11 2014-05-20 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Аудиокодер и аудиодекодер для кодирования и декодирования отсчетов аудиосигнала
MY154452A (en) 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
MX2011000375A (es) 2008-07-11 2011-05-19 Fraunhofer Ges Forschung Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada.
CN102150201B (zh) 2008-07-11 2013-04-17 弗劳恩霍夫应用研究促进协会 提供时间扭曲激活信号以及使用该时间扭曲激活信号对音频信号编码
US8380498B2 (en) 2008-09-06 2013-02-19 GH Innovation, Inc. Temporal envelope coding of energy attack signal by using attack point location
US8352279B2 (en) 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
WO2010031049A1 (en) 2008-09-15 2010-03-18 GH Innovation, Inc. Improving celp post-processing for music signals
US8798776B2 (en) 2008-09-30 2014-08-05 Dolby International Ab Transcoding of audio metadata
DE102008042579B4 (de) 2008-10-02 2020-07-23 Robert Bosch Gmbh Verfahren zur Fehlerverdeckung bei fehlerhafter Übertragung von Sprachdaten
JP5555707B2 (ja) 2008-10-08 2014-07-23 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン マルチ分解能切替型のオーディオ符号化及び復号化スキーム
KR101315617B1 (ko) 2008-11-26 2013-10-08 광운대학교 산학협력단 모드 스위칭에 기초하여 윈도우 시퀀스를 처리하는 통합 음성/오디오 부/복호화기
CN101770775B (zh) 2008-12-31 2011-06-22 华为技术有限公司 信号处理方法及装置
EP3598446B1 (en) 2009-01-16 2021-12-22 Dolby International AB Cross product enhanced harmonic transposition
US8457975B2 (en) 2009-01-28 2013-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program
TWI459375B (zh) 2009-01-28 2014-11-01 Fraunhofer Ges Forschung 音訊編碼器、音訊解碼器、包含經編碼音訊資訊之數位儲存媒體、用以將音訊信號編碼及解碼之方法及電腦程式
EP2214165A3 (en) * 2009-01-30 2010-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for manipulating an audio signal comprising a transient event
KR101441474B1 (ko) 2009-02-16 2014-09-17 한국전자통신연구원 적응적 정현파 펄스 코딩을 이용한 오디오 신호의 인코딩 및 디코딩 방법 및 장치
EP2234103B1 (en) * 2009-03-26 2011-09-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Device and method for manipulating an audio signal
US8363597B2 (en) 2009-04-09 2013-01-29 Qualcomm Incorporated MAC architectures for wireless communications using multiple physical layers
KR20100115215A (ko) * 2009-04-17 2010-10-27 삼성전자주식회사 가변 비트율 오디오 부호화 및 복호화 장치 및 방법
RU2557455C2 (ru) * 2009-06-23 2015-07-20 Войсэйдж Корпорейшн Прямая компенсация наложения спектров во временной области с применением в области взвешенного или исходного сигнала
JP5267362B2 (ja) * 2009-07-03 2013-08-21 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラムならびに映像伝送装置
CN101958119B (zh) 2009-07-16 2012-02-29 中兴通讯股份有限公司 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法
US8635357B2 (en) * 2009-09-08 2014-01-21 Google Inc. Dynamic selection of parameter sets for transcoding media data
PL2491555T3 (pl) 2009-10-20 2014-08-29 Fraunhofer Ges Forschung Wielotrybowy kodek audio
BR112012009032B1 (pt) 2009-10-20 2021-09-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. Codificador de sinal de áudio, decodificador de sinal de áudio, método para prover uma representação codificada de um conteúdo de áudio, método para prover uma representação decodificada de um conteúdo de áudio para uso em aplicações de baixo retardamento
RU2591011C2 (ru) 2009-10-20 2016-07-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Кодер аудиосигнала, декодер аудиосигнала, способ кодирования или декодирования аудиосигнала с удалением алиасинга (наложения спектров)
CN102081927B (zh) 2009-11-27 2012-07-18 中兴通讯股份有限公司 一种可分层音频编码、解码方法及***
US8423355B2 (en) 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
US8428936B2 (en) 2010-03-05 2013-04-23 Motorola Mobility Llc Decoder for audio signal including generic audio and speech frames
US8793126B2 (en) 2010-04-14 2014-07-29 Huawei Technologies Co., Ltd. Time/frequency two dimension post-processing
WO2011147950A1 (en) 2010-05-28 2011-12-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low-delay unified speech and audio codec
FR2963254B1 (fr) 2010-07-27 2012-08-24 Maurice Guerin Dispositif et procede pour laver des surfaces internes d?une enceinte
SG192745A1 (en) 2011-02-14 2013-09-30 Fraunhofer Ges Forschung Noise generation in audio codecs
ES2529025T3 (es) 2011-02-14 2015-02-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y método para procesar una señal de audio decodificada en un dominio espectral
CA2844659C (en) 2011-08-10 2020-06-09 Thompson Automotive Labs Llc Methods and apparatus for engine analysis and remote engine analysis
WO2013075753A1 (en) * 2011-11-25 2013-05-30 Huawei Technologies Co., Ltd. An apparatus and a method for encoding an input signal
KR20130134193A (ko) 2012-05-30 2013-12-10 삼성전자주식회사 컨커런트 서비스를 제공하기 위한 전자 장치 및 방법

Also Published As

Publication number Publication date
KR101562281B1 (ko) 2015-10-22
ZA201306842B (en) 2014-05-28
JP5914527B2 (ja) 2016-05-11
BR112013020588B1 (pt) 2021-07-13
AR085217A1 (es) 2013-09-18
EP2676270B1 (en) 2017-02-01
CN103493129B (zh) 2016-08-10
CA2920964A1 (en) 2012-08-23
PT2676270T (pt) 2017-05-02
CA2920964C (en) 2017-08-29
RU2013142072A (ru) 2015-03-27
WO2012110448A1 (en) 2012-08-23
KR101525185B1 (ko) 2015-06-02
SG192714A1 (en) 2013-09-30
EP2676270A1 (en) 2013-12-25
CA2827266C (en) 2017-02-28
CN103493129A (zh) 2014-01-01
US20130332177A1 (en) 2013-12-12
KR20140139630A (ko) 2014-12-05
AU2012217216A1 (en) 2013-09-26
MY166006A (en) 2018-05-21
AR098480A2 (es) 2016-06-01
TWI476760B (zh) 2015-03-11
BR112013020588A2 (pt) 2018-07-10
TW201301265A (zh) 2013-01-01
US9620129B2 (en) 2017-04-11
KR20130126708A (ko) 2013-11-20
CA2827266A1 (en) 2012-08-23
ES2623291T3 (es) 2017-07-10
AU2012217216B2 (en) 2015-09-17
JP2014510303A (ja) 2014-04-24
RU2573231C2 (ru) 2016-01-20
PL2676270T3 (pl) 2017-07-31

Similar Documents

Publication Publication Date Title
MX2013009304A (es) Aparato y metodo para codificar una porcion de una señal de audio utilizando deteccion de un transiente y resultado de calidad.
US7860709B2 (en) Audio encoding with different coding frame lengths
US8244525B2 (en) Signal encoding a frame in a communication system
CN110444219B (zh) 选择第一编码演算法或第二编码演算法的装置与方法
JP2011527446A (ja) エイリアシングスイッチスキームを用いてオーディオ信号を符号化/復号化するための装置および方法
CA2910878C (en) Apparatus and method for selecting one of a first encoding algorithm and a second encoding algorithm using harmonics reduction
Eksler et al. Efficient handling of mode switching and speech transitions in the EVS codec
KR100757366B1 (ko) Zinc 함수를 이용한 음성 부호화기 및 그의 표준파형추출 방법

Legal Events

Date Code Title Description
FG Grant or registration