ES2635142T3 - Énfasis de baja frecuencia para la codificación basada en lpc en el dominio de la frecuencia - Google Patents

Énfasis de baja frecuencia para la codificación basada en lpc en el dominio de la frecuencia Download PDF

Info

Publication number
ES2635142T3
ES2635142T3 ES14701984.8T ES14701984T ES2635142T3 ES 2635142 T3 ES2635142 T3 ES 2635142T3 ES 14701984 T ES14701984 T ES 14701984T ES 2635142 T3 ES2635142 T3 ES 2635142T3
Authority
ES
Spain
Prior art keywords
spectrum
spectral
predictive coding
linear predictive
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES14701984.8T
Other languages
English (en)
Inventor
Stefan DÖHLA
Bernhard Grill
Christian Helmrich
Nikolaus Rettelbach
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2635142T3 publication Critical patent/ES2635142T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/087Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using mixed excitation models, e.g. MELP, MBE, split band LPC or HVXC
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0016Codebook for LPC parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

El codificador de audio ara codificar una señal de audio (AS) que no es de voz para producir, a partir de ella, un flujo de bits (BS), el codificador de audio (1) que comprende: una combinación (2, 3) de un filtro de codificación predictiva lineal (2) que tiene una pluralidad de coeficientes (LC) de codificación predictiva lineal y un convertidor de tiempo-frecuencia (3), en el que la combinación (2, 3) está configurada para filtrar y convertir una trama (Fl) de la señal de audio (AS) en un dominio de la frecuencia con el fin de emitir un espectro (SP) basado en la trama (Fl) y en los coeficientes de codificación predictiva lineal (LC)

Description

DESCRIPCION
Enfasis de baja frecuencia para la codificacion basada en Ipc en el dominio de la frecuencia
5 [0001] Es bien sabido que las senales que no son de voz, por ejemplo, el sonido musical, pueden ser mas
complicadas de procesar que el sonido vocal humano, ocupando una banda mas amplia de frecuencia. Recientes sistemas de codificacion de audio como AMR-WB + [3] y xHE-AAC [4] ofrecen una herramienta de codificacion por transformada para musica y otras senales genericas que no son de voz. Esta herramienta se conoce comunmente como excitacion codificada por transformada (TCX) y se basa en el principio de transmision de un residuo de
10 codificacion predictiva lineal (LPC), denominado excitacion, cuantizado y codificado por entropla en el dominio de la frecuencia. Debido al orden limitado del predictor usado en la etapa LPC, sin embargo, pueden producirse artefactos en la senal descodificada, especialmente a bajas frecuencias, donde el oldo humano es muy sensible. Con este fin, se introdujo un esquema de desenfasis y enfasis de baja frecuencia (1-3).
15 [0002] Dicho esquema de enfasis de baja frecuencia (ALFE) adaptable de la tecnica anterior amplifica las
llneas espectrales de baja frecuencia antes de la cuantizacion en el codificador. En particular, las llneas de baja frecuencia se agrupan en bandas, se calcula la energla de cada banda y se encuentra la banda con el maximo de energla local. Basandose en el valor y la ubicacion del maximo de energla, las bandas por debajo de la banda de energla maxima se aumentan de forma que se cuantizan con mayor precision en la cuantizacion posterior.
20
[0003] El desenfasis de baja frecuencia realizado para invertir el ALFE en un descodificador correspondiente es conceptualmente muy similar. Como se hace en el codificador, se establecen bandas de baja frecuencia y se determina una banda con energla maxima. A diferencia del codificador, las bandas por debajo del pico de energla ahora estan atenuadas. Este procedimiento restaura aproximadamente las energlas de las llneas del espectro
25 original.
[0004] Cabe senalar que en la tecnica anterior el calculo de energla de las bandas en el codificador se realiza antes de la cuantizacion, es decir, en el espectro de entrada, mientras que en el descodificador se realiza en las llneas cuantizadas inverso, es decir, en el espectro descodificado. Aunque la operacion de cuantizacion puede
30 disenarse de tal manera que la energla espectral se conserve en promedio, no se puede asegurar la conservacion exacta de la energla para las llneas espectrales individuales. Por lo tanto, el ALFE no puede invertirse perfectamente. Ademas, se requiere una operacion de ralz cuadrada en una implementacion preferida del ALFE de la tecnica anterior tanto en el codificador como en el descodificador. Es deseable evitar dichas operaciones relativamente complejas.
35
[0005] El objetivo de la presente invencion es proporcionar unos conceptos mejorados para el procesamiento de senales de audio. Mas en particular, un objetivo de la presente invencion es proporcionar conceptos mejorados para el enfasis y desenfasis adaptables de baja frecuencia. El objetivo de la presente invencion se resuelve mediante un codificador de audio segun la reivindicacion 1, mediante un codificador de audio segun la reivindicacion
40 12, mediante un sistema segun la reivindicacion 24, mediante procedimientos segun las reivindicaciones 25 y 26, y mediante un programa informatico segun la reivindicacion 27. En un aspecto, la invencion proporciona un codificador de audio para codificar una senal de audio que no es de voz para producir, a partir de ella, un flujo de bits, comprendiendo el codificador de audio:
45 una combinacion de un filtro de codificacion predictiva lineal que tiene una pluralidad de coeficientes de
codificacion predictiva lineal y un convertidor de tiempo-frecuencia, en el que la combinacion esta configurada para filtrar y convertir una trama de la senal de audio en un dominio de la frecuencia con el fin de emitir un espectro basado en la trama y en los coeficientes de codificacion predictiva lineal;
50 un enfatizador de baja frecuencia configurado para calcular un espectro procesado basado en el espectro, en
el que se enfatizan llneas espectrales del espectro procesado que representan una frecuencia mas baja que una llnea espectral de referencia; y
un dispositivo de control configurado para controlar el calculo del espectro procesado mediante el enfatizador
55 de baja frecuencia en funcion de los coeficientes de codificacion predictiva lineal del filtro de codificacion
predictiva lineal.
[0006] Un filtro de codificacion predictiva lineal (filtro LPC) es una herramienta utilizada en el procesamiento de senal de audio y procesamiento de voz para representar la envolvente espectral de una senal digital en tramas de
sonido en forma comprimida, utilizando la informacion de un modelo predictivo lineal.
[0007] Un convertidor de tiempo-frecuencia es una herramienta que convierte en particular una senal digital en tramas desde el dominio del tiempo a un dominio de la frecuencia para estimar un espectro de la senal. El
5 convertidor de tiempo-frecuencia puede utilizar una transformada discreta del coseno modificada (MDCT), que es una transformada superpuesta basada en la transformada discreta del coseno de tipo IV (DCTIV), con la propiedad adicional de estar superpuesta: esta disenada para ser ejecutada en tramas consecutivas de un conjunto de datos mas grande, donde las tramas posteriores se superponen de manera que la ultima mitad de una trama coincide con la primera mitad de la trama siguiente. Esta superposicion, ademas de las cualidades de compactacion de energla
10 de la DCT, hace que la MDCT sea especialmente atractiva para aplicaciones de compresion de senales, ya que ayuda a evitar artefactos provenientes de los llmites de la trama.
[0008] El enfatizador de baja frecuencia esta configurado para calcular un espectro procesado basado en el espectro, en el que se enfatizan las llneas espectrales del espectro procesado que representan una frecuencia mas
15 baja que una llnea espectral de referencia, de manera que solo se enfatizan las frecuencias bajas contenidas en el espectro procesado. La llnea espectral de referencia puede predefinirse sobre la base de la experiencia emplrica.
[0009] El dispositivo de control esta configurado para controlar el calculo del espectro procesado mediante el enfatizador de baja frecuencia en funcion de los coeficientes de codificacion predictiva lineal del filtro de codificacion
20 predictiva lineal. Por lo tanto, el codificador de acuerdo con la invencion no necesita analizar el espectro de la senal de audio con el fin de enfatizar la baja frecuencia. Ademas, puesto que se pueden usar coeficientes de codificacion predictiva lineal identicos en el codificador y en un descodificador posterior, el enfasis de baja frecuencia adaptable es totalmente invertible independientemente de la cuantizacion del espectro siempre y cuando los coeficientes de codificacion predictiva lineal se transmitan al descodificador en el flujo de bits que se produce con el codificador o
25 con cualquier otro medio. En general, los coeficientes de codificacion predictiva lineal tienen que ser transmitidos en el flujo de bits de todos modos con el fin de reconstruir una senal de salida de audio desde el flujo de bits mediante un descodificador respectivo. Por lo tanto, la velocidad binaria del flujo de bits no se incrementara con el enfasis de baja frecuencia como se describe en este documento.
30 [0010] El sistema de enfasis adaptable de baja frecuencia que se describe en el presente documento puede
implementarse en el codificador de nucleo TCX de LO-USAC (EVS), una variante de bajo retardo de xHE-AAc [4] que puede conmutar entre codificacion en el dominio del tiempo y codificacion el dominio MDCT sobre una base por trama.
35 [0011] De acuerdo con una realizacion preferida de la invencion, la trama de la senal de audio es introducida
en el filtro de codificacion predictiva lineal, en el que una trama filtrada es emitida por el filtro de codificacion predictiva lineal y en el que el convertidor de tiempo- frecuencia esta configurado para estimar el espectro en base a la trama filtrada. Por consiguiente, el filtro de codificacion predictiva lineal puede funcionar en el dominio del tiempo, teniendo la senal de audio como entrada.
40
[0012] De acuerdo con una realizacion preferida de la invencion, la trama de la senal de audio es introducida en el convertidor de tiempo-frecuencia, en el que una trama convertida es emitida por el convertidor de tiempo- frecuencia y en el que el filtro de codificacion predictiva lineal esta configurado para estimar el espectro basandose en la trama convertida. Alternativamente, pero de manera equivalente a la primera realizacion del codificador de la
45 invencion que tiene un enfatizador de baja frecuencia, el codificador puede calcular un espectro procesado basado en el espectro de una trama producida mediante un modelado del ruido en el dominio de la frecuencia (FDNS), como se describe por ejemplo en [5]. Mas concretamente, en este punto se modifica el orden de las herramientas: el convertidor de tiempo-frecuencia tal como el mencionado anteriormente puede configurarse para estimar una trama convertida basada en la trama de la senal de audio y el filtro de codificacion predictiva lineal esta configurado para
50 estimar el espectro de audio basado en la trama convertida, que es emitida por el convertidor de tiempo-frecuencia. En consecuencia, el filtro de codificacion predictiva lineal puede funcionar en el dominio de la frecuencia (en lugar del dominio de tiempo), teniendo la trama convertida como entrada, con el filtro de codificacion predictiva lineal aplicado via multiplication mediante una representation espectral de los coeficientes de codificacion predictiva lineal.
55
[0013] Debe ser evidente para los expertos en la tecnica que estas dos estrategias -un filtrado lineal en el dominio del tiempo seguido de una conversion tiempo-frecuencia frente a una conversion tiempo-frecuencia seguido de un filtrado lineal a traves de la ponderacion espectral en el dominio de la frecuencia- pueden ser implementadas de manera que son equivalentes.
[0014] De acuerdo con una realizacion preferida de la invention, el codificador de audio comprende un dispositivo de cuantizacion configurado para producir un espectro cuantizado basado en el espectro procesado y un productor de flujo de bits configurado para incrustar el espectro cuantizado y los coeficientes de codification
5 predictiva lineal en el flujo de bits. La cuantizacion, en el procesamiento de senales digitales, es el proceso de mapear un gran conjunto de valores de entrada en un conjunto mas pequeno (contable), como los valores de redondeo a cierta unidad de precision. Un dispositivo o funcion algorltmica que realiza la cuantizacion se denomina dispositivo de cuantizacion. El productor de flujo de bits puede ser cualquier dispositivo que sea capaz de incrustar datos digitales de fuentes diferentes en un flujo de bits unitario. Mediante estas caracterlsticas, se puede producir 10 facilmente un flujo de bits producido con un enfasis de baja frecuencia adaptable, en el que el enfasis de baja frecuencia adaptable es completamente invertible mediante un descodificador posterior que utiliza unicamente la information que ya esta contenida en el flujo de bits.
[0015] En una realizacion preferida de la invencion, el dispositivo de control comprende un analizador 15 espectral configurado para estimar una representation espectral de los coeficientes de codificacion predictiva lineal,
un analizador de mlnimo-maximo configurado para estimar un mlnimo de la representacion espectral y un maximo de la representacion espectral por debajo de otra llnea espectral de referencia y un calculo de los factores de enfasis configurado para calcular factores de enfasis de llneas espectrales que calculan las llneas espectrales del espectro procesado que representan una frecuencia mas baja que la llnea espectral de referencia basada en el mlnimo y en 20 el maximo, en el que las llneas espectrales del espectro procesado se enfatizan aplicando los factores de enfasis de las llneas espectrales a las llneas espectrales del espectro de la trama filtrada. El analizador espectral puede ser un convertidor de tiempo-frecuencia como se ha descrito anteriormente. La representacion espectral es la funcion de transferencia del filtro de codificacion predictiva lineal y puede ser, pero no tiene que serlo, la misma representacion espectral que la utilizada para FDNS, como se ha descrito anteriormente. La representacion espectral se puede 25 calcular a partir de una transformada discreta de Fourier impar (ODFT) de los coeficientes de codificacion predictiva lineal. En xHE-AAC y LO-USAC, la funcion de transferencia puede ser aproximada por 32 o 64 ganancias en el dominio MDCT que cubren toda la representacion espectral.
[0016] En una realizacion preferida de la invencion, el calculo de los factores de enfasis esta configurado de 30 tal manera que los factores de enfasis de llneas espectrales aumentan en una direction desde la llnea espectral de
referencia hasta la llnea espectral que representa la frecuencia mas baja del espectro. Esto significa que la llnea espectral que representa la frecuencia mas baja se amplifica mas, mientras que la llnea espectral adyacente a la llnea espectral de referencia se amplifica al menos. La llnea espectral de referencia y las llneas espectrales que representan frecuencias mas altas que la llnea espectral de referencia no se enfatizan en absoluto. Esto reduce la 35 complejidad computacional sin desventajas audibles.
[0017] En una realizacion preferida de la invencion, el calculo de los factores de enfasis comprende una primera etapa configurada para calcular un factor de enfasis de base de acuerdo con una primera formula y = (a ■ min/ max)p, en el que a es un primer valor preestablecido, con un valor a > 1, p es un segundo valor preestablecido,
40 con 0 < p <= 1, min es el mlnimo de la representacion espectral, max es el maximo de la representacion espectral, y Y es el factor de enfasis de base y en el que el calculo de los factores de enfasis comprende una segunda etapa configurada para calcular factores de enfasis de llneas espectrales de acuerdo con una segunda formula £i = Yi'-i, en el que i' es un numero de llneas espectrales a enfatizar, i es un Indice de la llnea espectral respectiva, el Indice aumenta con las frecuencias de las llneas espectrales, con i = 0 a i'-1, Y es el factor de enfasis de base y ci es el 45 factor de enfasis de la llnea espectral con el Indice i. El factor de enfasis de base se calcula a partir de una relation del mlnimo y el maximo por la primera formula de una manera facil. El factor de enfasis de base sirve como base para el calculo de todos los factores de enfasis de llneas espectrales, en el que la segunda formula asegura que los factores de enfasis de llneas espectrales aumentan en una direccion desde la llnea espectral de referencia hasta la llnea espectral que representa la frecuencia mas baja del espectro. A diferencia de las soluciones de la tecnica 50 anterior, la solution propuesta no requiere una operation compleja de ralz cuadrada por bandas espectrales o similar. Solo se necesitan 2 operadores de division y 2 de potencia, uno de cada en el lado del codificador y el descodificador.
[0018] En una realizacion preferida de la invencion, el primer valor preestablecido es menor que 42 y mayor 55 que 22, en particular menor que 38 y mayor que 26, mas particularmente menor 34 y mayor que 30. Los intervalos
anteriormente mencionados se basan en experimentos emplricos. Los mejores resultados se pueden alcanzar cuando el primer valor preestablecido se establece en 32.
[0019] En una realizacion preferida de la invencion, el segundo valor preestablecido se determina de acuerdo
con la formula 13 = 1 / (9 ■ i'), en el que i' es un numero de las llneas espectrales enfatizadas, e es un factor entre 3 y 5, en particular entre 3,4 y 4,6, mas concretamente entre 3,8 y 4,2. Estos intervalos tambien se basan en experimentos emplricos. Se ha encontrado que los mejores resultados se pueden alcanzar cuando el segundo valor preestablecido se establece en 4.
5
[0020] En una realizacion preferida de la invencion, la llnea espectral de referencia representa una frecuencia entre 600 Hz y 1000 Hz, en particular entre 700 Hz y 900 Hz, mas particularmente, entre 750 Hz y 850 Hz. Estos intervalos encontrados emplricamente aseguran suficiente enfasis de baja frecuencia as! como una complejidad computacional baja del sistema. Estos intervalos aseguran, en particular, que en espectros densamente poblados,
10 las llneas de mas baja frecuencia se codifican con suficiente precision. En una realizacion preferida, la llnea espectral de referencia representa 800 Hz, en la que se enfatizan 32 llneas espectrales.
[0021] En una realizacion preferida de la invencion, la llnea espectral de referencia adicional representa la misma o mas alta frecuencia que la llnea espectral de referencia. Estas caracterlsticas garantizan que la estimacion
15 del mlnimo y del maximo se realiza en el intervalo de frecuencias pertinente.
[0022] En la realizacion preferida de la invencion, el dispositivo de control esta configurado de tal manera que las llneas espectrales del espectro procesado que representan una frecuencia mas baja que el espectro de referencia se enfatizan solamente si el maximo es menor que el mlnimo multiplicado por a, el primer valor
20 preestablecido. Estas caracterlsticas aseguran que el enfasis de baja frecuencia solo se ejecuta cuando es necesario para que la carga de trabajo del codificador pueda minimizarse y no se desperdicien bits en zonas perceptualmente no importantes durante la cuantizacion espectral.
[0023] En un aspecto, la invencion proporciona un descodificador de audio para descodificar un flujo de bits 25 basado en una serial de audio que no es de voz para producir, a partir del flujo de bits, una serial de salida de audio
que no es de voz descodificada, en particular para descodificar un flujo de bits producido por un codificador de audio segun la invencion, el flujo de bits que contiene espectros cuantizados y una pluralidad de coeficientes de codificacion predictiva lineal, el descodificador de audio que comprende:
30 un receptor de flujo de bits configurado para extraer el espectro cuantizado y los coeficientes de codificacion
predictiva lineal del flujo de bits;
un dispositivo de descuantizacion configurado para producir un espectro descuantizado basado en el espectro cuantizado;
35
un desenfatizador de baja frecuencia configurado para calcular un espectro procesado inverso basado en el espectro descuantizado, en el que se desenfatizan llneas espectrales del espectro procesado inverso que representan una frecuencia mas baja que una llnea espectral de referencia; y
40 un dispositivo de control configurado para controlar el calculo del espectro procesado inverso por el
desenfatizador de baja frecuencia en funcion de los coeficientes de codificacion predictiva lineal contenidos en el flujo de bits.
[0024] El receptor de flujo de bits puede ser cualquier dispositivo que sea capaz de clasificar datos digitales 45 desde un flujo de bits unitario para enviar los datos clasificados a la etapa de procesamiento posterior apropiada. En
particular, el receptor de flujo de bits esta configurado para extraer el espectro cuantizado, que luego se envla al dispositivo de descuantizacion, y los coeficientes de codificacion predictiva lineal, que luego se envlan al dispositivo de control desde el flujo de bits.
50 [0025] El dispositivo de descuantizacion esta configurado para producir un espectro descuantizado basado
en el espectro cuantizado, en el que la descuantizacion es un proceso inverso con respecto a la cuantizacion como se ha explicado anteriormente.
[0026] El desenfatizador de baja frecuencia esta configurado para calcular un espectro procesado inverso
55 basado en el espectro descuantizado, en el que las llneas espectrales del espectro procesado inverso que representan una frecuencia mas baja que una llnea espectral de referencia se desenfatizan de manera que solo las frecuencias bajas contenidas en el espectro procesado inverso se desenfatizan. La llnea espectral de referencia puede predefinirse sobre la base de la experiencia emplrica. Debe observarse que la llnea espectral de referencia del descodificador deberla representar la misma frecuencia que la llnea espectral de referencia del codificador como
se ha explicado anteriormente. Sin embargo, la frecuencia a la que se refiere la llnea espectral de referencia puede almacenarse en el lado del descodificador de modo que no sea necesario transmitir esta frecuencia en el flujo de bits.
5 [0027] El dispositivo de control esta configurado para controlar el calculo del espectro procesado inverso por
el desenfatizador de baja frecuencia en funcion de los coeficientes de codificacion predictiva lineal del filtro de codificacion predictiva lineal. Puesto que se pueden usar coeficientes de codificacion predictivos lineales identicos en el codificador que produce el flujo de bits y en el descodificador, el enfasis de baja frecuencia adaptable es totalmente invertible independientemente de la cuantizacion del espectro siempre y cuando los coeficientes de 10 codificacion predictiva lineal se transmitan al descodificador en el flujo de bits. En general, los coeficientes de codificacion predictiva lineal tienen que ser transmitidos en el flujo de bits de todos modos con el proposito de reconstruir la senal de salida de audio desde el flujo de bits en el descodificador. Por lo tanto, la velocidad binaria del flujo de bits no se incrementara con el enfasis de baja frecuencia y el desenfasis de baja frecuencia como se describe en este documento.
15
[0028] El sistema de desenfasis adaptable de baja frecuencia que se describe en el presente documento
puede implementarse en el codificador de nucleo TCX de LD-USAC, una variante de bajo retardo de xHE-AAC [4] que puede conmutar entre la codificacion en el dominio del tiempo y codificacion el dominio MDCT.
20 [0029] Mediante estas caracterlsticas, un flujo de bits producido con un enfasis de baja frecuencia adaptable
puede descodificarse facilmente, en el que el desenfasis de baja frecuencia adaptable puede ser realizado por el descodificador utilizando unicamente la informacion que ya esta contenida en el flujo de bits.
[0030] De acuerdo con una realizacion preferida de la invencion, el descodificador de audio comprende la
25 combinacion de un convertidor de frecuencia y un filtro de codificacion predictiva lineal inversa que reciben la
pluralidad de coeficientes de codificacion predictiva lineal contenidos en el flujo de bits, en el que la combinacion esta configurada para filtrar inversamente y convertir el espectro procesado inverso en un dominio del tiempo con el fin de emitir la senal de salida basada en el espectro procesado inverso y en los coeficientes de codificacion predictiva lineal.
30
[0031] Un convertidor de tiempo-frecuencia es una herramienta para ejecutar una operation inversa de la
operation de un convertidor de tiempo-frecuencia como se ha explicado anteriormente. Es una herramienta para
convertir en particular un espectro de una senal en un dominio de la frecuencia en una senal digital en tramas en el dominio del tiempo para estimar la senal original. El convertidor de tiempo-frecuencia puede utilizar una
35 transformada discreta del coseno modificada inversa (MDCT inversa), en la que la transformada discreta del coseno modificada es una transformada superpuesta basada en la transformada de coseno discreta de tipo IV (DCT-IV), con la propiedad adicional de estar superpuesta: se ha disenado para ejecutarse en tramas consecutivas de un conjunto de datos mas grande, donde las tramas posteriores se superponen de modo que la ultima mitad de una trama coincida con la primera mitad de la trama siguiente. Esta superposition, ademas de las cualidades de compactacion 40 energetica de la DCT, hace que la MDCT sea especialmente atractivo para aplicaciones de compresion de senales, ya que ayuda a evitar artefactos provenientes de los llmites de la trama. Los expertos en la tecnica comprenderan que son posibles otras transformadas. Sin embargo, la transformada en el descodificador debe ser una transformada inversa de la transformada en el codificador.
45 [0032] Un filtro de codificacion predictiva lineal inversa es una herramienta para ejecutar una operacion
inversa a la operacion realizada por el filtro de codificacion predictiva lineal (filtro LPC) como se ha explicado anteriormente. Es una herramienta utilizada en procesamiento de senales de audio y procesamiento de voz para descodificar la envolvente espectral de una senal digital en tramas con el fin de reconstruir la senal digital, utilizando la informacion de un modelo predictivo lineal. La codificacion predictiva lineal y la descodificacion son 50 completamente invertibles siempre y cuando se utilicen los mismos coeficientes de codificacion predictiva lineal, lo cual puede garantizarse transmitiendo los coeficientes de codificacion predictiva lineal desde el codificador al descodificador incrustado en el flujo de bits como se describe en el presente documento.
[0033] Mediante estas caracterlsticas la senal de salida puede procesarse de una manera facil.
55
[0034] Segun una realizacion preferida de la invencion, el convertidor de tiempo frecuencia esta configurado para estimar una senal de tiempo basada en el espectro procesado inverso, en el que el filtro de codificacion predictiva lineal inverso esta configurado para emitir la senal de salida basada en la senal de tiempo. Por consiguiente, el filtro de codificacion predictiva lineal inversa puede operar en el dominio del tiempo, teniendo el
espectro procesado inverso como entrada.
[0035] Segun una realizacion preferida de la invencion, el filtro de codificacion predictiva lineal inverso esta configurado para estimar una senal filtrada inversa basada en el espectro procesado inverso, en el que el
5 convertidor de tiempo frecuencia esta configurado para emitir la senal de salida basada en la senal filtrada inversa.
[0036] Alternativamente y de forma equivalente y analogo al procedimiento FDNS descrito anteriormente realizado en el lado del codificador, el orden del convertidor de tiempo-frecuencia y del filtro de codificacion predictiva lineal inversa puede invertirse de tal manera que este ultimo se opera primero y en el dominio de
10 frecuencia (en lugar del dominio del tiempo). Mas especlficamente, el filtro de codificacion predictiva lineal inversa puede emitir una senal filtrada inversa basada en el espectro procesado inverso, con el filtro de codificacion predictiva lineal inversa aplicado via multiplicacion (o division) mediante una representacion espectral de los coeficientes de codificacion predictiva lineal como en [5]. De acuerdo con ello, un convertidor de tiempo-frecuencia tal como el mencionado anteriormente puede configurarse para estimar una trama de la senal de salida basada en la 15 senal filtrada inversa, que es introducida en el convertidor de tiempo-frecuencia.
[0037] Debe ser evidente para los expertos en la tecnica que estas dos estrategias -un filtrado lineal inverso en el dominio del tiempo seguido de una conversion tiempo-frecuencia frente a una conversion tiempo-frecuencia seguido de un filtrado lineal a traves de la ponderacion espectral en el dominio del tiempo- pueden ser
20 implementadas de manera que son equivalentes.
[0038] En una realizacion preferida de la invencion, el dispositivo de control comprende un analizador espectral configurado para estimar una representacion espectral de los coeficientes de codificacion predictiva lineal, un analizador mlnimo-maximo configurado para estimar un mlnimo de la representacion espectral y un maximo de la
25 representacion espectral por debajo de otra llnea espectral de referencia y un calculo de los factores de desenfasis configurado para calcular factores de desenfasis de llneas espectrales que calculan las llneas espectrales del espectro procesado inverso que representan una frecuencia mas baja que la llnea espectral de referencia basada en el mlnimo y en el maximo, en el que las llneas espectrales del espectro procesado inverso se desenfatizan aplicando los factores de desenfasis de las llneas espectrales a las llneas espectrales del espectro descuantizado. El 30 analizador espectral puede ser un convertidor de tiempo-frecuencia como se ha descrito anteriormente. La representacion espectral es la funcion de transferencia del filtro de codificacion predictiva lineal y puede ser, pero no tiene que serlo, la misma representacion espectral que la utilizada para FDNS, como se ha descrito anteriormente. La representacion espectral se puede calcular a partir de una transformada discreta de Fourier impar (ODFT) de los coeficientes de codificacion predictiva lineal. En xHE-AAC y LO-USAC, la funcion de transferencia puede ser 35 aproximada por 32 o 64 ganancias en el dominio MOCT que cubren toda la representacion espectral.
[0039] En una realizacion preferida de la invencion, el calculo de los factores de desenfasis esta configurado de tal manera que los factores de desenfasis de las llneas espectrales disminuyen en una direccion desde la llnea espectral de referencia hasta la llnea espectral que representa la frecuencia mas baja del espectro procesado
40 inverso. Esto significa que la llnea espectral que representa la frecuencia mas baja se atenua mas, mientras que la llnea espectral adyacente a la llnea espectral de referencia es la que menos se atenua. La llnea espectral de referencia y las llneas espectrales que representan frecuencias mas altas que la llnea espectral de referencia no se desenfatizan en absoluto. Esto reduce la complejidad computacional sin desventajas audibles.
45 [0040] En una realizacion preferida de la invencion, el calculo de los factores de desenfasis comprende una
primera etapa configurada para calcular un factor de desenfasis de base de acuerdo con una primera formula 5 =(a ■ min/max)-p, en el que a a es un primer valor preestablecido con a > 1, B es un segundo valor preestablecido con 0 < p <= 1, min es el mlnimo de la representacion espectral, max es el maximo de la representacion espectral y 5 es el factor de desenfasis de base, y en el que el calculo de los factores de desenfasis comprende una segunda etapa 50 configurada para calcular los factores de desenfasis de las llneas espectrales de acuerdo con una segunda formula Zi = 5i'-i, en el que i' es un numero de las llneas espectrales a desenfatizar, i es un Indice de la respectiva llnea espectral, el Indice aumenta con las frecuencias de las llneas espectrales, con i = 0 a i'-1, 5 es el factor de desenfasis de la base y Zi es el factor de desenfasis de la llnea espectral con el Indice i. La operation del calculo de los factores de desenfasis es inversa a la operacion del calculo de los factores de enfasis como se ha descrito 55 anteriormente. El factor de desenfasis de base se calcula facilmente a partir de una relation entre el mlnimo y el maximo con la primera formula. El factor de desenfasis de base sirve como base para el calculo de los factores de desenfasis de todas las llneas espectrales, en el que la segunda formula asegura que los factores de desenfasis de las llneas espectrales disminuyen en una direccion desde la llnea espectral de referencia hasta la llnea espectral que representa la frecuencia mas baja del espectro procesado inverso. A diferencia de las soluciones de la tecnica
anterior, la solucion propuesta no requiere una operacion compleja de ralz cuadrada por bandas espectrales o similar. Solo se necesitan 2 operadores de division y 2 de potencia, uno de cada en el lado del codificador y el descodificador.
5 [0041] En una realizacion preferida de la invencion, el primer valor preestablecido es menor que 42 y mayor
que 22, en particular menor que 38 y mayor que 26, mas particularmente menor 34 y mayor que 30. Los intervalos anteriormente mencionados se basan en experimentos emplricos. Los mejores resultados se pueden alcanzar cuando el primer valor preestablecido se establece en 32. Observese que el primer valor preestablecido del descodificador debe ser el mismo que el primer valor preestablecido del codificador.
10
[0042] En una realizacion preferida de la invencion, el segundo valor preestablecido se determina de acuerdo con la formula p = 1 / (0 ■ i'), en la que i' es el numero de las llneas espectrales que se desenfatizan, e es un factor entre 3 y 5, en particular entre 3,4 y 4,6, mas particularmente, entre 3,8 y 4,2. Los mejores resultados se pueden alcanzar cuando el segundo valor preestablecido se establece en 4. Observese que el segundo valor preestablecido
15 del descodificador debe ser el mismo que el segundo valor preestablecido del codificador.
[0043] En una realizacion preferida de la invencion, la llnea espectral de referencia representa una frecuencia entre 600 Hz y 1000 Hz, en particular entre 700 Hz y 900 Hz, mas particularmente, entre 750 Hz y 850 Hz. Estos intervalos encontrados emplricamente aseguran suficiente enfasis de baja frecuencia as! como una complejidad
20 computacional baja del sistema. Estos intervalos aseguran, en particular, que en espectros densamente poblados, las llneas de mas baja frecuencia se codifican con suficiente precision. En una realizacion preferida, la llnea espectral de referencia representa 800 Hz, en la que se enfatizan 32 llneas espectrales. Es obvio que la llnea espectral de referencia del descodificador deberla representar la misma frecuencia que la llnea espectral de referencia del codificador.
25
[0044] En una realizacion preferida de la invencion, la llnea espectral de referencia adicional representa la misma o mas alta frecuencia que la llnea espectral de referencia. Estas caracterlsticas garantizan que la estimacion del mlnimo y del maximo se realiza en el intervalo de frecuencias pertinente, como es el caso en el codificador.
30 [0045] En una realizacion preferida de la invencion, el dispositivo de control esta configurado de tal manera
que las llneas espectrales del espectro procesado inverso que representan una frecuencia mas baja que la llnea espectral de referencia se desenfatizan solo si el maximo es menor que el mlnimo multiplicado por el primer valor preestablecido a. Estas caracterlsticas aseguran que el desenfasis de baja frecuencia solo se ejecuta cuando se necesita para que la carga de trabajo del descodificador pueda minimizarse y no se desperdicien bits en zonas
35 perceptualmente irrelevantes durante la cuantizacion.
[0046] En un aspecto, la invencion proporciona un sistema que comprende un descodificador y un
codificador, en el que el codificador esta disenado de acuerdo con la invencion y/o el descodificador esta disenado de acuerdo con la invencion.
40
[0047] En un aspecto, la invencion proporciona un procedimiento para codificar una senal de audio que no es de voz para producir, a partir de ella, un flujo de bits, el procedimiento que comprende:
filtrar con un filtro de codificacion predictiva lineal que tiene una pluralidad de coeficientes de codificacion
45 predictiva lineal y convertir una trama de la senal de audio en un dominio de la frecuencia con el fin de emitir
un espectro basado en la trama y en los coeficientes de codificacion predictiva lineal;
calcular un espectro procesado basado en el espectro de la trama filtrada, en el que se enfatizan llneas espectrales del espectro procesado que representan una frecuencia mas baja que una llnea espectral de
50 referencia; y
controlar el calculo del espectro procesado en funcion de los coeficientes de codificacion predictiva lineal del filtro de codificacion predictiva lineal.
55 [0048] En un aspecto, la invencion proporciona un procedimiento para descodificar un flujo de bits basado en
una senal de audio que no es de voz para producir, a partir del flujo de bits, una senal de salida de audio que no es de voz, en particular para descodificar un flujo de bits producido mediante el procedimiento segun la reivindicacion anterior, el flujo de bits que contiene espectros cuantizados y una pluralidad de coeficientes de codificacion predictiva lineal, el procedimiento que comprende las etapas:
extraer el espectro cuantizado y los coeficientes de codificacion predictiva lineal del flujo de bits;
producir un espectro descuantizado basado en el espectro cuantizado;
5
calcular un espectro procesado inverso basado en el espectro descuantizado, en el que se desenfatizan llneas espectrales del espectro procesado inverso que representan una frecuencia mas baja que una llnea espectral de referencia; y
10 controlar el calculo del espectro procesado inverso en funcion de los coeficientes de codificacion predictiva
lineal contenidos en el flujo de bits.
[0049] En un aspecto, la invencion proporciona un programa informatico para llevar a cabo, cuando se ejecuta en un ordenador o un procesador, el procedimiento de la invencion.
15
[0050] A continuacion se analizan realizaciones preferidas con respecto a los dibujos adjuntos en los que:
La Fig. 1a ilustra una primera realizacion de un codificador de audio segun la invencion;
20 La Fig. 1 b ilustra una segunda realizacion de un codificador de audio segun la invencion;
La Fig. 2 ilustra un primer ejemplo de enfasis de baja frecuencia ejecutado por un codificador de audio segun la invencion;
25 La Fig. 3 ilustra un segundo ejemplo de enfasis de baja frecuencia ejecutado por un codificador de audio
segun la invencion;
La Fig. 4 ilustra un tercer ejemplo de enfasis de baja frecuencia ejecutado por un codificador de audio segun la invencion;
30
La Fig. 5a ilustra una primera realizacion de un descodificador de audio segun la invencion;
La Fig. 5b ilustra una segunda realizacion de un descodificador de audio segun la invencion;
35 La Fig. 6 ilustra un primer ejemplo de desenfasis de baja frecuencia ejecutado por un descodificador de audio
segun la invencion;
La Fig. 7 ilustra un segundo ejemplo de desenfasis de baja frecuencia ejecutado por un descodificador de audio segun la invencion; y 40
La Fig. 8 ilustra un tercer ejemplo de desenfasis de baja frecuencia ejecutado por un descodificador de audio segun la invencion.
[0051] La Fig. 1a ilustra una primera realizacion de un codificador de audio 1 segun la invencion. El 45 codificador de audio 1 para codificar una senal de audio AS que no es de voz para producir, a partir de ella, un flujo
de bits BS comprende
una combinacion 2, 3 de un filtro de codificacion predictiva lineal 2 que tiene una pluralidad de coeficientes LC de codificacion predictiva lineal y un convertidor de tiempo-frecuencia 3, en el que la combinacion 2, 3 esta 50 configurada para filtrar y convertir una trama Fl de la senal de audio AS en un dominio de la frecuencia con el
fin de emitir un espectro SP basado en la trama Fl y en los coeficientes de codificacion predictiva lineal LC; un enfatizador de baja frecuencia 4 configurado para calcular un espectro procesado PS basado en el espectro SP, en el que se enfatizan las llneas espectrales SL (vease la Fig. 2) del espectro procesado PS que representan una frecuencia mas baja que la llnea espectral de referencia RSL (vease la Fig. 2) ; y 55 un dispositivo de control 5 configurado para controlar el calculo del espectro procesado PS mediante el
enfatizador de baja frecuencia 4 en funcion de los coeficientes de codificacion predictiva lineal LC del filtro de codificacion predictiva lineal 2.
[0052] Un filtro de codificacion predictiva lineal (filtro LPC) 2 es una herramienta utilizada en el procesamiento
de senales de audio y procesamiento de voz para representar la envolvente espectral de una senal digital en tramas de sonido en forma comprimida, utilizando la informacion de un modelo predictivo lineal.
[0053] Un convertidor de tiempo-frecuencia 3 es una herramienta que convierte en particular una senal digital 5 en tramas desde el dominio del tiempo a un dominio de la frecuencia para estimar un espectro de la senal. El
convertidor de tiempo-frecuencia 3 puede utilizar una transformada discreta del coseno modificada (MDCT), que es una transformada superpuesta basada en la transformada discreta del coseno de tipo IV (DCTIV), con la propiedad adicional de estar superpuesta: esta disenada para ejecutarse en tramas consecutivas de un conjunto de datos mas grande, donde las tramas posteriores se superponen de manera que la ultima mitad de una trama coincide con la 10 primera mitad de la trama siguiente. Esta superposicion, ademas de las cualidades de compactacion de energla de la DCT, hace que la MDCT sea especialmente atractiva para aplicaciones de compresion de senales, ya que ayuda a evitar artefactos provenientes de los llmites de la trama.
[0054] El enfatizador de baja frecuencia 4 esta configurado para calcular un espectro procesado PS basado 15 en el espectro SP de la trama filtrada FF, en el que se enfatizan las llneas espectrales SL del espectro procesado
PS que representan una frecuencia mas baja que la llnea espectral de referencia RSL, de modo que se enfatizan unicamente las frecuencias bajas contenidas en el espectro procesado PS. La llnea espectral de referencia RSL puede predefinirse basandose en la experiencia emplrica.
20 [0055] El dispositivo de control 5 esta configurado para controlar el calculo del espectro procesado SP por el
enfatizador de baja frecuencia 4 en funcion de los coeficientes de codificacion predictiva lineal LC del filtro de codificacion predictiva lineal 2. Por lo tanto, el codificador 1 de acuerdo con la invencion no necesita analizar el espectro SP de la senal de audio AS con el fin de enfatizar la baja frecuencia. Ademas, puesto que se pueden usar coeficientes LC de codificacion predictiva lineal identicos en el codificador 1 y en un descodificador posterior 12 25 (vease la Fig. 5), el enfasis de baja frecuencia adaptable es totalmente invertible independientemente de la cuantizacion del espectro siempre y cuando los coeficientes de codificacion predictiva lineal LC se transmitan al descodificador 12 en el flujo de bits BS que es producido mediante el codificador 1 o por cualquier otro medio. En general, los coeficientes de codificacion predictiva lineal LC tienen que ser transmitidos en el flujo de bits BS de todos modos con el proposito de reconstruir una senal de salida de audio OS (vease la Fig. 5) desde el flujo de bits 30 BS mediante un descodificador respectivo 12. Por lo tanto, la velocidad binaria del flujo de bits BS no aumentara por el enfasis de baja frecuencia como se describe en el presente documento.
[0056] El sistema de enfasis de baja frecuencia adaptable descrito en el presente documento puede implementarse en el codificador de nucleo TCX de LD-USAC, una variante de bajo retardo de xHE-AAC [4] que
35 puede conmutar entre codificacion en el dominio del tiempo y en el dominio MDCT en un base por trama.
[0057] De acuerdo con una realizacion preferida de la invencion, la trama Fl de la senal de audio AS se introduce en el filtro de codificacion predictiva lineal 2, en el que una trama filtrada FF es emitida por el filtro de codificacion predictiva lineal 2 y en el que el convertidor de tiempo-frecuencia 3 esta configurado para estimar el
40 espectro SP basado en la trama filtrada FF.Por consiguiente, el filtro de codificacion predictiva lineal 2 puede operar en el dominio del tiempo, teniendo la senal de audio AS como entrada.
[0058] De acuerdo con una realizacion preferida de la invencion, el codificador de audio 1 comprende un dispositivo de cuantizacion 6 configurado para producir un espectro cuantizado QS basado en el espectro procesado
45 BS y un productor de flujo de bits 7 y configurado para incrustar el espectro cuantizado QS y los coeficientes de codificacion predictiva lineal LC en el flujo de bits BS. La cuantizacion, en el procesamiento de senales digitales, es el proceso de mapear un gran conjunto de valores de entrada en un conjunto mas pequeno (contable), como los valores de redondeo a cierta unidad de precision. Un dispositivo o funcion algorltmica que realiza la cuantizacion se denomina dispositivo de cuantizacion 6. El productor de flujo de bits 7 puede ser cualquier dispositivo que sea capaz 50 de incrustar datos digitales de fuentes diferentes 2, 6 en un flujo de bits unitario BS. Mediante estas caracterlsticas, se puede producir facilmente un flujo de bits BS producido con un enfasis de baja frecuencia adaptable, en el que el enfasis de baja frecuencia adaptable es completamente invertible mediante un descodificador posterior 12 que utiliza unicamente la informacion que ya esta contenida en el flujo de bits BS.
55 [0059] En una realizacion preferida de la invencion, el dispositivo de control 5 comprende un analizador
espectral 8 configurado para estimar una representacion espectral SR de los coeficientes de codificacion predictiva lineal LC, un analizador mlnimo-maximo 9 configurado para estimar un mlnimo MI de la representacion espectral SR y un maximo MA de la representacion espectral SR por debajo de otra llnea espectral de referencia y un calculo de los factores de enfasis 10, 11 configurado para calcular factores de enfasis de llneas espectrales SEF que calculan
las ilneas espectrales SL del espectro procesado PS que representan una frecuencia mas baja que la llnea espectral de referencia RSL basada en el mlnimo MI y en el maximo MA, en el que las llneas espectrales SL del espectro procesado PS se enfatizan aplicando los factores de enfasis de las llneas espectrales SL a las llneas espectrales del espectro SP de la trama filtrada FF. El analizador espectral puede ser un convertidor de tiempo-frecuencia como se 5 ha descrito anteriormente. La representacion espectral SR es la funcion de transferencia del filtro de codificacion predictiva lineal 2. La representacion espectral SR se puede calcular a partir de una transformada discreta de Fourier impar (ODFT) de los coeficientes de codificacion predictiva lineal. En xHE-AAC y LO-USAC, la funcion de transferencia puede ser aproximada por 32 o 64 ganancias en el dominio MDCT que cubren toda la representacion espectral SR.
10
[0060] En una realizacion preferida de la invencion, el calculo de los factores de enfasis 10, 11 esta configurado de tal manera que los factores de enfasis de llneas espectrales SEF aumentan en una direccion desde la llnea espectral de referencia RSL hasta la llnea espectral SL0 que representa la frecuencia mas baja del espectro PS. Esto significa que la llnea espectral SL0 que representa la frecuencia mas baja se amplifica mas, mientras que
15 la llnea espectral SLi'-1 adyacente a la llnea espectral de referencia es la que se amplifica menos. La llnea espectral de referencia RSL y las llneas espectrales SLi'+1 que representan frecuencias mas altas que la llnea espectral de referencia RSL no se enfatizan en absoluto. Esto reduce la complejidad computacional sin desventajas audibles.
[0061] En una realizacion preferida de la invencion, el calculo de los factores de enfasis 10, 11 comprende 20 una primera etapa 10 configurada para calcular un factor de enfasis de base BEF de acuerdo con una primera
formula y = (a ■ min/ max)p, en el que a es un primer valor preestablecido, con un a > 1, p es un segundo valor preestablecido, con 0 < p <= 1, min es el mlnimo MI de la representacion espectral, max es el maximo MA de la representacion espectral, y y es el factor de enfasis de base BEF y en el que el calculo de los factores de enfasis 10, 11 comprende una segunda etapa 11 configurada para calcular factores de enfasis de llneas espectrales SEF de 25 acuerdo con una segunda formula si = Yi-i, en el que i' es un numero de llneas espectrales SL a enfatizar, i es un Indice de la llnea espectral respectiva SL, el Indice aumenta con las frecuencias de las llneas espectrales SL, con i = 0 a i'-1, Y es el factor de enfasis de base BEF y si es el factor de enfasis de la llnea espectral SEF con el Indice i. El factor de enfasis de base se calcula facilmente a partir de una relacion en el mlnimo y el maximo con la primera formula. El factor de enfasis de base BEF sirve como base para el calculo de todos los factores de enfasis de llneas 30 espectrales SEF, en el que la segunda formula asegura que los factores de enfasis de llneas espectrales SEF aumentan en una direccion desde la llnea espectral de referencia RSL hasta la llnea espectral SL0 que representa la frecuencia mas baja del espectro. A diferencia de las soluciones de la tecnica anterior, la solucion propuesta no requiere una operacion compleja de ralz cuadrada por bandas espectrales o similar. Solo se necesitan 2 operadores de division y 2 de potencia, uno de cada en el lado del codificador y el descodificador.
35
[0062] En una realizacion preferida de la invencion, el primer valor preestablecido es menor que 42 y mayor que 22, en particular menor que 38 y mayor que 26, mas particularmente menor 34 y mayor que 30. Los intervalos anteriormente mencionados se basan en experimentos emplricos. Los mejores resultados se pueden alcanzar cuando el primer valor preestablecido se establece en 32.
40
[0063] En una realizacion preferida de la invencion, el segundo valor preestablecido se determina de acuerdo con la formula p = 1 / (0 ■ i'), en el que i' es un numero de las llneas espectrales SL enfatizadas, 0 es un factor entre 3 y 5, en particular entre 3,4 y 4,6, mas concretamente entre 3,8 y 4,2. Estos intervalos tambien se basan en experimentos emplricos. Se ha encontrado que los mejores resultados se pueden alcanzar cuando el segundo valor
45 preestablecido se establece en 4.
[0064] En una realizacion preferida de la invencion, la llnea espectral de referencia RSL representa una frecuencia entre 600 Hz y 1000 Hz, en particular entre 700 Hz y 900 Hz, mas particularmente, entre 750 Hz y 850 Hz. Estos intervalos encontrados emplricamente aseguran suficiente enfasis de baja frecuencia as! como una
50 complejidad computacional baja del sistema. Estos intervalos aseguran, en particular, que en espectros densamente poblados, las llneas de mas baja frecuencia se codifican con suficiente precision. En una realizacion preferida, la llnea espectral de referencia representa 800 Hz, en la que se enfatizan 32 llneas espectrales.
[0065] El calculo de los factores de enfasis de las llneas espectrales SEF puede hacerse mediante la entrada 55 siguiente de codigo de programa:
max = tmp = lpcGains[0];
/* find minimum (tmp) and maximum (max) of LPC gains in low frequencies */ for (i = 1; i <: 9; i + + ) {
if (tmp > lpcGainsti]) { tmp — lpcGainsti];
}
if (max < lpcGains[i]) { max = lpcGainsti];
}
}
tmp 32.Of;
if ((max < tmp) && (max > FLT_MIN)) (
fac = tmp = (float)pow(tmp / max, 0.0078125f);
/* gradual boosting of lowest 32 bins; DC is boosted by (tmp/max)*1/4 */ fox (i =31; i >= 0; i--) { ’
x[i] *= fac; fac *= tmp;
} '
}
[0066] En una realization preferida de la invencion, la llnea espectral de referenda adicional representa una frecuencia mas alta que la llnea espectral de referencia RSL. Estas caracterlsticas garantizan que la estimacion del
5 mlnimo MI y del maximo MA se realiza en el intervalo de frecuencias pertinente.
[0067] La Fig. 1b ilustra una segunda realizacion de un codificador de audio 1 segun la invencion; La segunda realizacion se basa en la primera realizacion. A continuacion se explican unicamente las diferencias entre las dos realizaciones.
10
[0068] De acuerdo con una realizacion preferida de la invencion, la trama FI de la senal de audio AS es introducida en el convertidor de tiempo-frecuencia 3, en el que una trama convertida CF es emitida por el convertidor de tiempo-frecuencia 3 y en el que el filtro de codificacion predictiva lineal 2 esta configurado para estimar el espectro SP basandose en la trama convertida CF. Alternativamente, pero de manera equivalente a la primera
15 realizacion del codificador 1 de la invencion que tiene un enfatizador de baja frecuencia, el codificador 1 puede calcular un espectro procesado PS basado en el espectro SP de una trama producida mediante un modelado del ruido en el dominio de la frecuencia (FDNS), como se describe por ejemplo en [5]. Mas concretamente, en este punto se modifica el orden de las herramientas: el convertidor de tiempo-frecuencia 3 tal como el mencionado anteriormente puede configurarse para estimar una trama convertida FC basada en la trama FI de la senal de audio 20 AS y el filtro de codificacion predictiva lineal 2 esta configurado para estimar el espectro de audio SP basado en la trama convertida FC, que es emitida por el convertidor de tiempo-frecuencia 3. En consecuencia, el filtro de codificacion predictiva lineal 2 puede funcionar en el dominio de la frecuencia (en lugar del dominio de tiempo), teniendo la trama convertida FC como entrada, con el filtro de codificacion predictiva lineal 2 aplicado via multiplicacion mediante una representacion espectral de los coeficientes de codificacion predictiva lineal LC.
25
[0069] Debe ser evidente para los expertos en la tecnica que la primera y segunda realizacion -un filtrado lineal en el dominio del tiempo seguido de una conversion tiempo-frecuencia frente a una conversion tiempo- frecuencia seguido de un filtrado lineal a traves de la ponderacion espectral en el dominio de la frecuencia- se pueden implementar de manera que son equivalentes.
30
[0070] La Fig. 2 ilustra un primer ejemplo de enfasis de baja frecuencia ejecutado por un codificador segun la invencion. La Fig. 2 muestra un espectro ejemplar SP, factores de enfasis de llneas espectrales ejemplares SEF y un espectro procesado ejemplar SP en un sistema de coordenadas comun, en el que la frecuencia se representa en funcion del eje x y la amplitud en funcion de la frecuencia se representa en el eje y. Se amplifican las llneas
35 espectrales SL0 a SLi'-1, que representan frecuencias mas bajas a la llnea espectral de referencia RSL, mientras que la llnea espectral de referencia RSL y la llnea espectral SLi'+ 1, que representa una frecuencia mas alta que el espectro de referencia RSL, no se amplifican. La Fig. 2 muestra una situacion en la que la relacion del Ml mlnimo y mA maximo de la representacion espectral SR de los coeficientes de codificacion predictiva lineal LC es cercana a 1.
Por lo tanto, un factor maximo de entasis de ilnea espectral SEF para la ilnea espectral SL0 es aproximadamente 2,5.
[0071] La Fig. 3 ilustra un segundo ejemplo de entasis de baja frecuencia ejecutado por un codificador segun
5 la invencion. La diferencia con el entasis de baja frecuencia como se indica en la Fig. 2 es que la relacion del Ml mlnimo y MA maximo de la representacion espectral SR de los coeficientes de codificacion predictiva lineal LC es menor. Por lo tanto, un factor maximo de enfasis de llnea espectral SEF para la llnea espectral SL0 es menor, por ejemplo, aproximadamente 2,0.
10 [0072] La Fig. 4 ilustra un tercer ejemplo de enfasis de baja frecuencia ejecutado por un codificador segun la
invencion; En la realizacion preferida de la invencion, el dispositivo de control 5 esta configurado de tal manera que las llneas espectrales SL del espectro procesado SP que representan una frecuencia mas baja que el espectro de referencia RSL se enfatizan solamente si el maximo es menor que el mlnimo multiplicado por el primer valor preestablecido. Estas caracterlsticas aseguran que el enfasis de baja frecuencia solo se ejecuta cuando es 15 necesario para que la carga de trabajo del codificador pueda minimizarse En la Fig. 4 estas condiciones se cumplen de manera que no se ejecuta el enfasis de baja frecuencia.
[0073] La Fig. 5a ilustra una realizacion de un descodificador segun la invencion; El descodificador de audio 12 configurado para descodificar un flujo de bits BS basado en una senal de audio que no es de voz de manera que
20 produce, a partir del flujo de bits BS, una senal de salida de audio que no es de voz OS, en particular para descodificar un flujo de bits BS producido por un codificador de audio 1 segun la invencion, en el que el flujo de bits BS contiene espectros cuantizados QS y una pluralidad de coeficientes de codificacion predictiva lineal LC. El descodificador de audio 12 comprende:
25 un receptor de flujo de bits 13 configurado para extraer el espectro cuantizado QS y los coeficientes de
codificacion predictiva lineal LC del flujo de bits BS;
un dispositivo de descuantizacion 14 configurado para producir un espectro descuantizado DQ basado en el espectro cuantizado QS;
30
un desenfatizador de baja frecuencia 15 configurado para calcular un espectro procesado inverso RS basado en el espectro descuantizado DQ, en el que se desenfatizan llneas espectrales SLD del espectro procesado inverso RS que representan una frecuencia mas baja que una llnea espectral de referencia RSLD; y
35 un dispositivo de control 16 configurado para controlar el calculo del espectro procesado inverso RS por el
desenfatizador de baja frecuencia 15 en funcion de los coeficientes de codificacion predictiva lineal LC contenidos en el flujo de bits BS.
[0074] El receptor de flujo de bits 13 puede ser cualquier dispositivo que sea capaz de clasificar datos 40 digitales desde un flujo de bits unitario BS para enviar los datos clasificados a la etapa de procesamiento posterior
apropiada. En particular, el receptor de flujo de bits 13 esta configurado para extraer el espectro cuantizado QS, que luego se envla al dispositivo de descuantizacion 14, y los coeficientes de codificacion predictiva lineal LC, que luego se envlan al dispositivo de control 16 desde el flujo de bits BS.
45 [0075] El dispositivo de descuantizacion 16 esta configurado para producir un espectro descuantizado DQ
basado en el espectro cuantizado QS, en el que la descuantizacion es un proceso inverso con respecto a la cuantizacion como se ha explicado anteriormente.
[0076] El desenfatizador de baja frecuencia 15 esta configurado para calcular un espectro procesado inverso 50 RS basado en el espectro descuantizado QS, en el que las llneas espectrales SLD del espectro procesado inverso
RS que representan una frecuencia mas baja que una llnea espectral de referencia RSLD se desenfatizan de manera que solo las frecuencias bajas contenidas en el espectro procesado inverso RS se desenfatizan. La llnea espectral de referencia RSLD puede predefinirse basandose en la experiencia emplrica. Debe observarse que la llnea espectral de referencia RSLD del descodificador 12 deberla representar la misma frecuencia que la llnea 55 espectral de referencia RSL del codificador 1 como se ha explicado anteriormente. Sin embargo, la frecuencia a la que se refiere la llnea espectral de referencia RSLD puede almacenarse en el lado del descodificador de modo que no sea necesario transmitir esta frecuencia en el flujo de bits BS.
[0077] El dispositivo de control 16 esta configurado para controlar el calculo del espectro procesado inverso
RS por el desenfatizador de baja frecuencia 15 en funcion de los coeficientes de codificacion predictiva lineal LS del filtro de codificacion predictiva lineal 2. Puesto que se pueden usar coeficientes de codificacion predictivos lineales LC identicos en el codificador 1 que produce el flujo de bits BS y en el descodificador 12, el enfasis de baja frecuencia adaptable es totalmente invertible independientemente de la cuantizacion del espectro siempre y cuando 5 los coeficientes de codificacion predictiva lineal se transmitan al descodificador 12 en el flujo de bits BS. En general, los coeficientes de codificacion predictiva lineal LC tienen que ser transmitidos en el flujo de bits BS de todos modos con el proposito de reconstruir la senal de salida de audio OS desde el flujo de bits BS en el descodificador 12. Por lo tanto, la velocidad binaria del flujo de bits BS no se incremental con el enfasis de baja frecuencia y el desenfasis de baja frecuencia como se describe en este documento.
10
[0078] El sistema de desenfasis de baja frecuencia adaptable descrito en el presente documento puede
implementarse en el codificador de nucleo TCX de LD-USAC, una variante de bajo retardo de xHE-AAC [4] que puede conmutar entre codificacion en el dominio del tiempo y en el dominio MDCT en un base por trama.
15 [0079] Mediante estas caracterlsticas, un flujo de bits BS producido con un enfasis de baja frecuencia
adaptable puede descodificarse facilmente, en el que el desenfasis de baja frecuencia adaptable puede ser realizado por el descodificador 12 utilizando unicamente la informacion que esta contenida en el flujo de bits BS.
[0080] De acuerdo con una realizacion preferida de la invencion, el descodificador de audio 12 comprende la
20 combinacion 17,18 de un convertidor de frecuencia 17 y un filtro de codificacion predictiva lineal inversa 18 que
reciben la pluralidad de coeficientes de codificacion predictiva lineal LC contenidos en el flujo de bits BS, en el que la combinacion 17, 18 esta configurada para filtrar inversamente y convertir el espectro procesado inverso RS en un dominio del tiempo con el fin de emitir la senal de salida OS basada en el espectro procesado inverso RS y en los coeficientes de codificacion predictiva lineal LC.
25
[0081] Un convertidor de tiempo-frecuencia 17 es una herramienta para ejecutar una operacion inversa de la operacion de un convertidor de tiempo-frecuencia 3 como se ha explicado anteriormente. Es una herramienta para convertir en particular un espectro de una senal en un dominio de la frecuencia en una senal digital en tramas en el dominio del tiempo para estimar la senal original. El convertidor de tiempo-frecuencia puede utilizar una
30 transformada discreta del coseno modificada inversa (MDCT inversa), en la que la transformada discreta del coseno modificada es una transformada superpuesta basada en la transformada de coseno discreta de tipo IV (DCT-IV), con la propiedad adicional de estar superpuesta: se ha disenado para ejecutarse en tramas consecutivas de un conjunto de datos mas grande, donde las tramas posteriores se superponen de modo que la ultima mitad de una trama coincida con la primera mitad de la trama siguiente. Esta superposition, ademas de las cualidades de compactacion
35 de energla de la DCT, hace que la MDCT sea especialmente atractiva para aplicaciones de compresion de senales, ya que ayuda a evitar artefactos derivados de los llmites de la trama. Los expertos en la tecnica comprenderan que son posibles otras transformadas. Sin embargo, la transformada en el descodificador 12 debe ser una transformada inversa de la transformada en el codificador 1.
40 [0082] Un filtro de codificacion predictiva lineal inversa 18 es una herramienta para ejecutar una operacion
inversa a la operacion realizada por el filtro de codificacion predictiva lineal (filtro LPC) 2 como se ha explicado anteriormente. Es una herramienta utilizada en procesamiento de senales de audio y de voz para descodificar la envolvente espectral de una senal digital en tramas con el fin de reconstruir la senal digital, utilizando la informacion de un modelo predictivo lineal. La codificacion predictiva lineal y la descodificacion son completamente invertibles
45 siempre que se utilicen los mismos coeficientes de codificacion predictiva lineal, lo cual puede garantizarse transmitiendo los coeficientes de codificacion predictiva lineal LC desde el codificador 1 al descodificador 12 incrustado en el flujo de bits BS como se describe en el presente documento.
[0083] Mediante estas caracterlsticas la senal de salida OS puede ser procesada de una manera facil.
50
[0084] De acuerdo con una realizacion preferida de la invencion, el convertidor de frecuencia-tiempo 17 esta configurado para estimar una senal de tiempo TS basada en el espectro procesado inverso RS, en el que el filtro de codificacion predictiva lineal inverso 18 esta configurado para emitir la senal de salida OS basada en el tiempo Senal TS. Por consiguiente, el filtro de codificacion predictiva lineal inverso 18 puede funcionar en el dominio del tiempo,
55 teniendo la senal de tiempo TS como su entrada.
[0085] En una realizacion preferida de la invencion, el dispositivo de control 16 comprende un analizador espectral 19 configurado para estimar una representation espectral SR de los coeficientes de codificacion predictiva lineal LC, un analizador de mlnimo-maximo 20 configurado para estimar un Ml mlnimo de la representacion espectral
SR y a MA maxima de la representacion espectral SR por debajo de otra ilnea espectral de referenda y un calculo del factor de desenfasis 21, 22 configurado para calcular factores de desenfasis de llneas espectrales SDF para calcular las llneas espectrales SLD del espectro procesado inverso RS que representa una frecuencia inferior a la llnea espectral de referencia RSLD basada en el Ml mlnimo y en la MA maxima, en la que las llneas espectrales 5 SLD del espectro procesado inverso RS se desenfatizan aplicando los factores de desenfasis de la llnea espectral SDF a las llneas espectrales del espectro descuantizado OQ. El analizador espectral puede ser un convertidor de frecuencia de tiempo como se ha descrito anteriormente. La representacion espectral es la funcion de transferencia del filtro de codificacion predictiva lineal. La representacion espectral se puede calcular a partir de una transformada discreta de Fourier impar (ODFT) de los coeficientes de codificacion predictiva lineal. En xHE-AAC y LO-USAC, la
10 funcion de transferencia puede ser aproximada por 32 o 64 ganancias en el dominio MOCT que cubren toda la representacion espectral.
[0086] En una realizacion preferida de la invencion, el calculo de los factores de desenfasis esta configurado de tal manera que los factores de desenfasis de llneas espectrales disminuyen en una direccion desde la llnea
15 espectral de referencia hasta la llnea espectral que representa la frecuencia mas baja del espectro de proceso inverso. Esto significa que la llnea espectral que representa la frecuencia mas baja se atenua mas, mientras que la llnea espectral adyacente a la llnea espectral de referencia es la que menos se atenua. La llnea espectral de referencia y las llneas espectrales que representan frecuencias mas altas que la llnea espectral de referencia no se desenfatizan en absoluto. Esto reduce la complejidad computacional sin desventajas audibles.
20
[0087] En una realizacion preferida de la invencion, el calculo de factores de desenfasis 21, 22 comprende una primera etapa 21 configurada para calcular un factor BDF de desenfasis de base de acuerdo con una primera formula 5 = (a.min/rnax)-p, en la que a es un primer valor preestablecido, con a > 1, p es un segundo valor preestablecido, con 0 < p <= 1, min es el Ml mlnimo de la representacion espectral SR, max es el MA maximo de la
25 representacion espectral SR y 5 es el factor de desenfasis de base BDF, y en el que el calculo de factores de desenfasis 21, 22 comprende una segunda etapa 22 configurada para calcular los factores de desenfasis de las llneas espectrales SDF de acuerdo con una segunda formula ^i = 5i'-i, donde i' es un numero de las llneas espectrales SLD a desenfatizar, i es un Indice de la llnea espectral respectiva SLD, el Indice aumenta con las frecuencias de las llneas espectrales SLD, con i = 0 a i'-1, 5 es el factor de desenfasis de la base y ^i es el factor de
30 desenfasis de la llnea espectral SDF con el Indice i. El funcionamiento del calculador 21, 22 de factor de desenfasis es inverso al funcionamiento del calculador de factor de enfasis 10, 11 como se ha descrito anteriormente. El factor de desenfasis de base BDF se calcula a partir de una relacion en el Ml mlnimo y el MA maximo por la primera formula de una manera facil. El factor de desenfasis de base BDF sirve como base para el calculo de todos los factores de desenfasis de la llnea espectral SDF, en el que la segunda formula asegura que los factores de
35 desenfasis de la llnea espectral SDF disminuyen en una direccion desde la llnea espectral de referencia RSLD hasta la llnea espectral SL0 que representa la frecuencia mas baja del espectro procesado inverso RS. En contraste con las soluciones de la tecnica anterior, la solucion propuesta no requiere una operacion de complejo cuadratico o de ralz cuadrada por banda espectral. solo se necesitan 2 operadores de division y 2 de potencia, uno de cada uno en el codificador y el lado del descodificador.
40
[0088] En una realizacion preferida de la invencion, el primer valor preestablecido es menor que 42 y mayor que 22, en particular menor que 38 y mayor que 26, mas particularmente menor 34 y mayor que 30. Los intervalos anteriormente mencionados se basan en experimentos emplricos. Los mejores resultados se pueden alcanzar cuando el primer valor preestablecido se establece en 32. Observese que el primer valor preestablecido del
45 descodificador 12 deberla ser el mismo que el primer valor preestablecido del codificador 1.
[0089] En una realizacion preferida de la invencion, el segundo valor preestablecido se determina de acuerdo con la formula p = 1/(0 ■ i'), donde i' es el numero de llneas espectrales que se desenfatiza, 0 es un factor entre 3 y 5, en particular entre 3,4 y 4,6, mas concretamente entre 3,8 y 4,2. Los mejores resultados se pueden alcanzar
50 cuando el segundo valor preestablecido se establece en 4. Observese que el segundo valor preestablecido del descodificador 12 deberla ser el mismo que el segundo valor preestablecido del codificador 1.
[0090] En una realizacion preferida de la invencion, la llnea espectral de referencia representa RSLD una frecuencia entre 600 Hz y 1000 Hz, en particular entre 700 Hz y 900 Hz, mas concretamente entre 750 Hz y 850 Hz.
55 Estos intervalos encontrados emplricamente aseguran suficiente enfasis de baja frecuencia as! como una complejidad computacional baja del sistema. Estos intervalos aseguran, en particular, que en espectros densamente poblados, las llneas de mas baja frecuencia se codifican con suficiente precision. En una realizacion preferida, la llnea espectral de referencia RSLD representa 800 Hz, en la que 32 llneas espectrales SL se desenfatizan. Es obvio que la llnea espectral de referencia RSLD del descodificador 12 deberla representar la misma frecuencia que la
ilnea espectral de referenda RSL del codificador.
[0091] El calculo de ios factores de enfasis de las ilneas espectraies SEF puede hacerse mediante la entrada
siguiente de codigo de programa:
max = tmp = IpcGainsfO];
/* find minimum (tmp) and maximum (max) of LPC pains in low frequencies */ for (i = 1; i < 9; i++) {
if (tmp > lpcGains[i]) { tmp = lpcGains[i];
} ‘
if (max < IpcGains[i]) { max = IpcGains[i];
}
}
tmp *- 32.Of;
if ((max < tmp) S& (tmp > FLT_MIN)) {
fac = tmp = (float)pow(max / tmp, 0.0078125f);
/* gradual lowering of lowest 32 bins; DC is lowered by (max/tmp) ''1/4 */ for (i = 31; i >= 0; i—) { x[i) *= fac;
fac *= tmp; } '
}
[0092] En una realizacion preferida de la invention, la llnea espectral de referencia adicional representa la misma o una frecuencia mas alta que la llnea espectral de referencia RSLD. Estas caracterlsticas garantizan que la
10 estimation del mlnimo MI y del maximo MA se realiza en el intervalo de frecuencias pertinente.
[0093] Fig. 5b ilustra una segunda realizacion de un descodificador de audio 12 de acuerdo con la invencion. La segunda realizacion se basa en la primera realizacion. A continuation se explican unicamente las diferencias entre las dos realizaciones.
15
[0094] De acuerdo con una realizacion preferida de la invencion, el filtro 18 de codification predictiva lineal inversa esta configurado para estimar una senal IFS de filtro inverso basada en el espectro procesado inverso RS, en el que el convertidor 17 de frecuencia y tiempo esta configurado para emitir la senal de salida OS basada en el Senal filtrada inversa IFS.
20
[0095] Alternativamente y de forma equivalente y analoga al procedimiento FDNS descrito anteriormente realizado en el lado del codificador, el orden del convertidor de frecuencia-tiempo 17 y del filtro de codificacion predictiva lineal inverso 18 puede invertirse de tal manera que este ultimo se accione primero y en la frecuencia Dominio (en lugar del dominio de tiempo). Mas especlficamente, el filtro de codificacion predictiva lineal inverso 18
25 puede emitir una senal IFS inversa filtrada basada en el espectro procesado inverso RS, con el filtro de codificacion predictiva lineal inverso 2 aplicado mediante multiplicacion (o division) mediante una representacion espectral de los coeficientes de codificacion predictiva lineal LC, como en [5]. De acuerdo con ello, un convertidor de frecuencia- tiempo 17 tal como el mencionado anteriormente puede configurarse para estimar una trama de la senal de salida OS basada en la senal IFS filtrada inversa, que es introducida en el convertidor de tiempo-frecuencia 17.
30
[0096] Debe ser evidente para los expertos en la tecnica que estas dos estrategias -un filtrado lineal inverso en el dominio del tiempo seguido de una conversion tiempo-frecuencia frente a una conversion tiempo-frecuencia seguido de un filtrado lineal a traves de la ponderacion espectral en el dominio del tiempo- pueden ser implementadas de manera que son equivalentes.
35
[0097] La Fig. 6 ilustra un primer ejemplo de desenfasis de baja frecuencia ejecutado por un descodificador segun la invencion; La Fig. 2 muestra un espectro descuantizado DQ, factores de desenfasis de llneas espectrales ejemplares SDF y un espectro procesado inverso ejemplar RS en un sistema de coordenadas comun, en el que la frecuencia se representa en funcion del eje x y la amplitud en funcion de la frecuencia se representa en el eje y. Se
5 desenfatizan las llneas espectrales SLD0 a SLDi'-1, que representan frecuencias mas bajas a la llnea espectral de referencia RSLD, mientras que la llnea espectral de referencia RSLD y la llnea espectral SLDi'+1, que representa una frecuencia mas alta que el espectro de referencia RSLD, no se desenfatizan. La Fig. 6 muestra una situacion en la que la relacion del Ml mlnimo y MA maximo de la representacion espectral SR de los coeficientes de codificacion predictiva lineal LC es cercana a 1. Por lo tanto, un factor maximo de enfasis de llnea espectral SEF para la llnea 10 espectral SL0 es aproximadamente 0,4. Ademas, la Fig. 6 muestra el error de cuantizacion QE, en funcion de la frecuencia. Debido al fuerte desenfasis de baja frecuencia, el error de cuantizacion QE es muy bajo a frecuencias mas bajas.
[0098] La Fig. 7 ilustra un segundo ejemplo de desenfasis de baja frecuencia ejecutado por un descodificador 15 segun la invencion. La diferencia con el enfasis de baja frecuencia como se indica en la Fig. 6 es que la relacion del
Ml mlnimo y MA maximo de la representacion espectral SR de los coeficientes de codificacion predictiva lineal LC es menor. Por lo tanto, se lanza un factor maximo de desenfasis de llnea espectral SDF para la llnea espectral SL0, por ejemplo, por encima de 0,5. El error de cuantizacion QE es mayor en este caso pero no es crltico ya que esta muy por debajo de la amplitud del espectro procesado inverso RS.
20
[0099] La Fig. 8 ilustra un tercer ejemplo de desenfasis de baja frecuencia ejecutado por un descodificador segun la invencion. En una realization preferida de la invencion, el dispositivo de control 16 esta configurado de tal manera que las llneas espectrales SLD del espectro procesado inverso RS que representan una frecuencia mas baja que la llnea espectral de referencia RSLD se desenfatizan solo si el maximo MA es menor que el mlnimo MI
25 multiplicado por el primer valor preestablecido. Estas caracterlsticas aseguran que el desenfasis de baja frecuencia solo se ejecuta cuando es necesario para que la carga de trabajo del descodificador 12 pueda minimizarse Estas caracterlsticas aseguran que el desenfasis de baja frecuencia solo se ejecuta cuando es necesario para que la carga de trabajo del codificador pueda minimizarse En la Fig. 8 estas condiciones se cumplen de manera que no se ejecuta el enfasis de baja frecuencia.
30
[0100] Como una solution al problema mencionado anteriormente de complejidad relativamente alta (posiblemente causando problemas de implementation en dispositivos moviles de baja potencia) y falta de invertibilidad perfecta (arriesgando una fidelidad suficiente) de la estrategia ALFE de la tecnica anterior, se propone un enfasis modificado adaptable de baja frecuencia (ALFE) que
35
• no requiere una ralz cuadrada por banda espectral u operation compleja similar. Solo se necesitan 2 operadores de division y 2 de potencia, uno de cada en el lado del codificador y el descodificador.
• utiliza una representacion espectral de los coeficientes del filtro LPC como information de control para el
40 (des)enfasis, no el espectro en si. Dado que se utilizan coeficientes LPC identicos en el codificador y el
descodificador, el ALFE es totalmente invertible independientemente de la cuantizacion del espectro.
[0101] El sistema ALFE descrito en el presente documento se implemento en el codificador de nucleo TCX de LD-USAC, una variante de bajo retardo de xHE-AAC [4] que puede conmutar entre codificacion en el dominio del
45 tiempo y en el dominio MDCT en un base por trama. El proceso en codificador y descodificador se resume de la siguiente manera:
1. En el codificador, el mlnimo y el maximo de la representacion espectral de los coeficientes LPC se encuentran por debajo de una cierta frecuencia. La representacion espectral de un filtro generalmente
50 adoptado en el procesamiento de senales es la funcion de transferencia del filtro. En xHE-AAC y LD-USAC, la
funcion de transferencia se aproxima por 32 o 64 ganancias en el dominio MDCT que cubren todo el espectro, calculada a partir de una DFT impar (ODFT) de los coeficientes de filtro.
2. Si el maximo es mayor que un cierto mlnimo global (por ejemplo, 0) y menos de a veces mayor que el mlnimo, con a > 1 (por ejemplo, 32), se ejecutan las 2 etapas ALFe siguientes.
55 3. Un factor de enfasis de baja frecuencia y se calcula a partir de la relacion entre el mlnimo y el maximo
como y = (a- minimum / maximum)13, donde 0 < p <= 1 y p depende de a.
4. Las llneas MDCT con Indices i inferiores a un Indice i' que representan una cierta frecuencia (es decir, todas las llneas por debajo de esa frecuencia, preferentemente la misma frecuencia utilizada en la etapa 1) ahora se multiplican por Yi'-i. Esto implica que la llnea mas cercana a i' es la que se amplifica menos,
mientras que la primera ilnea, la mas cercana a la corriente continua, es la que se amplifica mas. Preferentemente, i' = 32.
5. En el descodificador, las etapas 1 y 2 se llevan a cabo igual que en el codificador (mismo llmite de frecuencia).
5 6. De forma analoga a la etapa 3, un factor de desenfasis de baja frecuencia, el inverso del factor de
enfasis y, se calcula como 5 =(a- minimum/ maximum)-p =(maximum/ (a- minimum))p.
7. Las llneas MDCT con Indices i inferiores al Indice i', con i' elegido como en el codificador, finalmente se multiplican por 5i'-i. El resultado es que la llnea mas cercana a i' es la que se atenua menos, la primera llnea es la que se atenua mas y, en general, el lado del codificador ALFE esta completamente invertido.
10
[0102] Esencialmente, el sistema ALFE propuesto asegura que en los espectros densamente poblados, las llneas de menor frecuencia sean codificadas con suficiente precision. Tres casos pueden servir para ilustrar esto, como se muestra en la Fig. 8. Cuando el maximo es mas de a veces mayor que el mlnimo, no se realiza ALFE. Esto ocurre cuando la forma LPC de baja frecuencia contiene un pico fuerte, probablemente originado por un tono bajo
15 aislado en la senal de entrada. Normalmente, los codificadores LPC pueden reproducir una senal de este tipo relativamente bien, por lo que no es necesario un ALFE.
[0103] En el caso de que la forma LPC sea plana, es decir, el maximo se aproxima al mlnimo, el ALFE es el mas fuerte como se representa en la Fig. 6 y puede evitar la codificacion de artefactos como el ruido musical.
20
[0104] Cuando la forma LPC no es ni totalmente plana ni alta, por ejemplo, en senales armonicas con tonos estrechamente espaciados, solo se realiza un ALFE suave como se muestra en la Fig. 7. Debe observarse que la aplicacion de los factores exponenciales y en las etapa 4 y 8 en la etapa 7 no requiere instrucciones de potencia, sino que puede realizarse de forma incremental utilizando solo multiplicaciones. Por lo tanto, la complejidad por llnea
25 espectral necesaria en el esquema ALFE de la invencion es muy baja.
[0105] Aunque se han descrito algunos aspectos en el contexto de un aparato, es evidente que estos aspectos tambien representan una descripcion del procedimiento correspondiente, donde un bloque o dispositivo se corresponde con una etapa del procedimiento o una caracterlstica de una etapa del procedimiento. De forma
30 analoga, los aspectos que se describen en el contexto de un etapa del procedimiento tambien representan una descripcion de un bloque correspondiente o un punto o caracterlstica del aparato correspondiente. Algunas o todas las etapas del procedimiento se pueden ejecutar con (o utilizando) un aparato de hardware, como por ejemplo, un microprocesador, un ordenador programable o un circuito electronico. En algunas realizaciones, una o mas de las etapas mas importantes del procedimiento se pueden ejecutar con dicho aparato.
35
[0106] En funcion de ciertos requisitos de implementacion, las realizaciones de la invencion se pueden
implementar en hardware o en software. La implementacion puede realizarse utilizando un medio de
almacenamiento no transitorio como un medio de almacenamiento digital, por ejemplo un disquete, un DVD, un Blu- Ray, un CD, una ROM, una PROM, una EPROM, una EEPROM o una memoria FLASH, que tiene senales de
40 control legibles electronicamente y almacenadas en el mismo, que coopera ( o es capaz de cooperar) con un sistema informatico programable de manera que se lleve a cabo el procedimiento respectivo. Por lo tanto, el medio de almacenamiento digital puede ser legible mediante ordenador.
[0107] Algunas realizaciones segun la invencion comprenden un soporte de datos que tiene senales de 45 control legibles electronicamente y que son capaces de cooperar con un sistema informatico programable, de tal
manera que se lleve a cabo uno de los procedimientos descritos en este documento.
[0108] En general las realizaciones de la presente invencion se pueden implementar como un producto de
programa informatico con un codigo de programa, siendo el codigo de programa operativo para llevar a cabo uno de
50 los procedimientos cuando el producto de programa informatico se ejecuta en un ordenador. El codigo de programa se puede almacenar, por ejemplo, en un soporte legible por maquina.
[0109] Otras realizaciones comprenden el programa de ordenador para llevar a cabo uno de los procedimientos descritos en este documento, almacenado en un soporte legible por maquina.
55
[0110] En otras palabras, una realizacion del procedimiento de la invencion es, por lo tanto, un programa informatico que tiene un codigo de programa para realizar uno de los procedimientos descritos en este documento cuando el programa informatico se ejecuta en un ordenador.
[0111] Una realizacion adicional del procedimiento de la invencion es, por lo tanto, un soporte de datos (o un medio de almacenamiento digital o un medio legible por ordenador) que comprende, grabado en el mismo, el programa informatico para llevar a cabo uno de los procedimientos descritos en este documento. El soporte de datos, el medio de almacenamiento digital o el medio grabado son normalmente tangibles y/o no transitorios.
5
[0112] Una realizacion adicional del procedimiento de la invencion es, por lo tanto, un flujo de datos o una secuencia de senales que representan el programa informatico para llevar a cabo uno de los procedimientos descritos en este documento. El flujo de datos o la secuencia de senales pueden, por ejemplo, estar configurados para ser transferidos a traves de una conexion de comunicacion de datos, por ejemplo, a traves de Internet.
10
[0113] Una realizacion adicional comprende ademas un medio de procesamiento, por ejemplo un ordenador
0 un dispositivo logico programable, configurado o adaptado para llevar a cabo uno de los procedimientos descritos en este documento.
15 [0114] Una realizacion adicional comprende un ordenador que tiene instalado en el mismo el programa
informatico para llevar a cabo uno de los procedimientos descritos en este documento.
[0115] Una realizacion adicional segun la invencion comprende un aparato o un sistema configurado para transferir (por ejemplo, electronicamente u opticamente) un programa informatico con el fin de llevar a cabo uno de
20 los procedimientos descritos en el presente documento a un receptor. El receptor puede ser, por ejemplo, un ordenador, un dispositivo movil, un dispositivo de memoria o algo similar. El aparato o sistema puede, por ejemplo, comprender un servidor de archivos para transferir el programa informatico al receptor.
[0116] En algunas realizaciones se puede utilizar un dispositivo logico programable (por ejemplo, una matriz 25 de puertas programables por campo) para llevar a cabo algunas o todas las funcionalidades de los procedimientos
descritos en este documento. En algunas realizaciones una matriz de puertas programables por campo podra cooperar con un microprocesador a fin de llevar a cabo uno de los procedimientos descritos en este documento. En general los procedimientos se llevan a cabo, preferentemente, por cualquier aparato de hardware.
30 Signos de referencia:
[0117]
1 codificador de audio
2 filtro de codificacion predictiva lineal
3 convertidor de tiempo-frecuencia
4 enfatizador de baja frecuencia
5 el dispositivo de control es
6 dispositivo de cuantizacion
7 productor de flujo de bits
8 analizador espectral
9 analizador mlnimo-maximo
10 primera etapa del calculo de los factores de enfasis
11 segunda etapa del calculo de los factores de enfasis
12 descodificador de audio
13 receptor de flujo de bits
14 dispositivo de descuantizacion
15 desenfatizador de baja frecuencia
16 el dispositivo de control es
17 convertidor de tiempo-frecuencia
18 filtro de codificacion predictiva lineal inversa
19 analizador espectral
20 analizador mlnimo-maximo
21 primera etapa del calculo de los factores de enfasis
22 segunda etapa del calculo de los factores de enfasis
35
COMO senal de audio
LC coeficientes de codificacion predictiva lineal
FF
trama filtrada
Fl
trama
SP
espectro
PS
espectro procesado
QS
espectro cuantizado
SR
representacion espectral
Ml
mlnimo de la representacion espectral
MA
maximo de la representacion espectral
SEF
factores de enfasis de las llneas espectrales
BEF
factor de enfasis por fases
FC
trama convertida en el dominio del tiempo
RSL
llnea espectral de referencia
SL
llnea espectral
DQ
espectro descuantizado
RS
espectro procesado inverso
TS
senal de tiempo
SDF
factores de desenfasis de las llneas espectrales
BDF
factor de desenfasis de base
IFS
senal filtrada inversa
SLD
llnea espectral
RSLD
llnea espectral de referencia
QE
error de cuantizacion
Referencias:
[0118]
5
[1] 3GPP TS 26.290, "Extended AMR Wideband Codec - Transcoding Functions," Dec. 2004.
[2] B. Bessette, U.S. Patent 7,933,769 B2, "Methods and devices for low-frequency emphasis during audio compression
based on ACELP/TCX", Apr. 2011.
10 [3] J. Makinen et al., "AMR-WB+: A New Audio Coding Standard for 3rd Generation Mobile Audio Services," in Proc. ICASSP 2005, Philadelphia, USA, Mar. 2005.
[4] M. Neuendorf et al., "MPEG Unified Speech and Audio Coding - The ISO/MPEG Standard for High-Efficiency Audio Coding of All Content Types," in Proc. 132nd Convention of the AES, Budapest, Hungary, Apr. 2012. Also to appear in the Journal of the AES, 2013.
15 [5] T. Baeckstroem et al., European Patent EP 2 471 061 B1, "Multi-mode audio signal decoder, multi-mode audio signal encoder, methods and computer program using linear prediction coding based noise shaping".

Claims (24)

  1. REIVINDICACIONES
    1. El codificador de audio ara codificar una senal de audio (AS) que no es de voz para producir, a partir de ella, un flujo de bits (BS), el codificador de audio (1) que comprende:
    5 una combinacion (2, 3) de un filtro de codificacion predictiva lineal (2) que tiene una pluralidad de coeficientes (LC) de codificacion predictiva lineal y un convertidor de tiempo-frecuencia (3), en el que la combinacion (2, 3) esta configurada para filtrar y convertir una trama (Fl) de la senal de audio (AS) en un dominio de la frecuencia con el fin de emitir un espectro (SP) basado en la trama (Fl) y en los coeficientes de codificacion predictiva lineal (LC);
    10 un enfatizador de baja frecuencia (4) configurado para calcular un espectro procesado (PS) basado en el espectro (SP), en el que se enfatizan las llneas espectrales (SL) del espectro procesado (PS) que representan una frecuencia mas baja que la llnea espectral de referencia (RSL);
    un dispositivo de control (5) configurado para controlar el calculo del espectro procesado (PS) mediante el 15 enfatizador de baja frecuencia (4) en funcion de los coeficientes de codificacion predictiva lineal (LC) del filtro de codificacion predictiva lineal (2); un dispositivo de cuantizacion (6) configurado para producir un espectro cuantizado (QS) basado en el espectro procesado (PS);
    un productor de flujo de bits (7) configurado para incrustar el espectro cuantizado (QS) y los coeficientes de 20 codificacion predictiva lineal (LC) en el flujo de bits (BS).
  2. 2. Codificador de audio segun la reivindicacion anterior en el que la trama (Fl) de la senal de audio (AS) se introduce en el filtro de codificacion predictiva lineal (2), en el que una trama filtrada (FF) es emitida por el filtro de codificacion predictiva lineal (2) y en el que el convertidor de tiempo-frecuencia (3) esta configurado para estimar el
    25 espectro (SP) basado en la trama filtrada (FF).
  3. 3. Codificador de audio segun la reivindicacion 1 en el que la trama (Fl) de la senal de audio (AS) se introduce en el convertidor de tiempo-frecuencia (3), en el que una trama convertida (FC) es emitida por el convertidor de tiempo-frecuencia (3) y en el que el filtro de codificacion predictiva lineal (2) esta configurado para
    30 estimar el espectro (SP) basado en la trama convertida (FC).
  4. 4. Codificador de audio segun una de las reivindicaciones anteriores en el que el dispositivo de control (5) comprende un analizador espectral (8) configurado para estimar una representacion espectral (SR) de los coeficientes de codificacion predictiva lineal (LC), un analizador mlnimo-maximo (9) configurado para estimar un
    35 mlnimo (MI) de la representacion espectral (SR) y un maximo (MA) de la representacion espectral (SR) por debajo de otra llnea espectral de referencia y un calculo de los factores de enfasis (10, 11) configurado para calcular factores de enfasis de llneas espectrales (SEF) que calculan las llneas espectrales (SL) del espectro procesado (PS) que representan una frecuencia mas baja que la llnea espectral de referencia (RSL) basada en el mlnimo (MI) y en el maximo (MA), en el que las llneas espectrales (SL) del espectro procesado (PS) se enfatizan aplicando los 40 factores de enfasis de las llneas espectrales (SEF) a las llneas espectrales del espectro de la trama filtrada.
  5. 5. Codificador de audio segun la reivindicacion 4 en el que el calculo de los factores de enfasis (10, 11) esta configurado de tal manera que los factores de enfasis de llneas espectrales (SEF) aumentan en una direccion desde la llnea espectral de referencia (RSL) hasta la llnea espectral (SL) que representa la frecuencia mas baja del
    45 espectro (SP).
  6. 6. Codificador de audio segun la reivindicacion 4 o 5 en el que el calculo de los factores de enfasis (10, 11) comprende una primera etapa (10) configurada para calcular un factor de enfasis de base (BEF) de acuerdo con una primera formula y = (a ■ min/ rnax)p, en el que a es un primer valor preestablecido, con un valor a > 1, p es un
    50 segundo valor preestablecido, con 0 < p <= 1, min es el mlnimo (MI) de la representacion espectral, max es el maximo (MA) de la representacion espectral (SR) y y es el factor de enfasis de base (BEF) y en el que el calculo de los factores de enfasis (10, 11) comprende una segunda etapa (11) configurada para calcular factores de enfasis de llneas espectrales (SEF) de acuerdo con una segunda formula & = Yi'"i, en el que i' es un numero de llneas espectrales (SL) a enfatizar, i es un Indice de la llnea espectral respectiva (SL), el Indice aumenta con las 55 frecuencias de las llneas espectrales (SL), con i = 0 a i'-1, y es el factor de enfasis de base (BEF) y & es el factor de enfasis de la llnea espectral (SEF) con el Indice i.
  7. 7. Codificador de audio segun la reivindicacion 6 en el que el primer valor preestablecido es menor que 42 y mayor que 22, en particular, menor que 38 y mayor que 26, mas particularmente, menor 34 y mayor que 30.
  8. 8. Codificador de audio segun la reivindicacion 6 o 7 en el que el segundo valor preestablecido se determina de acuerdo con la formula p = 1 / (0 ■ i'), en el que i' es un numero de las llneas espectrales enfatizadas, 0 es un factor entre 3 y 5, en particular entre 3,4 y 4,6, mas particularmente, entre 3,8 y 4,2.
    5
  9. 9. Codificador de audio segun una de las reivindicaciones anteriores en el que la llnea espectral de referencia (RSL) representa una frecuencia entre 600 Hz y 1000 Hz, en particular entre 700 Hz y 900 Hz, mas particularmente, entre 750 Hz y 850 Hz.
    10 10. Codificador de audio segun una de las reivindicaciones 4 a 9, en el que la llnea espectral de referencia
    adicional representa la misma o una frecuencia mas alta que la llnea espectral de referencia (RSL).
  10. 11. Codificador de audio segun una de las reivindicaciones anteriores en el que el dispositivo de control (5) esta configurado de tal manera que las llneas espectrales (SL) del espectro procesado inverso que representan
    15 una frecuencia mas baja que la llnea espectral de referencia (RSL) se desenfatizan solo si el maximo (MA) es menor que el mlnimo (MI) multiplicado por el primer valor preestablecido.
  11. 12. Descodificador de audio para descodificar un flujo de bits (BS) basado en una senal de audio que no es de voz (AS) de manera que produce, a partir del flujo de bits (BS), una senal de salida de audio que no es de voz
    20 (OS), en particular para descodificar un flujo de bits (BS) producido por un codificador de audio (1) segun las reivindicaciones 1 a 11, el flujo de bits (BS) contiene espectros cuantizados (QS) y una pluralidad de coeficientes de codificacion predictiva lineal (LC), el descodificador de audio (12) que comprende:
    un receptor de flujo de bits (13) configurado para extraer el espectro cuantizado (QS) y los coeficientes de codificacion predictiva lineal (LC) del flujo de bits (BS);
    25 un dispositivo de descuantizacion (14) configurado para producir un espectro descuantizado (DQ) basado en el espectro cuantizado (QS);
    un desenfatizador de baja frecuencia (15) configurado para calcular un espectro procesado inverso (RS) basado en el espectro descuantizado (DQ), en el que se desenfatizan llneas espectrales (sLd) del espectro procesado inverso (RS) que representan una frecuencia mas baja que una llnea espectral de referencia (RSLD); y 30 un dispositivo de control (16) configurado para controlar el calculo del espectro procesado inverso (RS) por el desactivador de baja frecuencia (15) en funcion de los coeficientes de codificacion predictiva lineal (LC) contenidos en el flujo de bits (BS).
  12. 13. Descodificador de audio segun la reivindicacion precedente en el que el descodificador de audio (12) 35 comprende la combination (17,18) de un convertidor de frecuencia (17) y un filtro de codificacion predictiva lineal
    inversa (18) que reciben la pluralidad de coeficientes de codificacion predictiva lineal (LC) contenidos en el flujo de bits (BS), en el que la combinacion (17, 18) esta configurada para filtrar inversamente y convertir el espectro procesado inverso (RS) en un dominio del tiempo con el fin de emitir la senal de salida (OS) basada en el espectro procesado inverso (RS) y en los coeficientes de codificacion predictiva lineal (LC).
    40
  13. 14. Descodificador de audio segun la reivindicacion precedente, en el que el convertidor de tiempo frecuencia (17) esta configurado para estimar una senal de tiempo (TS) basada en el espectro procesado inverso (RS) , en el que el filtro de codificacion predictiva lineal (18) inverso esta configurado para emitir la senal de salida (OS) basada en la senal de tiempo (TS).
    45
  14. 15. Descodificador de audio segun la reivindicacion 13, en el que el filtro de codificacion predictiva lineal inverso (18) esta configurado para estimar una senal filtrada inversa (IFS) basada en el espectro procesado inverso (RS) , en el que el convertidor de tiempo-frecuencia (17) esta configurado para emitir la senal de salida (OS) basada en la senal filtrada inversa (IFS).
    50
  15. 16. Descodificador de audio segun una de las reivindicaciones 12 a 15, en el que el dispositivo de control (16) comprende un analizador espectral (19) configurado para estimar una representation espectral (SR) de los coeficientes de codificacion predictiva lineal (LC), un analizador mlnimo-maximo (20) configurado para estimar un mlnimo (MI) de la representacion espectral (SR) y un maximo (MA) de la representacion espectral (SR) por debajo
    55 de otra llnea espectral de referencia y un calculo de los factores de desenfasis (21, 22) configurado para calcular factores de desenfasis de llneas espectrales (SDF) que calculan las llneas espectrales (SLD) del espectro procesado inverso (RS) que representan una frecuencia mas baja que la llnea espectral de referencia (RSLD) basada en el mlnimo (MI) y en el maximo (MA), en el que las llneas espectrales (SLD) del espectro procesado inverso (RS) se desenfatizan aplicando los factores de desenfasis de las llneas espectrales (SDF) a las llneas
    espectrales del espectro del espectro descuantizado (OQ).
  16. 17. Descodificador de audio segun la reivindicacion anterior, en el que el calculo de los factores de desenfasis (21, 22) esta configurado de tal manera que los factores de desenfasis de llneas espectrales (SDF)
    5 aumentan en una direccion desde la llnea espectral de referencia (RSLD) hasta la llnea espectral (SL) que representa la frecuencia mas baja del espectro procesado inverso (RS).
  17. 18. Descodificador de audio segun las reivindicaciones 16 o 17 en el que el calculo de los factores de desenfasis (21, 22) comprende una primera etapa (21) configurada para calcular un factor de desenfasis de base
    10 (BDF) de acuerdo con una primera formula 5 =(a- min/ max)'13, en el que a es un primer valor preestablecido, con un valor a > 1, p es un segundo valor preestablecido, con 0 < p <= 1, min es el mlnimo (Ml) de la representacion espectral, max es el maximo (MA) de la representacion espectral (SR) y 5 es el factor de desenfasis de base (BDF) y en el que el calculo de los factores de desenfasis (21, 22) comprende una segunda etapa (22) configurada para calcular factores de desenfasis de llneas espectrales (SDF) de acuerdo con una segunda formula ^i = 5i''i, en el que i' 15 es un numero de llneas espectrales (SLD) a desenfatizar, i es un Indice de la llnea espectral respectiva (SLD), el Indice aumenta con las frecuencias de las llneas espectrales, con i = 0 to i'-1, 5 es el factor de desenfasis de base (BDF) y ^i es el factor de desenfasis de la llnea espectral (SDF) con el Indice i.
  18. 19. Descodificador de audio segun la reivindicacion anterior, en el que el primer valor preestablecido es 20 menor que 42 y mayor que 22, en particular, menor que 38 y mayor que 26, mas particularmente, menor 34 y mayor
    que 30.
  19. 20. Descodificador de audio segun la reivindicacion 18 o 19, en el que el segundo valor preestablecido se determina de acuerdo con la formula p = 1 / (0 ■ i'), en el que i' es un numero de las llneas espectrales (SLD)
    25 desenfatizadas, 0 es un factor entre 3 y 5, en particular entre 3,4 y 4,6, mas particularmente, entre 3,8 y 4,2.
  20. 21. Codificador de audio segun una de las reivindicaciones 12 a 20, en el que la llnea espectral de referencia (RSLD) representa una frecuencia entre 600 Hz y 1000 Hz, en particular, entre 700 Hz y 900 Hz, mas particularmente, entre 750 Hz y 850 Hz.
    30
  21. 22. Codificador de audio segun una de las reivindicaciones 16 a 21, en el que la llnea espectral de referencia adicional representa la misma o una frecuencia mas alta que la llnea espectral de referencia (RSLD).
  22. 23. Descodificador de audio segun una de las reivindicaciones 12 a 22, en el que el dispositivo de control 35 (16) esta configurado de tal manera que las llneas espectrales (SLD) del espectro procesado inverso (RS) que
    representan una frecuencia mas baja que la llnea espectral de referencia (RSLD) se desenfatizan solo si el maximo (MA) es menor que el mlnimo (Ml) multiplicado por el primer valor preestablecido.
  23. 24. Sistema que comprende un descodificador (12) y un codificador (1), en el que el codificador (1) esta 40 disenado segun una de las reivindicaciones 1 a 11 y/o el descodificador esta disenado segun una de las
    reivindicaciones 12 a 23.
  24. 25. Procedimiento para codificar una senal de audio que no es de voz (AS) para producir, a partir de ella, un flujo de bits (BS), el procedimiento que comprende las etapas:
    45 filtrar con un filtro de codificacion predictiva lineal (2) que tiene una pluralidad de coeficientes de codificacion predictiva lineal (LC) y convertir una trama (FI) de la senal de audio (AS) en un dominio de la frecuencia con el fin de emitir un espectro (SP) basado en la trama (FI) y en los coeficientes de codificacion predictiva lineal (LC); calcular un espectro procesado (PS) basado en el espectro (SP), en el que se enfatizan las llneas espectrales (SL) del espectro procesado (PS) que representan una frecuencia mas baja que una llnea espectral de referencia (RSL); 50 y controlar el calculo del espectro procesado (PS) en funcion de los coeficientes de codificacion predictiva lineal (LC) del filtro de codificacion predictiva lineal (2);
    producir un espectro cuantizado (QS) basado en el espectro procesado (PS); y
    incrustar el espectro cuantizado (QS) y los coeficientes de codificacion predictiva lineal (LC) en el flujo de bits (BS).
    55 26. Procedimiento para descodificar un flujo de bits (BS) basado en una senal de audio (AS) que no es de
    voz para producir, a partir del flujo de bits (BS), una senal de salida de audio que no es de voz (OS), en particular para descodificar un flujo de bits (BS) producido mediante el procedimiento segun la reivindicacion anterior, el flujo de bits (BS) que contiene espectros cuantizados (QS) y una pluralidad de coeficientes de codificacion predictiva lineal (LC), el procedimiento que comprende las etapas:
    extraer el espectro cuantizado (QS) y los coeficientes de codificacion predictiva lineal (LC) del flujo de bits (BS); producir un espectro descuantizado (DQ) basado en el espectro cuantizado (QS);
    calcular un espectro procesado inverso (RS) basado en el espectro descuantizado (DQ), en el que se desenfatizan 5 las llneas espectrales (SLD) del espectro procesado inverso (RS) que representan una frecuencia mas baja que la llnea espectral de referencia (RSLD); y
    controlar el calculo del espectro procesado inverso (RS) en funcion de los coeficientes de codificacion predictiva lineal (LC) contenidos en el flujo de bits (BS).
    10 27. Programa informatico para realizar, cuando se ejecuta en un ordenador o un procesador, el
    procedimiento de la reivindicacion 25 o 26.
ES14701984.8T 2013-01-29 2014-01-28 Énfasis de baja frecuencia para la codificación basada en lpc en el dominio de la frecuencia Active ES2635142T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361758103P 2013-01-29 2013-01-29
US201361758103P 2013-01-29
PCT/EP2014/051585 WO2014118152A1 (en) 2013-01-29 2014-01-28 Low-frequency emphasis for lpc-based coding in frequency domain

Publications (1)

Publication Number Publication Date
ES2635142T3 true ES2635142T3 (es) 2017-10-02

Family

ID=50030281

Family Applications (1)

Application Number Title Priority Date Filing Date
ES14701984.8T Active ES2635142T3 (es) 2013-01-29 2014-01-28 Énfasis de baja frecuencia para la codificación basada en lpc en el dominio de la frecuencia

Country Status (20)

Country Link
US (5) US10176817B2 (es)
EP (1) EP2951814B1 (es)
JP (1) JP6148811B2 (es)
KR (1) KR101792712B1 (es)
CN (2) CN110047500B (es)
AR (2) AR094682A1 (es)
AU (1) AU2014211520B2 (es)
BR (1) BR112015018040B1 (es)
CA (1) CA2898677C (es)
ES (1) ES2635142T3 (es)
HK (1) HK1218018A1 (es)
MX (1) MX346927B (es)
MY (1) MY178306A (es)
PL (1) PL2951814T3 (es)
PT (1) PT2951814T (es)
RU (1) RU2612589C2 (es)
SG (1) SG11201505911SA (es)
TW (1) TWI536369B (es)
WO (1) WO2014118152A1 (es)
ZA (1) ZA201506314B (es)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2612589C2 (ru) 2013-01-29 2017-03-09 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Низкочастотное акцентирование для основанного на lpc кодирования в частотной области
FR3024582A1 (fr) * 2014-07-29 2016-02-05 Orange Gestion de la perte de trame dans un contexte de transition fd/lpd
US9338627B1 (en) 2015-01-28 2016-05-10 Arati P Singh Portable device for indicating emergency events
US11380340B2 (en) * 2016-09-09 2022-07-05 Dts, Inc. System and method for long term prediction in audio codecs
EP3382701A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using prediction based shaping
JP7214726B2 (ja) * 2017-10-27 2023-01-30 フラウンホッファー-ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ ニューラルネットワークプロセッサを用いた帯域幅が拡張されたオーディオ信号を生成するための装置、方法またはコンピュータプログラム
US10957331B2 (en) 2018-12-17 2021-03-23 Microsoft Technology Licensing, Llc Phase reconstruction in a speech decoder
US10847172B2 (en) * 2018-12-17 2020-11-24 Microsoft Technology Licensing, Llc Phase quantization in a speech encoder
BR112021012753A2 (pt) * 2019-01-13 2021-09-08 Huawei Technologies Co., Ltd. Método implementado por computador para codificação de áudio, dispositivo eletrônico e meio legível por computador não transitório
TWI789577B (zh) * 2020-04-01 2023-01-11 同響科技股份有限公司 音訊資料重建方法及系統

Family Cites Families (61)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4139732A (en) * 1975-01-24 1979-02-13 Larynogograph Limited Apparatus for speech pattern derivation
JPH0738118B2 (ja) * 1987-02-04 1995-04-26 日本電気株式会社 マルチパルス符号化装置
US5548647A (en) * 1987-04-03 1996-08-20 Texas Instruments Incorporated Fixed text speaker verification method and apparatus
US4890327A (en) * 1987-06-03 1989-12-26 Itt Corporation Multi-rate digital voice coder apparatus
US5173941A (en) * 1991-05-31 1992-12-22 Motorola, Inc. Reduced codebook search arrangement for CELP vocoders
US5651090A (en) * 1994-05-06 1997-07-22 Nippon Telegraph And Telephone Corporation Coding method and coder for coding input signals of plural channels using vector quantization, and decoding method and decoder therefor
JP3360423B2 (ja) * 1994-06-21 2002-12-24 三菱電機株式会社 音声強調装置
US5774846A (en) * 1994-12-19 1998-06-30 Matsushita Electric Industrial Co., Ltd. Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus
US5774837A (en) * 1995-09-13 1998-06-30 Voxware, Inc. Speech coding system and method using voicing probability determination
US6064962A (en) * 1995-09-14 2000-05-16 Kabushiki Kaisha Toshiba Formant emphasis method and formant emphasis filter device
JPH09230896A (ja) * 1996-02-28 1997-09-05 Sony Corp 音声合成装置
JP3357795B2 (ja) * 1996-08-16 2002-12-16 株式会社東芝 音声符号化方法および装置
SE9700772D0 (sv) * 1997-03-03 1997-03-03 Ericsson Telefon Ab L M A high resolution post processing method for a speech decoder
GB9811019D0 (en) * 1998-05-21 1998-07-22 Univ Surrey Speech coders
JP4308345B2 (ja) * 1998-08-21 2009-08-05 パナソニック株式会社 マルチモード音声符号化装置及び復号化装置
US6975254B1 (en) * 1998-12-28 2005-12-13 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Methods and devices for coding or decoding an audio signal or bit stream
US6278972B1 (en) * 1999-01-04 2001-08-21 Qualcomm Incorporated System and method for segmentation and recognition of speech signals
JP3526776B2 (ja) * 1999-03-26 2004-05-17 ローム株式会社 音源装置及び携帯機器
US6782361B1 (en) * 1999-06-18 2004-08-24 Mcgill University Method and apparatus for providing background acoustic noise during a discontinued/reduced rate transmission mode of a voice transmission system
JP2001117573A (ja) * 1999-10-20 2001-04-27 Toshiba Corp 音声スペクトル強調方法/装置及び音声復号化装置
US6754618B1 (en) * 2000-06-07 2004-06-22 Cirrus Logic, Inc. Fast implementation of MPEG audio coding
US6748363B1 (en) * 2000-06-28 2004-06-08 Texas Instruments Incorporated TI window compression/expansion method
US6898566B1 (en) * 2000-08-16 2005-05-24 Mindspeed Technologies, Inc. Using signal to noise ratio of a speech signal to adjust thresholds for extracting speech parameters for coding the speech signal
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
JP2002318594A (ja) * 2001-04-20 2002-10-31 Sony Corp 言語処理装置および言語処理方法、並びにプログラムおよび記録媒体
EP1388147B1 (de) * 2001-05-11 2004-12-29 Siemens Aktiengesellschaft Verfahren zur erweiterung der bandbreite eines schmalbandig gefilterten sprachsignals, insbesondere eines von einem telekommunikationsgerät gesendeten sprachsignals
WO2003046891A1 (en) * 2001-11-29 2003-06-05 Coding Technologies Ab Methods for improving high frequency reconstruction
US7516066B2 (en) * 2002-07-16 2009-04-07 Koninklijke Philips Electronics N.V. Audio coding
US8019598B2 (en) * 2002-11-15 2011-09-13 Texas Instruments Incorporated Phase locking method for frequency domain time scale modification based on a bark-scale spectral partition
SG135920A1 (en) * 2003-03-07 2007-10-29 St Microelectronics Asia Device and process for use in encoding audio data
US6988064B2 (en) * 2003-03-31 2006-01-17 Motorola, Inc. System and method for combined frequency-domain and time-domain pitch extraction for speech signals
EP1619666B1 (en) * 2003-05-01 2009-12-23 Fujitsu Limited Speech decoder, speech decoding method, program, recording medium
DE10321983A1 (de) * 2003-05-15 2004-12-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Einbetten einer binären Nutzinformation in ein Trägersignal
US7640157B2 (en) * 2003-09-26 2009-12-29 Ittiam Systems (P) Ltd. Systems and methods for low bit rate audio coders
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
ES2294506T3 (es) * 2004-05-14 2008-04-01 Loquendo S.P.A. Reduccion de ruido para el reconocimiento automatico del habla.
US7536302B2 (en) * 2004-07-13 2009-05-19 Industrial Technology Research Institute Method, process and device for coding audio signals
CN102103860B (zh) * 2004-09-17 2013-05-08 松下电器产业株式会社 频谱包络信息量化装置及方法、频谱包络信息解码装置及方法
US20070147518A1 (en) * 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
US20100023575A1 (en) * 2005-03-11 2010-01-28 Agency For Science, Technology And Research Predictor
US7599833B2 (en) * 2005-05-30 2009-10-06 Electronics And Telecommunications Research Institute Apparatus and method for coding residual signals of audio signals into a frequency domain and apparatus and method for decoding the same
RU2414009C2 (ru) * 2006-01-18 2011-03-10 ЭлДжи ЭЛЕКТРОНИКС ИНК. Устройство и способ для кодирования и декодирования сигнала
WO2007088853A1 (ja) * 2006-01-31 2007-08-09 Matsushita Electric Industrial Co., Ltd. 音声符号化装置、音声復号装置、音声符号化システム、音声符号化方法及び音声復号方法
WO2008100503A2 (en) * 2007-02-12 2008-08-21 Dolby Laboratories Licensing Corporation Improved ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners
JP5618826B2 (ja) * 2007-06-14 2014-11-05 ヴォイスエイジ・コーポレーション Itu.t勧告g.711と相互運用可能なpcmコーデックにおいてフレーム消失を補償する装置および方法
US8515767B2 (en) * 2007-11-04 2013-08-20 Qualcomm Incorporated Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs
KR101439205B1 (ko) * 2007-12-21 2014-09-11 삼성전자주식회사 오디오 매트릭스 인코딩 및 디코딩 방법 및 장치
EP2077550B8 (en) * 2008-01-04 2012-03-14 Dolby International AB Audio encoder and decoder
MX2011000369A (es) * 2008-07-11 2011-07-29 Ten Forschung Ev Fraunhofer Codificador y decodificador de audio para codificar marcos de señales de audio muestreadas.
MX2011000382A (es) * 2008-07-11 2011-02-25 Fraunhofer Ges Forschung Codificador de audio, decodificador de audio, metodos para la codificacion y decodificacion de audio; transmision de audio y programa de computacion.
ES2654433T3 (es) * 2008-07-11 2018-02-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador de señal de audio, método para codificar una señal de audio y programa informático
US8457975B2 (en) * 2009-01-28 2013-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program
ES2441069T3 (es) * 2009-10-08 2014-01-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decodificador multimodo para señal de audio, codificador multimodo para señal de audio, procedimiento y programa de computación que usan un modelado de ruido en base a linealidad-predicción-codificación
WO2011044700A1 (en) * 2009-10-15 2011-04-21 Voiceage Corporation Simultaneous time-domain and frequency-domain noise shaping for tdac transforms
MX2012004648A (es) * 2009-10-20 2012-05-29 Fraunhofer Ges Forschung Codificacion de señal de audio, decodificador de señal de audio, metodo para codificar o decodificar una señal de audio utilizando una cancelacion del tipo aliasing.
EP2362375A1 (en) * 2010-02-26 2011-08-31 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for modifying an audio signal using harmonic locking
US9536534B2 (en) * 2011-04-20 2017-01-03 Panasonic Intellectual Property Corporation Of America Speech/audio encoding apparatus, speech/audio decoding apparatus, and methods thereof
US9934780B2 (en) * 2012-01-17 2018-04-03 GM Global Technology Operations LLC Method and system for using sound related vehicle information to enhance spoken dialogue by modifying dialogue's prompt pitch
CN103493130B (zh) * 2012-01-20 2016-05-18 弗劳恩霍夫应用研究促进协会 用以利用正弦代换进行音频编码及译码的装置和方法
RU2612589C2 (ru) 2013-01-29 2017-03-09 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Низкочастотное акцентирование для основанного на lpc кодирования в частотной области
US20140358529A1 (en) * 2013-05-29 2014-12-04 Tencent Technology (Shenzhen) Company Limited Systems, Devices and Methods for Processing Speech Signals

Also Published As

Publication number Publication date
AU2014211520A1 (en) 2015-09-17
US20180293993A9 (en) 2018-10-11
EP2951814A1 (en) 2015-12-09
US20200327896A1 (en) 2020-10-15
EP2951814B1 (en) 2017-05-10
RU2612589C2 (ru) 2017-03-09
US20230087652A1 (en) 2023-03-23
WO2014118152A1 (en) 2014-08-07
US20180240467A1 (en) 2018-08-23
MX2015009752A (es) 2015-11-06
CN110047500B (zh) 2023-09-05
BR112015018040A2 (es) 2017-07-11
CN105122357A (zh) 2015-12-02
US11854561B2 (en) 2023-12-26
PT2951814T (pt) 2017-07-25
US20150332695A1 (en) 2015-11-19
MX346927B (es) 2017-04-05
AU2014211520B2 (en) 2017-04-06
CN105122357B (zh) 2019-04-23
KR20150110708A (ko) 2015-10-02
US10692513B2 (en) 2020-06-23
PL2951814T3 (pl) 2017-10-31
HK1218018A1 (zh) 2017-01-27
AR094682A1 (es) 2015-08-19
JP6148811B2 (ja) 2017-06-14
JP2016508618A (ja) 2016-03-22
TWI536369B (zh) 2016-06-01
BR112015018040B1 (pt) 2022-01-18
RU2015136223A (ru) 2017-03-06
CA2898677A1 (en) 2014-08-07
US20240119953A1 (en) 2024-04-11
TW201435861A (zh) 2014-09-16
CN110047500A (zh) 2019-07-23
US10176817B2 (en) 2019-01-08
US11568883B2 (en) 2023-01-31
SG11201505911SA (en) 2015-08-28
AR115901A2 (es) 2021-03-10
KR101792712B1 (ko) 2017-11-02
ZA201506314B (en) 2016-07-27
CA2898677C (en) 2017-12-05
MY178306A (en) 2020-10-07

Similar Documents

Publication Publication Date Title
ES2635142T3 (es) Énfasis de baja frecuencia para la codificación basada en lpc en el dominio de la frecuencia
JP6306702B2 (ja) 符号化オーディオ信号の復号装置、方法およびコンピュータプログラム
TWI523004B (zh) 用以再現音訊信號之裝置及方法、用以產生編碼音訊信號之裝置及方法、與電腦程式
ES2971838T3 (es) Codificación de audio multiseñal utilizando el blanqueamiento de señal como preprocesamiento
ES2659838T3 (es) Decodificador de audio y método para proporcionar una información de audio decodificada usando un ocultamiento de errores en base a una señal de excitación de dominio de tiempo
ES2380307T3 (es) Esquema de codificación/decodificación de audio de tasa de transmisión de bits baja con preprocesamiento común.
RU2668397C2 (ru) Кодер и декодер аудиосигнала, использующие процессор частотной области, процессор временной области и кросспроцессор для непрерывной инициализации
ES2693051T3 (es) Aparato y procedimiento para generar una señal mejorada mediante el uso de relleno de ruido independiente
ES2688021T3 (es) Adición de ruido de confort para modelar ruido de fondo a bajas tasas de bits
JP2019164367A (ja) 低複雑度の調性適応音声信号量子化
ES2898281T3 (es) Control de ancho de banda en codificadores y/o decodificadores