ES2821025T3 - Codificador de audio, decodificador de audio, procedimiento para codificar una señal de audio y procedimiento para decodificar una señal de audio codificada - Google Patents

Codificador de audio, decodificador de audio, procedimiento para codificar una señal de audio y procedimiento para decodificar una señal de audio codificada Download PDF

Info

Publication number
ES2821025T3
ES2821025T3 ES16709331T ES16709331T ES2821025T3 ES 2821025 T3 ES2821025 T3 ES 2821025T3 ES 16709331 T ES16709331 T ES 16709331T ES 16709331 T ES16709331 T ES 16709331T ES 2821025 T3 ES2821025 T3 ES 2821025T3
Authority
ES
Spain
Prior art keywords
spectral coefficients
groups
encoder
spectral
decoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES16709331T
Other languages
English (en)
Inventor
Bernd Edler
Christian Helmrich
Max Neuendorf
Benjamin Schubert
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority claimed from PCT/EP2016/054831 external-priority patent/WO2016142357A1/en
Application granted granted Critical
Publication of ES2821025T3 publication Critical patent/ES2821025T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/12Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/547Motion estimation performed in a transform domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/635Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by filter definition or implementation details

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Un codificador (100) para codificar una señal de audio (102), donde el codificador (100) está configurado para codificar la señal de audio (102) en el dominio de la transformada o en el dominio de banco de filtros (104), donde el codificador está configurado para determinar coeficientes espectrales (106_t0_f1:106_t0_f6; 106_t-1_f1:106_t-1_f6) de la señal de audio (102) correspondientes a una trama actual (108_t0) y al menos una trama anterior (108_t-1), donde el codificador (100) está configurado para aplicar selectivamente la codificación predictiva a una pluralidad de coeficientes espectrales individuales (106_t0_f2) o grupos de coeficientes espectrales (106_t0_f4,106_t0_f5), donde el codificador (100) está configurado para determinar un valor de espaciamiento, donde el codificador (100) está configurado para seleccionar la pluralidad de coeficientes espectrales individuales (106_t0_f2) o grupos de coeficientes espectrales (106_t0_f4,106_t0_f5) a los cuales se aplica la codificación predictiva sobre la base del valor de espaciamiento; caracterizado porque el valor de espaciamiento es un valor de espaciamiento de armónicos que describe un espaciamiento entre armónicos de la señal de audio (102).

Description

DESCRIPCIÓN
Codificador de audio, decodificador de audio, procedimiento para codificar una señal de audio y procedimiento para decodificar una señal de audio codificada
[0001] Las realizaciones se refieren a la codificación de audio; en particular, a un procedimiento y aparato para codificar una señal de audio empleando la codificación predictiva y a un procedimiento y aparato para decodificar una señal de audio codificada empleando la decodificación predictiva. Las realizaciones preferidas se refieren a procedimientos y aparatos para la predicción espectral adaptada al tono. Otras realizaciones preferidas se refieren a la codificación perceptual de señales de audio tonal por medio de codificación por transformadas con herramientas de predicción en el dominio espectral entre tramas.
[0002] Para mejorar la calidad de las señales tonales codificadas especialmente a bajas tasas de bits, los codificadores de audio por transformada modernos emplean transformadas muy largas y/o predicción a largo plazo o pre/post-filtrado. Sin embargo, una transformada larga implica un largo retraso algorítmico, lo que es inadmisible para situaciones de comunicaciones con bajo retardo. Por consiguiente, los indicadores con muy bajo retardo basados en el tono fundamental instantáneo han cobrado popularidad últimamente. El códec Opus de IETF (del inglés, Internet Engineering Task Force, Fuerza de Tareas de Ingenieros de Internet) utiliza pre- y post-filtrado adaptativo al tono en su trayecto de codificación por CELT (del inglés, Constrained-Energy Lapped Transform, Transformada Traslapada con Energía Restringida en el dominio de la frecuencia [J. M. Valin, K. Vos, y T. Terriberry, “Definition of the Opus audio codec,” 2012, IETF RFC 6716. http://tools.ietf.org/html/rfc67161.], y el códec de 3GPP (del inglés, 3rd Generation Partnership Project, Proyecto Conjunto de Tercera Generación) de EVS (del inglés, Enhanced Voice Services, Servicios de Voz Mejorados) ofrece un post-filtro de armónicos a largo plazo para la mejora perceptual de las señales decodificadas por transformadas [3GPP TS 26.443, “Codec for Enhanced Voice Services (EVS),” Publicación 12, Dic.
2014.]. Estas dos estrategias operan en el dominio del tiempo sobre la forma de onda de la señal completamente decodificada, haciendo que su aplicación sea difícil y/o costosa desde el punto de vista informático de manera selectiva de la frecuencia (ambos esquemas solo ofrecen un simple filtro de paso bajo para cierta selectividad de la frecuencia). Por consiguiente se ofrece una alternativa bienvenida a la predicción a largo plazo en el dominio del tiempo (LTP, del inglés Long Term Prediction) o pre-/post-filtrado (PPF, del inglés Pre-/post-filtering) mediante la predicción en el dominio de la frecuencia (FDP, por sus siglas en inglés Frequency Domain Prediction) como la propuesta en MPEG-2 AAC (por sus siglas en inglés, Moving Picture Expert Group Advanced Audio Coding/Codificación Avanzada de Audio del Grupo de Expertos en Imágenes en Movimiento 2) [ISO/IEC 13818-7, “ Information technology - Part 7: Advanced Audio Coding (AAC),” 2006.]. Este procedimiento, aunque facilita la selectividad de la frecuencia, tiene sus propias desventajas, como se describe a continuación.
[0003] El procedimiento de FDP antes citado tiene dos desventajas con respecto a las demás herramientas. En primer lugar, el procedimiento de FDP requiere una elevada complejidad informática. En detalle, la codificación por predicción lineal de un orden de al menos dos (es decir de los bins de transformación de canales de las dos últimas tramas) se aplica a cientos de bins espectrales por cada trama y canal en el peor de los casos de predicción en todas las bandas de factores de escala [ISO/IEC 13818-7, “ Information technology - Part 7: Advanced Audio Coding (AAC),” 2006.]. En segundo lugar, el procedimiento de FDP comprende una ganancia de predicción total limitada. Más precisamente, la eficiencia de la predicción es limitada porque los componentes ruidos entre las partes espectrales tonales predecibles armónicas, se someten también a la predicción, introduciendo errores, ya que estas partes ruidosas por lo general no son predecibles.
[0004] La elevada complejidad se debe a la retroadaptabilidad de los indicadores. Esto significa que se tienen que calcular los coeficientes de predicción correspondientes a cada bin sobre la base de bins ya transmitidos. Por lo tanto, las imprecisiones numéricas entre el codificador y el decodificador pueden dar lugar a errores debido a los coeficientes de predicción divergentes. Para superar este problema, se debe garantizar una adaptación idéntica con los bits exactos. Además, incluso si se deshabilitan grupos de indicadores en ciertas tramas, siempre se tiene que realizar la adaptación para mantener actualizados los coeficientes de predicción.
[0005] El documento US 2007/0016415 A1 describe técnicas y herramientas para la predicción de coeficientes espectrales en la codificación y decodificación. El espectro completo de una subtrama se divide en múltiples segmentos de tamaño uniforme y la predicción se puede aplicar de forma selectiva sobre una base de segmento.
[0006] Por lo tanto, el objeto de la presente invención es dar a conocer un concepto para la codificación de una señal de audio y/o la decodificación de una señal de audio codificada que evita al menos uno (por ejemplo, ambos) de los problemas antes mencionados y da lugar a una implementación más eficiente y económica desde el punto de vista informático.
[0007] Este objeto se resuelve en las reivindicaciones independientes.
[0008] Las implementaciones ventajosas son abordadas por las reivindicaciones dependientes.
[0009] Según el concepto de la presente invención, la codificación predictiva se aplica (solamente) a coeficientes espectrales seleccionados. Los coeficientes espectrales a los cuales se aplica la codificación predictiva pueden ser seleccionados de conformidad con las características de la señal. Por ejemplo, no aplicando la codificación predictiva a los componentes ruidosos de la señal se evitan los errores antes citados que se introducen por la predicción de componentes ruidosos no predecibles de la señal. Al mismo tiempo se puede reducir la complejidad informática, puesto que solo se aplica la codificación predictiva a componentes espectrales seleccionados.
[0010] Por ejemplo, la codificación perceptual de señales de audio tonal puede ser ejecutada (por ejemplo, por el codificador) por medio de codificación por transformada con procedimientos de predicción entre tramas guiados/adaptativos en el dominio espectral. Se puede incrementar la eficiencia de la predicción en el dominio de la frecuencia (FDP, por sus siglas en inglés) y se puede reducir la complejidad informática aplicando la predicción solo a los coeficientes espectrales, por ejemplo, alrededor de los componentes armónicos de la señal situados en múltiplos enteros de una frecuencia fundamental o tono, lo que puede ser señalizado en un flujo de bits apropiado de un codificador a un decodificador, por ejemplo en forma de valor de espaciamiento. Las realizaciones de la presente invención se pueden implementar o integrar preferentemente en el códec de audio 3D de MPEG-H (por sus siglas en inglés Moving Picture Expert Group-H [High Efficiency]/Grupo de Expertos en Imágenes en Movimiento de Alta Eficiencia), aunque son aplicables a cualquier sistema de codificación de audio por transformadas como, por ejemplo, MPEG-2 AAC (por sus siglas en inglés, Moving Picture Expert Group-2 Advanced Audio Coding/Codificación Avanzada de Audio del Grupo de Expertos en Imágenes en Movimiento-2).
[0011] En este documento se describen las realizaciones de la presente invención haciendo referencia a los dibujos adjuntos, en los cuales:
Fig. 1 ilustra un diagrama esquemático de bloques de un codificador para codificar una señal de audio, según una realización;
Fig. 2 ilustra en un diagrama la amplitud de una señal de audio trazada en la frecuencia correspondiente a una trama actual y los correspondientes coeficientes espectrales seleccionados a los cuales se aplica la codificación predictiva, según una realización;
Fig. 3 ilustra en un diagrama la amplitud de una señal de audio trazada en la frecuencia correspondiente a una trama actual y los correspondientes coeficientes espectrales que son objeto de predicción según MPEG-2 AAC (por sus siglas en inglés, Moving Picture Expert Group-2 Advanced Audio Coding/Codificación Avanzada de Audio del Grupo de Expertos en Imágenes en Movimiento-2);
Fig. 4 ilustra un diagrama esquemático de bloques de un decodificador para decodificar una señal de audio codificada, según una realización;
Fig. 5 ilustra un gráfico de flujo de un procedimiento para codificar una señal de audio, según una realización y Fig. 6 ilustra un gráfico de flujo de un procedimiento para decodificar una señal de audio codificada, según una realización.
[0012] Los elementos iguales o equivalentes con igual o equivalente funcionalidad están indicados en la siguiente descripción por números de referencia iguales o equivalentes.
[0013] En la siguiente descripción, se expone una pluralidad de detalles con el fin de proporcionar una explicación más exhaustiva de las realizaciones de la presente invención. Sin embargo, será evidente para el experto en la materia que la invención puede ser puesta en práctica sin estos detalles específicos. En otros casos, se exponen en forma de diagrama de bloques y no en detalle las estructuras y dispositivos muy conocidos para no complicar las realizaciones de la presente invención. Además, las características de las diferentes realizaciones descritas a continuación pueden combinarse entre sí a menos que se indique específicamente lo contrario.
[0014] La Fig. 1 ilustra un diagrama esquemático de bloques de un codificador 100 para codificar una señal de audio 102, según una realización. El codificador 100 está configurado para codificar la señal de audio 102 en el dominio de la transformada o en el dominio de banco de filtros 104 (por ejemplo, dominio de la frecuencia o dominio espectral), donde el codificador 100 está configurado para determinar coeficientes espectrales 106_t0_f1 a 106_t0_f6 de la señal de audio 102 correspondientes a una trama actual 108_t0 y coeficientes espectrales 106_t-1_f1 a 106_t-1_f6 de la señal de audio correspondientes al menos a una trama anterior 108_t-1. Además, el codificador 100 está configurado para aplicar selectivamente la codificación predictiva a una pluralidad de coeficientes espectrales individuales 106_t0_f2 o grupos de coeficientes espectrales 106_t0_f4 y 106_t0_f5, donde el codificador 100 está configurado para determinar un valor de espaciamiento, donde el codificador 100 está configurado para seleccionar la pluralidad de coeficientes espectrales individuales 106_t0_f2 o grupos de coeficientes espectrales 106_t0_f4 y 106_t0_f5 a los cuales se aplica la codificación predictiva sobre la base del valor de espaciamiento.
[0015] En otras palabras, el codificador 100 está configurado para aplicar selectivamente la codificación predictiva a una pluralidad de coeficientes espectrales individuales 106_t0_f2 o grupos de coeficientes espectrales 106_t0_f4 y 106_t0_f5 seleccionados sobre la base de un único valor de espaciamiento transmitido en forma de información lateral.
[0016] Este valor de espaciamiento puede corresponder a una frecuencia (por ejemplo, una frecuencia fundamental de un tono armónico (de la señal de audio 102)), que define, junto con sus múltiplos enteros, los centros de todos los grupos de coeficientes espectrales a los cuales se aplica la predicción: el primer grupo se puede centrar alrededor de esta frecuencia, el segundo grupo se puede centrar alrededor de esta frecuencia multiplicada por dos, el tercer grupo se puede centrar alrededor de esta frecuencia multiplicada por tres, y así sucesivamente. El conocimiento de estas frecuencias centrales permite el cálculo de los coeficientes de predicción para predecir los correspondientes componentes sinusoides de la señal (por ejemplo, fundamentales y sobretonos de las señales armónicas). Por lo tanto, ya no es necesaria la complicada retroadaptación propensa a errores de los coeficientes de predicción.
[0017] En algunas realizaciones, el codificador 100 puede estar configurado para determinar un valor de espaciamiento por trama.
[0018] En algunas realizaciones, la pluralidad de coeficientes espectrales individuales 106_t0_f2 o grupos de coeficientes espectrales 106_t0_f4 y 106_t0_f5 pueden estar separados por al menos un coeficiente espectral 106_t0_f3.
[0019] En algunas realizaciones, el codificador 100 puede estar configurado para aplicar la codificación predictiva a una pluralidad de coeficientes espectrales individuales que están separados por al menos un coeficiente espectral, como por ejemplo dos coeficientes espectrales individuales que están separados por al menos un coeficiente espectral. Además, el codificador 100 puede estar configurado para aplicar la codificación predictiva a una pluralidad de grupos de coeficientes espectrales (donde cada uno de los grupos comprende al menos dos coeficientes espectrales) que están separados por al menos un coeficiente espectral, como por ejemplo dos grupos de coeficientes espectrales que están separados por al menos un coeficiente espectral. Además, el codificador 100 puede estar configurado para aplicar la codificación predictiva a una pluralidad de coeficientes espectrales individuales y/o grupos de coeficientes espectrales que están separados por al menos un coeficiente espectral, como por ejemplo, al menos un coeficiente espectral individual y al menos un grupo de coeficientes espectrales que están separados por al menos un coeficiente espectral.
[0020] En el ejemplo ilustrado en la Fig. 1, el codificador 100 está configurado para determinar seis coeficientes espectrales 106_t0_f1 a 106_t0_f6 correspondientes a la trama actual 108_t0 y seis coeficientes espectrales 106_t-1_f1 a 106_t-1_f6 correspondientes a la trama anterior 108_t-1. Por consiguiente, el codificador 100 está configurado para aplicar selectivamente la codificación predictiva al segundo coeficiente espectral individual 106_t0_f2 de la trama actual y al grupo de coeficientes espectrales que consiste en el cuarto y quinto coeficientes espectrales 106_t0_f4 y 106_t0_f5 de la trama actual 108_t0. Como se puede apreciar, el segundo coeficiente espectral individual 106_t0_f2 y el grupo de coeficientes espectrales que consiste en el cuarto y quinto coeficientes espectrales 106_t0_f4 y 106_t0_f5 están separados entre sí por el tercer coeficiente espectral 106_t0_f3.
[0021] Cabe observar que el término “selectivamente” utilizado en el presente contexto se refiere a la aplicación de la codificación predictiva (solo) a coeficientes espectrales seleccionados. En otras palabras, la codificación predictiva no se aplica necesariamente a todos los coeficientes espectrales, sino solo a coeficientes espectrales individuales o grupos de coeficientes espectrales seleccionados, coeficientes espectrales individuales y/o grupos de coeficientes espectrales seleccionados que pueden estar separados entre sí por al menos un coeficiente espectral. En otras palabras, la codificación predictiva puede ser deshabilitada para al menos un coeficiente espectral por el cual está separada la pluralidad seleccionada de coeficientes espectrales individuales o grupos de coeficientes espectrales.
[0022] En algunas realizaciones, el codificador 100 puede estar configurado para aplicar de manera selectiva la codificación predictiva a una pluralidad de coeficientes espectrales individuales 106_t0_f2 o grupos de coeficientes espectrales 106_t0_f4 y 106_t0_f5 de la trama actual 108_t0 sobre la base de al menos una correspondiente pluralidad de coeficientes espectrales individuales 106_t-1_f2 o grupos de coeficientes espectrales 106_t-1_f4 y 106_t-1_f5 de la trama anterior 108_t-1.
[0023] Por ejemplo, el codificador 100 puede estar configurado para codificar por predicción la pluralidad de coeficientes espectrales individuales 106_t0_f2 o los grupos de coeficientes espectrales 106_t0_f4 y 106_t0_f5 de la trama actual 108_t0, mediante la codificación de los errores de predicción entre una pluralidad de coeficientes espectrales pronosticados individuales 110_t0_f2 o grupos de coeficientes espectrales pronosticados 110_t0_f4 y 110_t0_f5 de la trama actual 108_t0 y la pluralidad de coeficientes espectrales individuales 106_t0_f2 o grupos de coeficientes espectrales 106_t0_f4 y 106_t0_f5 de la trama actual (o versiones cuantificadas de los mismos).
[0024] En la Fig. 1, el codificador 100 codifica el coeficiente espectral individual 106_t0_f2 y el grupo de coeficientes espectrales que consiste en los coeficientes espectrales 106_t0_f4 y 106_t0_f5, mediante la codificación de un error de predicción entre el coeficiente espectral individual pronosticado 110_t0_f2 de la trama actual 108_t0 y el coeficiente espectral individual 106_t0_f2 de la trama actual 108_t0 y entre el grupo de coeficientes espectrales pronosticados 110_t0_f4 y 110_t0_f5 de la trama actual y el grupo de coeficientes espectrales 106_t0_f4 y 106_t0_f5 de la trama actual.
[0025] En otras palabras, el segundo coeficiente espectral 106_t0_f2 se codifica mediante la codificación del error de predicción (o diferencia) entre el segundo coeficiente espectral pronosticado 110_t0_f2 y el segundo coeficiente espectral (real o determinado) 106_t0_f2, donde el cuarto coeficiente espectral 106_t0_f4 se codifica mediante la codificación del error de predicción (o diferencia) entre el cuarto coeficiente espectral pronosticado 110_t0_f4 y el cuarto coeficiente espectral (real o determinado) 106_t0_f4 y donde el quinto coeficiente espectral 106_t0_f5 se codifica mediante la codificación del error de predicción (o diferencia) entre el quinto coeficiente espectral pronosticado 110_t0_f5 y el quinto coeficiente espectral (real o determinado) 106_t0_f5.
[0026] En una realización, el codificador 100 puede estar configurado para determinar la pluralidad de coeficientes espectrales pronosticados individuales 110_t0_f2 o grupos de coeficientes espectrales pronosticados 110_t0_f4 y 110_t0_f5 correspondientes a la trama actual 108_t0 por medio de las correspondientes versiones reales de la pluralidad de coeficientes espectrales individuales 106_t-1_f2 o de los grupos de coeficientes espectrales 106_t-1_f4 y 106_t-1_f5 de la trama anterior 108_t-1.
[0027] En otras palabras, el codificador 100 puede, en el procedimiento de determinación anteriormente descrito, utilizar directamente la pluralidad de coeficientes espectrales individuales reales 106_t-1_f2 o los grupos de coeficientes espectrales reales 106_t-1_f4 y 106_t-1_f5 de la trama anterior 108_t-1, donde 106_t-1_f2, 106_t-1_f4 y 106_t-1_f5 representan los coeficientes espectrales o grupos de coeficientes espectrales originales, aún no cuantificados, respectivamente, tal como son obtenidos por el codificador 100 de tal manera que dicho codificador pueda operar en el dominio de la transformada o en el dominio de banco de filtros 104.
[0028] Por ejemplo, el codificador 100 puede estar configurado para determinar el segundo coeficiente espectral pronosticado 110_t0_f2 de la trama actual 108_t0 sobre la base de una versión correspondiente aún no cuantificada del segundo coeficiente espectral 106_t-1_f2 de la trama anterior 10 108_t-1, el cuarto coeficiente espectral pronosticado 110_t0_f4 de la trama actual 108_t0 sobre la base de una versión correspondiente aún no cuantificada del cuarto coeficiente espectral 106_t-1_f4 de la trama anterior 108_t-1, y el quinto coeficiente espectral pronosticado 110_t0_f5 de la trama actual 108_t0 sobre la base de una versión correspondiente aún no cuantificada del quinto coeficiente espectral 106_t-1_f5 de la trama anterior.
[0029] En virtud de esta estrategia, el esquema de codificación y decodificación predictiva puede exhibir un tipo de modelado armónico del ruido de cuantificación, puesto que un decodificador correspondiente, una realización del cual se describe más adelante con respecto a la Fig. 4, solo puede emplear, en la etapa de determinación antes citada, las versiones cuantificadas transmitidas de la pluralidad de coeficientes espectrales individuales 106_t-1_f2 o de la pluralidad de grupos de coeficientes espectrales 106_t-1_f4 y 106_t-1_f5 de la trama anterior 108_t-1, para una decodificación predictiva.
[0030] Aunque ese tipo de modelado de ruido armónico que se ejecuta tradicionalmente, por ejemplo, por predicción a largo plazo (LTP, por sus siglas en inglés Long-Term Prediction) en el dominio del tiempo, puede ser subjetivamente ventajoso para la codificación predictiva, en algunos casos puede ser desventajoso, puesto que puede llevar a una cantidad excesiva no buscada de tonalidad introducida en una señal de audio decodificada. Por esta razón, en adelante se describe un esquema alternativo de codificación predictiva, que se sincroniza por completo con la correspondiente decodificación y, por ello, solo aprovecha toda ganancia posible de predicción sin llevar al modelado de ruido de cuantificación. Según esta realización de codificación alternativa, el codificador 100 puede estar configurado para determinar la pluralidad de coeficientes espectrales pronosticados individuales 110_t0_f2 o grupos de coeficientes espectrales pronosticados 110_t0_f4 y 110_t0_f5 correspondientes a la trama actual 108_t0 usando las versiones cuantificadas correspondientes de la pluralidad de coeficientes espectrales individuales 106_t-1_f2 o los grupos de coeficientes espectrales 106_t-1_f4 y 106_t-1_f5 de la trama anterior 108_t-1.
[0031] Por ejemplo, el codificador 100 puede estar configurado para determinar el segundo coeficiente espectral pronosticado 110_t0_f2 de la trama actual 108_t0 basándose en una versión cuantificada correspondiente del segundo coeficiente espectral 106_t-1_f2 de la trama anterior 108_t-1, el cuarto coeficiente espectral pronosticado 110_t0_f4 de la trama actual 108_t0 sobre la base de una versión cuantificada correspondiente del cuarto coeficiente espectral 106_t-1_f4 de la trama anterior 108_t-1, y el quinto coeficiente espectral pronosticado 110_t0_f5 de la trama actual 108_t0 sobre la base de una versión cuantificada correspondiente del quinto coeficiente espectral 106_t-1_f5 de la trama anterior.
[0032] Asimismo, el codificador 100 puede estar configurado para derivar los coeficientes de predicción 112_f2, 114_f2, 112_f4, 114_f4, 112_f5 y 114_f5 del valor de espaciamiento, y para calcular la pluralidad de coeficientes espectrales pronosticados individuales 110_t0_f2 o grupos de coeficientes espectrales pronosticados 110_t0_f4 y 110_t0_f5 correspondientes a la trama actual 108_t0 usando las versiones cuantificadas correspondientes de la pluralidad de coeficientes espectrales individuales 106_t-1_f2 y 106_t-2_f2 o grupos de coeficientes espectrales 106_t-1_f4, 106_t-2_f4, 106_t-1_f5, y 106_t-2_f5 de al menos dos tramas anteriores 108_t-1 y 108_t-2 y utilizando los coeficientes de predicción derivados 112_f2, 114_f2, 112_f4, 114_f4, 112_f5 y 114_f5.
[0033] Por ejemplo, el codificador 100 puede estar configurado para derivar los coeficientes de predicción 112_f2 y 114_f2 correspondientes al segundo coeficiente espectral 106_t0_f2 del valor de espaciamiento, para derivar los coeficientes de predicción 112_f4 y 114_f4 correspondientes al cuarto coeficiente espectral 106_t0_f4 del valor de espaciamiento, y para derivar los coeficientes de predicción 112_f5 y 114_f5 correspondientes al quinto coeficiente espectral 106_t0_f5 del valor de espaciamiento.
[0034] Por ejemplo, la derivación de coeficientes de predicción se puede realizar de la siguiente manera: si el valor de espaciamiento corresponde a una frecuencia f0 o a una versión codificada de la misma, la frecuencia central del k° grupo de coeficientes espectrales para el cual se habilita la predicción es fc=K*f0. Si la frecuencia de muestreo es fs el tamaño del salto de la transformada (desplazamiento entre tramas sucesivas) es N, los coeficientes de predicción ideales del K° grupo, tomando como suposición una señal sinusoide con la frecuencia fc son:
p1 = 2*cos(N*2*pi*fc/fs) y p2 = -1.
[0035] Si, por ejemplo, ambos coeficientes espectrales 106_t0_f4 y 106_t0_f5 están dentro de este grupo, los coeficientes de predicción son:
112_f4 = 112_f5 = 2*cos(N*2*pi*fc/fs) y 114_f4 = 114_f5 = -1.
[0036] Por razones de estabilidad, se puede introducir un factor de atenuación d que da lugar a coeficientes de predicción modificados:
112_f4' = 112_f5' = d*2*cos(N*2*pi*fc/fs), 114_f4' = 114_f5' = d2
[0037] Dado que el valor de espaciamiento se transmite en la señal de audio codificada 120, el decodificador puede derivar exactamente los mismos coeficientes de predicción 212_f4 = 212_f5 = 2*cos(N*2*pi*fc/fs) y 114_f4 = 114_f5 = -1. Si se utiliza un factor de atenuación, se pueden modificar los coeficientes de manera acorde.
[0038] Como se indica en la Fig. 1, el codificador 100 puede estar configurado para emitir una señal de audio codificada 120. Por consiguiente, el codificador 100 puede estar configurado para incluir en la señal de audio codificada 120 versiones cuantificadas de los errores de predicción correspondientes a la pluralidad de coeficientes espectrales individuales 106_t0_f2 o grupos de coeficientes espectrales 106_t0_f4 y 106_t0_f5 a los cuales se aplica la codificación predictiva. Además, el codificador 100 puede estar configurado para no incluir los coeficientes de predicción 112_f2 a 114_f5 en la señal de audio codificada 120.
[0039] De este modo, el codificador 100 puede utilizar solo los coeficientes de predicción 112_f2 a 114_f5 para calcular la pluralidad de coeficientes espectrales pronosticados individuales 110_t0_f2 o grupos de coeficientes espectrales pronosticados 110_t0_f4 y 110_t0_f5 y de estos los errores de predicción entre el coeficiente espectral individual pronosticado 110_t0_f2 o grupo de coeficientes espectrales pronosticados 110_t0_f4 y 110_t0_f5 y el coeficiente espectral individual 106_t0_f2 o grupo de coeficientes espectrales pronosticados 110_t0_f4 y 110_t0_f5 de la trama actual, pero no emitir los coeficientes espectrales individuales 106_t0_f4 (o una versión cuantificada de los mismos) o grupos de coeficientes espectrales 106_t0_f4 y 106_t0_f5 (o versiones cuantificadas de los mismos) ni los coeficientes de predicción 112_f2 a 114_f5 en la señal de audio codificada 120. Por consiguiente, un decodificador, una realización del cual se describe más adelante con respecto a la Fig. 4, puede derivar los coeficientes de predicción 112_f2 a 114_f5 para calcular la pluralidad de coeficientes espectrales pronosticados individuales o grupos de coeficientes espectrales pronosticados correspondientes a la trama actual del valor de espaciamiento.
[0040] En otras palabras, el codificador 100 puede estar configurado para emitir la señal de audio codificada 120 que incluye versiones cuantificadas de los errores de predicción en lugar de versiones cuantificadas de la pluralidad de coeficientes espectrales individuales 106_t0_f2 o de los grupos de coeficientes espectrales 106_t0_f4 y 106_t0_f5 para la pluralidad de coeficientes espectrales individuales 106_t0_f2 o grupos de coeficientes espectrales 106_t0_f4 y 106_t0_f5 a los cuales se aplica la codificación predictiva.
[0041] Asimismo, el codificador 100 puede estar configurado para emitir la señal de audio codificada 102 que incluye versiones cuantificadas de los coeficientes espectrales 106_t0_f3 por los cuales está separada la pluralidad de coeficientes espectrales individuales 106_t0_f2 o los grupos de coeficientes espectrales 106_t0_f4 y 106_t0_f5, de tal manera que haya una alternancia de los coeficientes espectrales 106_t0_f2 o grupos de coeficientes espectrales 106_t0_f4 y 106_t0_f5 de los cuales se incluyen versiones cuantificadas de los errores de predicción en la señal de audio codificada 120 y coeficientes espectrales 106_t0_f3 o grupos de coeficientes espectrales de los cuales se emiten versiones cuantificadas sin emplear la codificación predictiva.
[0042] En algunas realizaciones, el codificador 100 puede estar configurado además para codificar por entropía las versiones cuantificadas de los errores de predicción y las versiones cuantificadas de los coeficientes espectrales 106_t0_f3 por los cuales la pluralidad de coeficientes espectrales individuales 106_t0_f2 o grupos de coeficientes espectrales 106_t0_f4 y 106_t0_f5 están separados, y para incluir las versiones codificadas por entropía en la señal de audio codificada 120 (en lugar de las versiones no codificadas por entropía de los mismos).
[0043] La Fig. 2 ilustra, en un diagrama, la amplitud de la señal de audio 102 trazada en la frecuencia correspondiente a una trama actual 108_t0. Además, en la Fig. 2, se indican los coeficientes espectrales en el dominio de la transformada o en el dominio de banco de filtros determinados por el codificador 100 correspondientes a la trama actual 108_t0 de la señal de audio 102.
[0044] Como se ilustra en la Fig. 2, el codificador 100 puede estar configurado para aplicar de manera selectiva la codificación predictiva a una pluralidad de grupos 116_1 a 116_6 de coeficientes espectrales que están separados por al menos un coeficiente espectral. En detalle, en la realización mostrada en la Fig. 2, el codificador 100 aplica selectivamente la codificación predictiva a seis grupos 116_1 a 116_6 de coeficientes espectrales, donde cada uno de los primeros cinco grupos 116_1 a 116_5 de coeficientes espectrales incluye tres coeficientes espectrales (por ejemplo, el segundo grupo 116_2 incluye los coeficientes espectrales 106_t0_f8, 106_t0_f9 y 106_t0_f10), donde el sexto grupo 116_6 de coeficientes espectrales incluye dos coeficientes espectrales. De esa manera, los seis grupos 116_1 a 116_6 de coeficientes espectrales están separados por (cinco) grupos 118_1 a 118_5 de coeficientes espectrales a los cuales no se aplica la codificación predictiva.
[0045] En otras palabras, como se indica en la Fig. 2, el codificador 100 puede estar configurado para aplicar de manera selectiva la codificación predictiva a los grupos 116_1 a 110_6 de coeficientes espectrales, de tal manera que haya una alternancia de los grupos 116_1 a 116_6 de coeficientes espectrales a los cuales se aplica la codificación predictiva y los grupos 118_1 a 118_5 de coeficientes espectrales a los cuales no se aplica la codificación predictiva.
[0046] En algunas realizaciones, el codificador 100 puede estar configurado para determinar un valor de espaciamiento (indicado en la Fig. 2 por las flechas 122_1 y 122_2), donde el codificador 100 puede estar configurado para seleccionar la pluralidad de grupos 116_1 a 116_6 de coeficientes espectrales (o la pluralidad de coeficientes espectrales individuales) a los cuales se aplica la codificación predictiva sobre la base del valor de espaciamiento.
[0047] El valor de espaciamiento puede ser, por ejemplo, un espaciamiento (o distancia) entre dos frecuencias características de la señal de audio 102, tales como los picos 124_1 y 124_2 de la señal de audio. Además, el valor de espaciamiento puede ser un número entero de coeficientes espectrales (o índices de coeficientes espectrales) que aproxima el espaciamiento entre las dos frecuencias características de la señal de audio. Naturalmente, el valor de espaciamiento puede ser también un número real o una fracción o múltiplo del número entero de coeficientes espectrales que describe el espaciamiento entre las dos frecuencias características de la señal de audio.
[0048] En algunas realizaciones, el codificador 100 puede estar configurado para determinar una frecuencia fundamental instantánea de la señal de audio (102) y para derivar el valor de espaciamiento de la frecuencia fundamental instantánea o una fracción o un múltiplo de la misma.
[0049] Por ejemplo, el primer pico 124_1 de la señal de audio 102 puede ser una frecuencia fundamental instantánea (o tono, o primer armónico) de la señal de audio 102. Por lo tanto, el codificador 100 puede estar configurado para determinar la frecuencia fundamental instantánea de la señal de audio 102 y para derivar el valor de espaciamiento de la frecuencia fundamental instantánea o una fracción o un múltiplo de la misma. En ese caso, el valor de espaciamiento puede ser un número entero (o una fracción, o un múltiplo de la misma) de coeficientes espectrales que aproxima el espaciamiento entre la frecuencia fundamental instantánea 124_1 y un segundo armónico 124_2 de la señal de audio 102.
[0050] Naturalmente, la señal de audio 102 puede comprender más de dos armónicos. Por ejemplo, la señal de audio 102 expuesta en la Fig. 2 comprende seis armónicos 124_1 a 124_6 espectralmente distribuidos de tal manera que la señal de audio 102 comprenda un armónico en cada múltiplo entero de la frecuencia fundamental instantánea. Naturalmente, también es posible que la señal de audio 102 no comprenda la totalidad sino algunos de los armónicos, tales como el primero, tercero y quinto armónicos.
[0051] En algunas realizaciones, el codificador 100 puede estar configurado para seleccionar grupos 116_1 a 116_6 de coeficientes espectrales (o coeficientes espectrales individuales) espectralmente dispuestos según una red de armónicos definida por el valor de espaciamiento correspondiente a la codificación predictiva. De esa manera, la red de armónicos definida por el valor de espaciamiento describe la distribución espectral periódica (espaciamiento equidistante) de armónicos en la señal de audio 102. En otras palabras, la red de armónicos definida por el valor de espaciamiento puede ser una secuencia de valores de espaciamiento que describe el espaciamiento equidistante de armónicos de la señal de audio.
[0052] Además, el codificador 100 puede estar configurado para seleccionar coeficientes espectrales (por ejemplo, solo esos coeficientes espectrales), los índices espectrales de los cuales son iguales o se encuentran dentro de un intervalo (por ejemplo, predeterminado o variable) alrededor de una pluralidad de índices espectrales derivados sobre la base del valor de espaciamiento, para una codificación predictiva.
[0053] Del valor de espaciamiento se pueden derivar los índices (o números) de los coeficientes espectrales que representan los armónicos de la señal de audio 102. Por ejemplo, suponiendo que un cuarto coeficiente espectral 106_t0_f4 represente la frecuencia fundamental instantánea de la señal de audio 102 y suponiendo que el valor de espaciamiento sea cinco, se pueden derivar los coeficientes espectrales que tienen el índice nueve sobre la base del valor de espaciamiento. Como se puede apreciar en la Fig. 2, el coeficiente espectral así derivado, que tiene el índice nueve, es decir el noveno coeficiente espectral 106_t0_f9, representa el segundo armónico. De manera similar, se pueden derivar los coeficientes espectrales que tienen los índices 14, 19, 24 y 29, que representan el tercero a sexto armónicos 124_3 a 124_6. Sin embargo, no solo los coeficientes espectrales que tienen los índices iguales a la pluralidad de índices espectrales derivados sobre la base del valor de espaciamiento pueden ser objeto de codificación predictiva, sino también los coeficientes espectrales que tienen los índices dentro de un intervalo dado alrededor de la pluralidad de índices espectrales derivados sobre la base del valor de espaciamiento. Por ejemplo, como se ilustra en la Fig. 2, el intervalo puede ser tres, por lo que no se selecciona una pluralidad de coeficientes espectrales individuales para la codificación predictiva, sino más bien una pluralidad de grupos de coeficientes espectrales.
[0054] Asimismo, el codificador 100 puede estar configurado para seleccionar los grupos 116_1 a 116_6 de coeficientes espectrales (o la pluralidad de coeficientes espectrales individuales) a los cuales se aplica la codificación predictiva de tal manera que haya una alternancia periódica, periódica con una tolerancia de /-1 coeficiente espectral, entre los grupos 116_1 a 116_6 de coeficientes espectrales (o la pluralidad de coeficientes espectrales individuales) a los cuales se aplica la codificación predictiva y los coeficientes espectrales por los cuales están separados los grupos de coeficientes espectrales (o la pluralidad de coeficientes espectrales individuales) a los cuales se aplica la codificación predictiva. La tolerancia de /-1 coeficiente espectral puede ser indispensable cuando una distancia entre dos armónicos de la señal de audio 102 no es igual a un valor de espaciamiento entero (entero con respecto a los índices o números de coeficientes espectrales) sino, por el contrario, a una fracción o múltiplo del mismo. Esto se puede ver asimismo en la Fig. 2 puesto que las flechas 122_1 a 122_6 no siempre apuntan exactamente al centro o punto medio de los correspondientes coeficientes espectrales.
[0055] En otras palabras, la señal de audio 102 puede comprender al menos dos componentes armónicos de la señal 124_1 a 124_6, donde el codificador 100 puede estar configurado para aplicar de manera selectiva la codificación predictiva a la pluralidad de grupos 116_1 a 116_6 de coeficientes espectrales (o coeficientes espectrales individuales) que representan dichos al menos dos componentes armónicos de la señal 124_1 a 124_6 o entornos espectrales alrededor de dichos al menos dos componentes armónicos de la señal 124_1 a 124_6 de la señal de audio 102. Los entornos espectrales alrededor de dichos al menos dos componentes armónicos de la señal 124_1 a 124_6 pueden ser, por ejemplo, /-1, 2, 3, 4 o 5 componentes espectrales.
[0056] Por consiguiente, el codificador 100 puede estar configurado para no aplicar la codificación predictiva a los grupos 118_1 a 118_5 de coeficientes espectrales (o pluralidad de coeficientes espectrales individuales) que no representan dichos al menos dos componentes armónicos de la señal 124_1 a 124_6 o entornos espectrales de dichos al menos dos componentes armónicos de la señal 124_1 a 124_6 de la señal de audio 102. En otras palabras, el codificador 100 puede estar configurado para no aplicar la codificación predictiva a la pluralidad de grupos 118_1 a 118_5 de coeficientes espectrales (o coeficientes espectrales individuales) que pertenecen a un ruido de fondo no tonal entre los armónicos de la señal 124_1 a 124_6.
[0057] Además, el codificador 100 puede estar configurado para determinar un valor de espaciamiento de armónicos que indica un espaciamiento espectral entre dichos al menos dos componentes armónicos de la señal 124_1 a 124_6 de la señal de audio 102, el valor de espaciamiento de los armónicos que indica la pluralidad de coeficientes espectrales individuales o grupos de coeficientes espectrales que representan dichos al menos dos componentes armónicos de la señal 124_1 a 124_6 de la señal de audio 102.
[0058] Por otra parte, el codificador 100 puede estar configurado para proporcionar la señal de audio codificada 120 de tal manera que la señal de audio codificada 120 incluya el valor de espaciamiento (por ejemplo, un valor de espaciamiento por trama) o (de lo contrario) un parámetro a partir del cual se pueda derivar directamente el valor de espaciamiento.
[0059] Las realizaciones de la presente invención abordan los dos problemas antes citados del procedimiento de FDP (por sus siglas en inglés, Frequency Domain Prediction, Predicción en el Dominio de la Frecuencia) mediante la introducción de un valor de espaciamiento de armónicos en el procedimiento de FDP, señalizado desde el codificador (transmisor) 100 a un decodificador respectivo (receptor) de tal manera que ambos puedan operar en forma totalmente sincronizada. Dicho valor de espaciamiento de armónicos puede servir como indicador de una frecuencia fundamental instantánea (o tono) de uno o más espectros asociados a una trama que se va a codificar e identifica qué bins espectrales (coeficientes espectrales) se deben predecir. Más específicamente, solo los coeficientes espectrales que rodean a los componentes armónicos de la señal situados (en función de su indexación) en múltiplos enteros del tono fundamental (definidos por el valor de espaciamiento de los armónicos) se van a someter a la predicción. Las Figs. 2 y 3 ilustran la estrategia de predicción adaptativa al tono por medio de un sencillo ejemplo, en el cual la Fig. 3 ilustra el funcionamiento del indicador del estado actual de la técnica de MPEG-2 AAC (por sus siglas en inglés, Moving Picture Expert Group-2 Advanced Audio Coding/Codificación Avanzada de Audio del Grupo de Expertos en Imágenes en Movimiento-2), que no predice solo alrededor de una red de armónicos sino que somete a cada bin espectral por debajo de una determinada frecuencia final a predicción y donde la Fig. 2 ilustra el mismo indicador con una modificación según una realización integrada para ejecutar la predicción solo de los bins “tonales” que están cerca de la red de espaciamiento de armónicos.
[0060] La comparación de las Figs. 2 y 3 revela dos ventajas de la modificación según una realización, es decir (1) se incluyen muchos menos bins espectrales en el procedimiento de predicción, lo que reduce la complejidad (en el ejemplo dado aproximadamente un 40 %, puesto que solo se predicen tres quintos de los bins) y (2) los bins pertenecientes al ruido de fondo no tonal entre los armónicos de las señales no resultan afectados por la predicción, lo que debe aumentar la eficiencia de la predicción.
[0061] Cabe observar que el valor de espaciamiento de los armónicos no necesariamente debe corresponder al tono instantáneo real de la señal de entrada, sino que podría representar una fracción o múltiplo del tono real si esto ofrece una mejora general de la eficiencia del procedimiento de predicción. Además, se debe hacer hincapié en que el valor de espaciamiento de los armónicos no tiene que reflejar un múltiplo entero de la indexación de bins o unidades de ancho de banda sino que puede incluir una fracción de dichas unidades.
[0062] A continuación, se describe una implementación preferida de un codificador de audio al estilo MPEG (por sus siglas en inglés, Moving Picture Expert Group, Grupo de Expertos en Imágenes en Movimiento).
[0063] La predicción adaptativa al tono está preferentemente integrada a la MPEG-2 AAC (por sus siglas en inglés, Moving Picture Expert Group Advanced Audio Coding/Codificación Avanzada de Audio del Grupo de Expertos en Imágenes en Movimiento 2) [ISO/IEC 13818-7, “Information technology - Part 7: Advanced Audio Coding (AAC),” 2006.] o, utilizando un indicador similar al de la AAC, al códec de audio 3D de MPEG-H (por sus siglas en inglés, Moving Picture Expert Group-High efficiency coding [ISO/IEC 23008-3, “Information technology - High efficiency coding, part 3: 3D audio,” 2015.]. En particular, se puede escribir una bandera de un bit y leerla en un respectivo flujo de bits por cada trama y canal que no sea codificado de manera independiente (correspondiente a canales de tramas independientes, la bandera puede no transmitirse dado que la predicción puede ser deshabilitada para garantizar la independencia). Si se ajusta la bandera a uno, se pueden escribir y leer 8 bits más. Estos 8 bits representan una versión cuantificada (por ejemplo un índice) del valor de espaciamiento de armónicos correspondiente a la trama y canal dados. Empleando el valor de espaciamiento de armónicos derivado de la versión cuantificada mediante el uso de una función de mapeo lineal o no lineal, el procedimiento de predicción se puede llevar a cabo según una realización expuesta en la Fig. 2. De preferencia, solo los bins situados dentro de una distancia máxima de 1,5 bins alrededor de la red de armónicos se someten a la predicción. Por ejemplo, si el valor de espaciamiento de los armónicos indica una línea de armónicos en el índice de bin 47.11, se predicen solamente los bins que están en los índices 46, 47 y 48. Dicha distancia máxima, sin embargo, podría ser especificada de manera diferente, ya sea fijada a-priori para todos los canales y tramas o, por separado, para cada trama y canal sobre la base del valor de espaciamiento de los armónicos. La Fig. 4 ilustra un diagrama esquemático de bloques de un decodificador 200 para decodificar una señal codificada 120. El decodificador 200 está configurado para decodificar la señal de audio codificada 120 en el dominio de la transformada o en el dominio de banco de filtros 204, donde el decodificador 200 está configurado para analizar la señal de audio codificada 120 con el fin de obtener coeficientes espectrales codificados 206_t0_f1 a 206_t0_f6 de la señal de audio correspondientes a una trama actual 208_t0 y coeficientes espectrales codificados 206_t-1_f0 a 206_t-1_f6 correspondientes al menos a una trama anterior 208_t-1 y donde el decodificador 200 está configurado para aplicar selectivamente la decodificación predictiva a una pluralidad de coeficientes espectrales codificados individuales o grupos de coeficientes espectrales codificados que están separados por al menos un coeficiente espectral codificado.
[0064] En algunas realizaciones, el decodificador 200 puede estar configurado para aplicar la decodificación predictiva a una pluralidad de coeficientes espectrales codificados individuales que están separados por al menos un coeficiente espectral codificado, como por ejemplo dos coeficientes espectrales codificados individuales que están separados por al menos un coeficiente espectral codificado. Además, el decodificador 200 puede estar configurado para aplicar la decodificación predictiva a una pluralidad de grupos de coeficientes espectrales codificados (donde cada uno de los grupos comprende al menos dos coeficientes espectrales codificados) que están separados por al menos un coeficiente espectral codificado, como por ejemplo dos grupos de coeficientes espectrales codificados que están separados por al menos un coeficiente espectral codificado. Además, el decodificador 200 puede estar configurado para aplicar la decodificación predictiva a una pluralidad de coeficientes espectrales codificados individuales y/o grupos de coeficientes espectrales codificados que están separados por al menos un coeficiente espectral codificado como, por ejemplo, al menos un coeficiente espectral codificado individual y al menos un grupo de coeficientes espectrales codificados que están separados por al menos un coeficiente espectral codificado.
[0065] En el ejemplo ilustrado en la Fig. 4, el decodificador 200 está configurado para determinar seis coeficientes espectrales codificados 206_t0_f1 a 206_t0_f6 correspondientes a la trama actual 208_t0 y seis coeficientes espectrales codificados 206_t-1_f1 a 206_t-1_f6 correspondientes a la trama anterior 208_t-1. Por consiguiente, el decodificador 200 está configurado para aplicar selectivamente decodificación predictiva al segundo coeficiente espectral codificado individual 206_t0_f2 de la trama actual y al grupo de coeficientes espectrales codificados que consiste en el cuarto y quinto coeficientes espectrales codificados 206_t0_f4 y 206_t0_f5 de la trama actual 208_t0. Como se puede apreciar, el segundo coeficiente espectral codificado individual 206_t0_f2 y el grupo de coeficientes espectrales codificados que consiste en el cuarto y quinto coeficientes espectrales codificados 206_t0_f4 y 206_t0_f5 están separados entre sí por el tercer coeficiente espectral codificado 206_t0_f3.
[0066] Cabe observar que el término “selectivamente” utilizado en este contexto se refiere a la aplicación de la decodificación predictiva (solo) a coeficientes espectrales codificados seleccionados. En otras palabras, la decodificación predictiva no se aplica a todos los coeficientes espectrales codificados, sino por el contrario solo a coeficientes espectrales individuales o grupos de coeficientes espectrales codificados seleccionados, donde los coeficientes espectrales individuales y/o grupos de coeficientes espectrales codificados seleccionados están separados entre sí por al menos un coeficiente espectral codificado. En otras palabras, no se aplica la decodificación predictiva a dicho al menos un coeficiente espectral codificado por el cual están separados la pluralidad de coeficientes espectrales codificados individuales o grupos de coeficientes espectrales codificados seleccionados.
[0067] En algunas realizaciones el decodificador 200 puede estar configurado para no aplicar la decodificación predictiva a dicho al menos un coeficiente espectral codificado 206_t0_f3 por el cual están separados los coeficientes espectrales codificados individuales 206_t0_f2 o el grupo de coeficientes espectrales 206_t0_f4 y 206_t0_f5.
[0068] El decodificador 200 puede estar configurado para decodificar por entropía los coeficientes espectrales codificados, para obtener errores de predicción cuantificados correspondientes a los coeficientes espectrales 206_t0_f2, 2016_t0_f4 y 206_t0_f5 a los cuales se va a aplicar la decodificación predictiva y coeficientes espectrales cuantificados 206_t0_f3 correspondientes a dicho al menos un coeficiente espectral a los cuales no se va a aplicar la decodificación predictiva. Por lo tanto, el decodificador 200 puede estar configurado para aplicar los errores de predicción cuantificados a una pluralidad de coeficientes espectrales pronosticados individuales 210_t0_f2 o grupos de coeficientes espectrales pronosticados 210_t0_f4 y 210_t0_f5, para obtener, con respecto a la trama actual 208_t0, coeficientes espectrales decodificados asociados a los coeficientes espectrales codificados 206_t0_f2, 206_t0_f4 y 206_t0_f5 a los cuales se aplica la decodificación predictiva.
[0069] Por ejemplo, el decodificador 200 puede estar configurado para obtener un segundo error de predicción cuantificado para un segundo coeficiente espectral cuantificado 206_t0_f2 y para aplicar el segundo error de predicción cuantificado al segundo coeficiente espectral pronosticado 210_t0_f2, para obtener un segundo coeficiente espectral decodificado asociado al segundo coeficiente espectral codificado 206_t0_f2, donde el decodificador 200 puede estar configurado para obtener un cuarto error de predicción cuantificado correspondiente a un cuarto coeficiente espectral cuantificado 206_t0_f4 y para aplicar el cuarto error de predicción cuantificado al cuarto coeficiente espectral pronosticado 210_t0_f4, para obtener un cuarto coeficiente espectral decodificado asociado al cuarto coeficiente espectral codificado 206_t0_f4 y donde el decodificador 200 puede estar configurado para obtener un quinto error de predicción cuantificado correspondiente a un quinto coeficiente espectral cuantificado 206_t0_f5 y para aplicar el quinto error de predicción cuantificado al quinto coeficiente espectral pronosticado 210_t0_f5, para obtener un quinto coeficiente espectral decodificado asociado al quinto coeficiente espectral codificado 206_t0_f5.
[0070] Además, el decodificador 200 puede estar configurado para determinar la pluralidad de coeficientes espectrales pronosticados individuales 210_t0_f2 o grupos de coeficientes espectrales pronosticados 210_t0_f4 y 210_t0_f5 correspondientes a la trama actual 208_t0 basándose en una correspondiente pluralidad de los coeficientes espectrales codificados individuales 206_t-1_f2 (por ejemplo, usando una pluralidad de coeficientes espectrales anteriormente decodificados asociados a la pluralidad de los coeficientes espectrales codificados individuales 206_t-1_f2) o grupos de coeficientes espectrales codificados 206_t-1_f4 y 206_t-1_f5 (por ejemplo, usando grupos de coeficientes espectrales antes decodificados asociados a los grupos de coeficientes espectrales codificados 206_t-1_f4 y 206_t-1_f5) de la trama anterior 208_t-1.
[0071] Por ejemplo, el decodificador 200 puede estar configurado para determinar el segundo coeficiente espectral pronosticado 210_t0_f2 de la trama actual 208_t0 utilizando un segundo coeficiente espectral anteriormente decodificado (cuantificado) asociado al segundo coeficiente espectral codificado 206_t-1_f2 de la trama anterior 208_t-1, al cuarto coeficiente espectral pronosticado 210_t0_f4 de la trama actual 208_t0 usando un cuarto coeficiente espectral anteriormente decodificado (cuantificado) asociado al cuarto coeficiente espectral codificado 206_t-1_f4 de la trama anterior 208_t-1, y al quinto coeficiente espectral pronosticado 210_t0_f5 de la trama actual 208_t0 usando un quinto coeficiente espectral anteriormente decodificado (cuantificado) asociado al quinto coeficiente espectral codificado 206_t-1_f5 de la trama anterior 208_t-1.
[0072] Por otra parte, el decodificador 200 puede estar configurado para derivar los coeficientes de predicción del valor de espaciamiento y donde el decodificador 200 puede estar configurado para calcular la pluralidad de coeficientes espectrales pronosticados individuales 210_t0_f2 o grupos de coeficientes espectrales pronosticados 210_t0_f4 y 210_t0_f5 correspondientes a la trama actual 208_t0 utilizando una correspondiente pluralidad de coeficientes espectrales individuales anteriormente decodificados o grupos de coeficientes espectrales anteriormente decodificados de al menos dos tramas anteriores 208_t-1 y 208_t-2 y utilizando los coeficientes de predicción derivados.
[0073] Por ejemplo, el decodificador 200 puede estar configurado para derivar los coeficientes de predicción 212_f2 y 214_f2 correspondientes al segundo coeficiente espectral codificado 206_t0_f2 del valor de espaciamiento, para derivar coeficientes de predicción 212_f4 y 214_f4 correspondientes al cuarto coeficiente espectral codificado 206_t0_f4 del valor de espaciamiento, y para derivar coeficientes de predicción 212_f5 y 214_f5 correspondientes al quinto coeficiente espectral codificado 206_t0_f5 del valor de espaciamiento.
[0074] Cabe observar que el decodificador 200 puede estar configurado para decodificar la señal de audio codificada 120 con el fin de obtener errores de predicción cuantificados en lugar de una pluralidad de coeficientes espectrales cuantificados individuales o grupos de coeficientes espectrales cuantificados correspondientes a la pluralidad de coeficientes espectrales codificados individuales o grupos de coeficientes espectrales codificados a los cuales se aplica la decodificación predictiva.
[0075] Además, el decodificador 200 puede estar configurado para decodificar la señal de audio codificada 120 con el fin de obtener coeficientes espectrales cuantificados por los cuales la pluralidad de coeficientes espectrales individuales o grupos de coeficientes espectrales están separados, de tal manera que haya una alternancia de los coeficientes espectrales codificados 206_t0_f2 o grupos de coeficientes espectrales codificados 206_t0_f4 y 206_t0_f5 con respecto a los cuales se obtienen errores de predicción cuantificados y los coeficientes espectrales codificados 206_t0_f3 o grupos de coeficientes espectrales codificados para los cuales se obtienen coeficientes espectrales cuantificados.
[0076] El decodificador 200 puede estar configurado para proporcionar una señal de audio decodificada 220 utilizando los coeficientes espectrales decodificados asociados a los coeficientes espectrales codificados 206_t0_f2, 206_t0_f4 y 206_t0_f5 a los cuales se aplica la decodificación predictiva, y usando los coeficientes espectrales decodificados por entropía asociados a los coeficientes espectrales codificados 206_t0_f1,206_t0_f3 y 206_t0_f6 a los cuales no se aplica la decodificación predictiva.
[0077] En algunas realizaciones, el decodificador 200 puede estar configurado para obtener un valor de espaciamiento, donde el decodificador 200 puede estar configurado para seleccionar la pluralidad de coeficientes espectrales codificados individuales 206_t0_f2 o grupos de coeficientes espectrales codificados 206_t0_f4 y 206_t0_f5 a los cuales se aplica la decodificación predictiva sobre la base del valor de espaciamiento.
[0078] Como ya se mencionara anteriormente con respecto a la descripción del correspondiente codificador 100, el valor de espaciamiento puede ser, por ejemplo, un espaciamiento (o distancia) entre dos frecuencias características de la señal de audio. Además, el valor de espaciamiento puede ser un número entero de coeficientes espectrales (o índices de coeficientes espectrales) que aproximan el espaciamiento entre las dos frecuencias características de la señal de audio. Naturalmente, el valor de espaciamiento puede ser también una fracción o múltiplo del número entero de coeficientes espectrales que describe el espaciamiento entre las dos frecuencias características de la señal de audio.
[0079] El decodificador 200 puede estar configurado para seleccionar coeficientes espectrales individuales o grupos de coeficientes espectrales espectralmente dispuestos según una red de armónicos definida por el valor de espaciamiento para una decodificación predictiva. La red de armónicos definida por el valor de espaciamiento puede describir la distribución espectral periódica (espaciamiento equidistante) de armónicos en la señal de audio 102. En otras palabras, la red de armónicos definida por el valor de espaciamiento puede ser una secuencia de valores de espaciamiento que describen el espaciamiento equidistante de los armónicos de la señal de audio 102.
[0080] Por otra parte, el decodificador 200 puede estar configurado para seleccionar coeficientes espectrales (por ejemplo, solo los coeficientes espectrales), cuyos índices espectrales son iguales o se encuentran dentro de un intervalo (por ejemplo, un intervalo predeterminado o variable) alrededor de una pluralidad de índices espectrales derivada sobre la base del valor de espaciamiento, para una decodificación predictiva. Por lo tanto, el decodificador 200 puede estar configurado para establecer una amplitud del intervalo dependiendo del valor de espaciamiento.
[0081] En algunas realizaciones, la señal de audio codificada puede comprender el valor de espaciamiento o una versión codificada del mismo (por ejemplo, un parámetro del cual se deriva directamente el valor de espaciamiento), donde el decodificador 200 puede estar configurado para extraer el valor de espaciamiento o la versión codificada del mismo de la señal de audio codificada para obtener el valor de espaciamiento.
[0082] Por otro lado, el decodificador 200 puede estar configurado para determinar el valor de espaciamiento por sí mismo, es decir que la señal de audio codificada no incluye el valor de espaciamiento. En ese caso, el decodificador 200 puede estar configurado para determinar una frecuencia fundamental instantánea (de la señal de audio codificada 120 que representa la señal de audio 102) y para derivar el valor de espaciamiento de la frecuencia fundamental instantánea o una fracción o un múltiplo de la misma.
[0083] En algunas realizaciones, el decodificador 200 puede estar configurado para seleccionar la pluralidad de coeficientes espectrales individuales o grupos de coeficientes espectrales a los cuales se aplica la decodificación predictiva de tal manera que haya una alternancia periódica, periódica con una tolerancia de /-1 coeficiente espectral, entre la pluralidad de coeficientes espectrales individuales o grupos de coeficientes espectrales a los cuales se aplica la decodificación predictiva y los coeficientes espectrales por los cuales la pluralidad de coeficientes espectrales individuales o grupos de coeficientes espectrales a los cuales se aplica la decodificación predictiva están separados.
[0084] En algunas realizaciones, la señal de audio 102 representada por la señal de audio codificada 120 comprende al menos dos componentes armónicos de la señal, donde el decodificador 200 está configurado para aplicar selectivamente decodificación predictiva a la pluralidad de coeficientes espectrales codificados individuales 206_t0_f2 o grupos de coeficientes espectrales codificados 206_t0_f4 y 206_t0_f5 que representa dichos al menos dos componentes armónicos de la señal o entornos espectrales alrededor de dichos al menos dos componentes armónicos de la señal de la señal de audio 102. Los entornos espectrales alrededor de dichos al menos dos componentes armónicos de la señal pueden ser, por ejemplo, /-1, 2, 3, 4 o 5 componentes espectrales.
[0085] Por consiguiente, el decodificador 200 puede estar configurado para identificar dichos al menos dos componentes armónicos de la señal, y para aplicar de manera selectiva la decodificación predictiva a la pluralidad de coeficientes espectrales codificados individuales 206_t0_f2 o de grupos de coeficientes espectrales codificados 206_t0_f4 y 206_t0_f5 que está asociada a los componentes armónicos identificados de la señal, por ejemplo, que representan los componentes armónicos identificados de la señal o que están alrededor de los componentes armónicos identificados de la señal).
[0086] Por otro lado, la señal de audio codificada 120 puede comprender una información (por ejemplo, el valor de espaciamiento) que identifica dichos al menos dos componentes armónicos de la señal. En ese caso, el decodificador 200 puede estar configurado para aplicar de manera selectiva la decodificación predictiva a la pluralidad de coeficientes espectrales codificados individuales 206_t0_f2 o grupos de coeficientes espectrales codificados 206_t0_f4 y 206_t0_f5 que está asociada a los componentes armónicos identificados de la señal, por ejemplo, que representan los componentes armónicos identificados de la señal o que están alrededor de los componentes armónicos identificados de la señal).
[0087] En las dos alternativas mencionadas anteriormente, el decodificador 200 puede estar configurado para no aplicar la decodificación predictiva a la pluralidad de coeficientes espectrales codificados individuales 206_t0_f3, 206_t0_f1 y 206_t0_f6 o grupos de coeficientes espectrales codificados que no representan dichos al menos dos componentes armónicos de la señal o entornos espectrales de dichos al menos dos componentes armónicos de la señal de la señal de audio 102.
[0088] En otras palabras, el decodificador 200 puede estar configurado para no aplicar la decodificación predictiva a la pluralidad de coeficientes espectrales codificados individuales 206_t0_f3, 206_t0_f1,206_t0_f6 o grupos de coeficientes espectrales codificados que pertenecen a un ruido de fondo no tonal entre los armónicos de señal de la señal de audio 102.
[0089] La Fig. 5 ilustra un gráfico de flujo de un procedimiento 300 para codificar una señal de audio, según una realización. El procedimiento 300 comprende una etapa 302 de determinación de coeficientes espectrales de la señal de audio correspondientes a una trama actual y al menos una trama anterior, y una etapa 304 de aplicación de manera selectiva de la codificación predictiva a una pluralidad de coeficientes espectrales individuales o grupos de coeficientes espectrales que están separados por al menos un coeficiente espectral.
[0090] La Fig. 6 ilustra un gráfico de flujo de un procedimiento 400 para decodificar una señal de audio codificada, según una realización. El procedimiento 400 comprende una etapa 402 de análisis de la señal de audio codificada para obtener coeficientes espectrales codificados de la señal de audio correspondientes a una trama actual y al menos una trama anterior, y una etapa 404 de aplicación de manera selectiva de la decodificación predictiva a una pluralidad de coeficientes espectrales codificados individuales o grupos de coeficientes espectrales codificados que están separados por al menos un coeficiente espectral codificado.
[0091] Aunque se han descrito algunos aspectos en el contexto de un aparato, es obvio que estos aspectos también representan una descripción del procedimiento correspondiente, en el cual un bloque o dispositivo corresponde a una etapa del procedimiento o a una característica de una etapa del procedimiento. De manera análoga, los aspectos descritos en el contexto de una etapa del procedimiento también representan una descripción de un bloque o elemento correspondiente o de una característica de un aparato correspondiente. En algunas realizaciones, una cualquiera o más de las etapas más importantes del procedimiento pueden ser ejecutadas por ese tipo de aparato.
[0092] La señal de audio codificada de la invención puede ser almacenada en un medio de almacenamiento digital o puede ser transmitida por un medio de transmisión tal como un medio de transmisión inalámbrico o un medio de transmisión conectado por cables tal como Internet.
[0093] Dependiendo de ciertos requisitos de implementación, las realizaciones pueden ser implementadas en hardware o en software o al menos parcialmente en software, o al menos parcialmente en hardware. La implementación se puede realizar empleando un medio de almacenamiento digital, por ejemplo un disco flexible, un DVD, un Blu-Ray, un CD, una ROM, una PROM, una EPROM, una EEPROM o una memoria FLASH, que tiene almacenadas en la misma señales de control legibles electrónicamente, que cooperan (o tienen capacidad para cooperar) con un sistema informático programable de tal manera que se ejecute el procedimiento respectivo. Por lo tanto, el medio de almacenamiento digital puede ser legible por ordenador.
[0094] Algunas realizaciones según la invención un soporte no transitorio de datos que comprende señales de control legibles electrónicamente, con capacidad para cooperar con un sistema informático programable de tal manera que se ejecute uno de los procedimientos descritos en esta invención.
[0095] En general, las realizaciones de la presente invención pueden ser implementadas en forma de producto de programa informático con un código de programa, donde el código de programa cumple la función de ejecutar uno de los procedimientos al ejecutarse el programa informático en un ordenador. El código de programa puede ser almacenado, por ejemplo, en un soporte legible por máquina.
[0096] Otras realizaciones comprenden el programa informático para ejecutar uno de los procedimientos descritos en esta invención, almacenado en un soporte legible por máquina.
[0097] En otras palabras, una realización del procedimiento de la invención consiste, por lo tanto, en un programa informático que consta de un código de programa para poner en práctica uno de los procedimientos descritos en esta invención al ejecutarse el programa informático en un ordenador.
[0098] Otra realización de los procedimientos de la invención consiste, por lo tanto, en un soporte de datos (o medio de almacenamiento digital, o medio legible por ordenador) que comprende, grabado en el mismo, el programa informático para ejecutar uno de los procedimientos descritos en esta invención. El soporte de datos, el medio de almacenamiento digital o el medio grabado son por lo general tangibles y/o no transitorios.
[0099] Otra realización del procedimiento de la invención es, por lo tanto, un flujo de datos o una secuencia de señales que representa el programa informático para ejecutar uno de los procedimientos descritos en esta invención. El flujo de datos o la secuencia de señales pueden estar configurados, por ejemplo, para ser transferidos a través de una conexión de comunicación de datos, por ejemplo, a través de Internet.
[0100] Una realización adicional comprende un medio de procesamiento, por ejemplo, un ordenador, un dispositivo lógico programable, configurado o adaptado para ejecutar uno de los procedimientos descritos en esta invención.
[0101] Otra realización comprende un ordenador en el que se ha instalado el programa informático para ejecutar uno de los procedimientos descritos en esta invención.
[0102] Otra de las realizaciones según la invención comprende un aparato o un sistema configurado para transferir (por ejemplo, por vía electrónica u óptica) un programa informático para ejecutar uno de los procedimientos descritos en esta invención a un receptor. El receptor puede ser, por ejemplo, un ordenador, un dispositivo móvil, un dispositivo de memoria o similar. El aparato o sistema puede comprender, por ejemplo, un servidor de archivos para transferir un programa informático al receptor.
[0103] En algunas realizaciones, se puede utilizar un dispositivo lógico programable (por ejemplo, una matriz de puertas programables en el campo) para ejecutar algunas o todas las funcionalidades de los procedimientos descritos en esta invención. En algunas realizaciones, una matriz de puertas programables en el campo puede cooperar con un microprocesador para ejecutar uno de los procedimientos descritos en esta invención. Por lo general, los procedimientos son ejecutados preferentemente por cualquier aparato de hardware.
[0104] El aparato descrito en esta invención puede ser implementado utilizando un aparato de hardware o utilizando un ordenador, o mediante el uso de una combinación de un aparato de hardware y un ordenador.
[0105] Los procedimientos descritos en esta invención se pueden ejecutar utilizando un aparato de hardware, o utilizando un ordenador, o usando una combinación de un aparato de hardware y un ordenador.
[0106] Las realizaciones anteriormente descritas son meramente ilustrativas de los principios de la presente invención. Se entiende que las modificaciones y variaciones de las disposiciones y detalles descritos en esta invención deben ser evidentes para los expertos en la materia. Por lo tanto, solo se pretende limitarse al alcance de las siguientes reivindicaciones de patente y no a los detalles específicos presentados a modo de descripción y explicación de las realizaciones presentadas en esta invención.

Claims (45)

REIVINDICACIONES
1. Un codificador (100) para codificar una señal de audio (102), donde el codificador (100) está configurado para codificar la señal de audio (102) en el dominio de la transformada o en el dominio de banco de filtros (104), donde el codificador está configurado para determinar coeficientes espectrales (106_t0_f1:106_t0_f6; 106_t-1_f1:106_t-1_f6) de la señal de audio (102) correspondientes a una trama actual (108_t0) y al menos una trama anterior (108_t-1), donde el codificador (100) está configurado para aplicar selectivamente la codificación predictiva a una pluralidad de coeficientes espectrales individuales (106_t0_f2) o grupos de coeficientes espectrales (106_t0_f4,106_t0_f5), donde el codificador (100) está configurado para determinar un valor de espaciamiento, donde el codificador (100) está configurado para seleccionar la pluralidad de coeficientes espectrales individuales (106_t0_f2) o grupos de coeficientes espectrales (106_t0_f4,106_t0_f5) a los cuales se aplica la codificación predictiva sobre la base del valor de espaciamiento;
caracterizado porque el valor de espaciamiento es un valor de espaciamiento de armónicos que describe un espaciamiento entre armónicos de la señal de audio (102).
2. El codificador (100) según la reivindicación 1, donde la pluralidad de coeficientes espectrales individuales (106_t0_f2) o grupos de coeficientes espectrales (106_t0_f4,106_t0_f5) están separados por al menos un coeficiente espectral (106_t0_f3).
3. El codificador (100) según la reivindicación 2, donde no se aplica la codificación predictiva a dicho al menos un coeficiente espectral (106_t0_f3) por el cual los coeficientes espectrales individuales (106_t0_f2) o los grupos de coeficientes espectrales (106_t0_f4,106_t0_f5) están separados.
4. El codificador (100) según una de las reivindicaciones 1 a 3, donde el codificador (100) está configurado para aplicar la codificación predictiva a la pluralidad de coeficientes espectrales individuales (106_t0_f2) o los grupos de coeficientes espectrales (106_t0_f4,106_t0_f5) de la trama actual (108_t0), mediante la codificación de los errores de predicción entre una pluralidad de coeficientes espectrales pronosticados individuales (110_t0_f2) o grupos de coeficientes espectrales pronosticados (110_t0_f4,110_t0_f5) de la trama actual y la pluralidad de coeficientes espectrales individuales (106_t0_f2) o grupos de coeficientes espectrales (106_t0_f4,106_t0_f5) de la trama actual (108_t0).
5. El codificador (100) según la reivindicación 4, donde el codificador (100) está configurado para derivar coeficientes de predicción del valor de espaciamiento y donde el codificador (100) está configurado para calcular la pluralidad de coeficientes espectrales pronosticados individuales (110_t0_f2) o grupos de coeficientes espectrales pronosticados (110_t0_f4,110_t0_f5) correspondientes a la trama actual (108_t0) utilizando una correspondiente pluralidad de coeficientes espectrales individuales (106_t-2_f2,106_t-1_f2) o los grupos de coeficientes espectrales correspondientes (106_t-2_f4,106_t-1_f4; 106_t-2_f5,106_t-1_f5) de al menos dos tramas anteriores (108_t-2,108_t-1) y utilizando los coeficientes de predicción derivados.
6. El codificador (100) según la reivindicación 4, donde el codificador (100) está configurado para determinar la pluralidad de coeficientes espectrales pronosticados individuales (110_t0_f2) o grupos de coeficientes espectrales pronosticados (110_t0_f4,110_t0_f4) correspondientes a la trama actual (108_t0) usando las versiones cuantificadas correspondientes de la pluralidad de coeficientes espectrales individuales (106_t-1_f2) o los grupos de coeficientes espectrales (106_t-1_f4,106_t-1_f5) de la trama anterior (108_t-1).
7. El codificador (100) según la reivindicación 6, donde el codificador (100) está configurado para derivar coeficientes de predicción del valor de espaciamiento y donde el codificador (100) está configurado para calcular la pluralidad de coeficientes espectrales pronosticados individuales (110_t0_f2) o grupos de coeficientes espectrales pronosticados (110_t0_f4,110_t0_f5) correspondientes a la trama actual (108_t0) usando las versiones cuantificadas correspondientes de la pluralidad de coeficientes espectrales individuales (106_t-2_f2,106_t-1_f2) o los grupos de coeficientes espectrales (106_t-2_f4,106_t-1_f4; 106_t-2_f5,106_t-1_f5) de al menos dos tramas anteriores (108_t-2,108_t-1) y utilizando los coeficientes de predicción derivados.
8. El codificador (100) según cualquiera de las reivindicaciones 5 o 7, donde el codificador (100) está configurado para proporcionar una señal de audio codificada (120), no incluyendo la señal de audio codificada (120) los coeficientes de predicción o versiones codificadas de los mismos.
9. El codificador (100) según una de las reivindicaciones 4 a 8, donde el codificador (100) está configurado para proporcionar una señal de audio codificada (120), incluyendo la señal de audio codificada (120) versiones cuantificadas de los errores de predicción en lugar de versiones cuantificadas de la pluralidad de coeficientes espectrales individuales (106_t0_f2) o de los grupos de coeficientes espectrales (106_t0_f4,106_t0_f5) correspondientes a la pluralidad de coeficientes espectrales individuales o grupos de coeficientes espectrales a los cuales se aplica la codificación predictiva.
10. El codificador (100) según la reivindicación 9, donde la señal de audio codificada (120) incluye versiones cuantificadas de los coeficientes espectrales (106_t0_f3) a los cuales no se aplica la codificación predictiva, de tal manera que haya una alternancia de coeficientes espectrales (106_t0_f2) o grupos de coeficientes espectrales (106_t0_f4,106_t0_f5) de los cuales se incluyen versiones cuantificadas de los errores de predicción en la señal de audio codificada (120) y coeficientes espectrales (106_t0_f1,106_t0_f3,106_t0_f6) o grupos de coeficientes espectrales con respecto a los cuales se proporcionan versiones cuantificadas sin emplear la codificación predictiva.
11. El codificador (100) según una de las reivindicaciones 1 a 10, donde el codificador (100) está configurado para determinar una frecuencia fundamental instantánea de la señal de audio (102) y para derivar el valor de espaciamiento de la frecuencia fundamental instantánea o una fracción o un múltiplo de la misma.
12. El codificador (100) según una de las reivindicaciones 1 a 11, donde el codificador (100) está configurado para seleccionar coeficientes espectrales individuales o grupos (116_1:116_6) de coeficientes espectrales espectralmente dispuestos según una red de armónicos definida por el valor de espaciamiento para la codificación predictiva.
13. El codificador (100) según una de las reivindicaciones 1 a 11, donde el codificador (100) está configurado para seleccionar coeficientes espectrales, cuyos índices espectrales son iguales o se encuentran dentro de un intervalo alrededor de una pluralidad de índices espectrales derivados sobre la base del valor de espaciamiento, para una codificación predictiva.
14. El codificador (100) según la reivindicación 13, donde el codificador (100) está configurado para establecer la amplitud del intervalo dependiendo del valor de espaciamiento.
15. El codificador (100) según una de las reivindicaciones 1 a 14, donde el codificador (100) está configurado para seleccionar la pluralidad de coeficientes espectrales individuales o grupos (116_1:116_6) de coeficientes espectrales a los cuales se aplica la codificación predictiva de tal manera que haya una alternancia periódica, periódica con una tolerancia de /-1 coeficiente espectral, entre la pluralidad de coeficientes espectrales individuales o grupos (116_1:116_6) de coeficientes espectrales a los cuales se aplica la codificación predictiva y los coeficientes espectrales o grupos de coeficientes espectrales (118_1:118_5) a los cuales no se aplica la codificación predictiva.
16. El codificador (100) según la reivindicación 15, donde la señal de audio (102) comprende al menos dos componentes armónicos de la señal (124_1:124_6), donde el codificador (100) está configurado para aplicar selectivamente la codificación predictiva a la pluralidad de coeficientes espectrales individuales o grupos (116_1:116_6) de coeficientes espectrales que representan dichos al menos dos componentes armónicos de la señal (124_1:124_6) o entornos espectrales alrededor de dichos al menos dos componentes armónicos de la señal (124_1:124_6) de la señal de audio (102).
17. El codificador (100) según la reivindicación 16, donde el codificador (100) está configurado para no aplicar codificación predictiva a aquellos de la pluralidad de coeficientes espectrales individuales o grupos (118_1:118_5) de coeficientes espectrales que no representan los al menos dos componentes de señal armónicos (124_1:124_6) o ambientes espectrales de los al menos dos componentes de señal harmónicos (124_1:124_6) de la señal de audio (102).
18. El codificador (100) según cualquiera de las reivindicaciones 16 o 17, donde el codificador (100) está configurado para no aplicar la codificación predictiva a la pluralidad de coeficientes espectrales individuales o grupos (118_1:118_5) de coeficientes espectrales que pertenecen a un ruido de fondo no tonal entre los armónicos de señal (124_1:124_6).
19. El codificador (100) según una de las reivindicaciones 16 a 18, donde el valor de espaciamiento es un valor de espaciamiento de armónicos que indica un espaciamiento espectral entre dichos al menos dos componentes armónicos de la señal (124_1:124_6) de la señal de audio (102), indicando el valor de espaciamiento de los armónicos la pluralidad de coeficientes espectrales individuales o grupos (116_1:116_6) de coeficientes espectrales que representa dichos al menos dos componentes armónicos de la señal (124_1:124_6) de la señal de audio (102).
20. El codificador (100) según una de las reivindicaciones 1 a 19, donde el codificador (100) está configurado para proporcionar una señal de audio codificada (120), donde el codificador (100) está configurado para incluir en la señal de audio codificada (120) el valor de espaciamiento o una versión codificada del mismo.
21. El codificador (100) según una de las reivindicaciones 1 a 20, donde los coeficientes espectrales son bins espectrales.
22. Un decodificador (200) para decodificar una señal de audio codificada (120), donde el decodificador (200) está configurado para decodificar la señal de audio codificada (120) en el dominio de la transformada o en el dominio de banco de filtros (204), donde el decodificador (200) está configurado para analizar la señal de audio codificada (120) para obtener coeficientes espectrales codificados (206_t0_f1:206_t0_f6; 206_t-1_f1:206_t-1_f6) de la señal de audio (120) correspondientes a una trama actual (208_t0) y al menos una trama anterior (208_t-1) y donde el decodificador (200) está configurado para aplicar selectivamente decodificación predictiva a una pluralidad de coeficientes espectrales codificados individuales (206_t0_f2) o grupos de coeficientes espectrales codificados (206_t0_f4,206_t0_f5), donde el decodificador (200) está configurado para obtener un valor de espaciamiento, donde el decodificador (200) está configurado para seleccionar la pluralidad de coeficientes espectrales codificados individuales (206_t0_f2) o grupos de coeficientes espectrales codificados (206_t0_f4,206_t0_f5) a los cuales se aplica la decodificación predictiva sobre la base del valor de espaciamiento;
caracterizado porque el valor de espaciamiento es un valor de espaciamiento de armónicos que describe un espaciamiento entre armónicos de la señal de audio codificada (120).
23. El decodificador (200) según la reivindicación 22, donde la pluralidad de coeficientes espectrales codificados individuales (206_t0_f2) o grupos de coeficientes espectrales codificados (206_t0_f4,206_t0_f5) están separados por al menos un coeficiente espectral codificado (206_t0_f3).
24. El decodificador (200) según la reivindicación 23, donde la decodificación predictiva no se aplica a dicho al menos un coeficiente espectral (206_t0_f3) por el cual los coeficientes espectrales individuales (206_t0_f2) o el grupo de coeficientes espectrales (206_t0_f4,206_t0_f5) están separados.
25. El decodificador (200) según una de las reivindicaciones 22 a 24, donde el decodificador (200) está configurado para decodificar por entropía los coeficientes espectrales codificados, para obtener errores de predicción cuantificados correspondientes a los coeficientes espectrales (206_t0_f2,206_t0_f4,206_t0_f5) a los cuales se tiene que aplicar la decodificación predictiva y coeficientes espectrales cuantificados correspondientes a los coeficientes espectrales (206_t0_f3) a los cuales no se tiene que aplicar decodificación predictiva y
donde el decodificador (200) está configurado para aplicar los errores de predicción cuantificados a una pluralidad de coeficientes espectrales pronosticados individuales (210_t0_f2) o grupos de coeficientes espectrales pronosticados (210_t0_f4,210_t0_f5), para obtener, con respecto a la trama actual (208_t0), coeficientes espectrales decodificados asociados a los coeficientes espectrales codificados (206_t0_f2,206_t0_f4,206_t0_f5) a los cuales se aplica la decodificación predictiva.
26. El decodificador (200) según la reivindicación 25, donde el decodificador (200) está configurado para determinar la pluralidad de coeficientes espectrales pronosticados individuales (210_t0_f2) o grupos de coeficientes espectrales pronosticados (210_t0_f4,210_t0_f5) correspondientes a la trama actual (208_t0) basándose en una correspondiente pluralidad de los coeficientes espectrales codificados individuales (206_t-1_f2) o grupos de coeficientes espectrales codificados (206_t-1_f4,206_t-1_f5) de la trama anterior (208_t-1).
27. El decodificador (200) según la reivindicación 26, donde el decodificador (200) está configurado para derivar coeficientes de predicción del valor de espaciamiento y donde el decodificador (200) está configurado para calcular la pluralidad de coeficientes espectrales pronosticados individuales (210_t0_f2) o grupos de coeficientes espectrales pronosticados (210_t0_f4,210_t0_f5) correspondientes a la trama actual (208_t0) utilizando una correspondiente pluralidad de coeficientes espectrales individuales anteriormente decodificados o grupos de coeficientes espectrales anteriormente decodificados de al menos dos tramas anteriores y utilizando los coeficientes de predicción derivados.
28. El decodificador (200) según una de las reivindicaciones 22 a 27, donde el decodificador (200) está configurado para decodificar la señal de audio codificada (120) con el fin de obtener errores de predicción cuantificados en lugar de una pluralidad de coeficientes espectrales cuantificados individuales o grupos de coeficientes espectrales cuantificados correspondientes a la pluralidad de coeficientes espectrales codificados individuales (206_t0_f2) o grupos de coeficientes espectrales codificados (206_t0_f4,206_t0_f5) a los cuales se aplica la decodificación predictiva.
29. El decodificador (200) según la reivindicación 28, donde el decodificador está configurado para decodificar la señal de audio codificada (120) para obtener coeficientes espectrales cuantificados correspondientes a los coeficientes espectrales codificados (206_t0_f3) a los cuales no se aplica la decodificación predictiva, de tal manera que haya una alternancia de coeficientes espectrales codificados (206_t0_f2) o grupos de coeficientes espectrales codificados (206_t0_f4,206_t0_f5) con respecto a los cuales se obtienen los errores de predicción cuantificados y coeficientes espectrales codificados (206_t0_f3) o grupos de coeficientes espectrales codificados con respecto a los cuales se obtienen coeficientes espectrales cuantificados.
30. El decodificador (200) según una de las reivindicaciones 22 a 29, donde el decodificador (200) está configurado para seleccionar coeficientes espectrales individuales (206_t0_f2) o grupos de coeficientes espectrales (206_t0_f4,206_t0_f5) espectralmente dispuestos según una red de armónicos definida por el valor de espaciamiento para una decodificación predictiva.
31. El decodificador (200) según una de las reivindicaciones 22 a 30, donde el decodificador (200) está configurado para seleccionar coeficientes espectrales, los índices espectrales de los cuales son iguales o se encuentran dentro de un intervalo alrededor de una pluralidad de índices espectrales derivada sobre la base del valor de espaciamiento, para una decodificación predictiva.
32. El decodificador (200) según la reivindicación 31, donde el decodificador (200) está configurado para establecer una amplitud del intervalo dependiendo del valor de espaciamiento.
33. El decodificador (200) según una de las reivindicaciones 22 a 32, donde la señal de audio codificada (120) comprende el valor de espaciamiento o una versión codificada del mismo, donde el decodificador (200) está configurado para extraer el valor de espaciamiento o la versión codificada del mismo de la señal de audio codificada (120) para obtener el valor de espaciamiento.
34. El decodificador (200) según una de las reivindicaciones 22 a 32, donde el decodificador (200) está configurado para determinar el valor de espaciamiento.
35. El decodificador (200) según la reivindicación 34, donde el decodificador (200) está configurado para determinar una frecuencia fundamental instantánea y para derivar el valor de espaciamiento de la frecuencia fundamental instantánea o una fracción o un múltiplo de la misma.
36 El decodificador (200) según una de las reivindicaciones 22 a 35, donde la señal de audio (102) representada por la señal de audio codificada (120) comprende al menos dos componentes armónicos de la señal (124_1:124_6), donde el decodificador (200) está configurado para aplicar selectivamente la decodificación predictiva a la pluralidad de coeficientes espectrales codificados individuales o grupos de coeficientes espectrales codificados que representan dichos al menos dos componentes armónicos de la señal (124_1:124_6) o entornos espectrales alrededor de dichos al menos dos componentes armónicos de la señal (124_1:124_6) de la señal de audio (102).
37. El decodificador (200) según la reivindicación 36, donde el decodificador (200) está configurado para identificar dichos al menos dos componentes armónicos de la señal (124_1:124_6), y para aplicar de manera selectiva la decodificación predictiva a la pluralidad de coeficientes espectrales codificados individuales o grupos de coeficientes espectrales codificados que está asociada a los componentes armónicos identificados de la señal (124_1:124_6).
38. El decodificador (200) según la reivindicación 36, donde la señal de audio codificada (120) comprende el valor de espaciamiento o una versión codificada del mismo, donde el valor de espaciamiento identifica dichos al menos dos componentes armónicos de la señal (124_1:124_6), donde el decodificador (200) está configurado para aplicar selectivamente la decodificación predictiva a la pluralidad de coeficientes espectrales codificados individuales o grupos de coeficientes espectrales codificados que está asociada a los componentes armónicos identificados de la señal (124_1:124_6).
39. El decodificador (200) según una de las reivindicaciones 36 a 38, donde el decodificador (200) está configurado para no aplicar la decodificación predictiva a la pluralidad de coeficientes espectrales codificados individuales o grupos de coeficientes espectrales codificados que no representan dichos al menos dos componentes armónicos de la señal (124_1:124_6) o entornos espectrales de dichos al menos dos componentes armónicos de la señal (124_1:124_6) de la señal de audio.
40. El decodificador (200) según una de las reivindicaciones 36 a 39, donde el decodificador (200) está configurado para no aplicar la decodificación predictiva a la pluralidad de coeficientes espectrales codificados individuales o grupos de coeficientes espectrales codificados que pertenecen a un ruido de fondo no tonal entre los armónicos de señal (124_1:124_6) de la señal de audio.
41. El decodificador (200) según una de las reivindicaciones 22 a 40, donde la señal de audio codificada (120) incluye el valor de espaciamiento o una versión codificada del mismo, donde el valor de espaciamiento es un valor de espaciamiento de armónicos, donde el valor de espaciamiento de los armónicos indica la pluralidad de coeficientes espectrales codificados individuales o grupos de coeficientes espectrales codificados que representan al menos dos componentes armónicos de la señal (124_1:124_6) de la señal de audio (102).
42. El decodificador (200) según una de las reivindicaciones 22 a 41, donde los coeficientes espectrales son bins espectrales.
43. Procedimiento (300) para codificar una señal de audio en un dominio de transformada o dominio de banco de filtros, comprendiendo el procedimiento:
determinar (302) coeficientes espectrales de la señal de audio para una trama actual y al menos una trama anterior; determinar un valor de espaciamiento; y
aplicar selectivamente (304) codificación predictiva a una pluralidad de coeficientes espectrales individuales o grupos de coeficientes espectrales, donde la pluralidad de coeficientes espectrales individuales o grupos de coeficientes espectrales a los cuales se aplica la codificación predictiva son seleccionados con base en el valor de espaciamiento;
caracterizado porque el valor de espaciamiento es un valor de espaciamiento armónico que describe un espaciamiento entre los armónicos.
44. Procedimiento (400) para decodificar una señal de audio codificada en un dominio de transformada o dominio de banco de filtros, comprendiendo el procedimiento:
analizar (402) la señal de audio codificada para obtener coeficientes espectrales codificados de la señal de audio para una trama actual y al menos una trama anterior;
obtener un valor de espaciamiento; y
aplicar selectivamente (404) decodificación predictiva a una pluralidad de coeficientes espectrales codificados individuales o grupos de coeficientes espectrales codificados, donde la pluralidad de coeficientes espectrales individuales codificados o grupos de coeficientes espectrales codificados a los cuales se aplica la decodificación predictiva son seleccionados con base en el valor de espaciamiento;
caracterizado porque el valor de espaciamiento es un valor de espaciamiento armónico que describe un espaciamiento entre los armónicos de la señal de audio codificada.
45. Programa informático para llevar a cabo un procedimiento según una de las reivindicaciones 43 a 44.
ES16709331T 2015-03-09 2016-03-07 Codificador de audio, decodificador de audio, procedimiento para codificar una señal de audio y procedimiento para decodificar una señal de audio codificada Active ES2821025T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP15158253 2015-03-09
PCT/EP2015/063658 WO2016142002A1 (en) 2015-03-09 2015-06-17 Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
PCT/EP2016/054831 WO2016142357A1 (en) 2015-03-09 2016-03-07 Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal

Publications (1)

Publication Number Publication Date
ES2821025T3 true ES2821025T3 (es) 2021-04-23

Family

ID=52692424

Family Applications (2)

Application Number Title Priority Date Filing Date
ES18170157T Active ES2972504T3 (es) 2015-03-09 2016-03-07 Codificador de audio, decodificador de audio, procedimiento para codificar una señal de audio y procedimiento para decodificar una señal de audio codificada
ES16709331T Active ES2821025T3 (es) 2015-03-09 2016-03-07 Codificador de audio, decodificador de audio, procedimiento para codificar una señal de audio y procedimiento para decodificar una señal de audio codificada

Family Applications Before (1)

Application Number Title Priority Date Filing Date
ES18170157T Active ES2972504T3 (es) 2015-03-09 2016-03-07 Codificador de audio, decodificador de audio, procedimiento para codificar una señal de audio y procedimiento para decodificar una señal de audio codificada

Country Status (20)

Country Link
US (2) US10600428B2 (es)
EP (3) EP3268960B1 (es)
JP (3) JP6666356B2 (es)
KR (1) KR102151728B1 (es)
CN (3) CN114067812A (es)
AR (6) AR103890A1 (es)
AU (4) AU2016231220B2 (es)
BR (1) BR112017019185B1 (es)
CA (1) CA2978815C (es)
ES (2) ES2972504T3 (es)
HK (1) HK1244583A1 (es)
MX (1) MX365267B (es)
MY (1) MY181486A (es)
PL (2) PL3268960T3 (es)
PT (1) PT3268960T (es)
RU (1) RU2707151C2 (es)
SG (1) SG11201707349WA (es)
TW (1) TWI613644B (es)
WO (1) WO2016142002A1 (es)
ZA (6) ZA201706604B (es)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016142002A1 (en) * 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
WO2020094263A1 (en) 2018-11-05 2020-05-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and audio signal processor, for providing a processed audio signal representation, audio decoder, audio encoder, methods and computer programs
CN109473116B (zh) * 2018-12-12 2021-07-20 思必驰科技股份有限公司 语音编码方法、语音解码方法及装置
KR20220104049A (ko) * 2019-11-27 2022-07-25 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 코딩을 위한 음조 신호의 주파수 도메인 장기 예측을 위한 인코더, 디코더, 인코딩 방법 및 디코딩 방법

Family Cites Families (75)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CH572650A5 (es) * 1972-12-21 1976-02-13 Gretag Ag
JPS6031198A (ja) * 1983-07-29 1985-02-16 松下電器産業株式会社 予測残差信号符号化方法
US4885790A (en) * 1985-03-18 1989-12-05 Massachusetts Institute Of Technology Processing of acoustic waveforms
US5787387A (en) * 1994-07-11 1998-07-28 Voxware, Inc. Harmonic adaptive speech coding method and system
JP3680374B2 (ja) * 1995-09-28 2005-08-10 ソニー株式会社 音声合成方法
US5781888A (en) * 1996-01-16 1998-07-14 Lucent Technologies Inc. Perceptual noise shaping in the time domain via LPC prediction in the frequency domain
JP2891193B2 (ja) * 1996-08-16 1999-05-17 日本電気株式会社 広帯域音声スペクトル係数量子化装置
US6161089A (en) * 1997-03-14 2000-12-12 Digital Voice Systems, Inc. Multi-subframe quantization of spectral parameters
US6782360B1 (en) * 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US6636829B1 (en) * 1999-09-22 2003-10-21 Mindspeed Technologies, Inc. Speech communication system and method for handling lost frames
JP2002162998A (ja) * 2000-11-28 2002-06-07 Fujitsu Ltd パケット修復処理を伴なう音声符号化方法
EP1304885A3 (de) * 2001-09-14 2005-04-20 Siemens Aktiengesellschaft Verfahren und Computerprogrammprodukt zur Codierung und Decodierung von Videosignalen
WO2003088314A2 (en) * 2002-04-12 2003-10-23 Arch Specialty Chemicals, Inc. Remote monitoring system for chemical liquid delivery
US7634399B2 (en) * 2003-01-30 2009-12-15 Digital Voice Systems, Inc. Voice transcoder
EP1475144A2 (de) * 2003-05-09 2004-11-10 Pfaudler Werke GmbH Stromstörer für einen Rührkessel, aufweisend mindestens ein Stromstörelement
US7688894B2 (en) * 2003-09-07 2010-03-30 Microsoft Corporation Scan patterns for interlaced video content
JP2007506986A (ja) * 2003-09-17 2007-03-22 北京阜国数字技術有限公司 マルチ解像度ベクトル量子化のオーディオcodec方法及びその装置
US7356748B2 (en) * 2003-12-19 2008-04-08 Telefonaktiebolaget Lm Ericsson (Publ) Partial spectral loss concealment in transform codecs
TWI277013B (en) * 2005-02-01 2007-03-21 Ind Tech Res Inst Method for reducing buffered-frame memory sizes and accesses in a video codec
US8155965B2 (en) * 2005-03-11 2012-04-10 Qualcomm Incorporated Time warping frames inside the vocoder by modifying the residual
US7885809B2 (en) * 2005-04-20 2011-02-08 Ntt Docomo, Inc. Quantization of speech and audio coding parameters using partial information on atypical subsequences
US7599840B2 (en) * 2005-07-15 2009-10-06 Microsoft Corporation Selectively using multiple entropy models in adaptive coding and decoding
US7684981B2 (en) * 2005-07-15 2010-03-23 Microsoft Corporation Prediction of spectral coefficients in waveform coding and decoding
EP1852849A1 (en) * 2006-05-05 2007-11-07 Deutsche Thomson-Brandt Gmbh Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream
KR101365445B1 (ko) * 2007-01-03 2014-02-19 삼성전자주식회사 전역 및 국부 움직임 보상을 순차적으로 이용하는 움직임보상 방법, 복호화 방법, 장치, 인코더 및 디코더
DE102007018484B4 (de) * 2007-03-20 2009-06-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Senden einer Folge von Datenpaketen und Decodierer und Vorrichtung zum Decodieren einer Folge von Datenpaketen
US9653088B2 (en) 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
US7761290B2 (en) * 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US7774205B2 (en) * 2007-06-15 2010-08-10 Microsoft Corporation Coding of sparse digital media spectral data
US8515767B2 (en) * 2007-11-04 2013-08-20 Qualcomm Incorporated Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs
BRPI0910285B1 (pt) 2008-03-03 2020-05-12 Lg Electronics Inc. Métodos e aparelhos para processamento de sinal de áudio.
CN101335000B (zh) * 2008-03-26 2010-04-21 华为技术有限公司 编码的方法及装置
CN101552005A (zh) * 2008-04-03 2009-10-07 华为技术有限公司 编码方法、解码方法、***及装置
KR101227729B1 (ko) * 2008-07-11 2013-01-29 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 샘플 오디오 신호의 프레임을 인코딩하기 위한 오디오 인코더 및 디코더
ES2642906T3 (es) * 2008-07-11 2017-11-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador de audio, procedimientos para proporcionar un flujo de audio y programa de ordenador
EP2346030B1 (en) * 2008-07-11 2014-10-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, method for encoding an audio signal and computer program
BRPI0910796B1 (pt) * 2008-07-11 2021-07-13 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E. V. Codificador de áudio e decodificador de áudio
US8406307B2 (en) * 2008-08-22 2013-03-26 Microsoft Corporation Entropy coding/decoding of hierarchically organized data
WO2010028292A1 (en) * 2008-09-06 2010-03-11 Huawei Technologies Co., Ltd. Adaptive frequency prediction
EP2192786A1 (en) * 2008-11-27 2010-06-02 Panasonic Corporation Frequency domain filters for video coding
EP2380363B1 (en) * 2009-01-20 2015-09-30 MED-EL Elektromedizinische Geräte GmbH High accuracy tonotopic and periodic coding with enhanced harmonic resolution
US8666752B2 (en) * 2009-03-18 2014-03-04 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding multi-channel signal
JP4932917B2 (ja) * 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
US8391212B2 (en) * 2009-05-05 2013-03-05 Huawei Technologies Co., Ltd. System and method for frequency domain audio post-processing based on perceptual masking
ES2441069T3 (es) * 2009-10-08 2014-01-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decodificador multimodo para señal de audio, codificador multimodo para señal de audio, procedimiento y programa de computación que usan un modelado de ruido en base a linealidad-predicción-codificación
MX2012004648A (es) * 2009-10-20 2012-05-29 Fraunhofer Ges Forschung Codificacion de señal de audio, decodificador de señal de audio, metodo para codificar o decodificar una señal de audio utilizando una cancelacion del tipo aliasing.
KR101487687B1 (ko) * 2010-01-14 2015-01-29 삼성전자주식회사 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치
KR101445294B1 (ko) * 2010-03-10 2014-09-29 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 코딩 컨텍스트의 피치 의존 적응을 이용하는 오디오 신호 디코더, 오디오 신호 인코더, 오디오 신호 디코딩 방법, 오디오 신호 인코딩 방법, 및 컴퓨터 프로그램
CN101847413B (zh) * 2010-04-09 2011-11-16 北京航空航天大学 一种使用新型心理声学模型和快速比特分配实现数字音频编码的方法
JP5387522B2 (ja) * 2010-07-01 2014-01-15 コニカミノルタ株式会社 カラー画像形成装置
US8924222B2 (en) 2010-07-30 2014-12-30 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for coding of harmonic signals
CA2961088C (en) * 2010-09-16 2019-07-02 Dolby International Ab Cross product enhanced subband block based harmonic transposition
ES2600313T3 (es) * 2010-10-07 2017-02-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y método para la estimación de nivel de tramas de audio codificadas en un dominio de flujo de bits
FR2969805A1 (fr) * 2010-12-23 2012-06-29 France Telecom Codage bas retard alternant codage predictif et codage par transformee
EP2684355B1 (en) * 2011-03-10 2014-11-12 Telefonaktiebolaget L M Ericsson (PUBL) Decoding of transforms with curved basis functions
EP2770503B1 (en) * 2011-10-21 2019-05-29 Samsung Electronics Co., Ltd. Method and apparatus for concealing frame errors and method and apparatus for audio decoding
WO2013093172A1 (en) * 2011-12-20 2013-06-27 Nokia Corporation Audio conferencing
PL2830057T3 (pl) 2012-05-23 2019-01-31 Nippon Telegraph And Telephone Corporation Kodowanie sygnału audio
CN102798870B (zh) * 2012-08-07 2013-09-25 中国空间技术研究院 一种卫星导航***兼容性分析方法
EP3252762B1 (en) * 2012-10-01 2019-01-30 Nippon Telegraph and Telephone Corporation Encoding method, encoder, program and recording medium
EP3176784B1 (en) * 2013-01-08 2020-01-01 Dolby International AB Model based prediction in a filterbank
US9528371B2 (en) * 2013-02-27 2016-12-27 Evolution Engineering Inc. Fluid pressure pulse generating apparatus and method of using same
BR112015025092B1 (pt) * 2013-04-05 2022-01-11 Dolby International Ab Sistema de processamento de áudio e método para processar um fluxo de bits de áudio
CN105408956B (zh) * 2013-06-21 2020-03-27 弗朗霍夫应用科学研究促进协会 用于获取音频信号的替换帧的频谱系数的方法及相关产品
CA2984562C (en) * 2013-10-31 2020-01-14 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Audio decoder and method for providing a decoded audio information using an error concealment based on a time domain excitation signal
JP6031198B2 (ja) 2013-11-06 2016-11-24 株式会社日立製作所 信号伝送回路及びプリント基板
JP6319753B2 (ja) * 2013-12-02 2018-05-09 華為技術有限公司Huawei Technologies Co.,Ltd. 符号化方法および装置
CN104934034B (zh) * 2014-03-19 2016-11-16 华为技术有限公司 用于信号处理的方法和装置
KR20240010550A (ko) * 2014-03-28 2024-01-23 삼성전자주식회사 선형예측계수 양자화방법 및 장치와 역양자화 방법 및 장치
EP2963645A1 (en) * 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Calculator and method for determining phase correction data for an audio signal
JP5723472B1 (ja) * 2014-08-07 2015-05-27 廣幸 田中 データリンク生成装置、データリンク生成方法、データリンク構造および電子ファイル
US9536509B2 (en) * 2014-09-25 2017-01-03 Sunhouse Technologies, Inc. Systems and methods for capturing and interpreting audio
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
US20170022149A1 (en) * 2015-07-25 2017-01-26 Mark Quang Nguyen Fumarate compounds, pharmaceutical compositions thereof, and methods of use
KR20220104049A (ko) * 2019-11-27 2022-07-25 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 코딩을 위한 음조 신호의 주파수 도메인 장기 예측을 위한 인코더, 디코더, 인코딩 방법 및 디코딩 방법

Also Published As

Publication number Publication date
AR122486A2 (es) 2022-09-14
MX365267B (es) 2019-05-22
ZA202204768B (en) 2022-08-31
ZA201706604B (en) 2022-08-31
JP7078592B2 (ja) 2022-05-31
TWI613644B (zh) 2018-02-01
RU2017134620A3 (es) 2019-04-09
WO2016142002A1 (en) 2016-09-15
EP4297027A3 (en) 2024-03-20
US10600428B2 (en) 2020-03-24
JP2020038380A (ja) 2020-03-12
BR112017019185B1 (pt) 2023-09-26
CA2978815A1 (en) 2016-09-15
PL3268960T3 (pl) 2021-01-11
MX2017011494A (es) 2018-01-25
TW201637002A (zh) 2016-10-16
RU2707151C2 (ru) 2019-11-22
ZA202204765B (en) 2022-08-31
KR102151728B1 (ko) 2020-09-03
ZA202204764B (en) 2022-08-31
AU2016231220B2 (en) 2019-05-16
RU2017134620A (ru) 2019-04-09
US20200227058A1 (en) 2020-07-16
EP3373298A1 (en) 2018-09-12
SG11201707349WA (en) 2017-10-30
US20170365267A1 (en) 2017-12-21
AU2019203173A1 (en) 2019-05-30
ZA202204766B (en) 2022-08-31
AU2023241343A1 (en) 2023-10-26
AU2021215252A1 (en) 2021-09-02
AR122489A2 (es) 2022-09-14
AU2019203173B2 (en) 2021-05-13
JP2022110116A (ja) 2022-07-28
EP3373298B1 (en) 2023-12-20
ZA202204767B (en) 2022-08-31
CN114067813A (zh) 2022-02-18
AU2021215252B2 (en) 2023-07-06
CA2978815C (en) 2021-02-02
CN107533847A (zh) 2018-01-02
AR122488A2 (es) 2022-09-14
ES2972504T3 (es) 2024-06-13
AR122219A2 (es) 2022-08-24
AR122487A2 (es) 2022-09-14
PL3373298T3 (pl) 2024-05-06
EP3373298C0 (en) 2023-12-20
CN114067812A (zh) 2022-02-18
JP2018511821A (ja) 2018-04-26
JP6666356B2 (ja) 2020-03-13
BR112017019185A2 (pt) 2018-04-24
MY181486A (en) 2020-12-23
EP3268960B1 (en) 2020-06-24
AR103890A1 (es) 2017-06-14
KR20170134475A (ko) 2017-12-06
EP4297027A2 (en) 2023-12-27
EP3268960A1 (en) 2018-01-17
AU2016231220A1 (en) 2017-09-28
CN107533847B (zh) 2021-09-10
HK1244583A1 (zh) 2018-08-10
PT3268960T (pt) 2020-09-29

Similar Documents

Publication Publication Date Title
ES2821025T3 (es) Codificador de audio, decodificador de audio, procedimiento para codificar una señal de audio y procedimiento para decodificar una señal de audio codificada
JP6744363B2 (ja) スペクトルエンベロープのサンプル値のコンテキストベースエントロピー復号化器、パラメトリック復号化器、コンテキストベースエントロピー符号化器、復号化方法、符号化方法およびコンピュータプログラム
ES2660392T3 (es) Codificación de coeficientes espectrales de un espectro de una señal de audio
JP2019509511A (ja) マルチチャネル符号化におけるステレオ充填装置及び方法
ES2650549T3 (es) Relleno de ruido en codificación de audio multicanal
TWI559294B (zh) 支援轉換長度切換的頻率域音源編碼器、解碼器、編碼方法、解碼方法及電腦程式
RU2740148C1 (ru) Оконная функция анализа/синтеза для модулированного преобразования с перекрытием
ES2911515T3 (es) Codificación de audio
WO2016142357A1 (en) Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal