ES2821025T3 - Codificador de audio, decodificador de audio, procedimiento para codificar una señal de audio y procedimiento para decodificar una señal de audio codificada - Google Patents
Codificador de audio, decodificador de audio, procedimiento para codificar una señal de audio y procedimiento para decodificar una señal de audio codificada Download PDFInfo
- Publication number
- ES2821025T3 ES2821025T3 ES16709331T ES16709331T ES2821025T3 ES 2821025 T3 ES2821025 T3 ES 2821025T3 ES 16709331 T ES16709331 T ES 16709331T ES 16709331 T ES16709331 T ES 16709331T ES 2821025 T3 ES2821025 T3 ES 2821025T3
- Authority
- ES
- Spain
- Prior art keywords
- spectral coefficients
- groups
- encoder
- spectral
- decoder
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 128
- 238000000034 method Methods 0.000 title claims description 52
- 230000003595 spectral effect Effects 0.000 claims abstract description 495
- 238000004590 computer program Methods 0.000 claims description 11
- 230000000737 periodic effect Effects 0.000 claims description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 4
- 230000007774 longterm Effects 0.000 description 4
- 230000003044 adaptive effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000009420 retrofitting Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/12—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/547—Motion estimation performed in a transform domain
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/63—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
- H04N19/635—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by filter definition or implementation details
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Un codificador (100) para codificar una señal de audio (102), donde el codificador (100) está configurado para codificar la señal de audio (102) en el dominio de la transformada o en el dominio de banco de filtros (104), donde el codificador está configurado para determinar coeficientes espectrales (106_t0_f1:106_t0_f6; 106_t-1_f1:106_t-1_f6) de la señal de audio (102) correspondientes a una trama actual (108_t0) y al menos una trama anterior (108_t-1), donde el codificador (100) está configurado para aplicar selectivamente la codificación predictiva a una pluralidad de coeficientes espectrales individuales (106_t0_f2) o grupos de coeficientes espectrales (106_t0_f4,106_t0_f5), donde el codificador (100) está configurado para determinar un valor de espaciamiento, donde el codificador (100) está configurado para seleccionar la pluralidad de coeficientes espectrales individuales (106_t0_f2) o grupos de coeficientes espectrales (106_t0_f4,106_t0_f5) a los cuales se aplica la codificación predictiva sobre la base del valor de espaciamiento; caracterizado porque el valor de espaciamiento es un valor de espaciamiento de armónicos que describe un espaciamiento entre armónicos de la señal de audio (102).
Description
DESCRIPCIÓN
Codificador de audio, decodificador de audio, procedimiento para codificar una señal de audio y procedimiento para decodificar una señal de audio codificada
[0001] Las realizaciones se refieren a la codificación de audio; en particular, a un procedimiento y aparato para codificar una señal de audio empleando la codificación predictiva y a un procedimiento y aparato para decodificar una señal de audio codificada empleando la decodificación predictiva. Las realizaciones preferidas se refieren a procedimientos y aparatos para la predicción espectral adaptada al tono. Otras realizaciones preferidas se refieren a la codificación perceptual de señales de audio tonal por medio de codificación por transformadas con herramientas de predicción en el dominio espectral entre tramas.
[0002] Para mejorar la calidad de las señales tonales codificadas especialmente a bajas tasas de bits, los codificadores de audio por transformada modernos emplean transformadas muy largas y/o predicción a largo plazo o pre/post-filtrado. Sin embargo, una transformada larga implica un largo retraso algorítmico, lo que es inadmisible para situaciones de comunicaciones con bajo retardo. Por consiguiente, los indicadores con muy bajo retardo basados en el tono fundamental instantáneo han cobrado popularidad últimamente. El códec Opus de IETF (del inglés, Internet Engineering Task Force, Fuerza de Tareas de Ingenieros de Internet) utiliza pre- y post-filtrado adaptativo al tono en su trayecto de codificación por CELT (del inglés, Constrained-Energy Lapped Transform, Transformada Traslapada con Energía Restringida en el dominio de la frecuencia [J. M. Valin, K. Vos, y T. Terriberry, “Definition of the Opus audio codec,” 2012, IETF RFC 6716. http://tools.ietf.org/html/rfc67161.], y el códec de 3GPP (del inglés, 3rd Generation Partnership Project, Proyecto Conjunto de Tercera Generación) de EVS (del inglés, Enhanced Voice Services, Servicios de Voz Mejorados) ofrece un post-filtro de armónicos a largo plazo para la mejora perceptual de las señales decodificadas por transformadas [3GPP TS 26.443, “Codec for Enhanced Voice Services (EVS),” Publicación 12, Dic.
2014.]. Estas dos estrategias operan en el dominio del tiempo sobre la forma de onda de la señal completamente decodificada, haciendo que su aplicación sea difícil y/o costosa desde el punto de vista informático de manera selectiva de la frecuencia (ambos esquemas solo ofrecen un simple filtro de paso bajo para cierta selectividad de la frecuencia). Por consiguiente se ofrece una alternativa bienvenida a la predicción a largo plazo en el dominio del tiempo (LTP, del inglés Long Term Prediction) o pre-/post-filtrado (PPF, del inglés Pre-/post-filtering) mediante la predicción en el dominio de la frecuencia (FDP, por sus siglas en inglés Frequency Domain Prediction) como la propuesta en MPEG-2 AAC (por sus siglas en inglés, Moving Picture Expert Group Advanced Audio Coding/Codificación Avanzada de Audio del Grupo de Expertos en Imágenes en Movimiento 2) [ISO/IEC 13818-7, “ Information technology - Part 7: Advanced Audio Coding (AAC),” 2006.]. Este procedimiento, aunque facilita la selectividad de la frecuencia, tiene sus propias desventajas, como se describe a continuación.
[0003] El procedimiento de FDP antes citado tiene dos desventajas con respecto a las demás herramientas. En primer lugar, el procedimiento de FDP requiere una elevada complejidad informática. En detalle, la codificación por predicción lineal de un orden de al menos dos (es decir de los bins de transformación de canales de las dos últimas tramas) se aplica a cientos de bins espectrales por cada trama y canal en el peor de los casos de predicción en todas las bandas de factores de escala [ISO/IEC 13818-7, “ Information technology - Part 7: Advanced Audio Coding (AAC),” 2006.]. En segundo lugar, el procedimiento de FDP comprende una ganancia de predicción total limitada. Más precisamente, la eficiencia de la predicción es limitada porque los componentes ruidos entre las partes espectrales tonales predecibles armónicas, se someten también a la predicción, introduciendo errores, ya que estas partes ruidosas por lo general no son predecibles.
[0004] La elevada complejidad se debe a la retroadaptabilidad de los indicadores. Esto significa que se tienen que calcular los coeficientes de predicción correspondientes a cada bin sobre la base de bins ya transmitidos. Por lo tanto, las imprecisiones numéricas entre el codificador y el decodificador pueden dar lugar a errores debido a los coeficientes de predicción divergentes. Para superar este problema, se debe garantizar una adaptación idéntica con los bits exactos. Además, incluso si se deshabilitan grupos de indicadores en ciertas tramas, siempre se tiene que realizar la adaptación para mantener actualizados los coeficientes de predicción.
[0005] El documento US 2007/0016415 A1 describe técnicas y herramientas para la predicción de coeficientes espectrales en la codificación y decodificación. El espectro completo de una subtrama se divide en múltiples segmentos de tamaño uniforme y la predicción se puede aplicar de forma selectiva sobre una base de segmento.
[0006] Por lo tanto, el objeto de la presente invención es dar a conocer un concepto para la codificación de una señal de audio y/o la decodificación de una señal de audio codificada que evita al menos uno (por ejemplo, ambos) de los problemas antes mencionados y da lugar a una implementación más eficiente y económica desde el punto de vista informático.
[0007] Este objeto se resuelve en las reivindicaciones independientes.
[0008] Las implementaciones ventajosas son abordadas por las reivindicaciones dependientes.
[0009] Según el concepto de la presente invención, la codificación predictiva se aplica (solamente) a coeficientes espectrales seleccionados. Los coeficientes espectrales a los cuales se aplica la codificación predictiva pueden ser seleccionados de conformidad con las características de la señal. Por ejemplo, no aplicando la codificación predictiva a los componentes ruidosos de la señal se evitan los errores antes citados que se introducen por la predicción de componentes ruidosos no predecibles de la señal. Al mismo tiempo se puede reducir la complejidad informática, puesto que solo se aplica la codificación predictiva a componentes espectrales seleccionados.
[0010] Por ejemplo, la codificación perceptual de señales de audio tonal puede ser ejecutada (por ejemplo, por el codificador) por medio de codificación por transformada con procedimientos de predicción entre tramas guiados/adaptativos en el dominio espectral. Se puede incrementar la eficiencia de la predicción en el dominio de la frecuencia (FDP, por sus siglas en inglés) y se puede reducir la complejidad informática aplicando la predicción solo a los coeficientes espectrales, por ejemplo, alrededor de los componentes armónicos de la señal situados en múltiplos enteros de una frecuencia fundamental o tono, lo que puede ser señalizado en un flujo de bits apropiado de un codificador a un decodificador, por ejemplo en forma de valor de espaciamiento. Las realizaciones de la presente invención se pueden implementar o integrar preferentemente en el códec de audio 3D de MPEG-H (por sus siglas en inglés Moving Picture Expert Group-H [High Efficiency]/Grupo de Expertos en Imágenes en Movimiento de Alta Eficiencia), aunque son aplicables a cualquier sistema de codificación de audio por transformadas como, por ejemplo, MPEG-2 AAC (por sus siglas en inglés, Moving Picture Expert Group-2 Advanced Audio Coding/Codificación Avanzada de Audio del Grupo de Expertos en Imágenes en Movimiento-2).
[0011] En este documento se describen las realizaciones de la presente invención haciendo referencia a los dibujos adjuntos, en los cuales:
Fig. 1 ilustra un diagrama esquemático de bloques de un codificador para codificar una señal de audio, según una realización;
Fig. 2 ilustra en un diagrama la amplitud de una señal de audio trazada en la frecuencia correspondiente a una trama actual y los correspondientes coeficientes espectrales seleccionados a los cuales se aplica la codificación predictiva, según una realización;
Fig. 3 ilustra en un diagrama la amplitud de una señal de audio trazada en la frecuencia correspondiente a una trama actual y los correspondientes coeficientes espectrales que son objeto de predicción según MPEG-2 AAC (por sus siglas en inglés, Moving Picture Expert Group-2 Advanced Audio Coding/Codificación Avanzada de Audio del Grupo de Expertos en Imágenes en Movimiento-2);
Fig. 4 ilustra un diagrama esquemático de bloques de un decodificador para decodificar una señal de audio codificada, según una realización;
Fig. 5 ilustra un gráfico de flujo de un procedimiento para codificar una señal de audio, según una realización y Fig. 6 ilustra un gráfico de flujo de un procedimiento para decodificar una señal de audio codificada, según una realización.
[0012] Los elementos iguales o equivalentes con igual o equivalente funcionalidad están indicados en la siguiente descripción por números de referencia iguales o equivalentes.
[0013] En la siguiente descripción, se expone una pluralidad de detalles con el fin de proporcionar una explicación más exhaustiva de las realizaciones de la presente invención. Sin embargo, será evidente para el experto en la materia que la invención puede ser puesta en práctica sin estos detalles específicos. En otros casos, se exponen en forma de diagrama de bloques y no en detalle las estructuras y dispositivos muy conocidos para no complicar las realizaciones de la presente invención. Además, las características de las diferentes realizaciones descritas a continuación pueden combinarse entre sí a menos que se indique específicamente lo contrario.
[0014] La Fig. 1 ilustra un diagrama esquemático de bloques de un codificador 100 para codificar una señal de audio 102, según una realización. El codificador 100 está configurado para codificar la señal de audio 102 en el dominio de la transformada o en el dominio de banco de filtros 104 (por ejemplo, dominio de la frecuencia o dominio espectral), donde el codificador 100 está configurado para determinar coeficientes espectrales 106_t0_f1 a 106_t0_f6 de la señal de audio 102 correspondientes a una trama actual 108_t0 y coeficientes espectrales 106_t-1_f1 a 106_t-1_f6 de la señal de audio correspondientes al menos a una trama anterior 108_t-1. Además, el codificador 100 está configurado para aplicar selectivamente la codificación predictiva a una pluralidad de coeficientes espectrales individuales 106_t0_f2 o grupos de coeficientes espectrales 106_t0_f4 y 106_t0_f5, donde el codificador 100 está configurado para determinar un valor de espaciamiento, donde el codificador 100 está configurado para seleccionar la pluralidad de coeficientes espectrales individuales 106_t0_f2 o grupos de coeficientes espectrales 106_t0_f4 y 106_t0_f5 a los cuales se aplica la codificación predictiva sobre la base del valor de espaciamiento.
[0015] En otras palabras, el codificador 100 está configurado para aplicar selectivamente la codificación predictiva a una pluralidad de coeficientes espectrales individuales 106_t0_f2 o grupos de coeficientes espectrales 106_t0_f4 y 106_t0_f5 seleccionados sobre la base de un único valor de espaciamiento transmitido en forma de información lateral.
[0016] Este valor de espaciamiento puede corresponder a una frecuencia (por ejemplo, una frecuencia fundamental de un tono armónico (de la señal de audio 102)), que define, junto con sus múltiplos enteros, los centros de todos los grupos de coeficientes espectrales a los cuales se aplica la predicción: el primer grupo se puede centrar alrededor de esta frecuencia, el segundo grupo se puede centrar alrededor de esta frecuencia multiplicada por dos, el tercer grupo se puede centrar alrededor de esta frecuencia multiplicada por tres, y así sucesivamente. El conocimiento de estas frecuencias centrales permite el cálculo de los coeficientes de predicción para predecir los correspondientes componentes sinusoides de la señal (por ejemplo, fundamentales y sobretonos de las señales armónicas). Por lo tanto, ya no es necesaria la complicada retroadaptación propensa a errores de los coeficientes de predicción.
[0017] En algunas realizaciones, el codificador 100 puede estar configurado para determinar un valor de espaciamiento por trama.
[0018] En algunas realizaciones, la pluralidad de coeficientes espectrales individuales 106_t0_f2 o grupos de coeficientes espectrales 106_t0_f4 y 106_t0_f5 pueden estar separados por al menos un coeficiente espectral 106_t0_f3.
[0019] En algunas realizaciones, el codificador 100 puede estar configurado para aplicar la codificación predictiva a una pluralidad de coeficientes espectrales individuales que están separados por al menos un coeficiente espectral, como por ejemplo dos coeficientes espectrales individuales que están separados por al menos un coeficiente espectral. Además, el codificador 100 puede estar configurado para aplicar la codificación predictiva a una pluralidad de grupos de coeficientes espectrales (donde cada uno de los grupos comprende al menos dos coeficientes espectrales) que están separados por al menos un coeficiente espectral, como por ejemplo dos grupos de coeficientes espectrales que están separados por al menos un coeficiente espectral. Además, el codificador 100 puede estar configurado para aplicar la codificación predictiva a una pluralidad de coeficientes espectrales individuales y/o grupos de coeficientes espectrales que están separados por al menos un coeficiente espectral, como por ejemplo, al menos un coeficiente espectral individual y al menos un grupo de coeficientes espectrales que están separados por al menos un coeficiente espectral.
[0020] En el ejemplo ilustrado en la Fig. 1, el codificador 100 está configurado para determinar seis coeficientes espectrales 106_t0_f1 a 106_t0_f6 correspondientes a la trama actual 108_t0 y seis coeficientes espectrales 106_t-1_f1 a 106_t-1_f6 correspondientes a la trama anterior 108_t-1. Por consiguiente, el codificador 100 está configurado para aplicar selectivamente la codificación predictiva al segundo coeficiente espectral individual 106_t0_f2 de la trama actual y al grupo de coeficientes espectrales que consiste en el cuarto y quinto coeficientes espectrales 106_t0_f4 y 106_t0_f5 de la trama actual 108_t0. Como se puede apreciar, el segundo coeficiente espectral individual 106_t0_f2 y el grupo de coeficientes espectrales que consiste en el cuarto y quinto coeficientes espectrales 106_t0_f4 y 106_t0_f5 están separados entre sí por el tercer coeficiente espectral 106_t0_f3.
[0021] Cabe observar que el término “selectivamente” utilizado en el presente contexto se refiere a la aplicación de la codificación predictiva (solo) a coeficientes espectrales seleccionados. En otras palabras, la codificación predictiva no se aplica necesariamente a todos los coeficientes espectrales, sino solo a coeficientes espectrales individuales o grupos de coeficientes espectrales seleccionados, coeficientes espectrales individuales y/o grupos de coeficientes espectrales seleccionados que pueden estar separados entre sí por al menos un coeficiente espectral. En otras palabras, la codificación predictiva puede ser deshabilitada para al menos un coeficiente espectral por el cual está separada la pluralidad seleccionada de coeficientes espectrales individuales o grupos de coeficientes espectrales.
[0022] En algunas realizaciones, el codificador 100 puede estar configurado para aplicar de manera selectiva la codificación predictiva a una pluralidad de coeficientes espectrales individuales 106_t0_f2 o grupos de coeficientes espectrales 106_t0_f4 y 106_t0_f5 de la trama actual 108_t0 sobre la base de al menos una correspondiente pluralidad de coeficientes espectrales individuales 106_t-1_f2 o grupos de coeficientes espectrales 106_t-1_f4 y 106_t-1_f5 de la trama anterior 108_t-1.
[0023] Por ejemplo, el codificador 100 puede estar configurado para codificar por predicción la pluralidad de coeficientes espectrales individuales 106_t0_f2 o los grupos de coeficientes espectrales 106_t0_f4 y 106_t0_f5 de la trama actual 108_t0, mediante la codificación de los errores de predicción entre una pluralidad de coeficientes espectrales pronosticados individuales 110_t0_f2 o grupos de coeficientes espectrales pronosticados 110_t0_f4 y 110_t0_f5 de la trama actual 108_t0 y la pluralidad de coeficientes espectrales individuales 106_t0_f2 o grupos de coeficientes espectrales 106_t0_f4 y 106_t0_f5 de la trama actual (o versiones cuantificadas de los mismos).
[0024] En la Fig. 1, el codificador 100 codifica el coeficiente espectral individual 106_t0_f2 y el grupo de coeficientes espectrales que consiste en los coeficientes espectrales 106_t0_f4 y 106_t0_f5, mediante la codificación
de un error de predicción entre el coeficiente espectral individual pronosticado 110_t0_f2 de la trama actual 108_t0 y el coeficiente espectral individual 106_t0_f2 de la trama actual 108_t0 y entre el grupo de coeficientes espectrales pronosticados 110_t0_f4 y 110_t0_f5 de la trama actual y el grupo de coeficientes espectrales 106_t0_f4 y 106_t0_f5 de la trama actual.
[0025] En otras palabras, el segundo coeficiente espectral 106_t0_f2 se codifica mediante la codificación del error de predicción (o diferencia) entre el segundo coeficiente espectral pronosticado 110_t0_f2 y el segundo coeficiente espectral (real o determinado) 106_t0_f2, donde el cuarto coeficiente espectral 106_t0_f4 se codifica mediante la codificación del error de predicción (o diferencia) entre el cuarto coeficiente espectral pronosticado 110_t0_f4 y el cuarto coeficiente espectral (real o determinado) 106_t0_f4 y donde el quinto coeficiente espectral 106_t0_f5 se codifica mediante la codificación del error de predicción (o diferencia) entre el quinto coeficiente espectral pronosticado 110_t0_f5 y el quinto coeficiente espectral (real o determinado) 106_t0_f5.
[0026] En una realización, el codificador 100 puede estar configurado para determinar la pluralidad de coeficientes espectrales pronosticados individuales 110_t0_f2 o grupos de coeficientes espectrales pronosticados 110_t0_f4 y 110_t0_f5 correspondientes a la trama actual 108_t0 por medio de las correspondientes versiones reales de la pluralidad de coeficientes espectrales individuales 106_t-1_f2 o de los grupos de coeficientes espectrales 106_t-1_f4 y 106_t-1_f5 de la trama anterior 108_t-1.
[0027] En otras palabras, el codificador 100 puede, en el procedimiento de determinación anteriormente descrito, utilizar directamente la pluralidad de coeficientes espectrales individuales reales 106_t-1_f2 o los grupos de coeficientes espectrales reales 106_t-1_f4 y 106_t-1_f5 de la trama anterior 108_t-1, donde 106_t-1_f2, 106_t-1_f4 y 106_t-1_f5 representan los coeficientes espectrales o grupos de coeficientes espectrales originales, aún no cuantificados, respectivamente, tal como son obtenidos por el codificador 100 de tal manera que dicho codificador pueda operar en el dominio de la transformada o en el dominio de banco de filtros 104.
[0028] Por ejemplo, el codificador 100 puede estar configurado para determinar el segundo coeficiente espectral pronosticado 110_t0_f2 de la trama actual 108_t0 sobre la base de una versión correspondiente aún no cuantificada del segundo coeficiente espectral 106_t-1_f2 de la trama anterior 10 108_t-1, el cuarto coeficiente espectral pronosticado 110_t0_f4 de la trama actual 108_t0 sobre la base de una versión correspondiente aún no cuantificada del cuarto coeficiente espectral 106_t-1_f4 de la trama anterior 108_t-1, y el quinto coeficiente espectral pronosticado 110_t0_f5 de la trama actual 108_t0 sobre la base de una versión correspondiente aún no cuantificada del quinto coeficiente espectral 106_t-1_f5 de la trama anterior.
[0029] En virtud de esta estrategia, el esquema de codificación y decodificación predictiva puede exhibir un tipo de modelado armónico del ruido de cuantificación, puesto que un decodificador correspondiente, una realización del cual se describe más adelante con respecto a la Fig. 4, solo puede emplear, en la etapa de determinación antes citada, las versiones cuantificadas transmitidas de la pluralidad de coeficientes espectrales individuales 106_t-1_f2 o de la pluralidad de grupos de coeficientes espectrales 106_t-1_f4 y 106_t-1_f5 de la trama anterior 108_t-1, para una decodificación predictiva.
[0030] Aunque ese tipo de modelado de ruido armónico que se ejecuta tradicionalmente, por ejemplo, por predicción a largo plazo (LTP, por sus siglas en inglés Long-Term Prediction) en el dominio del tiempo, puede ser subjetivamente ventajoso para la codificación predictiva, en algunos casos puede ser desventajoso, puesto que puede llevar a una cantidad excesiva no buscada de tonalidad introducida en una señal de audio decodificada. Por esta razón, en adelante se describe un esquema alternativo de codificación predictiva, que se sincroniza por completo con la correspondiente decodificación y, por ello, solo aprovecha toda ganancia posible de predicción sin llevar al modelado de ruido de cuantificación. Según esta realización de codificación alternativa, el codificador 100 puede estar configurado para determinar la pluralidad de coeficientes espectrales pronosticados individuales 110_t0_f2 o grupos de coeficientes espectrales pronosticados 110_t0_f4 y 110_t0_f5 correspondientes a la trama actual 108_t0 usando las versiones cuantificadas correspondientes de la pluralidad de coeficientes espectrales individuales 106_t-1_f2 o los grupos de coeficientes espectrales 106_t-1_f4 y 106_t-1_f5 de la trama anterior 108_t-1.
[0031] Por ejemplo, el codificador 100 puede estar configurado para determinar el segundo coeficiente espectral pronosticado 110_t0_f2 de la trama actual 108_t0 basándose en una versión cuantificada correspondiente del segundo coeficiente espectral 106_t-1_f2 de la trama anterior 108_t-1, el cuarto coeficiente espectral pronosticado 110_t0_f4 de la trama actual 108_t0 sobre la base de una versión cuantificada correspondiente del cuarto coeficiente espectral 106_t-1_f4 de la trama anterior 108_t-1, y el quinto coeficiente espectral pronosticado 110_t0_f5 de la trama actual 108_t0 sobre la base de una versión cuantificada correspondiente del quinto coeficiente espectral 106_t-1_f5 de la trama anterior.
[0032] Asimismo, el codificador 100 puede estar configurado para derivar los coeficientes de predicción 112_f2, 114_f2, 112_f4, 114_f4, 112_f5 y 114_f5 del valor de espaciamiento, y para calcular la pluralidad de coeficientes espectrales pronosticados individuales 110_t0_f2 o grupos de coeficientes espectrales pronosticados 110_t0_f4 y 110_t0_f5 correspondientes a la trama actual 108_t0 usando las versiones cuantificadas correspondientes de la
pluralidad de coeficientes espectrales individuales 106_t-1_f2 y 106_t-2_f2 o grupos de coeficientes espectrales 106_t-1_f4, 106_t-2_f4, 106_t-1_f5, y 106_t-2_f5 de al menos dos tramas anteriores 108_t-1 y 108_t-2 y utilizando los coeficientes de predicción derivados 112_f2, 114_f2, 112_f4, 114_f4, 112_f5 y 114_f5.
[0033] Por ejemplo, el codificador 100 puede estar configurado para derivar los coeficientes de predicción 112_f2 y 114_f2 correspondientes al segundo coeficiente espectral 106_t0_f2 del valor de espaciamiento, para derivar los coeficientes de predicción 112_f4 y 114_f4 correspondientes al cuarto coeficiente espectral 106_t0_f4 del valor de espaciamiento, y para derivar los coeficientes de predicción 112_f5 y 114_f5 correspondientes al quinto coeficiente espectral 106_t0_f5 del valor de espaciamiento.
[0034] Por ejemplo, la derivación de coeficientes de predicción se puede realizar de la siguiente manera: si el valor de espaciamiento corresponde a una frecuencia f0 o a una versión codificada de la misma, la frecuencia central del k° grupo de coeficientes espectrales para el cual se habilita la predicción es fc=K*f0. Si la frecuencia de muestreo es fs el tamaño del salto de la transformada (desplazamiento entre tramas sucesivas) es N, los coeficientes de predicción ideales del K° grupo, tomando como suposición una señal sinusoide con la frecuencia fc son:
p1 = 2*cos(N*2*pi*fc/fs) y p2 = -1.
[0035] Si, por ejemplo, ambos coeficientes espectrales 106_t0_f4 y 106_t0_f5 están dentro de este grupo, los coeficientes de predicción son:
112_f4 = 112_f5 = 2*cos(N*2*pi*fc/fs) y 114_f4 = 114_f5 = -1.
[0036] Por razones de estabilidad, se puede introducir un factor de atenuación d que da lugar a coeficientes de predicción modificados:
112_f4' = 112_f5' = d*2*cos(N*2*pi*fc/fs), 114_f4' = 114_f5' = d2
[0037] Dado que el valor de espaciamiento se transmite en la señal de audio codificada 120, el decodificador puede derivar exactamente los mismos coeficientes de predicción 212_f4 = 212_f5 = 2*cos(N*2*pi*fc/fs) y 114_f4 = 114_f5 = -1. Si se utiliza un factor de atenuación, se pueden modificar los coeficientes de manera acorde.
[0038] Como se indica en la Fig. 1, el codificador 100 puede estar configurado para emitir una señal de audio codificada 120. Por consiguiente, el codificador 100 puede estar configurado para incluir en la señal de audio codificada 120 versiones cuantificadas de los errores de predicción correspondientes a la pluralidad de coeficientes espectrales individuales 106_t0_f2 o grupos de coeficientes espectrales 106_t0_f4 y 106_t0_f5 a los cuales se aplica la codificación predictiva. Además, el codificador 100 puede estar configurado para no incluir los coeficientes de predicción 112_f2 a 114_f5 en la señal de audio codificada 120.
[0039] De este modo, el codificador 100 puede utilizar solo los coeficientes de predicción 112_f2 a 114_f5 para calcular la pluralidad de coeficientes espectrales pronosticados individuales 110_t0_f2 o grupos de coeficientes espectrales pronosticados 110_t0_f4 y 110_t0_f5 y de estos los errores de predicción entre el coeficiente espectral individual pronosticado 110_t0_f2 o grupo de coeficientes espectrales pronosticados 110_t0_f4 y 110_t0_f5 y el coeficiente espectral individual 106_t0_f2 o grupo de coeficientes espectrales pronosticados 110_t0_f4 y 110_t0_f5 de la trama actual, pero no emitir los coeficientes espectrales individuales 106_t0_f4 (o una versión cuantificada de los mismos) o grupos de coeficientes espectrales 106_t0_f4 y 106_t0_f5 (o versiones cuantificadas de los mismos) ni los coeficientes de predicción 112_f2 a 114_f5 en la señal de audio codificada 120. Por consiguiente, un decodificador, una realización del cual se describe más adelante con respecto a la Fig. 4, puede derivar los coeficientes de predicción 112_f2 a 114_f5 para calcular la pluralidad de coeficientes espectrales pronosticados individuales o grupos de coeficientes espectrales pronosticados correspondientes a la trama actual del valor de espaciamiento.
[0040] En otras palabras, el codificador 100 puede estar configurado para emitir la señal de audio codificada 120 que incluye versiones cuantificadas de los errores de predicción en lugar de versiones cuantificadas de la pluralidad de coeficientes espectrales individuales 106_t0_f2 o de los grupos de coeficientes espectrales 106_t0_f4 y 106_t0_f5 para la pluralidad de coeficientes espectrales individuales 106_t0_f2 o grupos de coeficientes espectrales 106_t0_f4 y 106_t0_f5 a los cuales se aplica la codificación predictiva.
[0041] Asimismo, el codificador 100 puede estar configurado para emitir la señal de audio codificada 102 que incluye versiones cuantificadas de los coeficientes espectrales 106_t0_f3 por los cuales está separada la pluralidad de coeficientes espectrales individuales 106_t0_f2 o los grupos de coeficientes espectrales 106_t0_f4 y 106_t0_f5, de tal manera que haya una alternancia de los coeficientes espectrales 106_t0_f2 o grupos de coeficientes espectrales 106_t0_f4 y 106_t0_f5 de los cuales se incluyen versiones cuantificadas de los errores de predicción en la señal de audio codificada 120 y coeficientes espectrales 106_t0_f3 o grupos de coeficientes espectrales de los cuales se emiten versiones cuantificadas sin emplear la codificación predictiva.
[0042] En algunas realizaciones, el codificador 100 puede estar configurado además para codificar por entropía las versiones cuantificadas de los errores de predicción y las versiones cuantificadas de los coeficientes espectrales 106_t0_f3 por los cuales la pluralidad de coeficientes espectrales individuales 106_t0_f2 o grupos de coeficientes espectrales 106_t0_f4 y 106_t0_f5 están separados, y para incluir las versiones codificadas por entropía en la señal de audio codificada 120 (en lugar de las versiones no codificadas por entropía de los mismos).
[0043] La Fig. 2 ilustra, en un diagrama, la amplitud de la señal de audio 102 trazada en la frecuencia correspondiente a una trama actual 108_t0. Además, en la Fig. 2, se indican los coeficientes espectrales en el dominio de la transformada o en el dominio de banco de filtros determinados por el codificador 100 correspondientes a la trama actual 108_t0 de la señal de audio 102.
[0044] Como se ilustra en la Fig. 2, el codificador 100 puede estar configurado para aplicar de manera selectiva la codificación predictiva a una pluralidad de grupos 116_1 a 116_6 de coeficientes espectrales que están separados por al menos un coeficiente espectral. En detalle, en la realización mostrada en la Fig. 2, el codificador 100 aplica selectivamente la codificación predictiva a seis grupos 116_1 a 116_6 de coeficientes espectrales, donde cada uno de los primeros cinco grupos 116_1 a 116_5 de coeficientes espectrales incluye tres coeficientes espectrales (por ejemplo, el segundo grupo 116_2 incluye los coeficientes espectrales 106_t0_f8, 106_t0_f9 y 106_t0_f10), donde el sexto grupo 116_6 de coeficientes espectrales incluye dos coeficientes espectrales. De esa manera, los seis grupos 116_1 a 116_6 de coeficientes espectrales están separados por (cinco) grupos 118_1 a 118_5 de coeficientes espectrales a los cuales no se aplica la codificación predictiva.
[0045] En otras palabras, como se indica en la Fig. 2, el codificador 100 puede estar configurado para aplicar de manera selectiva la codificación predictiva a los grupos 116_1 a 110_6 de coeficientes espectrales, de tal manera que haya una alternancia de los grupos 116_1 a 116_6 de coeficientes espectrales a los cuales se aplica la codificación predictiva y los grupos 118_1 a 118_5 de coeficientes espectrales a los cuales no se aplica la codificación predictiva.
[0046] En algunas realizaciones, el codificador 100 puede estar configurado para determinar un valor de espaciamiento (indicado en la Fig. 2 por las flechas 122_1 y 122_2), donde el codificador 100 puede estar configurado para seleccionar la pluralidad de grupos 116_1 a 116_6 de coeficientes espectrales (o la pluralidad de coeficientes espectrales individuales) a los cuales se aplica la codificación predictiva sobre la base del valor de espaciamiento.
[0047] El valor de espaciamiento puede ser, por ejemplo, un espaciamiento (o distancia) entre dos frecuencias características de la señal de audio 102, tales como los picos 124_1 y 124_2 de la señal de audio. Además, el valor de espaciamiento puede ser un número entero de coeficientes espectrales (o índices de coeficientes espectrales) que aproxima el espaciamiento entre las dos frecuencias características de la señal de audio. Naturalmente, el valor de espaciamiento puede ser también un número real o una fracción o múltiplo del número entero de coeficientes espectrales que describe el espaciamiento entre las dos frecuencias características de la señal de audio.
[0048] En algunas realizaciones, el codificador 100 puede estar configurado para determinar una frecuencia fundamental instantánea de la señal de audio (102) y para derivar el valor de espaciamiento de la frecuencia fundamental instantánea o una fracción o un múltiplo de la misma.
[0049] Por ejemplo, el primer pico 124_1 de la señal de audio 102 puede ser una frecuencia fundamental instantánea (o tono, o primer armónico) de la señal de audio 102. Por lo tanto, el codificador 100 puede estar configurado para determinar la frecuencia fundamental instantánea de la señal de audio 102 y para derivar el valor de espaciamiento de la frecuencia fundamental instantánea o una fracción o un múltiplo de la misma. En ese caso, el valor de espaciamiento puede ser un número entero (o una fracción, o un múltiplo de la misma) de coeficientes espectrales que aproxima el espaciamiento entre la frecuencia fundamental instantánea 124_1 y un segundo armónico 124_2 de la señal de audio 102.
[0050] Naturalmente, la señal de audio 102 puede comprender más de dos armónicos. Por ejemplo, la señal de audio 102 expuesta en la Fig. 2 comprende seis armónicos 124_1 a 124_6 espectralmente distribuidos de tal manera que la señal de audio 102 comprenda un armónico en cada múltiplo entero de la frecuencia fundamental instantánea. Naturalmente, también es posible que la señal de audio 102 no comprenda la totalidad sino algunos de los armónicos, tales como el primero, tercero y quinto armónicos.
[0051] En algunas realizaciones, el codificador 100 puede estar configurado para seleccionar grupos 116_1 a 116_6 de coeficientes espectrales (o coeficientes espectrales individuales) espectralmente dispuestos según una red de armónicos definida por el valor de espaciamiento correspondiente a la codificación predictiva. De esa manera, la red de armónicos definida por el valor de espaciamiento describe la distribución espectral periódica (espaciamiento equidistante) de armónicos en la señal de audio 102. En otras palabras, la red de armónicos definida por el valor de espaciamiento puede ser una secuencia de valores de espaciamiento que describe el espaciamiento equidistante de armónicos de la señal de audio.
[0052] Además, el codificador 100 puede estar configurado para seleccionar coeficientes espectrales (por
ejemplo, solo esos coeficientes espectrales), los índices espectrales de los cuales son iguales o se encuentran dentro de un intervalo (por ejemplo, predeterminado o variable) alrededor de una pluralidad de índices espectrales derivados sobre la base del valor de espaciamiento, para una codificación predictiva.
[0053] Del valor de espaciamiento se pueden derivar los índices (o números) de los coeficientes espectrales que representan los armónicos de la señal de audio 102. Por ejemplo, suponiendo que un cuarto coeficiente espectral 106_t0_f4 represente la frecuencia fundamental instantánea de la señal de audio 102 y suponiendo que el valor de espaciamiento sea cinco, se pueden derivar los coeficientes espectrales que tienen el índice nueve sobre la base del valor de espaciamiento. Como se puede apreciar en la Fig. 2, el coeficiente espectral así derivado, que tiene el índice nueve, es decir el noveno coeficiente espectral 106_t0_f9, representa el segundo armónico. De manera similar, se pueden derivar los coeficientes espectrales que tienen los índices 14, 19, 24 y 29, que representan el tercero a sexto armónicos 124_3 a 124_6. Sin embargo, no solo los coeficientes espectrales que tienen los índices iguales a la pluralidad de índices espectrales derivados sobre la base del valor de espaciamiento pueden ser objeto de codificación predictiva, sino también los coeficientes espectrales que tienen los índices dentro de un intervalo dado alrededor de la pluralidad de índices espectrales derivados sobre la base del valor de espaciamiento. Por ejemplo, como se ilustra en la Fig. 2, el intervalo puede ser tres, por lo que no se selecciona una pluralidad de coeficientes espectrales individuales para la codificación predictiva, sino más bien una pluralidad de grupos de coeficientes espectrales.
[0054] Asimismo, el codificador 100 puede estar configurado para seleccionar los grupos 116_1 a 116_6 de coeficientes espectrales (o la pluralidad de coeficientes espectrales individuales) a los cuales se aplica la codificación predictiva de tal manera que haya una alternancia periódica, periódica con una tolerancia de /-1 coeficiente espectral, entre los grupos 116_1 a 116_6 de coeficientes espectrales (o la pluralidad de coeficientes espectrales individuales) a los cuales se aplica la codificación predictiva y los coeficientes espectrales por los cuales están separados los grupos de coeficientes espectrales (o la pluralidad de coeficientes espectrales individuales) a los cuales se aplica la codificación predictiva. La tolerancia de /-1 coeficiente espectral puede ser indispensable cuando una distancia entre dos armónicos de la señal de audio 102 no es igual a un valor de espaciamiento entero (entero con respecto a los índices o números de coeficientes espectrales) sino, por el contrario, a una fracción o múltiplo del mismo. Esto se puede ver asimismo en la Fig. 2 puesto que las flechas 122_1 a 122_6 no siempre apuntan exactamente al centro o punto medio de los correspondientes coeficientes espectrales.
[0055] En otras palabras, la señal de audio 102 puede comprender al menos dos componentes armónicos de la señal 124_1 a 124_6, donde el codificador 100 puede estar configurado para aplicar de manera selectiva la codificación predictiva a la pluralidad de grupos 116_1 a 116_6 de coeficientes espectrales (o coeficientes espectrales individuales) que representan dichos al menos dos componentes armónicos de la señal 124_1 a 124_6 o entornos espectrales alrededor de dichos al menos dos componentes armónicos de la señal 124_1 a 124_6 de la señal de audio 102. Los entornos espectrales alrededor de dichos al menos dos componentes armónicos de la señal 124_1 a 124_6 pueden ser, por ejemplo, /-1, 2, 3, 4 o 5 componentes espectrales.
[0056] Por consiguiente, el codificador 100 puede estar configurado para no aplicar la codificación predictiva a los grupos 118_1 a 118_5 de coeficientes espectrales (o pluralidad de coeficientes espectrales individuales) que no representan dichos al menos dos componentes armónicos de la señal 124_1 a 124_6 o entornos espectrales de dichos al menos dos componentes armónicos de la señal 124_1 a 124_6 de la señal de audio 102. En otras palabras, el codificador 100 puede estar configurado para no aplicar la codificación predictiva a la pluralidad de grupos 118_1 a 118_5 de coeficientes espectrales (o coeficientes espectrales individuales) que pertenecen a un ruido de fondo no tonal entre los armónicos de la señal 124_1 a 124_6.
[0057] Además, el codificador 100 puede estar configurado para determinar un valor de espaciamiento de armónicos que indica un espaciamiento espectral entre dichos al menos dos componentes armónicos de la señal 124_1 a 124_6 de la señal de audio 102, el valor de espaciamiento de los armónicos que indica la pluralidad de coeficientes espectrales individuales o grupos de coeficientes espectrales que representan dichos al menos dos componentes armónicos de la señal 124_1 a 124_6 de la señal de audio 102.
[0058] Por otra parte, el codificador 100 puede estar configurado para proporcionar la señal de audio codificada 120 de tal manera que la señal de audio codificada 120 incluya el valor de espaciamiento (por ejemplo, un valor de espaciamiento por trama) o (de lo contrario) un parámetro a partir del cual se pueda derivar directamente el valor de espaciamiento.
[0059] Las realizaciones de la presente invención abordan los dos problemas antes citados del procedimiento de FDP (por sus siglas en inglés, Frequency Domain Prediction, Predicción en el Dominio de la Frecuencia) mediante la introducción de un valor de espaciamiento de armónicos en el procedimiento de FDP, señalizado desde el codificador (transmisor) 100 a un decodificador respectivo (receptor) de tal manera que ambos puedan operar en forma totalmente sincronizada. Dicho valor de espaciamiento de armónicos puede servir como indicador de una frecuencia fundamental instantánea (o tono) de uno o más espectros asociados a una trama que se va a codificar e identifica qué bins espectrales (coeficientes espectrales) se deben predecir. Más específicamente, solo los coeficientes espectrales que rodean a los componentes armónicos de la señal situados (en función de su indexación) en múltiplos enteros del
tono fundamental (definidos por el valor de espaciamiento de los armónicos) se van a someter a la predicción. Las Figs. 2 y 3 ilustran la estrategia de predicción adaptativa al tono por medio de un sencillo ejemplo, en el cual la Fig. 3 ilustra el funcionamiento del indicador del estado actual de la técnica de MPEG-2 AAC (por sus siglas en inglés, Moving Picture Expert Group-2 Advanced Audio Coding/Codificación Avanzada de Audio del Grupo de Expertos en Imágenes en Movimiento-2), que no predice solo alrededor de una red de armónicos sino que somete a cada bin espectral por debajo de una determinada frecuencia final a predicción y donde la Fig. 2 ilustra el mismo indicador con una modificación según una realización integrada para ejecutar la predicción solo de los bins “tonales” que están cerca de la red de espaciamiento de armónicos.
[0060] La comparación de las Figs. 2 y 3 revela dos ventajas de la modificación según una realización, es decir (1) se incluyen muchos menos bins espectrales en el procedimiento de predicción, lo que reduce la complejidad (en el ejemplo dado aproximadamente un 40 %, puesto que solo se predicen tres quintos de los bins) y (2) los bins pertenecientes al ruido de fondo no tonal entre los armónicos de las señales no resultan afectados por la predicción, lo que debe aumentar la eficiencia de la predicción.
[0061] Cabe observar que el valor de espaciamiento de los armónicos no necesariamente debe corresponder al tono instantáneo real de la señal de entrada, sino que podría representar una fracción o múltiplo del tono real si esto ofrece una mejora general de la eficiencia del procedimiento de predicción. Además, se debe hacer hincapié en que el valor de espaciamiento de los armónicos no tiene que reflejar un múltiplo entero de la indexación de bins o unidades de ancho de banda sino que puede incluir una fracción de dichas unidades.
[0062] A continuación, se describe una implementación preferida de un codificador de audio al estilo MPEG (por sus siglas en inglés, Moving Picture Expert Group, Grupo de Expertos en Imágenes en Movimiento).
[0063] La predicción adaptativa al tono está preferentemente integrada a la MPEG-2 AAC (por sus siglas en inglés, Moving Picture Expert Group Advanced Audio Coding/Codificación Avanzada de Audio del Grupo de Expertos en Imágenes en Movimiento 2) [ISO/IEC 13818-7, “Information technology - Part 7: Advanced Audio Coding (AAC),” 2006.] o, utilizando un indicador similar al de la AAC, al códec de audio 3D de MPEG-H (por sus siglas en inglés, Moving Picture Expert Group-High efficiency coding [ISO/IEC 23008-3, “Information technology - High efficiency coding, part 3: 3D audio,” 2015.]. En particular, se puede escribir una bandera de un bit y leerla en un respectivo flujo de bits por cada trama y canal que no sea codificado de manera independiente (correspondiente a canales de tramas independientes, la bandera puede no transmitirse dado que la predicción puede ser deshabilitada para garantizar la independencia). Si se ajusta la bandera a uno, se pueden escribir y leer 8 bits más. Estos 8 bits representan una versión cuantificada (por ejemplo un índice) del valor de espaciamiento de armónicos correspondiente a la trama y canal dados. Empleando el valor de espaciamiento de armónicos derivado de la versión cuantificada mediante el uso de una función de mapeo lineal o no lineal, el procedimiento de predicción se puede llevar a cabo según una realización expuesta en la Fig. 2. De preferencia, solo los bins situados dentro de una distancia máxima de 1,5 bins alrededor de la red de armónicos se someten a la predicción. Por ejemplo, si el valor de espaciamiento de los armónicos indica una línea de armónicos en el índice de bin 47.11, se predicen solamente los bins que están en los índices 46, 47 y 48. Dicha distancia máxima, sin embargo, podría ser especificada de manera diferente, ya sea fijada a-priori para todos los canales y tramas o, por separado, para cada trama y canal sobre la base del valor de espaciamiento de los armónicos. La Fig. 4 ilustra un diagrama esquemático de bloques de un decodificador 200 para decodificar una señal codificada 120. El decodificador 200 está configurado para decodificar la señal de audio codificada 120 en el dominio de la transformada o en el dominio de banco de filtros 204, donde el decodificador 200 está configurado para analizar la señal de audio codificada 120 con el fin de obtener coeficientes espectrales codificados 206_t0_f1 a 206_t0_f6 de la señal de audio correspondientes a una trama actual 208_t0 y coeficientes espectrales codificados 206_t-1_f0 a 206_t-1_f6 correspondientes al menos a una trama anterior 208_t-1 y donde el decodificador 200 está configurado para aplicar selectivamente la decodificación predictiva a una pluralidad de coeficientes espectrales codificados individuales o grupos de coeficientes espectrales codificados que están separados por al menos un coeficiente espectral codificado.
[0064] En algunas realizaciones, el decodificador 200 puede estar configurado para aplicar la decodificación predictiva a una pluralidad de coeficientes espectrales codificados individuales que están separados por al menos un coeficiente espectral codificado, como por ejemplo dos coeficientes espectrales codificados individuales que están separados por al menos un coeficiente espectral codificado. Además, el decodificador 200 puede estar configurado para aplicar la decodificación predictiva a una pluralidad de grupos de coeficientes espectrales codificados (donde cada uno de los grupos comprende al menos dos coeficientes espectrales codificados) que están separados por al menos un coeficiente espectral codificado, como por ejemplo dos grupos de coeficientes espectrales codificados que están separados por al menos un coeficiente espectral codificado. Además, el decodificador 200 puede estar configurado para aplicar la decodificación predictiva a una pluralidad de coeficientes espectrales codificados individuales y/o grupos de coeficientes espectrales codificados que están separados por al menos un coeficiente espectral codificado como, por ejemplo, al menos un coeficiente espectral codificado individual y al menos un grupo de coeficientes espectrales codificados que están separados por al menos un coeficiente espectral codificado.
[0065] En el ejemplo ilustrado en la Fig. 4, el decodificador 200 está configurado para determinar seis
coeficientes espectrales codificados 206_t0_f1 a 206_t0_f6 correspondientes a la trama actual 208_t0 y seis coeficientes espectrales codificados 206_t-1_f1 a 206_t-1_f6 correspondientes a la trama anterior 208_t-1. Por consiguiente, el decodificador 200 está configurado para aplicar selectivamente decodificación predictiva al segundo coeficiente espectral codificado individual 206_t0_f2 de la trama actual y al grupo de coeficientes espectrales codificados que consiste en el cuarto y quinto coeficientes espectrales codificados 206_t0_f4 y 206_t0_f5 de la trama actual 208_t0. Como se puede apreciar, el segundo coeficiente espectral codificado individual 206_t0_f2 y el grupo de coeficientes espectrales codificados que consiste en el cuarto y quinto coeficientes espectrales codificados 206_t0_f4 y 206_t0_f5 están separados entre sí por el tercer coeficiente espectral codificado 206_t0_f3.
[0066] Cabe observar que el término “selectivamente” utilizado en este contexto se refiere a la aplicación de la decodificación predictiva (solo) a coeficientes espectrales codificados seleccionados. En otras palabras, la decodificación predictiva no se aplica a todos los coeficientes espectrales codificados, sino por el contrario solo a coeficientes espectrales individuales o grupos de coeficientes espectrales codificados seleccionados, donde los coeficientes espectrales individuales y/o grupos de coeficientes espectrales codificados seleccionados están separados entre sí por al menos un coeficiente espectral codificado. En otras palabras, no se aplica la decodificación predictiva a dicho al menos un coeficiente espectral codificado por el cual están separados la pluralidad de coeficientes espectrales codificados individuales o grupos de coeficientes espectrales codificados seleccionados.
[0067] En algunas realizaciones el decodificador 200 puede estar configurado para no aplicar la decodificación predictiva a dicho al menos un coeficiente espectral codificado 206_t0_f3 por el cual están separados los coeficientes espectrales codificados individuales 206_t0_f2 o el grupo de coeficientes espectrales 206_t0_f4 y 206_t0_f5.
[0068] El decodificador 200 puede estar configurado para decodificar por entropía los coeficientes espectrales codificados, para obtener errores de predicción cuantificados correspondientes a los coeficientes espectrales 206_t0_f2, 2016_t0_f4 y 206_t0_f5 a los cuales se va a aplicar la decodificación predictiva y coeficientes espectrales cuantificados 206_t0_f3 correspondientes a dicho al menos un coeficiente espectral a los cuales no se va a aplicar la decodificación predictiva. Por lo tanto, el decodificador 200 puede estar configurado para aplicar los errores de predicción cuantificados a una pluralidad de coeficientes espectrales pronosticados individuales 210_t0_f2 o grupos de coeficientes espectrales pronosticados 210_t0_f4 y 210_t0_f5, para obtener, con respecto a la trama actual 208_t0, coeficientes espectrales decodificados asociados a los coeficientes espectrales codificados 206_t0_f2, 206_t0_f4 y 206_t0_f5 a los cuales se aplica la decodificación predictiva.
[0069] Por ejemplo, el decodificador 200 puede estar configurado para obtener un segundo error de predicción cuantificado para un segundo coeficiente espectral cuantificado 206_t0_f2 y para aplicar el segundo error de predicción cuantificado al segundo coeficiente espectral pronosticado 210_t0_f2, para obtener un segundo coeficiente espectral decodificado asociado al segundo coeficiente espectral codificado 206_t0_f2, donde el decodificador 200 puede estar configurado para obtener un cuarto error de predicción cuantificado correspondiente a un cuarto coeficiente espectral cuantificado 206_t0_f4 y para aplicar el cuarto error de predicción cuantificado al cuarto coeficiente espectral pronosticado 210_t0_f4, para obtener un cuarto coeficiente espectral decodificado asociado al cuarto coeficiente espectral codificado 206_t0_f4 y donde el decodificador 200 puede estar configurado para obtener un quinto error de predicción cuantificado correspondiente a un quinto coeficiente espectral cuantificado 206_t0_f5 y para aplicar el quinto error de predicción cuantificado al quinto coeficiente espectral pronosticado 210_t0_f5, para obtener un quinto coeficiente espectral decodificado asociado al quinto coeficiente espectral codificado 206_t0_f5.
[0070] Además, el decodificador 200 puede estar configurado para determinar la pluralidad de coeficientes espectrales pronosticados individuales 210_t0_f2 o grupos de coeficientes espectrales pronosticados 210_t0_f4 y 210_t0_f5 correspondientes a la trama actual 208_t0 basándose en una correspondiente pluralidad de los coeficientes espectrales codificados individuales 206_t-1_f2 (por ejemplo, usando una pluralidad de coeficientes espectrales anteriormente decodificados asociados a la pluralidad de los coeficientes espectrales codificados individuales 206_t-1_f2) o grupos de coeficientes espectrales codificados 206_t-1_f4 y 206_t-1_f5 (por ejemplo, usando grupos de coeficientes espectrales antes decodificados asociados a los grupos de coeficientes espectrales codificados 206_t-1_f4 y 206_t-1_f5) de la trama anterior 208_t-1.
[0071] Por ejemplo, el decodificador 200 puede estar configurado para determinar el segundo coeficiente espectral pronosticado 210_t0_f2 de la trama actual 208_t0 utilizando un segundo coeficiente espectral anteriormente decodificado (cuantificado) asociado al segundo coeficiente espectral codificado 206_t-1_f2 de la trama anterior 208_t-1, al cuarto coeficiente espectral pronosticado 210_t0_f4 de la trama actual 208_t0 usando un cuarto coeficiente espectral anteriormente decodificado (cuantificado) asociado al cuarto coeficiente espectral codificado 206_t-1_f4 de la trama anterior 208_t-1, y al quinto coeficiente espectral pronosticado 210_t0_f5 de la trama actual 208_t0 usando un quinto coeficiente espectral anteriormente decodificado (cuantificado) asociado al quinto coeficiente espectral codificado 206_t-1_f5 de la trama anterior 208_t-1.
[0072] Por otra parte, el decodificador 200 puede estar configurado para derivar los coeficientes de predicción del valor de espaciamiento y donde el decodificador 200 puede estar configurado para calcular la pluralidad de coeficientes espectrales pronosticados individuales 210_t0_f2 o grupos de coeficientes espectrales pronosticados
210_t0_f4 y 210_t0_f5 correspondientes a la trama actual 208_t0 utilizando una correspondiente pluralidad de coeficientes espectrales individuales anteriormente decodificados o grupos de coeficientes espectrales anteriormente decodificados de al menos dos tramas anteriores 208_t-1 y 208_t-2 y utilizando los coeficientes de predicción derivados.
[0073] Por ejemplo, el decodificador 200 puede estar configurado para derivar los coeficientes de predicción 212_f2 y 214_f2 correspondientes al segundo coeficiente espectral codificado 206_t0_f2 del valor de espaciamiento, para derivar coeficientes de predicción 212_f4 y 214_f4 correspondientes al cuarto coeficiente espectral codificado 206_t0_f4 del valor de espaciamiento, y para derivar coeficientes de predicción 212_f5 y 214_f5 correspondientes al quinto coeficiente espectral codificado 206_t0_f5 del valor de espaciamiento.
[0074] Cabe observar que el decodificador 200 puede estar configurado para decodificar la señal de audio codificada 120 con el fin de obtener errores de predicción cuantificados en lugar de una pluralidad de coeficientes espectrales cuantificados individuales o grupos de coeficientes espectrales cuantificados correspondientes a la pluralidad de coeficientes espectrales codificados individuales o grupos de coeficientes espectrales codificados a los cuales se aplica la decodificación predictiva.
[0075] Además, el decodificador 200 puede estar configurado para decodificar la señal de audio codificada 120 con el fin de obtener coeficientes espectrales cuantificados por los cuales la pluralidad de coeficientes espectrales individuales o grupos de coeficientes espectrales están separados, de tal manera que haya una alternancia de los coeficientes espectrales codificados 206_t0_f2 o grupos de coeficientes espectrales codificados 206_t0_f4 y 206_t0_f5 con respecto a los cuales se obtienen errores de predicción cuantificados y los coeficientes espectrales codificados 206_t0_f3 o grupos de coeficientes espectrales codificados para los cuales se obtienen coeficientes espectrales cuantificados.
[0076] El decodificador 200 puede estar configurado para proporcionar una señal de audio decodificada 220 utilizando los coeficientes espectrales decodificados asociados a los coeficientes espectrales codificados 206_t0_f2, 206_t0_f4 y 206_t0_f5 a los cuales se aplica la decodificación predictiva, y usando los coeficientes espectrales decodificados por entropía asociados a los coeficientes espectrales codificados 206_t0_f1,206_t0_f3 y 206_t0_f6 a los cuales no se aplica la decodificación predictiva.
[0077] En algunas realizaciones, el decodificador 200 puede estar configurado para obtener un valor de espaciamiento, donde el decodificador 200 puede estar configurado para seleccionar la pluralidad de coeficientes espectrales codificados individuales 206_t0_f2 o grupos de coeficientes espectrales codificados 206_t0_f4 y 206_t0_f5 a los cuales se aplica la decodificación predictiva sobre la base del valor de espaciamiento.
[0078] Como ya se mencionara anteriormente con respecto a la descripción del correspondiente codificador 100, el valor de espaciamiento puede ser, por ejemplo, un espaciamiento (o distancia) entre dos frecuencias características de la señal de audio. Además, el valor de espaciamiento puede ser un número entero de coeficientes espectrales (o índices de coeficientes espectrales) que aproximan el espaciamiento entre las dos frecuencias características de la señal de audio. Naturalmente, el valor de espaciamiento puede ser también una fracción o múltiplo del número entero de coeficientes espectrales que describe el espaciamiento entre las dos frecuencias características de la señal de audio.
[0079] El decodificador 200 puede estar configurado para seleccionar coeficientes espectrales individuales o grupos de coeficientes espectrales espectralmente dispuestos según una red de armónicos definida por el valor de espaciamiento para una decodificación predictiva. La red de armónicos definida por el valor de espaciamiento puede describir la distribución espectral periódica (espaciamiento equidistante) de armónicos en la señal de audio 102. En otras palabras, la red de armónicos definida por el valor de espaciamiento puede ser una secuencia de valores de espaciamiento que describen el espaciamiento equidistante de los armónicos de la señal de audio 102.
[0080] Por otra parte, el decodificador 200 puede estar configurado para seleccionar coeficientes espectrales (por ejemplo, solo los coeficientes espectrales), cuyos índices espectrales son iguales o se encuentran dentro de un intervalo (por ejemplo, un intervalo predeterminado o variable) alrededor de una pluralidad de índices espectrales derivada sobre la base del valor de espaciamiento, para una decodificación predictiva. Por lo tanto, el decodificador 200 puede estar configurado para establecer una amplitud del intervalo dependiendo del valor de espaciamiento.
[0081] En algunas realizaciones, la señal de audio codificada puede comprender el valor de espaciamiento o una versión codificada del mismo (por ejemplo, un parámetro del cual se deriva directamente el valor de espaciamiento), donde el decodificador 200 puede estar configurado para extraer el valor de espaciamiento o la versión codificada del mismo de la señal de audio codificada para obtener el valor de espaciamiento.
[0082] Por otro lado, el decodificador 200 puede estar configurado para determinar el valor de espaciamiento por sí mismo, es decir que la señal de audio codificada no incluye el valor de espaciamiento. En ese caso, el decodificador 200 puede estar configurado para determinar una frecuencia fundamental instantánea (de la señal de
audio codificada 120 que representa la señal de audio 102) y para derivar el valor de espaciamiento de la frecuencia fundamental instantánea o una fracción o un múltiplo de la misma.
[0083] En algunas realizaciones, el decodificador 200 puede estar configurado para seleccionar la pluralidad de coeficientes espectrales individuales o grupos de coeficientes espectrales a los cuales se aplica la decodificación predictiva de tal manera que haya una alternancia periódica, periódica con una tolerancia de /-1 coeficiente espectral, entre la pluralidad de coeficientes espectrales individuales o grupos de coeficientes espectrales a los cuales se aplica la decodificación predictiva y los coeficientes espectrales por los cuales la pluralidad de coeficientes espectrales individuales o grupos de coeficientes espectrales a los cuales se aplica la decodificación predictiva están separados.
[0084] En algunas realizaciones, la señal de audio 102 representada por la señal de audio codificada 120 comprende al menos dos componentes armónicos de la señal, donde el decodificador 200 está configurado para aplicar selectivamente decodificación predictiva a la pluralidad de coeficientes espectrales codificados individuales 206_t0_f2 o grupos de coeficientes espectrales codificados 206_t0_f4 y 206_t0_f5 que representa dichos al menos dos componentes armónicos de la señal o entornos espectrales alrededor de dichos al menos dos componentes armónicos de la señal de la señal de audio 102. Los entornos espectrales alrededor de dichos al menos dos componentes armónicos de la señal pueden ser, por ejemplo, /-1, 2, 3, 4 o 5 componentes espectrales.
[0085] Por consiguiente, el decodificador 200 puede estar configurado para identificar dichos al menos dos componentes armónicos de la señal, y para aplicar de manera selectiva la decodificación predictiva a la pluralidad de coeficientes espectrales codificados individuales 206_t0_f2 o de grupos de coeficientes espectrales codificados 206_t0_f4 y 206_t0_f5 que está asociada a los componentes armónicos identificados de la señal, por ejemplo, que representan los componentes armónicos identificados de la señal o que están alrededor de los componentes armónicos identificados de la señal).
[0086] Por otro lado, la señal de audio codificada 120 puede comprender una información (por ejemplo, el valor de espaciamiento) que identifica dichos al menos dos componentes armónicos de la señal. En ese caso, el decodificador 200 puede estar configurado para aplicar de manera selectiva la decodificación predictiva a la pluralidad de coeficientes espectrales codificados individuales 206_t0_f2 o grupos de coeficientes espectrales codificados 206_t0_f4 y 206_t0_f5 que está asociada a los componentes armónicos identificados de la señal, por ejemplo, que representan los componentes armónicos identificados de la señal o que están alrededor de los componentes armónicos identificados de la señal).
[0087] En las dos alternativas mencionadas anteriormente, el decodificador 200 puede estar configurado para no aplicar la decodificación predictiva a la pluralidad de coeficientes espectrales codificados individuales 206_t0_f3, 206_t0_f1 y 206_t0_f6 o grupos de coeficientes espectrales codificados que no representan dichos al menos dos componentes armónicos de la señal o entornos espectrales de dichos al menos dos componentes armónicos de la señal de la señal de audio 102.
[0088] En otras palabras, el decodificador 200 puede estar configurado para no aplicar la decodificación predictiva a la pluralidad de coeficientes espectrales codificados individuales 206_t0_f3, 206_t0_f1,206_t0_f6 o grupos de coeficientes espectrales codificados que pertenecen a un ruido de fondo no tonal entre los armónicos de señal de la señal de audio 102.
[0089] La Fig. 5 ilustra un gráfico de flujo de un procedimiento 300 para codificar una señal de audio, según una realización. El procedimiento 300 comprende una etapa 302 de determinación de coeficientes espectrales de la señal de audio correspondientes a una trama actual y al menos una trama anterior, y una etapa 304 de aplicación de manera selectiva de la codificación predictiva a una pluralidad de coeficientes espectrales individuales o grupos de coeficientes espectrales que están separados por al menos un coeficiente espectral.
[0090] La Fig. 6 ilustra un gráfico de flujo de un procedimiento 400 para decodificar una señal de audio codificada, según una realización. El procedimiento 400 comprende una etapa 402 de análisis de la señal de audio codificada para obtener coeficientes espectrales codificados de la señal de audio correspondientes a una trama actual y al menos una trama anterior, y una etapa 404 de aplicación de manera selectiva de la decodificación predictiva a una pluralidad de coeficientes espectrales codificados individuales o grupos de coeficientes espectrales codificados que están separados por al menos un coeficiente espectral codificado.
[0091] Aunque se han descrito algunos aspectos en el contexto de un aparato, es obvio que estos aspectos también representan una descripción del procedimiento correspondiente, en el cual un bloque o dispositivo corresponde a una etapa del procedimiento o a una característica de una etapa del procedimiento. De manera análoga, los aspectos descritos en el contexto de una etapa del procedimiento también representan una descripción de un bloque o elemento correspondiente o de una característica de un aparato correspondiente. En algunas realizaciones, una cualquiera o más de las etapas más importantes del procedimiento pueden ser ejecutadas por ese tipo de aparato.
[0092] La señal de audio codificada de la invención puede ser almacenada en un medio de almacenamiento
digital o puede ser transmitida por un medio de transmisión tal como un medio de transmisión inalámbrico o un medio de transmisión conectado por cables tal como Internet.
[0093] Dependiendo de ciertos requisitos de implementación, las realizaciones pueden ser implementadas en hardware o en software o al menos parcialmente en software, o al menos parcialmente en hardware. La implementación se puede realizar empleando un medio de almacenamiento digital, por ejemplo un disco flexible, un DVD, un Blu-Ray, un CD, una ROM, una PROM, una EPROM, una EEPROM o una memoria FLASH, que tiene almacenadas en la misma señales de control legibles electrónicamente, que cooperan (o tienen capacidad para cooperar) con un sistema informático programable de tal manera que se ejecute el procedimiento respectivo. Por lo tanto, el medio de almacenamiento digital puede ser legible por ordenador.
[0094] Algunas realizaciones según la invención un soporte no transitorio de datos que comprende señales de control legibles electrónicamente, con capacidad para cooperar con un sistema informático programable de tal manera que se ejecute uno de los procedimientos descritos en esta invención.
[0095] En general, las realizaciones de la presente invención pueden ser implementadas en forma de producto de programa informático con un código de programa, donde el código de programa cumple la función de ejecutar uno de los procedimientos al ejecutarse el programa informático en un ordenador. El código de programa puede ser almacenado, por ejemplo, en un soporte legible por máquina.
[0096] Otras realizaciones comprenden el programa informático para ejecutar uno de los procedimientos descritos en esta invención, almacenado en un soporte legible por máquina.
[0097] En otras palabras, una realización del procedimiento de la invención consiste, por lo tanto, en un programa informático que consta de un código de programa para poner en práctica uno de los procedimientos descritos en esta invención al ejecutarse el programa informático en un ordenador.
[0098] Otra realización de los procedimientos de la invención consiste, por lo tanto, en un soporte de datos (o medio de almacenamiento digital, o medio legible por ordenador) que comprende, grabado en el mismo, el programa informático para ejecutar uno de los procedimientos descritos en esta invención. El soporte de datos, el medio de almacenamiento digital o el medio grabado son por lo general tangibles y/o no transitorios.
[0099] Otra realización del procedimiento de la invención es, por lo tanto, un flujo de datos o una secuencia de señales que representa el programa informático para ejecutar uno de los procedimientos descritos en esta invención. El flujo de datos o la secuencia de señales pueden estar configurados, por ejemplo, para ser transferidos a través de una conexión de comunicación de datos, por ejemplo, a través de Internet.
[0100] Una realización adicional comprende un medio de procesamiento, por ejemplo, un ordenador, un dispositivo lógico programable, configurado o adaptado para ejecutar uno de los procedimientos descritos en esta invención.
[0101] Otra realización comprende un ordenador en el que se ha instalado el programa informático para ejecutar uno de los procedimientos descritos en esta invención.
[0102] Otra de las realizaciones según la invención comprende un aparato o un sistema configurado para transferir (por ejemplo, por vía electrónica u óptica) un programa informático para ejecutar uno de los procedimientos descritos en esta invención a un receptor. El receptor puede ser, por ejemplo, un ordenador, un dispositivo móvil, un dispositivo de memoria o similar. El aparato o sistema puede comprender, por ejemplo, un servidor de archivos para transferir un programa informático al receptor.
[0103] En algunas realizaciones, se puede utilizar un dispositivo lógico programable (por ejemplo, una matriz de puertas programables en el campo) para ejecutar algunas o todas las funcionalidades de los procedimientos descritos en esta invención. En algunas realizaciones, una matriz de puertas programables en el campo puede cooperar con un microprocesador para ejecutar uno de los procedimientos descritos en esta invención. Por lo general, los procedimientos son ejecutados preferentemente por cualquier aparato de hardware.
[0104] El aparato descrito en esta invención puede ser implementado utilizando un aparato de hardware o utilizando un ordenador, o mediante el uso de una combinación de un aparato de hardware y un ordenador.
[0105] Los procedimientos descritos en esta invención se pueden ejecutar utilizando un aparato de hardware, o utilizando un ordenador, o usando una combinación de un aparato de hardware y un ordenador.
[0106] Las realizaciones anteriormente descritas son meramente ilustrativas de los principios de la presente invención. Se entiende que las modificaciones y variaciones de las disposiciones y detalles descritos en esta invención deben ser evidentes para los expertos en la materia. Por lo tanto, solo se pretende limitarse al alcance de las siguientes
reivindicaciones de patente y no a los detalles específicos presentados a modo de descripción y explicación de las realizaciones presentadas en esta invención.
Claims (45)
1. Un codificador (100) para codificar una señal de audio (102), donde el codificador (100) está configurado para codificar la señal de audio (102) en el dominio de la transformada o en el dominio de banco de filtros (104), donde el codificador está configurado para determinar coeficientes espectrales (106_t0_f1:106_t0_f6; 106_t-1_f1:106_t-1_f6) de la señal de audio (102) correspondientes a una trama actual (108_t0) y al menos una trama anterior (108_t-1), donde el codificador (100) está configurado para aplicar selectivamente la codificación predictiva a una pluralidad de coeficientes espectrales individuales (106_t0_f2) o grupos de coeficientes espectrales (106_t0_f4,106_t0_f5), donde el codificador (100) está configurado para determinar un valor de espaciamiento, donde el codificador (100) está configurado para seleccionar la pluralidad de coeficientes espectrales individuales (106_t0_f2) o grupos de coeficientes espectrales (106_t0_f4,106_t0_f5) a los cuales se aplica la codificación predictiva sobre la base del valor de espaciamiento;
caracterizado porque el valor de espaciamiento es un valor de espaciamiento de armónicos que describe un espaciamiento entre armónicos de la señal de audio (102).
2. El codificador (100) según la reivindicación 1, donde la pluralidad de coeficientes espectrales individuales (106_t0_f2) o grupos de coeficientes espectrales (106_t0_f4,106_t0_f5) están separados por al menos un coeficiente espectral (106_t0_f3).
3. El codificador (100) según la reivindicación 2, donde no se aplica la codificación predictiva a dicho al menos un coeficiente espectral (106_t0_f3) por el cual los coeficientes espectrales individuales (106_t0_f2) o los grupos de coeficientes espectrales (106_t0_f4,106_t0_f5) están separados.
4. El codificador (100) según una de las reivindicaciones 1 a 3, donde el codificador (100) está configurado para aplicar la codificación predictiva a la pluralidad de coeficientes espectrales individuales (106_t0_f2) o los grupos de coeficientes espectrales (106_t0_f4,106_t0_f5) de la trama actual (108_t0), mediante la codificación de los errores de predicción entre una pluralidad de coeficientes espectrales pronosticados individuales (110_t0_f2) o grupos de coeficientes espectrales pronosticados (110_t0_f4,110_t0_f5) de la trama actual y la pluralidad de coeficientes espectrales individuales (106_t0_f2) o grupos de coeficientes espectrales (106_t0_f4,106_t0_f5) de la trama actual (108_t0).
5. El codificador (100) según la reivindicación 4, donde el codificador (100) está configurado para derivar coeficientes de predicción del valor de espaciamiento y donde el codificador (100) está configurado para calcular la pluralidad de coeficientes espectrales pronosticados individuales (110_t0_f2) o grupos de coeficientes espectrales pronosticados (110_t0_f4,110_t0_f5) correspondientes a la trama actual (108_t0) utilizando una correspondiente pluralidad de coeficientes espectrales individuales (106_t-2_f2,106_t-1_f2) o los grupos de coeficientes espectrales correspondientes (106_t-2_f4,106_t-1_f4; 106_t-2_f5,106_t-1_f5) de al menos dos tramas anteriores (108_t-2,108_t-1) y utilizando los coeficientes de predicción derivados.
6. El codificador (100) según la reivindicación 4, donde el codificador (100) está configurado para determinar la pluralidad de coeficientes espectrales pronosticados individuales (110_t0_f2) o grupos de coeficientes espectrales pronosticados (110_t0_f4,110_t0_f4) correspondientes a la trama actual (108_t0) usando las versiones cuantificadas correspondientes de la pluralidad de coeficientes espectrales individuales (106_t-1_f2) o los grupos de coeficientes espectrales (106_t-1_f4,106_t-1_f5) de la trama anterior (108_t-1).
7. El codificador (100) según la reivindicación 6, donde el codificador (100) está configurado para derivar coeficientes de predicción del valor de espaciamiento y donde el codificador (100) está configurado para calcular la pluralidad de coeficientes espectrales pronosticados individuales (110_t0_f2) o grupos de coeficientes espectrales pronosticados (110_t0_f4,110_t0_f5) correspondientes a la trama actual (108_t0) usando las versiones cuantificadas correspondientes de la pluralidad de coeficientes espectrales individuales (106_t-2_f2,106_t-1_f2) o los grupos de coeficientes espectrales (106_t-2_f4,106_t-1_f4; 106_t-2_f5,106_t-1_f5) de al menos dos tramas anteriores (108_t-2,108_t-1) y utilizando los coeficientes de predicción derivados.
8. El codificador (100) según cualquiera de las reivindicaciones 5 o 7, donde el codificador (100) está configurado para proporcionar una señal de audio codificada (120), no incluyendo la señal de audio codificada (120) los coeficientes de predicción o versiones codificadas de los mismos.
9. El codificador (100) según una de las reivindicaciones 4 a 8, donde el codificador (100) está configurado para proporcionar una señal de audio codificada (120), incluyendo la señal de audio codificada (120) versiones cuantificadas de los errores de predicción en lugar de versiones cuantificadas de la pluralidad de coeficientes espectrales individuales (106_t0_f2) o de los grupos de coeficientes espectrales (106_t0_f4,106_t0_f5) correspondientes a la pluralidad de coeficientes espectrales individuales o grupos de coeficientes espectrales a los cuales se aplica la codificación predictiva.
10. El codificador (100) según la reivindicación 9, donde la señal de audio codificada (120) incluye versiones
cuantificadas de los coeficientes espectrales (106_t0_f3) a los cuales no se aplica la codificación predictiva, de tal manera que haya una alternancia de coeficientes espectrales (106_t0_f2) o grupos de coeficientes espectrales (106_t0_f4,106_t0_f5) de los cuales se incluyen versiones cuantificadas de los errores de predicción en la señal de audio codificada (120) y coeficientes espectrales (106_t0_f1,106_t0_f3,106_t0_f6) o grupos de coeficientes espectrales con respecto a los cuales se proporcionan versiones cuantificadas sin emplear la codificación predictiva.
11. El codificador (100) según una de las reivindicaciones 1 a 10, donde el codificador (100) está configurado para determinar una frecuencia fundamental instantánea de la señal de audio (102) y para derivar el valor de espaciamiento de la frecuencia fundamental instantánea o una fracción o un múltiplo de la misma.
12. El codificador (100) según una de las reivindicaciones 1 a 11, donde el codificador (100) está configurado para seleccionar coeficientes espectrales individuales o grupos (116_1:116_6) de coeficientes espectrales espectralmente dispuestos según una red de armónicos definida por el valor de espaciamiento para la codificación predictiva.
13. El codificador (100) según una de las reivindicaciones 1 a 11, donde el codificador (100) está configurado para seleccionar coeficientes espectrales, cuyos índices espectrales son iguales o se encuentran dentro de un intervalo alrededor de una pluralidad de índices espectrales derivados sobre la base del valor de espaciamiento, para una codificación predictiva.
14. El codificador (100) según la reivindicación 13, donde el codificador (100) está configurado para establecer la amplitud del intervalo dependiendo del valor de espaciamiento.
15. El codificador (100) según una de las reivindicaciones 1 a 14, donde el codificador (100) está configurado para seleccionar la pluralidad de coeficientes espectrales individuales o grupos (116_1:116_6) de coeficientes espectrales a los cuales se aplica la codificación predictiva de tal manera que haya una alternancia periódica, periódica con una tolerancia de /-1 coeficiente espectral, entre la pluralidad de coeficientes espectrales individuales o grupos (116_1:116_6) de coeficientes espectrales a los cuales se aplica la codificación predictiva y los coeficientes espectrales o grupos de coeficientes espectrales (118_1:118_5) a los cuales no se aplica la codificación predictiva.
16. El codificador (100) según la reivindicación 15, donde la señal de audio (102) comprende al menos dos componentes armónicos de la señal (124_1:124_6), donde el codificador (100) está configurado para aplicar selectivamente la codificación predictiva a la pluralidad de coeficientes espectrales individuales o grupos (116_1:116_6) de coeficientes espectrales que representan dichos al menos dos componentes armónicos de la señal (124_1:124_6) o entornos espectrales alrededor de dichos al menos dos componentes armónicos de la señal (124_1:124_6) de la señal de audio (102).
17. El codificador (100) según la reivindicación 16, donde el codificador (100) está configurado para no aplicar codificación predictiva a aquellos de la pluralidad de coeficientes espectrales individuales o grupos (118_1:118_5) de coeficientes espectrales que no representan los al menos dos componentes de señal armónicos (124_1:124_6) o ambientes espectrales de los al menos dos componentes de señal harmónicos (124_1:124_6) de la señal de audio (102).
18. El codificador (100) según cualquiera de las reivindicaciones 16 o 17, donde el codificador (100) está configurado para no aplicar la codificación predictiva a la pluralidad de coeficientes espectrales individuales o grupos (118_1:118_5) de coeficientes espectrales que pertenecen a un ruido de fondo no tonal entre los armónicos de señal (124_1:124_6).
19. El codificador (100) según una de las reivindicaciones 16 a 18, donde el valor de espaciamiento es un valor de espaciamiento de armónicos que indica un espaciamiento espectral entre dichos al menos dos componentes armónicos de la señal (124_1:124_6) de la señal de audio (102), indicando el valor de espaciamiento de los armónicos la pluralidad de coeficientes espectrales individuales o grupos (116_1:116_6) de coeficientes espectrales que representa dichos al menos dos componentes armónicos de la señal (124_1:124_6) de la señal de audio (102).
20. El codificador (100) según una de las reivindicaciones 1 a 19, donde el codificador (100) está configurado para proporcionar una señal de audio codificada (120), donde el codificador (100) está configurado para incluir en la señal de audio codificada (120) el valor de espaciamiento o una versión codificada del mismo.
21. El codificador (100) según una de las reivindicaciones 1 a 20, donde los coeficientes espectrales son bins espectrales.
22. Un decodificador (200) para decodificar una señal de audio codificada (120), donde el decodificador (200) está configurado para decodificar la señal de audio codificada (120) en el dominio de la transformada o en el dominio de banco de filtros (204), donde el decodificador (200) está configurado para analizar la señal de audio codificada (120) para obtener coeficientes espectrales codificados (206_t0_f1:206_t0_f6; 206_t-1_f1:206_t-1_f6) de la
señal de audio (120) correspondientes a una trama actual (208_t0) y al menos una trama anterior (208_t-1) y donde el decodificador (200) está configurado para aplicar selectivamente decodificación predictiva a una pluralidad de coeficientes espectrales codificados individuales (206_t0_f2) o grupos de coeficientes espectrales codificados (206_t0_f4,206_t0_f5), donde el decodificador (200) está configurado para obtener un valor de espaciamiento, donde el decodificador (200) está configurado para seleccionar la pluralidad de coeficientes espectrales codificados individuales (206_t0_f2) o grupos de coeficientes espectrales codificados (206_t0_f4,206_t0_f5) a los cuales se aplica la decodificación predictiva sobre la base del valor de espaciamiento;
caracterizado porque el valor de espaciamiento es un valor de espaciamiento de armónicos que describe un espaciamiento entre armónicos de la señal de audio codificada (120).
23. El decodificador (200) según la reivindicación 22, donde la pluralidad de coeficientes espectrales codificados individuales (206_t0_f2) o grupos de coeficientes espectrales codificados (206_t0_f4,206_t0_f5) están separados por al menos un coeficiente espectral codificado (206_t0_f3).
24. El decodificador (200) según la reivindicación 23, donde la decodificación predictiva no se aplica a dicho al menos un coeficiente espectral (206_t0_f3) por el cual los coeficientes espectrales individuales (206_t0_f2) o el grupo de coeficientes espectrales (206_t0_f4,206_t0_f5) están separados.
25. El decodificador (200) según una de las reivindicaciones 22 a 24, donde el decodificador (200) está configurado para decodificar por entropía los coeficientes espectrales codificados, para obtener errores de predicción cuantificados correspondientes a los coeficientes espectrales (206_t0_f2,206_t0_f4,206_t0_f5) a los cuales se tiene que aplicar la decodificación predictiva y coeficientes espectrales cuantificados correspondientes a los coeficientes espectrales (206_t0_f3) a los cuales no se tiene que aplicar decodificación predictiva y
donde el decodificador (200) está configurado para aplicar los errores de predicción cuantificados a una pluralidad de coeficientes espectrales pronosticados individuales (210_t0_f2) o grupos de coeficientes espectrales pronosticados (210_t0_f4,210_t0_f5), para obtener, con respecto a la trama actual (208_t0), coeficientes espectrales decodificados asociados a los coeficientes espectrales codificados (206_t0_f2,206_t0_f4,206_t0_f5) a los cuales se aplica la decodificación predictiva.
26. El decodificador (200) según la reivindicación 25, donde el decodificador (200) está configurado para determinar la pluralidad de coeficientes espectrales pronosticados individuales (210_t0_f2) o grupos de coeficientes espectrales pronosticados (210_t0_f4,210_t0_f5) correspondientes a la trama actual (208_t0) basándose en una correspondiente pluralidad de los coeficientes espectrales codificados individuales (206_t-1_f2) o grupos de coeficientes espectrales codificados (206_t-1_f4,206_t-1_f5) de la trama anterior (208_t-1).
27. El decodificador (200) según la reivindicación 26, donde el decodificador (200) está configurado para derivar coeficientes de predicción del valor de espaciamiento y donde el decodificador (200) está configurado para calcular la pluralidad de coeficientes espectrales pronosticados individuales (210_t0_f2) o grupos de coeficientes espectrales pronosticados (210_t0_f4,210_t0_f5) correspondientes a la trama actual (208_t0) utilizando una correspondiente pluralidad de coeficientes espectrales individuales anteriormente decodificados o grupos de coeficientes espectrales anteriormente decodificados de al menos dos tramas anteriores y utilizando los coeficientes de predicción derivados.
28. El decodificador (200) según una de las reivindicaciones 22 a 27, donde el decodificador (200) está configurado para decodificar la señal de audio codificada (120) con el fin de obtener errores de predicción cuantificados en lugar de una pluralidad de coeficientes espectrales cuantificados individuales o grupos de coeficientes espectrales cuantificados correspondientes a la pluralidad de coeficientes espectrales codificados individuales (206_t0_f2) o grupos de coeficientes espectrales codificados (206_t0_f4,206_t0_f5) a los cuales se aplica la decodificación predictiva.
29. El decodificador (200) según la reivindicación 28, donde el decodificador está configurado para decodificar la señal de audio codificada (120) para obtener coeficientes espectrales cuantificados correspondientes a los coeficientes espectrales codificados (206_t0_f3) a los cuales no se aplica la decodificación predictiva, de tal manera que haya una alternancia de coeficientes espectrales codificados (206_t0_f2) o grupos de coeficientes espectrales codificados (206_t0_f4,206_t0_f5) con respecto a los cuales se obtienen los errores de predicción cuantificados y coeficientes espectrales codificados (206_t0_f3) o grupos de coeficientes espectrales codificados con respecto a los cuales se obtienen coeficientes espectrales cuantificados.
30. El decodificador (200) según una de las reivindicaciones 22 a 29, donde el decodificador (200) está configurado para seleccionar coeficientes espectrales individuales (206_t0_f2) o grupos de coeficientes espectrales (206_t0_f4,206_t0_f5) espectralmente dispuestos según una red de armónicos definida por el valor de espaciamiento para una decodificación predictiva.
31. El decodificador (200) según una de las reivindicaciones 22 a 30, donde el decodificador (200) está configurado para seleccionar coeficientes espectrales, los índices espectrales de los cuales son iguales o se
encuentran dentro de un intervalo alrededor de una pluralidad de índices espectrales derivada sobre la base del valor de espaciamiento, para una decodificación predictiva.
32. El decodificador (200) según la reivindicación 31, donde el decodificador (200) está configurado para establecer una amplitud del intervalo dependiendo del valor de espaciamiento.
33. El decodificador (200) según una de las reivindicaciones 22 a 32, donde la señal de audio codificada (120) comprende el valor de espaciamiento o una versión codificada del mismo, donde el decodificador (200) está configurado para extraer el valor de espaciamiento o la versión codificada del mismo de la señal de audio codificada (120) para obtener el valor de espaciamiento.
34. El decodificador (200) según una de las reivindicaciones 22 a 32, donde el decodificador (200) está configurado para determinar el valor de espaciamiento.
35. El decodificador (200) según la reivindicación 34, donde el decodificador (200) está configurado para determinar una frecuencia fundamental instantánea y para derivar el valor de espaciamiento de la frecuencia fundamental instantánea o una fracción o un múltiplo de la misma.
36 El decodificador (200) según una de las reivindicaciones 22 a 35, donde la señal de audio (102) representada por la señal de audio codificada (120) comprende al menos dos componentes armónicos de la señal (124_1:124_6), donde el decodificador (200) está configurado para aplicar selectivamente la decodificación predictiva a la pluralidad de coeficientes espectrales codificados individuales o grupos de coeficientes espectrales codificados que representan dichos al menos dos componentes armónicos de la señal (124_1:124_6) o entornos espectrales alrededor de dichos al menos dos componentes armónicos de la señal (124_1:124_6) de la señal de audio (102).
37. El decodificador (200) según la reivindicación 36, donde el decodificador (200) está configurado para identificar dichos al menos dos componentes armónicos de la señal (124_1:124_6), y para aplicar de manera selectiva la decodificación predictiva a la pluralidad de coeficientes espectrales codificados individuales o grupos de coeficientes espectrales codificados que está asociada a los componentes armónicos identificados de la señal (124_1:124_6).
38. El decodificador (200) según la reivindicación 36, donde la señal de audio codificada (120) comprende el valor de espaciamiento o una versión codificada del mismo, donde el valor de espaciamiento identifica dichos al menos dos componentes armónicos de la señal (124_1:124_6), donde el decodificador (200) está configurado para aplicar selectivamente la decodificación predictiva a la pluralidad de coeficientes espectrales codificados individuales o grupos de coeficientes espectrales codificados que está asociada a los componentes armónicos identificados de la señal (124_1:124_6).
39. El decodificador (200) según una de las reivindicaciones 36 a 38, donde el decodificador (200) está configurado para no aplicar la decodificación predictiva a la pluralidad de coeficientes espectrales codificados individuales o grupos de coeficientes espectrales codificados que no representan dichos al menos dos componentes armónicos de la señal (124_1:124_6) o entornos espectrales de dichos al menos dos componentes armónicos de la señal (124_1:124_6) de la señal de audio.
40. El decodificador (200) según una de las reivindicaciones 36 a 39, donde el decodificador (200) está configurado para no aplicar la decodificación predictiva a la pluralidad de coeficientes espectrales codificados individuales o grupos de coeficientes espectrales codificados que pertenecen a un ruido de fondo no tonal entre los armónicos de señal (124_1:124_6) de la señal de audio.
41. El decodificador (200) según una de las reivindicaciones 22 a 40, donde la señal de audio codificada (120) incluye el valor de espaciamiento o una versión codificada del mismo, donde el valor de espaciamiento es un valor de espaciamiento de armónicos, donde el valor de espaciamiento de los armónicos indica la pluralidad de coeficientes espectrales codificados individuales o grupos de coeficientes espectrales codificados que representan al menos dos componentes armónicos de la señal (124_1:124_6) de la señal de audio (102).
42. El decodificador (200) según una de las reivindicaciones 22 a 41, donde los coeficientes espectrales son bins espectrales.
43. Procedimiento (300) para codificar una señal de audio en un dominio de transformada o dominio de banco de filtros, comprendiendo el procedimiento:
determinar (302) coeficientes espectrales de la señal de audio para una trama actual y al menos una trama anterior; determinar un valor de espaciamiento; y
aplicar selectivamente (304) codificación predictiva a una pluralidad de coeficientes espectrales individuales o grupos de coeficientes espectrales, donde la pluralidad de coeficientes espectrales individuales o grupos de coeficientes espectrales a los cuales se aplica la codificación predictiva son seleccionados con base en el valor de
espaciamiento;
caracterizado porque el valor de espaciamiento es un valor de espaciamiento armónico que describe un espaciamiento entre los armónicos.
44. Procedimiento (400) para decodificar una señal de audio codificada en un dominio de transformada o dominio de banco de filtros, comprendiendo el procedimiento:
analizar (402) la señal de audio codificada para obtener coeficientes espectrales codificados de la señal de audio para una trama actual y al menos una trama anterior;
obtener un valor de espaciamiento; y
aplicar selectivamente (404) decodificación predictiva a una pluralidad de coeficientes espectrales codificados individuales o grupos de coeficientes espectrales codificados, donde la pluralidad de coeficientes espectrales individuales codificados o grupos de coeficientes espectrales codificados a los cuales se aplica la decodificación predictiva son seleccionados con base en el valor de espaciamiento;
caracterizado porque el valor de espaciamiento es un valor de espaciamiento armónico que describe un espaciamiento entre los armónicos de la señal de audio codificada.
45. Programa informático para llevar a cabo un procedimiento según una de las reivindicaciones 43 a 44.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP15158253 | 2015-03-09 | ||
PCT/EP2015/063658 WO2016142002A1 (en) | 2015-03-09 | 2015-06-17 | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
PCT/EP2016/054831 WO2016142357A1 (en) | 2015-03-09 | 2016-03-07 | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2821025T3 true ES2821025T3 (es) | 2021-04-23 |
Family
ID=52692424
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES18170157T Active ES2972504T3 (es) | 2015-03-09 | 2016-03-07 | Codificador de audio, decodificador de audio, procedimiento para codificar una señal de audio y procedimiento para decodificar una señal de audio codificada |
ES16709331T Active ES2821025T3 (es) | 2015-03-09 | 2016-03-07 | Codificador de audio, decodificador de audio, procedimiento para codificar una señal de audio y procedimiento para decodificar una señal de audio codificada |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES18170157T Active ES2972504T3 (es) | 2015-03-09 | 2016-03-07 | Codificador de audio, decodificador de audio, procedimiento para codificar una señal de audio y procedimiento para decodificar una señal de audio codificada |
Country Status (20)
Country | Link |
---|---|
US (2) | US10600428B2 (es) |
EP (3) | EP3268960B1 (es) |
JP (3) | JP6666356B2 (es) |
KR (1) | KR102151728B1 (es) |
CN (3) | CN114067812A (es) |
AR (6) | AR103890A1 (es) |
AU (4) | AU2016231220B2 (es) |
BR (1) | BR112017019185B1 (es) |
CA (1) | CA2978815C (es) |
ES (2) | ES2972504T3 (es) |
HK (1) | HK1244583A1 (es) |
MX (1) | MX365267B (es) |
MY (1) | MY181486A (es) |
PL (2) | PL3268960T3 (es) |
PT (1) | PT3268960T (es) |
RU (1) | RU2707151C2 (es) |
SG (1) | SG11201707349WA (es) |
TW (1) | TWI613644B (es) |
WO (1) | WO2016142002A1 (es) |
ZA (6) | ZA201706604B (es) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016142002A1 (en) * | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
EP3483883A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
WO2020094263A1 (en) | 2018-11-05 | 2020-05-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and audio signal processor, for providing a processed audio signal representation, audio decoder, audio encoder, methods and computer programs |
CN109473116B (zh) * | 2018-12-12 | 2021-07-20 | 思必驰科技股份有限公司 | 语音编码方法、语音解码方法及装置 |
KR20220104049A (ko) * | 2019-11-27 | 2022-07-25 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 오디오 코딩을 위한 음조 신호의 주파수 도메인 장기 예측을 위한 인코더, 디코더, 인코딩 방법 및 디코딩 방법 |
Family Cites Families (75)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CH572650A5 (es) * | 1972-12-21 | 1976-02-13 | Gretag Ag | |
JPS6031198A (ja) * | 1983-07-29 | 1985-02-16 | 松下電器産業株式会社 | 予測残差信号符号化方法 |
US4885790A (en) * | 1985-03-18 | 1989-12-05 | Massachusetts Institute Of Technology | Processing of acoustic waveforms |
US5787387A (en) * | 1994-07-11 | 1998-07-28 | Voxware, Inc. | Harmonic adaptive speech coding method and system |
JP3680374B2 (ja) * | 1995-09-28 | 2005-08-10 | ソニー株式会社 | 音声合成方法 |
US5781888A (en) * | 1996-01-16 | 1998-07-14 | Lucent Technologies Inc. | Perceptual noise shaping in the time domain via LPC prediction in the frequency domain |
JP2891193B2 (ja) * | 1996-08-16 | 1999-05-17 | 日本電気株式会社 | 広帯域音声スペクトル係数量子化装置 |
US6161089A (en) * | 1997-03-14 | 2000-12-12 | Digital Voice Systems, Inc. | Multi-subframe quantization of spectral parameters |
US6782360B1 (en) * | 1999-09-22 | 2004-08-24 | Mindspeed Technologies, Inc. | Gain quantization for a CELP speech coder |
US6636829B1 (en) * | 1999-09-22 | 2003-10-21 | Mindspeed Technologies, Inc. | Speech communication system and method for handling lost frames |
JP2002162998A (ja) * | 2000-11-28 | 2002-06-07 | Fujitsu Ltd | パケット修復処理を伴なう音声符号化方法 |
EP1304885A3 (de) * | 2001-09-14 | 2005-04-20 | Siemens Aktiengesellschaft | Verfahren und Computerprogrammprodukt zur Codierung und Decodierung von Videosignalen |
WO2003088314A2 (en) * | 2002-04-12 | 2003-10-23 | Arch Specialty Chemicals, Inc. | Remote monitoring system for chemical liquid delivery |
US7634399B2 (en) * | 2003-01-30 | 2009-12-15 | Digital Voice Systems, Inc. | Voice transcoder |
EP1475144A2 (de) * | 2003-05-09 | 2004-11-10 | Pfaudler Werke GmbH | Stromstörer für einen Rührkessel, aufweisend mindestens ein Stromstörelement |
US7688894B2 (en) * | 2003-09-07 | 2010-03-30 | Microsoft Corporation | Scan patterns for interlaced video content |
JP2007506986A (ja) * | 2003-09-17 | 2007-03-22 | 北京阜国数字技術有限公司 | マルチ解像度ベクトル量子化のオーディオcodec方法及びその装置 |
US7356748B2 (en) * | 2003-12-19 | 2008-04-08 | Telefonaktiebolaget Lm Ericsson (Publ) | Partial spectral loss concealment in transform codecs |
TWI277013B (en) * | 2005-02-01 | 2007-03-21 | Ind Tech Res Inst | Method for reducing buffered-frame memory sizes and accesses in a video codec |
US8155965B2 (en) * | 2005-03-11 | 2012-04-10 | Qualcomm Incorporated | Time warping frames inside the vocoder by modifying the residual |
US7885809B2 (en) * | 2005-04-20 | 2011-02-08 | Ntt Docomo, Inc. | Quantization of speech and audio coding parameters using partial information on atypical subsequences |
US7599840B2 (en) * | 2005-07-15 | 2009-10-06 | Microsoft Corporation | Selectively using multiple entropy models in adaptive coding and decoding |
US7684981B2 (en) * | 2005-07-15 | 2010-03-23 | Microsoft Corporation | Prediction of spectral coefficients in waveform coding and decoding |
EP1852849A1 (en) * | 2006-05-05 | 2007-11-07 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream |
KR101365445B1 (ko) * | 2007-01-03 | 2014-02-19 | 삼성전자주식회사 | 전역 및 국부 움직임 보상을 순차적으로 이용하는 움직임보상 방법, 복호화 방법, 장치, 인코더 및 디코더 |
DE102007018484B4 (de) * | 2007-03-20 | 2009-06-25 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Senden einer Folge von Datenpaketen und Decodierer und Vorrichtung zum Decodieren einer Folge von Datenpaketen |
US9653088B2 (en) | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
US7761290B2 (en) * | 2007-06-15 | 2010-07-20 | Microsoft Corporation | Flexible frequency and time partitioning in perceptual transform coding of audio |
US7774205B2 (en) * | 2007-06-15 | 2010-08-10 | Microsoft Corporation | Coding of sparse digital media spectral data |
US8515767B2 (en) * | 2007-11-04 | 2013-08-20 | Qualcomm Incorporated | Technique for encoding/decoding of codebook indices for quantized MDCT spectrum in scalable speech and audio codecs |
BRPI0910285B1 (pt) | 2008-03-03 | 2020-05-12 | Lg Electronics Inc. | Métodos e aparelhos para processamento de sinal de áudio. |
CN101335000B (zh) * | 2008-03-26 | 2010-04-21 | 华为技术有限公司 | 编码的方法及装置 |
CN101552005A (zh) * | 2008-04-03 | 2009-10-07 | 华为技术有限公司 | 编码方法、解码方法、***及装置 |
KR101227729B1 (ko) * | 2008-07-11 | 2013-01-29 | 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 | 샘플 오디오 신호의 프레임을 인코딩하기 위한 오디오 인코더 및 디코더 |
ES2642906T3 (es) * | 2008-07-11 | 2017-11-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador de audio, procedimientos para proporcionar un flujo de audio y programa de ordenador |
EP2346030B1 (en) * | 2008-07-11 | 2014-10-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, method for encoding an audio signal and computer program |
BRPI0910796B1 (pt) * | 2008-07-11 | 2021-07-13 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E. V. | Codificador de áudio e decodificador de áudio |
US8406307B2 (en) * | 2008-08-22 | 2013-03-26 | Microsoft Corporation | Entropy coding/decoding of hierarchically organized data |
WO2010028292A1 (en) * | 2008-09-06 | 2010-03-11 | Huawei Technologies Co., Ltd. | Adaptive frequency prediction |
EP2192786A1 (en) * | 2008-11-27 | 2010-06-02 | Panasonic Corporation | Frequency domain filters for video coding |
EP2380363B1 (en) * | 2009-01-20 | 2015-09-30 | MED-EL Elektromedizinische Geräte GmbH | High accuracy tonotopic and periodic coding with enhanced harmonic resolution |
US8666752B2 (en) * | 2009-03-18 | 2014-03-04 | Samsung Electronics Co., Ltd. | Apparatus and method for encoding and decoding multi-channel signal |
JP4932917B2 (ja) * | 2009-04-03 | 2012-05-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
US8391212B2 (en) * | 2009-05-05 | 2013-03-05 | Huawei Technologies Co., Ltd. | System and method for frequency domain audio post-processing based on perceptual masking |
ES2441069T3 (es) * | 2009-10-08 | 2014-01-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decodificador multimodo para señal de audio, codificador multimodo para señal de audio, procedimiento y programa de computación que usan un modelado de ruido en base a linealidad-predicción-codificación |
MX2012004648A (es) * | 2009-10-20 | 2012-05-29 | Fraunhofer Ges Forschung | Codificacion de señal de audio, decodificador de señal de audio, metodo para codificar o decodificar una señal de audio utilizando una cancelacion del tipo aliasing. |
KR101487687B1 (ko) * | 2010-01-14 | 2015-01-29 | 삼성전자주식회사 | 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치 |
KR101445294B1 (ko) * | 2010-03-10 | 2014-09-29 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 코딩 컨텍스트의 피치 의존 적응을 이용하는 오디오 신호 디코더, 오디오 신호 인코더, 오디오 신호 디코딩 방법, 오디오 신호 인코딩 방법, 및 컴퓨터 프로그램 |
CN101847413B (zh) * | 2010-04-09 | 2011-11-16 | 北京航空航天大学 | 一种使用新型心理声学模型和快速比特分配实现数字音频编码的方法 |
JP5387522B2 (ja) * | 2010-07-01 | 2014-01-15 | コニカミノルタ株式会社 | カラー画像形成装置 |
US8924222B2 (en) | 2010-07-30 | 2014-12-30 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for coding of harmonic signals |
CA2961088C (en) * | 2010-09-16 | 2019-07-02 | Dolby International Ab | Cross product enhanced subband block based harmonic transposition |
ES2600313T3 (es) * | 2010-10-07 | 2017-02-08 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato y método para la estimación de nivel de tramas de audio codificadas en un dominio de flujo de bits |
FR2969805A1 (fr) * | 2010-12-23 | 2012-06-29 | France Telecom | Codage bas retard alternant codage predictif et codage par transformee |
EP2684355B1 (en) * | 2011-03-10 | 2014-11-12 | Telefonaktiebolaget L M Ericsson (PUBL) | Decoding of transforms with curved basis functions |
EP2770503B1 (en) * | 2011-10-21 | 2019-05-29 | Samsung Electronics Co., Ltd. | Method and apparatus for concealing frame errors and method and apparatus for audio decoding |
WO2013093172A1 (en) * | 2011-12-20 | 2013-06-27 | Nokia Corporation | Audio conferencing |
PL2830057T3 (pl) | 2012-05-23 | 2019-01-31 | Nippon Telegraph And Telephone Corporation | Kodowanie sygnału audio |
CN102798870B (zh) * | 2012-08-07 | 2013-09-25 | 中国空间技术研究院 | 一种卫星导航***兼容性分析方法 |
EP3252762B1 (en) * | 2012-10-01 | 2019-01-30 | Nippon Telegraph and Telephone Corporation | Encoding method, encoder, program and recording medium |
EP3176784B1 (en) * | 2013-01-08 | 2020-01-01 | Dolby International AB | Model based prediction in a filterbank |
US9528371B2 (en) * | 2013-02-27 | 2016-12-27 | Evolution Engineering Inc. | Fluid pressure pulse generating apparatus and method of using same |
BR112015025092B1 (pt) * | 2013-04-05 | 2022-01-11 | Dolby International Ab | Sistema de processamento de áudio e método para processar um fluxo de bits de áudio |
CN105408956B (zh) * | 2013-06-21 | 2020-03-27 | 弗朗霍夫应用科学研究促进协会 | 用于获取音频信号的替换帧的频谱系数的方法及相关产品 |
CA2984562C (en) * | 2013-10-31 | 2020-01-14 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Audio decoder and method for providing a decoded audio information using an error concealment based on a time domain excitation signal |
JP6031198B2 (ja) | 2013-11-06 | 2016-11-24 | 株式会社日立製作所 | 信号伝送回路及びプリント基板 |
JP6319753B2 (ja) * | 2013-12-02 | 2018-05-09 | 華為技術有限公司Huawei Technologies Co.,Ltd. | 符号化方法および装置 |
CN104934034B (zh) * | 2014-03-19 | 2016-11-16 | 华为技术有限公司 | 用于信号处理的方法和装置 |
KR20240010550A (ko) * | 2014-03-28 | 2024-01-23 | 삼성전자주식회사 | 선형예측계수 양자화방법 및 장치와 역양자화 방법 및 장치 |
EP2963645A1 (en) * | 2014-07-01 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Calculator and method for determining phase correction data for an audio signal |
JP5723472B1 (ja) * | 2014-08-07 | 2015-05-27 | 廣幸 田中 | データリンク生成装置、データリンク生成方法、データリンク構造および電子ファイル |
US9536509B2 (en) * | 2014-09-25 | 2017-01-03 | Sunhouse Technologies, Inc. | Systems and methods for capturing and interpreting audio |
WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
US20170022149A1 (en) * | 2015-07-25 | 2017-01-26 | Mark Quang Nguyen | Fumarate compounds, pharmaceutical compositions thereof, and methods of use |
KR20220104049A (ko) * | 2019-11-27 | 2022-07-25 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 오디오 코딩을 위한 음조 신호의 주파수 도메인 장기 예측을 위한 인코더, 디코더, 인코딩 방법 및 디코딩 방법 |
-
2015
- 2015-06-17 WO PCT/EP2015/063658 patent/WO2016142002A1/en active Application Filing
-
2016
- 2016-03-07 MY MYPI2017001298A patent/MY181486A/en unknown
- 2016-03-07 SG SG11201707349WA patent/SG11201707349WA/en unknown
- 2016-03-07 CN CN202110984953.6A patent/CN114067812A/zh active Pending
- 2016-03-07 CA CA2978815A patent/CA2978815C/en active Active
- 2016-03-07 BR BR112017019185-7A patent/BR112017019185B1/pt active IP Right Grant
- 2016-03-07 RU RU2017134620A patent/RU2707151C2/ru active
- 2016-03-07 PL PL16709331T patent/PL3268960T3/pl unknown
- 2016-03-07 PL PL18170157.4T patent/PL3373298T3/pl unknown
- 2016-03-07 EP EP16709331.9A patent/EP3268960B1/en active Active
- 2016-03-07 JP JP2017546946A patent/JP6666356B2/ja active Active
- 2016-03-07 CN CN201680015022.2A patent/CN107533847B/zh active Active
- 2016-03-07 EP EP18170157.4A patent/EP3373298B1/en active Active
- 2016-03-07 CN CN202110984955.5A patent/CN114067813A/zh active Pending
- 2016-03-07 MX MX2017011494A patent/MX365267B/es active IP Right Grant
- 2016-03-07 AU AU2016231220A patent/AU2016231220B2/en active Active
- 2016-03-07 ES ES18170157T patent/ES2972504T3/es active Active
- 2016-03-07 PT PT167093319T patent/PT3268960T/pt unknown
- 2016-03-07 ES ES16709331T patent/ES2821025T3/es active Active
- 2016-03-07 KR KR1020177028551A patent/KR102151728B1/ko active IP Right Grant
- 2016-03-07 EP EP23209483.9A patent/EP4297027A3/en active Pending
- 2016-03-08 TW TW105107024A patent/TWI613644B/zh active
- 2016-03-09 AR ARP160100621A patent/AR103890A1/es active IP Right Grant
-
2017
- 2017-09-06 US US15/697,042 patent/US10600428B2/en active Active
- 2017-10-02 ZA ZA2017/06604A patent/ZA201706604B/en unknown
-
2018
- 2018-03-06 HK HK18103159.1A patent/HK1244583A1/zh unknown
-
2019
- 2019-05-06 AU AU2019203173A patent/AU2019203173B2/en active Active
- 2019-11-01 JP JP2019200326A patent/JP7078592B2/ja active Active
-
2020
- 2020-02-26 US US16/802,397 patent/US20200227058A1/en active Pending
-
2021
- 2021-05-31 AR ARP210101476A patent/AR122219A2/es unknown
- 2021-05-31 AR ARP210101478A patent/AR122487A2/es unknown
- 2021-05-31 AR ARP210101479A patent/AR122488A2/es unknown
- 2021-05-31 AR ARP210101480A patent/AR122489A2/es unknown
- 2021-05-31 AR ARP210101477A patent/AR122486A2/es unknown
- 2021-08-13 AU AU2021215252A patent/AU2021215252B2/en active Active
-
2022
- 2022-04-29 ZA ZA2022/04764A patent/ZA202204764B/en unknown
- 2022-04-29 ZA ZA2022/04765A patent/ZA202204765B/en unknown
- 2022-04-29 ZA ZA2022/04766A patent/ZA202204766B/en unknown
- 2022-04-29 ZA ZA2022/04767A patent/ZA202204767B/en unknown
- 2022-04-29 ZA ZA2022/04768A patent/ZA202204768B/en unknown
- 2022-05-19 JP JP2022082087A patent/JP2022110116A/ja active Pending
-
2023
- 2023-10-05 AU AU2023241343A patent/AU2023241343A1/en active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2821025T3 (es) | Codificador de audio, decodificador de audio, procedimiento para codificar una señal de audio y procedimiento para decodificar una señal de audio codificada | |
JP6744363B2 (ja) | スペクトルエンベロープのサンプル値のコンテキストベースエントロピー復号化器、パラメトリック復号化器、コンテキストベースエントロピー符号化器、復号化方法、符号化方法およびコンピュータプログラム | |
ES2660392T3 (es) | Codificación de coeficientes espectrales de un espectro de una señal de audio | |
JP2019509511A (ja) | マルチチャネル符号化におけるステレオ充填装置及び方法 | |
ES2650549T3 (es) | Relleno de ruido en codificación de audio multicanal | |
TWI559294B (zh) | 支援轉換長度切換的頻率域音源編碼器、解碼器、編碼方法、解碼方法及電腦程式 | |
RU2740148C1 (ru) | Оконная функция анализа/синтеза для модулированного преобразования с перекрытием | |
ES2911515T3 (es) | Codificación de audio | |
WO2016142357A1 (en) | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |