ES2823250T3 - Aparato de codificación de señal de audio, dispositivo de decodificación de señal de audio y métodos del mismo - Google Patents

Aparato de codificación de señal de audio, dispositivo de decodificación de señal de audio y métodos del mismo Download PDF

Info

Publication number
ES2823250T3
ES2823250T3 ES18186595T ES18186595T ES2823250T3 ES 2823250 T3 ES2823250 T3 ES 2823250T3 ES 18186595 T ES18186595 T ES 18186595T ES 18186595 T ES18186595 T ES 18186595T ES 2823250 T3 ES2823250 T3 ES 2823250T3
Authority
ES
Spain
Prior art keywords
subband
bits
subbands
quantizer
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES18186595T
Other languages
English (en)
Inventor
Takuya Kawashima
Hiroyuki Ehara
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2823250T3 publication Critical patent/ES2823250T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Un aparato de codificación de señal de audio, que comprende: un transformador de tiempo-frecuencia (101) que genera un espectro que comprende realizar una transformada en una señal de audio de entrada en un dominio de frecuencia, divide el espectro en una pluralidad de subbandas, que son bandas de frecuencia predeterminadas y emite muestras espectrales de subbanda; un cuantificador de energía de subbanda (102) que obtiene, para cada una de la pluralidad de subbandas, una energía de subbanda cuantificada; un calculador de tonalidad (103) que analiza una tonalidad de las muestras espectrales de subbanda y emite un resultado de análisis; un asignador de bits (104) que selecciona una segunda subbanda en la que se realiza cuantificación por un segundo cuantificador (107) de entre la pluralidad de subbandas basándose en el resultado de análisis de la tonalidad y la energía de subbanda cuantificada, y determina un primer número de bits para asignarse a una primera subbanda, entre la pluralidad de subbandas, en la que se realiza cuantificación por un primer cuantificador (106); y un multiplexor (108) que multiplexa información emitida desde el primer cuantificador y desde el segundo cuantificador, la energía de subbanda cuantificada y el resultado de análisis de la tonalidad, y emite la información multiplexada, en el que el primer cuantificador codifica una muestra espectral de subbanda entre las muestras espectrales de subbanda que están incluidas en la primera subbanda por un primer método de codificación usando el primer número de bits, y el segundo cuantificador codifica una muestra espectral de subbanda entre las muestras espectrales de subbanda que están incluidas en la segunda subbanda por un segundo método de codificación para obtener la información codificada emitida desde el segundo cuantificador, en el que el segundo método de codificación está configurado para calcular información de retardo para la segunda subbanda.

Description

DESCRIPCIÓN
Aparato de codificación de señal de audio, dispositivo de decodificación de señal de audio y métodos del mismo
Campo de la invención
La presente divulgación se refiere a una técnica de codificación y a una técnica de decodificación para mejorar la calidad de audio de señales de audio, tal como señales de voz y señales de música.
Antecedentes de la técnica
Una técnica de codificación para comprimir señales de audio a una baja tasa de bits es una técnica esencial para llevar a cabo el uso efectivo de ondas de radio y así sucesivamente en comunicación móvil. Mientras tanto, ha habido recientemente un deseo cada vez mayor de mejorar la calidad de audio en comunicación telefónica y se anticipa una implementación de servicios de comunicación por teléfono que produce una sensación mayor de presencia. Para implementar tales servicios, es necesario codificar señales de audio que tienen una banda de frecuencia amplia a una alta tasa de bits. No obstante, este enfoque entra en conflicto con el uso eficaz de las ondas de radio y las bandas de frecuencia.
Por ejemplo, ahora se estudia una técnica de codificación de señal de audio adoptada por la norma G.719 (NPL 1).
En la norma G.719, ante la codificación de una señal de audio, se realiza una transformada de frecuencia sobre la señal de audio, y los bits predeterminados se asignan a un espectro obtenido como resultado de la transformada de frecuencia. Específicamente, el espectro se divide en subbandas que tienen anchos de banda de frecuencia predeterminados, y una unidad (una unidad que tiene un número necesario de bits) utilizada en cuantificación basándose en la cuantificación del vector de malla se asigna a cada una de las subbandas en orden decreciente de energía, como sigue.
(1) Una unidad se asigna a una subbanda que tiene la energía más grande entre la totalidad de las subbandas.
Se asigna un bit por espectro. Por lo tanto, si el número de muestras espectrales en una subbanda es ocho, por ejemplo, una unidad contiene ocho bits (obsérvese que el número máximo de bits que se pueden asignar por espectro son nueve bits, y por lo tanto, si el número de muestras espectrales en una subtrama es ocho, se pueden asignar hasta 72 bits).
(2) La energía de subbanda cuantificada de la subbanda a la cual se ha asignado una unidad se disminuye en dos niveles (6 dB). Si el número de bits asignados a la subbanda a la cual se ha asignado una unidad que supera el valor máximo (nueve bits), la subbanda se excluye de la cuantificación en los bucles sucesivos.
(3) De regreso a (1) anterior, se repite el mismo proceso.
La figura 6 ilustra la energía de subbanda de cada subbanda. El eje horizontal representa la frecuencia y el eje vertical representa la amplitud en una escala logarítmica. En la figura, la energía de la subbanda de cada subbanda se representa por una línea horizontal en lugar de un punto. La longitud de cada línea horizontal representa el ancho de banda de frecuencia de cada subbanda.
La figura 7 y la figura 8 son diagramas que ilustran ejemplos de los resultados de asignación de bits a cada subbanda en un caso de uso de un método de codificación especificado en la norma G.719. En las figuras, el eje horizontal representa la frecuencia y el eje vertical representa el número asignado de bits. La figura 7 ilustra un caso de una tasa de bits de 128 kbit/s, y la figura 8 ilustra un caso de una tasa de bits de 64 kbit/s.
En el caso de 128 kbit/s, está disponible para asignación un presupuesto de bits abundante y por lo tanto pueden asignarse nueve bits, que es el valor máximo, a una gran cantidad de subbandas (espectro) y puede mantenerse la calidad de señales de audio a un alto nivel.
En contraste, en el caso de 64 kbit/s, a ninguna subbanda se le asignan nueve bits, que es el valor máximo, sino que a cada subbanda se le asignan algunos bits. En consecuencia, se considera que esta degradación en la calidad de las señales de audio se puede suprimir y se puede llevar a cabo un uso eficaz de las ondas de radio y las bandas de frecuencia.
Lista de citas
Bibliografía de patente
PTL 1: Publicación de solicitud de patente no examinada Japonesa (traducción de la solicitud PCT) N° 2013- 534328
PTL 2: Publicación internacional N.° 2005/027095
Bibliografía no de patente
NPL 1: ITU-T norma G.719, 2008
Sumario de la invención
No obstante, el uso eficaz de ondas de radio y bandas de frecuencia necesita fomentarse adicionalmente. En este punto, en un caso de codificación de una señal de audio que tiene una frecuencia de muestreo de aproximadamente 32 kHz a una tasa de bits baja 20 kpbs/s o menos mediante la utilización del método anteriormente descrito adoptado por la norma G.719, no es posible reservar una unidad (un número de bits) utilizados en la cuantificación de todas las subbandas, lo cual es un problema.
La figura 9 es un diagrama que ilustra un ejemplo del resultado de asignación de bits a cada subbanda en un caso de uso del método de codificación especificado en la norma G.719 a 20 kbit/s. Como se ilustra, la asignación de bits falla no solo en un intervalo de alta frecuencia sino también, dependiendo de la situación, en un intervalo de baja frecuencia, lo cual es esencial para escuchar. En consecuencia, no es posible la codificación de espectros en las subbandas correspondientes, lo que da como resultado degradación significativa en la calidad de las señales de audio.
Para resolver un problema de este tipo, puede emplearse un método para cambiar dinámicamente un método de asignación de bits (publicación de solicitud de patente sin examinar japonesa (traducción de la solicitud PCT) n.° 2013­ 534328).
No obstante, el método de asignación de bits se cambia mientras se utiliza un método de codificación único (método de cuantificación) sin cambiar el método de codificación (método de cuantificación), y por lo tanto, este enfoque a la degradación en la calidad de las señales de audio tiene un efecto limitado.
El documento JP H07336233 da a conocer un método y un dispositivo para codificar o decodificar información. Un circuito de conversión convierte la señal de entrada de uno de los múltiples canales en componentes de frecuencia que se separan en componentes tonales y componentes de ruido en un circuito de separación de componentes de señal. Los componentes tonales y los componentes de ruido se codifican por un circuito de codificación de componentes tonales y un circuito de codificación de componentes de ruido, respectivamente. La cantidad de bytes asignados a los componentes de ruido en los respectivos canales se determina por un circuito de asignación de bytes basado en cambios de tiempo de la suma de los factores de escala de los respectivos canales.
El objeto de la presente invención se consigue mediante las reivindicaciones independientes. Se definen realizaciones específicas en las reivindicaciones dependientes.
La presente divulgación proporciona una técnica de codificación y una técnica de decodificación para realizar señales de audio de alta calidad y al mismo tiempo reducir la tasa de bits global
Obsérvese que las realizaciones generales o específicas se pueden implementar como un sistema, un método, un circuito integrado o un programa informático o cualquier combinación selectiva de un sistema, un aparato, un método, un circuito integrado y un programa informático.
Con el aparato de codificación, el aparato de decodificación y así sucesivamente, de acuerdo con la presente divulgación, es posible codificar y decodificar señales de audio de alta calidad y al mismo tiempo reducir la tasa de bits global.
Breve descripción de los dibujos
[Fig. 1] La figura 1 es un diagrama de bloques de un aparato de codificación de acuerdo con una primera realización de la presente divulgación.
[Fig. 2] La figura 2 es un diagrama de bloques detallado de un asignador de bits del aparato de codificación de acuerdo con la primera realización de la presente divulgación.
[Fig. 3] La figura 3 es un diagrama para describir una operación realizada por el aparato de codificación de acuerdo con la primera realización de la presente divulgación.
[Fig. 4] La figura 4 es un diagrama de bloques de un aparato de decodificación de acuerdo con una segunda realización de la presente divulgación.
[Fig. 5] La figura 5 es un diagrama de bloques detallado de un asignador de bits del aparato de decodificación de acuerdo con la segunda realización de la presente divulgación.
[Fig. 6] La figura 6 es un diagrama para describir la energía de subbanda en un aparato de codificación de acuerdo con la técnica relacionada.
[Fig. 7] La figura 7 es un diagrama para describir el resultado de asignación de bits a subbandas en un aparato de codificación de acuerdo con la técnica relacionada.
[Fig. 8] La figura 8 es un diagrama para describir el resultado de asignación de bits de las subbandas en un aparato de codificación de acuerdo con la técnica relacionada.
[Fig. 9] La figura 9 es un diagrama para describir el resultado de asignación de bits a subbandas en un aparato de codificación de acuerdo con la técnica relacionada.
Descripción de las realizaciones
En lo sucesivo se describirán configuraciones y operaciones de realizaciones de la presente divulgación con referencia a los dibujos. Las señales de audio, las cuales son señales de entrada a un aparato de codificación de la presente divulgación y señales de salida desde un aparato de decodificación de la presente divulgación, incluyen conceptualmente señales de voz, señales de música que tienen una banda más amplia y señales en las cuales estos tipos de señales se mezclan.
En la presente divulgación, las “señales de audio de entrada” incluyen conceptualmente señales de música, señales de voz y señales en las cuales se mezclan ambos tipos de señales. El término “energía de subbanda cuantificada” significa energía obtenida cuantificando energía de una subbanda, la cual es la suma o promedio de la energía de los espectros de subbanda en una subbanda, y la energía de una subbanda se puede obtener al calcular el cuadrado de la suma de los espectros de subbanda en la subbanda, por ejemplo. El término “tonalidad” significa el grado en el cual se produce el pico espectral en un componente de frecuencia específico y el resultado de análisis de la tonalidad se puede representar por un valor numérico, una codificación o similar. El término “codificación de pulso” significa codificación en la cual el espectro está representado aproximadamente utilizando pulsos.
La expresión “relativamente bajo” significa un caso que es menor como resultado de una comprensión entre subbandas y corresponde a un caso que es menor que el promedio de todas las subbandas o un caso que es menor que un valor predeterminado. La expresión “subbanda en un intervalo de frecuencia alto” significa una subbanda que está colocada más cercana a un lado de alta frecuencia entre una pluralidad de subbandas.
Obsérvese que un primer cuantificador (espectro), un segundo cuantificador (espectro), un primer decodificador (espectro), un segundo decodificador (espectro), una primera subbanda, una segunda subbanda, una tercera subbanda, una cuarta subbanda, un primer número de bits, un segundo número de bits, un tercer número de bits y un cuarto número de bits descritos en las realizaciones y en las reivindicaciones se distinguen entre sí para representar no el orden de los mismos sino sus categorías.
(Primera realización)
La figura 1 es un diagrama de bloques que ilustra una configuración y una operación de un aparato de codificación de señal de audio 100 de acuerdo con una primera realización. El aparato de codificación de señal de audio 100 ilustrado en la figura 1 incluye un transformador de tiempo-frecuencia 101, un cuantificador de energía de subbanda 102, un calculador de tonalidad 103, un asignador de bits 104, un normalizador 105, un primer cuantificador de espectro 106, un segundo cuantificador de espectro 107 y un multiplexor 108. Al multiplexor 108 está conectada una antena A. El aparato de codificación de señal de audio 100 y la antena A juntos constituyen un aparato terminal o un aparato de estación de base.
El transformador de tiempo-frecuencia 101 realiza una transformada sobre una señal de audio de entrada en un dominio de tiempo en un dominio de frecuencia y genera un espectro de señal de audio de entrada (a continuación denominado como “espectro”). La transformada tiempo frecuencia se realiza utilizando MDCT (transformada de coseno discreta modificada), por ejemplo, pero no está limitada a esta transformada. La transformada de tiempofrecuencia se puede realizar utilizando DCT (transformada de coseno discreta), DFT (transformada de Fourier discreta) o transformada de Fourier, por ejemplo.
El transformador de tiempo-frecuencia 101 divide el espectro en subbandas que son bandas de frecuencia predeterminadas. Las bandas de frecuencia predeterminadas pueden estar separadas en intervalos iguales o pueden estar separadas en intervalos diferentes, específicamente, en intervalos largos en un intervalo de alta frecuencia y en intervalos cortos en un intervalo de baja frecuencia, por ejemplo.
El transformador de tiempo-frecuencia 101 emite espectros obtenidos por división en las subbandas al cuantificador de energía de subbanda 102, al calculador de tonalidad 103 y al normalizador 105 como espectros de subbanda.
El cuantificador de energía de subbanda 102 obtiene, para cada subbanda, energía de subbanda, que es energía del espectro de subbanda, cuantifica la energía de subbanda y obtiene la energía de subbanda cuantificada. Específicamente, la energía de subbanda se puede obtener al calcular la suma cuadrada de los espectros de subbanda en la subbanda; no obstante, el cálculo no se limita a esto. La energía de subbanda se puede obtener al realizar integración de las amplitudes de espectros de subbanda para cada subbanda, por ejemplo. En un caso de promediado de la energía de subbanda, la suma cuadrada se divide entre el número de espectros (anchura de subbanda) en la subbanda. La energía de subbanda obtenida de esta manera se cuantifica de acuerdo con una anchura de paso predeterminada.
El cuantificador de energía de subbanda 102 emite la energía de subbanda cuantificada obtenida al normalizador 105 y al asignador de bits 104 y emite la energía de subbanda cuantificada codificada obtenida por codificación de la energía de subbanda cuantificada al multiplexor 108.
El calculador de tonalidad 103 analiza los espectros de subbanda incluidos en cada subbanda y determina la tonalidad de la subbanda. La tonalidad es el grado al cual se produce el pico espectral en un componente de frecuencia específico e incluye conceptualmente la presentación de picos, lo que significa que está presente un pico perceptible. La tonalidad se puede obtener cuantitativamente al calcular la relación entre la amplitud del espectro promedio en una subbanda objetivo y la amplitud del espectro máximo presente en la subbanda, por ejemplo. Se define que los espectros de la subbanda tienen tonalidad (presentación de picos) si el valor obtenido supera un umbral predeterminado. En esta realización, el calculador de tonalidad 103 genera una bandera con picos/tonal establecida a uno si el valor obtenido supera del valor predeterminado o genera una bandera con picos/tonal establecida a cero si el valor obtenido es igual o menor que un umbral predeterminado y emite la bandera con picos/tonal al asignador de bits 104 y al multiplexor 108 como resultado de análisis. El calculador de tonalidad 103 puede transmitir como resultado de análisis la relación anteriormente descrita tal cual.
El calculador de tonalidad es eficaz como sigue.
Bajo una condición de baja velocidad de bits, para cuantificar eficazmente un espectro en el que la energía espectral se distribuye a través de una subbanda, tal como un espectro similar a ruido, es efectivo un método basado en un filtro de tono (esto es, un método en el que un espectro de intervalo de alta frecuencia se expresa utilizando un espectro de intervalo de baja frecuencia). Por lo tanto, el grado de distribución de energía dentro de una subbanda se determina a partir de la medida de la presentación de picos/tonalidad (la relación entre la potencia pico y la potencia promedio o similar) del espectro en la subbanda, y si la presentación de picos/tonalidad del espectro no es alta, la subbanda se somete a cuantificación basándose en un filtro de tono.
El asignador de bits 104 hace referencia a la energía de subbanda cuantificada y a la bandera con picos/tonal de cada subbanda y asigna bits a partir de un presupuesto de bits, el cual corresponde al número total de bits disponibles para codificación, al espectro de subbanda en cada subbanda. Específicamente, el asignador de bits 104 calcula y determina un primer número de bits, el cual es el número de bits que van a asignarse a las primeras subbandas, las cuales son subbandas en las que se realiza cuantificación por el primer cuantificador de espectro, y emite el resultado al primer cuantificador de espectro 106 como información de bits asignada. Además, el asignador de bits 104 selecciona e identifica segundas subbandas, que son subbandas en las que se realiza cuantificación por el segundo cuantificador de espectro 107, y emite el resultado al segundo cuantificador de espectro 107 como un modo de cuantificación.
La configuración y operación del asignador de bits 104 se describen en detalle a continuación.
Obsérvese que, en esta realización, el asignador de bits 104 hace referencia a la bandera con picos/tonal y la energía de subbanda cuantificada de cada subbanda en este orden; no obstante, el orden de referencia puede ser cualquier orden.
Con respecto a las segundas subbandas, las cuales se someten a cuantificación por el segundo cuantificador de espectro 107, las subbandas en la banda completa pueden ser segundas subbandas candidatas. En general, una banda que tiene una energía de subbanda cuantificada baja y una banda que tiene una tonalidad baja están presentes principalmente en un intervalo de alta frecuencia y por lo tanto únicamente las subbandas presentes en un intervalo de alta frecuencia específico pueden tenerse como objetivo. Por ejemplo, únicamente pueden tenerse como objetivo cuatro o cinco subbandas en un intervalo de alta frecuencia.
Una señal de audio normalmente tiene una tonalidad alta en un intervalo de baja frecuencia y una tonalidad baja en el intervalo de alta frecuencia y por lo tanto las subbandas en un intervalo de alta frecuencia se someten sustancialmente a cuantificación basándose en un filtro de tono. En consecuencia, se puede utilizar un método alternativo en el cual todas las subbandas, en un intervalo de frecuencia superior a una subbanda seleccionada basándose en la tonalidad se pueden someter a cuantificación basándose en un filtro de tono y únicamente los números de subbanda pueden transmitirse como el modo de cuantificación.
En normalizador 105 normaliza (divide) cada espectro de subbanda por la energía de subbanda cuantificada de entrada para generar un espectro de subbanda normalizado. Como resultado, se normaliza la diferencia en la magnitud de la amplitud entre las subbandas. El normalizador 105 emite el espectro de subbanda normalizado al primer cuantificador de espectro 106 y al segundo cuantificador de espectro 107.
Obsérvese que el normalizador 105 puede tener cualquier configuración.
Aunque el normalizador 105 está configurado como un componente en esta realización, el normalizador 105 se puede proporcionar en la etapa anterior del primer cuantificador de espectro 106 y en la etapa anterior del segundo cuantificador de espectro 107, esto es, se pueden configurar como dos componentes.
El primer cuantificador de espectro 106 es un ejemplo de un primer cuantificador y cuantifica espectros de subbanda que pertenecen a las primeras subbandas sobre las cuales se va a realizar cuantificación por el primer cuantificador de espectro 106 entre los espectros de subbanda normalizados de entrada mediante la utilización del primer número de bits asignados por el asignador de bits 104. El primer cuantificador de espectro 106 emite el resultado de cuantificación al segundo cuantificador de espectro 107 como espectros cuantificados y emite la primera información codificada obtenida por codificación de los espectros cuantificados al multiplexor 108.
El primer cuantificador de espectro 106 utiliza un codificador de pulsos. Los ejemplos del codificador de pulsos incluyen un cuantificador de vector de malla que realiza cuantificación de vector de malla y un codificador de pulsos que realiza codificación de pulsos en el cual un espectro de subbanda está representado aproximadamente por un número pequeño de pulsos. Esto es, cualquier cuantificador se puede utilizar en la medida en que el cuantificador emplee un método de cuantificación adecuado para cuantificación de un espectro que tenga una tonalidad alta o un método de cuantificación que utilice un número pequeño de pulsos.
Obsérvese que, a una tasa de bits extremadamente baja, se puede esperar un efecto superior de mantenimiento de calidad de audio con cuantificación utilizando codificación de pulso en la cual el espectro de subbanda está representado aproximadamente por un número pequeño de pulsos en comparación con la cuantificación de vector de malla.
El segundo cuantificador de espectro 107 es un ejemplo de un segundo cuantificador y puede emplear un método de cuantificación utilizando una banda extendida (modelo de predicción utilizando un filtro de tono) como se describe a continuación, por ejemplo.
En este punto, un filtro de tono es un bloque de procesamiento que realiza un procedimiento representado por la expresión 1 a continuación.
[E xpresión m atem ática 1)
y[¡] = x[¡] B * y[¡ - T]
En general, un filtro de tono hace referencia a un filtro que enfatiza un ciclo de tono (T) para una señal en un eje de tiempo (enfatiza un componente de tono sobre un eje de frecuencia) y es, por ejemplo, un filtro digital representado por la expresión 1 para una señal discontinua x[i] si el número de derivaciones es uno. No obstante, un filtro de tono en esta realización se define como un bloque de procesamiento que realiza un procedimiento representado por la expresión 1 y no necesariamente realiza el tono enfatizado sobre una señal en el eje de tiempo.
En esta realización, el filtro de tono (bloque de procesamiento representado por la expresión 1) se aplica a una secuencia de coeficiente MDCT de cuantificación Mq[i]. Específicamente, la expresión 1, los ajustes, específicamente x[i] = 0 (i > K, donde K es el límite de frecuencia inferior del coeficiente MDCt que se somete a codificación) y se realiza y[i] = Mq[i] (i < K), y se calcula y[i](K < I < K', donde K' es el límite de frecuencia superior del coeficiente MDCT que se somete a codificación). Se codifica un valor T con el que se minimiza el error entre el coeficiente MDCT, Mt[i] que se somete a codificación y el valor y[i] calculado como información de retardo. Tal codificación de espectro basada en un filtro de tono se describe por PTL 2, por ejemplo.
El segundo cuantificador de espectro 107 hace referencia a un modo de cuantificación e identifica las segundas subbandas (espectros de subbandas normalizados) sobre las cuales se va a realizar la cuantificación por el segundo cuantificador de espectro 107. Como resultado, se identifican los valores de K y K' anteriormente descritas. Después, la subbanda o la banda de un espectro cuantificado para el cual el espectro de subbanda normalizado (que corresponde a Mt[i] anteriormente descrito, donde K < i < K') en relación a las segundas subbandas identificadas (una frecuencia que varía de K a K') tiene la correlación máxima con un espectro cuantificado (que corresponde a Mq[i] anteriormente descrito, donde i < K) que es lo que se busca, y la posición de la subbanda o la banda se utiliza para generar información de retardo (que corresponde a T anteriormente descrita). Los ejemplos de la información de retardo incluyen la posición absoluta o la posición relativa de la subbanda o la banda, o el número de subbanda. El segundo cuantificador de espectro 107 codifica y emite la información de retardo al multiplexor 108 como segunda información codificada.
Obsérvese que, en esta realización, la energía de la subbanda cuantificada codificada se multiplexa y transmite por el multiplexor 108 y se puede generar una ganancia por un decodificador. Por lo tanto, una ganancia no está codificada. No obstante, una ganancia puede codificarse y transmitirse. En este caso, se calcula una ganancia entre las segundas subbandas sobre las cuales se va a realizar la cuantificación y la subbanda de un espectro cuantificado que tiene la correlación máxima y el segundo cuantificador de espectro 107 codifica y emite la información de retardo y la ganancia al multiplexor 108 como la segunda información codificada.
Obsérvese que, en general, el ancho de banda de una subbanda en un intervalo de alta frecuencia se establece más amplio que una subbanda en un intervalo de baja frecuencia. No obstante, algunas subbandas en un intervalo de baja frecuencia sometidas a copiado tienen baja energía y pueden no estar sometidas a cuantificación de vector de malla. En este caso, tales subbandas puede suponerse que son espectros cero o se puede agregar ruido para evitar cambio espectral repentino entre subbandas.
El multiplexor 108 multiplexa y emite la energía de subbanda cuantificada, la primera información codificada, la segunda información codificada y las banderas con picos/tonales a la antena A como información codificada.
La antena A transmite la información codificada a un aparato de decodificación de señal de audio. La información codificada alcanza al aparato de decodificación de señal de audio por medio de diversos nodos y estaciones base.
Ahora, el asignador de bits 104 se describirá con detalle a continuación.
La figura 2 es un diagrama de bloques que ilustra una configuración detallada y una operación del asignador de bits 104 del aparato de codificación de señal de audio 100 de acuerdo con la primera realización. El asignador de bits 104 que se ilustra en la figura 2 incluye un reservador de bits 111, un reservador de bits 112, un calculador de asignación de bits 113 y un determinador de modo de cuantificación 114.
El reservador de bits 111 hace referencia a las banderas con picos/tonales que se transmiten desde el calculador de tonalidad 103 y reserva un número de bits necesarios para segunda cuantificación de espectro realizada por el segundo cuantificador de espectro 107 si cualquiera de las banderas con picos/tonales se establece a cero.
En esta realización, se reserva un número de bits necesarios para codificar información de retardo basándose en filtro de tono. El número reservado de bits se excluyen del presupuesto de bits, el cual corresponde al número total de bits disponibles para cuantificación y el presupuesto de bits restante se emite al reservador de bits 112. Obsérvese que el presupuesto de bits se suministra por el cuantificador de energía de subbanda 102, lo que significa que los bits que permanecen después de excluir el número de bits necesarios para codificación variable de energía de subbanda cuantificada están disponibles para el primer cuantificador de espectro 106, para el segundo cuantificador de espectro 107 y para cuantificación (codificación) de las banderas con picos/tonales. El cuantificador de energía de subbanda 102 no necesariamente genera información acerca del presupuesto de bits.
El reservador de bits 112 reserva un número de bits utilizados para las banderas con picos/tonales. En la primera realización, las banderas con picos/tonales se transmiten mediante la utilización de cinco subbandas en un intervalo de alta frecuencia y por lo tanto, el reservador de bits 112 reserva cinco bits, por ejemplo.
El reservador de bits 112 emite, al calculador de asignación de bits 113, el cual es un asignador de bits adaptable, un número de bits que permanecen después de excluir el número de bits reservados por el reservador de bits 112 del presupuesto de bits introducido desde el reservador de bits 111. La suma del número de bits reservados por el reservador de bits 111 y el número de bits reservados por el reservador de bits 112 corresponde a un tercer número de bits. Una subbanda para la cual el indicador con picos/tonal se establece en cero, corresponde a una tercera subbanda.
Obsérvese que el orden del reservador de bits 111 y el reservador de bits 112 puede cambiarse. En esta realización, el reservador de bits 111 y el reservador de bits 112 son bloques separados; no obstante, las operaciones de estos reservadores se pueden realizar simultáneamente en un solo bloque. Como alternativa, las operaciones se pueden realizar dentro del calculador de asignación de bits 113.
El calculador de asignación de bits 113 calcula una asignación de bits a una subbanda sobre la cual se realiza cuantificación por el primer cuantificador de espectro 106. Específicamente, el calculador de asignación de bits 113 asigna en primer lugar el número de bits emitidos desde el reservador de bits 112 a cada subbanda mientras hace referencia a la energía de subbanda cuantificada. La asignación se realiza con un método descrito en la sección de la técnica relacionada en la cual se realiza la determinación con respecto a si una subbanda es esencial para escuchar, basándose en la magnitud de la energía de subbanda cuantificada, una subbanda que se determina que es esencial se le proporciona prioridad, y se realiza asignación de bits sobre la subbanda. Como resultado, no se asignan bits a una subbanda que tiene una energía de subbanda cuantificada igual a cero, menor que cero o menor que un valor predeterminado.
Tras la asignación, el calculador de asignación de bits 113 hace referencia a las banderas con picos/tonales de entrada y excluye subbandas (terceras subbandas) a partir de las cuales las banderas con picos/tonales se establecen a cero a partir de la asignación de bits. Esto es, el calculador de asignación de bits 113 identifica únicamente subbandas que tienen presentación de picos alta (subbandas para las cuales las banderas con picos/tonales se establecen en uno) para que sean subbandas objetivo para asignación de bits y asigna bits a las subbandas. El calculador de asignación de bits 113 identifica las subbandas (primeras subbandas) a las cuales van a asignarse los bits, crea información de bits asignada que indica el número de bits que van a asignarse a las subbandas y emite la información al determinador de modo de cuantificación 114 en primer lugar.
El determinador de modo de cuantificación 114 recibe la información de bits asignada o transmitida desde el calculador de asignación de bits 113 y las banderas con picos/tonales. En un caso donde está presente una subbanda en un intervalo de alta frecuencia que tiene una tonalidad alta (que se somete a cuantificación por el primer cuantificador de espectro 106) y a la que no se le ha asignado bit, el determinador de modo de cuantificación 114 redefine la subbanda como una subbanda (cuarta subbanda) sobre la cual se realiza la cuantificación por el segundo cuantificador de espectro 107 y emite un número de bits (cuarto número de bits) necesario para cuantificación por el segundo cuantificador de espectro al calculador de asignación de bits 113 para restar el número de bits de la información de bit asignada. Esto es, el determinador de modo de cuantificación 114 asigna el número de bits necesarios para cuantificación por el segundo cuantificador de espectro 107 a la banda de interés y emite el número de bits asignados (cuarto número de bits). De manera alternativa, el determinador de modo de cuantificación 114 puede restar el número de bits asignados a partir del presupuesto de bits disponible al primer cuantificador de espectro 106 y emitir el resultado al calculador de asignación de bits 113.
El determinador de modo de cuantificación 114 identifica subbandas sobre las cuales se realiza cuantificación por el segundo cuantificador de espectro 107 y emite el resultado al segundo cuantificador de espectro 107 como un modo de cuantificación. Específicamente, el determinador de modo de cuantificación 114 especifica subbandas (terceras subbandas) en un intervalo de alta frecuencia que tienen una baja tonalidad (para las cuales las banderas con picos/tonales se establecen a cero) y subbandas (cuartas subbandas) en un intervalo de alta frecuencia a las cuales no se les han asignado bit como subbandas (segundas subbandas) sobre las cuales se realiza cuantificación por el segundo cuantificador de espectro 107 y emite las subbandas como un modo de cuantificación.
De nuevo, el calculador de asignación de bits 113 actualiza el presupuesto de bits al restar el número de bits (cuarto número de bits) recibidos del determinador de modo de cuantificación 114 a partir del número de bits (presupuesto de bits) introducido desde el reservador de bits 112 y vuelve a calcular la asignación de bits a una subbanda sobre la cual se realiza la cuantificación por el primer cuantificador de espectro 106. En un caso de recibir el presupuesto de bits actualizado a partir del determinador de modo de cuantificación, el calculador de asignación de bits 113 vuelve a calcular la asignación de bits a una subbanda sobre la cual se realiza la cuantificación por el primer cuantificador de espectro 106 mediante la utilización del presupuesto de bits actualizado. En consecuencia, el primer número de bits es igual a un valor obtenido al restar el tercer número de bits y el cuarto número de bits del número de bits total (presupuesto de bits).
El calculador de asignación de bits 113 emite el número de bits (primer número de bits) obtenido después del recálculo y la información acerca de las subbandas (primeras subbandas) sobre las cuales se realiza la cuantificación por el primer cuantificador de espectro 106 al primer cuantificador de espectro 106 esta vez como información de bit asignado.
En un caso donde el recálculo no necesita realizarse debido a que todas las subbandas son bits asignados como resultado del primer cálculo de la asignación de bits por el calculador de asignación de bits 113, por ejemplo, el calculador de asignación de bits 113 puede emitir la información de bits asignada directamente al primer cuantificador de espectro 106.
La figura 3 es un diagrama de flujo de una operación realizada por el aparato de codificación de señal de audio 100 de acuerdo con la primera realización, específicamente, una operación realizada por el asignador de bits 104.
En primer lugar, el asignador de bits 104 obtiene energía de subbanda cuantificada a partir del cuantificador de energía de subbanda 102 (S1).
Después, el asignador de bits 104 obtiene banderas con picos/tonales en un intervalo de alta frecuencia a partir del calculador de tonalidad 103 (S2).
El asignador de bits 104 posteriormente identifica subbandas (terceras subbandas) sobre las cuales va a realizarse la cuantificación por el segundo cuantificador de espectro 107 basándose en las banderas con picos/tonales y el reservador de bits 111 y el reservador de bits 112 en el mismo reservan bits (tercer número de bits) utilizados en la cuantificación por el segundo cuantificador de espectro 107 (S3).
El calculador de asignación de bits 113 en el asignador de bits 104 determina un número de bits que van a asignarse a las subbandas que se someten a cuantificación por el primer cuantificador de espectro 106 basándose en la energía de subbanda cuantificada (S4).
El determinador de modo de cuantificación 114 en el asignador de bits 104 verifica el número de bits asignados a las subbandas en un intervalo de alta frecuencia determinado por el calculador de asignación de bits 113, identifica nuevamente las subbandas (segundas subbandas) sobre las cuales va a realizarse la cuantificación por el segundo cuantificador de espectro 107 según sea necesario y actualiza el presupuesto de bits para el primer cuantificador 106 de subbanda (S5).
Finalmente, el calculador de asignación de bits 113 en el asignador de bits 104 vuelve a calcular la asignación de bits (primer número de bits) al primer cuantificador de espectro 106 mediante el uso del presupuesto de bits actualizado (S6).
Con el aparato de codificación de señal de audio de acuerdo con esta realización, es posible realizar codificación de señales de audio de alta calidad y al mismo tiempo reducir la tasa de bits global.
Específicamente, con las configuraciones y operaciones en la figura 2 y en la figura 3, es posible realizar asignación de bits que no produzca una subbanda sobre la cual no se realice cuantificación (el número de bits asignados se vuelve cero) en un intervalo de alta frecuencia en el cual la anchura de subbanda es específicamente amplia y que maximice el número de subbandas sobre las cuales se realiza cuantificación por el primer cuantificador. En consecuencia, es posible realizar asignación de bits adaptable que pueda alcanzar el mejor desempeño a una tasa de bits limitada.
(Segunda realización)
La figura 4 es un diagrama de bloques que ilustra una configuración y una operación de un aparato de decodificación de señal de audio 200 de acuerdo con una segunda realización. El aparato de decodificación de señal de audio 200 que se ilustra en la figura 4 incluye un demultiplexor 201, un decodificador de energía de subbanda 202, un asignador de bits 203, un primer decodificador de espectro 204, un segundo decodificador de espectro 205, un de-normalizador 206 y un transformador de frecuencia tiempo 207. Al demultiplexor 201 se conecta una antena El aparato de decodificación de señal de audio 200 y la antena A juntos constituyen un aparato terminal o un aparato de estación de base.
El demultiplexor 201 recibe información codificada recibida por la antena A y demultiplexa la información codificada en energía de subbanda cuantificada codificada, primera información codificada, segunda información codificada y banderas con picos/tonales. El demultiplexor 201 emite la energía de subbanda cuantificada codificada al decodificador de energía de subbanda 202, la primera información codificada al primer decodificador de espectro 204, la segunda información codificada al segundo decodificador de espectro 205 y las banderas con picos/tonales al asignador de bits 203.
El decodificador de energía de subbanda 202 decodifica la energía de subbanda cuantificada codificada, genera energía de subbanda cuantificada decodificada y emite la energía de subbanda cuantificada decodificada al asignador de bits 203 y al de-normalizador 206.
El asignador de bits 203 hace referencia a la energía de subbanda cuantificada decodificada de cada subbanda y a las banderas con picos/tonales y determina asignación de bits que se asignan por el primer decodificador de espectro 204 y aquellos que se asignan por el segundo decodificador de espectro 205. Específicamente, el asignador de bits 203 determina el número de bits (primer número de bits) que van a asignarse en la decodificación de la primera información decodificada por el primer decodificador de espectro 204 y las subbandas (primeras subbandas) a las cuales se asignan los bits y emiten resultado como información de bit asignado. Además, el asignador de bits 203 identifica y selecciona subbandas (segundas subbandas) para las cuales la segunda información codificada va a decodificarse por el segundo decodificador de espectro 205 y emite el resultado al segundo decodificador de espectro 205 como un modo de cuantificación.
El asignador de bits 203 tiene la misma configuración y realiza la misma operación que en el asignador de bits 104 que se ilustra en la figura 5 y que se describe en la descripción del aparato de codificación. Por lo tanto, para los detalles de la operación, hágase referencia a la descripción del asignador de bits 104 en el aparato de codificación.
El primer decodificador de espectro 204 decodifica la primera información codificada mediante la utilización de un primer número de bits indicados por la información de bits asignada, genera un primer espectro decodificado y emite el primer espectro decodificado al segundo decodificador de espectro 205.
El segundo decodificador de espectro 205 utiliza el primer espectro decodificado para las subbandas identificadas con el modo de cuantificación, decodifica la segunda información codificada, genera un segundo espectro decodificado, genera un espectro reconstruido al combinar el segundo espectro decodificado con el primer espectro decodificado y emite el espectro reconstruido.
El de-normalizador 206 ajusta la amplitud (ganancia) del espectro reconstruido mientras hace referencia a la energía de subbanda cuantificada decodificada y emite el resultado al transformador de frecuencia tiempo 207.
El transformador 207 de frecuencia-tiempo transforma el espectro reconstruido en un dominio de frecuencia dentro de una señal de audio de salida en un dominio de tiempo y emite la señal de audio de salida. Los ejemplos de la transformada frecuencia-tiempo incluyen una transformada que es la inversa de la transformada descrita en la descripción de la transformada de frecuencia-tiempo.
Con el aparato de decodificación de señal de audio de acuerdo con esta realización, es posible realizar decodificación de señales de audio de alta calidad y al mismo tiempo reducir la tasa de bits global.
(Conclusión)
El aparato de codificación de señal de audio y el aparato de decodificación de señal de audio de acuerdo con la presente divulgación se han descrito en la primera y segunda realizaciones. El aparato de codificación y el aparato de decodificación de acuerdo con la presente divulgación pueden estar conceptualmente en forma de un producto semiterminado o un componente, tal como una placa de sistema o un dispositivo semiconductor, o en forma de un producto terminado como por ejemplo un aparato terminal o un aparato de estación de base. En el caso donde el aparato de codificación y el aparato de decodificación de acuerdo con la presente divulgación están en la forma de un producto o un componente semi-terminado, el aparato de codificación y el aparato de decodificación se combinan con una antena, un convertidor de DA/AD, un amplificador, un altavoz, un micrófono, y así sucesivamente, para conformar un producto terminado.
Obsérvese que los diagramas de bloques en las figuras 1,2, 4 y 5 ilustran las configuraciones y operaciones (métodos) de los dispositivos de hardware diseñados exclusivamente y pueden ser aplicables a un caso donde un programa para realizar las operaciones (métodos) de la presente divulgación está instalado en un dispositivo de hardware de fin general y se ejecuta por un procesador para de esta manera implementar las operaciones (métodos). Los ejemplos del dispositivo de hardware de fin general, el cual es un ordenador, incluyen diversos terminales de información portátiles, tales como un ordenador personal y un teléfono inteligente y diversos teléfonos portátiles.
Los ejemplos de los dispositivos de hardware diseñados exclusivamente incluyen no solo productos terminados (productos electrónicos para el consumidor), tales como un teléfono portátil y un teléfono fijo, sino también productos semi-terminados y componentes, tales como una placa de sistema y un dispositivo semiconductor.
Aplicabilidad industrial
El aparato de codificación de señal de audio y el aparato de decodificación de señal de audio de acuerdo con la presente divulgación son aplicables a una máquina o a un componente involucrado en grabación, transmisión y reproducción de señales de audio. Lista de signos de referencia
100 aparato de codificación de señal de audio
101 transformador de tiempo-frecuencia
102 cuantificador de energía de subbanda
103 calculador de tonalidad
104 asignador de bits
normalizador
primer cuantificador de espectro segundo cuantificador de espectro multiplexor
reservador de bits
reservador de bits
calculador de asignación de bits determinador de modo de cuantificación aparato de decodificación de señal de audio demultiplexor
decodificador de energía de subbanda asignador de bits
primer decodificador de espectro segundo decodificador de espectro
de-normalizador
transformador de frecuencia-tiempo reservador de bits
reservador de bits
calculador de asignación de bits determinador de modo de cuantificación

Claims (11)

  1. REIVINDICACIONES
    i. Un aparato de codificación de señal de audio, que comprende:
    un transformador de tiempo-frecuencia (101) que genera un espectro que comprende realizar una transformada en una señal de audio de entrada en un dominio de frecuencia, divide el espectro en una pluralidad de subbandas, que son bandas de frecuencia predeterminadas y emite muestras espectrales de subbanda;
    un cuantificador de energía de subbanda (102) que obtiene, para cada una de la pluralidad de subbandas, una energía de subbanda cuantificada;
    un calculador de tonalidad (103) que analiza una tonalidad de las muestras espectrales de subbanda y emite un resultado de análisis;
    un asignador de bits (104) que selecciona una segunda subbanda en la que se realiza cuantificación por un segundo cuantificador (107) de entre la pluralidad de subbandas basándose en el resultado de análisis de la tonalidad y la energía de subbanda cuantificada, y determina un primer número de bits para asignarse a una primera subbanda, entre la pluralidad de subbandas, en la que se realiza cuantificación por un primer cuantificador (106); y
    un multiplexor (108) que multiplexa información emitida desde el primer cuantificador y desde el segundo cuantificador, la energía de subbanda cuantificada y el resultado de análisis de la tonalidad, y emite la información multiplexada, en el que
    el primer cuantificador codifica una muestra espectral de subbanda entre las muestras espectrales de subbanda que están incluidas en la primera subbanda por un primer método de codificación usando el primer número de bits, y
    el segundo cuantificador codifica una muestra espectral de subbanda entre las muestras espectrales de subbanda que están incluidas en la segunda subbanda por un segundo método de codificación para obtener la información codificada emitida desde el segundo cuantificador, en el que el segundo método de codificación está configurado para calcular información de retardo para la segunda subbanda.
  2. 2. Aparato de codificación de señal de audio de acuerdo con la reivindicación 1, en el que el asignador de bits selecciona la segunda subbanda de entre la pluralidad de subbandas que están en un intervalo de alta frecuencia.
  3. 3. Aparato de codificación de señal de audio de acuerdo con la reivindicación 2, en el que el asignador de bits selecciona una subbanda, entre la pluralidad de subbandas, en el que la tonalidad es inferior a un umbral predeterminado como la segunda subbanda.
  4. 4. Aparato de codificación de señal de audio de acuerdo con la reivindicación 2, en el que el asignador de bits selecciona una subbanda entre la pluralidad de subbandas que tiene la energía de subbanda cuantificada igual a cero o inferior que un valor predeterminado como la segunda subbanda.
  5. 5. Aparato de codificación de señal de audio de acuerdo con la reivindicación 1, en el que
    el asignador de bits
    determina el primer número de bits restando un segundo número de bits para asignarse a la segunda subbanda de un número total de bits disponible para cuantificación.
  6. 6. Aparato de codificación de señal de audio de acuerdo con la reivindicación 5, en el que el asignador de bits calcula un tercer número de bits, entre el número total de bits, para asignarse a una tercera subbanda seleccionada de entre la pluralidad de subbandas basándose en el resultado de análisis para la tonalidad, selecciona, como una cuarta subbanda, una subbanda entre la pluralidad de subbandas a la que no se asigna ningún bit cuando un número de bits obtenido restando el tercer número de bits del número total de bits se asigna a la primera subbanda basándose en la energía de subbanda cuantificada, y calcula un cuarto número de bits que va a asignarse en un caso donde se realiza codificación en la cuarta subbanda por el segundo cuantificador,
    selecciona la tercera subbanda y la cuarta subbanda como segundas subbandas adicionales en las que se realiza cuantificación por el segundo cuantificador, y
    determina un número de bits obtenido restando el tercer número de bits y el cuarto número de bits del número total de bits para ser el primer número de bits que va a asignarse a la primera subbanda en la que se realiza cuantificación por el primer cuantificador.
  7. 7. Aparato de codificación de señal de audio de acuerdo con la reivindicación 1, en el que
    el resultado de análisis del calculador de tonalidad se emite como una bandera que indica si la tonalidad es o no mayor que un umbral predeterminado.
  8. 8. Aparato de codificación de señal de audio de acuerdo con la reivindicación 1, estando configurado el aparato:
    para obtener las energías de subbanda cuantificadas,
    para obtener banderas con picos/tonales en un intervalo de alta frecuencia,
    para identificar subbandas en las que se va a realizar cuantificación por el segundo cuantificador y para reservar bits para usarlos en la cuantificación por el segundo cuantificador,
    para determinar un número de bits para asignar a las subbandas que van a cuantificarse por el primer cuantificador basándose en las energías de subbanda cuantificadas,
    para comprobar el número de bits asignados a las subbandas en el intervalo de alta frecuencia, para identificar de nuevo segundas subbandas en las que se va a realizar cuantificación por el segundo cuantificador según sea necesario, y para actualizar un presupuesto de bits para el primer cuantificador, y
    para recalcular una asignación de bits para el primer cuantificador usando un presupuesto de bits actualizado.
  9. 9. Aparato de decodificación de señal de audio para decodificar información codificada, comprendiendo el aparato de decodificación de señal de audio:
    un demultiplexor (201) que demultiplexa la información codificada en primera información codificada, segunda información codificada, energía de subbanda cuantificada obtenida cuantificando energía de cada subbanda entre la pluralidad de subbandas y un resultado de análisis para una tonalidad calculada para cada subbanda entre la pluralidad de subbandas;
    un asignador de bits (203) que selecciona la segunda subbanda en la que se realiza decodificación por un segundo decodificador (205) de entre la pluralidad de subbandas basándose en el resultado de análisis de la tonalidad y la energía de subbanda cuantificada, y determina un primer número de bits que va a asignarse a una primera subbanda, entre la pluralidad de subbandas, en la que se realiza decodificación por un primer decodificador (204); y
    un transformador de frecuencia-tiempo (207) que genera y emite una señal de audio de salida realizando una transformada en un espectro emitido desde el segundo decodificador en un dominio de tiempo, en el que el primer decodificador (204) genera un primer espectro decodificado decodificando la primera información codificada utilizando el primer número de bits, y
    el segundo decodificador (205) genera un segundo espectro decodificado usando decodificación de la segunda información codificada, y genera un espectro reconstruido combinando el segundo espectro decodificado y el primer espectro decodificado.
  10. 10. Aparato de decodificación de señal de audio de acuerdo con la reivindicación 9, en el que la segunda información codificada es una información de retardo codificada, en el que la segunda información decodificada es una información de retardo decodificada, y en el que el segundo decodificador está configurado para calcular el espectro reconstruido usando el primer espectro decodificado y la información de retardo.
  11. 11. Un aparato terminal que comprende:
    el aparato de codificación de señal de audio de acuerdo con la reivindicación 1; y una antena que transmite la información codificada.
    Un aparato terminal que comprende:
    una antena que recibe y emite al demultiplexor la información codificada; y
    el aparato de decodificación de señal de audio de acuerdo con la reivindicación 9.
    Un método de codificación de señal de audio que comprende:
    generar un espectro realizando una transformada en una señal de audio de entrada en un dominio de frecuencia;
    dividir el espectro en una pluralidad de subbandas, que son bandas de frecuencia predeterminada, y emitir muestras espectrales de subbanda;
    obtener, para cada una de la pluralidad de subbandas, energía de subbanda cuantificada;
    analizar una tonalidad de las muestras espectrales de subbanda y emitir un resultado de análisis; seleccionar una segunda subbanda entre la pluralidad de subbandas basándose en el resultado de análisis de la tonalidad y la energía de subbanda cuantificada;
    determinar un primer número de bits que van a asignarse a una primera subbanda entre la pluralidad de subbandas;
    generar primera información codificada codificando una muestra espectral de subbanda entre las muestras espectrales de subbanda que están incluidas en la primera subbanda por un primer método de codificación usando el primer número de bits;
    generar segunda información codificada codificando una muestra espectral de subbanda entre las muestras espectrales de subbanda que están incluidas en la segunda subbanda usando un segundo método de codificación, en el que el segundo método de codificación está configurado para calcular información de retardo para la segunda subbanda; y
    multiplexar juntos y emitir la primera información codificada y la segunda información codificada.
    Método de decodificación de señal de audio para decodificar información codificada, comprendiendo el método de decodificación de señal de audio:
    demultiplexar la información codificada en primera información codificada, segunda información codificada, energías de subbanda cuantificada para cada subbanda entre una pluralidad de subbandas, y un resultado de análisis para una tonalidad calculado para cada subbanda entre la pluralidad de subbandas; seleccionar una segunda subbanda entre la pluralidad de subbandas basándose en el resultado de análisis de la tonalidad y la energía de subbanda cuantificada;
    determinar un primer número de bits que van a asignarse a una primera subbanda entre la pluralidad de subbandas;
    generar un primer espectro decodificado decodificando la primera información codificada usando el primer número de bits;
    generar un segundo espectro decodificado usando decodificación de la segunda información codificada, y generar un espectro reconstruido combinando el segundo espectro decodificado y el primer espectro decodificado; y
    generar y emitir una señal de audio de salida realizando una transformada en el espectro reconstruido en un dominio de tiempo.
    Programa informático que tiene un código de programa que, cuando el programa se ejecuta por un ordenador, hace que el ordenador lleve a cabo el método de acuerdo con la reivindicación 13 o la reivindicación 14.
    Ċ
ES18186595T 2014-07-25 2015-07-03 Aparato de codificación de señal de audio, dispositivo de decodificación de señal de audio y métodos del mismo Active ES2823250T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201462028805P 2014-07-25 2014-07-25
JP2014219214 2014-10-28

Publications (1)

Publication Number Publication Date
ES2823250T3 true ES2823250T3 (es) 2021-05-06

Family

ID=65895473

Family Applications (2)

Application Number Title Priority Date Filing Date
ES18186595T Active ES2823250T3 (es) 2014-07-25 2015-07-03 Aparato de codificación de señal de audio, dispositivo de decodificación de señal de audio y métodos del mismo
ES15824312T Active ES2707337T3 (es) 2014-07-25 2015-07-03 Aparato de codificación de señal de audio, dispositivo de decodificación de señal de audio y métodos del mismo

Family Applications After (1)

Application Number Title Priority Date Filing Date
ES15824312T Active ES2707337T3 (es) 2014-07-25 2015-07-03 Aparato de codificación de señal de audio, dispositivo de decodificación de señal de audio y métodos del mismo

Country Status (5)

Country Link
JP (2) JP2019144527A (es)
ES (2) ES2823250T3 (es)
PT (2) PT3174050T (es)
TR (1) TR201901476T4 (es)
ZA (1) ZA201701428B (es)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220262374A1 (en) * 2019-07-19 2022-08-18 Sony Group Corporation Signal processing device and signal processing method, and program
CN113192517B (zh) * 2020-01-13 2024-04-26 华为技术有限公司 一种音频编解码方法和音频编解码设备

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3250376B2 (ja) * 1994-06-13 2002-01-28 ソニー株式会社 情報符号化方法及び装置並びに情報復号化方法及び装置
JP4789622B2 (ja) * 2003-09-16 2011-10-12 パナソニック株式会社 スペクトル符号化装置、スケーラブル符号化装置、復号化装置、およびこれらの方法
JP2005265865A (ja) * 2004-02-16 2005-09-29 Matsushita Electric Ind Co Ltd オーディオ符号化のためのビット割り当て方法及び装置
WO2011086924A1 (ja) * 2010-01-14 2011-07-21 パナソニック株式会社 音声符号化装置および音声符号化方法
BR112016019838B1 (pt) * 2014-03-31 2023-02-23 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Codificador de áudio, decodificador de áudio, método de codificação, método de decodificação e mídia de registro legível por computador não transitória

Also Published As

Publication number Publication date
PT3413307T (pt) 2020-10-19
JP2019070823A (ja) 2019-05-09
PT3174050T (pt) 2019-02-04
TR201901476T4 (tr) 2019-02-21
JP2019144527A (ja) 2019-08-29
ZA201701428B (en) 2018-12-19
JP6957444B2 (ja) 2021-11-02
ES2707337T3 (es) 2019-04-03

Similar Documents

Publication Publication Date Title
ES2643746T3 (es) Dispositivo de codificación de audio de voz, dispositivo de descodificación de audio de voz, método de codificación de audio de voz y método de descodificación de audio de voz
US11521625B2 (en) Audio signal coding apparatus, audio signal decoding apparatus, audio signal coding method, and audio signal decoding method
RU2701065C1 (ru) Устройство кодирования речи-аудио, устройство декодирования речи-аудио, способ кодирования речи-аудио и способ декодирования речи-аудио
ES2823250T3 (es) Aparato de codificación de señal de audio, dispositivo de decodificación de señal de audio y métodos del mismo