ES2546028T3 - Un método y un dispositivo de codificación/decodificación - Google Patents

Un método y un dispositivo de codificación/decodificación Download PDF

Info

Publication number
ES2546028T3
ES2546028T3 ES08706659.3T ES08706659T ES2546028T3 ES 2546028 T3 ES2546028 T3 ES 2546028T3 ES 08706659 T ES08706659 T ES 08706659T ES 2546028 T3 ES2546028 T3 ES 2546028T3
Authority
ES
Spain
Prior art keywords
layer
characteristic parameters
improvement layer
noise signal
improvement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES08706659.3T
Other languages
English (en)
Inventor
Hualin Wan
Libin Zhang
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Application granted granted Critical
Publication of ES2546028T3 publication Critical patent/ES2546028T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Un método para la codificación de una señal de ruido de fondo, que comprende: dividir la señal de ruido de fondo en una señal de ruido de fondo de banda inferior y una señal de ruido de fondo de banda superior; extraer los parámetros característicos de la capa principal y los parámetros característicos de la capa de mejora de la señal de ruido de fondo; en donde la extracción de los parámetros característicos de la capa principal y los parámetros característicos de la capa de mejora de la señal de ruido de fondo comprende: extraer los parámetros característicos de la capa principal de la señal de ruido de fondo de la banda inferior y extraer los parámetros característicos de la capa de mejora de la banda superior de la señal de ruido de fondo de la banda superior; y codificar los parámetros característicos de la capa principal y los parámetros característicos de la capa de mejora con el fin de obtener un flujo de códigos de la capa principal y un flujo de códigos de la capa de mejora.

Description

5
10
15
20
25
30
35
40
45
50
E08706659
25-08-2015
DESCRIPCIÓN
Un método y un dispositivo de codificación/decodificación
Campo de la invención
La presente invención está relacionada con las tecnologías de codificación-decodificación y, más en particular, con métodos y dispositivos de codificación-decodificación.
Antecedentes
Las señales transmitidas en las comunicaciones de voz incluyen una señal sonora y una señal de silencio. Para el propósito de la comunicación, las señales de voz generadas hablando y pronunciando se definen como una señal sonora. Una señal generada en el intervalo entre la pronunciación generalmente discontinua se define como señal de silencio. La señal de silencio incluye varias señales de ruido de fondo como, por ejemplo, una señal de ruido blanco, una señal ruidosa de fondo y una señal de silencio, y similares. La señal sonora es una portadora de contenidos de comunicación y se denomina señal útil. Por lo tanto, la señal de voz se puede dividir en una señal útil y una señal de ruido de fondo.
En la técnica anterior, se utiliza un modelo de Predicción Lineal con Excitación por Código (CELP) con el fin de extraer los parámetros característicos de la capa principal de la señal de ruido de fondo, y no se extraen los parámetros característicos de la señal de ruido de fondo de las bandas más altas. Por lo tanto, durante la codificación y decodificación, únicamente se utilizan los parámetros característicos de la capa principal para codificar/decodificar la señal de ruido de fondo, mientras que la señal de ruido de fondo de las bandas más altas no se codifica/decodifica. Los parámetros característicos de la capa principal incluyen únicamente un parámetro de espectro y un parámetro de energía, lo cual quiere decir que no son suficientes los parámetros característicos utilizados para la codificación-decodificación. Como resultado, la señal de ruido de fondo reconstruida a través de la codificación-decodificación no es lo suficientemente precisa, lo cual hace que la codificación y la decodificación de la señal de ruido de fondo sea de baja calidad.
El documento US2005/163323 A1 divulga un equipo de codificación que comprende una sección de submuestreo que disminuye la tasa de muestreo de una señal de entrada; una sección de codificación de la capa básica que codifica una señal de entrada cuya tasa de muestreo se reduce y se obtiene una primera información de codificación; una sección de decodificación que genera una señal decodificada basándose en dicha primera información de codificación; y una sección de sobremuestreo que aumenta la tasa de muestreo de dicha señal codificada a una tasa idéntica a la de dicha señal de entrada; una sección de codificación de la capa de mejora que utiliza un parámetro generado en un procesamiento de decodificación de dicha sección de decodificación, codifica un valor de la diferencia entre dicha señal de entrada y dicha señal decodificada cuya tasa de muestreo se ha aumentado, y se obtiene una segunda información de codificación; y una sección de multiplexación que multiplexa dicha primera información de codificación y dicha segunda información de codificación.
Resumen
Un modo de realización de la invención proporciona un método para codificar una señal de ruido de fondo de acuerdo con la reivindicación 1, el cual mejora la calidad de la codificación de la señal de ruido de fondo.
Un modo de realización de la invención proporciona un método para decodificar una señal de ruido de fondo de acuerdo con la reivindicación 5, el cual mejora la calidad de la codificación de la señal de ruido de fondo.
Un modo de realización de la invención proporciona un dispositivo para codificar una señal de ruido de fondo de acuerdo con la reivindicación 8, el cual mejora la calidad de la codificación de la señal de ruido de fondo.
Un modo de realización de la invención proporciona un dispositivo para decodificar una señal de ruido de fondo de acuerdo con la reivindicación 11, el cual mejora la calidad de la codificación de la señal de ruido de fondo.
En las reivindicaciones dependientes se definen características ventajosas.
Breve descripción de los dibujos
La Figura 1 es un diagrama de bloques que ilustra un sistema para codificación-decodificación de la señal de voz en un escenario de aplicación de acuerdo con un ejemplo no cubierto por la invención;
la Figura 2 es un diagrama de bloques que ilustra un sistema para codificación-decodificación de la señal de ruido de fondo en otro escenario de aplicación de acuerdo con un ejemplo no cubierto por la invención;
la Figura 3 es un diagrama de flujo que ilustra un método para codificación-decodificación de la señal de voz en otro escenario de aplicación de acuerdo con un ejemplo no cubierto por la invención;
10
15
20
25
30
35
40
45
50
E08706659
25-08-2015
la Figura 4 es un diagrama de bloques que ilustra un dispositivo para la codificación de la señal de ruido de fondo de acuerdo con un ejemplo no cubierto por la invención;
la Figura 5 es un diagrama de bloques que ilustra un dispositivo para la codificación de la señal de ruido de fondo de acuerdo con otro ejemplo;
la Figura 6 es un diagrama de flujo que ilustra un dispositivo para la decodificación de la señal de ruido de fondo de acuerdo con un ejemplo no cubierto por la invención;
la Figura 7 es un diagrama de bloques que ilustra un dispositivo para la decodificación de la señal de ruido de fondo de acuerdo con otro ejemplo;
la Figura 8 es un diagrama de flujo de un método para la codificación la señal de ruido de fondo de acuerdo con otro ejemplo;
la Figura 9 es un diagrama de la arquitectura de una trama de SID en G.729.1; y
la Figura 10 es un diagrama de flujo de un método para la decodificación la señal de ruido de fondo.
Descripción detallada
En la actualidad, un método para procesar la señal de ruido de fondo supone la compresión de la señal de ruido de fondo utilizando un esquema de compresión de silencios antes de transmitir la señal de ruido de fondo. El modelo para comprimir la señal de ruido de fondo es el mismo que el modelo para comprimir la señal útil y ambos modelos utilizan el modelo de compresión CELP. El principio para sintetizar la señal útil y la señal de ruido de fondo es del siguiente modo: un filtro de síntesis se excita mediante una señal de excitación y genera una señal de salida que satisface la ecuación s(n)=e(n)*v(n), donde s(n) es la señal útil obtenida desde el procesamiento de síntesis, e(n) es la señal de excitación y v(n) es el filtro de síntesis. Por lo tanto, la codificación-decodificación de la señal de ruido de fondo se puede tomar simplemente como la codificación-decodificación de la señal útil.
La señal de excitación para la señal de ruido de fondo puede ser una simple secuencia de ruido aleatorio generada por un módulo de generación de ruido aleatorio. Las amplitudes de la secuencia de ruido aleatorio se controlan mediante el parámetro de energía, esto es, se puede crear una señal de excitación. De este modo, los parámetros de la señal de excitación para la señal de ruido de fondo se pueden representar mediante el parámetro de energía. Un parámetro del filtro de síntesis para la señal de ruido de fondo es un parámetro de espectro, el cual también se denomina como parámetro cuantizado de la Frecuencia del Espectro de Línea (LSF).
La Figura 1 es un diagrama de bloques de un sistema para codificación-decodificación de la señal de voz en una aplicación de acuerdo con un ejemplo no cubierto por la presente invención. Tal como se muestra en la Figura 1, el sistema incluye un dispositivo de codificación y un dispositivo de decodificación. El dispositivo de codificación incluye un detector de actividad de voz (VAD), un codificador de voz y una unidad de transmisión discontinua (DTX); y el dispositivo de decodificación incluye un decodificador de voz y una unidad de generación de ruido confortable (CNG).
El VAD está configurado para detectar la señal de voz, con el fin de transmitir la señal útil al codificador de voz, y con el fin de transmitir la señal de ruido de fondo a la unidad de DTX.
El codificador de voz está configurado para codificar la señal útil y para transmitir la señal útil codificada al decodificador de voz a través de un canal de comunicación.
La unidad de DTX está configurada para extraer los parámetros característicos de la capa principal de la señal de ruido de fondo, codificar los parámetros característicos de la capa principal, encapsular el flujo de códigos de la capa principal en una trama de Descriptor de Inserción de Silencios (SID), y para transmitir la trama de SID a la unidad de CNG a través de un canal de comunicación.
El decodificador de voz está configurado para recibir la señal útil transmitida por parte del codificador de voz, decodificar la señal útil, y a continuación proporcionar como salida la señal útil reconstruida.
La unidad de CNG está configurada para recibir la trama de SID transmitida por parte de la unidad de DTX, decodificar los parámetros característicos de la capa principal de la trama de SID, y obtener una señal de ruido de fondo reconstruida, esto es, el ruido de fondo confortable.
Se debe observar que si la señal de voz detectada es una señal útil, los conmutadores están conectados a los extremos K1, K3, K5 y K7; si la señal de voz es una señal de ruido de fondo, los conmutadores están conectados a los extremos K2, K4, K6 y K8. Tanto la señal útil reconstruida como la señal de ruido de fondo reconstruida son señales de voz reconstruidas.
10
15
20
25
30
35
40
E08706659
25-08-2015
El sistema para la codificación-decodificación de la señal de voz se ilustra en el ejemplo que se muestra en la Fig. 1. La señal de voz incluye la señal útil y la señal de ruido de fondo. En el siguiente ejemplo se describe el sistema para la codificación-decodificación de la señal de ruido de fondo.
La Fig. 2 es un diagrama de bloques del sistema para la codificación-decodificación de la señal de ruido de fondo en otra aplicación de acuerdo con un ejemplo no cubierto por la presente invención. Tal como se muestra en la Fig. 2, el sistema incluye un dispositivo de codificación y un dispositivo de decodificación. El dispositivo de codificación incluye una unidad de codificación de los parámetros característicos de la capa principal y una unidad de encapsulación de la trama de SID; y el dispositivo de decodificación incluye una unidad de análisis de la trama de SID y una unidad de decodificación de los parámetros característicos de la capa principal.
La unidad de codificación de los parámetros característicos de la capa principal está configurada para recibir la señal de ruido de fondo, extraer el parámetro de espectro y el parámetro de energía de la señal de ruido de fondo, y para transmitir a la unidad de encapsulación de la trama de SID los parámetros de espectro y energía extraídos.
La unidad de encapsulación de la trama de SID está configurada para recibir los parámetros de espectro y energía, codificar estos parámetros con el fin de obtener el flujo de códigos de la capa principal, encapsular el flujo de códigos de la capa principal en una trama de SID, y transmitir la trama de SID encapsulada a una unidad de análisis de la trama de SID.
La unidad de análisis de la trama de SID está configurada para recibir la trama de SID transmitida por la unidad de encapsulación de la trama de SID, extraer el flujo de códigos de la capa principal, y transmitir el flujo de códigos de la capa principal extraído a la unidad de decodificación de los parámetros característicos de la capa principal.
La unidad de decodificación de los parámetros característicos de la capa principal está configurada para recibir el flujo de códigos de la capa principal, extraer los parámetros de espectro y energía, sintetizar los parámetros de espectro y energía, y obtener una señal de ruido de fondo reconstruida.
La Fig. 3 es un diagrama de flujo de un método para la codificación-decodificación de la señal de voz en otra aplicación de acuerdo con un ejemplo no cubierto por la presente invención. Tal como se muestra en la Fig. 3, el método incluye los siguientes pasos:
Paso 300: se determina si la señal de voz es una señal de ruido de fondo; si es la señal de ruido de fondo se ejecuta el paso 310; en caso contrario se ejecuta el paso 320.
En este paso, el método para determinar si la señal de voz es la señal de ruido de fondo es como sigue: el VAD realiza una comprobación sobre la señal de ruido de fondo; si el resultado de la comprobación es 0, se determina que la señal de voz es la señal de ruido de fondo; y si el resultado de la comprobación es 1, se determina que la señal de voz es la señal útil.
Paso 310: un codificador no de voz extrae los parámetros característicos de la capa principal de la señal de ruido de fondo.
En este paso, el codificador no de voz extrae los parámetros característicos de la capa principal, esto es los parámetros característicos de la banda inferior. Los parámetros característicos de la capa principal incluyen el parámetro de espectro y el parámetro de energía. Se debe observar que los parámetros característicos de la capa principal de la señal de ruido de fondo se pueden extraer de acuerdo con el modelo CELP.
Paso 311: se determina si un cambio en los parámetros característicos de la capa principal excede un umbral definido. Si excede el umbral, se ejecuta el paso 312; en caso contrario, se ejecuta el paso 330.
Paso 312: los parámetros característicos de la capa principal se encapsulan en una trama de SID y ésta se envía a un decodificador no de voz.
En este paso, se codifican los parámetros de espectro y energía. El flujo de códigos de la capa principal codificado se encapsula en la trama de SID tal como se muestra en la Tabla 1.
Descripción del parámetro característico
Número de bits
Índice predictor de la cuantización de la LSF
1
Vector cuantizado de la LSF de la primera etapa
5
Vector cuantizado de la LSF de la segunda etapa
4
Ganancia
5
10
15
20
25
30
35
40
45
50
E08706659
25-08-2015
Tabla 1
La trama de SID que se muestra en la Tabla 1 es conforme con el estándar G.729 e incluye un índice predictor de la cuantización de la LSF, un vector cuantizado de la LSF de la primera etapa, un vector cuantizado de la LSF de la segunda etapa y una ganancia. Aquí, al índice predictor de la cuantización de la LSF, al vector cuantizado de la LSF de la primera etapa, al vector cuantizado de la LSF de la segunda etapa y a la ganancia se les asigna, respectivamente, 1 bit, 5 bits, 4 bits y 5 bits.
En los parámetros enumerados más arriba, el índice predictor de la cuantización de la LSF, el vector cuantizado de la LSF de la primera etapa y el vector cuantizado de la LSF de la segunda etapa son los parámetros de cuantización de la LSF y corresponden al parámetro de espectro, y la ganancia es un parámetro de energía.
Paso 313: el decodificador no de voz decodifica los parámetros característicos de la capa principal incluidos en la trama de SID con el fin de obtener la señal de ruido de fondo reconstruida.
Paso 320: el codificador de voz codifica la señal útil y envía al decodificador de voz la señal útil codificada.
Paso 321: el decodificador de voz decodifica la señal útil codificada y devuelve la señal útil reconstruida.
Paso 330: el procedimiento finaliza.
Los modos de realización de la invención proporcionan un método, un sistema y un dispositivo para la codificacióndecodificación. Cuando se codifica la señal de ruido de fondo, se extraen y se codifican los parámetros característicos de la capa principal y los parámetros característicos de la capa de mejora de la señal de ruido de fondo. En el extremo de decodificación, se extraen el flujo de códigos de la capa principal y el flujo de códigos de la capa de mejora en la trama de SID, se analizan los parámetros característicos de la capa principal y los parámetros característicos de la capa de mejora de acuerdo con el flujo de códigos de la capa principal y el flujo de códigos de la capa de mejora, y se decodifican los parámetros característicos de la capa principal y los parámetros característicos de la capa de mejora.
La Fig. 4 ilustra un diagrama de bloques de un dispositivo para la codificación de la señal de ruido de fondo de acuerdo con un ejemplo no cubierto por la invención. Tal como se muestra en la Fig. 4, el dispositivo incluye una unidad de codificación de los parámetros característicos de la capa principal, una unidad de codificación de los parámetros característicos de la capa de mejora, una unidad de codificación y una unidad de encapsulación de la trama de SID.
La unidad de codificación de los parámetros característicos de la capa principal está configurada para recibir la señal de ruido de fondo, extraer los parámetros característicos de la capa principal de la señal de ruido de fondo, y transmitir a la unidad de codificación los parámetros característicos de la capa principal extraídos.
La unidad de codificación de los parámetros característicos de la capa de mejora está configurada para recibir la señal de ruido de fondo, extraer los parámetros característicos de la capa de mejora, y transmitir a la unidad de codificación los parámetros característicos de la capa de mejora.
La unidad de codificación está configurada para codificar los parámetros característicos de la capa principal y los parámetros característicos de la capa de mejora con el fin de obtener el flujo de códigos de la capa principal y el flujo de códigos de la capa de mejora y transmitir el flujo de códigos de la capa principal y el flujo de códigos de la capa de mejora a la unidad de encapsulación de la trama de SID.
La unidad de encapsulación de la trama de SID está configurada para encapsular el flujo de códigos de la capa principal y el flujo de códigos de la capa de mejora en una trama de SID.
En el ejemplo, la señal de ruido de fondo se puede codificar utilizando los parámetros característicos de la capa principal y los parámetros característicos de la capa de mejora. Se pueden utilizar más parámetros característicos para codificar la señal de ruido de fondo, lo cual mejora la precisión de la codificación de la señal de ruido de fondo y, a su vez, mejora la calidad de codificación de la señal de ruido de fondo. Se debe observar que el dispositivo de codificación del ejemplo puede extraer los parámetros característicos de la capa principal y codificar los parámetros característicos de la capa principal. Además, el dispositivo de codificación proporcionado por el modo de realización es compatible con el dispositivo de codificación existente.
La Fig. 5 ilustra un diagrama de bloques de un dispositivo para la codificación de la señal de ruido de fondo. Tal como se muestra en la Fig. 5, en el dispositivo, la unidad de codificación de parámetros característicos de la capa principal incluye una unidad de codificación de parámetros del espectro de la banda inferior, y una unidad de codificación de parámetros de la energía de la banda inferior. La unidad de codificación de parámetros característicos de la capa de mejora incluye al menos una de las siguientes: la unidad de codificación de parámetros característicos de la capa de mejora de la banda inferior y una unidad de codificación de parámetros característicos de la capa de mejora de la banda superior.
10
15
20
25
30
35
40
45
50
E08706659
25-08-2015
La unidad de codificación de parámetros del espectro de la banda inferior está configurada para recibir la señal de ruido de fondo, extraer el parámetro de espectro de la señal de ruido de fondo y transmitirle el parámetro de espectro a la unidad de codificación.
La unidad de codificación de energía de la banda inferior está configurada para recibir la señal de ruido de fondo, extraer el parámetro de energía de la señal de ruido de fondo y transmitirle el parámetro de energía a la unidad de codificación.
La unidad de codificación de parámetros característicos de la capa de mejora de la banda inferior está configurada para recibir la señal de ruido de fondo, extraer el parámetro característico de la capa de mejora de la banda inferior, y transmitirle el parámetro característico de la capa de mejora de la banda inferior a la unidad de codificación.
La unidad de codificación de parámetros característicos de la capa de mejora de la banda superior está configurada para recibir la señal de ruido de fondo, extraer el parámetro característico de la capa de mejora de la banda superior, y transmitirle el parámetro característico de la capa de mejora de la banda superior a la unidad de codificación.
La unidad de codificación está configurada para recibir y codificar los parámetros de espectro y energía con el fin de obtener el flujo de códigos de la capa principal. También se utiliza para recibir y codificar el parámetro característico de la capa de mejora de la banda inferior y el parámetro característico de la capa de mejora de la banda superior con el fin de obtener el flujo de códigos de la capa de mejora.
La unidad de encapsulación de la trama de SID está configurada para encapsular el flujo de códigos de la capa principal y el flujo de códigos de la capa de mejora en la trama de SID.
Se debe observar que la unidad de codificación de parámetros característicos de la capa de mejora en el modo de realización incluye al menos una de las siguientes: la unidad de codificación de parámetros característicos de la capa de mejora de la banda inferior y la unidad de codificación de parámetros característicos de la capa de mejora de la banda superior. La Fig. 5 ilustra el caso en el que se incluyen tanto la unidad de codificación de parámetros característicos de la capa de mejora de la banda inferior como la unidad de codificación de parámetros característicos de la capa de mejora de la banda superior. Si incluyera únicamente una de las unidades, por ejemplo la unidad de codificación de parámetros característicos de la capa de mejora de la banda inferior, en la Fig. 5 no se mostraría la unidad de codificación de parámetros característicos de la capa de mejora de la banda superior. Análogamente, si únicamente se incluyera la unidad de codificación de parámetros característicos de la capa de mejora de la banda superior, en la Fig. 5 no se mostraría la unidad de codificación de parámetros característicos de la capa de mejora de la banda inferior.
La unidad de codificación también se puede ajustar correspondientemente de acuerdo con las unidades incluidas en la Fig. 5 cuando se lleva a cabo la codificación. Por ejemplo, si en la Fig. 5 no se incluyera la unidad de codificación de parámetros característicos de la capa de mejora de la banda inferior, la unidad de codificación estaría configurada para recibir y codificar los parámetros de espectro y energía con el fin de obtener el flujo de códigos de la capa principal. También se utilizaría para recibir y codificar el parámetro característico de la capa de mejora de la banda superior con el fin de obtener el flujo de códigos de la capa de mejora.
En correspondencia con el dispositivo de codificación que se muestra en la Fig. 5, el dispositivo de decodificación es necesario para decodificar la trama de SID codificada, con el fin de obtener la señal de ruido de fondo reconstruida. A continuación se describe el dispositivo para decodificar la señal de ruido de fondo.
La Fig. 6 ilustra un diagrama de bloques de un dispositivo para la decodificación de la señal de ruido de fondo de acuerdo con un ejemplo no cubierto por la invención. Tal como se muestra en la Fig. 6, el dispositivo de decodificación incluye una unidad de decodificación de los parámetros característicos de la capa principal, una unidad de decodificación de los parámetros característicos de la capa de mejora y una unidad de análisis de la trama de SID.
La unidad de análisis de la trama de SID está configurada para recibir la trama de SID de la señal de ruido de fondo, extraer el flujo de códigos de la capa principal y el flujo de códigos de la capa de mejora, transmitir el flujo de códigos de la capa principal a la unidad de decodificación de los parámetros característicos de la capa principal, y transmitir el flujo de códigos de la capa de mejora a la unidad de decodificación de los parámetros característicos de la capa de mejora.
La unidad de decodificación de los parámetros característicos de la capa principal está configurada para recibir el flujo de códigos de la capa principal, extraer los parámetros característicos de la capa principal y sintetizar los parámetros característicos de la capa principal con el fin de obtener la señal de ruido de fondo de la capa principal reconstruida.
La unidad de decodificación de los parámetros característicos de la capa de mejora está configurada para recibir el flujo de códigos de la capa de mejora, extraer y decodificar los parámetros característicos de la capa principal con el
10
15
20
25
30
35
40
45
50
E08706659
25-08-2015
fin de obtener la señal de ruido de fondo de la capa de mejora reconstruida.
El dispositivo de decodificación del modo de realización puede extraer el flujo de códigos de la capa de mejora, y extraer los parámetros característicos de la capa de mejora de acuerdo con el flujo de códigos de la capa de mejora, y decodificar los parámetros característicos de la capa de mejora con el fin de obtener la señal de ruido de fondo de la capa de mejora reconstruida. Con la solución técnica del modo de realización, se pueden utilizar más parámetros característicos para describir la señal de ruido de fondo, y la señal de ruido de fondo se puede decodificar con más precisión, pudiéndose mejorar de este modo la calidad de la decodificación de la señal de ruido de fondo.
La Fig. 7 ilustra un diagrama de bloques de otro dispositivo de ejemplo para decodificar la señal de ruido de fondo. En contraste con el dispositivo de decodificación que se muestra en la Fig. 6, la unidad de decodificación de los parámetros característicos de la capa principal incluye específicamente una unidad de análisis de los parámetros del espectro de la banda inferior, una unidad de análisis de los parámetros de energía de la banda inferior y un filtro de síntesis de la capa principal; la unidad de decodificación de los parámetros característicos de la capa de mejora incluye específicamente una unidad de decodificación de los parámetros característicos de la capa de mejora de la banda inferior y una unidad de decodificación de los parámetros característicos de la capa de mejora de la banda superior, o una de las dos unidades de decodificación.
La unidad de análisis de los parámetros del espectro de la banda inferior está configurada para recibir el flujo de códigos de la capa principal transmitido por la unidad de análisis de la trama de SID, extraer el parámetro de espectro y transmitirle el parámetro de espectro al filtro de síntesis de la capa principal.
La unidad de análisis de los parámetros de energía de la banda inferior está configurada para recibir el flujo de códigos de la capa principal transmitido por la unidad de análisis de la trama de SID, extraer el parámetro de energía y transmitirle el parámetro de energía al filtro de síntesis de la capa principal.
El filtro de síntesis de la capa principal está configurado para recibir y sintetizar el parámetro de espectro y el parámetro de energía con el fin de obtener la señal de ruido de fondo de la capa principal reconstruida.
La unidad de decodificación de los parámetros característicos de la capa de mejora de la banda inferior está configurada para recibir el flujo de códigos de la capa de mejora transmitido por la unidad de análisis de la trama de SID, extraer y decodificar los parámetros característicos de la capa de mejora de la banda inferior con el fin de obtener la señal de ruido de fondo de la capa de mejora reconstruida, esto es, la señal de ruido de fondo de la capa de mejora de la banda inferior reconstruida.
La unidad de decodificación de los parámetros característicos de la capa de mejora de la banda superior está configurada para recibir el flujo de códigos de la capa de mejora transmitido por la unidad de análisis de la trama de SID, extraer y decodificar los parámetros característicos de la capa de mejora de la banda superior, y obtener la señal de ruido de fondo de la capa de mejora reconstruida, esto es, la señal de ruido de fondo de la capa de mejora de la banda superior reconstruida.
El flujo de códigos de la capa de mejora incluye el flujo de códigos de la capa de mejora de la banda inferior y el flujo de códigos de la capa de mejora de la banda superior. Tanto la señal de ruido de fondo de la capa de mejora de la banda inferior reconstruida como la señal de ruido de fondo de la capa de mejora de la banda superior reconstruida corresponden a una señal de ruido de fondo de la capa de mejora reconstruida y forman parte de la señal de ruido de fondo reconstruida.
La unidad de decodificación de los parámetros característicos de la capa de mejora de la banda inferior puede incluir una unidad de análisis de los parámetros característicos de la capa de mejora de la banda inferior y una unidad de mejora de la banda inferior. La unidad de decodificación de los parámetros característicos de la capa de mejora de la banda superior puede incluir una unidad de análisis de los parámetros característicos de la capa de mejora de la banda superior y una unidad de mejora de la banda superior.
La unidad de análisis de los parámetros característicos de la capa de mejora de la banda inferior está configurada para recibir el flujo de códigos de la capa de mejora, extraer los parámetros característicos de la capa de mejora de la banda inferior y transmitirle los parámetros característicos de la capa de mejora de la banda inferior a la unidad de mejora de la banda inferior.
La unidad de mejora de la banda inferior está configurada para recibir y decodificar los parámetros característicos de la capa de mejora de la banda inferior, y obtener la señal de ruido de fondo de la capa de mejora de la banda inferior reconstruida.
La unidad de análisis de los parámetros característicos de la capa de mejora de la banda superior está configurada para recibir el flujo de códigos de la capa de mejora, extraer los parámetros característicos de la capa de mejora de la banda superior y transmitirle los parámetros característicos de la capa de mejora de la banda superior a la unidad de mejora de la banda superior.
10
15
20
25
30
35
40
45
50
55
E08706659
25-08-2015
La unidad de mejora de la banda superior está configurada para recibir y decodificar los parámetros característicos de la capa de mejora de la banda superior, y obtener la señal de ruido de fondo de la capa de mejora de la banda superior reconstruida.
Se debe observar que las unidades incluidas en el dispositivo de decodificación se corresponden con las unidades incluidas en el dispositivo de codificación que se muestra en la Fig. 5. Por ejemplo, si la unidad de codificación de parámetros característicos de la capa de mejora de la Fig. 5 incluye la unidad de codificación de parámetros característicos de la capa de mejora de la banda inferior y la unidad de codificación de parámetros característicos de la capa de mejora de la banda superior, el dispositivo de decodificación, en correspondencia, incluye la unidad de decodificación de los parámetros característicos de la capa de mejora de la banda inferior y la unidad de decodificación de los parámetros característicos de la capa de mejora de la banda superior. Si la unidad de codificación de parámetros característicos de la capa de mejora de la Fig. 5 incluye únicamente la unidad de codificación de parámetros característicos de la capa de mejora de la banda inferior, el dispositivo de decodificación incluye al menos la unidad de decodificación de los parámetros característicos de la capa de mejora de la banda inferior, además de la unidad de decodificación de los parámetros característicos de la capa principal. Si no se incluye la unidad de decodificación de los parámetros característicos de la capa de mejora de la banda superior, la unidad no se muestra en la Fig. 7. Si el dispositivo de la Fig. 5 incluye únicamente la unidad de codificación de parámetros característicos de la capa de mejora de la banda superior, el dispositivo de decodificación incluye al menos la unidad de decodificación de los parámetros característicos de la capa de mejora de la banda superior. Si la unidad de decodificación de los parámetros característicos de la capa de mejora de la banda inferior no se incluye, la unidad no se muestra en la Fig. 7.
Un modo de realización de la presente invención, también proporciona un sistema de codificación-descodificación, el cual incluye un dispositivo de codificación y un dispositivo de descodificación
El dispositivo de codificación está configurado para recibir la señal de ruido de fondo, extraer y codificar los parámetros característicos de la capa principal y los parámetros característicos de la capa de mejora de la señal de ruido de fondo para obtener el flujo de códigos de la capa principal y el flujo de códigos de la capa de mejora, encapsular el flujo de códigos de la capa principal y el flujo de códigos de la capa de mejora obtenidos en una trama de SID y transmitirle la trama de SID al dispositivo de decodificación.
El dispositivo de decodificación está configurado para recibir la trama de SID transmitida por el dispositivo de codificación, analizar el flujo de códigos de la capa principal y el flujo de códigos de la capa de mejora; extraer los parámetros característicos de la capa principal de acuerdo con el flujo de códigos de la capa principal; sintetizar los parámetros característicos de la capa principal con el fin de obtener la señal de ruido de fondo de la capa principal reconstruida; extraer los parámetros característicos de la capa de mejora de acuerdo con el flujo de códigos de la capa de mejora, y decodificar los parámetros característicos de la capa de mejora con el fin de obtener la señal de ruido de fondo de la capa de mejora reconstruida.
En los modos de realización descritos más arriba se describen las estructuras y funciones detalladas de los dispositivos para la codificación y la decodificación de la señal de ruido de fondo. A continuación se describen los métodos para la codificación y la decodificación de la señal de ruido de fondo.
La Fig. 8 es un diagrama de flujo de un método para la codificación de la señal de ruido de fondo de acuerdo con otro ejemplo. Tal como se muestra en la Fig. 8, el método incluye los siguientes pasos:
Paso 801: se recibe la señal de ruido de fondo.
Paso 802: se extraen los parámetros característicos de la capa principal y los parámetros característicos de la capa de mejora de la señal de ruido de fondo y se codifican los parámetros característicos con el fin de obtener el flujo de códigos de la capa principal y el flujo de códigos de la capa de mejora.
Los parámetros característicos de la capa principal en el modo de realización también incluyen el índice predictor de la cuantización de la LSF, el vector cuantizado de la LSF de la primera etapa, el vector cuantizado de la LSF de la segunda etapa y la ganancia. Los parámetros característicos de la capa de mejora incluyen al menos uno de los siguientes: el parámetro característico de la capa de mejora de la banda inferior y el parámetro característico de la capa de mejora de la banda superior.
Los valores del índice predictor de la cuantización de la LSF, el vector cuantizado de la LSF de la primera etapa y el vector cuantizado de la LSF de la segunda etapa se pueden calcular de acuerdo con el G.729, y la señal de ruido de fondo se puede codificar de acuerdo con los valores calculados con el fin de obtener el flujo de códigos de la capa principal.
El parámetro característico de la capa de mejora de la banda inferior incluye al menos uno de los parámetros fijos del libro de codificación y de los parámetros adaptativos del libro de codificación. Los parámetros fijos del libro de codificación incluyen un índice fijo del libro de códigos, una señal fija del libro de códigos y una ganancia fija del libro
10
15
20
25
30
35
E08706659
25-08-2015
de códigos. Los parámetros adaptativos del libro de codificación incluyen un retardo de tono y una ganancia de tono.
Los estándares asociados describen los métodos para calcular el índice fijo del libro de códigos, la señal fija del libro de códigos, la ganancia fija del libro de códigos, el retardo de tono y la ganancia de tono, y los métodos para codificar la señal de ruido de fondo de acuerdo con el resultado del cálculo con el fin de obtener el flujo de códigos de la capa de mejora de la banda inferior, los cuales son conocidos por aquellos experimentados en la técnica y no se detallan aquí con el propósito de simplificar.
Se debe observar que los parámetros característicos de la capa de mejora de la banda inferior, esto es, los parámetros fijos del libro de codificación y los parámetros adaptativos del libro de codificación se pueden calcular directamente. O también es posible calcular primero los parámetros característicos de la capa principal, esto es, el índice predictor de la cuantización de la LSF, el vector cuantizado de la LSF de la primera etapa, el vector cuantizado de la LSF de la segunda etapa y la ganancia, y a continuación se calcula un resto de los parámetros característicos de la capa principal y la señal de ruido de fondo y se utiliza, además, para calcular el parámetro característico de la capa de mejora de la banda inferior.
Los parámetros característicos de la capa de mejora de la banda superior incluyen al menos una de las siguientes: las envolventes en el dominio del tiempo y las envolventes en el dominio de la frecuencia.
A continuación se describe el cálculo de las envolventes en dominio del tiempo y de la frecuencia de los parámetros característicos de la capa de mejora de la banda superior.
imagen1
Esta ecuación se utiliza para realizar el cálculo con el fin de obtener 16 parámetros de la envolvente en el dominio del tiempo, donde sHB(n) es la señal de la supertrama de voz de entrada. La especificación G.729 especifica que la longitud de cada una de las tramas de SID es de 10 ms, cada trama de SID incluye 80 puntos de muestreo. En el modo de realización de la presente invención, se combinan dos tramas de SID para formar una supertrama de 20ms, la cual incluye 160 puntos de muestreo. La trama de SID de 20 ms se divide a continuación en 16 segmentos teniendo cada uno de ellos una duración de 1,25 ms. Donde i designa el número de serie del segmento dividido; y n designa el número de muestras en cada segmento. Existen 10 puntos de muestreo en cada uno de los segmentos.
Los 16 parámetros de la envolvente en el dominio del tiempo obtenidos se promedian para obtener el valor medio de la envolvente en el dominio del tiempo:
imagen2
A continuación se describe el cálculo del vector cuantizado de la envolvente en el dominio del tiempo y del vector cuantizado de la envolvente en el dominio de la frecuencia. En primer lugar se realiza una Transformada Rápida de Fourier (FFT) sobre la señal sHB(n). A continuación se procesa la señal transformada mediante una ventana de Hamming wF(n) para obtener 12 parámetros de la envolvente en el dominio de la frecuencia:
imagen3
donde,
imagen4
5
10
15
20
25
30
35
40
45
E08706659
25-08-2015
A continuación, se calculan las diferencias entre los 16 parámetros de la envolvente en el dominio del tiempo y el imagen5
valor medio de la envolvente en el dominio del tiempo: , i = 0,...,15. Las 16 diferencias se dividen en dos subvectores de dimensión 8, esto es, se obtiene el vector cuantizado de la envolvente en el dominio del tiempo:
imagen6
Se calculan las diferencias entre los 12 parámetros de la envolvente de la frecuencia y el valor medio de la imagen7
envolvente del tiempo, , j = 0,…,11, para obtener tres subvectores de dimensión 4, esto es los vectores cuantizados de la envolvente del espectro:
imagen8
Después de haber obtenido el valor medio de la envolvente en el dominio del tiempo, el vector cuantizado de la envolvente en el dominio del tiempo y el vector cuantizado de la envolvente en el dominio de la frecuencia, se le asigna a cada uno de los parámetros el número de bits respectivo, con el fin de obtener el flujo de códigos de la capa de mejora de la banda superior.
Paso 803: el flujo de códigos de la capa principal y el flujo de códigos de la capa de mejora codificados se encapsulan en tramas de SID.
Antes de describir la encapsulación del flujo de códigos de la capa principal y el flujo de códigos de la capa de mejora en la trama de SID, se describe la trama de SID. La trama de SID es una trama de SID jerárquica embebida. Una trama de SID jerárquica embebida significa que el flujo de códigos de la capa principal se sitúa en la parte inicial de la trama de SID para formar la capa principal, y el flujo de códigos de la capa de mejora se sitúa después del flujo de códigos de la capa principal para formar la capa de mejora. El flujo de códigos de la capa de mejora incluye el flujo de códigos de la capa de mejora de la banda inferior y el flujo de códigos de la capa de mejora de la banda superior, o uno de ellos. Aquí, el flujo de códigos inmediatamente a continuación del flujo de códigos de la capa principal puede ser el flujo de códigos de la capa de mejora de la banda inferior o el flujo de códigos de la capa de mejora de la banda superior.
La Fig. 9 es un diagrama de bloques de la trama de SID mencionada anteriormente. Tal como se muestra en la Fig. 9, la trama de SID incluye una parte de la capa principal y una parte de la capa de mejora. La parte de la capa de mejora incluye al menos una de las siguientes: la capa de mejora de la banda inferior y la capa de mejora de la banda superior. La capa de mejora de la banda superior puede incluir una pluralidad de capas; normalmente, la señal de ruido de fondo en el rango de 4k~7K se encapsula como una capa, y la señal de ruido de fondo de más de 7K se puede codificar y encapsular como una pluralidad de capas como, por ejemplo, n capas, el valor de n viene determinado por el rango de frecuencias de la señal de ruido de fondo y la división actual del rango de frecuencias. Se debe observar que el flujo de códigos de la capa de mejora de la banda inferior se puede situar antes o después del flujo de códigos de la capa de mejora de la banda superior, o incluso se puede situar entre una pluralidad de flujos de códigos de la capa de mejora de la banda superior. Todos los métodos alternativos se encuentran incluidos dentro del alcance de protección de la presente invención. La Fig. 9 es un gráfico general que muestra una estructura de la trama de SID, la cual se puede ajustar en función de las condiciones específicas. Por ejemplo, si la trama de SID no incluye el flujo de códigos de la capa de mejora de la banda inferior, entonces en la Fig. 9 no existe una capa de mejora de la banda inferior.
En la Fig. 9 se muestra la estructura de la trama de SID. En este paso, después de haber codificado la señal de ruido de fondo, se asigna un número de bits a los parámetros característicos de la capa principal y los parámetros característicos de la capa de mejora codificados. A continuación se muestra una tabla de asignación del número de bits para la trama de SID. La Tabla 2 es una tabla de asignación del número de bits para la trama de SID. La tabla incluye la capa principal, la capa de mejora de la banda inferior y la capa de mejora de la banda superior, en donde el parámetro característico de la capa de mejora de la banda inferior está representado con un parámetro fijo del libro de códigos.
Descripción de parámetros característicos
Número de bits
Índice predictor de la cuantización de la LSF
1
Vector cuantizado de la LSF de la primera etapa
5
Vector cuantizado de la LSF de la segunda etapa
4
Ganancia
5
Índice fijo del libro de códigos
13
Señal fija del libro de códigos
4
Ganancia fija del libro de códigos
3
Valor medio de la envolvente en el dominio del tiempo
5
Vector cuantizado de la envolvente en el dominio del tiempo
14
Vector cuantizado de la envolvente en el dominio de la frecuencia
14
imagen9
Capa principal
Capa de mejora de la banda inferior
Capa de mejora de la banda superior
Tabla 2
En este paso, el proceso para encapsular el flujo de códigos de la capa principal y el flujo de códigos de la capa de mejora en la trama de SID es como sigue: tal como se muestra en la Fig. 2, se asigna el número de bits para los parámetros característicos de la capa principal, los parámetros característicos de la capa de mejora de la banda 5 inferior y los parámetros característicos de la capa de mejora de la banda superior, respectivamente, con el fin de obtener el flujo de códigos de la capa principal, el flujo de códigos de la capa de mejora de la banda inferior y el flujo de códigos de la capa de mejora de la banda superior. La encapsulación de la trama de SID se lleva a cabo mediante la inserción en el flujo de datos del flujo de códigos de la capa principal, el flujo de códigos de la capa de mejora de la banda inferior y el flujo de códigos de la capa de mejora de la banda superior obtenidos, de acuerdo 10 con la secuencia que se muestra en la Tabla 2. Se debe observar que, si se cambia el formato que se muestra en la Tabla 2, por ejemplo si la capa de mejora de la banda superior se sitúa antes que la capa de mejora de la banda inferior, antes de la encapsulación de la SID se realizan los cambios correspondientes, esto es, el flujo de códigos de la capa principal, el flujo de códigos de la capa de mejora de la banda superior y el flujo de códigos de la capa de mejora de la banda inferior se insertan en este orden en el flujo de datos. La descripción del método de la
15 encapsulación de la trama de SID no pretende limitar el alcance de la presente invención, y dentro del alcance de protección de la presente invención también se encuentra cualquier otro método alternativo. Los esquemas alternativos de la estructura y el formato de encapsulación de la trama de SID son consistentes con la descripción de los esquemas alternativos de la estructura y el formato de encapsulación de la trama de SID los cuales se muestran en laFig.9 y enla Tabla 2.
20 Si los parámetros característicos de la capa de mejora incluyen al menos el parámetro característico de la capa de mejora de la banda superior, después del paso 801 y antes del paso 802, el método que se muestra en la Fig. 8 incluye, además: mediante la utilización de un filtro espejo en cuadratura (QMF) u otros filtros, dividir la señal de ruido de fondo en una señal de ruido de fondo de banda inferior y una señal de ruido de fondo de banda superior. Específicamente, las operaciones entre el paso 802 y 803 son como sigue: los parámetros característicos de la capa
25 principal se extraen en función de la señal de ruido de fondo de la banda inferior, y el parámetro característico de la capa de mejora de la banda superior se extrae en función de la señal de ruido de fondo de la banda superior; los parámetros característicos de la capa principal se codifican con el fin de obtener el flujo de códigos de la capa principal y el parámetro característico de la capa de mejora de la banda superior se codifica para generar el flujo de códigos de la capa de mejora de la banda superior; y el flujo de códigos de la capa principal y el flujo de códigos de
30 la capa de mejora de la banda superior se encapsulan en la trama de SID.
Si los parámetros característicos de la capa de mejora incluyen además el parámetro característico de la capa de mejora de la banda inferior, el parámetro característico de la capa de mejora de la banda inferior también se extrae en función de la señal de ruido de fondo de la banda inferior y se codifica para generar el flujo de códigos de la capa de mejora de la banda inferior, el cual se encapsula en la trama de SID. Se debe observar que tanto el flujo de 35 códigos de la capa de mejora de la banda inferior como el flujo de códigos de la capa de mejora de la banda superior corresponden a unos flujos de códigos de la capa de mejora. Si los parámetros característicos de la capa de mejora no incluyen los parámetros característicos de la capa de mejora de la banda superior, no es necesario dividir la señal de ruido de fondo en una señal de ruido de fondo de la banda inferior y una señal de ruido de fondo de la banda superior. Concretamente, las operaciones desde el paso 802 al 803 son como sigue: los parámetros característicos 40 de la capa principal y el parámetro característico de la capa de mejora de la banda inferior se extraen en función del señal de ruido de fondo de la banda inferior y se codifican, y el flujo de códigos de la capa principal y el flujo de
10
15
20
25
30
35
40
45
E08706659
25-08-2015
códigos de la capa de mejora de la banda inferior codificados se encapsulan en la trama de SID.
Esto describe el método para la codificación de la señal de ruido de fondo. Basándose en el método para codificar la señal de ruido de fondo, los parámetros característicos de la capa de mejora se pueden utilizar, además, para codificar con más precisión la señal de ruido de fondo, lo cual puede mejorar la calidad de la codificación de la señal de ruido de fondo.
En el siguiente ejemplo se describe la solución técnica para la decodificación de la señal de ruido de fondo que se corresponde con el método de codificación que se muestra en la Fig. 8.
La Fig. 10 ilustra un diagrama de flujo de un método para la decodificación de la señal de ruido de fondo. Tal como se muestra en la Fig. 10, el método incluye los siguientes pasos:
Paso 1001: se recibe la trama de SID de la señal de ruido de fondo.
Paso 1002: el flujo de códigos de la capa principal y el flujo de códigos de la capa de mejora se extraen de la trama de SID.
En este paso, el paso de extracción del flujo de códigos de la capa principal y del flujo de códigos de la capa de mejora de la trama de SID incluyen: interceptar el flujo de códigos de la capa principal y el flujo de códigos de la capa de mejora de acuerdo con la trama de SID encapsulada en el paso 803. Por ejemplo, en función del formato de la trama de SID de la Tabla 2, se interceptan por orden 15 bits del flujo de códigos de la capa principal, 20 bits del flujo de códigos de la capa de mejora de la banda inferior y 33 bits del flujo de códigos de la capa de mejora de la banda superior.
Se debe observar que el flujo de códigos de la capa de mejora incluye al menos uno de los siguientes: el flujo de códigos de la capa de mejora de la banda inferior y el flujo de códigos de la capa de mejora de la banda superior. Si en la Tabla 2 no se incluye la capa de mejora de la banda inferior, esto es, la trama de SID encapsulada no incluye el flujo de códigos de la capa de mejora de la banda inferior, el flujo de códigos de la capa de mejora extraído incluye únicamente el flujo de códigos de la capa de mejora de la banda superior. Si cambia el formato de encapsulación de la trama de SID que se muestra en la Fig. 2, en este paso se ajusta adecuadamente el método para extraer el flujo de códigos de la capa principal y el flujo de códigos de la capa de mejora. De cualquier modo, sin duda el formato de la trama de SID encapsulada se especifica por adelantado en los extremos de codificación y decodificación, y las operaciones de codificación y decodificación se realizan en función del formato especificado con el fin de asegurar la consistencia entre la codificación y la decodificación.
Paso 1003: se analizan los parámetros característicos de la capa principal y los parámetros característicos de la capa de mejora en función del flujo de códigos de la capa principal y del flujo de códigos de la capa de mejora.
Los parámetros característicos de la capa principal y los parámetros característicos de la capa de mejora enumerados en este paso son los mismos que los enumerados en el paso 802.
Haciendo referencia al G.729, se pueden analizar los valores del índice predictor de la cuantización de la LSF, el vector cuantizado de la LSF de la primera etapa y el vector cuantizado de la LSF de la segunda etapa.
En este modo de realización, de forma parecida, se toma como ejemplo la trama de SID que se muestra en la Fig. 9, esto es, los parámetros característicos incluidos en la capa de mejora de la banda inferior son el índice fijo del libro de códigos, la señal fija del libro de códigos y la ganancia fija del libro de códigos. Los valores del índice fijo del libro de códigos, la señal fija del libro de códigos, la ganancia fija del libro de códigos, el retardo de tono y la ganancia de tono se pueden calcular de acuerdo con el G.729.
En el paso 803 se calculan los siguientes parámetros:
el valor medio de la envolvente en el dominio del tiempo:
imagen10
el vector cuantizado de la envolvente en el dominio del tiempo:
imagen11
el vector cuantizado de la envolvente del espectro:
E08706659
25-08-2015
imagen12
imagen13
Estos parámetros se utilizan para calcular los parámetros de la envolvente en el dominio del 0,…,15 y los parámetros de la envolvente en el dominio de la
, j =0,…,11.
5 Paso 1004: los parámetros característicos de la capa principal y los parámetros característicos de la capa de mejora se analizan con el fin de obtener la señal de ruido de fondo reconstruida.
En este paso, se obtiene mediante decodificación la señal de ruido de fondo de la capa principal reconstruida, en función del índice predictor de la cuantización de la LSF, el vector cuantizado de la LSF de la primera etapa y el vector cuantizado de la LSF de la segunda etapa analizados de acuerdo con el G.729.
10 La señal de ruido de fondo de la capa de mejora de la banda inferior reconstruida obtenida es del siguiente modo:
imagen14
âi es el coeficiente de interpolación del filtro Â(z) de síntesis de la predicción lineal (LP) de la trama actual; es la señal obtenida mediante la combinación de la señal u(n) de excitación de , n=0,…,39, de excitación fija de mejora de banda inferior del libro de
imagen15
de excitación fija de mejora de banda inferior del libro de códigos se obtiene El método para obtener la señal de ruido de fondo de la capa de mejora de la banda superior reconstruida es como sigue: En el dominio del tiempo, el parámetro
imagen16de la envolvente en el dominio del tiempo obtenida mediante la 20 decodificación se utiliza para calcular la función de ganancia gT(n), la cual se multiplica a continuación por la señal de excitación para obtener En el dominio de la frecuencia, la ganancia de corrección de dos subtramas se calcula
para cada una de las supertramas se construyen dos filtros lineales de respuesta al impulso finito de fase (FIR):
imagen17
imagen18
imagen19
imagen20
Los dos filtros de corrección FIR se aplican a la señal para generar la señal de ruido de fondo de la capa de mejora de la banda superior reconstruida:
imagen21
Se sintetizan la señal de ruido de fondo de la capa principal reconstruida, la señal de ruido de fondo de la capa de 30 mejora de la banda inferior reconstruida y la señal de ruido de fondo de la capa de mejora de la banda superior reconstruida obtenidas mediante la decodificación con el fin de obtener la señal de ruido de fondo reconstruida, esto
E08706659
25-08-2015
es, la señal de ruido de fondo confortable.
En este modo de realización, los parámetros característicos de la capa principal, uno o ambos de los siguientes: el parámetro característico de la capa de mejora de la banda inferior y el parámetro característico de la capa de mejora de la banda superior se obtienen mediante la decodificación en función de la trama de SID codificada obtenida 5 mediante el modo de realización que se muestra en la Fig. 8. A continuación se decodifican los parámetros característicos para obtener la señal de ruido de fondo reconstruida. Se observa que, además de los parámetros característicos de la capa principal, también se utilizan para decodificar la señal de ruido de fondo los parámetros característicos de la capa de mejora de la banda inferior y los parámetros característicos de la capa de mejora de la banda superior. De este modo, la señal de ruido de fondo se puede recuperar con más precisión, y se puede mejorar
10 la calidad de la decodificación de la señal de ruido de fondo.
En resumen, los ejemplos descritos más arriba no pretender limitar el alcance de la presente invención. Se pretende que se encuentre incluida en el alcance de la presente invención cualquier modificación, sustitución equivalente y mejora sin que se aparte del alcance de la presente invención, mientras que el alcance de la presente invención está definido por las reivindicaciones adjuntas.
15

Claims (13)

  1. REIVINDICACIONES
    1. Un método para la codificación de una señal de ruido de fondo, que comprende:
    dividir la señal de ruido de fondo en una señal de ruido de fondo de banda inferior y una señal de ruido de 5 fondo de banda superior;
    extraer los parámetros característicos de la capa principal y los parámetros característicos de la capa de mejora de la señal de ruido de fondo;
    en donde la extracción de los parámetros característicos de la capa principal y los parámetros característicos de la capa de mejora de la señal de ruido de fondo comprende:
    10 extraer los parámetros característicos de la capa principal de la señal de ruido de fondo de la banda inferior y extraer los parámetros característicos de la capa de mejora de la banda superior de la señal de ruido de fondo de la banda superior; y
    codificar los parámetros característicos de la capa principal y los parámetros característicos de la capa de mejora con el fin de obtener un flujo de códigos de la capa principal y un flujo de códigos de la capa de mejora.
    15 2. El método de la reivindicación 1, en el que la extracción de los parámetros característicos de la capa principal y los parámetros característicos de la capa de mejora de la señal de ruido de fondo comprende, además:
    extraer los parámetros característicos de la capa de mejora de la banda inferior de la señal de ruido de fondo de la banda inferior.
  2. 3. El método de la reivindicación 2, en el que la extracción de los parámetros característicos de la capa de 20 mejora de la banda inferior comprende:
    calcular los parámetros característicos de la capa de mejora de la banda inferior de acuerdo con el parámetro característico de la capa principal y la señal de ruido de fondo.
  3. 4. El método de una cualquiera de las reivindicaciones 1 a 3, que comprende, además:
    encapsular en una trama de Descripción de Inserción de Silencios, SID, el flujo de códigos de la capa principal 25 y el flujo de códigos de la capa de mejora obtenidos.
  4. 5. Un método de decodificación para obtener una señal de ruido de fondo, que comprende:
    extraer de una trama de Descripción de Inserción de Silencios, SID, un flujo de códigos de la capa principal y un flujo de códigos de la capa de mejora;
    analizar los parámetros característicos de la capa principal de la banda inferior a partir del flujo de códigos de la 30 capa principal;
    analizar los parámetros característicos de la capa de mejora a partir del flujo de códigos de la capa de mejora; y
    decodificar los parámetros característicos de la capa principal de la banda inferior y los parámetros característicos de la capa de mejora con el fin de obtener una señal de ruido de fondo de la capa principal 35 reconstruida y una señal de ruido de fondo de la capa de mejora reconstruida;
    en donde la extracción del flujo de códigos de la capa de mejora a partir de la trama de SID comprende extraer de la trama de SID un flujo de códigos de la capa de mejora de la banda superior; y
    el análisis de los parámetros característicos de la capa de mejora a partir del flujo de códigos de la capa de mejora comprende analizar los parámetros característicos de la capa de mejora de la banda superior a partir del flujo 40 de códigos de la capa de mejora.
  5. 6. El método de la reivindicación 5, en el que
    la extracción del flujo de códigos de la capa de mejora a partir de la trama de SID comprende extraer de la trama de SID un flujo de códigos de la capa de mejora de la banda inferior; y
    el análisis de los parámetros característicos de la capa de mejora a partir del flujo de códigos de la capa de 45 mejora comprende analizar los parámetros característicos de la capa de mejora de la banda inferior a partir del flujo de códigos de la capa de mejora.
    15 5
    10
    15
    20
    25
    30
    35
    40
    45
    50
  6. 7. El método de la reivindicación 5, que comprende, además:
    combinar la señal de ruido de fondo de la capa principal reconstruida y la señal de ruido de fondo de la capa de mejora reconstruida con el fin de obtener una señal de ruido de fondo reconstruida.
  7. 8. Un dispositivo para codificar una señal de ruido de fondo, estando configurado dicho dispositivo para dividir la señal de ruido de fondo en una señal de ruido de fondo de la banda inferior y una señal de ruido de fondo de la banda superior, comprendiendo dicho dispositivo:
    una unidad de codificación de los parámetros característicos de la capa principal configurada para extraer los parámetros característicos de la capa principal de la señal de ruido de fondo de la banda inferior y para transmitirle a una unidad de codificación los parámetros característicos de la capa principal;
    una unidad de codificación de los parámetros característicos de la capa de mejora de la banda superior configurada para extraer unos parámetros característicos de la capa de mejora de la banda superior de la señal de ruido de fondo de la banda superior y para transmitirle a la unidad de codificación los parámetros característicos de la capa de mejora de la banda superior; y
    la unidad de codificación configurada para codificar los parámetros característicos de la capa principal y los parámetros característicos de la capa de mejora recibidos con el fin de obtener un flujo de códigos de la capa principal y un flujo de códigos de la capa de mejora.
  8. 9. El dispositivo de la reivindicación 8, que comprende, además:
    una unidad de encapsulación de la trama de Descriptor de Inserción de Silencios, SID, configurada para encapsular en una trama de SID el flujo de códigos de la capa principal y el flujo de códigos de la capa de mejora.
  9. 10. El dispositivo de la reivindicación 8 ó 9, que comprende, además:
    una unidad de codificación de parámetros característicos de la capa de mejora de la banda inferior configurada para extraer los parámetros característicos de la capa de mejora de la banda inferior de la señal de ruido de fondo de la banda inferior y para transmitirle a la unidad de codificación los parámetros característicos de la capa de mejora de la banda inferior.
  10. 11. Un dispositivo de decodificación para obtener una señal de ruido de fondo, que comprende:
    una unidad de análisis de la trama de Descriptor de Inserción de Silencios, SID, configurada para recibir una trama de SID de la señal de ruido de fondo, extraer de la trama de SID un flujo de códigos de la capa principal y un flujo de códigos de la capa de mejora, transmitir el flujo de códigos de la capa principal a una unidad de decodificación de los parámetros característicos de la capa principal; y transmitirle el flujo de códigos de la capa de mejora a una unidad de decodificación de los parámetros característicos de la capa de mejora;
    la unidad de decodificación de los parámetros característicos de la capa principal configurada para extraer los parámetros característicos de la capa principal de la banda inferior del flujo de códigos de la capa principal y decodificar los parámetros característicos de la capa principal de la banda inferior con el fin de obtener una señal de ruido de fondo de la capa principal reconstruida; y
    la unidad de decodificación de los parámetros característicos de la capa de mejora, configurada para extraer del flujo de códigos de la capa de mejora los parámetros característicos de la capa de mejora y decodificar los parámetros característicos de la capa de mejora con el fin de obtener una señal de ruido de fondo de la capa de mejora reconstruida, en donde la unidad de decodificación de los parámetros característicos de la capa de mejora comprende una unidad de decodificación de los parámetros característicos de la capa de mejora de la banda superior, en donde la unidad de decodificación de los parámetros característicos de la capa de mejora de la banda superior está configurada para extraer del flujo de códigos de la capa de mejora los parámetros característicos de la capa de mejora de la banda superior, y decodificar los parámetros característicos de la capa de mejora de la banda superior con el fin de obtener la señal de ruido de fondo de la capa de mejora reconstruida.
  11. 12. El dispositivo de la reivindicación 11, en el que la unidad de decodificación de los parámetros característicos de la capa de mejora comprende, además, una unidad de decodificación de los parámetros característicos de la capa de mejora de la banda inferior; en donde
    la unidad de decodificación de los parámetros característicos de la capa de mejora de la banda inferior está configurada para extraer del flujo de códigos de la capa de mejora los parámetros característicos de la capa de mejora de la banda inferior, y decodificar los parámetros característicos de la capa de mejora de la banda inferior con el fin de obtener la señal de ruido de fondo de la capa de mejora reconstruida.
  12. 13. El dispositivo de la reivindicación 12, en el que la unidad de decodificación de los parámetros
    16
    característicos de la capa de mejora de la banda inferior comprende:
    una unidad de análisis de los parámetros característicos de la capa de mejora de la banda inferior configurada para extraer del flujo de códigos de la capa de mejora recibido los parámetros característicos de la capa de mejora de la banda inferior, y para transmitirle los parámetros característicos de la capa de mejora de la banda inferior a una
    5 unidad de mejora de la banda inferior; y
    la unidad de mejora de la banda inferior configurada para decodificar los parámetros característicos de la capa de mejora de la banda inferior con el fin de obtener la señal de ruido de fondo de la capa de mejora reconstruida.
  13. 14. El dispositivo de la reivindicación 12, en el que la unidad de decodificación de los parámetros característicos de la capa de mejora de la banda superior comprende:
    10 una unidad de análisis de los parámetros característicos de la capa de mejora de la banda superior configurada para extraer del flujo de códigos de la capa de mejora recibido los parámetros característicos de la capa de mejora de la banda superior y para transmitirle los parámetros característicos de la capa de mejora de la banda superior a una unidad de mejora de la banda superior; y
    la unidad de mejora de la banda superior configurada para decodificar los parámetros característicos de la capa 15 de mejora de la banda superior con el fin de obtener la señal de ruido de fondo de la capa de mejora reconstruida.
    17
ES08706659.3T 2007-02-14 2008-02-05 Un método y un dispositivo de codificación/decodificación Active ES2546028T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN2007100801851A CN101246688B (zh) 2007-02-14 2007-02-14 一种对背景噪声信号进行编解码的方法、***和装置
CN200710080185 2007-02-14
PCT/CN2008/070286 WO2008098512A1 (en) 2007-02-14 2008-02-05 A coding/decoding method, system and apparatus

Publications (1)

Publication Number Publication Date
ES2546028T3 true ES2546028T3 (es) 2015-09-17

Family

ID=39689673

Family Applications (1)

Application Number Title Priority Date Filing Date
ES08706659.3T Active ES2546028T3 (es) 2007-02-14 2008-02-05 Un método y un dispositivo de codificación/decodificación

Country Status (5)

Country Link
US (1) US8775166B2 (es)
EP (1) EP2128859B1 (es)
CN (1) CN101246688B (es)
ES (1) ES2546028T3 (es)
WO (1) WO2008098512A1 (es)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009063928A (ja) * 2007-09-07 2009-03-26 Fujitsu Ltd 補間方法、情報処理装置
DE102008009719A1 (de) * 2008-02-19 2009-08-20 Siemens Enterprise Communications Gmbh & Co. Kg Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen
EP2458586A1 (en) * 2010-11-24 2012-05-30 Koninklijke Philips Electronics N.V. System and method for producing an audio signal
CN102395030B (zh) * 2011-11-18 2014-05-07 杭州海康威视数字技术股份有限公司 基于视频压缩码流的运动分析方法、码流转换方法及其装置
CN103187065B (zh) * 2011-12-30 2015-12-16 华为技术有限公司 音频数据的处理方法、装置和***
US9065576B2 (en) * 2012-04-18 2015-06-23 2236008 Ontario Inc. System, apparatus and method for transmitting continuous audio data
KR102378065B1 (ko) * 2014-07-09 2022-03-25 한국전자통신연구원 레이어드 디비전 멀티플렉싱을 이용한 방송 신호 송신 장치 및 방송 신호 송신 방법
EP2980790A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for comfort noise generation mode selection
CN110070885B (zh) * 2019-02-28 2021-12-24 北京字节跳动网络技术有限公司 音频起始点检测方法和装置

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5774849A (en) * 1996-01-22 1998-06-30 Rockwell International Corporation Method and apparatus for generating frame voicing decisions of an incoming speech signal
US6269331B1 (en) * 1996-11-14 2001-07-31 Nokia Mobile Phones Limited Transmission of comfort noise parameters during discontinuous transmission
US5960389A (en) * 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission
JPH10341256A (ja) * 1997-06-10 1998-12-22 Logic Corp 音声から有音を抽出し、抽出有音から音声を再生する方法および装置
US6240386B1 (en) * 1998-08-24 2001-05-29 Conexant Systems, Inc. Speech codec employing noise classification for noise compensation
SE9803698L (sv) * 1998-10-26 2000-04-27 Ericsson Telefon Ab L M Metoder och anordningar i ett telekommunikationssystem
US7124079B1 (en) * 1998-11-23 2006-10-17 Telefonaktiebolaget Lm Ericsson (Publ) Speech coding with comfort noise variability feature for increased fidelity
US6691084B2 (en) * 1998-12-21 2004-02-10 Qualcomm Incorporated Multiple mode variable rate speech coding
FI116643B (fi) * 1999-11-15 2006-01-13 Nokia Corp Kohinan vaimennus
JP2001242896A (ja) * 2000-02-29 2001-09-07 Matsushita Electric Ind Co Ltd 音声符号化/復号装置およびその方法
US7143178B2 (en) * 2000-06-29 2006-11-28 Qualcomm Incorporated System and method for DTX frame detection
US6615169B1 (en) * 2000-10-18 2003-09-02 Nokia Corporation High frequency enhancement layer coding in wideband speech codec
US6631139B2 (en) * 2001-01-31 2003-10-07 Qualcomm Incorporated Method and apparatus for interoperability between voice transmission systems during speech inactivity
US6721712B1 (en) * 2002-01-24 2004-04-13 Mindspeed Technologies, Inc. Conversion scheme for use between DTX and non-DTX speech coding systems
US7752052B2 (en) 2002-04-26 2010-07-06 Panasonic Corporation Scalable coder and decoder performing amplitude flattening for error spectrum estimation
AU2003278013A1 (en) * 2002-10-11 2004-05-04 Voiceage Corporation Methods and devices for source controlled variable bit-rate wideband speech coding
US7657427B2 (en) * 2002-10-11 2010-02-02 Nokia Corporation Methods and devices for source controlled variable bit-rate wideband speech coding
CN100583241C (zh) * 2003-04-30 2010-01-20 松下电器产业株式会社 音频编码设备、音频解码设备、音频编码方法和音频解码方法
CN1617605A (zh) * 2003-11-12 2005-05-18 皇家飞利浦电子股份有限公司 一种在语音信道传输非语音数据的方法及装置
CA2454296A1 (en) * 2003-12-29 2005-06-29 Nokia Corporation Method and device for speech enhancement in the presence of background noise
CN1322488C (zh) * 2004-04-14 2007-06-20 华为技术有限公司 一种语音增强的方法
KR101171098B1 (ko) * 2005-07-22 2012-08-20 삼성전자주식회사 혼합 구조의 스케일러블 음성 부호화 방법 및 장치
US7610197B2 (en) * 2005-08-31 2009-10-27 Motorola, Inc. Method and apparatus for comfort noise generation in speech communication systems
US20070136055A1 (en) * 2005-12-13 2007-06-14 Hetherington Phillip A System for data communication over voice band robust to noise
EP1982324B1 (en) * 2006-02-10 2014-09-24 Telefonaktiebolaget LM Ericsson (publ) A voice detector and a method for suppressing sub-bands in a voice detector
JP4810335B2 (ja) * 2006-07-06 2011-11-09 株式会社東芝 広帯域オーディオ信号符号化装置および広帯域オーディオ信号復号装置
US8725499B2 (en) * 2006-07-31 2014-05-13 Qualcomm Incorporated Systems, methods, and apparatus for signal change detection
US8032359B2 (en) 2007-02-14 2011-10-04 Mindspeed Technologies, Inc. Embedded silence and background noise compression
US8990073B2 (en) * 2007-06-22 2015-03-24 Voiceage Corporation Method and device for sound activity detection and sound signal classification
CN100555414C (zh) * 2007-11-02 2009-10-28 华为技术有限公司 一种dtx判决方法和装置
CN101483042B (zh) * 2008-03-20 2011-03-30 华为技术有限公司 一种噪声生成方法以及噪声生成装置
CN101335000B (zh) * 2008-03-26 2010-04-21 华为技术有限公司 编码的方法及装置

Also Published As

Publication number Publication date
WO2008098512A1 (en) 2008-08-21
EP2128859A4 (en) 2010-03-10
US20100042416A1 (en) 2010-02-18
EP2128859B1 (en) 2015-06-10
CN101246688B (zh) 2011-01-12
CN101246688A (zh) 2008-08-20
US8775166B2 (en) 2014-07-08
EP2128859A1 (en) 2009-12-02

Similar Documents

Publication Publication Date Title
ES2546028T3 (es) Un método y un dispositivo de codificación/decodificación
US11631417B2 (en) Stereo audio encoder and decoder
KR101664434B1 (ko) 오디오 신호의 부호화 및 복호화 방법 및 그 장치
ES2413807T3 (es) Método y aparato para procesar una señal de audio
US7876966B2 (en) Switching between coding schemes
ES2539304T3 (es) Un aparato y un método para generar datos de salida por ampliación de ancho de banda
ES2865099T3 (es) Procedimiento y aparato de ocultación de errores de trama y procedimiento y aparato de decodificación que usa los mismos
KR101797033B1 (ko) 부호화 모드를 이용한 음성신호의 부호화/복호화 장치 및 방법
US8190440B2 (en) Sub-band codec with native voice activity detection
US10332536B2 (en) Apparatus and method for decoding an encoded audio signal with low computational resources
EP2562750B1 (en) Encoding device, decoding device, encoding method and decoding method
ES2545623T3 (es) Compartición adaptativa de la velocidad de ganancia-forma
US20120123788A1 (en) Coding method, decoding method, and device and program using the methods
ES2911515T3 (es) Codificación de audio
KR20100114450A (ko) 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치
ES2871872T3 (es) Integración retrocompatible de técnicas de reconstrucción de alta frecuencia para señales de audio
KR100653783B1 (ko) 음성 복호화 기능이 구비된 이동통신 단말기 및 그동작방법
WO2009146734A1 (en) Multi-channel audio coding
KR101798084B1 (ko) 부호화 모드를 이용한 음성신호의 부호화/복호화 장치 및 방법
KR101770301B1 (ko) 부호화 모드를 이용한 음성신호의 부호화/복호화 장치 및 방법
KR101455648B1 (ko) 상호 운용성을 지원하는 오디오/스피치 신호의부호화/복호화 방법 및 시스템