ES2588156T3 - Generación de ruido de confort con alta resolución espectro-temporal en transmisión discontinua de señales de audio - Google Patents

Generación de ruido de confort con alta resolución espectro-temporal en transmisión discontinua de señales de audio Download PDF

Info

Publication number
ES2588156T3
ES2588156T3 ES13819029.3T ES13819029T ES2588156T3 ES 2588156 T3 ES2588156 T3 ES 2588156T3 ES 13819029 T ES13819029 T ES 13819029T ES 2588156 T3 ES2588156 T3 ES 2588156T3
Authority
ES
Spain
Prior art keywords
spectrum
noise
output signal
audio output
decoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES13819029.3T
Other languages
English (en)
Inventor
Anthony LOMBARD
Martin Dietz
Stephan Wilde
Emmanuel Ravelli
Panji Setiawan
Markus Multrus
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2588156T3 publication Critical patent/ES2588156T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Noise Elimination (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Abstract

Un decodificador de audio para decodificar un flujo de bits (BS) para producir a partir del mismo una señal de salida de audio (OS), comprendiendo el flujo de bits (BS) por lo menos una fase activa seguida por al menos una fase inactiva, donde el flujo de bits (BS) tiene, codificada en el mismo, por lo menos una trama de descriptor de inserción de silencio (SI) que describe un espectro de un ruido de fondo (SBN), comprendiendo el decodificador de audio (1): un decodificador de descriptores de inserción de silencio (3) configurado para decodificar la trama de descriptor de inserción de silencio (SI) a fin de reconstruir el espectro (SBN) del ruido de fondo; un dispositivo decodificador (2) configurado para reconstruir la señal de salida de audio (OS) a partir del flujo de bits durante la fase activa; un conversor espectral (4) configurado para determinar un espectro (SAS) de la señal de salida de audio (OS); un dispositivo estimador de ruido (5) configurado para determinar un primer espectro (SN1) del ruido de la señal de salida de audio (OS) sobre la base del espectro (SAS) de la señal de salida de audio (OS) provista por el conversor espectral (4), donde el primer espectro (SN1) del ruido de la señal de salida de audio (OS) tiene una resolución espectral más alta que el espectro (SBN) del ruido de fondo; un conversor de resolución (6) configurado para establecer un segundo espectro (SN2) del ruido de la señal de salida de audio (OS) sobre la base del primer espectro (SN1) del ruido de la señal de salida de audio (OS), donde el segundo espectro (SN2) del ruido de la señal de salida de audio (OS) tiene la misma resolución espectral que el espectro (SBN) del ruido de fondo; un dispositivo de estimación del espectro del ruido de confort (7) que consta de un dispositivo de cómputo de factores de escala (7a) configurado para calcular factores de escala (SF) respecto de un espectro (SCN) correspondiente a un ruido de confort (CN) sobre la base del espectro (SBN) del ruido de fondo provisto por el decodificador de descriptores de inserción de silencio (3) y sobre la base del segundo espectro (SN2) del ruido de la señal de salida de audio (OS) provisto por el conversor de resolución (6) y tiene un generador de espectros de ruido de confort (7b) configurado para computar el espectro (SCN) correspondiente a un ruido de confort (CN) sobre la base de los factores de escala (SF); y un generador de ruido de confort (8) configurado para producir el ruido de confort (CN) durante la fase inactiva sobre la base del espectro (SCN) correspondiente al ruido de confort (CN).

Description

imagen1
imagen2
imagen3
imagen4
imagen5
imagen6
Además, el conversor de resolución 6 puede establecer un segundo espectro SN2 del ruido de la señal de salida de audio OS sobre la base del primer espectro SN1 del ruido de la señal de salida de audio OS, donde el segundo espectro SN2 del ruido de la señal de salida de audio OS tiene la misma resolución espectral que el espectro del
5 ruido de fondo SBN.
El dispositivo de cómputo de factores de escala 7a puede computar fácilmente los factores de escala SF correspondientes a un espectro SCN que corresponde a un ruido de confort CN sobre la base del espectro SBN del ruido de fondo provisto por el decodificador de descriptores de inserción de silencio 3 y sobre la base del segundo
10 espectro SN2 del ruido de la señal de salida de audio OS provisto por el conversor de resolución 6, ya que el espectro SBN del ruido de fondo y el segundo espectro SN2 del ruido de la señal de salida de audio OS tienen la misma resolución espectral.
El generador de espectros de ruido de confort 7b puede establecer el espectro SCN correspondiente al ruido de 15 confort CN sobre la base de los factores de escala SF.
Más aun, el generador de ruido de confort 8 puede producir el ruido de confort CN durante la fase inactiva sobre la base del espectro SCN correspondiente al ruido de confort.
20 Las estimaciones de ruido obtenidas en el decodificador 1 contienen información acerca de la estructura espectral del ruido de fondo, que es más precisa que la información acerca de la estructura espectral del ruido de fondo contenida en las tramas SID SI. Sin embargo, estas estimaciones no pueden ser adaptadas durante las fases inactivas, dado que la estimación de ruido se lleva a cabo sobre la señal de salida de audio decodificada OS. Por el contrario, las tramas SID envían nueva información acerca de la envolvente espectral a intervalos regulares durante
25 las fases inactivas. El decodificador 1 de acuerdo con la invención combina estas dos fuentes de información. Los factores de escala SF se pueden actualizar durante las fases activas dependiendo de las estimaciones de ruido del lado del decodificador y durante las fases inactivas dependiendo de las estimaciones de ruido contenidas en las tramas SID SI. La actualización continua de los factores de escala SF garantiza que no haya cambios repentinos de las características del ruido de confort producido CN.
30 Como el espectro SBN del ruido de fondo contenido en las tramas SID SI y el segundo espectro SN2 del ruido de la señal de salida de audio OS tienen la misma resolución espectral, la actualización de los factores de escala SF y, por ende, del ruido de confort CN se pueden realizar de manera sencilla, ya que por cada grupo de bandas de frecuencia del espectro SBN del ruido de fondo contenido en las tramas SID SI existe exactamente un grupo de
35 bandas de frecuencia en el segundo espectro SN2 del ruido de la señal de salida de audio OS. Se debe tener en cuenta que en una realización preferida, el grupo de bandas de frecuencias del espectro del ruido de fondo contenido en las tramas SID SI y el grupo de bandas de frecuencias del segundo espectro SN2 del ruido de la señal de salida de audio OS se corresponden entre sí.
40 Por añadidura, como el espectro SBN del ruido de fondo contenido en las tramas SID SI y el segundo espectro SN2 del ruido de la señal de salida de audio OS tienen la misma resolución espectral, la actualización de los factores de escala SF no produce distorsiones, o estas son sólo escasamente audibles.
De acuerdo con una realización preferida de la invención el analizador espectral 4 comprende un dispositivo de
45 transformación rápida de Fourier. Una transformada rápida de Fourier (FFT) es un algoritmo para computar una transformada discreta de Fourier (DFT) y su inversa, lo que sólo requiere un bajo esfuerzo informático. Por lo tanto, el dispositivo de transformación rápida de Fourier puede calcular el espectro SAS de la señal de salida de audio OS de manera sencilla.
50 De acuerdo con una realización preferida de la invención el dispositivo estimador de ruido 5 comprende un dispositivo conversor 9 configurado para convertir el espectro SAS de la señal de salida de audio OS en un espectro convertido CSA de la señal de salida de audio OS que tiene la misma resolución espectral que el decodificador de núcleo 17. En general, la resolución espectral del espectro SAS de la señal de salida de audio OS obtenida por un conversor espectral 4 es mucho más elevada que la resolución espectral del decodificador de núcleo 17. Mediante la
55 obtención del espectro convertido CSA de la señal de salida de audio OS se puede reducir la complejidad de los pasos de computación subsiguientes.
De acuerdo con una realización preferida de la invención el dispositivo estimador de ruido 5 comprende un estimador de ruido 10 configurado para determinar el primer espectro SN1 del ruido de la señal de salida de audio
60 OS sobre la base del espectro convertido CAS de la señal de salida de audio OS provista por el dispositivo conversor 9. Cuando se utiliza el espectro convertido CSA de la señal de salida de audio OS como base para la estimación de ruido en el decodificador se pueden reducir los esfuerzos de computación sin reducir la calidad de la estimación de ruido.
8
imagen7
imagen8
invención, se utiliza el módulo de extensión de ancho de banda 20 para producir la señal de salida de audio OS, que es alimentada al conversor espectral 4. Merced a estas características, se puede utilizar la totalidad del ancho de banda para producir el ruido de confort.
5 Con respecto a las tres realizaciones del decodificador de audio de acuerdo con la invención se puede agregar lo siguiente: Del lado del decodificador, se puede aplicar un generador aleatorio 8 para excitar cada banda espectral individual en el dominio de la FFT, como así también en el dominio QMF en el caso de los modos SWB. Se deben computar individualmente las secuencias aleatorias en cada banda, de tal manera que el espectro del ruido de confort generado CN se asemeje al espectro del ruido de fondo real presente en el flujo de bits.
10 Las estimaciones de ruido de alta resolución obtenidas en el decodificador 1 capturan información acerca de la fina estructura espectral del ruido de fondo. Sin embargo, estas estimaciones no pueden ser adaptadas durante las fases inactivas, puesto que la estimación de ruido se lleva a cabo sobre la señal OS decodificada. Por el contrario, las tramas SID SI envían nueva información acerca de la envolvente espectral a intervalos regulares durante las fases
15 inactivas. El presente decodificador 1 combina estas dos fuentes de información en un esfuerzo por reproducir la fina estructura espectral capturada del el ruido de fondo presente durante las fases activas, en tanto que sólo se actualiza la envolvente espectral del ruido de confort CN durante las partes inactivas con el auxilio de la información de SID.
20 Para lograr esta meta, se utiliza un estimador de ruido adicional 5 en el decodificador 1, como se ilustra en las Figs. 1 a 3. Por ende, la estimación de ruido se lleva a cabo en ambos extremos del sistema de transmisión, aunque aplica una resolución espectral más elevada en el decodificador 1 que en el codificador 100. Una manera de obtener una resolución espectral elevada en el decodificador 1 consiste simplemente en considerar cada banda espectral en forma individual (resolución total) en lugar de agruparlas por promedio como en el codificador 100. Por otro lado, se
25 puede obtener una compensación entre resolución espectral y complejidad informática llevando a cabo el agrupamiento espectral también en el decodificador 1, aunque utilizando un número mayor de grupos espectrales en comparación con el codificador 100, para producir así una cuantificación más fina del eje de frecuencias en el decodificador.
30 Nótese entonces que la estimación de ruido del lado del decodificador opera en la señal OS decodificada. En un sistema basado en DTX, se debe poder, en consecuencia, operar durante las fases activas solamente, es decir, necesariamente sobre el contenido de voz clara o voz ruidosa (a diferencia de ruido solamente).
Se puede interpolar en primer lugar el espectro de potencia de ruido de alta resolución (HR)
imagen9computado en el 35 decodificador (por ej., usando interpolación lineal) para producir un espectro de potencia de resolución total (FR)
imagen9. Este se puede convertir luego a un espectro de potencia de baja resolución (LR)
imagen9mediante el agrupamiento espectral (es decir, mediante cálculo de promedio) tal como se hiciera en el codificador. El espectro de
potencia
imagen9exhibe, por lo tanto, la misma resolución espectral que los niveles de ruido
imagen9obtenidos de las
tramas SID SI. En comparación con los espectros de ruido de baja resolución
imagen9y imagen9, el espectro de ruido de
40 resolución total puede ser escalado, en última instancia, para producir un espectro de potencia de resolución total de la siguiente manera:
imagen9
imagen10
45 donde
imagen9es el número de grupos espectrales utilizado por la estimación de ruido de baja resolución en el
codificador, y
imagen9denota la primera banda espectral del iº grupo espectral, imagen9. En última instancia
se puede ajustar con precisión el espectro de potencia de ruido de resolución total
imagen9generado en cada banda
FFT o QMF (esto último para los modos SWB únicamente). 50 En las Figs. 1 y 2, se aplican los mecanismos antes citados sólo a los coeficientes FFT. Por ende, en el caso de los
11
imagen11
directamente en la salida de las transformadas espectrales. Por el contrario, se la aplica a una resolución espectral más baja promediando el espectro de potencia de entrada entre los grupos de bandas, por ej., siguiendo la escala de Bark. El promedio se puede obtener por medios aritméticos o geométricos. En el caso de la SWB, el agrupamiento espectral se lleva a cabo para los dominios FFT y QMF por separado, en tanto que los modos NB y
5 WB se basan sólo en el dominio FFT.
Nótese que la reducción de la resolución espectral también es ventajosa en términos de complejidad informática, puesto que la estimación de ruido se debe aplicar a sólo un pequeño número de grupos espectrales en lugar de considerar cada banda espectral por separado.
10 Los niveles de ruido estimados (uno por cada grupo espectral) pueden ser codificados conjuntamente en las tramas SID utilizando técnicas de cuantificación de vectores. En los modos NB y WB, sólo se aprovecha el dominio FFT. Por el contrario, en el caso de los modos SWB, la codificación de las tramas SID se puede llevar a cabo para los dominios FFT y QMF en forma conjunta utilizando cuantificación de vectores, es decir, recurriendo a un libro de
15 códigos único que cubre ambos dominios.
Si bien se han descrito algunos aspectos en el contexto de un aparato, es obvio que estos aspectos también representan una descripción del método correspondiente, en el cual un bloque o dispositivo corresponde a un paso del método o a una característica de un paso del método. De manera análoga, los aspectos descriptos en el
20 contexto de un paso del método también representan una descripción de un bloque o ítem correspondiente o de una característica de un aparato correspondiente. Algunos o todos los pasos del método pueden ser ejecutados por medio de (o utilizando) un aparato de hardware, como por ejemplo, un microprocesador, una computadora programable o un circuito electrónico. En algunas realizaciones, uno cualquiera o más de los pasos más importantes del método pueden ser ejecutados por ese tipo de aparato.
25 Dependiendo de ciertos requisitos de implementación, las realizaciones de la invención pueden ser implementadas en hardware o en software. La implementación se puede realizar empleando un medio de almacenamiento digital, por ejemplo un disco blando, un DVD, un BlueRay, un CD, una ROM, una PROM, una EPROM, una EEPROM o una memoria FLASH, que tiene almacenadas en la misma señales control legibles electrónicamente, que cooperan
30 (o tienen capacidad para cooperar) con un sistema de computación programable de tal manera que se ejecute el método respectivo. Por lo tanto, el medio de almacenamiento digital puede ser legible por una computadora.
Algunas realizaciones de acuerdo con la invención comprenden un transportador de datos que comprende señales de control legibles electrónicamente, con capacidad para cooperar con un sistema de computación programable de
35 tal manera que se ejecute uno de los métodos descriptos en la presente.
En general, las realizaciones de la presente invención pueden ser implementadas en forma de producto programa de computación con un código de programa, donde el código de programa cumple la función de ejecutar uno de los métodos al ejecutarse el programa de computación en una computadora. El código de programa puede ser
40 almacenado, por ejemplo, en un portador legible por una máquina.
Otras realizaciones comprenden el programa de computación para ejecutar uno de los métodos aquí descriptos, almacenado en un portador legible por una máquina.
45 En otras palabras, una realización del método de la invención consiste, por lo tanto, en un programa de computación que consta de un código de programa para realizar uno de los métodos aquí descriptos al ejecutarse el programa de computación en una computadora.
Otra de las realizaciones de los métodos de la invención consiste, por lo tanto, en un portador de datos (o medio de
50 almacenamiento digital, o medio legible por computadora) que comprende, grabado en el mismo, el programa de computación para ejecutar uno de los métodos aquí descriptos. El portador de datos, el medio de almacenamiento digital o el medio grabado son por lo general tangibles y no transitorios.
Otra realización del método de la invención es, por lo tanto, un flujo de datos o una secuencia de señales que
55 representa el programa de computación para ejecutar uno de los métodos aquí descriptos. El flujo de datos o la secuencia de señales pueden estar configuradas, por ejemplo, para ser transferida a través de una conexión de comunicación de datos, por ejemplo por Internet.
Otra realización comprende un medio de procesamiento, por ejemplo un ordenador, un dispositivo lógico 60 programable, configurado o adaptado para ejecutar uno de los métodos aquí descritos.
Otra realización comprende una computadora en la que se ha instalado el programa de computación para ejecutar uno de los métodos aquí descritos.
13
imagen12
imagen13

Claims (1)

  1. imagen1
    imagen2
    imagen3
ES13819029.3T 2012-12-21 2013-12-19 Generación de ruido de confort con alta resolución espectro-temporal en transmisión discontinua de señales de audio Active ES2588156T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201261740857P 2012-12-21 2012-12-21
US201261740857P 2012-12-21
PCT/EP2013/077525 WO2014096279A1 (en) 2012-12-21 2013-12-19 Generation of a comfort noise with high spectro-temporal resolution in discontinuous transmission of audio signals

Publications (1)

Publication Number Publication Date
ES2588156T3 true ES2588156T3 (es) 2016-10-31

Family

ID=49949638

Family Applications (1)

Application Number Title Priority Date Filing Date
ES13819029.3T Active ES2588156T3 (es) 2012-12-21 2013-12-19 Generación de ruido de confort con alta resolución espectro-temporal en transmisión discontinua de señales de audio

Country Status (20)

Country Link
US (1) US9583114B2 (es)
EP (1) EP2936487B1 (es)
JP (1) JP6180544B2 (es)
KR (1) KR101690899B1 (es)
CN (1) CN104871242B (es)
AR (1) AR094278A1 (es)
AU (1) AU2013366642B2 (es)
BR (1) BR112015014212B1 (es)
CA (1) CA2894625C (es)
ES (1) ES2588156T3 (es)
HK (1) HK1216448A1 (es)
MX (1) MX344169B (es)
MY (1) MY171106A (es)
PL (1) PL2936487T3 (es)
PT (1) PT2936487T (es)
RU (1) RU2650025C2 (es)
SG (1) SG11201504810YA (es)
TW (1) TWI539445B (es)
WO (1) WO2014096279A1 (es)
ZA (1) ZA201505193B (es)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
USD589322S1 (en) 2006-10-05 2009-03-31 Lowe's Companies, Inc. Tool handle
CN103187065B (zh) 2011-12-30 2015-12-16 华为技术有限公司 音频数据的处理方法、装置和***
EP2936486B1 (en) 2012-12-21 2018-07-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Comfort noise addition for modeling background noise at low bit-rates
AU2013366642B2 (en) 2012-12-21 2016-09-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Generation of a comfort noise with high spectro-temporal resolution in discontinuous transmission of audio signals
EP2980790A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for comfort noise generation mode selection
EP2980801A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals
US10325588B2 (en) * 2017-09-28 2019-06-18 International Business Machines Corporation Acoustic feature extractor selected according to status flag of frame of acoustic signal
US10805191B2 (en) 2018-12-14 2020-10-13 At&T Intellectual Property I, L.P. Systems and methods for analyzing performance silence packets
GB2595891A (en) * 2020-06-10 2021-12-15 Nokia Technologies Oy Adapting multi-source inputs for constant rate encoding
MX2023002238A (es) 2020-08-31 2023-04-21 Fraunhofer Ges Forschung Enerador de señales multicanal, codificador de audio y métodos relacionados que se basan en una señal de ruido de mezcla.

Family Cites Families (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5537509A (en) * 1990-12-06 1996-07-16 Hughes Electronics Comfort noise generation for digital communication systems
ATE294441T1 (de) 1991-06-11 2005-05-15 Qualcomm Inc Vocoder mit veränderlicher bitrate
US5630016A (en) * 1992-05-28 1997-05-13 Hughes Electronics Comfort noise generation for digital communication systems
US5657422A (en) 1994-01-28 1997-08-12 Lucent Technologies Inc. Voice activity detection driven noise remediator
FI101439B (fi) * 1995-04-13 1998-06-15 Nokia Telecommunications Oy Transkooderi, jossa on tandem-koodauksen esto
JP3252782B2 (ja) 1998-01-13 2002-02-04 日本電気株式会社 モデム信号対応音声符号化復号化装置
US6122611A (en) 1998-05-11 2000-09-19 Conexant Systems, Inc. Adding noise during LPC coded voice activity periods to improve the quality of coded speech coexisting with background noise
US6424938B1 (en) 1998-11-23 2002-07-23 Telefonaktiebolaget L M Ericsson Complex signal activity detection for improved speech/noise classification of an audio signal
RU2237296C2 (ru) * 1998-11-23 2004-09-27 Телефонактиеболагет Лм Эрикссон (Пабл) Кодирование речи с функцией изменения комфортного шума для повышения точности воспроизведения
US8583427B2 (en) * 1999-11-18 2013-11-12 Broadcom Corporation Voice and data exchange over a packet based network with voice detection
US20070110042A1 (en) * 1999-12-09 2007-05-17 Henry Li Voice and data exchange over a packet based network
JP2001318694A (ja) 2000-05-10 2001-11-16 Toshiba Corp 信号処理装置、信号処理方法および記録媒体
US6873604B1 (en) * 2000-07-31 2005-03-29 Cisco Technology, Inc. Method and apparatus for transitioning comfort noise in an IP-based telephony system
US6615169B1 (en) * 2000-10-18 2003-09-02 Nokia Corporation High frequency enhancement layer coding in wideband speech codec
US6807525B1 (en) * 2000-10-31 2004-10-19 Telogy Networks, Inc. SID frame detection with human auditory perception compensation
US20030120484A1 (en) 2001-06-12 2003-06-26 David Wong Method and system for generating colored comfort noise in the absence of silence insertion description packets
CA2388439A1 (en) 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
RU2331933C2 (ru) 2002-10-11 2008-08-20 Нокиа Корпорейшн Способы и устройства управляемого источником широкополосного кодирования речи с переменной скоростью в битах
JP4311541B2 (ja) 2003-10-06 2009-08-12 アルパイン株式会社 オーディオ信号圧縮装置
US7649988B2 (en) * 2004-06-15 2010-01-19 Acoustic Technologies, Inc. Comfort noise generator using modified Doblinger noise estimate
US7454010B1 (en) * 2004-11-03 2008-11-18 Acoustic Technologies, Inc. Noise reduction and comfort noise gain control using bark band weiner filter and linear attenuation
EP1897085B1 (en) * 2005-06-18 2017-05-31 Nokia Technologies Oy System and method for adaptive transmission of comfort noise parameters during discontinuous speech transmission
US7610197B2 (en) 2005-08-31 2009-10-27 Motorola, Inc. Method and apparatus for comfort noise generation in speech communication systems
US8139777B2 (en) * 2007-10-31 2012-03-20 Qnx Software Systems Co. System for comfort noise injection
US8554550B2 (en) 2008-01-28 2013-10-08 Qualcomm Incorporated Systems, methods, and apparatus for context processing using multi resolution analysis
DE102008009719A1 (de) * 2008-02-19 2009-08-20 Siemens Enterprise Communications Gmbh & Co. Kg Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen
US20090222268A1 (en) * 2008-03-03 2009-09-03 Qnx Software Systems (Wavemakers), Inc. Speech synthesis system having artificial excitation signal
CN101335000B (zh) 2008-03-26 2010-04-21 华为技术有限公司 编码的方法及装置
ES2379761T3 (es) 2008-07-11 2012-05-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Proporcinar una señal de activación de distorsión de tiempo y codificar una señal de audio con la misma
EP2345030A2 (en) * 2008-10-08 2011-07-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-resolution switched audio encoding/decoding scheme
EP3352168B1 (en) * 2009-06-23 2020-09-16 VoiceAge Corporation Forward time-domain aliasing cancellation with application in weighted or original signal domain
EP2491548A4 (en) 2009-10-19 2013-10-30 Ericsson Telefon Ab L M VOICE ACTIVITY METHOD AND DETECTOR FOR SPEECH ENCODER
CN103282959B (zh) 2010-10-25 2015-06-03 沃伊斯亚吉公司 低位速率和短延迟地编码普通音频信号
DK3493205T3 (da) 2010-12-24 2021-04-19 Huawei Tech Co Ltd Fremgangsmåde og indretning til adaptiv detektion af stemmeaktivitet i et lydindgangssignal
AR085895A1 (es) * 2011-02-14 2013-11-06 Fraunhofer Ges Forschung Generacion de ruido en codecs de audio
RU2586838C2 (ru) * 2011-02-14 2016-06-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Аудиокодек, использующий синтез шума в течение неактивной фазы
US20120237048A1 (en) 2011-03-14 2012-09-20 Continental Automotive Systems, Inc. Apparatus and method for echo suppression
ES2604652T3 (es) 2012-08-31 2017-03-08 Telefonaktiebolaget Lm Ericsson (Publ) Método y dispositivo para detectar la actividad vocal
AU2013366642B2 (en) 2012-12-21 2016-09-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Generation of a comfort noise with high spectro-temporal resolution in discontinuous transmission of audio signals
US9106196B2 (en) 2013-06-20 2015-08-11 2236008 Ontario Inc. Sound field spatial stabilizer with echo spectral coherence compensation

Also Published As

Publication number Publication date
EP2936487B1 (en) 2016-06-22
ZA201505193B (en) 2016-07-27
CN104871242B (zh) 2017-10-24
BR112015014212B1 (pt) 2021-10-19
JP6180544B2 (ja) 2017-08-16
TW201428734A (zh) 2014-07-16
RU2650025C2 (ru) 2018-04-06
MY171106A (en) 2019-09-25
PT2936487T (pt) 2016-09-23
KR101690899B1 (ko) 2016-12-28
BR112015014212A2 (pt) 2017-08-22
JP2016500452A (ja) 2016-01-12
CN104871242A (zh) 2015-08-26
WO2014096279A1 (en) 2014-06-26
US9583114B2 (en) 2017-02-28
SG11201504810YA (en) 2015-07-30
US20150287415A1 (en) 2015-10-08
HK1216448A1 (zh) 2016-11-11
KR20150096494A (ko) 2015-08-24
TWI539445B (zh) 2016-06-21
EP2936487A1 (en) 2015-10-28
CA2894625C (en) 2017-11-07
PL2936487T3 (pl) 2016-12-30
AR094278A1 (es) 2015-07-22
RU2015129691A (ru) 2017-01-26
AU2013366642A1 (en) 2015-07-02
MX344169B (es) 2016-12-07
MX2015007434A (es) 2015-09-16
AU2013366642B2 (en) 2016-09-22
CA2894625A1 (en) 2014-06-26

Similar Documents

Publication Publication Date Title
ES2588156T3 (es) Generación de ruido de confort con alta resolución espectro-temporal en transmisión discontinua de señales de audio
ES2760573T3 (es) Decodificador de audio y método para proveer una información de audio decodificada usando un ocultamiento de error que modifica una señal de excitación de dominio de tiempo
ES2398573T3 (es) Número reducido de decodificación de canales
ES2888804T3 (es) Conformación simultánea de ruido en el dominio del tiempo y el dominio de la frecuencia para transformaciones TDAC
ES2664185T3 (es) Codificador de audio, decodificador de audio, método para proporcionar una información de audio codificada, método para proporcionar una información de audio decodificada, programa informático y representación codificada utilizando una ampliación de ancho de banda adaptada a la señal
ES2780000T3 (es) Seleccionar un procedimiento de ocultación de pérdida de paquetes
US9449605B2 (en) Inactive sound signal parameter estimation method and comfort noise generation method and system
ES2732560T3 (es) Llenado de ruido sin información secundaria para codificadores tipo celp
ES2526783T3 (es) Generador de filigrana digital, decodificador de filigrana digital, procedimiento para proporcionar una señal de filigrana digital en base a datos valorados discretos y procedimiento para proporcionar datos valorados discretos en dependencia de una señal de filigrana digital
ES2900594T3 (es) Procedimiento para determinar un modo de codificación
BR122019025115B1 (pt) Sistema e método para gerar um sinal de tempo alongado e/ou de frequência transposta a partir de um sinal de entrada e meio de armazenamento legível por computador não transitório
US11501788B2 (en) Periodic-combined-envelope-sequence generation device, periodic-combined-envelope-sequence generation method, periodic-combined-envelope-sequence generation program and recording medium
US9646619B2 (en) Coding of multichannel audio content
ES2709327T3 (es) Método de descodificación y descodificador para la mejora del diálogo
US20190096413A1 (en) Encoder, decoder, coding method, decoding method, coding program, decoding program and recording medium
ES2783975T3 (es) Codificación multicanal
ES2732440T3 (es) Dispositivo de procesamiento de señales de habla, método de procesamiento de señales de habla y programa de procesamiento de señales de habla
ES2908564T3 (es) Codificación de una señal de sonido
ES2901749T3 (es) Método de descodificación, aparato de descodificación, programa y soporte de registro correspondientes
ES2802373T3 (es) Aparato y método de selección de modo de generación de ruido de confort
BR112017001394B1 (pt) Aparelho e método para seleção de modo de geração de ruído de conforto