ES2588156T3 - Generación de ruido de confort con alta resolución espectro-temporal en transmisión discontinua de señales de audio - Google Patents
Generación de ruido de confort con alta resolución espectro-temporal en transmisión discontinua de señales de audio Download PDFInfo
- Publication number
- ES2588156T3 ES2588156T3 ES13819029.3T ES13819029T ES2588156T3 ES 2588156 T3 ES2588156 T3 ES 2588156T3 ES 13819029 T ES13819029 T ES 13819029T ES 2588156 T3 ES2588156 T3 ES 2588156T3
- Authority
- ES
- Spain
- Prior art keywords
- spectrum
- noise
- output signal
- audio output
- decoder
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005540 biological transmission Effects 0.000 title description 2
- 230000005236 sound signal Effects 0.000 title 1
- 238000001228 spectrum Methods 0.000 abstract description 57
- 230000003595 spectral effect Effects 0.000 abstract description 40
- 239000012073 inactive phase Substances 0.000 abstract description 7
- 238000003780 insertion Methods 0.000 abstract description 5
- 230000037431 insertion Effects 0.000 abstract description 5
- 239000012071 phase Substances 0.000 abstract description 3
- 238000000034 method Methods 0.000 description 19
- 238000004590 computer program Methods 0.000 description 8
- 239000012072 active phase Substances 0.000 description 3
- 238000011002 quantification Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 241001025261 Neoraja caerulea Species 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
- Noise Elimination (AREA)
- Circuit For Audible Band Transducer (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
Abstract
Un decodificador de audio para decodificar un flujo de bits (BS) para producir a partir del mismo una señal de salida de audio (OS), comprendiendo el flujo de bits (BS) por lo menos una fase activa seguida por al menos una fase inactiva, donde el flujo de bits (BS) tiene, codificada en el mismo, por lo menos una trama de descriptor de inserción de silencio (SI) que describe un espectro de un ruido de fondo (SBN), comprendiendo el decodificador de audio (1): un decodificador de descriptores de inserción de silencio (3) configurado para decodificar la trama de descriptor de inserción de silencio (SI) a fin de reconstruir el espectro (SBN) del ruido de fondo; un dispositivo decodificador (2) configurado para reconstruir la señal de salida de audio (OS) a partir del flujo de bits durante la fase activa; un conversor espectral (4) configurado para determinar un espectro (SAS) de la señal de salida de audio (OS); un dispositivo estimador de ruido (5) configurado para determinar un primer espectro (SN1) del ruido de la señal de salida de audio (OS) sobre la base del espectro (SAS) de la señal de salida de audio (OS) provista por el conversor espectral (4), donde el primer espectro (SN1) del ruido de la señal de salida de audio (OS) tiene una resolución espectral más alta que el espectro (SBN) del ruido de fondo; un conversor de resolución (6) configurado para establecer un segundo espectro (SN2) del ruido de la señal de salida de audio (OS) sobre la base del primer espectro (SN1) del ruido de la señal de salida de audio (OS), donde el segundo espectro (SN2) del ruido de la señal de salida de audio (OS) tiene la misma resolución espectral que el espectro (SBN) del ruido de fondo; un dispositivo de estimación del espectro del ruido de confort (7) que consta de un dispositivo de cómputo de factores de escala (7a) configurado para calcular factores de escala (SF) respecto de un espectro (SCN) correspondiente a un ruido de confort (CN) sobre la base del espectro (SBN) del ruido de fondo provisto por el decodificador de descriptores de inserción de silencio (3) y sobre la base del segundo espectro (SN2) del ruido de la señal de salida de audio (OS) provisto por el conversor de resolución (6) y tiene un generador de espectros de ruido de confort (7b) configurado para computar el espectro (SCN) correspondiente a un ruido de confort (CN) sobre la base de los factores de escala (SF); y un generador de ruido de confort (8) configurado para producir el ruido de confort (CN) durante la fase inactiva sobre la base del espectro (SCN) correspondiente al ruido de confort (CN).
Description
Además, el conversor de resolución 6 puede establecer un segundo espectro SN2 del ruido de la señal de salida de audio OS sobre la base del primer espectro SN1 del ruido de la señal de salida de audio OS, donde el segundo espectro SN2 del ruido de la señal de salida de audio OS tiene la misma resolución espectral que el espectro del
5 ruido de fondo SBN.
El dispositivo de cómputo de factores de escala 7a puede computar fácilmente los factores de escala SF correspondientes a un espectro SCN que corresponde a un ruido de confort CN sobre la base del espectro SBN del ruido de fondo provisto por el decodificador de descriptores de inserción de silencio 3 y sobre la base del segundo
10 espectro SN2 del ruido de la señal de salida de audio OS provisto por el conversor de resolución 6, ya que el espectro SBN del ruido de fondo y el segundo espectro SN2 del ruido de la señal de salida de audio OS tienen la misma resolución espectral.
El generador de espectros de ruido de confort 7b puede establecer el espectro SCN correspondiente al ruido de 15 confort CN sobre la base de los factores de escala SF.
Más aun, el generador de ruido de confort 8 puede producir el ruido de confort CN durante la fase inactiva sobre la base del espectro SCN correspondiente al ruido de confort.
20 Las estimaciones de ruido obtenidas en el decodificador 1 contienen información acerca de la estructura espectral del ruido de fondo, que es más precisa que la información acerca de la estructura espectral del ruido de fondo contenida en las tramas SID SI. Sin embargo, estas estimaciones no pueden ser adaptadas durante las fases inactivas, dado que la estimación de ruido se lleva a cabo sobre la señal de salida de audio decodificada OS. Por el contrario, las tramas SID envían nueva información acerca de la envolvente espectral a intervalos regulares durante
25 las fases inactivas. El decodificador 1 de acuerdo con la invención combina estas dos fuentes de información. Los factores de escala SF se pueden actualizar durante las fases activas dependiendo de las estimaciones de ruido del lado del decodificador y durante las fases inactivas dependiendo de las estimaciones de ruido contenidas en las tramas SID SI. La actualización continua de los factores de escala SF garantiza que no haya cambios repentinos de las características del ruido de confort producido CN.
30 Como el espectro SBN del ruido de fondo contenido en las tramas SID SI y el segundo espectro SN2 del ruido de la señal de salida de audio OS tienen la misma resolución espectral, la actualización de los factores de escala SF y, por ende, del ruido de confort CN se pueden realizar de manera sencilla, ya que por cada grupo de bandas de frecuencia del espectro SBN del ruido de fondo contenido en las tramas SID SI existe exactamente un grupo de
35 bandas de frecuencia en el segundo espectro SN2 del ruido de la señal de salida de audio OS. Se debe tener en cuenta que en una realización preferida, el grupo de bandas de frecuencias del espectro del ruido de fondo contenido en las tramas SID SI y el grupo de bandas de frecuencias del segundo espectro SN2 del ruido de la señal de salida de audio OS se corresponden entre sí.
40 Por añadidura, como el espectro SBN del ruido de fondo contenido en las tramas SID SI y el segundo espectro SN2 del ruido de la señal de salida de audio OS tienen la misma resolución espectral, la actualización de los factores de escala SF no produce distorsiones, o estas son sólo escasamente audibles.
De acuerdo con una realización preferida de la invención el analizador espectral 4 comprende un dispositivo de
45 transformación rápida de Fourier. Una transformada rápida de Fourier (FFT) es un algoritmo para computar una transformada discreta de Fourier (DFT) y su inversa, lo que sólo requiere un bajo esfuerzo informático. Por lo tanto, el dispositivo de transformación rápida de Fourier puede calcular el espectro SAS de la señal de salida de audio OS de manera sencilla.
50 De acuerdo con una realización preferida de la invención el dispositivo estimador de ruido 5 comprende un dispositivo conversor 9 configurado para convertir el espectro SAS de la señal de salida de audio OS en un espectro convertido CSA de la señal de salida de audio OS que tiene la misma resolución espectral que el decodificador de núcleo 17. En general, la resolución espectral del espectro SAS de la señal de salida de audio OS obtenida por un conversor espectral 4 es mucho más elevada que la resolución espectral del decodificador de núcleo 17. Mediante la
55 obtención del espectro convertido CSA de la señal de salida de audio OS se puede reducir la complejidad de los pasos de computación subsiguientes.
De acuerdo con una realización preferida de la invención el dispositivo estimador de ruido 5 comprende un estimador de ruido 10 configurado para determinar el primer espectro SN1 del ruido de la señal de salida de audio
60 OS sobre la base del espectro convertido CAS de la señal de salida de audio OS provista por el dispositivo conversor 9. Cuando se utiliza el espectro convertido CSA de la señal de salida de audio OS como base para la estimación de ruido en el decodificador se pueden reducir los esfuerzos de computación sin reducir la calidad de la estimación de ruido.
8
invención, se utiliza el módulo de extensión de ancho de banda 20 para producir la señal de salida de audio OS, que es alimentada al conversor espectral 4. Merced a estas características, se puede utilizar la totalidad del ancho de banda para producir el ruido de confort.
5 Con respecto a las tres realizaciones del decodificador de audio de acuerdo con la invención se puede agregar lo siguiente: Del lado del decodificador, se puede aplicar un generador aleatorio 8 para excitar cada banda espectral individual en el dominio de la FFT, como así también en el dominio QMF en el caso de los modos SWB. Se deben computar individualmente las secuencias aleatorias en cada banda, de tal manera que el espectro del ruido de confort generado CN se asemeje al espectro del ruido de fondo real presente en el flujo de bits.
10 Las estimaciones de ruido de alta resolución obtenidas en el decodificador 1 capturan información acerca de la fina estructura espectral del ruido de fondo. Sin embargo, estas estimaciones no pueden ser adaptadas durante las fases inactivas, puesto que la estimación de ruido se lleva a cabo sobre la señal OS decodificada. Por el contrario, las tramas SID SI envían nueva información acerca de la envolvente espectral a intervalos regulares durante las fases
15 inactivas. El presente decodificador 1 combina estas dos fuentes de información en un esfuerzo por reproducir la fina estructura espectral capturada del el ruido de fondo presente durante las fases activas, en tanto que sólo se actualiza la envolvente espectral del ruido de confort CN durante las partes inactivas con el auxilio de la información de SID.
20 Para lograr esta meta, se utiliza un estimador de ruido adicional 5 en el decodificador 1, como se ilustra en las Figs. 1 a 3. Por ende, la estimación de ruido se lleva a cabo en ambos extremos del sistema de transmisión, aunque aplica una resolución espectral más elevada en el decodificador 1 que en el codificador 100. Una manera de obtener una resolución espectral elevada en el decodificador 1 consiste simplemente en considerar cada banda espectral en forma individual (resolución total) en lugar de agruparlas por promedio como en el codificador 100. Por otro lado, se
25 puede obtener una compensación entre resolución espectral y complejidad informática llevando a cabo el agrupamiento espectral también en el decodificador 1, aunque utilizando un número mayor de grupos espectrales en comparación con el codificador 100, para producir así una cuantificación más fina del eje de frecuencias en el decodificador.
30 Nótese entonces que la estimación de ruido del lado del decodificador opera en la señal OS decodificada. En un sistema basado en DTX, se debe poder, en consecuencia, operar durante las fases activas solamente, es decir, necesariamente sobre el contenido de voz clara o voz ruidosa (a diferencia de ruido solamente).
Se puede interpolar en primer lugar el espectro de potencia de ruido de alta resolución (HR)
potencia
tramas SID SI. En comparación con los espectros de ruido de baja resolución
40 resolución total puede ser escalado, en última instancia, para producir un espectro de potencia de resolución total de la siguiente manera:
45 donde
codificador, y
se puede ajustar con precisión el espectro de potencia de ruido de resolución total
FFT o QMF (esto último para los modos SWB únicamente). 50 En las Figs. 1 y 2, se aplican los mecanismos antes citados sólo a los coeficientes FFT. Por ende, en el caso de los
11
directamente en la salida de las transformadas espectrales. Por el contrario, se la aplica a una resolución espectral más baja promediando el espectro de potencia de entrada entre los grupos de bandas, por ej., siguiendo la escala de Bark. El promedio se puede obtener por medios aritméticos o geométricos. En el caso de la SWB, el agrupamiento espectral se lleva a cabo para los dominios FFT y QMF por separado, en tanto que los modos NB y
5 WB se basan sólo en el dominio FFT.
Nótese que la reducción de la resolución espectral también es ventajosa en términos de complejidad informática, puesto que la estimación de ruido se debe aplicar a sólo un pequeño número de grupos espectrales en lugar de considerar cada banda espectral por separado.
10 Los niveles de ruido estimados (uno por cada grupo espectral) pueden ser codificados conjuntamente en las tramas SID utilizando técnicas de cuantificación de vectores. En los modos NB y WB, sólo se aprovecha el dominio FFT. Por el contrario, en el caso de los modos SWB, la codificación de las tramas SID se puede llevar a cabo para los dominios FFT y QMF en forma conjunta utilizando cuantificación de vectores, es decir, recurriendo a un libro de
15 códigos único que cubre ambos dominios.
Si bien se han descrito algunos aspectos en el contexto de un aparato, es obvio que estos aspectos también representan una descripción del método correspondiente, en el cual un bloque o dispositivo corresponde a un paso del método o a una característica de un paso del método. De manera análoga, los aspectos descriptos en el
20 contexto de un paso del método también representan una descripción de un bloque o ítem correspondiente o de una característica de un aparato correspondiente. Algunos o todos los pasos del método pueden ser ejecutados por medio de (o utilizando) un aparato de hardware, como por ejemplo, un microprocesador, una computadora programable o un circuito electrónico. En algunas realizaciones, uno cualquiera o más de los pasos más importantes del método pueden ser ejecutados por ese tipo de aparato.
25 Dependiendo de ciertos requisitos de implementación, las realizaciones de la invención pueden ser implementadas en hardware o en software. La implementación se puede realizar empleando un medio de almacenamiento digital, por ejemplo un disco blando, un DVD, un BlueRay, un CD, una ROM, una PROM, una EPROM, una EEPROM o una memoria FLASH, que tiene almacenadas en la misma señales control legibles electrónicamente, que cooperan
30 (o tienen capacidad para cooperar) con un sistema de computación programable de tal manera que se ejecute el método respectivo. Por lo tanto, el medio de almacenamiento digital puede ser legible por una computadora.
Algunas realizaciones de acuerdo con la invención comprenden un transportador de datos que comprende señales de control legibles electrónicamente, con capacidad para cooperar con un sistema de computación programable de
35 tal manera que se ejecute uno de los métodos descriptos en la presente.
En general, las realizaciones de la presente invención pueden ser implementadas en forma de producto programa de computación con un código de programa, donde el código de programa cumple la función de ejecutar uno de los métodos al ejecutarse el programa de computación en una computadora. El código de programa puede ser
40 almacenado, por ejemplo, en un portador legible por una máquina.
Otras realizaciones comprenden el programa de computación para ejecutar uno de los métodos aquí descriptos, almacenado en un portador legible por una máquina.
45 En otras palabras, una realización del método de la invención consiste, por lo tanto, en un programa de computación que consta de un código de programa para realizar uno de los métodos aquí descriptos al ejecutarse el programa de computación en una computadora.
Otra de las realizaciones de los métodos de la invención consiste, por lo tanto, en un portador de datos (o medio de
50 almacenamiento digital, o medio legible por computadora) que comprende, grabado en el mismo, el programa de computación para ejecutar uno de los métodos aquí descriptos. El portador de datos, el medio de almacenamiento digital o el medio grabado son por lo general tangibles y no transitorios.
Otra realización del método de la invención es, por lo tanto, un flujo de datos o una secuencia de señales que
55 representa el programa de computación para ejecutar uno de los métodos aquí descriptos. El flujo de datos o la secuencia de señales pueden estar configuradas, por ejemplo, para ser transferida a través de una conexión de comunicación de datos, por ejemplo por Internet.
Otra realización comprende un medio de procesamiento, por ejemplo un ordenador, un dispositivo lógico 60 programable, configurado o adaptado para ejecutar uno de los métodos aquí descritos.
Otra realización comprende una computadora en la que se ha instalado el programa de computación para ejecutar uno de los métodos aquí descritos.
13
Claims (1)
-
imagen1 imagen2 imagen3
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261740857P | 2012-12-21 | 2012-12-21 | |
US201261740857P | 2012-12-21 | ||
PCT/EP2013/077525 WO2014096279A1 (en) | 2012-12-21 | 2013-12-19 | Generation of a comfort noise with high spectro-temporal resolution in discontinuous transmission of audio signals |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2588156T3 true ES2588156T3 (es) | 2016-10-31 |
Family
ID=49949638
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES13819029.3T Active ES2588156T3 (es) | 2012-12-21 | 2013-12-19 | Generación de ruido de confort con alta resolución espectro-temporal en transmisión discontinua de señales de audio |
Country Status (20)
Country | Link |
---|---|
US (1) | US9583114B2 (es) |
EP (1) | EP2936487B1 (es) |
JP (1) | JP6180544B2 (es) |
KR (1) | KR101690899B1 (es) |
CN (1) | CN104871242B (es) |
AR (1) | AR094278A1 (es) |
AU (1) | AU2013366642B2 (es) |
BR (1) | BR112015014212B1 (es) |
CA (1) | CA2894625C (es) |
ES (1) | ES2588156T3 (es) |
HK (1) | HK1216448A1 (es) |
MX (1) | MX344169B (es) |
MY (1) | MY171106A (es) |
PL (1) | PL2936487T3 (es) |
PT (1) | PT2936487T (es) |
RU (1) | RU2650025C2 (es) |
SG (1) | SG11201504810YA (es) |
TW (1) | TWI539445B (es) |
WO (1) | WO2014096279A1 (es) |
ZA (1) | ZA201505193B (es) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
USD589322S1 (en) | 2006-10-05 | 2009-03-31 | Lowe's Companies, Inc. | Tool handle |
CN103187065B (zh) | 2011-12-30 | 2015-12-16 | 华为技术有限公司 | 音频数据的处理方法、装置和*** |
EP2936486B1 (en) | 2012-12-21 | 2018-07-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Comfort noise addition for modeling background noise at low bit-rates |
AU2013366642B2 (en) | 2012-12-21 | 2016-09-22 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Generation of a comfort noise with high spectro-temporal resolution in discontinuous transmission of audio signals |
EP2980790A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for comfort noise generation mode selection |
EP2980801A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals |
US10325588B2 (en) * | 2017-09-28 | 2019-06-18 | International Business Machines Corporation | Acoustic feature extractor selected according to status flag of frame of acoustic signal |
US10805191B2 (en) | 2018-12-14 | 2020-10-13 | At&T Intellectual Property I, L.P. | Systems and methods for analyzing performance silence packets |
GB2595891A (en) * | 2020-06-10 | 2021-12-15 | Nokia Technologies Oy | Adapting multi-source inputs for constant rate encoding |
MX2023002238A (es) | 2020-08-31 | 2023-04-21 | Fraunhofer Ges Forschung | Enerador de señales multicanal, codificador de audio y métodos relacionados que se basan en una señal de ruido de mezcla. |
Family Cites Families (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5537509A (en) * | 1990-12-06 | 1996-07-16 | Hughes Electronics | Comfort noise generation for digital communication systems |
ATE294441T1 (de) | 1991-06-11 | 2005-05-15 | Qualcomm Inc | Vocoder mit veränderlicher bitrate |
US5630016A (en) * | 1992-05-28 | 1997-05-13 | Hughes Electronics | Comfort noise generation for digital communication systems |
US5657422A (en) | 1994-01-28 | 1997-08-12 | Lucent Technologies Inc. | Voice activity detection driven noise remediator |
FI101439B (fi) * | 1995-04-13 | 1998-06-15 | Nokia Telecommunications Oy | Transkooderi, jossa on tandem-koodauksen esto |
JP3252782B2 (ja) | 1998-01-13 | 2002-02-04 | 日本電気株式会社 | モデム信号対応音声符号化復号化装置 |
US6122611A (en) | 1998-05-11 | 2000-09-19 | Conexant Systems, Inc. | Adding noise during LPC coded voice activity periods to improve the quality of coded speech coexisting with background noise |
US6424938B1 (en) | 1998-11-23 | 2002-07-23 | Telefonaktiebolaget L M Ericsson | Complex signal activity detection for improved speech/noise classification of an audio signal |
RU2237296C2 (ru) * | 1998-11-23 | 2004-09-27 | Телефонактиеболагет Лм Эрикссон (Пабл) | Кодирование речи с функцией изменения комфортного шума для повышения точности воспроизведения |
US8583427B2 (en) * | 1999-11-18 | 2013-11-12 | Broadcom Corporation | Voice and data exchange over a packet based network with voice detection |
US20070110042A1 (en) * | 1999-12-09 | 2007-05-17 | Henry Li | Voice and data exchange over a packet based network |
JP2001318694A (ja) | 2000-05-10 | 2001-11-16 | Toshiba Corp | 信号処理装置、信号処理方法および記録媒体 |
US6873604B1 (en) * | 2000-07-31 | 2005-03-29 | Cisco Technology, Inc. | Method and apparatus for transitioning comfort noise in an IP-based telephony system |
US6615169B1 (en) * | 2000-10-18 | 2003-09-02 | Nokia Corporation | High frequency enhancement layer coding in wideband speech codec |
US6807525B1 (en) * | 2000-10-31 | 2004-10-19 | Telogy Networks, Inc. | SID frame detection with human auditory perception compensation |
US20030120484A1 (en) | 2001-06-12 | 2003-06-26 | David Wong | Method and system for generating colored comfort noise in the absence of silence insertion description packets |
CA2388439A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
RU2331933C2 (ru) | 2002-10-11 | 2008-08-20 | Нокиа Корпорейшн | Способы и устройства управляемого источником широкополосного кодирования речи с переменной скоростью в битах |
JP4311541B2 (ja) | 2003-10-06 | 2009-08-12 | アルパイン株式会社 | オーディオ信号圧縮装置 |
US7649988B2 (en) * | 2004-06-15 | 2010-01-19 | Acoustic Technologies, Inc. | Comfort noise generator using modified Doblinger noise estimate |
US7454010B1 (en) * | 2004-11-03 | 2008-11-18 | Acoustic Technologies, Inc. | Noise reduction and comfort noise gain control using bark band weiner filter and linear attenuation |
EP1897085B1 (en) * | 2005-06-18 | 2017-05-31 | Nokia Technologies Oy | System and method for adaptive transmission of comfort noise parameters during discontinuous speech transmission |
US7610197B2 (en) | 2005-08-31 | 2009-10-27 | Motorola, Inc. | Method and apparatus for comfort noise generation in speech communication systems |
US8139777B2 (en) * | 2007-10-31 | 2012-03-20 | Qnx Software Systems Co. | System for comfort noise injection |
US8554550B2 (en) | 2008-01-28 | 2013-10-08 | Qualcomm Incorporated | Systems, methods, and apparatus for context processing using multi resolution analysis |
DE102008009719A1 (de) * | 2008-02-19 | 2009-08-20 | Siemens Enterprise Communications Gmbh & Co. Kg | Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen |
US20090222268A1 (en) * | 2008-03-03 | 2009-09-03 | Qnx Software Systems (Wavemakers), Inc. | Speech synthesis system having artificial excitation signal |
CN101335000B (zh) | 2008-03-26 | 2010-04-21 | 华为技术有限公司 | 编码的方法及装置 |
ES2379761T3 (es) | 2008-07-11 | 2012-05-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Proporcinar una señal de activación de distorsión de tiempo y codificar una señal de audio con la misma |
EP2345030A2 (en) * | 2008-10-08 | 2011-07-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-resolution switched audio encoding/decoding scheme |
EP3352168B1 (en) * | 2009-06-23 | 2020-09-16 | VoiceAge Corporation | Forward time-domain aliasing cancellation with application in weighted or original signal domain |
EP2491548A4 (en) | 2009-10-19 | 2013-10-30 | Ericsson Telefon Ab L M | VOICE ACTIVITY METHOD AND DETECTOR FOR SPEECH ENCODER |
CN103282959B (zh) | 2010-10-25 | 2015-06-03 | 沃伊斯亚吉公司 | 低位速率和短延迟地编码普通音频信号 |
DK3493205T3 (da) | 2010-12-24 | 2021-04-19 | Huawei Tech Co Ltd | Fremgangsmåde og indretning til adaptiv detektion af stemmeaktivitet i et lydindgangssignal |
AR085895A1 (es) * | 2011-02-14 | 2013-11-06 | Fraunhofer Ges Forschung | Generacion de ruido en codecs de audio |
RU2586838C2 (ru) * | 2011-02-14 | 2016-06-10 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Аудиокодек, использующий синтез шума в течение неактивной фазы |
US20120237048A1 (en) | 2011-03-14 | 2012-09-20 | Continental Automotive Systems, Inc. | Apparatus and method for echo suppression |
ES2604652T3 (es) | 2012-08-31 | 2017-03-08 | Telefonaktiebolaget Lm Ericsson (Publ) | Método y dispositivo para detectar la actividad vocal |
AU2013366642B2 (en) | 2012-12-21 | 2016-09-22 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Generation of a comfort noise with high spectro-temporal resolution in discontinuous transmission of audio signals |
US9106196B2 (en) | 2013-06-20 | 2015-08-11 | 2236008 Ontario Inc. | Sound field spatial stabilizer with echo spectral coherence compensation |
-
2013
- 2013-12-19 AU AU2013366642A patent/AU2013366642B2/en active Active
- 2013-12-19 JP JP2015548605A patent/JP6180544B2/ja active Active
- 2013-12-19 CA CA2894625A patent/CA2894625C/en active Active
- 2013-12-19 BR BR112015014212-5A patent/BR112015014212B1/pt active IP Right Grant
- 2013-12-19 RU RU2015129691A patent/RU2650025C2/ru active
- 2013-12-19 ES ES13819029.3T patent/ES2588156T3/es active Active
- 2013-12-19 WO PCT/EP2013/077525 patent/WO2014096279A1/en active Application Filing
- 2013-12-19 KR KR1020157019048A patent/KR101690899B1/ko active IP Right Grant
- 2013-12-19 SG SG11201504810YA patent/SG11201504810YA/en unknown
- 2013-12-19 MX MX2015007434A patent/MX344169B/es active IP Right Grant
- 2013-12-19 PL PL13819029.3T patent/PL2936487T3/pl unknown
- 2013-12-19 EP EP13819029.3A patent/EP2936487B1/en active Active
- 2013-12-19 MY MYPI2015001606A patent/MY171106A/en unknown
- 2013-12-19 CN CN201380067152.7A patent/CN104871242B/zh active Active
- 2013-12-19 PT PT138190293T patent/PT2936487T/pt unknown
- 2013-12-20 TW TW102147454A patent/TWI539445B/zh active
- 2013-12-20 AR ARP130105026A patent/AR094278A1/es active IP Right Grant
-
2015
- 2015-06-19 US US14/744,715 patent/US9583114B2/en active Active
- 2015-07-20 ZA ZA2015/05193A patent/ZA201505193B/en unknown
-
2016
- 2016-04-18 HK HK16104369.7A patent/HK1216448A1/zh unknown
Also Published As
Publication number | Publication date |
---|---|
EP2936487B1 (en) | 2016-06-22 |
ZA201505193B (en) | 2016-07-27 |
CN104871242B (zh) | 2017-10-24 |
BR112015014212B1 (pt) | 2021-10-19 |
JP6180544B2 (ja) | 2017-08-16 |
TW201428734A (zh) | 2014-07-16 |
RU2650025C2 (ru) | 2018-04-06 |
MY171106A (en) | 2019-09-25 |
PT2936487T (pt) | 2016-09-23 |
KR101690899B1 (ko) | 2016-12-28 |
BR112015014212A2 (pt) | 2017-08-22 |
JP2016500452A (ja) | 2016-01-12 |
CN104871242A (zh) | 2015-08-26 |
WO2014096279A1 (en) | 2014-06-26 |
US9583114B2 (en) | 2017-02-28 |
SG11201504810YA (en) | 2015-07-30 |
US20150287415A1 (en) | 2015-10-08 |
HK1216448A1 (zh) | 2016-11-11 |
KR20150096494A (ko) | 2015-08-24 |
TWI539445B (zh) | 2016-06-21 |
EP2936487A1 (en) | 2015-10-28 |
CA2894625C (en) | 2017-11-07 |
PL2936487T3 (pl) | 2016-12-30 |
AR094278A1 (es) | 2015-07-22 |
RU2015129691A (ru) | 2017-01-26 |
AU2013366642A1 (en) | 2015-07-02 |
MX344169B (es) | 2016-12-07 |
MX2015007434A (es) | 2015-09-16 |
AU2013366642B2 (en) | 2016-09-22 |
CA2894625A1 (en) | 2014-06-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2588156T3 (es) | Generación de ruido de confort con alta resolución espectro-temporal en transmisión discontinua de señales de audio | |
ES2760573T3 (es) | Decodificador de audio y método para proveer una información de audio decodificada usando un ocultamiento de error que modifica una señal de excitación de dominio de tiempo | |
ES2398573T3 (es) | Número reducido de decodificación de canales | |
ES2888804T3 (es) | Conformación simultánea de ruido en el dominio del tiempo y el dominio de la frecuencia para transformaciones TDAC | |
ES2664185T3 (es) | Codificador de audio, decodificador de audio, método para proporcionar una información de audio codificada, método para proporcionar una información de audio decodificada, programa informático y representación codificada utilizando una ampliación de ancho de banda adaptada a la señal | |
ES2780000T3 (es) | Seleccionar un procedimiento de ocultación de pérdida de paquetes | |
US9449605B2 (en) | Inactive sound signal parameter estimation method and comfort noise generation method and system | |
ES2732560T3 (es) | Llenado de ruido sin información secundaria para codificadores tipo celp | |
ES2526783T3 (es) | Generador de filigrana digital, decodificador de filigrana digital, procedimiento para proporcionar una señal de filigrana digital en base a datos valorados discretos y procedimiento para proporcionar datos valorados discretos en dependencia de una señal de filigrana digital | |
ES2900594T3 (es) | Procedimiento para determinar un modo de codificación | |
BR122019025115B1 (pt) | Sistema e método para gerar um sinal de tempo alongado e/ou de frequência transposta a partir de um sinal de entrada e meio de armazenamento legível por computador não transitório | |
US11501788B2 (en) | Periodic-combined-envelope-sequence generation device, periodic-combined-envelope-sequence generation method, periodic-combined-envelope-sequence generation program and recording medium | |
US9646619B2 (en) | Coding of multichannel audio content | |
ES2709327T3 (es) | Método de descodificación y descodificador para la mejora del diálogo | |
US20190096413A1 (en) | Encoder, decoder, coding method, decoding method, coding program, decoding program and recording medium | |
ES2783975T3 (es) | Codificación multicanal | |
ES2732440T3 (es) | Dispositivo de procesamiento de señales de habla, método de procesamiento de señales de habla y programa de procesamiento de señales de habla | |
ES2908564T3 (es) | Codificación de una señal de sonido | |
ES2901749T3 (es) | Método de descodificación, aparato de descodificación, programa y soporte de registro correspondientes | |
ES2802373T3 (es) | Aparato y método de selección de modo de generación de ruido de confort | |
BR112017001394B1 (pt) | Aparelho e método para seleção de modo de geração de ruído de conforto |