ES2354962T3 - Nivel de señal de audio variable con el tiempo usando una densidad de probabilidad estimada variable con el tiempo del nivel. - Google Patents

Nivel de señal de audio variable con el tiempo usando una densidad de probabilidad estimada variable con el tiempo del nivel. Download PDF

Info

Publication number
ES2354962T3
ES2354962T3 ES08780173T ES08780173T ES2354962T3 ES 2354962 T3 ES2354962 T3 ES 2354962T3 ES 08780173 T ES08780173 T ES 08780173T ES 08780173 T ES08780173 T ES 08780173T ES 2354962 T3 ES2354962 T3 ES 2354962T3
Authority
ES
Spain
Prior art keywords
level
probability
smoothing
time
short
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES08780173T
Other languages
English (en)
Inventor
Alan Jeffrey Seefeldt
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby Laboratories Licensing Corp
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=40090149&utm_source=***_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=ES2354962(T3) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Application granted granted Critical
Publication of ES2354962T3 publication Critical patent/ES2354962T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/3005Automatic control in amplifiers having semiconductor devices in amplifiers suitable for low-frequencies, e.g. audio amplifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/32Automatic control in amplifiers having semiconductor devices the control being dependent upon ambient noise level or sound level

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Control Of Amplification And Gain Control (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Electric Clocks (AREA)
  • Filters That Use Time-Delay Elements (AREA)
  • Television Receiver Circuits (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Ropes Or Cables (AREA)

Abstract

Método para suavizar un nivel variable con el tiempo de una señal, comprendiendo el método: estimar (33) una densidad de probabilidad variable con el tiempo del nivel variable con el tiempo de la señal; computar (34) la probabilidad de un nivel variable con el tiempo suavizado anterior usando la estimación de densidad de probabilidad variable con el tiempo; adaptar (35) un filtro de suavizado en respuesta a la probabilidad; y aplicar (32) el filtro de suavizado adaptado al nivel variable con el tiempo para generar el nivel variable con el tiempo suavizado.

Description

Campo técnico
La invención se refiere al procesamiento de señales de audio. En particular, la invención se refiere a computar una medida variable con el tiempo del nivel de una señal de audio suavizando el nivel a corto plazo de la señal de audio, en la que los parámetros del procedimiento de suavizado se controlan, al menos en parte, mediante una estimación 5 variable con el tiempo de la densidad de probabilidad del nivel a corto plazo.
Referencias e incorporación como referencia
En la solicitud de patente internacional publicada WO 2004/11994 A2, de Alan Jeffrey Seefeldt et al, publicada el 23 de diciembre de 2004, titulada “Method, Apparatus and Computer Program for Calculating and Adjusting the Perceived Loudness of an Audio Signal” y en “A New Objective Measure of Perceived Loudness” de Alan Seefeldt et al, 10 Audio Engineering Society Convention Paper 6236, San Francisco, 28 de octubre de 2004 se describen determinadas técnicas para medir la sonoridad (psicoacústica) percibida útiles para entender mejor la presente invención .
Antecedentes de la técnica
En el procesamiento de señales de audio, con frecuencia es necesario generar una medida variable con el tiempo del nivel de señal de audio. (En el presente documento el término “nivel” se refiere genéricamente a una medida 15 del nivel tal como nivel de pico, nivel de rms, nivel de sonoridad, etc.). Por ejemplo, un medidor de sonoridad puede presentar una medida variable con el tiempo de una sonoridad perceptiva de la señal de audio, suavizándose esta medida significativamente con el fin de indicar la sonoridad promedio durante los últimos segundos. En otro ejemplo, un procedimiento de control automático de ganancia (AGC) puede computar una medida variable con el tiempo altamente estabilizada de un nivel de la señal de audio y entonces usar la medida resultante para generar una ganancia 20 ligeramente variable que, cuando se aplica a la señal de audio, acerca automáticamente el nivel promedio del audio a un nivel objetivo deseado.
En estos dos de muchos ejemplos, puede computarse la medida del nivel suavizado aplicando alguna forma de filtro de suavizado a una medida del nivel a corto plazo. (“Corto plazo” significa computar por un intervalo de tiempo significativamente más corto que el intervalo por el que el suavizado posterior es eficaz). Por ejemplo, puede 25 computarse el nivel de rms de la señal o el nivel de sonoridad perceptiva, tal como se describe en la solicitud WO 2004/111994 A2, por un intervalo de decenas de milisegundos para generar el nivel a corto plazo. Entonces el suavizado posterior de este nivel a corto plazo puede implicar constantes de tiempo en el orden de varios segundos. En la siguiente discusión, esta medida del nivel a corto plazo variable con el tiempo se representa como la señal L[t], y la medida del nivel suavizado posteriormente se representa como [t], donde t representa el índice de tiempo discreto. 30 L
Pueden aplicarse muchos tipos diferentes de filtros de suavizado a L[t] para generar [t]. Puede usarse un filtro de respuesta finita al impulso (FIR) o un filtro de respuesta infinita al impulso de polos múltiples (IIR). El filtro particular empleado no es crítico. Para fines ilustrativos puede considerarse el suavizador de IIR de polo único de liberación lenta/ataque rápido comúnmente usado. Con un filtro de este tipo, puede actualizarse la medida del nivel suavizado [t] según la ecuación: 35
(1)
Los coeficientes de suavizado ataque y liberación pueden elegirse de tal manera que ataque < liberación. Esto significa que [t] realiza un seguimiento de L[t] más rápidamente cuando L[t] está aumentando (ataque) en comparación a cuando L[t] está disminuyendo (liberación). Para un AGC, puede elegirse, por ejemplo, ataque 40 correspondiendo a una constante de tiempo de un segundo y liberación correspondiendo a una constante de tiempo de cuatro segundos. De esta manera, [t] varía muy lentamente con el tiempo, y como resultado, la ganancia correspondiente que modifica el audio también varía lentamente, manteniendo de ese modo la dinámica a corto plazo del audio original. Sin embargo, pueden surgir problemas, cuando se usan tales constantes de tiempo grandes. Supóngase que un AGC de este tipo está operando en el audio de un televisor con la intención de mantener un nivel 45 promedio consistente a través de la programación y a través de diversos canales. En una situación de este tipo, el contenido de la señal de audio que se procesa por el AGC puede cambiar repentinamente, por ejemplo, cuando se cambia de canal y por tanto el nivel promedio asociado de la señal de audio también puede cambiar repentinamente. Sin embargo, con sus constantes de tiempo grandes, el AGC requiere una cantidad de tiempo considerable para converger a un nivel nuevo y hacer que el nivel modificado del audio procesado sea según el nivel objetivo deseado. 50
Durante este tiempo de adaptación, un televidente puede percibir el nivel del audio como demasiado alto o demasiado bajo. Como resultado, el televidente puede agarrar rápidamente el mando a distancia para ajustar el volumen sólo para encontrarse a sí mismo luchando contra el AGC según converge.
Algunos tipos de suavizado de señal conocidos en la técnica anterior usan una forma de control automático de ganancia. Una técnica dada a conocer en la publicación de solicitud de patente estadounidense n.º 2006/274620 A1 5 ajusta la ganancia de un amplificador para controlar el nivel de una señal obtenida de un sistema óptico láser que lee información codificada digitalmente con longitud de ejecución limitada (RLL) a partir de un medio óptico tal como un DVD o un disco compacto. Se ajusta la ganancia del amplificador para conducir una parte optimizada de la señal hacia la región de saturación de un convertidor analógico-digital (ADC) de modo que puede recuperarse la información digital con mayor precisión. Se usa un histograma de longitudes de símbolos de RLL para ajustar la ganancia del amplificador 10 aunque este ajuste se realiza instantáneamente. Este ajuste de ganancia no se basa en la probabilidad de ningún nivel de señal y no hay ningún ajuste de constantes de tiempo para ningún filtro de suavizado.
Otra técnica, que se da a conocer en la patente estadounidense n.º 5.101.416, calcula la densidad de probabilidad de valores de señales detectadas y compara la densidad de probabilidad calculada frente a una densidad prototipo ideal para determinar si la ganancia del amplificador está establecida apropiadamente. Si la comparación 15 indica que determinadas partes de la densidad de probabilidad calculada son superiores o inferiores a las de la densidad prototipo, la ganancia del amplificador se disminuye o aumenta de forma inmediata, respectivamente. Este ajuste de ganancia no se basa en la probabilidad de ningún nivel de señal particular y no hay ningún ajuste de constantes de tiempo para ningún filtro de suavizado.
En la patente estadounidense n.º 6.768.979, en la publicación de solicitud de patente estadounidense n.º 20 2002/196510 A1 y en la publicación de solicitud de patente internacional n.º WO 92/15150 A se dan a conocer otras técnicas. Ninguna de estas técnicas ajusta las constantes de tiempo de ningún filtro de suavizado.
Otra técnica anterior soluciona normalmente el problema recién descrito usando constantes de tiempo basándose en la relación relativa del nivel a corto plazo L[t] con respecto al nivel suavizado [t]. Por ejemplo, si el nivel a corto plazo de la señal es significativamente mayor o menor que el nivel suavizado tal como se define mediante 25 algunos límites umbral alrededor del nivel suavizado, entonces la operación de suavizado cambia a constantes de tiempo de ataque y/o liberación más rápidas, respectivamente, hasta que el nivel a corto plazo vuelve a estar en los límites umbral alrededor del nivel suavizado. Posteriormente, el sistema cambia de nuevo a las constantes de tiempo más lentas originales. Puede modificarse la ecuación 1 para implementar esta técnica de suavizado más sofisticada incluyendo cuatro casos en lugar de dos: 30
En la ecuación 2, ataque rápido < ataque y liberación rápida < liberación lo que significa que ataque rápido y liberación rápida corresponden a constantes de tiempo más rápidas que ataque y liberación, respectivamente. Si ataque y liberación corresponden a constantes de tiempo de 1 y 4 segundos, respectivamente, entonces pueden elegirse ataque rápido y liberación rápida, por ejemplo, correspondiendo a constantes de tiempo de 0,1 y 0,4 segundos, respectivamente (10 veces 35 más rápido). El umbral de constante de tiempo rápida Lrápida debe elegirse con criterio de modo que el cambio a estas constantes de tiempo más rápidas no se produzca demasiado a menudo y dé como resultado una inestabilidad no deseada del nivel suavizado [t]. Si, por ejemplo, las medidas del nivel L[t] y [t] representan el nivel de rms en unidades de decibelios, puede establecerse Lrápida, a 10 dB, una duplicación aproximada de la sonoridad percibida.
A pesar de ser una mejora sobre el suavizado en la ecuación 1, el suavizado de la ecuación 2 todavía funciona 40 de manera subóptima para muchas señales. En general, para cualquier umbral Lrápida razonable, pueden existir señales para las que la dinámica deseada original del nivel a corto plazo L[t] fluctúe fuera de los límites umbral alrededor del nivel promedio [t], provocando así que el procedimiento de suavizado cambie incorrectamente al modo de ataque o liberación rápido.
Para entender mejor los casos para los que el suavizado de la ecuación 2 funciona tal como se desea y para 45 los que funciona inadecuadamente, puede imaginarse la distribución del nivel a corto plazo L[t] por el tiempo. Puede imaginarse esta distribución como una densidad de probabilidad variable con el tiempo que predice la probabilidad de encontrar algún valor particular de nivel a corto plazo L dentro de un intervalo de tiempo alrededor del índice de tiempo actual t. La duración de este intervalo debe estar en proporción con el conjunto de constantes de tiempo más lentas usadas en el filtro de suavizado de la ecuación 2. 50
Considérese ahora el comportamiento de esta densidad de probabilidad para el ejemplo de cambio de canal de televisión descrito anteriormente. Suponiendo que el intervalo dinámico del nivel a corto plazo para un canal dado es algo limitado, la función de densidad de probabilidad del nivel a corto plazo L[t] adopta la forma de una cresta bastante estrecha situada alrededor del nivel suavizado [t]. Cuando se cambia de canal, y suponiendo que el nivel promedio del canal nuevo es significativamente superior al del original, la función de densidad de probabilidad empezará a 5 cambiar: la cresta original disminuye según crece una nueva cresta situada alrededor del nivel promedio superior del canal nuevo.
La figura 1 representa una función de densidad de probabilidad de este tipo al principio de la transición descrita. En esta figura, el eje horizontal representa el nivel y el eje vertical representa la probabilidad. La línea continua representa la densidad de probabilidad del nivel a corto plazo al principio de la transición. Se observa la cresta 10 decreciente a la izquierda, que representa la probabilidad decreciente asociada con la selección del canal antiguo, y la cresta creciente a la derecha, que representa la probabilidad creciente asociada con la selección del canal nuevo. Al principio de la transición, el nivel suavizado [t-1] todavía entra dentro de la cresta de la selección del canal antiguo, mientras que el nivel a corto plazo L[t] entra dentro de la cresta del canal nuevo. En este diagrama, el nivel a corto plazo L[t] es mayor que [t-1] por una cantidad mayor que Lrápida, y por tanto, según la ecuación 2, se usa una constante de 15 tiempo rápida para actualizar [t] hacia L[t]. Este es el efecto deseado: el nivel suavizado [t] se adapta rápidamente al nivel superior del canal recientemente seleccionado, desplazándose rápidamente a través del espacio que divide las dos crestas de la densidad de probabilidad.
La figura 2 representa la densidad de probabilidad del nivel a corto plazo para una señal de audio muy diferente. En este caso, la dinámica original de la señal es relativamente grande, y por tanto la cresta de la densidad de 20 probabilidad se abre con mucha amplitud. Tal dinámica puede ser típica en una grabación de alta calidad de jazz o música clásica. También en la figura 2, la relación entre [t-1] y L[t] es exactamente la misma que en la figura 1, pero ahora ambos valores se encuentran dentro de la cresta principal de la densidad de probabilidad. Por tanto, no se desea el cambio a una constante de tiempo rápida porque esta relación entre [t-1] y L[t] forma parte de la dinámica típica de la señal. En este caso, el suavizado descrito por la ecuación 2 no es apropiado. 25
Descripción de la invención
En el presente documento se enseñan métodos, medios y aparatos para suavizar un nivel variable con el tiempo de una señal. Un método incluye estimar una densidad de probabilidad variable con el tiempo de un nivel a corto plazo de la señal y suavizar un nivel de la señal usando la densidad de probabilidad. La señal puede ser una señal de audio, mientras que el nivel suavizado y la densidad de probabilidad estimada pueden variar con el tiempo a 30 aproximadamente la misma tasa.
El nivel a corto plazo y el nivel suavizado pueden ser series cronológicas, teniendo cada una índices de tiempo anteriores y actuales. En el presente documento, antes del suavizado, puede producirse el cómputo de una probabilidad del nivel suavizado en el índice de tiempo anterior. Antes del suavizado, puede producirse el cálculo de parámetros de suavizado usando la densidad de probabilidad. El cálculo de los parámetros de suavizado puede incluir calcular los 35 parámetros de suavizado usando el nivel suavizado en el índice de tiempo anterior, el nivel a corto plazo en el índice de tiempo actual y la probabilidad del nivel suavizado en el índice de tiempo anterior. El cálculo de los parámetros de suavizado puede incluir calcular los parámetros de suavizado usando la amplitud de la densidad de probabilidad estimada.
El cálculo de los parámetros de suavizado puede incluir, cuando el nivel suavizado en el índice de tiempo 40 anterior no tiene más que una probabilidad umbral, usar primeras constantes de tiempo de ataque y liberación, y por el contrario, cuando el nivel suavizado en el índice de tiempo anterior tiene más que la probabilidad del umbral, usar constantes de tiempo de ataque y liberación, una de las cuales es más lenta que sus primeras constantes de tiempo correspondientes. Las dos constantes de tiempo de ataque y liberación usadas pueden ser más lentas que sus primeras constantes de tiempo correspondientes. 45
La probabilidad umbral puede ser variable. La probabilidad umbral variable puede ser una función de la densidad de probabilidad estimada.
El suavizado puede incluir suavizar el nivel a corto plazo usando la densidad de probabilidad.
La estimación de la densidad de probabilidad puede incluir adaptar una representación paramétrica a valores anteriores del nivel a corto plazo. La adaptación puede incluir adaptar un modelo de mezclas Gaussianas a los valores 50 anteriores del nivel a corto plazo. La estimación de la densidad de probabilidad puede incluir computar un histograma de valores anteriores del nivel a corto plazo.
Una memoria legible por ordenador puede contener un programa informático para realizar uno cualquiera de los métodos descritos en el presente documento.
Un sistema informático puede incluir una CPU, una memoria de este tipo y un bus que acople con comunicación la CPU y la memoria.
Un suavizador del nivel de la señal de audio puede incluir una unidad de cómputo de nivel a corto plazo para computar un nivel a corto plazo de una señal de audio, un suavizador de nivel para suavizar el nivel de la señal de audio usando parámetros de suavizado, un estimador de densidad de probabilidad para estimar una densidad de probabilidad 5 de la señal de audio, una unidad de cómputo de probabilidad para computar una probabilidad de un nivel suavizado retardado, un calculador de parámetros de suavizado para calcular los parámetros de suavizado y un retardador para retardar el nivel suavizado.
El estimador de densidad de probabilidad puede incluir un estimador de densidad de probabilidad para estimar una densidad de probabilidad usando una serie cronológica del nivel a corto plazo de la señal de audio. La unidad de 10 cómputo de probabilidad puede incluir una unidad de cómputo de probabilidad para computar la probabilidad usando la densidad de probabilidad estimada y el nivel suavizado retardado. El calculador de parámetros de suavizado puede incluir un calculador de parámetros de suavizado para calcular parámetros de suavizado usando la probabilidad, el nivel suavizado retardado y el nivel a corto plazo. La unidad de cómputo de probabilidad puede incluir una unidad de cómputo de probabilidad para computar la probabilidad usando la densidad de probabilidad estimada y el nivel suavizado 15 retardado, y el calculador de parámetros de suavizado puede incluir un calculador de parámetros de suavizado para calcular parámetros de suavizado usando la probabilidad, el nivel suavizado retardado y el nivel a corto plazo.
El suavizador de nivel puede incluir un suavizador de nivel para suavizar el nivel a corto plazo de la señal de audio.
El estimador de densidad de probabilidad puede incluir un adaptador para adaptar una representación 20 paramétrica a valores anteriores del nivel a corto plazo. El adaptador de representación paramétrica puede incluir un adaptador para adaptar un modelo de mezclas Gaussianas a los valores anteriores del nivel a corto plazo. El estimador de densidad de probabilidad puede incluir una unidad de cómputo de histograma para computar un histograma de valores anteriores del nivel a corto plazo.
Otro método para suavizar un nivel variable con el tiempo de una señal puede incluir recibir una señal que 25 tenga un nivel a corto plazo y suavizar el nivel variable con el tiempo, en el que el nivel a corto plazo y el nivel variable con el tiempo suavizado son series cronológicas, teniendo cada una índices de tiempo anteriores y actuales, y el suavizado puede incluir usar constantes de tiempo lentas en las que la diferencia entre el nivel a corto plazo suavizado en el índice de tiempo anterior y el nivel a corto plazo en el índice de tiempo actual supera un umbral que dirige el uso de constantes de tiempo rápidas. 30
Las diversas características de la presente invención y sus realizaciones preferidas pueden entenderse mejor haciendo referencia a la siguiente discusión y los dibujos adjuntos en los que números de referencia similares se refieren a elementos similares.
Descripción de los dibujos
La figura 1 representa la densidad de probabilidad del nivel a corto plazo de una señal de audio para la que es 35 apropiado el cambio a una constante de tiempo de suavizado rápida.
La figura 2 representa la densidad de probabilidad del nivel a corto plazo de una señal de audio para la que no es apropiado el cambio a una constante de tiempo de suavizado rápida.
La figura 3 representa un diagrama de bloques de visión general de una realización de la invención.
La figura 4 representa la operación de una realización de la invención en una señal de audio que cambia entre 40 fuentes de niveles significativamente diferentes.
La figura 5 es un diagrama de flujo de la operación del generador de nivel suavizado, según una realización de la invención.
Mejor modo para llevar a cabo la invención
La figura 3 es un diagrama de bloques de un generador 3 de nivel suavizado, según una realización de la 45 invención.
El generador 3 de nivel suavizado incluye una unidad 31 de cómputo de nivel a corto plazo, un suavizador 32 de nivel a corto plazo, un estimador 33 de densidad de probabilidad, una unidad 34 de cómputo de probabilidad, un calculador 35 de parámetros de suavizado y un retardador 36. La unidad 31 de cómputo de nivel a corto plazo recibe una señal de audio 3D como entrada y produce un nivel 37 a corto plazo L[t] como salida. El estimador 33 de densidad 50 de probabilidad recibe el nivel 37 a corto plazo L[t] como entrada y produce una densidad 38 de probabilidad estimada p(l,t) como salida. La unidad 34 de cómputo de probabilidad recibe la densidad 38 de probabilidad estimada p(l,t) y la
medida 3C del nivel suavizado retardado [t-1] como entrada y produce la probabilidad 39 p([t-1],t) como salida. El calculador 35 de parámetros de suavizado recibe la probabilidad 39 p([t-1],t) como entrada, así como el nivel 3B a corto plazo suavizado retardado y el nivel 37 a corto plazo L[t], y produce los parámetros 3A de suavizado como salida. El suavizador 32 de nivel a corto plazo recibe los parámetros 3A de suavizado y el nivel 37 a corto plazo L[t] como entrada y produce la medida 3C del nivel suavizado [t] como salida. Finalmente, el retardador 36 recibe y retarda la 5 medida 3C del nivel suavizado [t].
Naturalmente, el generador 3 de nivel suavizado puede implementarse en su totalidad o en parte como un ordenador de propósito general incluyendo memoria programada, como circuitos de aplicación específica, como una disposición de puertas programables, etc.
A continuación se describe la operación del generador 3 de nivel suavizado según una realización. 10
El generador 3 de nivel suavizado genera una estimación de nivel suavizado [t] suavizando una estimación de nivel a corto plazo L[t], que se controla, al menos en parte, por información derivada de una estimación de densidad de probabilidad variable con el tiempo del nivel a corto plazo L[t]. La estimación de nivel suavizado resultante [t] es útil, por ejemplo, como valor presentado mediante un medidor de sonoridad en tiempo real o para su uso en el trayecto de control en un procesador de dinámica de audio tal como un AGC. 15
La figura 5 es un diagrama de flujo de la operación del generador 3 de nivel suavizado, según una realización de la invención. En primer lugar, se computa el nivel a corto plazo L[t] de una señal de audio, etapa 505. Se suaviza este nivel a corto plazo, etapa 510, generando la medida del nivel suavizado [t].
Simultáneamente, a partir del nivel a corto plazo L[t], se actualiza una estimación variable con el tiempo de la densidad de probabilidad del nivel a corto plazo, etapa 515. Esta estimación de densidad de probabilidad, p(l,t), 20 devuelve una probabilidad de entre cero y uno para un nivel de entrada l. El índice de tiempo t indica que esta función cambia con el tiempo a medida que el estimador 33 de densidad de probabilidad (figura 3) recibe nuevos valores del nivel a corto plazo L[t]. Idealmente, el intervalo de tiempo por el que el estimador 33 de densidad de probabilidad considera valores de L[t] para crear la estimación p(l,t) debe estar en proporción con las constantes de tiempo a partir de las que el suavizador 32 genera [t]. Como resultado, [t] y p(l,t) varían con el tiempo a aproximadamente la misma 25 tasa.
Se computa una probabilidad de la medida del nivel suavizado a partir del índice de tiempo anterior, p([t-1],t), etapa 520, alimentando la estimación de densidad p(l,t) con el valor del nivel [t-1]. Este valor de probabilidad p([t-1],t) representa información sobre la relación entre [t-1] y muchos valores del nivel a corto plazo alrededor del índice de tiempo t, no sólo la relación entre [t-1] y el nivel a corto plazo actual L[t]. Por ejemplo, si p([t-1],t) es alto, esto 30 indica que [t-1] es similar a muchos valores del nivel a corto plazo en el pasado reciente. A la inversa, si p([t-1],t) es bajo, entonces [t-1] es diferente de la mayoría de los valores del nivel a corto plazo en el pasado reciente.
Finalmente, el valor de probabilidad p([t-1],t), así como el nivel a corto plazo actual L[t] y la medida del nivel suavizado anterior [t-1], se alimentan al calculador 35 de parámetros de suavizado (figura 3) que usa estos valores para seleccionar los parámetros de suavizado para generar la medida del nivel suavizado actual [t], etapa 525. 35
Aunque la figura 3 representa p([t-1],t) que controla los parámetros de suavizado, puede emplearse otra información derivada de la estimación de densidad p(l,t). Por ejemplo, el calculador 35 de parámetros de suavizado puede usar una medida de la amplitud de la estimación de densidad, un indicador del intervalo dinámico de la señal de audio.
Volviendo al uso ilustrado de p([t-1],t), generalmente, cuando la estimación de densidad p(l,t) estima que el 40 valor suavizado anterior [t-1] tiene una baja probabilidad, entonces las constantes de tiempo rápidas deben actualizar [t]. Si la probabilidad de [t-1] es relativamente alta, entonces deben usarse constantes de tiempo más lentas normales. De esta manera, si la mayoría de los valores de nivel a corto plazo se han alejado mucho del valor suavizado anterior [t-1], entonces [t] se moverá más rápidamente hacia tales valores. Si [t-1] ya está cerca de la mayoría de los valores de nivel a corto plazo, entonces es apropiado el movimiento más lento. 45
Con referencia a la figura 2, una realización de la invención evita el cambio no deseado a constantes de tiempo más rápidas porque [t-1] se encuentra dentro de una zona de alta probabilidad aun cuando el nivel a corto plazo L[t] está relativamente lejos. Para el ejemplo del cambio de canal de la figura 1, vale la pena examinar con más detalle cómo esta estrategia todavía produce la adaptación rápida deseada. Como ayuda, la figura 4 representa la transición
entre los dos canales en cinco fases. Una estrategia de control de constante de tiempo simple supone que cuando p([t-1],t) es mayor que algún umbral pT, se usan constantes de tiempo lentas para actualizar [t-1]. Cuando p([t-1],t) es menor que este umbral pT, se usan constantes de tiempo rápidas. (Se ha eliminado el índice de tiempo de la notación en la figura para simplificar las expresiones.)
La primera fase de la figura 4, el estado de equilibrio inicial, representa condiciones justo antes de seleccionar 5 el segundo canal más fuerte. La densidad de probabilidad del nivel a corto plazo se distribuye estrechamente alrededor del nivel promedio del primer canal. El nivel suavizado se encuentra dentro de la cresta principal de esta densidad. Por tanto, la probabilidad de , p(), es mayor que el umbral pT, y se usan constantes de tiempo lentas para actualizar .
La segunda fase, el principio de la transición, representa el estado del sistema justo tras haber cambiado el 10 audio al segundo canal más fuerte. En esta fase, se reduce la cresta grande de la densidad de probabilidad situada alrededor del nivel promedio del primer canal, y crece una nueva cresta situada alrededor del nivel promedio del segundo canal más fuerte. El nivel suavizado ha empezado a moverse a la derecha hacia el nivel promedio del segundo canal. Sin embargo, su probabilidad todavía es mayor que pT, y por tanto todavía se emplean las constantes de tiempo más lentas. 15
En la tercera fase, la mitad de la transición, la primera cresta de la densidad de probabilidad ha seguido reduciéndose, y la segunda cresta ha seguido creciendo. El nivel suavizado ha seguido creciendo hacia la derecha hacia el segundo canal, pero ahora su probabilidad cae por debajo del umbral pT. ( se ha movido hacia el espacio de baja probabilidad entre las dos crestas.) En este punto, se usan constantes de tiempo rápidas para actualizar , haciendo que se mueva rápidamente a través del espacio hacia la cresta del segundo canal. 20
En la cuarta fase, el final de la transición, se ha movido hacia la cresta principal del segundo canal, y de nuevo su probabilidad es mayor que pT. Ahora se produce un nuevo cambio a las constantes de tiempo más lentas.
Finalmente, en la quinta fase, el nuevo estado de equilibrio, el nivel suavizado se ha situado en el nivel promedio del segundo canal; y se siguen usando constantes de tiempo lentas.
Al usar información derivada de la estimación de densidad de probabilidad variable con el tiempo p(l,t), esta 25 realización de la invención adapta las constantes de tiempo para suavizar una medida del nivel de señal de audio de una manera que responde rápidamente durante períodos verdaderos de transición pero permanece estable para señales anteriormente problemáticas.
Ahora se describe en detalle un ejemplo de una realización específica de la invención. En esta realización, el suavizado que genera [t] a partir de L[t] puede expresarse como un filtro de un polo con un coeficiente variable con el 30 tiempo [t]:
Se adapta este suavizado variando el coeficiente [t] como una función de la estimación de densidad de probabilidad p(l,t). Se describe en primer lugar la derivación de esta estimación de densidad p(l,t) a partir del nivel a corto plazo L[t]. Entonces se describe el control del coeficiente [t]. 35
Estimación de la densidad de probabilidad
La estimación de densidad de probabilidad p(l,t) captura el comportamiento del nivel a corto plazo L[t] por un intervalo de tiempo que se extiende al pasado reciente desde el índice de tiempo actual t. Para ello, el estimador 33 (figura 3) tiene una memoria intermedia (no mostrada) que contiene los valores T anteriores del nivel a corto plazo L[t]. (La duración T de esta memoria intermedia puede elegirse según la aplicación deseada. Para el ejemplo de AGC 40 tratado anteriormente, la duración de la memoria intermedia puede establecerse, por ejemplo, igual a cuatro segundos.)
A partir de esta memoria intermedia, puede generarse una estimación de la densidad de probabilidad de muchas maneras. Por ejemplo, puede adaptarse una representación paramétrica tal como un modelo de mezclas Gaussianas a los datos en la memoria intermedia. Otra técnica computa un histograma de los datos almacenados en memoria intermedia. Cada valor en la memoria intermedia se asigna a un intervalo discreto. La función de densidad 45 p(l,t) se computa hallando en primer lugar el intervalo en el que se encuentra el valor l y después computando la probabilidad como el número de puntos en la memoria intermedia de datos asignada a este intervalo dividido entre el número total de puntos en la memoria intermedia de datos. Los intervalos del histograma pueden definirse para situarse
entre algún nivel mínimo Lmín y nivel máximo Lmáx con una separación de Lint. Por ejemplo, si el nivel se representa en unidades de dB, puede establecerse Lmín =1 dB, Lmáx =120 dB, y Lint =1 dB, para obtener un histograma con 120 intervalos. Generalmente, el número total de intervalos B puede expresarse como:
En cada instante de tiempo t, se cuenta el número de muestras en la memoria intermedia de datos de duración 5 T que entra en cada intervalo del histograma. Ht[b], b = 1 ... B, son los intervalos del histograma, y puede computarse el intervalo b al que se asigna un valor de nivel l según la función de correspondencia:
Algorítmicamente, el cómputo del histograma Ht[b] en cada momento t se produce según el siguiente pseudocódigo: 10
para b = 1 a B,
Ht[b] = 0
final
para  = 0 a T-1
b = NivelAIntervalo (L[t-]) 15
Ht[b] = Ht[b]+1
final
Entonces la estimación de densidad de probabilidad p(l,t) se da mediante el histograma en el intervalo al que se asigna l dividido entre el número total de puntos de datos en la memoria intermedia:
20
El resultado es una densidad de probabilidad estimada p(l,t) que no es una función continua del nivel de entrada l sino más bien una función de “etapas escalonadas” en un intervalo de Lint. Sin embargo, si la separación del histograma Lint es lo suficientemente pequeña, la estimación de densidad de probabilidad es lo suficiente suave para fines prácticos.
Cálculo del coeficiente de filtro de suavizado 25
Ahora se describe el cálculo del coeficiente de filtro adaptativo [t]. En condiciones normales, cuando la probabilidad de [t-1] es relativamente alta, se usan constantes de tiempo de ataque y liberación normales (como en la ecuación 1). Cuando la probabilidad de [t-1] es baja, se usan constantes de tiempo de ataque y liberación más rápidas.
Para interpolar suavemente entre constantes de tiempo normales y rápidas, se genera una señal de control [t] que oscila entre cero y uno basándose en la probabilidad de [t-1] que se computa a partir de la estimación de densidad p(l,1):
Si p([t-1],t) es mayor que un umbral pT, entonces la señal de control [t] es igual a uno. A medida que p([t-5 1],t) cae por debajo de pT, la señal de control [t] cae a cero. Finalmente, se computa el coeficiente de filtro de suavizado [t] interpolando entre coeficientes de ataque y liberación normales y rápidos basándose en la señal de control [t].
Cuando [t] es igual a cero ([t-1]) se encuentra en una zona de baja probabilidad), se usan coeficientes de 10 ataque y liberación rápida. Cuando [t] es igual a uno ([t-1]) se encuentra en una zona de alta probabilidad), entonces se usan los coeficientes de ataque y liberación normales.
Para la implementación de un AGC, los valores de ataque, ataque rápido, liberación y liberación rápida, pueden establecerse correspondiendo a constantes de tiempo de 1, 0,1, 4 y 0,4 segundos, respectivamente. Puede establecerse el valor del umbral pT de probabilidad a un valor fijo de 0,075. 15
A pesar de que esta realización usa un valor fijo del umbral pT también puede ser ventajoso en determinadas aplicaciones hacer que pT sea un umbral variable que cambie, por ejemplo, como una función de alguna medida de la estimación de densidad p(l,t). Por ejemplo, pT puede variar con el máximo de p(l, t) a través del nivel l.
Esta memoria descriptiva incorpora como referencia todas las publicaciones y solicitudes de patentes mencionadas en el presente documento, en la misma medida que si la memoria descriptiva hubiera incorporado 20 específica e individualmente como referencia cada dicha solicitud de patente o publicación individual.
Como esta invención puede implementarse de varias formas sin apartarse del espíritu de las características esenciales de la misma, la presente realización es por tanto ilustrativa y no restrictiva. Se pretende por tanto que las reivindicaciones abarquen los cambios que se encuentren dentro de las medidas y los límites de las reivindicaciones, o la equivalencia de tales medidas y límites de las mismas. 25

Claims (19)

  1. REIVINDICACIONES
    1. Método para suavizar un nivel variable con el tiempo de una señal, comprendiendo el método:
    estimar (33) una densidad de probabilidad variable con el tiempo del nivel variable con el tiempo de la señal;
    computar (34) la probabilidad de un nivel variable con el tiempo suavizado anterior usando la estimación de densidad de probabilidad variable con el tiempo; 5
    adaptar (35) un filtro de suavizado en respuesta a la probabilidad; y
    aplicar (32) el filtro de suavizado adaptado al nivel variable con el tiempo para generar el nivel variable con el tiempo suavizado.
  2. 2. Método según la reivindicación 1, que comprende adaptar constantes de tiempo del filtrado de suavizado para estar en proporción con la tasa de variación de la densidad de probabilidad estimada. 10
  3. 3. Método según la reivindicación 1, en el que el nivel variable con el tiempo y el nivel variable con el tiempo suavizado son series cronológicas, teniendo cada una índices de tiempo anteriores y actuales, y comprendiendo el método:
    computar la probabilidad del nivel variable con el tiempo suavizado en el índice de tiempo anterior;
    adaptar el filtro de suavizado en respuesta a la probabilidad del nivel variable con el tiempo suavizado en el índice de tiempo anterior; y 15
    aplicar el filtro de suavizado adaptado al nivel variable con el tiempo en el índice de tiempo actual.
  4. 4. Método según la reivindicación 3, comprendiendo el método adaptar el filtro de suavizado en respuesta a:
    el nivel variable con el tiempo suavizado en el índice de tiempo anterior, el nivel variable con el tiempo en el índice de tiempo actual y
    la probabilidad del nivel variable con el tiempo suavizado en el índice de tiempo anterior. 20
  5. 5. Método según la reivindicación 4, que comprende adaptar constantes de tiempo de ataque y liberación del filtro de suavizado de tal manera que:
    la constante de ataque es igual a un primer valor de ataque y la constante de liberación es igual a un primer valor de liberación cuando la probabilidad computada del nivel variable con el tiempo suavizado en el índice de tiempo anterior es menor que o igual a una probabilidad umbral; y 25
    la constante de ataque es igual a un segundo valor de ataque y la constante de liberación es igual a un segundo valor de liberación cuando la probabilidad computada del nivel variable con el tiempo suavizado en el índice de tiempo anterior es mayor que la probabilidad umbral, en el que o bien el segundo valor de ataque es mayor que el primer valor de ataque o bien el segundo valor de liberación es mayor que el primer valor de liberación.
  6. 6. Método según la reivindicación 1, que adapta el filtro de suavizado modificando constantes de tiempo del filtro de 30 suavizado en respuesta a la probabilidad, en el que se usan constantes de tiempo más rápidas cuando la probabilidad es inferior y se usan constantes de tiempo más lentas cuando la probabilidad es superior.
  7. 7. Método según la reivindicación 1, que comprende adaptar el filtro de suavizado en respuesta al ancho de la densidad de probabilidad variable con el tiempo.
  8. 8. Método según la reivindicación 5, que comprende adaptar la probabilidad umbral en respuesta a la densidad de 35 probabilidad estimada.
  9. 9. Método según una cualquiera de las reivindicaciones 1 a 8, que comprende estimar la densidad de probabilidad adaptando una representación paramétrica a valores anteriores del nivel variable con el tiempo.
  10. 10. Método según una cualquiera de las reivindicaciones 1 a 8, que comprende estimar la densidad de probabilidad computando un histograma de valores anteriores del nivel variable con el tiempo. 40
  11. 11. Memoria legible por ordenador que contiene un programa informático para su ejecución mediante un ordenador para realizar uno cualquiera de los métodos según las reivindicaciones 1 a 10.
  12. 12. Sistema informático que comprende:
    una CPU;
    la memoria según la reivindicación 11; y
    un bus que acopla con comunicación la CPU y la memoria.
  13. 13. Aparato para suavizar un nivel variable con el tiempo de una señal de audio, comprendiendo el aparato:
    un terminal de entrada para recibir la señal de audio;
    una unidad de cómputo de nivel a corto plazo acoplada al terminal de entrada para computar un nivel a corto plazo de la 5 señal de audio;
    un suavizador (32) de nivel acoplado a una salida de la unidad de cómputo de nivel a corto plazo para suavizar el nivel a corto plazo de la señal de audio usando parámetros de suavizado;
    un estimador (33) de densidad de probabilidad acoplado a la salida de la unidad de cómputo de nivel a corto plazo para estimar una densidad de probabilidad del nivel a corto plazo; 10
    un retardador (36) acoplado a una salida del suavizador de nivel para retardar el nivel a corto plazo suavizado de la señal de audio;
    una unidad (34) de cómputo de probabilidad acoplado a una salida del estimador de densidad de probabilidad y a una salida del retardador para computar una probabilidad del nivel a corto plazo suavizado retardado; y
    un calculador (35) de parámetros de suavizado acoplado a la salida de la unidad de cómputo de nivel a corto plazo, 15 acoplado a una salida de la unidad de cómputo de probabilidad, y acoplado a la salida del retardador para calcular los parámetros de suavizado, en el que el suavizador de nivel también está acoplado a una salida del calculador de parámetros de suavizado.
  14. 14. Aparato según la reivindicación 13, en el que el estimador de densidad de probabilidad estima la densidad de probabilidad usando una serie cronológica del nivel a corto plazo de la señal de audio. 20
  15. 15. Aparato según la reivindicación 13, en el que la unidad de cómputo de probabilidad computa la probabilidad usando la densidad de probabilidad estimada y el nivel a corto plazo suavizado retardado.
  16. 16. Aparato según la reivindicación 13, en el que el calculador de parámetros de suavizado calcula los parámetros de suavizado usando la probabilidad, el nivel a corto plazo suavizado retardado y el nivel a corto plazo.
  17. 17. Aparato según la reivindicación 14, en el que 25
    la unidad de cómputo de probabilidad computa la probabilidad usando la densidad de probabilidad estimada y el nivel a corto plazo suavizado retardado; y
    el calculador de parámetros de suavizado calcula los parámetros de suavizado usando la probabilidad, el nivel a corto plazo suavizado retardado y el nivel a corto plazo.
  18. 18. Aparato según las reivindicaciones 13 a 17, en el que el estimador de densidad de probabilidad adapta una 30 representación paramétrica a valores anteriores del nivel a corto plazo.
  19. 19. Aparato según las reivindicaciones 13 a 17, en el que el estimador de densidad de probabilidad computa un histograma de valores anteriores del nivel a corto plazo.
ES08780173T 2007-07-13 2008-07-11 Nivel de señal de audio variable con el tiempo usando una densidad de probabilidad estimada variable con el tiempo del nivel. Active ES2354962T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US95944207P 2007-07-13 2007-07-13
US959442P 2007-07-13

Publications (1)

Publication Number Publication Date
ES2354962T3 true ES2354962T3 (es) 2011-03-21

Family

ID=40090149

Family Applications (1)

Application Number Title Priority Date Filing Date
ES08780173T Active ES2354962T3 (es) 2007-07-13 2008-07-11 Nivel de señal de audio variable con el tiempo usando una densidad de probabilidad estimada variable con el tiempo del nivel.

Country Status (11)

Country Link
US (1) US9698743B2 (es)
EP (1) EP2168237B1 (es)
JP (1) JP5044019B2 (es)
CN (1) CN101743689B (es)
AT (1) ATE486407T1 (es)
BR (1) BRPI0814241B1 (es)
DE (1) DE602008003236D1 (es)
ES (1) ES2354962T3 (es)
RU (1) RU2433525C1 (es)
TW (1) TWI467568B (es)
WO (1) WO2009011826A2 (es)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102017402B (zh) 2007-12-21 2015-01-07 Dts有限责任公司 用于调节音频信号的感知响度的***
JP5120288B2 (ja) * 2009-02-16 2013-01-16 ソニー株式会社 音量補正装置、音量補正方法、音量補正プログラムおよび電子機器
DK2238899T3 (da) * 2009-04-06 2017-01-02 Gn Resound As Effektiv bedømmelse af høreevne
WO2010127024A1 (en) 2009-04-30 2010-11-04 Dolby Laboratories Licensing Corporation Controlling the loudness of an audio signal in response to spectral localization
WO2010126709A1 (en) 2009-04-30 2010-11-04 Dolby Laboratories Licensing Corporation Low complexity auditory event boundary detection
TWI503816B (zh) 2009-05-06 2015-10-11 Dolby Lab Licensing Corp 調整音訊信號響度並使其具有感知頻譜平衡保持效果之技術
US8538042B2 (en) 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
US9312829B2 (en) 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
RU2665873C1 (ru) * 2013-01-21 2018-09-04 Долби Лэборетериз Лайсенсинг Корпорейшн Оптимизация громкости и динамического диапазона через различные устройства воспроизведения
CN105225673B (zh) * 2014-06-09 2020-12-04 杜比实验室特许公司 用于噪声水平估计的方法、***和介质
US9953661B2 (en) * 2014-09-26 2018-04-24 Cirrus Logic Inc. Neural network voice activity detection employing running range normalization
US11170313B2 (en) * 2014-10-10 2021-11-09 Analog Devices International Unlimited Company Pipelining and parallelism for implementing a mixture model

Family Cites Families (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8608289D0 (en) * 1986-04-04 1986-05-08 Pa Consulting Services Noise compensation in speech recognition
US4890250A (en) * 1988-11-18 1989-12-26 Steven Levin Hybrid estimating filter
US5101416A (en) * 1990-11-28 1992-03-31 Novatel Comunications Ltd. Multi-channel digital receiver for global positioning system
GB9103931D0 (en) * 1991-02-26 1991-04-10 Dsp Consultants Ltd Signal processing apparatus and method
US5517531A (en) * 1991-05-29 1996-05-14 The United States Of America As Represented By The Secretary Of The Navy Kernel adaptive interference suppression system
US5740048A (en) * 1992-08-07 1998-04-14 Abel; Jonathan S. Method and apparatus for GPS positioning, filtering and integration
JP3533696B2 (ja) 1994-03-22 2004-05-31 三菱電機株式会社 音声認識の境界推定方法及び音声認識装置
AU7723696A (en) * 1995-11-07 1997-05-29 Euphonics, Incorporated Parametric signal modeling musical synthesizer
GB9614209D0 (en) 1996-07-05 1996-09-04 Univ Manchester Speech synthesis system
US5903872A (en) * 1997-10-17 1999-05-11 Dolby Laboratories Licensing Corporation Frame-based audio coding with additional filterbank to attenuate spectral splatter at frame boundaries
WO1999030315A1 (fr) * 1997-12-08 1999-06-17 Mitsubishi Denki Kabushiki Kaisha Procede et dispositif de traitement du signal sonore
US6768979B1 (en) 1998-10-22 2004-07-27 Sony Corporation Apparatus and method for noise attenuation in a speech recognition system
US6226409B1 (en) * 1998-11-03 2001-05-01 Compaq Computer Corporation Multiple mode probability density estimation with application to sequential markovian decision processes
US6266633B1 (en) * 1998-12-22 2001-07-24 Itt Manufacturing Enterprises Noise suppression and channel equalization preprocessor for speech and speaker recognizers: method and apparatus
WO2001015144A1 (fr) * 1999-08-23 2001-03-01 Matsushita Electric Industrial Co., Ltd. Vocodeur et procede correspondant
US6111183A (en) * 1999-09-07 2000-08-29 Lindemann; Eric Audio signal synthesis system based on probabilistic estimation of time-varying spectra
US6954745B2 (en) * 2000-06-02 2005-10-11 Canon Kabushiki Kaisha Signal processing system
US7035790B2 (en) * 2000-06-02 2006-04-25 Canon Kabushiki Kaisha Speech processing system
US7236640B2 (en) * 2000-08-18 2007-06-26 The Regents Of The University Of California Fixed, variable and adaptive bit rate data source encoding (compression) method
RU2237965C2 (ru) 2000-09-18 2004-10-10 Евгений Александрович Баранник Способ цифровой адаптивной фильтрации сигналов и устройство для его выполнения
ATE492076T1 (de) * 2001-04-04 2011-01-15 Quellan Inc Verfahren und system zum decodieren von mehrpegelsignalen
US6702608B2 (en) * 2001-05-16 2004-03-09 Bernard A. Brennan, Jr. Electric workstation with power reel cords
US7219034B2 (en) * 2001-09-13 2007-05-15 Opnet Technologies, Inc. System and methods for display of time-series data distribution
US7552030B2 (en) * 2002-01-22 2009-06-23 Honeywell International Inc. System and method for learning patterns of behavior and operating a monitoring and response system based thereon
US6999628B2 (en) * 2002-03-28 2006-02-14 Microsoft Corporation Tarp filter
US7218763B2 (en) * 2003-02-27 2007-05-15 Eastman Kodak Company Method for automated window-level settings for magnetic resonance images
US7475013B2 (en) * 2003-03-26 2009-01-06 Honda Motor Co., Ltd. Speaker recognition using local models
CA2525942C (en) 2003-05-28 2015-04-07 Dolby Laboratories Licensing Corporation Method, apparatus and computer program for calculating and adjusting the perceived loudness of an audio signal
US7212652B1 (en) * 2003-07-07 2007-05-01 The United States Of America As Represented By The Secretary Of The Navy Method for tracking targets with hyper-spectral data
US7343284B1 (en) * 2003-07-17 2008-03-11 Nortel Networks Limited Method and system for speech processing for enhancement and detection
CN100417043C (zh) * 2003-08-05 2008-09-03 华邦电子股份有限公司 自动增益控制器及其控制方法
JP4529492B2 (ja) * 2004-03-11 2010-08-25 株式会社デンソー 音声抽出方法、音声抽出装置、音声認識装置、及び、プログラム
US7649988B2 (en) * 2004-06-15 2010-01-19 Acoustic Technologies, Inc. Comfort noise generator using modified Doblinger noise estimate
US8180664B2 (en) * 2004-12-01 2012-05-15 Hewlett-Packard Development Company, L.P. Methods and systems for forecasting with model-based PDF estimates
US7668053B2 (en) * 2005-06-03 2010-02-23 Zoran Corporation Processing an information carrying signal
US7830991B2 (en) * 2005-10-03 2010-11-09 Harris Corporation Frequency selective automatic gain control with dual non-symmetric attack and release times and interference detection feature
JP4630983B2 (ja) * 2007-02-26 2011-02-09 独立行政法人産業技術総合研究所 音高推定装置、音高推定方法およびプログラム
US8005238B2 (en) * 2007-03-22 2011-08-23 Microsoft Corporation Robust adaptive beamforming with enhanced noise suppression
DE102007036277A1 (de) * 2007-07-31 2009-02-05 Technische Universität Berlin Verfahren und Vorrichtung zur automatischen Mustererkennung
US7983490B1 (en) * 2007-12-20 2011-07-19 Thomas Cecil Minter Adaptive Bayes pattern recognition
JP2009176909A (ja) * 2008-01-24 2009-08-06 Toshiba Corp 抜取検査の評価方法及び抜取検査の評価装置

Also Published As

Publication number Publication date
US9698743B2 (en) 2017-07-04
TW200912898A (en) 2009-03-16
BRPI0814241B1 (pt) 2020-12-01
CN101743689A (zh) 2010-06-16
ATE486407T1 (de) 2010-11-15
WO2009011826A2 (en) 2009-01-22
BRPI0814241A2 (pt) 2015-01-06
TWI467568B (zh) 2015-01-01
CN101743689B (zh) 2013-04-10
JP5044019B2 (ja) 2012-10-10
JP2010540977A (ja) 2010-12-24
EP2168237B1 (en) 2010-10-27
US20100174540A1 (en) 2010-07-08
DE602008003236D1 (de) 2010-12-09
WO2009011826A3 (en) 2009-04-30
RU2433525C1 (ru) 2011-11-10
RU2010105057A (ru) 2011-08-20
EP2168237A2 (en) 2010-03-31

Similar Documents

Publication Publication Date Title
ES2354962T3 (es) Nivel de señal de audio variable con el tiempo usando una densidad de probabilidad estimada variable con el tiempo del nivel.
ES2399295T3 (es) Limitación de picos de audio en etapas lentas y rápidas
TWI459719B (zh) 響度補償音量控制方法、適於執行此方法的設備、以及非暫時性電腦可讀取儲存媒體
TWI538393B (zh) 響應於頻譜局部化來控制音訊信號響度的技術
ES2290764T3 (es) Metodo, aparato y programa de ordenador para calcular y ajustar la sonoridad percibida de una señal de audio.
US8090120B2 (en) Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
JP5041979B2 (ja) オーディオコンプレッサ
WO2009112825A1 (en) Audio processing
EP2002429A1 (en) Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
EP2928076B1 (en) Level adjustment device and method
US8816886B1 (en) Method and apparatus to control the effective gain of a statistically calibrated analog to digital converter
JP5744745B2 (ja) 聴覚測定装置及びその方法
CN107659279A (zh) 一种音频自动增益控制方法及装置
EP2023484A1 (en) Automatic gain control device
JP6746588B2 (ja) 増幅器のパワー制限のためにボリューム利得を適合させるための方法、および増幅器
US9628907B2 (en) Audio device and method having bypass function for effect change
US9219455B2 (en) Peak detection when adapting a signal gain based on signal loudness
US8054993B1 (en) System for automatic compensation of low frequency audio based on human loudness perceptual models
TWI425844B (zh) 音量控制電路及其方法
CN106533379B (zh) 用于处理音频信号的方法和装置
KR102509783B1 (ko) 자동 사운드 레벨 조절 기능을 가진 증폭기
KR101842774B1 (ko) 오디오 ld 자동 제어 방법 및 시스템
EP2530952B1 (en) Sound processing apparatus and parameter setting method