ES2399295T3 - Limitación de picos de audio en etapas lentas y rápidas - Google Patents

Limitación de picos de audio en etapas lentas y rápidas Download PDF

Info

Publication number
ES2399295T3
ES2399295T3 ES07836595T ES07836595T ES2399295T3 ES 2399295 T3 ES2399295 T3 ES 2399295T3 ES 07836595 T ES07836595 T ES 07836595T ES 07836595 T ES07836595 T ES 07836595T ES 2399295 T3 ES2399295 T3 ES 2399295T3
Authority
ES
Spain
Prior art keywords
gain
audio signal
buffer
input
threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES07836595T
Other languages
English (en)
Inventor
Michael John Smithers
Brett Graham Crockett
David Stanley Mcgrath
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby Laboratories Licensing Corp
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Application granted granted Critical
Publication of ES2399295T3 publication Critical patent/ES2399295T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/007Volume compression or expansion in amplifiers of digital or coded signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G11/00Limiting amplitude; Limiting rate of change of amplitude ; Clipping in general
    • H03G11/008Limiting amplitude; Limiting rate of change of amplitude ; Clipping in general of digital or coded signals

Landscapes

  • Control Of Amplification And Gain Control (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

Un método para limitar picos en señales de audio, en el que el método comprende: - recibir una señal de audio de entrada; - detectar excursiones de la señal de audio de entrada que superan un umbral; - calcular una primera ganancia en respuesta a las excursiones detectadas; - aplicar la primera ganancia a la señal de audio de entrada para genera una señal de audio intermedia; - aplicar una línea de retardo a la señal de audio intermedia para generar una señal de audio intermedia retardada; - identificar uno o más valores de picos de la señal de audio intermedia dentro de la línea de retardo que superan elumbral; - calcular una segunda ganancia en respuesta a los valores de picos identificados, en donde las reducciones en lasegunda ganancia son más rápidas que las reducciones en la primera ganancia; y - aplicar la segunda ganancia a la señal de audio intermedia retardada para generar una señal de audio de salidacuyos valores de picos no superan el umbral.

Description

Limitación de picos de audio en etapas lentas y rápidas
5 Campo técnico
Esta invención se refiere en general al procesamiento de señal de audio digital y a la limitación de picos de audio. Más particularmente, la invención se refiere a la reducción de ganancia variable de una señal de audio para limitar la señal de audio a un umbral.
Técnica antecedente
La limitación de picos de audio ha sido una parte fundamental de la producción, transmisión y reproducción de audio durante más de 50 años. Como muestra la figura 1, en su forma más básica un limitador de picos de audio
15 proporciona una entrada a la característica de nivel de señal de salida de tal manera que la tensión de salida es igual a la tensión de entrada hasta el umbral de limitación de picos. Para señales de audio de entrada con amplitud por encima del umbral, nivel de salida de la señal de audio está restringido (limitado), de modo que no se supere el umbral. Al igual que con otros sistemas dinámicos de control de ganancia para el audio, el método de modificar la ganancia tiene un impacto significativo sobre la naturaleza y la audibilidad de los artefactos introducidos en la señal de audio de salida.
En uno de sus primeros usos, la limitación de picos de audio controlaba las amplitudes de señal de audio para evitar la sobre-modulación durante las emisiones de radio. Hoy en día, la limitación de picos de audio aún evita rutinariamente la sobre-modulación en emisiones de radio y televisión.
25 La limitación de picos de audio también ha sido una parte importante de la masterización fonográfica de grabación. La masterización fonográfica implica que un torno corte acanaladuras en un disco maestro fonográfico de grabación que representan la forma de onda de audio. En este caso, la limitación restringe la amplitud del audio y, por lo tanto, la anchura y la profundidad de los surcos de la grabación fonográfica para que encajen dentro de las limitaciones físicas del medio fonográfico.
Con la llegada de la tecnología de audio digital, el control de la amplitud de audio usando limitación de picos sigue siendo importante durante la grabación y la reproducción. Durante la grabación de audio digital, que convierte de analógico a digital, si la señal analógica de entrada de audio supera el nivel de señal de entrada correspondiente al
35 máximo de la muestra de audio digital que puede ser representada por el sistema digital (0 dBFS), la resultante representación digital grabada del audio se recortará. Esto ocurre porque los niveles de señal analógica de audio por encima de 0 dBFS pueden ser representados como máximo por 0 dBFS. Del mismo modo, si múltiples señales digitales de audio se mezclan en el dominio digital sin escalado, durante la reproducción es posible que la suma de los datos de audio superen 0 dBFS, el máximo de la señal digital que puede ser representado durante la conversión de digital a analógico. El resultado es una forma de onda analógica de salida recortada.
Un ejemplo típico de recorte, representativo de la grabación y la reproducción digitales se muestra en la figura 2. La mezcla de múltiples señales digitales de audio se ha convertido en muy común con la llegada de los modernos formatos multicanal de audio (tales como Dolby Digital 5.1 y MLP) y los sistemas de reproducción que reducen
45 canales mediante mezcla de material multicanal para su reproducción en sistemas compatibles con los sistemas estereofónicos o monoaurales.
Recientemente, en la masterización de material de audio digital (es decir, CD y DVD de audio), los algoritmos de limitación de picos son estándar con el fin de permitir que el nivel (y por lo tanto sonoridad aparente) del audio aumente sin superar un de nivel de picos definido por el usuario (por ejemplo -0,1 dBFS o 0 dBFS). Esta práctica se ha vuelto cada vez más frecuente a medida que el deseo de producir representaciones cada vez más fuertes de audio ha crecido.
La limitación de picos de audio se puede realizar tanto en la señal completa de ancho de banda completo como en
55 un enfoque multibanda que realiza operaciones individuales de limitación de picos en distintas y diferentes bandas de frecuencia de audio. Para la limitación de picos multibanda, las bandas de frecuencias procesadas individualmente se suman después de la limitación de picos para volver a crear una señal compuesta.
En general, la limitación de picos de banda ancha se utiliza cuando se prefiere una mínima alteración del espectro de audio y el timbre, tal como con la masterización de música. La limitación multibanda se utiliza a menudo para alcanzar cantidades significativas de limitación de picos, pero con el potencial de alterar significativamente las características espectrales y el timbre percibido del audio. Los usos de la limitación multibanda incluyen la transmisión de radio FM en la que una estación desea tener un nivel muy alto de sonido percibido, así como tener un "sonido" único - dictado por los ajustes del limitador multibanda.
65 La limitación de picos en la masterización de música por lo general requiere reducciones de ganancia de 0 a aproximadamente 20 dB. Reducir canales mediante mezcla de señales de audio envolvente de cinco (5) canales a señales estéreo de dos (2) canales, como ocurre en los reproductores de DVD y receptores de cine en casa, requiere hasta 9 dB de reducción de ganancia -cuando, por ejemplo, el canal izquierdo estéreo es una suma del canal izquierdo, envolvente izquierdo y central reducido -3 dB para la señal envolvente de 5 canales.
5 Puede lograrse una limitación de picos bastante inaudible para reducciones de ganancia en el rango de 0 a 12 dB, y existen algunos productos comerciales que tienen un buen rendimiento en este rango. La limitación que requiere reducciones de ganancia mayores de aproximadamente 12 dB puede llegar a ser bastante audible, y en esta discusión una reducción de ganancia mayor de aproximadamente 12 dB se considera grande o significativa.
El documento US 2006/0018493 A1 divulga un aparato y un método para compensar automáticamente el volumen de audio en respuesta a un cambio de canal. Se genera un valor de ganancia para ajustar un nivel de una señal de audio de entrada comparando un nivel medio de la señal de audio de entrada con una curva predeterminada de nivel de entrada/salida, ajustando un volumen de audio de la señal de audio de entrada aplicando el valor de ganancia
15 generado al nivel de la señal de audio de entrada, y ajustando un rango dinámico de la señal de audio que tiene el volumen de audio ajustado. Una unidad de retardo retarda la señal de audio de entrada hasta que el valor final de ganancia se aplica a la señal de audio de entrada.
Breve sumario de la invención
La invención se define mediante las reivindicaciones independientes. Las reivindicaciones dependientes tratan rasgos opcionales de algunas realizaciones de la invención.
Aquí se enseñan métodos y aparatos para limitar la magnitud absoluta de una señal de audio. El método puede
25 incluir primeramente una reducción de ganancia variable de la ganancia de una señal de audio y, a continuación, en segundo lugar una reducción de ganancia variable de la ganancia de la señal de audio más rápida que la primera reducción de ganancia variable, lo que limita la magnitud absoluta de la señal de audio a un umbral. La primera reducción de ganancia variable puede incluir la reducción de ganancia variable de la ganancia de la señal de audio en una primera etapa, y la segunda reducción de ganancia variable puede incluir la reducción de ganancia variable de la ganancia de la señal de audio en una segunda etapa que reduce la ganancia más rápidamente que la primera etapa.
La primera reducción de ganancia variable puede incluir la detección de una excursión en la señal de audio más allá del umbral, el cálculo de una ganancia lenta utilizando la excursión detectada, y la aplicación de la ganancia lenta a
35 la señal de audio.
La segunda reducción de ganancia variable puede incluir el retardo de la señal de audio, la localización de un pico entre la señal de audio retardada, el cálculo de una ganancia rápida a partir de un pico localizado, y la modificación de la señal de audio retardada con la ganancia rápida calculada. El retardo puede incluir el almacenamiento en búfer de la señal de audio, y la localización podría incluir el examen de la señal de audio almacenada en búfer. Se pueden mantener direcciones aparentes de respectivas imágenes virtuales y direcciones de respectivas señales de audio codificadas en matriz. La segunda reducción de ganancia variable puede producir menos salpicadura espectral audible que un método como se constituyó anteriormente, excepto que carece del retardo. El almacenamiento en búfer puede incluir proporcionar una cantidad finita de tiempo para que la segunda reducción de ganancia variable
45 dé un giro para encontrar un pico más allá del umbral. La retardo puede incluir retardar durante al menos 1 ms y puede incluir retardar durante alrededor de 1,5 ms. Localizar el pico puede incluir la determinación de máximos en los respectivos segmentos temporales de la señal de audio retardada, retardando los máximos de la señal de audio, y computar una señal de control para la reducción de la ganancia de la señal de audio, sobre la base de los máximos retardados.
El primer retardo anterior puede coincidir con el retardo indicado adicionalmente con anterioridad. El cómputo puede incluir el cómputo de la señal de control como una función de filtrado de paso bajo de los máximos retardados. El cómputo puede incluir el cómputo de la señal de control como una función de los máximos retardados promediados ponderados.
55 El cómputo puede incluir el uso de coeficientes del filtrado que son una función de la raíz cuadrada de una ventana de Hanning. El uso puede incluir el dimensionamiento de la ventana de Hanning con la misma longitud que el búfer de retardo.
El cómputo puede incluir el uso de valores de ponderación que son una función de la raíz cuadrada de una ventana de Hanning. El uso puede incluir el dimensionamiento de la ventana de Hanning con la misma longitud que el búfer de retardo.
El cálculo de la ganancia rápida puede incluir la inversión sustancial de la determinación, el retardo y el cómputo de
65 la localización del pico. El cálculo de una ganancia rápida puede incluir el cálculo de la ganancia rápida como el inverso de la suma de 1 y la señal de control computada para la reducción de la ganancia.
El cálculo de una ganancia rápida puede incluir el cálculo de la ganancia rápida por aproximación de Newton-Rhapson. El cálculo puede incluir el cálculo por aproximación de Newton-Rhapson de a cuál pertenece la convergencia que se ralentiza. El cálculo puede incluir calcular por aproximación de Newton-Rhapson ralentizada dónde se limita la velocidad de convergencia S tal que:
El cálculo puede incluir calcular por aproximación de Newton-Rhapson ralentizada dónde la velocidad de 10 convergencia S es de aproximadamente 0,3.
Aquí se enseña también un medio legible por ordenador que contiene un programa de ordenador para ejecutar uno de los métodos anteriores.
15 Aquí también se enseña un sistema de ordenador que incluye una CPU, uno de los medios legibles por ordenador y un bus que acopla la CPU y el medio.
Aquí se enseña también un limitador de picos de audio. El limitador de picos puede incluir un primer reductor de ganancia variable para la reducción de ganancia variable de la ganancia de una señal de audio, y un segundo 20 reductor de ganancia variable para una reducción adicional de ganancia variable de la ganancia de la señal de audio más rápida que la primera reducción de ganancia variable, lo que limita la magnitud absoluta de la señal de audio a un umbral. El primer reductor de ganancia variable puede incluir una primera etapa para la reducción de ganancia variable de la ganancia de la señal de audio, y el segundo reductor de ganancia variable puede incluir una segunda etapa de reducción de ganancia variable de la ganancia de la señal de audio en una segunda etapa que reduce la
25 ganancia más rápidamente que la primera etapa.
El primer reductor de ganancia variable puede incluir un retardo para retardar una señal de audio, un localizador de picos para localizar un pico en la señal retardada de audio, una calculadora de ganancia rápida para el cálculo de una reducción de ganancia rápida usando un pico localizado, y un modificador para modificar la señal retardada de
30 audio con la ganancia rápida calculada.
El retardo puede incluir un búfer, y el localizador de picos puede incluir un examinador de la señal de audio almacenada en búfer. Se pueden mantener direcciones aparentes de respectivas imágenes virtuales y direcciones de respectivas señales de audio codificadas en matriz. La segunda reducción de ganancia variable puede producir 35 menos salpicaduras espectral audibles que un limitador de picos como anteriormente, excepto que carece del retardo. El retardo puede incluir un retardo de al menos 1 ms y puede incluir un retardo de aproximadamente 1,5 ms. El localizador de picos puede incluir un motor de diferencias para determinar máximos en respectivos segmentos temporales de la señal retardada de audio, un búfer de retardo para retardar los máximos de la señal de audio, y un ordenador para computar una señal de control para la reducción de la ganancia de la señal de audio, sobre la base
40 de los máximos retardados.
El búfer de retardo del localizador de picos puede coincidir con el retardo del limitador de picos. El ordenador puede incluir un ordenador para el cómputo de la señal de control como una función del filtrado de paso bajo de los máximos retardados. El ordenador puede incluir un ordenador para el cómputo de la señal de control como una
45 función de los máximos retardados promediados ponderados.
Los coeficientes del filtrado pueden ser una función de la raíz cuadrada de una ventana de Hanning. La ventana de Hanning puede ser de la misma longitud que el búfer de retardo.
50 Los valores de ponderación pueden ser una función de la raíz cuadrada de una ventana de Hanning. La ventana de Hanning puede ser de la misma longitud que el búfer de retardo.
La calculadora de ganancia rápida puede incluir una calculadora de ganancia rápida para el cálculo de una reducción más ganancia rápida mediante sustancialmente la inversión de la operación del localizador de picos. La
55 calculadora de ganancia rápida puede incluir una calculadora de ganancia rápida para el cálculo de la ganancia rápida como el inverso de la suma de 1 y la señal de control computada para la reducción de la ganancia.
La calculadora de ganancia rápida puede incluir una calculadora de ganancia rápida para el cálculo de la ganancia rápida. La calculadora de ganancia rápida puede incluir una calculadora rápida para el cálculo por aproximación de
60 Newton-Rhapson de a cuál pertenece la convergencia que se ralentiza. La calculadora de ganancia rápida puede incluir una calculadora de ganancia rápida para el cálculo por aproximación de Newton-Rhapson ralentizada dónde se limita la velocidad de convergencia S tal que:
La calculadora de ganancia rápida puede incluir una calculadora de ganancia rápida para calcular por aproximación de Newton-Rhapson ralentizada dónde la velocidad de convergencia S es de aproximadamente 0,3.
5 Las diversas características de la presente invención y sus realizaciones preferidas pueden entenderse mejor haciendo referencia a la siguiente discusión y los dibujos que se acompañan.
Breve descripción de los dibujos
10 La figura 1 resume el funcionamiento de un limitador de audio típico, esquematizando un limitador de audio a nivel de sistema de bloques, que muestra la típica característica de voltaje de entrada / salida de un limitador de audio con un umbral arbitrario y que proporciona un ejemplo de una señal de audio antes y después de un procesamienteo de limitación de picos.
15 La figura 2 muestra un ejemplo típico de recorte, representativo de la grabación y reproducción digitales.
La figura 3a ilustra un limitador de picos de audio de dos etapas de acuerdo con una realización de la invención.
20 La figura 3b detalla adicionalmente el limitador de picos de audio de la figura 3a, de acuerdo con una realización de la invención.
La figura 4 ilustra varios cientos de muestras de una señal de entrada y la correspondiente señal de control que emite el detector de excursiones de acuerdo con una realización de la invención.
25 La figura 5 es una visión general del proceso de la calculadora de ganancia lenta de acuerdo con una realización de la invención.
La figura 6 representa gráficamente la función de alabeo de la calculadora 304 de ganancia lenta de acuerdo con 30 una realización de la invención.
La figura 7 traza la actualización de los valores de resistencia de un modelo de RC del circuito de ganancia lenta de acuerdo con una realización de la invención.
35 La figura 8 modela un circuito RC de la calculadora de ganancia lenta de acuerdo con una realización de la invención.
La figura 9 representa gráficamente las relaciones entre la resistencia de salida Rout y el valor anterior de reducción de ganancia lenta y entre la resistencia de entrada Rin y el número de muestras consecutivas de entrada de audio 40 que superan el umbral de limitador, de acuerdo con una realización de la invención.
La figura 10 detalla el localizador de muestras de picos de acuerdo con una realización de la invención.
La figura 11 muestra valores aproximados de reducción de ganancia rápida estimada por "Newton-Rhapson" para 45 varios cientos de muestras superpuestos con los valores verdaderos.
La figura 12 representa gráficamente la reducción de ganancia rápida para señales que se recortan entre 3 y 18 dB de acuerdo con una realización de la invención, así como cantidades más grandes de reducción de ganancia frente a cantidades correspondientemente más altas de dispersión espectral.
50 La figura 13 muestra la resultante señal de reducción de ganancia de limitación de picos computada por una realización de la presente invención para medio segundo de contenido de audio digital típico de 44,1 kHz.
La figura 14 muestra otra señal de reducción de ganancia de limitación de picos computada por una realización de la 55 presente invención para un segundo y medio de contenido de audio digital típico de 44,1 kHz.
La figura 15 muestra cómo las dos etapas del limitador trabajan en condiciones pesadas y sostenidas de reducción de recorte de acuerdo con realizaciones de la invención.
60 La figura 16 es una visión general del proceso del localizador lento de muestras de pico de acuerdo con una realización de la invención.
Descripción detallada de la invención
65 La figura 3a ilustra un limitador de picos de audio de dos etapas 102 de acuerdo con una realización de la invención.
El limitador de picos 102 incluye un reductor de ganancia lenta 202 y una reductor de ganancia rápida 204. El reductor de ganancia lenta 202 recibe como entrada una señal de umbral 201 y una señal de audio 101 y produce una señal intermedia de audio 203. El reductor de ganancia rápida 204 recibe como entrada la señal intermedia de audio 203, así como la señal de umbral 201, y produce como salida la señal de audio 103.
5 El limitador de picos 102 funciona como viene a continuación: El reductor de ganancia lenta 202 recibe uno o más canales de audio por medio de la señal de entrada 101 y una señal que representa el umbral del limitador por medio de la señal de umbral 201. El pico o picos absolutos del canal o canales de audio puede superar el umbral del limitador.
10 El reductor de ganancia rápida 204 da a la salida la señal 103, el o los canales de audio posiblemente limitados de la señal de audio de entrada 101. El limitador 102 limita (reduce la ganancia) cualesquiera picos absolutos en la señal de audio de entrada 101 que supere el umbral del limitador a no más de el umbral límite.
15 Las señales de audio de entrada y salida 101 y 103, respectivamente, pueden ser muestras lineales PCM de acuerdo con una realización de la invención. La señal de umbral 201 puede ser un valor en unidades de dBFS. Entonces, x denota la señal de audio de entrada 101, M representa el número de canales de entrada en la entrada de audio de señal 101, y en la notación x [m, n], m es el índice de canal desde 0 hasta M-1 y n el índice de muestra.
20 La figura 3b detalla adicionalmente el limitador de picos 102 de acuerdo con una realización de la invención. El reductor de ganancia lenta 202 incluye un detector de excursiones/excesos 302, una calculadora de ganancia lenta 304 y un multiplicador 306. El detector de excursiones 302 recibe como entrada la señal de umbral 201 y la señal de audio 101 y produce como salida una señal de control Q[n] 303. La calculadora de ganancia lenta 304 recibe como entrada la señal de control de Q[n] 303 y produce como salida una señal de valor actual de ganancia lenta GSLOW[n]
25 305. El multiplicador 306 recibe como entrada la señal de audio de entrada 101 y la señal de valor actual de ganancia lenta GSLOW[n] 305 y produce como salida la señal de audio de ganancia reducida x’[m, n] 307.
El reductor de ganancia rápida 204 incluye una calculadora de ganancia rápida 312, un localizador de muestras de picos 311, un retardo 308 y un multiplicador 315. El retardo 308 recibe como entrada la señal de audio de ganancia 30 reducida x’[m, n] 307 y produce como salida la señal retardada de audio de ganancia reducida x’‘[m, n] 314. El retardo 308 también pone a disposición todo su búfer de señales de audio retardas como señal 309. El localizador de muestras de pico 310 recibe como entrada la señal 309 de búfer de retardo y la señal de umbral 201 y produce como salida la señal de control P’[n] 311. La calculadora de ganancia rápida 312 recibe como entrada la señal de control P’[n] 311 y produce como salida el valor de reducción de ganancia rápida GFAST[n] 313. El multiplicador 315
35 recibe como entrada el valor de reducción de ganancia rápida GFAST[n] 313 y la señal retardada de audio de ganancia reducida de x’[m, n] 314 y produce como salida las muestras finales de ganancia reducida x’‘[m, n] 103.
En cada iteración de las operaciones de los reductores de ganancia rápida y lenta 202 y 204, se procesa una muestra de cada uno de los canales de entrada y se calculan tanto un único valor de reducción de ganancia lenta
40 como un solo valor de reducción de ganancia rápida y se aplican a todos los canales. Puesto que todos los canales reciben la misma reducción de ganancia lenta y rápida, se mantienen la dirección aparente de imágenes virtuales y la dirección de señales de audio codificadas en matriz.
Reducción de ganancia lenta 45
Detectar excursiones (detectar audio que supera el umbral del limitador)
El detector de excursiones 302 ajusta la señal de control Q[n] 303 a cero (0) cuando la muestra absoluta máxima en todos los M canales de la señal de entrada de audio 101 no es mayor que el umbral de limitador T. Cuando la
50 muestra absoluta máxima en todos los M canales supera el umbral de limitador T, el detector de excursiones 302 ajusta la señal de control Q[n] 303 a una señal proporcional en la medida en que la señal de entrada supera el umbral de limitador T.
De este modo, el reductor de ganancia lenta 202 reduce la señal de audio de entrada 101 para ofrecer a la salida la 55 señal de audio intermedia 307 sólo cuando la señal de entrada 101 supera el umbral de limitador T.
De este modo, en la producción de la señal intermedia de audio 307, el reductor de ganancia lenta 202 responde cuando la señal de audio de entrada 101 supera el umbral de limitador T - pero puede seguir reduciendo la ganancia después de que la señal de audio 303 cae por debajo del umbral T.
60 En una realización, si la muestra absoluta máxima en todos los M canales de la señal de entrada 101 es mayor que el umbral de limitador T, la señal de control Q[n] se establece en la proporción de la muestra absoluta máxima para el umbral T, menos uno. La ecuación (1) detalla esta realización.
La figura 4 ilustra varios cientos de muestras de una señal de entrada y la correspondiente señal de control Q[n] 303 de acuerdo con una realización de la invención. La señal de entrada es una onda sinusoidal digital a 500 Hz con una 5 amplitud pico de -3 dB, y el umbral de limitador T es 0,5 o -6,02 dB. Como se muestra en la figura 4, el valor de muestra de la señal de control Q[n] 303 se computa para cada muestra de entrada PCM.
(Para reducir la complejidad computacional, en lugar de la operación de división mostrada, una multiplicación por 1 / T puede implementar el cómputo de Q[n]).
10 Calcular la ganancia lenta
La figura 5 es una visión general del proceso de la calculadora de ganancia lenta 304 de acuerdo con una realización de la invención. Recibiendo como entrada la señal de control Q[n] 303 y el valor anterior de ganancia
15 lenta GSLOW[n-1] 305, la calculadora de ganancia lenta 304 modifica la señal de control Q[n] 303 (etapa 601), suaviza la señal de control modificada 602 (etapa 603) y, a partir de la señal de control suavizada modificada 604 computa el valor actual de ganancia lenta GSLOW[n] 305 (etapa 605).
En una realización, la etapa de suavizado 603 incorpora características de liberación y de ataque dependientes de la 20 señal.
Modificar la señal de control
La calculadora de ganancia lenta 304 modifica (alabea) la señal de control Q[n] 303 por el valor anterior de ganancia
25 lenta GSLOW[n-1] para crear la señal de control modificada Q’[n] 602. El valor anterior de ganancia lenta GSLOW[n-1] 305 se ajusta inicialmente a la unidad o un valor de 1,0.
Esta modificación amplifica (aumenta) la influencia de la señal de control Q[n] 303 en aumentar la cantidad de reducción de ganancia cuando la reducción de ganancia es ya falta de unidad - es decir, si la reducción de ganancia
30 ya se está aplicando. Beneficiosamente, las infrecuentes apariciones de saturación de señal (es decir, las excursiones que serán recortadas) tienen menos efecto en la generación de la reducción de ganancia lenta pero las frecuentes apariciones en rápida sucesión dan como resultado significativamente más reducción de ganancia. Así, por apariciones infrecuentes de recorte, esta etapa trabaja poco y se evita la posibilidad de bombeo audible.
35 Las ecuaciones 2a y 2b muestran el alabeo de acuerdo con una realización de la invención, y la figura 6 representa gráficamente esa función de deformación. La deformación de las ecuaciones 2a y 2b y la figura 6 fue determinada por una amplia experimentación y ensayo. Su efecto es más prominente cuando el valor anterior ganancia lenta es de aproximadamente -6 dB (como puede verse en la figura 6).
Suavizar la señal de control
De acuerdo con una realización de la invención, un filtro con tiempos de ataque y de liberación dependientes de la
45 señal suaviza la señal de control modificada Q’[n] 602. Estas técnicas dependientes de la señal minimizan los artefactos audibles a partir de la aplicación de la reducción de la ganancia, especialmente cuando se requieren grandes cantidades de reducción de ganancia.
En una realización, una emulación digital de un circuito RC analógico, bien conocido en compresores / limitadores, 50 suaviza la señal de control modificada Q’[n] 602. En este caso, la variación de los valores de resistencia efectúa un comportamiento de ataque y de liberación dependiente de la señal.
La figura 8 modela tal circuito de acuerdo con una realización de la invención. Por simplicidad del modelo, la caída de tensión a través del diodo se supone que es cero y la resistencia de salida Rout se ignora durante la carga del 55 condensador C. El valor preferido de C es 1 μF.
La figura 7 traza la actualización de los valores de resistencia de acuerdo con una realización de la invención. Si la señal de control modificada Q’[n] 602 es mayor que cero -es decir, la actual magnitud de muestra de entrada supera el umbral de limitador-, el recuento de recorte de muestra se incrementa (etapa 708), aumentando por ello la medida de la longitud de tiempo en recortes y la resistencia de entrada Rin se calcula como una función de la longitud de tiempo en el recorte (etapa 709). También la resistencia de salida Rout se calcula como una función del valor de reducción de ganancia anterior GSLOW[n-1] (etapa 709).
5 Si la señal de control modificada Q’[n] 602 no es mayor que cero (etapa 702) -es decir, la actual magnitud de muestra no supera el umbral de limitador- las resistencias se ajustan a valores por defecto (etapas 705 y 706) y el recuento de recorte de muestra se fija en cero (etapa 704), restableciendo por ello la medida de la longitud de tiempo en el recorte.
Mediante el cálculo de la resistencia de entrada Rin como una función de la longitud de tiempo en detectar excursiones, el más suave varía su tiempo de ataque de una manera dependiente de la frecuencia. Las apariciones de recortes de frecuencia más corta o más elevada resultan en un tiempo de ataque rápido y las apariciones de recortes de frecuencia más larga o inferior da como resultado un tiempo de ataque cada vez más lento. Esto reduce
15 la posibilidad de fluctuaciones de ganancia dramáticas sobre el contenido de frecuencia más baja y por lo tanto minimiza golpeteo audible. Un comportamiento de ataque rápido de la reducción de ganancia puede ser tolerada por una duración más corta o apariciones de recortes de más alta frecuencia donde el enmascaramiento auditivo de frecuencia es más prevalente.
En la figura 9, el gráfico "b)" representa gráficamente la relación entre la resistencia de entrada Rin y el número de muestras consecutivas de entrada de audio que superan el umbral de limitador de acuerdo con una realización de la invención. La resistencia se expresa en ohmios, y la duración en el recorte se expresa en el número de muestras en el recorte (el recuento de recortes) para una velocidad de muestras de 44,1 kHz.
25 La forma de la representación gráfica en la figura 9b se deriva de experimentos y pruebas de audición. Para longitudes de recortes de menos de ≈13 ms (600 muestras a 44,1 kHz), Rin es no lineal. Para longitudes de recorte de más de ≈13 ms, Rin es lineal (como en la ecuación 5):
donde ClipCnt es el número de muestras en recortes a 44,1 kHz.
Con longitudes bajas de tiempo en recorte, Rin sube rápidamente al aumentar el tiempo de corte. En largos períodos de tiempo en el recorte, Rin se eleva más lentamente. Valores más bajos de Rin dan a la calculadora de ganancia
35 lenta 304 tiempos de ataque más rápidos y valores Rin más altos, tiempos más lentos de ataque.
Mediante el cálculo de la resistencia de salida Rout como una función del anterior valor lenta reducción de ganancia, la calculadora de ganancia lenta 304 puede alterar su comportamiento de liberación en proporción a la cantidad de reducción en uso. Cuando está en uso poca reducción de ganancia, un tiempo de liberación más rápido permite que la reducción de ganancia vuelva más rápidamente a la unidad. Cuando está en uso una cantidad significativa de reducción de ganancia, aumenta el tiempo de liberación para reducir al mínimo los artefactos audibles de bombeo. Esto también significa que cuando se requieren cantidades grandes y sostenidas de reducción de ganancia, la primera etapa, más lenta, supone más reducción de ganancia que la segunda etapa, más rápida. Esto ayuda a minimizar la salpicadura audible espectral que la segunda etapa puede generar cuando se aplican grandes
45 cantidades de reducción de ganancia.
(La multiplicación de audio por un factor de ganancia variable puede ser considerada una modulación de amplitud. Como tal, la operación introduce componentes espectrales adicionales que pueden ser audibles, dependiendo del espectro de audio, el espectro del factor de ganancia variable y el grado de cambio de ganancia. En este documento, estos componentes se denominan "salpicadura espectral").
En la figura 9, el gráfico "a)" representa gráficamente la relación entre la resistencia de salida Rout y el anterior valor de ganancia de reducción lenta GSLOW[n-1] de acuerdo con una realización de la invención. Cuanto más cantidad de reducción de ganancia se ha utilizado anteriormente, menor es el valor de Rout y por lo tanto más rápido es el
55 comportamiento de liberación del circuito de suavizado.
La ecuación 3 calcula el valor de la resistencia de salida:
Para muchos ordenadores y procesadores de señales digitales (DSP), el cómputo de la raíz cuadrada es computacionalmente costoso. Sin embargo, métodos computacionalmente más baratos pueden aproximar la función de raíz cuadrada. El método preferido es la ecuación de estimación de raíz cuadrada iterativa "iteración de Newton", que se muestra en la ecuación 4.
En esta ecuación, la estimación de raíz cuadrada (SqrtEstimate) para la iteración k es una función de la estimación anterior k-1 y el valor para el que se computa la raíz cuadrada - en este caso GSLOW[n-1].
5 Normalmente, se requieren varias iteraciones para obtener una única estimación relativamente precisa. Sin embargo, puesto que el valor de reducción de ganancia lenta cambia de forma relativamente lenta con el tiempo, es suficientemente preciso realizar una iteración y utilizar la estimación de raíz cuadrada de la muestra anterior o cálculo de reducción de ganancia lenta. Esto sí requiere, sin embargo, una operación de división única que puede
10 ser o bien tolerada computacionalmente o bien sustituida con una tabla de consulta de valores discretos posiblemente a expensas de la precisión.
La suavización de la señal de control por el circuito RC modelado funciona como sigue. Si la señal de control Q’[n] 602 es mayor que la tensión del condensador del cálculo anterior Q’‘[n-1] 602, entonces el condensador se carga a 15 través de Rin y se descarga a través de Rout como viene a continuación.
De lo contrario el condensador simplemente se descarga a través de Rout como viene a continuación:
(El parámetro fs es la velocidad de muestreo en Hz).
25 La señal de control suavizada Q’‘[n] 604 se utiliza entonces para calcular el valor de reducción de ganancia lenta.
Puesto que las operaciones de división pueden ser computacionalmente caras en muchos ordenadores y DSP, el rango útil de valores de 1/Rin y 1/Rout pueden ser almacenados como valores discretos en las tablas de consulta. Esto puede ser tolerado sin variación audible de la señal de control Q’‘[n] 604 del ideal en las ecuaciones 6 y 7.
Calcular el valor de ganancia lenta
Siguiendo desde la ecuación 1, el valor de reducción de ganancia lenta sería típicamente una función del recíproco de la señal de control ajustada y suavizada Q’‘[n] 604. La ecuación 8 muestra esto:
Sin embargo, debido a las características de suavizado y después de mucha experimentación, la función preferida tiene una forma sustractiva, como muestra la ecuación 9.
(La constante tiene un valor de 1,65).
45 Aunque se prefiere esta función, puede teóricamente dar como resultado una ganancia negativa para valores grandes de la señal de control Q’‘[n] 604. Con fines prácticos, cuando la cantidad típica de reducción de ganancia requerida es inferior a 20 dB, el suavizado asegura que la reducción de ganancia lenta es siempre mayor que cero.
Finalmente, el multiplicador 306 multiplica el valor de reducción de ganancia lenta GSLOW[n] 305 con las muestras 50 PCM de cada uno de los canales de entrada m para crear las muestras de ganancia reducida x’ [m, n] 307.
Reducción de ganancia rápida
Retardo
5 Las muestras reducidas de ganancia lenta x’[m, n] 307 pasan a través de un retardo 308. Esto proporciona al reductor de ganancia rápida 204 una visión a futuro de modo que el reductor de ganancia rápida 204 puede saber cuándo se producirá una excursión más allá del umbral del limitador, y puede calcular una reducción de ganancia rápida que asegura que la señal de audio de salida no supere el umbral. La visión a futuro permite una cantidad finita de tiempo para que la reducción de ganancia rápida dé un giro para encontrar la excursión más allá del umbral del
10 limitador y por lo tanto reduce la cantidad de salpicadura espectral audible resultante de la trayectoria de la ganancia, en comparación con un limitador sin visión a futuro.
Una realización del retardo 308 es una línea de retardo y, más específicamente, una línea de retardo 308 con una visión a futuro de aproximadamente 1,5 ms o N = 66 muestras a una velocidad de muestreo de 44,1 kHz. La línea de
15 retardo 308 puede ser un búfer de tipo primero en entrar primero en salir (FIFO), y la salida es la señal de muestra de audio x’‘[m, n] 314. Cuando están presentes más de un canal, cada canal m es retardado por el mismo número de muestras.
En cuanto a la duración del retardo 308, son deseables cambios de ganancia más largos. En una realización, sin
20 embargo, un objetivo primordial es mantener la latencia tan baja como sea posible. Los experimentos indican que los cambios de ganancia más rápidos que 1 ms pueden ser bastante audibles y molestos. Una visión a futuro de alrededor de 1,5 ms es un buen compromiso.
En la descripción siguiente se supone una implementación de línea de retardo del retardo 308. 25
Encontrar muestras de picos
La figura 10 detalla el localizador de muestras de pico 310 de acuerdo con una realización de la invención. En esta realización, el localizador de muestras de pico incluye una memoria 1004 para almacenar coeficientes de filtro, una
30 CPU 1003 u otros medios de cómputo 1003, un búfer de retardo 1002 y un comparador y motor de diferencias 1001. (Por supuesto, la CPU 1003 u otros medios de cómputo 1003 pueden ser los mismos que el comparador y motor de diferencias 1001).
El comparador y motor de diferencias 1001 recibe como entrada la señal 309 de búfer de retardo del retardo 308 y
35 emite una señal de control intermedia. El búfer de retardo 1002 recibe como entrada la señal de control intermedia y produce como salida el contenido de su búfer. Los medios de cómputo 1003 reciben como entrada el contenido del búfer de retardo 1002 y el contenido de la memoria 1004 y da salida a la señal de control 311.
El localizador de muestras de pico 310 busca y mantiene el valor de pico a través de un período de tiempo definido.
40 Coge la salida 309 del retardo 308 y genera una señal de control P’[n] 311 que es una función del valor máximo de muestra a través de los contenidos del retardo 308 que ha superado el umbral de limitador T (aquí, en toda la longitud de la línea de retardo 308, efectivamente el anterior ~ 1,5 ms).
La figura 16 es una vista general del proceso 1600 del localizador de muestras de pico 310 de acuerdo con una
45 realización de la invención. Con cada muestra de entrada, el localizador de muestras de pico 310 encuentra el valor absoluto máximo en toda la longitud de la línea de retardo 308 y en todos los canales m (etapa 1605). Divide 310 entonces el valor máximo absoluto por el umbral de limitador T y resta uno para crear la señal de control intermedia P[n] (etapa 1610). (Multiplicación por 1/T puede implementar con eficacia la división por T, como en la ecuación (1)):
Esta señal de control intermedia P[n] pasa a través de una línea de retardo o búfer de retardo FIFO 1002 que tiene la misma longitud que la línea de retardo 308 (etapa 1615).
55 El localizador de muestras de pico 310 entonces calcula la señal de control de salida P’[n] 311 a partir de la señal de control intermedia filtrada de paso bajo o promediada ponderada P[n] (etapa 1620). La línea de retardo 1002 estipula un promedio o filtro de orden (N-1)ésimo.
El localizador de muestras de pico 310 calcula los coeficientes preferidos de los filtros o valores de ponderación H [i]
60 1004 desde la raíz cuadrada de una ventana de Hanning de longitud N (la misma longitud que el búfer de retardo 1002). Empíricamente, estos producen mínimos efectos audibles.
donde
y donde
10 El paso de normalización en la ecuación 12b asegura que los coeficientes de filtro H [i] 1004 suman la unidad.
Calcular ganancia rápida
15 En una realización, el valor de reducción de ganancia rápida es la inversa de uno más la señal de control de pico suavizada P’[n] 311. Esta es esencialmente la inversa de la operación de localización de muestras de picos en la ecuación 11. Véase la ecuación 13:
20 Debido a que las longitudes de las dos líneas de retardos 308 y 1002 son iguales, el valor de reducción de ganancia rápida en la ecuación 13 alcanza el valor requerido para reducir el pico absoluto al nivel del umbral de limitador T al mismo tiempo que la muestra de pico emerge de la línea de retardo 308. Una longitud de retardo uniforme N da como resultado un retardo de muestra de grupo de número entero a partir de la señal de audio 307 a través de la
25 señal de control P’[n] 311 y el correspondiente valor de reducción de ganancia rápida GFAST[n].
Puesto que, como se ha mencionado anteriormente, las operaciones de división en muchos ordenadores y DSP pueden ser computacionalmente costosas, un método no basado en divisiones para calcular el valor de reducción de ganancia rápida de la ecuación 13 sería beneficioso. El uso de una tabla de consulta que contiene valores discretos,
30 sin embargo, requiere mucha memoria para conservar la exactitud y evitar la salpicadura espectral espuria que surgiría de una tabla de consulta de valores toscos.
Una alternativa consiste en aproximar el valor de reducción de ganancia rápida usando la ecuación de estimación iterativa "Newton-Rhapson". La estimación "Newton-Rhapson" resuelve de manera iterativa ecuaciones de la forma: 35
La bien conocida aproximación iterativa "Newton-Rhapson" utiliza un valor estimado inicial de x o x0 y calcula un valor actualizado de x o x1. Los valores iniciales y actualizados se computan utilizando la ecuación de aproximación 40 "Newton-Rhapson":
donde f(x) representa la función que se muestra en las ecuaciones 14, 15 y 16 y f’(x) es la derivada de la función.
Para la ecuación 13 de valor de reducción de ganancia rápida para el que se está tratando de resolver, el valor de GFAST[n] (x) y por lo tanto la ecuación 13 toma la forma genérica:
Luego, la aproximación "Newton-Rhapson" resuelve la ecuación 15 en la forma de la ecuación 14:
55 donde a = (1 + P’[n]). Para la ecuación que se está tratando de resolver en la ecuación 16, la aproximación "Newton
Rhapson" de la ecuación 17 toma la forma:
Esta forma, sin embargo, todavía requiere una división por a y no implementa eficientemente la ecuación 15. Sin embargo, para el computo de reducción de ganancia rápida se puede aprovechar el hecho de que 1/a se aproxima a x0. Dada esta aproximación, la ecuación 18 toma la forma:
dando el método ’‘Newton-Rhapson":
15 Esta aproximación converge bastante rápidamente al valor de x con el número de lugares decimales de precisión doblándose con cada iteración computacional.
Para mantener bajo el coste computacional de la aproximación, la convergencia útil tan baja como una sola iteración es deseable. La ecuación 20, sin embargo, exhibe fluctuaciones indeseables de una muestra a otra para una única 20 iteración. La convergencia de la iteración puede ser ralentizada para proporcionar una solución que introduce menos artefactos. Si el término S de velocidad de convergencia se aplica a la ecuación 20, la ecuación toma la forma:
25 donde S = 1 indica la plena "Newton-Rhapson", y S = 0,001 se traduce en que el método deliberadamente converge muy lentamente. En la práctica, evitar un comportamiento indeseable de la convergencia de la ecuación 21 requiere una selección adecuada del valor de S. Por ejemplo, preferiblemente, S es un valor tal que:
30
porque valores más altos de esta expresión pueden provocar una "reacción exagerada" en convergencia.
35
Aplicando los parámetros de control utilizados en el cálculo de GFAST[n] donde x1 = GFAST[n], x0 = GFAST[n-1] y a = (1 + P’[n]), la ecuación 21 toma la forma:
En esta ecuación, el valor de reducción de ganancia rápida GFAST[n] es una función del valor anterior a partir de la muestra del momento anterior n-1 y el valor de entrada en la ecuación - en este caso P’[n]. Como se mencionó 40 anteriormente, una estimación precisa por lo general requiere de múltiples iteraciones. En este método, sin embargo, una única iteración que da un giro lentamente al valor de reducción de ganancia rápida GFAST[n] hacia el valor deseado 1/(1+x) da como resultado menos artefactos audibles que una estimación más precisa o incluso el cálculo exacto. Experimentos de escucha han encontrado que un valor de S = 0,3 proporciona muy buenos resultados con un mínimo de artefactos audibles en el audio. La figura 11 muestra un ejemplo de los valores aproximados "Newton
45 Rhapson" FastGain para varios cientos de muestras superpuestas con los verdaderos valores computados utilizando la ecuación 13.
Finalmente, la multiplicación del producto del valor de reducción de ganancia rápida GFAST[n] 313 y las muestras previamente reducidas en ganancia x’[m, n] emitidas de la línea de retardo 308 produce las muestras finales de 50 ganancia reducida x" [m, n ] 103 (etapa 1625).
En la figura 12, el gráfico "a)" representa gráficamente la reducción de ganancia rápida para señales que se recortan
55 por entre 3 y 18 dB de acuerdo con una realización de la invención. El recorte se produce en aproximadamente 1,5 ms, y las representaciones gráficas muestran cómo la visión a futuro anticipa la aparición del recorte. Cantidades mayores de reducción de ganancia dan como resultado velocidades más altas de cambio de ganancia y cantidades correspondientemente más altas de dispersión espectral, mostrado en el gráfico "b)" de la figura 12. Sin embargo, puesto que la primera etapa, lenta, de reducción de ganancia precede a esta etapa de reducción de ganancia, la
60 etapa rápida no tiene que proporcionar tanta reducción de ganancia como si se utiliza sola, y por lo tanto la dispersión espectral audible se minimiza. Un ejemplo de esto se muestra en la figura 15 y se discute adicionalmente más adelante.
En la figura 12, el gráfico "b)" muestra ondulación en la dispersión espectral debido a la utilización de un filtro FIR en el suavizado de picos. Un filtro IIR podría eliminar el rizado, pero el retardo variable de grupo de la frecuencia resultante en la más suave no garantizaría que la señal de audio se reduce a exactamente el nivel del umbral del
5 limitador. El valor de reducción de ganancia rápida podría caer demasiado temprano o demasiado tarde para encontrar las muestras que requieren reducción de ganancia y no alcanzaría exactamente el valor de ganancia requerido.
Rendimiento
10 La figura 13 muestra la resultante señal de reducción de ganancia de limitación de picos computada por una realización de la presente invención durante medio segundo de contenido digital típico de audio de 44,1 kHz. En el ejemplo mostrado, el umbral de limitador T fue de 0,5 o -6 dB. La mitad inferior del diagrama muestra la amplitud absoluta de la señal de entrada PCM (voz), y la mitad superior del diagrama muestra la señal compuesta de
15 reducción de ganancia lenta y rápida. En la figura 13, el componente de ganancia lenta proporciona una señal mínima de reducción de ganancia que varía lentamente (por la totalidad de la anchura de la figura), mientras que el componente de ganancia rápida proporciona reducción de ganancia más significativa para los componentes de la señal a corto plazo que superan el umbral del limitador.
20 La figura 14 muestra otra señal de reducción de ganancia de limitación de picos computada por una realización de la presente invención durante un segundo y medio de contenido digital típico de audio de 44,1 kHz. En el ejemplo mostrado, el umbral de limitador T fue de 0,25 o -12 dB. En la figura 14, el componente de ganancia lenta proporciona una modesta cantidad de señal de reducción de ganancia que varía lentamente (por la totalidad de la anchura de la figura), mientras que el componente de ganancia rápida proporciona reducción ocasional de ganancia
25 a corto plazo para los componentes de señal a corto plazo que superan el umbral del limitador. Debido al escalado de la imagen, los componentes de reducción de ganancia a corto plazo aparecen como líneas verticales, por lo que la figura 14 también aumenta parte de la señal de reducción de ganancia, mostrando con más detalle el componente de reducción de ganancia a corto plazo. Los componentes de reducción de ganancia a corto plazo de la figura 14 tienen una forma y duración similares a los mostrados en la figura 13.
30 La figura 15 muestra cómo las dos etapas trabajan en condiciones pesadas y sostenidas de reducción de recortes de acuerdo con una realización de la invención. La representación gráfica muestra la trayectoria combinada de reducción de ganancia para una señal de diapasón de inicio súbito que requiere ~ 10 dB de reducción de ganancia sostenida. En la figura 15, la gráfica "a)" ofrece una visión amplia de la reducción de ganancia en aproximadamente
35 un intervalo de 1 segundo. En la figura 15, el gráfico "b)" muestra el detalle muy fino alrededor de 0,2 segundos. En este ejemplo, la primera etapa de reducción de ganancia, que varía lentamente, proporciona la mayor parte de la reducción de ganancia en torno a 0,2 o -14 dB, y la segunda etapa de acción rápida supone la ondulación de aproximadamente ±1 dB.

Claims (8)

  1. REIVINDICACIONES
    1. Un método para limitar picos en señales de audio, en el que el método comprende: 5 - recibir una señal de audio de entrada;
    -
    detectar excursiones de la señal de audio de entrada que superan un umbral;
    -
    calcular una primera ganancia en respuesta a las excursiones detectadas;
    -
    aplicar la primera ganancia a la señal de audio de entrada para genera una señal de audio intermedia;
    -
    aplicar una línea de retardo a la señal de audio intermedia para generar una señal de audio intermedia retardada;
    15 - identificar uno o más valores de picos de la señal de audio intermedia dentro de la línea de retardo que superan el umbral;
    -
    calcular una segunda ganancia en respuesta a los valores de picos identificados, en donde las reducciones en la segunda ganancia son más rápidas que las reducciones en la primera ganancia; y
    -
    aplicar la segunda ganancia a la señal de audio intermedia retardada para generar una señal de audio de salida cuyos valores de picos no superan el umbral.
  2. 2. El método de la reivindicación 1, que calcula la primera ganancia en respuesta a la frecuencia y las cantidades de 25 las excursiones detectadas.
  3. 3. El método de la reivindicación 1, que comprende:
    -
    aplicar la línea de retardo a la señal de audio intermedia mediante la recepción de muestras que representan la señal de audio intermedia en una entrada de un primer búfer que tiene una longitud igual a L y que pasa las muestras a través del primer búfer hasta una salida del primer búfer, en donde el primer búfer es un búfer de tipo primero en entrar primero en salir que almacena un cierto número de muestras iguales a L; e
    -
    identificar los valores de picos y calcular la segunda ganancia para cada muestra de la señal de audio intermedia 35 que se recibe en la entrada del primer búfer mediante:
    la derivación de un valor de control intermedio a partir de la muestra almacenada en el primer búfer que tiene la magnitud más grande;
    el paso del valor de control intermedio a través de un segundo búfer que tiene una longitud igual a L, en donde el segundo búfer es un búfer de tipo primero en entrar primero en salir que tiene una longitud igual a L y almacena un cierto número de valores de control intermedios iguales a L;
    la multiplicación de los valores de control intermedios almacenados en el segundo búfer por coeficientes de filtro y la 45 suma de los productos de multiplicación para obtener un valor de control de ganancia; y
    el cálculo de la segunda ganancia en respuesta al valor de control de ganancia.
  4. 4.
    El método de la reivindicación 3, en donde los coeficientes de filtro tienen valores procedentes de la raíz cuadrada de una función de ventana de Hanning de longitud L.
  5. 5.
    El método de la reivindicación 3, que comprende calcular la segunda ganancia mediante aproximación numérica de Newton-Raphson de una cantidad que varía inversamente con el valor de control de ganancia.
    55 6. Un aparato (102) para una limitación de picos de señal, que comprende:
    -
    medios para recibir una señal de audio de entrada (101);
    -
    medios (302) para detectar excursiones de la señal de audio de entrada que superan un umbral;
    -
    medios (304) para calcular una primera ganancia en respuesta a las excursiones detectadas;
    -
    medios (306) para aplicar la primera ganancia a la señal de audio de entrada para generar una señal de audio
    intermedia (307); 65
    -
    una línea de retardo (308) para aplicar un retardo a la señal de audio intermedia para generar una señal de audio
    intermedia retardada (314);
    -
    medios (310) para identificar uno o más valores de picos de la señal de audio intermedia dentro de la línea de
    retardo que superan el umbral; 5
    -
    medios (312) para calcular una segunda ganancia en respuesta a los valores de picos identificados, en donde las reducciones en la segunda ganancia son más rápidas que las reducciones en la primera ganancia; y
    -
    medios (315) para aplicar la segunda ganancia a la señal de audio intermedia retardada para generar una señal de 10 audio de salida cuyos valores de picos no superan el umbral.
  6. 7. El aparato de la reivindicación 6, que calcula la primera ganancia en respuesta a la frecuencia y las cantidades de las excursiones detectadas.
    15 8. El aparato de la reivindicación 6, que comprende:
    -
    la línea de retardo (308) para aplicar el retardo a la señal de audio intermedia mediante la recepción de muestras que representan la señal de audio intermedia en una entrada de un primer búfer que tiene una longitud igual a L y que pasa las muestras a través del primer búfer hasta una salida del primer búfer, en donde el primer búfer es un
    20 búfer de tipo primero en entrar primero en salir que almacena un cierto número de muestras iguales a L; y
    -
    medios para identificar los valores de picos y calcular la segunda ganancia para cada muestra de la señal de audio intermedia que se recibe en la entrada del primer búfer mediante:
    25 la derivación de un valor de control intermedio a partir de la muestra almacenada en el primer búfer que tiene la magnitud más grande;
    el paso del valor de control intermedio a través de un segundo búfer que tiene una longitud igual a L, en donde el segundo búfer es un búfer de tipo primero en entrar primero en salir que tiene una longitud igual a L y almacena un 30 cierto número de valores de control intermedios iguales a L;
    la multiplicación de los valores de control intermedios almacenados en el segundo búfer por coeficientes de filtro y la suma de los productos de multiplicación para obtener un valor de control de ganancia; y
    35 el cálculo de la segunda ganancia en respuesta al valor de control de ganancia.
  7. 9. El aparato de la reivindicación 8, en donde los coeficientes de filtro tienen valores procedentes de la raíz cuadrada de una función de ventana de Hanning de longitud L.
    40 10. El aparato de la reivindicación 8, que comprende medios para calcular la segunda ganancia mediante aproximación numérica de Newton-Raphson de una cantidad que varía inversamente con el valor de control de ganancia.
  8. 11. Un medio de almacenamiento que graba un programa de instrucciones que es ejecutable por un dispositivo para
    45 realizar un método para la limitación de picos de señal de audio de acuerdo con una cualquiera de las reivindicaciones 1-5.
ES07836595T 2006-08-09 2007-08-08 Limitación de picos de audio en etapas lentas y rápidas Active ES2399295T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US83674806P 2006-08-09 2006-08-09
US836748P 2006-08-09
PCT/US2007/017588 WO2008021110A2 (en) 2006-08-09 2007-08-08 Audio-peak limiting in slow and fast stages

Publications (1)

Publication Number Publication Date
ES2399295T3 true ES2399295T3 (es) 2013-03-27

Family

ID=39082570

Family Applications (1)

Application Number Title Priority Date Filing Date
ES07836595T Active ES2399295T3 (es) 2006-08-09 2007-08-08 Limitación de picos de audio en etapas lentas y rápidas

Country Status (7)

Country Link
US (1) US8488811B2 (es)
EP (1) EP2070191B1 (es)
JP (1) JP5038417B2 (es)
CN (1) CN101501988B (es)
ES (1) ES2399295T3 (es)
TW (1) TWI489774B (es)
WO (1) WO2008021110A2 (es)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101324577B1 (ko) * 2007-07-16 2013-11-04 삼성전자주식회사 지연된 신호에 avc를 적용하는 신호 처리장치 및 방법
JP5248625B2 (ja) 2007-12-21 2013-07-31 ディーティーエス・エルエルシー オーディオ信号の知覚ラウドネスを調節するシステム
TWI397059B (zh) 2008-07-29 2013-05-21 Lg Electronics Inc 音頻訊號之處理方法及其裝置
WO2010053728A1 (en) * 2008-10-29 2010-05-14 Dolby Laboratories Licensing Corporation Signal clipping protection using pre-existing audio gain metadata
US8538042B2 (en) 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
DK2512157T3 (en) * 2011-04-13 2014-02-17 Oticon As Hearing aid with automatic speech clipping prevention and similar procedure
US9806688B2 (en) * 2012-04-12 2017-10-31 Dolby Laboratories Licensing Corporation System and method for leveling loudness variation in an audio signal
US9312829B2 (en) * 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
US9070371B2 (en) * 2012-10-22 2015-06-30 Ittiam Systems (P) Ltd. Method and system for peak limiting of speech signals for delay sensitive voice communication
JP6105929B2 (ja) * 2012-12-27 2017-03-29 キヤノン株式会社 音声処理装置及びその制御方法
US9325286B1 (en) * 2013-04-08 2016-04-26 Amazon Technologies, Inc. Audio clipping prevention
US9247342B2 (en) 2013-05-14 2016-01-26 James J. Croft, III Loudspeaker enclosure system with signal processor for enhanced perception of low frequency output
DE102015217565A1 (de) * 2015-09-15 2017-03-16 Ford Global Technologies, Llc Verfahren und Vorrichtung zur Verarbeitung von Audio-Signalen
CN106558314B (zh) * 2015-09-29 2021-05-07 广州酷狗计算机科技有限公司 一种混音处理方法和装置及设备
US9979369B2 (en) 2016-10-21 2018-05-22 Dolby Laboratories Licensing Corporation Audio peak limiting
US10574371B2 (en) * 2017-10-23 2020-02-25 Wheatstone Corporation Audio processor apparatus, methods and computer program products using integrated diversity delay error compensation
CN109963235B (zh) * 2019-03-15 2021-12-28 维沃移动通信有限公司 一种声音信号处理方法及移动终端
GB2592030B (en) * 2020-02-12 2022-03-09 Edwards Ltd Multiple stage vacuum pump
US11405739B2 (en) * 2020-12-01 2022-08-02 Bose Corporation Dynamic audio headroom management system

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57146297A (en) 1981-03-04 1982-09-09 Nippon Electric Co Voice processor
JPH04195000A (ja) * 1990-11-27 1992-07-14 Canon Inc 情報処理方法及び装置
JP3713289B2 (ja) 1994-07-11 2005-11-09 クラリオン株式会社 デジタル信号処理方式
JP3789503B2 (ja) * 1994-12-22 2006-06-28 ソニー株式会社 音声処理装置
JP3972267B2 (ja) 1997-02-25 2007-09-05 日本ビクター株式会社 デジタルオーディオ信号処理用記録媒体、プログラム用の通信方法及び受信方法、デジタルオーディオ信号用の通信方法及び受信方法、並びにデジタルオーディオ記録媒体
US6868163B1 (en) * 1998-09-22 2005-03-15 Becs Technology, Inc. Hearing aids based on models of cochlear compression
US6556685B1 (en) * 1998-11-06 2003-04-29 Harman Music Group Companding noise reduction system with simultaneous encode and decode
JP2001320793A (ja) 2000-05-10 2001-11-16 Sony Corp 自動利得調整装置
GB2373975B (en) 2001-03-30 2005-04-13 Sony Uk Ltd Digital audio signal processing
US7406178B2 (en) * 2001-04-06 2008-07-29 Texas Instruments Incorporated Efficient digital audio automatic gain control
US20080056504A1 (en) * 2003-06-18 2008-03-06 Frederik Gorges Dynamic Range Control Of An Audio Signal And Method Of Its Operation
KR100561440B1 (ko) * 2004-07-24 2006-03-17 삼성전자주식회사 채널 변경에 따른 음량 자동 보정 장치 및 그 방법
CN100466467C (zh) * 2004-12-02 2009-03-04 上海交通大学 具有自动增益控制功能的音量自动限幅装置
US9008319B2 (en) * 2004-12-30 2015-04-14 Plantronics, Inc. Sound pressure level limiter with anti-startle feature
US7729673B2 (en) * 2004-12-30 2010-06-01 Sony Ericsson Mobile Communications Ab Method and apparatus for multichannel signal limiting

Also Published As

Publication number Publication date
CN101501988B (zh) 2012-03-28
EP2070191B1 (en) 2012-11-21
CN101501988A (zh) 2009-08-05
JP5038417B2 (ja) 2012-10-03
WO2008021110A3 (en) 2008-06-05
TW200830704A (en) 2008-07-16
JP2010500613A (ja) 2010-01-07
EP2070191A2 (en) 2009-06-17
TWI489774B (zh) 2015-06-21
US20090271185A1 (en) 2009-10-29
WO2008021110A2 (en) 2008-02-21
US8488811B2 (en) 2013-07-16

Similar Documents

Publication Publication Date Title
ES2399295T3 (es) Limitación de picos de audio en etapas lentas y rápidas
US10396738B2 (en) Methods and apparatus for adjusting a level of an audio signal
JP5917518B2 (ja) 知覚スペクトルアンバランス改善のための音声信号動的補正
EP2002429B1 (en) Controlling a perceived loudness characteristic of an audio signal
JP5021809B2 (ja) アンビエンス信号成分とマトリックスデコードされた信号成分とを制御可能に結合することによるサラウンドサウンドオーディオチャンネルのハイブリッド導出
US9735746B2 (en) Automatic loudness control
US20140369527A1 (en) Dynamic range control
BRPI0923440B1 (pt) método de virtualização de som surround e sistema de virtualização de som surround
US8351619B2 (en) Auditory sense correction device
JP2011193442A (ja) オーディオ信号におけるラウドネスレベルの自動補正
US10128809B2 (en) Intelligent method and apparatus for spectral expansion of an input signal
EP2693635A1 (en) Automatic loudness control
CN103580632B (zh) 自动响度控制***及方法
JP2003274492A (ja) ステレオ音響信号処理方法、ステレオ音響信号処理装置、ステレオ音響信号処理プログラム
JP5915281B2 (ja) 音響処理装置
CN108768330B (zh) 自动响度控制
CN106533379B (zh) 用于处理音频信号的方法和装置
US9653065B2 (en) Audio processing device, method, and program
CN107408930B (zh) 调节自动声音水平的放大器
JP6484970B2 (ja) ディストーション装置、ディストーション制御方法、およびプログラム
JPH0573084A (ja) 残響付加装置