CN101501988B

CN101501988B - 慢级和快级中的音频限峰

Info

Publication number: CN101501988B
Application number: CN2007800296475A
Authority: CN
Inventors: M·J·斯密斯尔思; B·G·克罗克特; D·S·迈克格拉斯
Original assignee: Dolby Laboratories Licensing Corp
Current assignee: Dolby Laboratories Licensing Corp
Priority date: 2006-08-09
Filing date: 2007-08-08
Publication date: 2012-03-28
Anticipated expiration: 2027-08-08
Also published as: TWI489774B; ES2399295T3; JP5038417B2; EP2070191B1; TW200830704A; US20090271185A1; WO2008021110A2; WO2008021110A3; CN101501988A; US8488811B2; EP2070191A2; JP2010500613A

Abstract

一种用于限制音频信号的绝对幅度的方法和设备。所述方法可包括：第一可变增益地减小音频信号的增益；然后，比第一可变增益减小更快地第二可变增益地减小音频信号的增益，从而将音频信号的绝对幅度限制到阈值。第一可变增益减小可包括在第一级中对音频信号的增益进行可变增益减小，第二可变增益减小可包括在第二级中对音频信号的增益进行可变增益减小，第二级比第一级更快地减小增益。第二可变增益减小可包括：延迟音频信号，查找延迟的音频信号中的峰，利用找到的峰计算快增益和用计算出的快增益修改延迟的音频信号。

Description

慢级和快级中的音频限峰

技术领域

本发明总地涉及音频数字信号处理和音频限峰。更具体地，本发明涉及音频信号的可变增益减小以使音频信号限于阈值。

背景技术

音频限峰是50年来音频制作、传输和再现的基本部分。如图1所示，作为最基本的形式，音频限峰器提供的输入到输出信号电平特性满足：输出电压等于输入电压，直到限峰阈值。对于振幅大于阈值的输入音频信号，输出音频信号电平被约束(限制)为不超过阈值。关于其它音频动态增益控制***，修改增益的方法对引入到输出音频信号中的伪像(artifact)的性质和可听性具有显著的影响。

在音频限峰的最早用途之一中，音频限峰控制音频信号振幅以防止无线电广播期间的过调制。现今，音频限峰仍常用来防止电台和电视广播中的过调制。

音频限峰也是唱片母版制作的重要部分。唱片母版制作涉及在唱片母盘中切割出表示音频波形的凹槽的车床。在这种情况下，限峰约束音频的振幅，从而限制唱片的凹槽的宽度和深度，以使它们限于留声机介质的物理极限内。

随着数字音频技术的到来，使用限峰的音频振幅控制在记录和再现期间仍然很重要。在将模拟转换为数字的数字音频记录期间，如果输入模拟音频信号超过与数字***能够表示的最大数字音频采样对应的输入信号电平(0dBFS)，则得到的音频的记录数字表示将被剪切。这是由于大于0dBFS的模拟音频信号电平最多可用0dBFS表示。类似地，如果在数字域中没有缩放地混合多个数字音频信号，则在播放期间，音频数据之和可能超过0dBFS，即在数模转换期间可表示的最大数字信号。结果为被剪切的输出模拟波形。

图2中显示了表示数字记录和再现二者的剪切的典型例子。随着现代多声道音频格式(诸如Dolby Digital 5.1和MLP)和用于缩混(downmix)在立体声或单声道兼容***上播放的多声道素材的再现***的出现，多个数字音频信号的混合变得非常普遍。

最近，在母版制作数字音频素材(即，CD和DVD音频)中，为了允许音频的电平(因而，视在响度)增加而不超过用户定义的峰电平(例如，-0.1dBFS或0dBFS)，限峰算法是标准的。随着产生越来越大声的音频表示的需求增长，这种做法变得日益普遍。

可在完整的全带宽信号上执行音频限峰，或者以多带方式执行音频限峰，即对完全不同的音频带执行各自的限峰操作。对于多带限峰，在限峰之后将分别处理的频带相加以重新产生合成信号。

通常，当偏好于音频频谱和音色的最小改变时，诸如对于音乐母版制作，使用多带限峰。多带限峰通常用于实现大量的限峰，但是具有显著改变音频的频谱特性和感知音色的可能性。多带限峰的用途包括FM无线电传输，其中电台希望具有非常大声的感知声音电平，同时具有唯一的“声音”——通过多带限峰器的设置来指定。

音乐母版制作中的限峰典型地要求0-约20dB之间的增益减小。如在DVD播放器和家庭影院接收机中进行的，将5声道环绕声音频信号缩混到2声道立体声信号要求达到9dB的增益减小——其中，例如，对于5声道环绕声信号来说，立体声左声道为左声道、左环绕声和减小3dB的中央声道之和。

典型地，对于0-12dB的增益减小，可实现几乎听不到的限峰，存在在此范围内性能很好的一些商业产品。需要大于约12dB的增益减小的限峰可变得完全听得到，在这个讨论中，认为大于约12dB的增益减小为相当大或显著的。

发明内容

这里教导了用于限制音频信号的绝对幅度的方法和设备。该方法可包括：第一可变增益地减小音频信号的增益；然后，比第一可变增益减小更快地第二可变增益地减小音频信号的增益，从而将音频信号的绝对幅度限制到阈值。第一可变增益减小可包括在第一级中可变增益地减小音频信号的增益，第二可变增益减小可包括在第二级中可变增益地减小音频信号的增益，第二级比第一级更快地减小增益。

第一可变增益减小可包括检测音频信号中超过阈值的偏移，使用检测到的偏移计算慢增益和将慢增益应用于音频信号。

第二可变增益减小可包括延迟音频信号，查找延迟的音频信号中的峰、利用找到的峰计算快增益和用计算出的快增益修改延迟的音频信号。延迟步骤可包括对音频信号进行缓冲，查找步骤可包括检查缓冲的音频信号。各虚像的视在方向和各个矩阵编码的音频信号的方向可被保持。第二可变增益减小可产生比如以上构成的除了没有延迟之外的方法更少听得到的频谱飞溅。缓冲步骤可包括为第二可变增益减小提供有限的时间量来滑动以遇到超过阈值的峰。延迟步骤可包括至少1ms的延迟，可包括约1.5ms的延迟。查找峰的步骤可包括确定在延迟的音频信号的各时间段中的最大值，延迟音频信号最大值和基于延迟的最大值计算用于减小音频信号的增益的控制信号。

上面第一次提及的延迟步骤可与接下来记载的延迟步骤相匹配。计算步骤可包括利用延迟的最大值的低通滤波的函数来计算控制信号。计算步骤可包括利用加权平均后的延迟的最大值的函数来计算控制信号。

计算步骤可包括使用滤波系数，所述系数是Hanning窗的平方根的函数。该使用步骤可包括将Hanning窗的大小调整为与延迟缓冲器的长度相同。

计算步骤可包括使用加权值，所述加权值是Hanning窗的平方根的函数。该使用步骤可包括将Hanning窗的大小调整为与延迟缓冲器的长度相同。

快增益的计算可包括：基本上颠倒查找峰的步骤所包括的确定、延迟和计算步骤。快增益的计算可包括：快增益被计算为等于1加上计算出的用于减小增益的控制信号之和的倒数。

快增益的计算可包括利用Newton-Rhapson逼近法计算快增益。计算可包括利用收敛减慢的Newton-Rhapson逼近法来计算。计算可包括利用收敛速度S被限制为满足：

- \frac{1}{2} < S * ((x_{0} * a) - 1) < \frac{1}{2}

的减慢Newton-Rhapson逼近法来计算

计算可包括利用收敛速度S约为0.3的减慢Newton-Rhapson逼近法来计算。

这里还教导了一种包含用于执行以上方法之一的计算机程序的计算机可读介质。

这里还教导了一种包括CPU、计算机可读介质之一和耦合CPU和介质的总线的计算机***。

这里还教导了一种音频限峰器。该限峰器可包括：第一可变增益减小器，用于可变增益地减小音频信号的增益；和第二可变增益减小器，用于比第一可变增益减小更快地进一步可变增益地减小音频信号的增益，从而将音频信号的绝对幅度限制到阈值。

第一可变增益减小器可包括对音频信号的增益进行可变增益减小的第一级，第二可变增益减小器可包括对音频信号的增益进行可变增益减小的第二级，第二级比第一级更快地减小增益。

第一可变增益减小器可包括：延迟音频信号的延迟部分；查找延迟的音频信号内的峰的峰查找器；快增益计算器，利用找到的峰计算快增益减小；和修改器，用计算出的快增益修改延迟的音频信号。

延迟部分可包括缓冲器，峰查找器可包括缓冲的音频信号的检查器。各虚像的视在方向和各矩阵编码的音频信号的方向可被保持。第二可变增益减小可产生比如上的除了没有延迟部分之外的限峰器更少听得到的频谱飞溅。延迟部分可包括至少1ms的延迟，可包括约1.5ms的延迟。峰查找器可包括：用于确定延迟的音频信号的各时间段中的最大值的差引擎；延迟缓冲器，用于延迟音频信号最大值；和计算器，基于延迟的最大值来计算用于减小音频信号的增益的控制信号。

峰查找器的延迟缓冲器可匹配限峰器的延迟部分。计算器可包括利用延迟最大值的低通滤波的函数来计算控制信号的计算器。计算器可包括利用加权平均后的延迟的最大值的函数来计算控制信号的计算器。

滤波系数可以是Hanning窗的平方根的函数。Hanning窗的长度可与延迟缓冲器相同。

加权值可以是Hanning窗的平方根的函数。Hanning窗的长度可与延迟缓冲器相同。

快增益计算器可包括通过将峰查找器的操作基本颠倒次序来计算快增益减小的快增益计算器。快增益计算器可包括将快增益计算为等于1和计算出的用于减小增益的控制信号之和的倒数的快增益计算器。

快增益计算器可包括用于计算快增益的快增益计算器。快增益计算器可包括利用收敛减慢的Newton-Rhapson逼近法来计算的快增益计算器。快增益计算器可包括利用收敛速度S被限制为满足：

- \frac{1}{2} < S * ((x_{0} * a) - 1) < \frac{1}{2}

的减慢Newton-Rhapson逼近法来计算的快增益计算器。

快增益计算器可包括利用收敛速度S约为0.3的减慢Newton-Rhapson逼近法来计算的快增益计算器。

通过参考以下讨论和附图，可更好地理解本发明及其优选实施例的各个特征。

附图说明

图1总结了典型的音频限峰器的操作，示出***级的音频限峰器，显示典型的具有任意阈值的音频限峰器的输入/输出电压特性，并提供限峰处理之前和之后的音频信号的例子。

图2显示代表数字记录和再现的剪切的典型例子。

图3a示出根据本发明一个实施例的两级音频限峰器。

图3b进一步详细示出根据本发明一个实施例的图3a的音频限峰器。

图4示出根据本发明一个实施例的几百个输入信号采样和偏移(excursion)检测器输出的对应的控制信号。

图5为根据本发明一个实施例的慢增益计算器的处理的示意图。

图6描绘根据本发明一个实施例的慢增益计算器304的伸缩(warping)函数。

图7示出根据本发明一个实施例的慢增益电路的RC模型的电阻值的更新。

图8对根据本发明一个实施例的慢增益计算器的RC电路建模。

图9描绘根据本发明一个实施例的输出电阻器R_out和先前的慢增益减小值之间以及输入电阻器R_in和超过限峰器阈值的连续输入音频采样的数量之间的关系。

图10详细示出根据本发明一个实施例的峰采样查找器。

图11显示与真实值重叠的、对几百个采样的逼近“Newton-Rhapson”估计的快增益减小值。

图12描绘根据本发明一个实施例的剪切3-18dB的信号的快增益减小、以及更大的增益减小量与相应更高的频谱离散量的关系。

图13显示根据本发明的实施例计算得到的典型的44.1kHz数字音频内容在半秒内的限峰增益减小信号。

图14显示根据本发明的实施例计算得到的典型的44.1kHz数字音频内容在一秒半内的另一限峰增益减小信号。

图15显示根据本发明实施例的限峰器的两级如何在大量的持续的剪切减小条件下工作。

图16为根据本发明一个实施例的慢峰采样查找器的处理的示意图。

具体实施方式

图3a示出根据本发明一个实施例的两级音频限峰器102。限峰器102包括慢增益减小器202和快增益减小器204。慢增益减小器202接收阈值信号201和音频信号101作为输入，并生成中间音频信号203。快增益减小器204接收中间音频信号203以及阈值信号201作为输入，并生成音频信号103作为输出。

限峰器102如下操作：慢增益减小器202利用输入信号101接收一个或多个音频声道，利用阈值信号201接收表示限峰器阈值的信号。音频声道的绝对峰可能超过限峰器阈值。

快增益减小器204输出信号103，即输入音频信号101的可能被限峰的音频声道。限峰器102将输入音频信号101中超过限峰器阈值的任何绝对峰都限制(增益减小)为不大于限峰器阈值。

根据本发明的一个实施例，输入音频信号101和输出音频信号103分别可以是线性PCM采样。阈值信号201可以是以dBFS为单位的值。于是，x表示输入音频信号101，M表示输入音频信号101中的输入声道的数量，在表示式x[m，n]中，m为从0到M-1的声道索引，n为采样索引。

图3b进一步详述根据本发明的一个实施例的限峰器102。慢增益减小器202包括偏移/超过量检测器302、慢增益计算器304和乘法器306。偏移检测器302接收阈值信号201和音频信号101作为输入，并生成控制信号Q[n]303作为输出。慢增益计算器304接收控制信号Q[n]303作为输入，并生成当前慢增益值G_SLOW[n]信号305作为输出。乘法器306接收输入音频信号101和当前慢增益值G_SLOW[n]信号305作为输入，并生成增益减小的音频信号x’[m，n]307作为输出。

快增益减小器204包括快增益计算器312、峰采样查找器311、延迟308和乘法器315。延迟308接收增益减小的音频信号x’[m，n]307作为输入，并生成延迟的增益减小的音频信号x”[m，n]314作为输出。延迟308还使其延迟的音频信号的完整缓冲可用作信号309。峰采样查找器310接收延迟缓冲信号309和阈值信号201作为输入，并生成控制信号P’[n]311作为输出。快增益计算器312接收控制信号P’[n]311作为输入，并生成快增益减小值G_FAST[n]313作为输出。乘法器315接收快增益减小值G_FAST[n]313和延迟的增益减小的音频信号x”[m，n]314作为输入，并生成最终的增益减小的采样x”’[m，n]103作为输出。

在慢增益减小器202和快增益减小器204的每次迭代操作中，对来自每个输入声道的一个采样进行处理，计算单个慢增益减小值和单个快增益减小值，并将二者应用于所有声道。由于所有声道接受相同的慢增益减小和快增益减小，所以虚像的视在方向和矩阵编码的音频信号的方向被保持。

慢增益减小

检测偏移(检测超过限峰器阈值的音频)

当输入音频信号101的所有M个声道上的最大绝对采样不大于限峰器阈值T时，偏移检测器302将控制信号Q[n]303设置为0。当所有M个声道上的最大绝对采样超过限峰器阈值T时，偏移检测器302将控制信号Q[n]303设置为与输入信号超过限峰器阈值T的程度成比例的信号。

因而，仅当输入信号101超过限峰器阈值T时，慢增益减小器202才减小输入音频信号101以输出中间音频信号307。

因而，在生成中间音频信号307时，当输入音频信号101超过限峰器阈值T时，慢增益减小器202响应——但是，在音频信号303下降到阈值T以下之后，可继续减小增益。

在一个实施例中，如果输入信号的所有M个声道上的最大绝对采样大于限峰器阈值T，则将控制信号Q[n]设置为最大绝对采样与阈值T之比减1。方程(1)详述这个实施例。

Q [n] = \{\begin{matrix} \frac{\max_{m} {| x [m, n] |}}{T} - 1 & \max_{m} {| x [m, n] |} > T \\ 0 & \max_{m} {| x [m, n] |} \leq T \end{matrix} - - - (1)

图4根据本发明的一个实施例示出输入信号的几百个采样和对应的控制信号Q[n]303。输入信号为具有-3dB峰振幅的500Hz的数字正弦波，限峰器阈值T为0.5或-6.02dB。如图4所示，对于每个输入的PCM采样计算控制信号Q[n]303采样值。

(为了减小计算复杂性，不采用所显示的除法操作，而是乘以1/T即可实现Q[n]的计算)。

计算慢增益

图5是根据本发明的一个实施例的慢增益计算器304的处理的示意图。接收控制信号Q[n]303和前一慢增益值G_SLOW[n-1]305作为输入，慢增益计算器304修改控制信号Q[n]303(步骤601)，对修改后的控制信号602进行平滑处理(步骤603)，并且根据经过平滑处理的、修改后的控制信号604计算当前慢增益值G_SLOW[n]305(步骤605)。

在一个实施例中，平滑步骤603包含信号相关的发起(attack)和释放(release)特性。

修改控制信号

慢增益计算器304用前一慢增益值G_SLOW[n-1]修改(伸缩)控制信号Q[n]303以产生修改的控制信号Q’[n]602。前一慢增益值G_SLOW[n-1]被初始设置为单位值或1.0的值。

当增益减小已经为非单位值时——即，如果增益减小已经在被应用，则该修改过程放大(增大)控制信号Q[n]303对增益减小量增大的影响。有利的是，信号剪切(也就是说，将被剪切的偏移)的不频繁发生对产生慢增益减小具有较小的影响，但快速连续的频繁发生导致显著增多的增益减小。因而，对于不频繁的剪切发生，这一级几乎不工作，并且避免了听得见的抽吸的可能性。

方程2a和2b显示根据本发明的一个实施例的伸缩操作，图6描绘这个伸缩函数。通过大量的实验和测试确定方程2a和2b及图6的伸缩操作。当前一慢增益值约为-6dB时，它的效果最突出(如可从图6看出)。

Q′[n]＝Q[n]*W[n] (2a)

W[n]＝1.4*G_SLOW[n-1]-0.4*(G_SLOW[n-1])² (2b)

对控制信号进行平滑

根据本发明的一个实施例，具有信号相关的发起时间和释放时间的滤波器对修改后的控制信号Q’[n]602进行平滑处理。这些信号相关的技术使因应用增益减小而产生的听得见的伪像最小化，尤其是在要求大量增益减小的情况下。

在一个实施例中，在压缩器/限峰器领域公知的模拟RC电路的数字仿真对修改后的控制信号Q’[n]602进行平滑处理。这里，改变电阻值影响信号相关的发起和释放行为。

图8对根据本发明的一个实施例的这样的电路进行建模。为了简化模型，假设二极管两端的电压降为零，并且在对电容器C充电期间忽略输出电阻器R_out。C的优选值为1μF。

图7示出根据本发明一个实施例的电阻值的更新。如果修改的控制信号Q’[n]602大于0——即，当前输入采样幅度超过限峰器阈值，则采样剪切计数递增(步骤708)，从而增加剪切时间长度的度量，并输入电阻器R_in被计算为剪切时间长度的函数(步骤709)。此外，利用前一增益减小值G_SLOW[n-1]的函数来计算输出电阻器R_out(步骤709)。

如果修改的控制信号Q’[n]602不大于0(步骤702)——即，当前采样幅度不超过限峰器阈值——则将电阻器设置为默认值(步骤705和706)，并将采样剪切计数设置为0(步骤704)，从而使剪切时间长度的度量复位。

通过用检测偏移的时间长度的函数来计算输入电阻R_in，平滑器以频率相关的方式改变它的发起时间。剪切发生频率更短或更高导致快的发起时间，剪切发生频率更长或更低导致逐渐变慢的发起时间。这降低了较低频率内容上剧烈的增益波动的可能性，从而使听得到的砰砰声最小化。对于听觉频率掩蔽更占优的、更短时间或更高频率的剪切发生，可容忍快的增益减小的发起行为。

在图9中，曲线图“b)”描绘根据本发明一个实施例的输入电阻R_in和超过限峰器阈值的连续输入音频采样的数量之间的关系。用欧姆表示电阻，用在44.1kHz的采样率下剪切的采样数量(剪切计数)表示剪切持续时间。

图9b中的曲线图的形状从实验和听力测试获得。对于小于～13ms的剪切长度(44.1kHz下的600个采样)，R_in为非线性。对于长于～13ms的剪切长度，R_in为线性——如方程5中：

R_in＝16100+2.33*(ClipCnt-600) (5)

其中，ClipCnt为44.1kHz下剪切的采样数量。

在低剪切时间长度下，R_in随着剪切时间增加而快速上升。在长剪切时间长度下，R_in更慢地上升。较低的R_in值给予慢增益计算器304更快的发起时间，较高的R_in值给予慢增益计算器304更慢的发起时间。

通过用前一慢增益减小值的函数来计算输出电阻R_out，慢增益计算器304可与所使用的减小量成比例地改变它的释放行为。当使用很小的增益减小时，更快的释放时间允许增益减小更快速地返回到单位值。当使用大数量的增益减小时，释放时间增加以使听得到的抽吸伪像最小化。这还意味着，当要求大的持续的增益减小量时，更慢的第一级比更快的第二级产生更多的增益减小。这有助于使当应用大量增益减小时第二级可产生的听得到的频谱飞溅最小化。

(将音频乘以可变增益因子可被认为是振幅调制。这样，根据音频的频谱、可变增益因子的频谱和增益变化的程度，运算引入可听得到的额外的频谱分量。这里，这些分量被称为“频谱飞溅”。)

在图9中，曲线图“a)”描绘根据本发明一个实施例的输出电阻R_out和前一慢增益减小值G_SLOW[n-1)之间的关系。先前所使用的增益减小的量越多，R_out的值越低，从而，平滑电路的释放行为越快。

方程3计算输出电阻值：

R_{out} = 21950 * (2 - \sqrt{G_{SLOW} [n - 1]}) - - - (3)

对于许多计算机和数字信号处理器(DSP)，平方根的计算在计算上昂贵。然而，在计算上更便宜的方法可逼***方根函数。优选方法为方程4中显示的“Newton Iteration”迭代平方根估计方程。

SqrEstimate [k] = 0.5 * \frac{SqrtEstimate [k - 1] + G_{SLOW} [n - 1]}{SqrtEstimate [k - 1]} - - - (4)

在这个方程中，第k次迭代的平方根估计为先前的第k-1次估计和正对其计算平方根的值——在这种情况下G_SLOW[n-1]的函数。

正常情况下，要求多次迭代以获得单个相对精确的估计。然而，由于慢增益减小值随时间相对慢地改变，所以执行一次迭代并使用前一采样的平方根估计或慢增益减小计算就足够精确了。然而，这需要单次除法运算，它在计算上可被容忍或者可用离散值的查找表代替——不过可能以精度为代价。

用建模的RC电路对控制信号进行平滑操作。如果控制信号Q’[n]602大于源自前一计算Q”[n-1]602的电容器电压，则如下所述，通过R_in对电容器充电并通过R_out放电。

Q^{''} [n] = Q^{''} [n - 1] + \frac{Q^{'} [n] - Q^{''} [n - 1]}{R_{in} * C * fs} - - - (6 a)

Q^{''} [n] = Q^{''} [n] - \frac{Q^{''} [n]}{R_{out} * C * fs} - - - (6 b)

否则，电容器只是通过R_out放电，如下所示：

Q^{''} [n] = Q^{''} [n - 1] - \frac{Q^{''} [n - 1]}{R_{out} * C * fs} - - - (7)

(参数fs为以Hz为单位的采样率。)然后将平滑后的控制信号Q”[n]604用于计算慢增益减小值。

由于在许多计算机和DSP上除法运算在计算上昂贵，所以可将1/R_in和1/R_out的值的使用范围作为离散值存储在查找表中。从方程6和7的理想情况，这可以容忍，而没有控制信号Q”[n]604的听得见的变化。

计算慢增益值

方程1之后，慢增益减小值将典型地为经过调节和平滑的控制信号Q”[n]604的倒数的函数。方程8显示这一关系：

G_{SLOW} [n] = \frac{1}{1 + Q^{''} [n]} - - - (8)

然而，由于平滑特性且在大量实验之后，优选函数具有如方程9所示的减法形式。

G_SLOW[n]＝1-Q″[n]*s (9)

(常数s具有1.65的值)

尽管优选这个函数，但是它在理论上可导致对于控制信号Q”[n]604的大值的负增益。为了实现的目的，在所要求的增益减小的典型量小于20dB的地方，平滑确保慢增益减小总是大于零。

最后，乘法器306将慢增益减小值G_SLOW[n]305乘以来自每个输入声道m的PCM采样以产生增益减小的采样x’[m，n]307。

x′[m，n]＝x[m，n]*G_SLOW[n]，对于所有m (10)

快增益减小

延迟

慢增益减小的采样x’[m，n]307穿过延迟308。这为快增益减小器204提供前瞻(look-ahead)，从而快增益减小器204可知道超过限峰器阈值的偏移将在什么时候发生，并可计算确保输出音频信号不超过阈值的快增益减小。与没有前瞻的限峰器相比，前瞻允许用于快增益减小的有限时间量滑过(slew)以遇到超过限峰器阈值的偏移，因此减小因增益轨迹产生的听得见的频谱飞溅量。

延迟308的一个实施例为延迟线，更具体地讲，具有约1.5ms的前瞻或者在44.1kHz的采样率下N＝66个采样的延迟线308。延迟线308可以是先入先出(FIFO)缓冲器，输出为音频采样信号x”[m，n]314。在多于一个声道存在的情况下，每个声道m被延迟相同数量的采样。

关于延迟308的长度，更长的增益变化是期望的。然而，在一个实施例中，更高的目标是保持尽可能低的等待时间。实验表明，快于1ms的增益变化可以是完全听得到的，而且令人厌烦的。约1.5ms的前瞻为好的折衷。

在以下描述中假设用延迟线实现延迟308。

查找峰采样

图10详述根据本发明一个实施例的峰采样查找器310。在这个实施例中，峰采样查找器包括用于存储滤波器系数的存储器1004、CPU 1003或其它计算装置1003、延迟缓冲器1002以及比较器和差引擎1001。(当然，CPU 1003或其它计算装置1003可与比较器和差引擎1001相同)。

比较器和差引擎1001接收延迟308的延迟缓冲信号309作为输入，并输出中间控制信号。延迟缓冲器1002接收中间控制信号作为输入，并将其缓冲器的内容产生为输出。计算装置1003接收延迟缓冲器1002的内容和存储器1004的内容作为输入，并输出控制信号311。

峰采样查找器310找到在定义的时间长度上的峰值并保存该峰值。它取出延迟308的输出309，并产生控制信号P’[n]311，P’[n]311为在延迟308的内容中(这里，在整个延迟线308的长度上，实际上为之前的～1.5ms)超过限峰器阈值T的最大采样值的函数。

图16是根据本发明一个实施例的峰采样查找器310的处理1600的示意图。对于每个输入采样，峰采样查找器310找到在延迟线308的长度上且在所有m个声道上的最大绝对值(步骤1605)。它310然后将最大绝对值除以限峰器阈值T，并减去1，以产生中间控制信号P[n](步骤1610)。(如方程(1)中，乘以1/T可有效地实现除以T。)：

P [n] = \{\begin{matrix} \frac{\max_{m, n} {| x^{'} [m, n] |}}{T} - 1 & \max_{m, n} {| x^{'} [m, n] |} > T \\ 0 & \max_{m, n} {| x^{'} [m, n] |} \leq T \end{matrix} - - - (11)

这个中间控制信号P[n]穿过FIFO延迟线或延迟缓冲器1002，延迟缓冲器1002具有与延迟线308相同的长度(步骤1615)。

峰采样查找器310然后利用经过低通滤波或加权平均的中间控制信号P[n]计算输出控制信号P’[n]311(步骤1620)。延迟线1002用于第(N-1)阶滤波或平均。

峰采样查找器310利用长度N的Hanning窗(与延迟缓冲器1002相同的长度)的平方根来计算优选的滤波器系数或加权值H[i]1004。经验上，这些产生最小的听得到的伪像。

P^{'} [n] = Σ_{i = 0}^{N - 1} DelayBuffer [i] * H [i] - - - (12 a)

其中，

H [i] = \frac{W [i]}{Σ_{j = 0}^{N - 1} W [j]}, for 0 < = i < N - 1 - - - (12 b)

其中，

W [j] = \sqrt{Hanning [j]}, for 0 < = j < N - 1 - - - (12 c)

方程12b中的规范化步骤确保滤波器系数H[i]1004之和为单位值。

计算快增益

在一个实施例中，快增益减小值为1加上平滑后的峰控制信号P’[n]311的倒数。这本质上为方程11中的峰采样查找运算的逆。参见方程13：

G_{FAST} [n] = \frac{1}{1 + P^{'} [n]} - - - (13)

由于两个延迟线308和1002的长度相同，所以在从延迟线308出现峰采样的同时，方程13中的快增益减小值达到将绝对峰减小到限峰器阈值T的水平所需的值。偶数延迟长度N导致从音频信号307直到控制信号P’[n]311和对应的快增益减小值G_FAST[n]的整数采样群延迟。

如前所述，由于在许多计算机和DSP上除法运算可能在计算上昂贵，所以用于在方程13中计算快增益减小值的基于非除法的方法将是有利的。然而，包含离散值的查找表的使用需要较大的存储器来保证精度，并避免因粗取值的查找表引起的寄生频谱飞溅。

一种替换方法是使用“Newton-Rhapson”迭代估计方程逼近快增益减小值。“Newton-Rhapson”估计迭代地对以下形式的方程求解：

f(x)＝0 (14)

公知的“Newton-Rhapson”迭代逼近法使用x的初始估计值或者说x₀，并计算x的更新值或者说x₁。使用“Newton-Rhapson”逼近方程对初始值和更新值进行运算：

x_{1} = x_{0} - \frac{f (x_{0})}{f^{'} (x_{0})} - - - (17)

其中，f(x)表示方程14、15和16中显示的函数，f′(x)为该函数的导数。

对于我们试图求解的快增益减小值方程13，G_FAST[n](x)的值因而方程13采取以下的一般形式：

x = \frac{1}{1 + P^{'} [n]} = \frac{1}{a} - - - (15)

那么，“Newton-Rhapson”逼近法以方程14的形式对方程15进行求解：

f(x)＝x*a-1 (16)

其中，a＝(1+P’[n])。对于我们尝试在方程16中求解的方程，方程17的“Newton-Rhapson”逼近法采取以下形式：

x_{1} = x_{0} - \frac{(x_{0} * a) - 1}{a} - - - (18)

然而，这种形式仍要求除以a，没有效率地执行方程15。但是，对于快增益减小计算，我们可借用以下事实：l/a近似x₀。在假设这个近似的情况下，方程18采取以下形式：

x₁＝x₀-((x₀*a)-1)*x₀ (19)

给出“Newton-Rhapson”方法：

x₁＝x₀*(1-((x₀*a)-1)) (20)

这个逼近法以每次计算迭代双倍精度的小数位的数值非常快速地收敛到x值。

为了使逼近法的计算成本保持低，低如单次迭代中的有用收敛是期望的。然而，对于单次迭代，方程20在采样之间表现出不期望的波动。可使迭代的收敛变慢以提供引入更少伪像的解决方案。如果收敛速度项S被应用于方程20，则该方程采取以下形式：

x₁＝x₀*(1-S*((x₀*a)-1)) (21)

其中，S＝1指示完全的“Newton-Rhapson”，S＝0.001意味着有意非常慢地收敛的方法。实际上，避免方程21不期望的收敛行为需要正确地选择S的值。例如，优选地，由于这个表达式的更大的值可引起收敛中的“过度反应”，所以S为这样的值：

- \frac{1}{2} < S * ((x_{0} * a) - 1) < \frac{1}{2} - - - (22)

应用在G_FAST[n]计算中使用的控制参数，方程21采取以下形式，其中x₁＝G_FAST[n]，x₀＝G_FAST[n-1]和a＝(1+P’[n])：

G_FAST[n]＝G_FAST[n-1]*(1-0.3*((1+P′[n])*G_FAST[n-1]-1)) (23)

在这个方程中，快增益减小值G_FAST[n]为来自前一时间采样n-1的前一值和方程的输入值——在这种情况下P’[n]的函数。如前所述，精确的估计典型地需要多次迭代。然而，在这种方法中，缓慢地使快增益减小值G_FAST[n]滑向期望的1/(1+x)值的单次迭代导致比更精确的估计、甚至准确的计算更少的听得到的伪像。听力实验发现，S＝0.3的值提供具有音频中的最小听得到的伪像的非常好的结果。图11显示与使用方程13计算的真实值重叠的对几百个采样的逼近“Newton-Rhapson”FastGain(快增益)值的例子。

最后，快增益减小值G_FAST[n]313与从延迟线308输出的前一个增益减小的采样x’[m，n]的相乘产生最后的增益减小的采样x”[m，n]103(步骤1625)。

x″[m，n]＝x′[m，n]*G_FAST[n]，对于所有m (24)

在图12中，曲线图“a)”描绘根据本发明一个实施例的关于剪切3-18dB的信号的快增益减小。剪切进行约1.5ms，曲线图显示前瞻如何预计剪切发生。更大的增益减小量导致更高速率的增益变化，对应地，图12的曲线图“b)”中显示的更高的频谱分散量。然而，由于首先，慢增益减小级在该增益减小级之前，所以快级不必提供如单独使用那么多的增益减小，因而，听得到的频谱分散被最小化。图15中显示这的例子，以下进一步讨论这。

在图12中，曲线图“b)”显示由于在峰平滑中使用FIR滤波器而导致的频谱分散中的波纹。IIR滤波器可去除波纹，但是，平滑器中得到的随频率变化的群延迟将不保证音频信号精确地减小到限峰器阈值的水平。快增益减小值可能下降得太早或太晚以至于不能遇到需要增益减小的采样，将不会精确地达到要求的增益值。

性能

图13显示利用本发明的实施例计算得到的半秒的典型的44.1kHz数字音频内容的限峰增益减小信号。在显示的例子中，限峰器阈值T为0.5或-6dB。示意图的下半部显示输入的PCM信号(语音)的绝对振幅，示意图的上半部显示合成的慢和快增益减小信号。在图13中，慢增益分量提供(在附图的整个宽度上)最小的、缓慢变化的增益减小信号，而快增益分量对于超过限峰器阈值的短期信号分量提供更显著的增益减小。

图14显示利用本发明的实施例计算得到的一秒半的典型的44.1kHz数字音频内容的另一限峰增益减小信号。在显示的例子中，限峰器阈值为0.25或-12dB。在图14中，慢增益分量提供(在附图的整个宽度上)适中量的、缓慢变化的增益减小信号，而快增益分量对于超过限峰器阈值的短期信号分量提供临时的短期增益减小。由于图像缩放，短期增益减小分量显现为垂直线，所以图14还放大了增益减小信号的一部分，更详细地显示短期增益减小分量。图14中的短期增益减小分量具有与图13类似的形状和持续时间。

图15显示根据本发明实施例的两级如何在大量的、持续的剪切减小条件下工作。曲线图显示需要～10dB的持续增益减小的突发性定调管信号的组合增益减小轨迹。在图15中，曲线图“a)”给出在约1秒的时间间隔上增益减小的示意图。在图15中，曲线图“b)”显示约0.2秒的非常精细的细节。在这个例子中，第一级的缓慢变化的增益减小级提供约0.2或-14dB的大部分的增益减小，第二级的快动作的增益减小级负责约+1dB的波动。

Claims

1.一种音频信号的限峰方法，其中该方法包括：

接收输入音频信号；

检测输入音频信号超过阈值的偏移；

响应于检测到的偏移计算第一增益，其中，第一增益的变化限于第一变化率；

将第一增益应用于输入音频信号以产生中间音频信号；

将延迟线应用于中间音频信号以产生延迟的中间音频信号；

识别所述延迟线的延迟缓冲信号的超过所述阈值的一个或多个峰值；

响应于识别的一个或多个峰值计算第二增益，其中，第二增益的变化限于第二变化率，第二变化率高于第一变化率；和

将第二增益应用于延迟的中间音频信号以产生峰值不超过所述阈值的输出音频信号。

2.根据权利要求1所述的方法，响应于检测到的偏移的数目和偏移量来计算第一增益。

3.根据权利要求1所述的方法，包括：计算第二增益，使得当中间音频信号的峰值离开所述延迟线时，第二增益的变化率正好足以使输出音频信号振幅减小为等于或低于所述阈值。

4.根据权利要求1所述的方法，包括：

通过在长度等于L的第一缓冲器的输入端接收代表中间音频信号的采样并使这些采样通过第一缓冲器到达第一缓冲器的输出端来将所述延迟线应用于中间音频信号，其中，第一缓冲器为存储L个采样的先入先出缓冲器；和

通过以下步骤，识别所述一个或多个峰值并为在第一缓冲器的输入端接收的中间音频信号的每个采样计算第二增益：

从存储在第一缓冲器中的、具有最大幅度的采样导出中间控制值；

使中间控制值穿过长度等于L的第二缓冲器，其中，第二缓冲器为长度等于L的先入先出缓冲器且存储L个中间控制值；

将存储在第二缓冲器中的中间控制值乘以滤波器系数，并对乘积求和以获得增益控制值；和

响应于该增益控制值计算第二增益。

5.根据权利要求4所述的方法，其中，所述滤波器系数的值为从长度L的Hanning窗函数的平方根得出的值。

6.根据权利要求4所述的方法，包括：通过Newton-Raphson数值逼近法计算作为所述增益控制值加1之和的倒数的第二增益。

7.一种用于音频信号限峰的设备，包括：

用于接收输入音频信号的装置；

用于检测输入音频信号超过阈值的偏移的装置；

用于响应于检测到的偏移计算第一增益的装置，其中，第一增益的变化限于第一变化率；

用于将第一增益应用于输入音频信号以产生中间音频信号的装置；

用于将延迟线应用于中间音频信号以产生延迟的中间音频信号的装置；

用于识别所述延迟线的延迟缓冲信号的超过阈值的一个或多个峰值的装置；

用于响应于识别的一个或多个峰值计算第二增益的装置，其中，第二增益的变化限于第二变化率，第二变化率高于第一变化率；和

用于将第二增益应用于延迟的中间音频信号以产生峰值不超过所述阈值的输出音频信号的装置。

8.根据权利要求7所述的设备，响应于检测到的偏移的数目和偏移量来计算第一增益。

9.根据权利要求7所述的设备，包括下述装置：用于计算第二增益，使得当中间音频信号的峰值离开所述延迟线时，第二增益的变化率正好足以使输出音频信号振幅减小为等于或低于所述阈值的装置。

10.根据权利要求7所述的设备，包括：

用于通过在长度等于L的第一缓冲器的输入端接收代表中间音频信号的采样并使这些采样通过第一缓冲器到达第一缓冲器的输出端来将所述延迟线应用于中间音频信号的装置，其中，第一缓冲器为存储L个采样的先入先出缓冲器；和

用于通过以下操作来识别所述一个或多个峰值并为在第一缓冲器的输入端接收的中间音频信号的每个采样计算第二增益的装置：

响应于该增益控制值计算第二增益。

11.根据权利要求10所述的设备，其中，所述滤波器系数的值为从长度L的Hanning窗函数的平方根得出的值。

12.根据权利要求10所述的设备，包括下述装置：用于通过Newton-Raphson数值逼近法计算作为所述增益控制值加1之和的倒数的第二增益的装置。