CN117079657A

CN117079657A - 压限处理方法、装置、电子设备及可读存储介质

Info

Publication number: CN117079657A
Application number: CN202311335260.XA
Authority: CN
Inventors: 李�昊; 薛楠; 宁业栋; 马鸿泰; 蔡晓雄; 杨桄; 于龙广睿
Original assignee: China Tower Co Ltd
Current assignee: China Tower Co Ltd
Priority date: 2023-10-16
Filing date: 2023-10-16
Publication date: 2023-11-17
Anticipated expiration: 2043-10-16
Also published as: CN117079657B

Abstract

本申请公开了一种压限处理方法、装置、电子设备及可读存储介质，属于音频技术领域。其中，所述方法包括：获取待处理音频关联的n个子带，其中，n为大于或者等于2的整数；确定每个所述子带各自对应的短时能量和信号变化率；基于每个所述子带各自对应的所述短时能量和所述信号变化率，计算每个所述子带各自对应的信号增益；将每个所述子带对应的所述信号增益进行合成，得到压限后的音频。本申请提供的方案能够解决在对高动态信号进行压限时出现的失真、响应滞后的问题。

Description

压限处理方法、装置、电子设备及可读存储介质

技术领域

本申请属于音频技术领域，具体涉及一种压限处理方法、装置、电子设备及可读存储介质。

背景技术

压限器作为音响组成的重要设备之一，既能够压缩或者限制音频信号的动态范围，防止声音过载或者失真，也能够提高音频***响度。由于现有技术中通常采用对信号全频段进行峰值包络计算的压限方法，或者采用将信号全频段分成多个子带进行包络计算的压限方法，因此，在对高动态声音进行压限处理时，会出现声音失真、响应滞后的问题。

发明内容

本申请实施例的目的是提供一种压限处理方法、装置、电子设备及介质，能够解决对高动态声音进行压限处理时出现的声音失真、响应滞后的问题。

第一方面，本申请实施例提供了一种压限处理方法，包括：

获取待处理音频关联的n个子带，其中，n为大于或者等于2的整数；

确定每个所述子带各自对应的短时能量和信号变化率；

基于每个所述子带各自对应的所述短时能量和所述信号变化率，计算每个所述子带各自对应的信号增益；

将每个所述子带对应的所述信号增益进行合成，得到压限后的音频。

可选地，所述确定每个所述子带的短时能量，包括：

根据以下公式确定目标子带的短时能量：

;

其中，为所述目标子带中的任一帧信号在i时刻的信号大小，所述目标子带为多个所述子带中的任意一个；

为所述目标子带在当前时刻的所述短时能量；

为计算短时能量的点数。

可选地，确定每个所述子带各自对应的信号变化率，包括：

基于所述目标子带对应的所述短时能量，获取所述目标子带在当前时刻的第一均值包络和第二均值包络，所述第一均值包络为基于第一预设平滑系数获取的计算信号包络值，所述第二均值包络为基于第二预设平滑系数获取的计算信号包络值，所述第一预设平滑系数大于所述第二预设平滑系数；

基于所述第一均值包络和所述第二均值包络，计算所述目标子带对应的所述信号变化率。

可选地，所述基于所述目标子带对应的所述短时能量，获取所述目标子带的第一均值包络和第二均值包络，包括：

获取所述目标子带在目标时刻的第三均值包络和第四均值包络，其中，所述目标时刻为当前时刻之前的时刻，所述第三均值包络为基于在所述目标时刻对应的第一阈值获取的计算信号包络值，所述第四均值包络为基于在所述目标时刻对应的第二阈值获取的计算信号包络值，所述第三均值包络大于所述第四均值包络；

基于所述第三均值包络、所述短时能量和所述第一预设平滑系数，确定所述第一均值包络；

基于所述第四均值包络、所述短时能量和所述第二预设平滑系数，确定所述第二均值包络。

可选地，所述基于每个所述子带各自对应的所述短时能量和所述信号变化率，计算每个所述子带各自对应的信号增益，包括：

对所述目标子带对应的所述信号变化率进行归一化处理，获取第一分类因子；

对所述目标子带对应的所述短时能量进行归一化处理，获取第二分类因子;

基于所述第一分类因子和所述第二分类因子，计算所述目标子带对应的目标包络；

基于所述目标包络、预设增益和所述目标子带的延时时间，计算所述目标子带对应的所述信号增益。

可选地，所述基于所述第一分类因子和所述第二分类因子，计算所述目标子带对应的目标包络，包括：

获取所述目标子带的包络在所述目标时刻的第一峰值包络；

基于所述第一峰值包络、第三预设平滑系数和所述短时能量，确定所述目标子带的包络在当前时刻的第二峰值包络；

基于所述第二峰值包络、所述第一分类因子和所述第二分类因子，计算所述目标包络。

可选地，所述基于所述目标包络、预设增益和所述目标子带的延时时间，计算所述目标子带对应的所述信号增益，包括：

根据以下公式计算所述目标子带对应的所述信号增益：

;

其中，为所述目标子带对应的调节的增益；

为所述预设增益；

为所述目标包络；

为所述目标子带的延时时间；

为所述目标子带对应的所述信号增益。

第二方面，本申请实施例提供了一种压限处理装置，包括：

子带获取模块，用于获取待处理音频关联的n个子带，其中，n为大于或者等于2的整数；

第一确定模块，用于确定每个所述子带各自对应的短时能量和信号变化率；

信号增益模块，用于基于每个所述子带各自对应的所述短时能量和所述信号变化率，计算每个所述子带各自对应的信号增益；

合成模块，用于将每个所述子带对应的所述信号增益进行合成，得到压限后的音频。

第三方面，本申请实施例提供了一种电子设备，该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现如第一方面所述的压限处理方法的步骤。

第四方面，本申请实施例提供了一种可读存储介质，所述可读存储介质上存储程序或指令，所述程序或指令被处理器执行时实现如第一方面所述的压限处理方法的步骤。

在本申请实施例中，获取待处理音频的子带，再确定子带对应的短时能量和信号变化率，随后通过子带对应的短时能量和信号变化率，计算出每个子带各自对应的信号增益。而对待处理音频中的每个子带进行信号增益能够使得音频中的高动态信号实现平稳过渡，降低高动态信号失真问题出现的可能性，同时，整个过程能够快速跟踪音频子带的变化，减少压限滞后出现的可能。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种压限处理方法的流程图之一；

图2是本申请实施例提供的一种压限处理方法的流程图之二；

图3是本申请实施例提供的一种压限处理装置的结构示意图；

图4是本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员获得的所有其他实施例，都属于本申请保护的范围。

本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象，而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施，且“第一”、“第二”等所区分的对象通常为一类，并不限定对象的个数，例如第一对象可以是一个，也可以是多个。此外，说明书以及权利要求中“和/或”表示所连接对象的至少其中之一，字符“/”，一般表示前后关联对象是一种“或”的关系。

下面结合附图，通过具体的实施例及其应用场景对本申请实施例提供的压限处理方法、装置及相关设备进行详细地说明。

请参照图1，图1是本申请实施例提供的一种压限处理方法的流程图。如图1所示，包括以下步骤：

步骤101、获取待处理音频关联的n个子带，其中，n为大于或者等于2的整数。

值得一提的是，获取待处理音频关联的n个子带，可以通过模拟数字转换器（Analog to Digital，ADC）采集待处理音频的信号，随后可以通过MATLAB设计椭圆滤波器或者相应的镜像滤波器进行处理。而待处理音频的信号经过滤波器处理之后可以得到n个子带。其中，子带的具体个数可以根据所设计的滤波器来确定，例如设计椭圆滤波器中包括四个范围，具体是、/>、/>、/>，最后得到的待处理音频的子带也是四个，本申请不对子带数量作出限制，可以根据实际情况进行确定。由于本申请待处理音频获取的是全频段的信号，对于语音、超低音、舞曲等动态范围变化较大的信号都能够进行处理，覆盖范围较广。

步骤102、确定每个所述子带各自对应的短时能量和信号变化率。

在本申请实施例中，需要分别确定每一个子带各自对应的短时能量和信号变化率（如图2所示），可以先确定每个子带分别对应的短时能量，再确定每个子带各自对应的信号变化率。对子带的信号变化率确定是便于能够确定待处理音频中各个子带噪声出现的可能性，本申请中的信号变化率可以替换成谐波成分、信号特征值等参数，来估算待处理音频中各个子带对应的噪声。这样，由于对信号变化率的确定是便于实施计算信号噪声，因此，本申请实施例也能够应用于信噪较差的场景中。通过确定各个子带各自对应的短时能量和信号变化率，便于确定各子带对应的信号增益，以实现对待处理音频的压限处理。

步骤103、基于每个所述子带各自对应的所述短时能量和所述信号变化率，计算每个所述子带各自对应的信号增益。

在具体实施中，计算每个子带各自对应的信号增益，需要先将短时能量和信号变化率分别进行归一化分类因子计算，将短时能量和信号变化率转变为处于同一区间的概率值，通过获得的概率值表示待处理音频中各子带对应的声音大小。再通过所获取的每个子带分别对应的两个概率值，计算各个子带对应的信号增益。这样，本申请通过对短时能量和信号变化率分别进行归一化分类因子计算，可以更好的快速跟踪信号变化，获取各个子带对应的信号增益，使得待处理音频可以平稳过渡，而不引起信号失真。

步骤104、将每个所述子带对应的所述信号增益进行合成，得到压限后的音频。

需要说明的是，通过对每个子带所获取的对应的信号增益进行合成（如图2所示），再对合成后的子带进行转化，就可以输出为模拟信号，完成对待处理音频的压限处理。其中，合成后的信号增益为数字信号，可以通过数字模拟转换器（Digital-to-AnalogConverter，DAC），将合成后的信号增益转换为模拟信号输出。这样，最后输出的为经过压限处理的模拟信号，由于在信号增益处理过程中是平稳过渡的，因此降低了该输出的模拟信号中的高动态信号出现失真的可能性。

可选地，所述确定每个所述子带的短时能量，包括：

根据以下公式确定目标子带的短时能量：

;

为所述目标子带在当前时刻的所述短时能量；

为计算短时能量的点数。

可以理解地，本申请中各个子带对应的短时能量可以通过上述公式进行获取，确定各个子带分别对应的短时能量。

可选地，确定每个所述子带各自对应的信号变化率，包括：

具体地，获取目标子带的信号变化率可以先获取目标子带在当前时刻的第一均值包络和第二均值包络，而第一均值包络和第二均值包络是基于不同的预设阈值确定的。其中，第一均值包络对应的第一预设平滑系数大于第二均值包络对应的第二预设平滑系数，又由于第一预设平滑系数和第二预设平滑系数的确定是与包络值的变化情况相关的，第一预设平滑系数对应的包络值的变化快于第二预设平滑系数对应的包络值的变化情况，因此，第一均值包络可以是快速计算包络值，第二均值包络可以是慢速计算包络值。

在本申请的一个具体实施例中，在确定了目标子带的第一均值包络和第二均值包络之后，可以通过以下公式计算目标子带对应的信号变化率：

；

其中，为当前时刻所述目标子带的第一均值包络；

为当前时刻所述目标子带的第二均值包络；

为当前时刻所述目标子带对应的所述信号变化率。

可以理解地是，为增加数据的准确性，把各个子带对应的信号变化率所处的不同变化方向统一到一个方向，可以设定在小于1时，令/>。

在本申请的一个具体实施例中，上述目标时刻可以是当前所处时刻的上一时刻，例如当前所处时刻的前一秒为目标时刻，本申请对此不作具体限制。上述第三均值包络和第四均值包络分别是基于第一阈值和第二阈值获取的，第一阈值和第二阈值可以是在目标时刻是预设的，根据子带的变化情况确定具体数值。具体地，可以根据以下公式确定目标子带对应的第一均值包络：

；

其中，为目标时刻目标子带的第三均值包络；

为第一预设平滑系数；

同样地，可以根据以下公式获取目标子带的第二均值包络：

；

为上一时刻所述目标子带的第四均值包络；

为第二预设平滑系数。

在一个具体实施例中，上述可以取值为0.05，上述/>可以取值为0.02。这样，通过上述公式能够快速准确跟踪待处理音频中各个子带对应的包络值，避免出现因为估算不及时造成压限滞后的问题。

在本申请又一个具体实施例中，通过各个子带对应的短时能量和信号变化率，确定每个子带分别对应的信号增益，首先需要对短时能量继续归一化处理，也需要对信号变化率进行归一化处理。在待处理音频的各个子带中，若存在没有信号的一段，则该段可以是噪声，由于噪声的变化是较为平稳的，平稳的值比率趋向于1。而信号变化较快，因此需要对信号变化率进行归一化因子计算，可以通过以下公式进行：

;

其中，表示为当前时刻的所述信号变化率映射到[-1,1]这一区间对应的数值；

为/>到1的距离，可以取值为0.965；

表示为归一化处理中的归一化曲线的第一斜率，可以取值为-5.12；

表示为归一化处理中的归一化曲线的第一截距，可以取值为0.22；

表示为当前时刻的所述信号变化率映射到[0,1]这一区间对应的数值，即第一分类因子。

具体地，归一化处理可以是对短时能量和信号变化率分别进行归一化分类因子计算，可以通过以下公式对短时能量进行归一化分类因子计算，以获取第二分类因子：

;

其中，表示为当前时刻的所述短时能量映射到[-1,1]这一区间对应的数值；

为当前时刻的平稳噪声大小（在/>小于初始噪声信号/>的情况下，/>可以取值为0.25，/>，其中，/>为第三预设平滑系数，可以取值为0.22，/>为目标时刻的平稳噪声大小）；

为/>到1的距离因子；

表示为归一化处理中的归一化曲线的第二斜率；

表示为归一化处理中的归一化曲线的第二截距；

表示为当前时刻的所述短时能量映射到[0,1]这一区间对应的数值，即第二分类因子。

获取所述目标子带的包络在所述目标时刻的第一峰值包络；

在本申请的另一实施例中，在确定第一分类因子和第二分类因子之后，可以计算目标子带对应的目标包络，具体可以根据以下公式计算得到：

；

其中，为所述目标子带对应的所述第三均值包络；

为当前时刻的第一峰值包络；

需要说明的是，上述公式是通过将第一分类因子和第二分类因子相乘获取信号包络，也即通过短时能量对应的第一分类因子和信号变化率对应的第二分类因子计算信号包络（如图2所示），再与第一峰值包络相乘，获取目标包络。

另外，如果此时目标子带的短时能量大于目标时刻的第一峰值包络，则通过以下公式确定第二峰值包络：

；

为目标时刻的所述峰值包络值；

为第四预设平滑系数，可以取值为0.08。

否则，可以通过下列公式确定：

；

此时，为第五预设平滑系数，可以取值为0.00013。

此外，上述确定第四预设平滑系数可以是为了计算第二峰值包络,信号在变大取大点的值（取值为第四预设平滑系数），跟踪信号会快一些。而信号在变小取小点值（取值为第五预设平滑系数），跟踪信号会慢一些，合在一起会形成第峰值包络。

根据以下公式计算所述目标子带对应的所述信号增益：

；

其中，为所述目标子带对应的调节的增益；

为所述预设增益；

为所述目标包络；

为所述目标子带的延时时间；

为所述目标子带对应的所述信号增益。

可以理解的是，通过上述公式能够确定每一个子带各自对应的信号增益，由于包括了高动态信号对应的子带，对高动态信号对应的子带进行压限处理采用上述信号增益的方式进行，能够避免引起信号失真，使得音频信号能够平稳过渡。

请具体参考图3，在本申请的另一个实施例中，还提供了一种压限处理装置，该压限处理装置200具体包括：

子带获取模块201，用于获取待处理音频关联的n个子带，其中，n为大于或者等于2的整数；

第一确定模块202，用于确定每个所述子带各自对应的短时能量和信号变化率；

信号增益模块203，用于基于每个所述子带各自对应的所述短时能量和所述信号变化率，计算每个所述子带各自对应的信号增益；

合成模块204，用于将每个所述子带对应的所述信号增益进行合成，得到压限后的音频。

可选地，所述第一确定模块202用于：

根据以下公式确定目标子带的短时能量：

;

为所述目标子带在当前时刻的所述短时能量；

为计算短时能量的点数。

可选地，所述第一确定模块202包括：

第二确定子模块，用于基于所述目标子带对应的所述短时能量，获取所述目标子带在当前时刻的第一均值包络和第二均值包络，所述第一均值包络为基于第一预设平滑系数获取的计算信号包络值，所述第二均值包络为基于第二预设平滑系数获取的计算信号包络值，所述第一预设平滑系数大于所述第二预设平滑系数；

第一计算子模块，用于基于所述第一均值包络和所述第二均值包络，计算所述目标子带对应的所述信号变化率。

可选地，所述第二确定子模块包括：

第一获取单元，用于获取所述目标子带在目标时刻的第三均值包络和第四均值包络，其中，所述目标时刻为当前时刻之前的时刻，所述第三均值包络为基于在所述目标时刻对应的第一阈值获取的计算信号包络值，所述第四均值包络为基于在所述目标时刻对应的第二阈值获取的计算信号包络值，所述第三均值包络大于所述第四均值包络；

第一确定单元，用于基于所述第三均值包络、所述短时能量和所述第一预设平滑系数，确定所述第一均值包络；

第二确定单元，用于基于所述第四均值包络、所述短时能量和所述第二预设平滑系数，确定所述第二均值包络。

可选地，所述信号增益模块203包括：

第一分类因子子模块，用于对所述目标子带对应的所述信号变化率进行归一化处理，获取第一分类因子；

第二分类因子子模块，用于对所述目标子带对应的所述短时能量进行归一化处理，获取第二分类因子;

第二计算子模块，用于基于所述第一分类因子和所述第二分类因子，计算所述目标子带对应的目标包络；

第三计算子模块，用于基于所述目标包络、预设增益和所述目标子带的延时时间，计算所述目标子带对应的所述信号增益。

可选地，所述第二计算子模块包括：

第二获取单元，用于获取所述目标子带的包络在所述目标时刻的第一峰值包络；

第三确定单元，用于基于所述第一峰值包络、第三预设平滑系数和所述短时能量，确定所述目标子带的包络在当前时刻的第二峰值包络；

第三均值包络单元，用于基于所述第二峰值包络、所述第一分类因子和所述第二分类因子，计算所述目标包络。

可选地，所述第三计算子模块用于：

根据以下公式计算所述目标子带对应的所述信号增益：

;

其中，为所述目标子带对应的调节的增益；

为所述预设增益；

为所述目标包络；

为所述目标子带的延时时间；

为所述目标子带对应的所述信号增益。

本申请实施例提供的压限处理装置200，能够实现图1所述方法实施例实现的各个过程，且能够达到相应的有益效果，为避免重复，这里不再赘述。

如图4所示，本申请实施例还提供一种电子设备300，包括处理器301，存储器302，存储在存储器302上并可在处理器301上运行的程序或指令，该程序或指令被处理器301执行时实现如图1所示方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

本申请实施例还提供一种可读存储介质，所述可读存储介质上存储有程序或指令，该程序或指令被处理器执行时实现上述图1中所述压限处理方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

其中，所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质，包括计算机可读存储介质，如计算机只读存储器（Read-Only Memory，ROM）、随机存取存储器（Random Access Memory，RAM）、磁碟或者光盘等。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外，需要指出的是，本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能，还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能，例如，可以按不同于所描述的次序来执行所描述的方法，并且还可以添加、省去、或组合各种步骤。另外，参照某些示例所描述的特征可在其他示例中被组合。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机软件产品的形式体现出来，该计算机软件产品存储在一个存储介质（如ROM/RAM、磁碟、光盘）中，包括若干指令用以使得一台终端（可以是手机，计算机，算力网络，或者网络设备等）执行本申请各个实施例所述的方法。

上面结合附图对本申请的实施例进行了描述，但是本申请并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本申请的启示下，在不脱离本申请宗旨和权利要求所保护的范围情况下，还可做出很多形式，均属于本申请的保护之内。

Claims

1.一种压限处理方法，其特征在于，包括：

确定每个所述子带各自对应的短时能量和信号变化率；

2.根据权利要求1所述的方法，其特征在于，所述确定每个所述子带的短时能量，包括：

根据以下公式确定目标子带的短时能量：

;

为所述目标子带在当前时刻的所述短时能量；

为计算短时能量的点数。

3.根据权利要求2所述的方法，其特征在于，确定每个所述子带各自对应的信号变化率，包括：

4.根据权利要求3所述的方法，其特征在于，所述基于所述目标子带对应的所述短时能量，获取所述目标子带的第一均值包络和第二均值包络，包括：

5.根据权利要求4所述的方法，其特征在于，所述基于每个所述子带各自对应的所述短时能量和所述信号变化率，计算每个所述子带各自对应的信号增益，包括：

6.根据权利要求5所述的方法，其特征在于，所述基于所述第一分类因子和所述第二分类因子，计算所述目标子带对应的目标包络，包括：

获取所述目标子带的包络在所述目标时刻的第一峰值包络；

7.根据权利要求5所述的方法，其特征在于，所述基于所述目标包络、预设增益和所述目标子带的延时时间，计算所述目标子带对应的所述信号增益，包括：

根据以下公式计算所述目标子带对应的所述信号增益：

;

其中，为所述目标子带对应的调节的增益；

为所述预设增益；

为所述目标包络；

为所述目标子带的延时时间；

为所述目标子带对应的所述信号增益。

8.一种压限处理装置，其特征在于，包括：

9.一种电子设备，其特征在于，包括处理器和存储器，所述存储器存储可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现如权利要求1-7中任一项所述的压限处理方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述可读存储介质上存储程序或指令，所述程序或指令被处理器执行时实现如权利要求1-7中任一项所述的压限处理方法的步骤。