CN113452855B

CN113452855B - 啸叫处理方法、装置、电子设备及存储介质

Info

Publication number: CN113452855B
Application number: CN202110618560.3A
Authority: CN
Inventors: 陈耀斌; 阮良; 陈功
Original assignee: Hangzhou Netease Zhiqi Technology Co Ltd
Current assignee: Hangzhou Netease Zhiqi Technology Co Ltd
Priority date: 2021-06-03
Filing date: 2021-06-03
Publication date: 2022-05-27
Anticipated expiration: 2041-06-03
Also published as: CN113452855A

Abstract

本公开公开了一种啸叫处理方法、装置、电子设备及存储介质。该方法通过将待检测音频信号中各音频帧的时域数据进行时频转换，得到各音频帧的频域数据后，针对任一音频帧，基于音频帧的频域数据，获取音频帧中各频带的能量；根据当前音频帧中目标频带与相邻频带间的能量比值，以及目标频带与预设数量个历史音频帧中相应频带的能量趋势，确定目标频带的频带类别；目标频带为当前音频帧中的任一频带，历史音频帧为当前音频帧所在时间之前的音频帧，从而基于目标频带的频带类别，对携带目标频带的当前音频帧的频域数据进行啸叫处理，以避免了啸叫的产生，提高了用户体验。

Description

啸叫处理方法、装置、电子设备及存储介质

技术领域

本公开涉及音频处理技术领域，尤其涉及一种啸叫处理方法、装置、电子设备及存储介质。

背景技术

在语音通信、多媒体通信领域，电话会议或者多媒体会议场景，由于参会人数众多，极易出现由于设备问题或者是场景问题导致的啸叫现象。啸叫对于会议通话质量危害极大，因此啸叫抑制是音频处理中的一个重要环节。通过啸叫抑制可以避免在通话过程中出现啸叫现象，可极大的提升通话语音质量和参会人的主观体验。

发明内容

本公开实施例提供一种啸叫处理方法、装置、电子设备及存储介质，解决了现有技术存在的上述问题，避免了啸叫的产生，提高了用户体验。

本公开实施例提供的具体技术方案如下：

第一方面，提供了一种啸叫处理方法，该方法可以包括：

将待检测音频信号中各音频帧的时域数据进行时频转换，得到所述各音频帧的频域数据；

针对任一音频帧，基于所述音频帧的频域数据，获取所述音频帧中各频带的能量；

根据当前音频帧中目标频带与相邻频带间的能量比值，以及所述目标频带与预设数量个历史音频帧中相应频带的能量趋势，确定所述目标频带的频带类别；所述目标频带为所述当前音频帧中的任一频带，所述历史音频帧为所述当前音频帧所在时间之前的音频帧；

基于所述目标频带的频带类别，对携带所述目标频带的当前音频帧的频域数据进行啸叫处理。

在一个可能的实现中，所述频带类别包括第一频带、第二频带和第三频带；

根据当前音频帧中目标频带与相邻频带间的能量比值，以及所述目标频带与预设数量个历史音频帧中相应频带的能量趋势，确定所述目标频带的频带类别，包括：

获取所述目标频带的能量与所述相邻频带的第一能量比值和第二能量比值；

若所述第一能量比值与所述第二能量比值均不小于预设最大啸叫能量阈值，且按照时间顺序，所述预设数量个历史音频帧中相应频带和所述目标频带的能量趋势为依次递增，则确定所述目标频带的频带类别为所述第一频带；

若所述第一能量比值与所述第二能量比值均小于所述预设最大啸叫能量阈值，且均不小于预设最小啸叫能量阈值，以及按照时间顺序，所述预设数量个相应频带和所述目标频带的能量趋势为依次递增，则确定所述目标频带的频带类别为所述第二频带；

若所述第一能量比值和所述第二能量比值中至少一个能量比值小于所述预设最小啸叫能量阈值，或按照时间顺序，所述预设数量个相应频带和所述目标频带的能量趋势不为依次递增，则确定所述目标频带的频带类别为所述第三频带。

在一个可能的实现中，基于所述目标频带的频带类别，对携带所述目标频带的当前音频帧的频域数据进行啸叫处理，包括：

若所述目标频带的频带类别为所述第一频带，则采用预设啸叫检测算法，对携带所述第一频带的当前音频帧的频域数据进行啸叫检测，并根据检测结果，对所述当前音频帧的频域数据进行啸叫抑制；

若所述目标频带的频带类别为所述第二频带，则将所述第二频带的能量与第一预设增益值相乘，得到所述目标频带的新能量和所述当前音频帧的新频域数据，所述第一预设增益值的值域为[0,1]。

在一个可能的实现中，根据检测结果，对所述当前音频帧的频域数据进行啸叫抑制，包括：

若所述检测结果为所述第一频带为啸叫频带，则采用预设啸叫抑制算法，对所述当前音频帧的频域数据进行啸叫抑制，得到处理后的频域数据；

若所述检测结果为所述第一频带不为啸叫频带，则将所述第一频带的能量与第二预设增益值相乘，得到所述第一频带的新能量和所述当前音频帧的新频域数据，所述第二预设增益值的值域为[0,1]。

在一个可能的实现中，采用预设啸叫检测算法，对携带所述第一频带的音频帧的频域数据进行啸叫检测，包括：

采用预设的谱平坦度啸叫检测算法，对携带所述第一频带的当前音频帧的频域数据进行啸叫检测。

在一个可能的实现中，采用预设啸叫抑制算法，对所述当前音频帧的频域数据进行啸叫抑制，得到处理后的频域数据，包括：

采用预设的陷波器啸叫抑制算法，对所述当前音频帧的频域数据进行啸叫抑制，得到处理后的频域数据。

第二方面，提供了一种啸叫处理装置，该装置可以包括：

时频转换单元，用于将待检测音频信号中各音频帧的时域数据进行时频转换，得到所述各音频帧的频域数据；

获取单元，用于针对任一音频帧，基于所述音频帧的频域数据，获取所述音频帧中各频带的能量；

确定单元，用于根据当前音频帧中目标频带与相邻频带间的能量比值，以及所述目标频带与预设数量个历史音频帧中相应频带的能量趋势，确定所述目标频带的频带类别；所述目标频带为所述当前音频帧中的任一频带，所述历史音频帧为所述当前音频帧所在时间之前的音频帧；

啸叫处理单元，用于基于所述目标频带的频带类别，对携带所述目标频带的当前音频帧的频域数据进行啸叫处理。

所述确定单元，具体用于获取所述目标频带的能量与所述相邻频带的第一能量比值和第二能量比值；

以及，若所述第一能量比值与所述第二能量比值均不小于预设最大啸叫能量阈值，且按照时间顺序，所述预设数量个历史音频帧中相应频带和所述目标频带的能量趋势为依次递增，则确定所述目标频带的频带类别为所述第一频带；

在一个可能的实现中，所述啸叫处理单元，具体用于若所述目标频带的频带类别为所述第一频带，则采用预设啸叫检测算法，对携带所述第一频带的当前音频帧的频域数据进行啸叫检测，并根据检测结果，对所述当前音频帧的频域数据进行啸叫抑制；

以及，若所述目标频带的频带类别为所述第二频带，则将所述第二频带的能量与第一预设增益值相乘，得到所述目标频带的新能量和所述当前音频帧的新频域数据，所述第一预设增益值的值域为[0,1]。

在一个可能的实现中，所述啸叫处理单元，还具体用于若所述检测结果为所述第一频带为啸叫频带，则采用预设啸叫抑制算法，对所述当前音频帧的频域数据进行啸叫抑制，得到处理后的频域数据；

以及，若所述检测结果为所述第一频带不为啸叫频带，则将所述第一频带的能量与第二预设增益值相乘，得到所述第一频带的新能量和所述当前音频帧的新频域数据，所述第二预设增益值的值域为[0,1]。

在一个可能的实现中，所述啸叫处理单元，还具体用于采用预设的谱平坦度啸叫检测算法，对携带所述第一频带的当前音频帧的频域数据进行啸叫检测。

在一个可能的实现中，所述啸叫处理单元，还具体用于采用预设的陷波器啸叫抑制算法，对所述当前音频帧的频域数据进行啸叫抑制，得到处理后的频域数据。

第三方面，提供了一种电子设备，该电子设备包括：

至少一个存储器，用于存储程序指令；

至少一个处理器，用于调用所述存储器中存储的程序指令，按照获得的程序指令执行上述第一方面中任一所述的方法步骤。

第四方面，提供了一种计算机可读存储介质，该计算机可读存储介质内存储有计算机程序，所述计算机程序被处理器执行时实现上述第一方面中任一所述的方法步骤。

本公开实施例提供的啸叫处理方法通过将待检测音频信号中各音频帧的时域数据进行时频转换，得到各音频帧的频域数据后，针对任一音频帧，基于音频帧的频域数据，获取音频帧中各频带的能量；根据当前音频帧中目标频带与相邻频带间的能量比值，以及目标频带与预设数量个历史音频帧中相应频带的能量趋势，确定目标频带的频带类别；目标频带为当前音频帧中的任一频带，历史音频帧为当前音频帧所在时间之前的音频帧，从而基于目标频带的频带类别，对携带目标频带的当前音频帧的频域数据进行啸叫处理，以避免了啸叫的产生，提高了用户体验。

附图说明

图1为本公开实施例中的一种啸叫产生的原理示意图；

图2为本公开实施例中的一种陷波器啸叫抑制***的结构示意图；

图3为本公开实施例中的一种啸叫检测的过程示意图；

图4为本公开实施例中的一种啸叫处理方法的流程示意图；

图5为本公开实施例中的一种啸叫处理装置的结构示意图；

图6为本公开实施例中的一种电子设备的结构示意图。

具体实施方式

下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本公开一部分实施例，并不是全部的实施例。基于本公开实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本公开保护的范围。

首先对本公开实施例中涉及的部分用语进行说明，以便于本领域技术人员理解。

终端设备：可以是移动终端、固定终端或便携式终端，例如移动手机、站点、单元、设备、多媒体计算机、多媒体平板、互联网节点、通信器、台式计算机、膝上型计算机、笔记本计算机、上网本计算机、平板计算机、个人通信***设备、个人导航设备、个人数字助理、音频/视频播放器、数码相机/摄像机、定位设备、电视接收器、无线电广播接收器、电子书设备、游戏设备或者其任意组合，包括这些设备的配件和外设或者其任意组合。还可预见到的是，终端设备能够支持任意类型的针对用户的接口(例如可穿戴设备)等。

服务器：可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式***，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务以及大数据和人工智能平台等基础云计算服务的云服务器。

啸叫，是扩声***中存在正反馈而产生的振荡。啸叫现象是指在扩声***中传声器接受声音信号，并将其变为电信号，电信号经过扩声通路的功率放大器放大，然后由扬声器将电信号变成声音信号辐射出去，辐射出来的一部分信号通过各种路径又返回到传声器***，形成了“扬声器—传声器—放大器—扬声器”这样的正反馈路径，如此反复循环形成正反馈。当振幅平衡条件和相位平衡条件同时满足时即产生振荡，表现为啸叫。

其中，啸叫产生的原理如图1所示，扩声通路输入的信号x(n)由声输入信号s(n)与反馈信号f(n)经传声器抬音获得，由扩声通路中的功率放大器放大，得到信号u(n)，经扬声器输出，然后声场反馈路径反射，形成反馈信号f(n)，将再次被传声器拾音而形成闭环***。根据奈奎斯特稳定判据，若存在频率。0＝2π(f₀/f_s)，f₀表示啸叫频率，fs表示采样率，使得G(ω)F(ω)满足以下增益和相位条件，会在频点ω₀处产生自激震荡，产生啸叫。

|G(ω₀F(ω₀))|≥1； (1)

∠G(ω₀)F(ω₀)＝2πk，k为整数； (2)

式中，G(ω)与F(ω)分别表示***扩声增益和声场反馈路径的频率响应，可通过计算各自的短时离散傅里叶变换获得。

陷波器啸叫抑制原理，基于陷波器的啸叫抑制方法主要由啸叫检测和陷波器设计两部分组成。其原理是通过准确检测声反馈中出现的啸叫频点，并进行陷波处理，降低啸叫频点处增益，破坏啸叫产生的增益条件，达到抑制啸叫的目的。如图2所示，首先，啸叫检测模块基于一定的特征实时检测输入信号x(n)是否产生啸叫；若判定产生啸叫，则精确计算啸叫频率点，根据啸叫频率设计相应的陷波器，降低该啸叫频点处增益，抑制啸叫。其中：

(1)啸叫检测，如图3所示，首先对输入信号进行分帧加窗，并通过短时离散傅里叶变换求得信号功率谱，进行频谱分析；其次选择每帧信号功率谱幅值较大的若干个频点作为候选啸叫频点；然后分别计算每个候选啸叫频点处的特征值；最后依据设置的检测阈值对相应特征值进行检测。

(2)陷波器，本质上为带阻滤波器，将啸叫频率设计为带阻的中心频率。当检测到啸叫成分并计算出准确的啸叫频率后，就需要设计相应频率的陷波器，来降低啸叫频点处增益，达到抑制啸叫的目的。最常用的陷波滤波器是二阶IIR滤波器。

谱平坦度啸叫检测原理，通过音频信号对应的功率谱的几何平均值与算术平均值的比值对音频信号进行啸叫检测。

式中，SFM为频带num_band的谱平坦度，a(k)为频带num_band中k个频点的振幅，K为频谱中的频点个数。其中，SFM越接近0，表明平坦度越低，越容易发生啸叫；SFM越接近1，表明平坦度越高，越不容易发生啸叫。

由于啸叫对于会议通话质量危害极大，因此啸叫抑制是音频处理中的一个重要环节。若要实现啸叫抑制需要先对待检测音频信号进行啸叫检测，之后对检测出的啸叫进行啸叫抑制。

目前的啸叫检测方法为：首先将待检测音频信号中的音频帧从时域空间中变换至频域空间内，从而可以得到多个频率点，接着根据各个频率点的功率值来计算全部频率点的平均功率，然后计算各个频率点的功率值与计算出的平均功率的比值，当该比值超过预设阈值的情况下，可以判定对应的频率点为啸叫频率点，从而检测到啸叫。

现有的啸叫抑制方案主要包括两类：第一类为通过大量训练样本训练基于机器学习的啸叫抑制模型，以达到啸叫抑制的目的，第二类为基于传统信号处理方法的啸叫抑制方案，例如：移频法，陷波器啸叫抑制法(啸叫检测+陷波法)等。然而，对于第一类啸叫抑制方案会引入大量的计算量，占用了设备的大量资源。对于第二类啸叫抑制方案中的移频法在没有啸叫的情况下也会对音频信号进行处理，会造成音频信号产生一定程度的失真；陷波器啸叫抑制法是在啸叫发生后才对音频信号进行处理，由于已经发生了啸叫故降低了用户的主观体验。

为此本公开提供了一种啸叫处理方法，该方法可以应用在终端设备中，也可以应用在服务器，如云服务器或应用服务器中，通过对各音频帧的频域数据，获取音频帧中各频带的能量，并根据各音频帧中目标频带与相邻频带间的能量比值，以及目标频带与预设数量个历史音频帧中相应频带的能量趋势，确定目标频带的频带类别；从而基于目标频带的频带类别，对携带目标频带的当前音频帧的频域数据进行啸叫处理，以避免了啸叫的产生，提高了用户体验。

以下结合说明书附图对本公开的优选实施例进行说明，应当理解，此处所描述的优选实施例仅用于说明和解释本发明，并不用于限定本发明，并且在不冲突的情况下，本公开中的实施例及实施例中的特征可以相互组合。

图4为本公开实施例提供的一种啸叫处理方法的流程示意图。如图4所示，该方法可以包括：

步骤410、将待检测音频信号中各音频帧的时域数据进行时频转换，得到各音频帧的频域数据。

获取待检测音频信号中的各音频帧。其中，获取到的各音频帧为时域数据。为了进行啸叫频带检测，需要将各音频帧的时域数据进行时频转换，如采用快速傅里叶变换(FastFourier Transformation，FFT)，对时域数据进行时频变换，得到各音频帧的频域数据。

步骤420、针对任一音频帧，基于音频帧的频域数据，获取音频帧中各频带的能量。

针对每个音频帧，对该音频帧的频域数据进行频带划分，并计算该频带的能量。

步骤430、根据当前音频帧中目标频带与相邻频带间的能量比值，以及目标频带与预设数量个历史音频帧中相应频带的能量趋势，确定目标频带的频带类别。

其中，目标频带为当前音频帧中的任一频带，历史音频帧为当前音频帧所在时间之前的音频帧。当前音频帧为待检测音频信号中各音频帧中的任一音频帧。

为了避免在没有啸叫发生时才能对音频信号进行处理，以及只有在啸叫发生时才能对音频信号进行处理的情况，本公开通过对频带进行频带类别的分类，以实现针对不同类别进行相应的啸叫处理，避免啸叫的产生，提高用户体验。

故为了提高频带类别分类的准确性，可以通过获取当前音频帧中目标频带与相邻频带间的能量比值，将相应能量比值与不同预设阈值进行比较来初步检测目标频带的类别。

一个实施例中，获取目标频带的能量与相邻频带的第一能量比值和第二能量比值。具体为：将目标频带的能量与其左侧相邻频带的能量作比值，得到第一能量比值；将目标频带的能量与其右侧相邻频带的能量作比值，得到第二能量比值。

例如，若第i个频带为目标频带，第i个频带的能量为band(i)，则第i个频带左侧相邻频带的能量为band(i-1)，第i个频带右侧相邻频带的能量为band(i+1)。

那么，第一能量比值可以表示为：band(i)/band(i-1)；第二能量比值可以表示为：band(i)/band(i+1)。

为了验证上述初步检测的准确性，可进一步通过不同音频帧中目标频带的能量趋势来确定目标频带的类别。具体的，获取当前音频帧所在时间之前的预设数量个历史音频帧，如采集10个历史音频帧。

其中，该历史音频帧可以是当前音频帧所在时间之前的连续的预设数量个音频帧，也可以是当前音频帧所在时间之前的按照预设帧间隔的预设数量个音频帧，可根据实际情况进行确定，本公开实施例在此不做限定。

预设帧间隔是预先设置的不影响连续音频帧能量趋势的最小帧数。

例如，当前音频帧所在时间为t，t之前存在连续的8个音频帧，按照时间从小到大的顺序，相应音频帧所在时间为t1-t8。

若预设数量为4，则可以获取到t之前的连续4个音频帧，且相应音频帧所在时间依次为t5-t8；

若预设数量为4，且预设帧间隔为1，则按照预设帧间隔，可以获取到t之前的4个音频帧，相应音频帧所在时间依次为t7、t5、t3、t1。

进一步的，可以根据相邻频带间的能量比值与预设啸叫能量阈值的比较结果，以及目标频带与历史音频帧中相应频带的能量趋势，对目标频带的频带类别进行区分，提高了区分频带类别的准确性，以便更好的实现对不同类别频带的啸叫检测。

一个实施例中，根据第一能量比值和第二能量比值各自与预设最大啸叫能量阈值的比较结果，以及按照时间顺序，目标频带和预设数量个历史音频帧中相应频带的能量趋势，确定目标频带的频带类别。

具体实施中，若第一能量比值与第二能量比值均不小于预设最大啸叫能量阈值，且按照时间顺序，预设数量个历史音频帧中相应频带和目标频带的能量趋势为依次递增，则确定目标频带的频带类别为第一频带；

其中，预设最大啸叫能量阈值为形成啸叫的最大啸叫能量。由于此时相邻频带间的能量比值超出了预设最大啸叫能量阈值，且相应能量趋势处于递增趋势，故该目标频带有较大概率是啸叫频带，即第一频带为疑似啸叫频带。

若第一能量比值与第二能量比值均小于预设最大啸叫能量阈值，且均不小于预设最小啸叫能量阈值，以及按照时间顺序，预设数量个相应频带和目标频带的能量趋势为依次递增，则确定目标频带的频带类别为第二频带；

其中，预设最小啸叫能量阈值为形成啸叫的最小啸叫能量。此时相邻频带间的能量比值在形成啸叫的区间中，且相应能量趋势处于递增趋势，表明该目标频带在形成啸叫频带的过程中，即第二频带为啸叫形成频带。

若第一能量比值和第二能量比值中至少一个能量比值小于预设最小啸叫能量阈值，或按照时间顺序，预设数量个相应频带和目标频带的能量趋势不为依次递增，则确定目标频带的频带类别为第三频带。

此时相邻频带间的能量比值在形成啸叫的区间以下，且相应能量趋势不为递增趋势，表明该目标频带为正常频带，即不属于啸叫形成频带，也不属于疑似啸叫频带。

需要说明的是，预设最大啸叫能量阈值与预设最小啸叫能量阈值可根据实际情况或历史经验进行设置，本公开实施例在此不做限定；能量趋势不为递增趋势可以包括能量趋势为递减趋势，或周期性先递增后递减的趋势，或非周期性先递增后递减的趋势等，本公开实施例在此不做限定。

在一个例子中，以预设最大啸叫能量阈值为12，预设最小啸叫能量阈值为8，第i频带与相邻频带间的第一能量比值为band(i)/band(i-1)，第二能量比值为band(i)/band(i+1)为例。

(1)若band(i)/band(i-1)>12,且band[i]/band(i+1)>12，则此时将第i频带确定为第一候选频带；且若第i频带与相应预设数量个历史音频帧中相应频带的能量趋势为递增趋势，则确定该第一候选频带的频带类别为疑似啸叫频带；

(2)若12>＝band[i]/band(i-1)>8，且12>＝band[i]/band(i+1)>8，则此时将第i频带确定为第二候选频带；且若第i频带与相应预设数量个历史音频帧中相应频带的能量趋势为递增趋势，则确定该第二候选频带的频带类别为啸叫形成频带；

(3)若8>band(i)/band(i-1)和/或8>band[i]/band(i+1)，则此时确定第i频带为正常频带；或者，若第i频带与相应预设数量个历史音频帧中相应频带的能量趋势不为递增趋势，则确定第i频带为正常频带。

步骤440、基于目标频带的频带类别，对携带目标频带的当前音频帧的频域数据进行啸叫处理。

通过上述的频带类别检测方案，可准确对频带的类别进行区分得到：正常频带，啸叫形成频带和疑似啸叫频带，从而实现针对不同类别的频带进行相应的啸叫保护处理，避免啸叫产生。

一个实施例中，若目标频带的频带类别为第二频带，则将第二频带的能量与第一预设增益值相乘，得到目标频带的新能量和当前音频帧的新频域数据，第一预设增益值的值域为[0,1]。由于第二频带为啸叫形成频带，通过将第二频带的能量与小于1的整数相乘，即对该频带的能量施加一个小于1的增益值来降低第二频带的能量和该能量对应的频率，以破坏啸叫的形成条件，达到抑制啸叫的目的。

若目标频带的频带类别为第一频带，则采用预设啸叫检测算法，对携带第一频带的当前音频帧的频域数据进行啸叫检测，并根据检测结果，对当前音频帧的频域数据进行啸叫抑制。

一个例子中，在目标频带的频带类别为第一频带时，可以采用预设的谱平坦度啸叫检测算法或前述图3所示的啸叫检测算法，对携带第一频带的当前音频帧的频域数据进行啸叫检测。

采用预设的谱平坦度啸叫检测算法时，需要获取第一频带内各频点的振幅，以及频域数据对应的频谱中的频点个数，计算几何平均值与算术平均值的比值，得到谱平坦度；

若谱平坦度大于预设平坦度阈值，如0.6，则表明第一频带为啸叫频带；若谱平坦度不大于预设平坦度阈值，则表明第一频带可能为啸叫形成频带或正常频带。

进一步的，若检测结果表示第一频带为啸叫频带，则采用预设啸叫抑制算法，对当前音频帧的频域数据进行啸叫抑制，得到处理后的频域数据；

一个实施例中，在第一频带为啸叫频带时，可以采用预设的陷波器啸叫抑制算法，对当前音频帧的频域数据进行啸叫抑制，得到处理后的频域数据。

具体实施中，由于已检测出第一频带为啸叫频带，故采用预设的陷波器啸叫抑制算法时，需要将该啸叫频带的能量对应的最大频率设计为陷波器的中心频率，将当前音频帧的频域数据通过该陷波器后，即可降低该啸叫频带在该频点处的增益，达到抑制啸叫的目的。

若检测结果表示第一频带不为啸叫频带，则将第一频带的能量与第二预设增益值相乘，得到第一频带的新能量和当前音频帧的新频域数据，第二预设增益值的值域为[0,1]。

其中，当第一频带不为啸叫频带时，可能是检测频带类别时检测出现误差，此时第一频带可能为啸叫形成频带或正常频带，为了避免该频带形成啸叫频带，通过将该频带的能量与小于1的整数相乘来降低该频带的能量和该能量对应的频率。

可见，本公开上述实施例对携带正常频带的音频信号不进行处理，以达到保护音频质量的目的；对携带啸叫形成频带的音频信号进行啸叫破坏处理，如该频带的能量施加一个小于1的增益值，以破坏啸叫的形成条件，预防啸叫的形成；对携带啸叫频带的音频信号进行啸叫抑制处理，如陷波器啸叫抑制算法，从而避免了啸叫的产生，提高了用户的主观体验。

需要说明的是，第一预设增益值与第二预设增益值可以相同，也可以不同，可根据实际需要进行配置，本公开实施例在此不做限定。

基于相同的技术构思，本公开实施例还提供一种啸叫处理装置，啸叫处理装置解决问题的原理与上述啸叫处理方法相似，因此啸叫处理装置的实施可参见啸叫处理装置方法的实施，重复之处不再赘述。图5为本公开实施例提供的一种啸叫处理装置的结构示意图，如图5所示，该啸叫处理装置包括：时频转换单元510、获取单元520、确定单元530和啸叫处理单元540；

时频转换单元510，用于将待检测音频信号中各音频帧的时域数据进行时频转换，得到所述各音频帧的频域数据；

可以采用FFT，对待检测音频信号中各音频帧的时域数据进行时频变换，得到各音频帧的频域数据。

获取单元520，用于针对任一音频帧，基于所述音频帧的频域数据，获取所述音频帧中各频带的能量；

确定单元530，用于根据当前音频帧中目标频带与相邻频带间的能量比值，以及所述目标频带与预设数量个历史音频帧中相应频带的能量趋势，确定所述目标频带的频带类别；所述目标频带为所述当前音频帧中的任一频带，所述历史音频帧为所述当前音频帧所在时间之前的音频帧；

首先，获取目标频带的能量与相邻频带的能量比值，即第一能量比值和第二能量比值，以及当前音频帧所在时间之前的预设数量个历史音频帧，基于相邻频带间的能量比值与预设啸叫能量阈值的比较结果，以及目标频带与历史音频帧中相应频带的能量趋势，确定目标频带的频带类别，具体确定过程可以参照步骤430所述的步骤实现。

啸叫处理单元540，用于基于所述目标频带的频带类别，对携带所述目标频带的当前音频帧的频域数据进行啸叫处理。

其中，若目标频带的频带类别为疑似啸叫频带，且该疑似啸叫频带不是啸叫频带，或者目标频带的频带类别为啸叫形成频带，则对相应频带的能量施加一个小于1的增益值来降低第二频带的增益，达到抑制啸叫的目的。若目标频带的频带类别为疑似啸叫频带，且该疑似啸叫频带是啸叫频带，则对该频带进行啸叫抑制。

确定单元530，具体用于获取所述目标频带的能量与所述相邻频带的第一能量比值和第二能量比值；

在一个可能的实现中，啸叫处理单元540，具体用于若所述目标频带的频带类别为所述第一频带，则采用预设啸叫检测算法，对携带所述第一频带的当前音频帧的频域数据进行啸叫检测，并根据检测结果，对所述当前音频帧的频域数据进行啸叫抑制；

在一个可能的实现中，啸叫处理单元540，还具体用于若所述检测结果为所述第一频带为啸叫频带，则采用预设啸叫抑制算法，对所述当前音频帧的频域数据进行啸叫抑制，得到处理后的频域数据；

在一个可能的实现中，啸叫处理单元540，还具体用于采用预设的谱平坦度啸叫检测算法，对携带所述第一频带的当前音频帧的频域数据进行啸叫检测。

在一个可能的实现中，啸叫处理单元540，还具体用于采用预设的陷波器啸叫抑制算法，对所述当前音频帧的频域数据进行啸叫抑制，得到处理后的频域数据。

本发明上述实施例提供的对象推荐装置的各功能单元的功能，可以通过上述各方法步骤来实现，因此，本公开实施例提供的对象推荐装置中的各个单元的具体工作过程和有益效果，在此不复赘述。

基于上述实施例，参阅图6所示为本公开实施例中电子设备的结构示意图。

本公开实施例提供了一种电子设备，该电子设备可以包括处理器610(CenterProcessing Unit，CPU)、存储器620、输入设备630和输出设备640等，输入设备630可以包括键盘、鼠标、触摸屏等，输出设备640可以包括显示设备，如液晶显示器(Liquid CrystalDisplay，LCD)、阴极射线管(Cathode Ray Tube，CRT)等。

存储器620可以包括只读存储器(ROM)和随机存取存储器(RAM)，并向处理器610提供存储器620中存储的程序指令和数据。在本公开实施例中，存储器620可以用于存储本公开实施例中任一种啸叫处理方法的程序。

处理器610通过调用存储器620存储的程序指令，处理器610用于按照获得的程序指令执行本公开实施例中任一种啸叫处理方法。

基于上述实施例，本公开实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述任意方法实施例中的啸叫处理方法。

本领域内的技术人员应明白，本公开的实施例可提供为方法、***、或计算机程序产品。因此，本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本公开是参照根据本公开的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然，本领域的技术人员可以对本公开进行各种改动和变型而不脱离本公开的精神和范围。这样，倘若本公开的这些修改和变型属于本公开权利要求及其等同技术的范围之内，则本公开也意图包含这些改动和变型在内。

Claims

1.一种啸叫处理方法，其特征在于，所述方法包括：

基于所述目标频带的频带类别，对携带所述目标频带的当前音频帧的频域数据进行啸叫处理；

所述频带类别包括正常频带、啸叫形成频带和疑似啸叫频带；

若所述第一能量比值与所述第二能量比值均不小于预设最大啸叫能量阈值，且按照时间顺序，所述预设数量个历史音频帧中相应频带和所述目标频带的能量趋势为依次递增，则确定所述目标频带的频带类别为疑似啸叫频带；

若所述第一能量比值与所述第二能量比值均小于所述预设最大啸叫能量阈值，且均不小于预设最小啸叫能量阈值，以及按照时间顺序，所述预设数量个相应频带和所述目标频带的能量趋势为依次递增，则确定所述目标频带的频带类别为啸叫形成频带；

若所述第一能量比值和所述第二能量比值中至少一个能量比值小于所述预设最小啸叫能量阈值，或按照时间顺序，所述预设数量个相应频带和所述目标频带的能量趋势不为依次递增，则确定所述目标频带的频带类别为正常频带。

2.如权利要求1所述的方法，其特征在于，基于所述目标频带的频带类别，对携带所述目标频带的当前音频帧的频域数据进行啸叫处理，包括：

若所述目标频带的频带类别为所述疑似啸叫频带，则采用预设啸叫检测算法，对携带所述疑似啸叫频带的当前音频帧的频域数据进行啸叫检测，并根据检测结果，对所述当前音频帧的频域数据进行啸叫抑制；

若所述目标频带的频带类别为所述啸叫形成频带，则将所述啸叫形成频带的能量与第一预设增益值相乘，得到所述目标频带的新能量和所述当前音频帧的新频域数据，所述第一预设增益值的值域为[0,1]。

3.如权利要求2所述的方法，其特征在于，根据检测结果，对所述当前音频帧的频域数据进行啸叫抑制，包括：

若所述检测结果为所述疑似啸叫频带为啸叫频带，则采用预设啸叫抑制算法，对所述当前音频帧的频域数据进行啸叫抑制，得到处理后的频域数据；

若所述检测结果为所述疑似啸叫频带不为啸叫频带，则将所述疑似啸叫频带的能量与第二预设增益值相乘，得到所述疑似啸叫频带的新能量和所述当前音频帧的新频域数据，所述第二预设增益值的值域为[0,1]。

4.如权利要求2所述的方法，其特征在于，采用预设啸叫检测算法，对携带所述疑似啸叫频带的音频帧的频域数据进行啸叫检测，包括：

采用预设的谱平坦度啸叫检测算法，对携带所述疑似啸叫频带的当前音频帧的频域数据进行啸叫检测。

5.如权利要求3所述的方法，其特征在于，采用预设啸叫抑制算法，对所述当前音频帧的频域数据进行啸叫抑制，得到处理后的频域数据，包括：

6.一种啸叫处理装置，其特征在于，所述装置包括：

啸叫处理单元，用于基于所述目标频带的频带类别，对携带所述目标频带的当前音频帧的频域数据进行啸叫处理；

所述确定单元，具体用于获取所述目标频带的能量与所述相邻频带的第一能量比值和第二能量比值；若所述第一能量比值与所述第二能量比值均不小于预设最大啸叫能量阈值，且按照时间顺序，所述预设数量个历史音频帧中相应频带和所述目标频带的能量趋势为依次递增，则确定所述目标频带的频带类别为所述疑似啸叫频带；若所述第一能量比值与所述第二能量比值均小于所述预设最大啸叫能量阈值，且均不小于预设最小啸叫能量阈值，以及按照时间顺序，所述预设数量个相应频带和所述目标频带的能量趋势为依次递增，则确定所述目标频带的频带类别为所述啸叫形成频带；若所述第一能量比值和所述第二能量比值中至少一个能量比值小于所述预设最小啸叫能量阈值，或按照时间顺序，所述预设数量个相应频带和所述目标频带的能量趋势不为依次递增，则确定所述目标频带的频带类别为所述正常频带。

7.如权利要求6所述的装置，其特征在于，所述啸叫处理单元，具体用于若所述目标频带的频带类别为所述疑似啸叫频带，则采用预设啸叫检测算法，对携带所述疑似啸叫频带的当前音频帧的频域数据进行啸叫检测，并根据检测结果，对所述当前音频帧的频域数据进行啸叫抑制；

以及，若所述目标频带的频带类别为所述啸叫形成频带，则将所述啸叫形成频带的能量与第一预设增益值相乘，得到所述目标频带的新能量和所述当前音频帧的新频域数据，所述第一预设增益值的值域为[0,1]。

8.如权利要求7所述的装置，其特征在于，所述啸叫处理单元，还具体用于若所述检测结果为所述疑似啸叫频带为啸叫频带，则采用预设啸叫抑制算法，对所述当前音频帧的频域数据进行啸叫抑制，得到处理后的频域数据；

以及，若所述检测结果为所述疑似啸叫频带不为啸叫频带，则将所述疑似啸叫频带的能量与第二预设增益值相乘，得到所述疑似啸叫频带的新能量和所述当前音频帧的新频域数据，所述第二预设增益值的值域为[0,1]。

9.如权利要求7所述的装置，其特征在于，所述啸叫处理单元，还具体用于采用预设的谱平坦度啸叫检测算法，对携带所述疑似啸叫频带的当前音频帧的频域数据进行啸叫检测。

10.如权利要求8所述的装置，其特征在于，所述啸叫处理单元，还具体用于采用预设的陷波器啸叫抑制算法，对所述当前音频帧的频域数据进行啸叫抑制，得到处理后的频域数据。

11.一种电子设备，其特征在于，包括：

至少一个存储器，用于存储程序指令；

至少一个处理器，用于调用所述存储器中存储的程序指令，按照获得的程序指令执行上述权利要求1-5任一项所述的方法步骤。

12.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，当所述计算机程序在电子设备上运行时，所述计算机程序用于使所述电子设备执行权利要求1-5任一项所述的方法步骤。