CN109215675B

CN109215675B - 一种啸叫抑制的方法、装置及设备

Info

Publication number: CN109215675B
Application number: CN201710541073.5A
Authority: CN
Inventors: 吴威麒; 张凯磊
Original assignee: Suzhou Qianwen Wandaba Education Technology Co Ltd
Current assignee: Suzhou Qianwen Wandaba Education Technology Co ltd
Priority date: 2017-07-05
Filing date: 2017-07-05
Publication date: 2021-08-03
Anticipated expiration: 2037-07-05
Also published as: CN109215675A

Abstract

本发明实施例公开了一种啸叫抑制的方法、装置及设备。该方法包括：将声音输入信息进行分帧处理，得到至少一个声音帧数据；对所述声音帧数据进行移频处理，得到移频输出信息；对所述移频输出信息进行自适应滤波，输出啸叫抑制声音信息。本发明实施例所提供的技术方案，可以实现对声音信息中包括的啸叫部分进行有效抑制的效果。

Description

一种啸叫抑制的方法、装置及设备

技术领域

本发明实施例涉及音频处理技术领域，尤其涉及一种啸叫抑制的方法、装置及设备。

背景技术

现阶段，声音放大回路已经广泛应用于人们的工作和生活当中。例如，在会场讲话时，或者在KTV包房唱歌时，当麦克风和扬声器离得很近时，扬声器播放出来的声音又被录入麦克风，麦克风录制的声音通过扬声器又播放出来，这样反复叠加，构成回路增益，达到一定程度，会破坏回路***的稳定点，此时会听到很刺耳的啸叫声，极大的影响了用户的体验。

当出现上述问题时，最简单的解决办法就是让麦克风和扬声器保持一定的距离，或者错开方向，但是由于场地的限制，同样会出时常现啸叫现象。所以，如何能够有效抑制啸叫现象，成为了亟待解决的技术难题。

发明内容

本发明实施例提供一种啸叫抑制的方法、装置及设备，以实现对声音信息中包括的啸叫部分进行有效抑制的效果。

第一方面，本发明实施例提供了一种啸叫抑制的方法，该方法包括：

获取声音输入信息；

将所述声音输入信息进行分帧处理，得到至少一个声音帧数据；

对所述声音帧数据进行移频处理，得到移频输出信息；

对所述移频输出信息进行自适应滤波，输出啸叫抑制声音信息。

进一步的，对所述声音帧数据进行移频处理，得到移频输出信息，包括：

获取所述声音帧数据的单边带数据；

对所述单边带数据进行余弦调制，得到移频输出信息；

其中，获取所述声音帧数据的单边带数据的方式包括进行低通滤波和复指数调制。

进一步的，对所述移频输出信息进行自适应滤波包括：对所述移频输出信息进行多子带自适应滤波。

进一步的，对所述移频输出信息进行多子带自适应滤波，包括：

对所述移频输出信息进行下采样处理和划分子带处理，将得到的至少两个子带数据进行自适应滤波，得到自适应滤波结果；

对所述自适应滤波结果进行上采样处理和合并处理，得到啸叫抑制声音信息。

进一步的，对所述移频输出信息进行下采样和划分，将得到的子带数据进行自适应滤波，得到自适应滤波结果，包括：

将所述移频输出信息划分为至少两个子带，对所述子带进行下采样处理，将下采样处理的结果进行自适应滤波，得到自适应滤波结果；或者，

对所述移频输出信息进行下采样处理，将下采样处理的结果划分为至少两个子带，将所述子带进行自适应滤波，得到自适应滤波结果。

进一步的，对所述自适应滤波结果进行上采样处理和合并处理，得到啸叫抑制声音信息，包括：

对所述自适应滤波结果进行上采样处理，将得到的上采样处理结果合成为啸叫抑制声音信息并输出；或者，

将各子带的自适应滤波的结果合成为待输出信息，对所述待输出信息进行上采样处理，得到啸叫抑制声音信息并输出。

第二方面，本发明实施例还提供了一种啸叫抑制的装置，该装置包括：

声音输入信息获取模块，用于获取声音输入信息；

分帧处理模块，用于将所述声音输入信息进行分帧处理，得到至少一个声音帧数据；

移频处理模块，用于对所述声音帧数据进行移频处理，得到移频输出信息；

自适应滤波模块，用于对所述移频输出信息进行自适应滤波，以使啸叫信号得到抑制，输出啸叫抑制声音信息。

进一步的，所述移频处理模块包括：

单边带数据获取单元，用于获取所述声音帧数据的单边带数据；

移频信息输出单元，用于对所述单边带数据进行余弦调制，得到移频输出信息；

进一步的，所述自适应滤波模块具体用于：对所述移频输出信息进行多子带自适应滤波。

所述自适应滤波模块包括：

自适应滤波单元，用于对所述移频输出信息进行下采样处理和划分子带处理，将得到的至少两个子带数据进行自适应滤波，得到自适应滤波结果；

啸叫抑制声音信息获得单元，用于对所述自适应滤波结果进行上采样处理和合并处理，得到啸叫抑制声音信息。

第三方面，本发明实施例还提供了一种设备，所述设备包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现本发明实施例中提供的上述啸叫抑制的方法。

本发明实施例通过对声音输入信息进行分帧处理，得到一个或者多个声音帧数据，在对声音帧数据进行移频处理，并将得到的结果进行自适应滤波，即可以得到啸叫抑制声音信息进行输出，解决了现实生活中，时常产生啸叫现象给用户带来极坏的体验的问题，实现对声音信息中包括的啸叫部分进行有效抑制的效果。

附图说明

图1是本发明实施例一提供的啸叫抑制的方法的流程图；

图2是本发明实施例二提供的啸叫抑制的方法的流程图；

图3是本发明实施例三提供的啸叫抑制的装置的结构示意图；

图4为本发明实施例四提供的一种设备的结构示意图；

图5是本发明优选实施例提供的一种逐帧式移频流程示意图；

图6为本发明优选实施例提供的多子带自适应滤波流程示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。

在更加详细地讨论示例性实施例之前应当提到的是，一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理，但是其中的许多步骤可以被并行地、并发地或者同时实施。此外，各步骤的顺序可以被重新安排。当其操作完成时所述处理可以被终止，但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。

实施例一

图1是本发明实施例一提供的啸叫抑制的方法的流程图，本实施例可适用出现啸叫现象的情况，该方法可以由本发明实施例所提供的啸叫抑制的装置来执行，该装置可以由软件和/或硬件的方式来实现，并可集成于声音录制与播放设备中。

如图1所示，所述啸叫抑制的方法包括：

S110、将声音输入信息进行分帧处理，得到至少一个声音帧数据。

其中，声音输入信息可以是用户说话的声音，通过麦克风等设备录制的到的声音信息。分帧处理可以是按照固定的时间长度进行分帧，然后将每一帧数据进行封装，就可以得到至少一个声音帧数据。每一帧声音帧数据可以包括整个声音频段，也可以包括部分声音频段。结合实际场景中，啸叫现象可能出现在某一帧声音帧数据当中，也可能出现在连续或者分段的多帧声音帧数据当中。

S120、对所述声音帧数据进行移频处理，得到移频输出信息。

其中，对所述声音帧数据进行移频处理，可以是对所有的声音帧数据，也可以是对部分声音帧数据，具体可以根据需求来确定。如，为了提高计算速度，可以根据声音输入信息分帧后，估算每一帧声音的能量的大小来判断当前帧是否有可能存在啸叫现象，对存在啸叫概率较高的声音帧数据进行移频处理，另外也可以对所有的声音帧数据做移频处理。

移频处理是指对判断可能存在啸叫现象的频率移动一定的范围，从而可以初步的对啸叫现象起到抑制作用。其中，移频范围可以是几赫兹，在本发明实施例中，以移频之后既不会对音质造成影响，又能够达到较好的啸叫抑制效果为宜，比如，将可能存在啸叫现象的声音频率移动5赫兹以内。

在本发明实施例中，优选的，对所述声音帧数据进行移频处理，得到移频输出信息，包括：获取所述声音帧数据的单边带数据；对所述单边带数据进行余弦调制，得到移频输出信息；其中，获取所述声音帧数据的单边带数据的方式包括进行低通滤波和复指数调制。

其中，低通滤波、复指数调制、余弦调制的参数都可以是提前计算出来的，通过上述方式对声音输入信息进行分帧处理，然后再进行逐帧式移频的好处在于其相对逐点式移频可以大大缩小了计算量，提高计算速度，从而提高对声音输入信息的处理速度。

S130、对所述移频输出信息进行自适应滤波，输出啸叫抑制声音信息

在得到移频输出信息之后，可以对其进行自适应滤波处理，以实现对输入声音信息存在的啸叫现象达到最大程度的抑制的效果。

在本发明实施例中，优选的，对所述移频输出信息进行自适应滤波包括：对所述移频输出信息进行多子带自适应滤波。这样设置的好处是可以同时对多个子带对声音信息进行自适应滤波处理，从而可以提高计算速度，实现声音的快速输出，减小延迟。

其中，得到的多个子带可以是均等划分的，也可以是不均等划分的，均等划分的好处在于可以统一分子带过程中的划分函数，无需单独设置。不均等划分的好处在于可以根据啸叫现象易出现的频率范围，将整个声音带宽中，不易出现啸叫现象的频段放大或者缩小，然后可以根据选择对其进行自适应滤波处理，或者不做处理，这样可以减小计算负担，同时对于易出现啸叫现象的频带划分为多个子带，从而提高啸叫抑制的精度。

实施例二

图2是本发明实施例二提供的啸叫抑制的方法的流程图。本实施例在上述实施例的基础上，对上述实施例中的对所述移频输出信息进行自适应滤波，输出啸叫抑制声音信息，其中，优选的，对所述移频输出信息进行多子带自适应滤波，进行了进一步的优化。

如图2所示，所述啸叫抑制的方法包括：

S210、将声音输入信息进行分帧处理，得到至少一个声音帧数据。

S220、对所述声音帧数据进行移频处理，得到移频输出信息。

S230、对所述移频输出信息进行下采样处理和划分子带处理，将得到的至少两个子带数据进行自适应滤波，得到自适应滤波结果。

其中，下采样处理可以是根据预先设定的参数进行抽样处理，如可以设置下采样的步数为4，则每隔三个单位抽取一个单位作为下采样数据，本实施例中，可以是以频率为单位。如每隔3赫兹抽取1赫兹的数据进行下一步处理。划分子带处理，可以是将整个移频输出信息带宽上的数据，进行均等或者不均等的方式进行子带划分。如整个移频输出信息带宽为8kHz，则可以以每2kHz划分为一个子带，共划分为4个子带。其中，划分子带的过程可以通过分析滤波器组来实现。

将得到的至少两个子带数据进行自适应滤波，进而得到自适应滤波结果。

本发明实施例中，优选的，将所述移频输出信息划分为至少两个子带，对所述子带进行下采样处理，将下采样处理的结果进行自适应滤波，得到自适应滤波结果；或者，对所述移频输出信息进行下采样处理，将下采样处理的结果划分为至少两个子带，将所述子带进行自适应滤波，得到自适应滤波结果。也就是说，根据多相滤波结构，划分子带和下采样处理这两个步骤的先后顺序可以颠倒，对于计算结果没有影响，这两个步骤的有益效果均在于可以缩短分析子带滤波器的长度，提升计算速度，减小计算负荷量，达到减小声音信息处理延迟的效果。

S240、对所述自适应滤波结果进行上采样处理和合并处理，得到啸叫抑制声音信息。

其中，上采样的过程可以理解为插值的过程，其参数可以与下采样的参数相对应，优选的在插值之后，还可以进行低通滤波处理，从而滤出镜像信息。合并处理可以是由合成滤波器组来进行，其与分子带过程中的分析滤波器组的功能相对应，即将多个子带的处理结果相互合成为完整带宽的声音信号。

本发明实施例中，优选的，对所述自适应滤波结果进行上采样处理和合并处理，得到啸叫抑制声音信息，包括：对所述自适应滤波结果进行上采样处理，将得到的上采样处理结果合成为啸叫抑制声音信息并输出；或者，将各子带的自适应滤波的结果合成为待输出信息，对所述待输出信息进行上采样处理，得到啸叫抑制声音信息并输出。这样设置的好处是不对上采样和合并处理两个步骤的先后顺序进行限定，根据多相滤波结构，如果子带合成在前，上采样在后，，这样可以缩短合成子带滤波器的长度，减小计算量。

实施例三

图3是本发明实施例三提供的啸叫抑制的装置的结构示意图。如图3所示，所述啸叫抑制的装置，包括：

分帧处理模块310，用于将声音输入信息进行分帧处理，得到至少一个声音帧数据；

移频处理模块320，用于对所述声音帧数据进行移频处理，得到移频输出信息；

自适应滤波模块330，用于对所述移频输出信息进行自适应滤波，以使啸叫信号得到抑制，输出啸叫抑制声音信息。

在上述各实施例的基础上，所述移频处理模块320包括：

在上述各实施例的基础上，所述自适应滤波模块330具体用于：对所述移频输出信息进行多子带自适应滤波。

所述自适应滤波模块330包括：

上述产品可执行本发明任意实施例所提供的方法，具备执行方法相应的功能模块和有益效果。

实施例四

图4为本发明实施例四提供的一种设备的结构示意图。图4示出了适于用来实现本发明实施方式的示例性设备12的框图。图4显示的设备12仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图4所示，设备12以通用计算设备的形式表现。设备12的组件可以包括但不限于：一个或者多个处理器或者处理单元16，***存储器28，连接不同***组件(包括***存储器28和处理单元16)的总线18。

总线18表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器，***总线，图形加速端口，处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说，这些体系结构包括但不限于工业标准体系结构(ISA)总线，微通道体系结构(MAC)总线，增强型ISA总线、视频电子标准协会(VESA)局域总线以及***组件互连(PCI)总线。

设备12典型地包括多种计算机***可读介质。这些介质可以是任何能够被设备12访问的可用介质，包括易失性和非易失性介质，可移动的和不可移动的介质。

***存储器28可以包括易失性存储器形式的计算机***可读介质，例如随机存取存储器(RAM)30和/或高速缓存存储器32。设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机***存储介质。仅作为举例，存储***34可以用于读写不可移动的、非易失性磁介质(图4未显示，通常称为“硬盘驱动器”)。尽管图4中未示出，可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器，以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下，每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品，该程序产品具有一组(例如至少一个)程序模块，这些程序模块被配置以执行本发明各实施例的功能。

具有一组(至少一个)程序模块42的程序/实用工具40，可以存储在例如存储器28中，这样的程序模块42包括但不限于操作***、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。

设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信，还可与一个或者多个使得用户能与该设备12交互的设备通信，和/或与使得该设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡，调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且，设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN)，广域网(WAN)和/或公共网络，例如因特网)通信。如图4所示，网络适配器20通过总线18与设备12的其它模块通信。应当明白，尽管图中未示出，可以结合设备12使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储***等。

处理单元16通过运行存储在***存储器28中的程序，从而执行各种功能应用以及数据处理，例如实现本发明实施例所提供的啸叫抑制的方法。

优选实施例

为了更好的解释本发明实施例中所提供的啸叫抑制的方法，以及各个步骤的具体实现方式，提供了本发明优选实施例作为解释，但是本发明优选实施例并不对具体的实现过程做限定。

S111、获取到声音输入信息首先对其进行分帧处理，分帧处理的具体方式较为常规，本实施例此处不再赘述。

S112、逐帧式移频。

通常作法是对信号作希尔伯特变换，将信号变成单边带信号，然后用正弦波和余弦波对信号进行频域调制，实现移频。但是希尔伯特变换是针对完整逐点信号，不是针对帧数据，而且，希尔伯特变换对新来的信号都要进行运算一次，计算量大。本文提出使用滤波器的思想实现逐帧式频移，计算量小。

逐帧处理相比逐点计算量大大缩减，帧数据通过预先设计好的低通滤波和复指数调制单元，实现单边带，最后通过余弦调制，输出移频信号。其中，低通滤波、复指数调制、余弦调制单元都是可以提前计算出来的，这样进一步大大缩小了计算量。

图5是本发明优选实施例提供的一种逐帧式移频流程示意图，如图5所示，逐帧式移频流程为：

S1121、获取分帧处理后的声音信息帧数据；

S1122、对所述帧数据进行低通滤波处理；

S1123、将低通滤波处理结果进行复指数调制，得到单边带数据；

S1124、对所述单边带数据进行余弦调制；

S1125、输出余弦调制处理后的信号。

相应的，在输出宇轩调制处理后的信号后，将该信号作为其他处理流程输入信号，做后续处理。

S113、分析子带滤波器组。

本发明实施例优选的，采用的是QMF滤波器组，此处分解成4个子带作为示范，(也可以分为2个子带)。基本设计思想，就是首先设计一个低通滤波器，归一化截止频率为子带数的倒数，将低通滤波器逐步调制到不同的频率带，从而实现信号的子带分解。

假设原型的低通滤波器h1[n]，根据QMF滤波器组各个子带的关系，则可得到其他子带的滤波器依次为：

子带1滤波器：h₁[n]

子带2滤波器：

子带3滤波器：

子带4滤波器：

假设输入信号为x(n)，则各子带信号为：

sub(m,n)＝x(n)*h_m[n]

其中，n为采样点或者第n时刻的样本点。

S114、下采样处理。

对于n时刻第m个子带信号，表示为sub(m,n)。

Q倍下采样分为两步：

第一步，先通过一个低通滤波器，防止后面的高频信号混叠。低通滤波器的归一化截止频率为1/Q，得到sub_f(m,n)。

第二步，进行抽取每隔Q-1个点抽取一个点，即下采样信号sub_d(m,n)为：

sub_d(m,n)＝sub_f(m,1+Q*(n-1))。

S115、自适应滤波。

对于第m个子带下采样信号，n时刻表示为sub_d(m,n)，对应滤波后的子带信号表示y(m，n)。该滤波器优选的为IIR滤波器，所以输入信号input(m,n)表示为：

input(m,n)＝[sub_d(m,n),sub_d(m,n-1),sub_d(m,n-2),y(m,n-1),y(m,n-2)]

滤波器系数表示为：

w＝[1,b(m,n),1,-a*b(m,n),-a²]^T

则滤波后的子带输出信号为：

y(m,n)＝input(m,n)*w

其中，滤波器参数b(n)更新:

b(m,n+1)＝b(m,n)+μ(m,n)*y(m,n)*g(m,n)

μ(m,n)＝1/(2*y(m,n)^T*y(m,n))

g(m,n)＝[sub_d(m,n-1),y(m,n-1)]*[1,-a]^T

S116、上采样处理。

假设y(m,n)，n＝1,2,…,M。

P倍上采样过程也可以分为两步：

第一步，在信号相邻两点内插P-1个零点，即

当n＝1,2,…,M时，

y_z(m,P*(n-1)+1)＝y(m,n)

其它时刻，y_z(m,n)＝0.

第二步，低通滤波，滤除镜像信息。将y_z(m,n)和一个低通线性滤波器h(n)做卷积可得y_u(m,n)＝y_z(m,n)*h(n)，其中

S117、合并处理。

根据分析滤波器和合成滤波器的关系，可得合成滤波器

h_s1[n]＝4*h₁[n]

h_s2[n]＝-4*h₂[n]

h_s3[n]＝4*h₃[n]

h_s4[n]＝-4*h₄[n]

则合成的输出信号为：

图6为本发明优选实施例提供的多子带自适应滤波流程示意图，其中可以涵盖S113-S117的数据处理过程，值得说明的是，图6仅为本发明实施例的一种多子带自适应滤波流程，并不对本发明实施例的多子带自适应滤波流程过程构成限定。经过上述S111-S117的数据处理，就可以得到啸叫抑制输出信号。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

Claims

1.一种啸叫抑制的方法，其特征在于，包括：

将声音输入信息进行分帧处理，得到至少一个声音帧数据；

估算所述声音帧数据中声音的能量大小，判断当前声音帧存在啸叫现象的概率，若概率较高，则对所述声音帧数据进行移频处理，得到移频输出信息；

对所述移频输出信息进行自适应滤波，输出啸叫抑制声音信息；

对所述声音帧数据进行移频处理，包括：

获取分帧处理后的声音帧数据；对所述声音帧数据进行低通滤波处理；将低通滤波处理结果进行复指数调制，得到单边带数据；对所述单边带数据进行余弦调制；输出余弦调制处理后的信号。

2.根据权利要求1所述的方法，其特征在于，对所述移频输出信息进行自适应滤波包括：对所述移频输出信息进行多子带自适应滤波。

3.根据权利要求2所述的方法，其特征在于，对所述移频输出信息进行多子带自适应滤波，包括：

4.根据权利要求3所述的方法，其特征在于，对所述移频输出信息进行下采样和划分，将得到的子带数据进行自适应滤波，得到自适应滤波结果，包括：

5.根据权利要求3所述的方法，其特征在于，对所述自适应滤波结果进行上采样处理和合并处理，得到啸叫抑制声音信息，包括：

6.一种啸叫抑制的装置，其特征在于，包括：

分帧处理模块，用于将声音输入信息进行分帧处理，得到至少一个声音帧数据；

移频处理模块，用于估算所述声音帧数据中声音的能量大小，判断当前声音帧存在啸叫现象的概率，若概率较高，则对所述声音帧数据进行移频处理，得到移频输出信息；

自适应滤波模块，用于对所述移频输出信息进行自适应滤波，以使啸叫信号得到抑制，输出啸叫抑制声音信息；

所述移频处理模块，具体用于：

7.根据权利要求6所述的装置，其特征在于，所述自适应滤波模块具体用于：对所述移频输出信息进行多子带自适应滤波；

所述自适应滤波模块包括：

8.一种啸叫抑制的设备，其特征在于，所述设备包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-5中任一所述的啸叫抑制的方法。