CN110431624A

CN110431624A - 残余回声检测方法、残余回声检测装置、语音处理芯片及电子设备

Info

Publication number: CN110431624A
Application number: CN201980001068.2A
Authority: CN
Inventors: 郭红敬; 李国梁; 王鑫山; 韩文凯; 朱虎
Original assignee: Shenzhen Huiding Technology Co Ltd
Current assignee: Shenzhen Goodix Technology Co Ltd
Priority date: 2019-06-17
Filing date: 2019-06-17
Publication date: 2019-11-08
Anticipated expiration: 2039-06-17
Also published as: CN110431624B; WO2020252629A1

Abstract

一种残余回声检测方法、残余回声检测装置、语音处理芯片及电子设备，残余回声检测方法包括：根据远端语音信号与近端语音信号之间的相关功率，确定残余回声检测因子；根据所述残余回声检测因子，检测是否存在残余回声，从而提供了一种残余回声的检测方案。

Description

残余回声检测方法、残余回声检测装置、语音处理芯片及电子设备

技术领域

本申请实施例涉及语音技术领域，尤其涉及一种残余回声检测方法、残余回声检测装置、语音处理芯片及电子设备。

背景技术

随着通信技术、人工智能、语音交互等技术的快速发展，对通信质量、可穿戴设备的用户体验、语音交互的可靠性等提出了越来越高的要求。无论那种应用场景，只要存在语音通话的场景，就一定存在回声，因此，需要通过回声消除(acoustic echo cancellation，AEC)消除回声，改善语音质量，从而提升用户体验。

回声消除中大多数情况下主要针对声学回声。声学回声消除主要分成两部分：线性回声消除以及残余回声消除。在线性回声消除中，线性回声可以通过使用自适应滤波器对回声路径进行估计，尽可能逼近真实的声场，然后估计出回声信号，并在麦克风实际采集到的语音信号中扣除估计的回声信号以达到回声消除的效果，但是由于自适应滤波器阶数有限、数据特性、扬声器非线性特性等因素的影响，并不能彻底消除掉回声，仍然会存在残余回声。残余回声的存在会严重影响通话的语音质量和用户体验感。为此，需要通过残余回声消除处理消除残余回声。

在发明人实现本申请的过程中发现，残余回声的消除是以准确地检测到残余回声为前提，检测结果的准确度越高，越能保证有效地消除掉残留回声，因此，亟待提供一种解决方案，以实现残余回声的检测。

发明内容

有鉴于此，本申请实施例提供一种残余回声检测方法、残余回声检测装置、语音处理芯片及电子设备，用以至少解决现有技术中存在的上述问题。

本申请实施例提供一种残余回声检测方法，其包括：

根据远端语音信号与近端语音信号之间的相关功率，确定残余回声检测因子；

根据所述残余回声检测因子，检测是否存在残余回声。

本申请实施例提供一种残余回声检测装置，其包括：

检测因子计算单元，用于根据远端语音信号与近端语音信号之间的相关功率，确定残余回声检测因子；

残余回声检测单元，用于根据所述残余回声检测因子，检测是否存在残余回声。

本申请实施例提供一种语音处理芯片，其包括：残余回声检测装置所述残余回声检测装置包括：检测因子计算单元，用于根据远端语音信号与近端语音信号之间的相关功率，确定残余回声检测因子；残余回声检测单元，用于根据所述残余回声检测因子，检测是否存在残余回声。

本申请实施例提供一种电子设备，其包括本申请实施例任一所述的语音处理芯片。

由以上技术方案可见，本申请实施例中，根据远端语音信号与近端语音信号之间的相关功率，确定残余回声检测因子；根据所述残余回声检测因子，检测是否存在残余回声，从而提供了一种残余回声的检测方案。

附图说明

图1为可应用本申请残余回声检测方案的回声消除***结构示意图；

图2为应用了本申请残余回声检测装置的回声消除***结构示意图；

图3为本申请实施例一种残余回声检测方法流程示意图；

图4为本申请实施例又一种残余回声检测方法流程示意图；

图5为本申请实施例再一种残余回声检测方法流程示意图；

图6为本申请实施例中残余回声消除方法的流程示意图。

具体实施方式

为使本领域的普通技术人员更好地理解本申请实施例中的技术方案，下面结合附图对本申请实施例中的技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本申请的一部分实施例，而不是全部实施例。因此，本领域普通技术人员基于所描述的实施例而获得的其他实施例，都应当属于本申请实施例保护的范围。

图1为可应用本申请残余回声检测方案的回声消除***结构示意图；如图1所示，回声消除装置具体包括语音端点检测模块106、双端通话检测器108、自适应滤波器110，除此之外，该回声消除装置还可以包括：语音采集模块102、语音播放模块104、加法模块112，其中，语音采集模块102分别与语音端点检测模块106、双端通话检测器108、加法模块112通讯连接，语音播放模块104分别与语音端点检测模块106、自适应滤波器110通讯连接，语音端点检测模块106与双端通话检测器108通讯连接，双端通话检测器108分别与自适应滤波器110、加法模块112通讯连接。

其中，语音采集模块102用于采集近端模拟语音信号y(t)，以生成所述近端数字语音信；本实施例中，语音采集模块具体可以为麦克风，其采集的近端模拟语音信号y(t)可能包括近端说话者的模拟语音信号s(t)，也可能包括语音播放模块104播放远端模拟语音信号x(t)而导致的回声模拟语音信号d(t)。

其中，语音播放模块104，用于播放接收到的远端模拟语音信号x(t)；本实施例中，语音播放模块104可以具体为扬声器。

其中，语音端点检测模块106，用于检测是否存在回声模拟语音信号d(t)；本实施例中，语音端点检测模块106又可以称之为语音端点检测器(Voice Activity Detector，简称VAD)。

所述双端通话检测器用于检测是否同时存在回声模拟语音信号d(t)以及近端说话者的模拟语音信号s(t)，即区分是单端通话状态，还是双端通话状态，以确定滤波器系数的更新。

自适应滤波器110，用于根据滤波器系数以及所述远端模拟语音信号x(t)生成估计的回声模拟语音信号以消除所述近端模拟语音信号y(t)中存在的回声数字语音信号d(t)。本实施例中，所述自适应滤波器110比如为多时延块频域自适应滤波器。

其中，加法模块112，用于通过从所述近端模拟语音信号y(t)中减去估计的回声模拟语音信号得到所述误差模拟语音信号e(t)，以消除所述近端模拟语音信号y(t)中存在的回声模拟语音信号d(t)。本实施例中，加法模块112可以具体为加法器。所述估计的回声模拟语音信号越准确，即越接近实际的所述回声模拟语音信号d(t)，则语音的清晰度越高。

图2为应用了本申请残余回声检测装置的回声消除***结构示意图；如图2所示，可在上述图1的回声消除***中增加了残余回声检测装置114以及残余回声消除装置118，所述残余回声检测装置包括：检测因子计算单元以及残余回声检测单元，检测因子计算单元用于根据远端语音信号与近端语音信号之间的相关功率，确定残余回声检测因子；残余回声检测单元用于根据所述残余回声检测因子，检测是否存在残余回声；所述残余回声消除装置可用于消除检测到的残余回声。

而对于残余回声检测因子的计算可通过如下两种情形来计算：

第一种情形：在一应用场景中，检测因子计算单元进一步用于根据所述远端语音信号与误差语音信号之间的相关功率以及所述远端语音信号与近端语音信号之间的所述相关功率，确定残余回声检测因子。进一步地，检测因子计算单元进一步用于确定所述远端语音信号与所述误差语音信号之间的所述相关功率与所述远端语音信号与近端语音信号之间的所述相关功率的比值为所述残余回声检测因子。在具体实施时，可以计算出所述远端语音信号与所述误差语音信号之间的所述相关功率，以及计算出所述远端语音信号与近端语音信号之间的所述相关功率，再计算这两个相关功率之间的比值比并将其作为所述残余回声检测因子。残余回声检测单元在检测是否存在残余回声时，若所述残余回声检测因子大于残余回声检测因子门限，则判定存在残余回声，否则判定不存在残余回声。

第二种情形：在另一种应用场景中，检测因子计算单元进一步用于根据所述远端语音信号与估计的回声语音信号之间的相关功率以及所述远端语音信号与近端语音信号之间的所述相关功率，确定所述残余回声检测因子。进一步地，可以检测因子计算单元进一步用于确定所述远端语音信号与估计的回声语音信号之间的所述相关功率与所述远端语音信号与近端语音信号之间的所述相关功率的比值为所述残余回声检测因子。在具体实施时，可以先确定出所述远端语音信号与估计的回声语音信号之间的所述相关功率，以及所述远端语音信号与近端语音信号之间的所述相关功率，再计算这两个相关功率之间的比值并将其作为所述残余回声检测因子。残余回声检测单元在检测是否存在残余回声时，若所述残余回声检测因子小于残余回声检测因子门限，则判定存在残余回声，否则判定不存在残余回声。

此处，需要说明的是，在采取上述不同方式计算残余回声检测因子，在判断是否存在残余回声时都会用到残余回声检测因子门限，因此，从理论上来讲，单独对应其中任一种计算残余回声检测因子方式来说，残余回声检测因子门限可以根据检测准确度进行灵活设置。或者，换言之，如果采取上述两种情形中的任一种计算残余回声检测因子方式，残余回声检测因子门限可以根据检测准确度进行灵活设置。但是，如果要采取上述两种情形同时进行残余回声的检测的话，为了便于区分，根据远端语音信号与误差语音信号之间的所述相关功率以及所述远端语音信号与近端语音信号之间的所述相关功率，确定的残余回声检测因子称之为第一残余回声检测因子，对应的门限称之为第一残余回声检测因子门限；对应地，根据所述远端语音信号与估计的回声语音信号之间的所述相关功率以及所述远端语音信号与近端语音信号之间的所述相关功率，确定的所述残余回声检测因子称之为第二残余回声检测因子，对应的门限称之为第二残余回声检测因子门限；优选地，第二残余回声检测因子门限小于第一残余回声检测因子门限。

分别对应上述两种情形，具体地对于第一种情形，检测因子计算单元进一步用于根据所述远端语音信号与误差语音信之间的相关功率、所述估计的回声语音信号的功率以及所述残余回声检测因子，确定所述第一残余回声抑制因子，以根据所述第一残余回声抑制因子消除所述残余回声。

分别对应上述两种情形，具体地对于第二种情形，检测因子计算单元进一步用于根据所述远端语音信号与估计的回声语音信之间的相关功率、所述误差语音信号的功率以及所述残余回声检测因子，确定所述第一残余回声抑制因子，以根据所述第一残余回声抑制因子消除所述残余回声。

进一步地，如果为了提高检测准确度，还可以引入信号之间的归一化相关因子，将其与所述残余回声检测因子结合进行所述残余回声的检测。

具体地，比如对于第一种情形，还可以包括相关因子计算单元，确定所述远端语音信号的功率与误差语音信号的功率的乘积，根据所述乘积，以及所述远端语音信号与所述误差语音信号之间的相关功率，计算归一化相关因子，所述归一化相关因子与所述残余回声检测因子结合，以进行所述残余回声的检测。

具体地，比如对于上述第二种情形，还可以包括相关因子计算单元，其用于确定所述远端语音信号的功率与估计的回声语音信号的功率的乘积，根据所述乘积，以及所述远端语音信号与所述估计的回声语音信号之间的相关功率，计算归一化相关因子，所述归一化相关因子与所述残余回声检测因子结合，以进行所述残余回声的检测。

再次，需要说明的是，为了便于区分，针对还第一种情形下的相关因子计算单元又可以称之为第一相关因子计算单元，针对第二种情形下的相关因子计算单元又可以称之为第二相关因子计算单元。当然，第一相关因子计算单元和第二相关因子计算单元也可以复用。

进一步地，在残余回声检测单元根据所述归一化相关因子与所述残余回声检测因子的结合，进行残余回声的检测时，具体可以根据所述归一化相关因子与归一化相关因子门限的比对结果，以及所述残余回声检测因子与残余回声检测因子门限的比对结果，进行残余回声的检测。

进一步地，对应于上述第一种情形，残余回声检测单元可以进一步用于：若处于单端通话状态，则根据所述归一化相关因子生成第二残余回声抑制因子，取所述第一残余回声抑制因子和第二残余回声抑制因子中的最小值作为有效残余回声抑制因子，用于与所述误差语音信号进行乘积运算以消除所述残余回声。

进一步地，对应于上述第二种情形，残余回声检测单元可以进一步用于：若处于单端通话状态，则根据所述归一化相关因子生成第二残余回声抑制因子，取所述第一残余回声抑制因子和第二残余回声抑制因子中的最大值作为有效残余回声抑制因子，用于与所述误差语音信号进行乘积运算以消除所述残余回声。

进一步地，在上述两种情形中，所述第二残余回声抑制因子为一稳定值与各自情形对应的所述归一化因子的差值。

进一步地，优选地，残余回声检测单元可以进一步用于：若处于双端通话状态，则根据先验的估计的回声语音信号功率以及近端语音信号功率生成第三残余回声抑制因子，取所述第一残余回声抑制因子和第三残余回声抑制因子中的最大值作为有效残余回声抑制因子，以消除所述残余回声；或者，若处于双端通话状态，则根据所述归一化相关因子以及所述第一残余回声抑制因子确定有效残余回声抑制因子，用于调整滤波器系数以消除所述残余回声。

进一步地，在使用到有效残余回声抑制因子的实施例中，考虑到避免对语音的损伤，残余回声检测装置还可以包括：修正单元，如果所述归一化相关因子大于归一化相关因子门限的上限，用于减小所述有效残余回声抑制因子以对所述有效残余回声抑制因子进行修正；或者，若所述归一化相关因子小于归一化相关因子门限的下限，用于增大所述有效残余回声抑制因子以对所述有效残余回声抑制因子进行修正。

具体地，在双端通话状态时，优选采用上述抑制因子修正单元对有效残余回声抑制因子进行修正。而在单端通话状态时，可以采用上述修正单元对有效残余回声抑制因子进行修正，也可以不用修正有效残余回声抑制因子。当然，实际上，如果在双端通话状态时不考虑对语音可能造成的损伤，也可以不用修正有效残余回声抑制因子。

类似地，为了避免语音损伤，尤其在双端通话状态，还可以包括检测因子修正单元，根据设定的残余回声检测因子有效门限，确定有效和无效的所述残余回声检测因子，根据有效的所述残余回声检测因子的均值对无效的所述残余回声检测因子进行修正。

在经过上述方案检测出存在残余回声后，具体可以根据如下方案进行残余回声的消除。

方案一：根据所述残余回声抑制因子与所述误差语音信号的乘积，得到残余回声消除后的所述误差语音信号，其执行主体可以为残余回声消除单元。

方案二：根据所述残余回声检测因子，调整自适应滤波器的滤波系数更新步长，根据所述滤波器系数更新步长调整滤波器系数，以消除所述残余回声。调整自适应滤波器的滤波系数更新步长，根据所述滤波器系数更新步长调整滤波器系数的执行主体可以为残余回声消除单元。

而对于上述方案二又可以存在如下三种可能的实现方式：

2.1确定有效的残余回声检测因子的均值以及滤波器系数最大更新步长的乘积，根据滤波器系数最小更新步长以及所述乘积，确定滤波器系数有效更新步长。

2.2确定有效的残余回声检测因子以及滤波器系数最大更新步长的乘积，根据滤波器系数最小更新步长以及所述乘积，确定滤波器系数有效更新步长。

2.3根据残余回声检测因子和步长变换函数，确定滤波器系数有效更新步长。

当然，在此需要说明的是，可以同时单独采取上述方案一或者方案二，也可以采用方案一和方案二结合，以较为彻底消除掉残余回声。

以下本申请的实施例中以此提供实施例说明如何实现残余回声的检测，以及在检测到残余回声后如何进行消除。

下述实施例中，主要以针对上述第一种情形计算残余回声检测因子为基础如何实现残余回声的检测进行说明。同时，由于第二种情形残余回声检测因子为基础实现残余回声的检测出的逻辑与第一种情形下的逻辑相反，因此，穿插在下述实施例中进行简要说明，以使本领域普通技术人员对本申请的技术方案清楚的理解。

图3为本申请实施例一种残余回声检测方法流程示意图；如图3所示，其包括：

S301、确定远端语音信号与误差语音信号之间的相关功率，以及确定所述远端语音信号与近端语音信号之间的相关功率；

本实施例中，若所述远端语音信号为远端语音时域信号，所述误差语音信号为误差语音时域信号，所述近端语音信号为近端语音时域信号，则还包括：在步骤301中首先分别将所述远端语音时域信号、所述误差语音时域信号、所述近端语音时域信号变换到频域得到远端语音频域信号、所述误差语音频域信号、所述近端语音频域信号，再在频域上确定远端语音信号与误差语音信号之间的相关功率，以及确定所述远端语音信号与近端语音信号之间的相关功率。

进一步地，本实施例中，步骤S301中在频域上确定远端语音信号与误差语音信号之间的相关功率，以及确定所述远端语音信号与近端语音信号之间的相关功率时，具体以频点为单位在频域上确定远端语音频域信号与误差语音频域信号的对应频域信号之间的相关功率，以及确定远端语音频域信号与近端语音频域信号的对应频域信号之间的相关功率。

具体地，在一种应用场景中，如前所述，假设远端模拟语音信号记为x(t)，近端模拟语音信号记为y(t)，估计的回声模拟语音信号记为误差模拟语音信号e(t)。这些模拟语音信号经过模数转换后得到远端数字语音信号记为x(n)，近端数字语音信号记为y(n)，估计的回声数字语音信号记为误差数字语音信号记为e(n)。

上述各数字语音信号经过快速傅里叶变化得到远端数字语音信号的第i帧信号的频域信号X＝[X(1),X(2)...X(N)]^T、近端数字语音信号的第i帧信号的频域信号Y＝[Y(1),Y(2)...Y(N)]^T、估计的回声数字语音信号的第i帧信号的频域信号误差数字语音信号的第i帧信号的频域信号E＝[E(1),E(2)...E(N)]^T，N为自适应滤波器的频点数。

上述各相关功率的计算方式如公式(1)所示：

上述公式(1)中，远端数字语音信号中第n帧信号与误差数字语音信号中第n帧信号在第k个频点上的对应频域信号之间的相关功率记为S_xe(k,n)，以及远端数字语音信号中第n帧信号与近端数字语音信号中第n帧信号在第k个频点上对应频域信号之间的相关功率记为S_xy(k,n)，远端数字语音信号中第n-1帧信号与误差数字语音信号中第n-1帧信号在第k个频点上的对应频域信号之间的相关功率记为S_xe(k,n-1)，以及远端数字语音信号中第n-1帧信号与近端数字语音信号中第n-1帧信号在第k个频点上对应频域信号之间的相关功率记为S_xy(k,n-1)，X(k,n)表示远端数字语音信号中第n帧信号在第k个频点上对应频域信号，Y(k,n)表示近端数字语音信号中第n帧信号在第k个频点上对应频域信号，E(k,n)表示误差数字语音信号中第n帧信号在第k个频点上对应频域信号，Y(k，n)^*、E(k，n)^*分别表示Y(k,n)、E(k,n)的共轭，λ为平滑因子，0＜λ＜1，k＝1.........N。

S302、根据远端语音信号与误差语音信号之间的所述相关功率以及所述远端语音信号与近端语音信号之间的所述相关功率，确定残余回声检测因子，以检测是否存在残余回声。

本实施例中，在步骤S302中根据远端语音信号与误差语音信号之间的所述相关功率以及所述远端语音信号与近端语音信号之间的所述相关功率，确定残余回声检测因子时，具体可以根据远端语音信号与误差语音信号之间的所述相关功率与所述远端语音信号与近端语音信号之间的所述相关功率的比值作为所述残余回声检测因子。

具体地，在一应用场景中，具体通过如下公式(2)计算所述残余回声检测因子。

上述公式(2)中，η_xe(k,n)表示所述残余回声检测因子，σ为控制因子，防止公式(2)的分母为零，σ值小于S_xy(k,n)。

进一步地，将所述残余回声检测因子与残余回声检测因子门限进行比对，如果所述残余回声检测因子大于残余回声检测因子门限，则表明存在较多的残余回声，否则表明存在较少或者不存在残余回声。

图4为本申请实施例又一种残余回声检测方法流程示意图；如图4所示，其包括：

S401、确定远端语音信号与估计的回声语音信号之间的相关功率，以及确定所述远端语音信号与近端语音信号之间的相关功率；

表示远端数字语音信号中第n帧信号与估计的回声数字语音信号中第n帧信号在第k个频点上的对应频域信号之间的相关功率，表示远端数字语音信号中第n-1帧信号与估计的回声数字语音信号中第n-1帧信号在第k个频点上的对应频域信号之间的相关功率，X(k,n)表示远端数字语音信号中第n帧信号在第k个频点上对应频域信号，表示估计的回声数字语音信号中第n帧信号在第k个频点上对应频域信号，*表示共轭。

所述远端语音信号与近端语音信号之间的相关功率参见上述公式(1)。

S402、根据远端语音信号与估计的回声语音信号之间的所述相关功率以及所述远端语音信号与近端语音信号之间的所述相关功率，确定残余回声检测因子，以检测是否存在残余回声。

本实施例中，在步骤S402中根据远端语音信号与估计的回声语音信号之间的所述相关功率以及所述远端语音信号与近端语音信号之间的所述相关功率，确定残余回声检测因子时，具体以远端语音信号与估计的回声语音信号之间的所述相关功率与所述远端语音信号与近端语音信号之间的所述相关功率的比值作为残余回声检测因子。

在一具体的应用场景中，参见下述公式(4)计算残余回声检测因子。

上述公式(4)中，表示残余回声检测因子，σ为控制因子，防止公式(4)的分母为零，σ值小于S_xy(k,n)。

进一步地，将按照公式(4)计算得到的所述残余回声检测因子与残余回声检测因子门限进行比对，如果所述残余回声检测因子小于残余回声检测因子门限，则表明存在较多残余回声，否则表明存在较少或者不存在残余回声。

基于公式(4)计算得到的所述残余回声检测因子进行残余回声的检测所使用的残余回声检测因子门限与基于公式(2)计算得到的所述残余回声检测因子进行残余回声的检测所使用的残余回声检测因子门限的大小关系，详细请参见上述图1实施例中的相关说明。

此处，需要说明的是，如前所述，由于从所述近端数字语音信号y(n)中减去估计的回声数字语音信号得到所述误差数字语音信号e(n)，因此，实际上，由于按照公式(2)和按照公式(4)计算得到的两个残余回声检测因子之和从理论来讲大致为1，因此，这两个残余回声检测因子可以互相转换。因此，如果采用公式(4)进行残余回声的检测，则进行残余回声的检测逻辑与用公式(2)进行残余回声的检测逻辑相反，此处检测逻辑具体可以指得到残余回声检测因子之后，跟对应的残余回声检测因子门限进行比对时，是残余回声检测因子大于还是小于对应的残余回声检测因子门限才判定存在较多残余回声，或者表明存在较少或者不存在残余回声的处理过程。

如前所述，如果判定存在较多残余回声，则认定为存在残余回声，则需要执行后续的残余回声消除处理。如果存在较少或者完全不存在残余回声，则可认定不存在残余回声，则不需要执行后续的残余回声消除处理。

图5为本申请实施例再一种残余回声检测方法流程示意图；如图5所示，在图3实施例的基础上，为了进一步提高残余回声检测的准确性以及对残余回声进行简单的定量分析，本实施例中，增加了归一化相关因子的相关步骤，其包括：

S501、确定远端语音信号与误差语音信号之间的相关功率，以及确定所述远端语音信号与近端语音信号之间的相关功率；

S502、根据远端语音信号与误差语音信号之间的所述相关功率以及所述远端语音信号与近端语音信号之间的所述相关功率，确定残余回声检测因子；

本实施例中，步骤S501和步骤S502类似上述图3所述实施例。

S503、确定远端语音信号的功率，以及误差语音信号的功率；

本实施例中，如前所述，是在频域上统计远端语音信号的功率，以及误差语音信号的功率。即远端模拟语音信号、误差模拟语音信号进行模数转换得到远端数字语音信号、误差数字语音信号，再将远端数字语音信号、误差数字语音信号转换到频域。

具体地，在一种应用场景中的具体可参照如下公式(5)计算方法确定远端语音信号的功率，以及误差语音信号的功率。

上述公式(5)中，S_xx(k,n)表示远端数字语音信号中第n帧信号在第k个频点上的对应频域信号的功率，S_xx(k,n-1)表示远端数字语音信号中第n-1帧信号在第k个频点上的对应频域信号的功率，S_ee(k,n)表示误差数字语音信号中第n帧信号在第k个频点上的对应频域信号的功率，S_ee(k,n-1)表示误差数字语音信号中第n-1帧信号在第k个频点上的对应频域信号的功率，X(k,n)表示远端数字语音信号中第n帧信号在第k个频点上对应频域信号，E(k,n)表示误差数字语音信号中第n帧信号在第k个频点上对应频域信号，X(k，n)^**和E(k，n)^*分别表示X(k,n)和E(k,n)的共轭，λ为平滑因子，0＜λ＜1。

在其他实施例中，针对上述第二种情形，估计的回声语音信号的功率按照如下公式(5)’来计算：

公式(5)’中,表示估计的回声数字语音信号中第n帧信号在第k个频点上对应频域信号，表示估计的回声数字语音信号中第n-1帧信号在第k个频点上的对应频域信号的功率，表示的共轭，表示估计的回声数字语音信号中第n帧信号在第k个频点上的对应频域信号的功率。

S504、根据远端语音信号的功率和误差语音信号的功率，确定所述远端语音信号与所述误差语音信号的归一化相关因子；

本实施例中，在一种应用场景中，根据所述远端语音信号与所述误差语音信号之间的相关功率，与所述远端数字语音信号的功率与误差数字语音信号的功率乘积的比值，计算所述归一化相关因子。具体可参照如下公式(6)计算在频域上计算所述归一化相关因子。

在上述公式(6)中，通过计算远端数字语音信号中第n帧信号与误差数字语音信号中第n帧信号在第k个频点上的对应频域信号之间的相关功率S_xe(k,n)，与远端数字语音信号中第n帧信号在第k个频点上的对应频域信号的功率S_xx(k,n)与误差数字语音信号中第n帧信号在第k个频点上的对应频域信号的功率S_ee(k,n)乘积的比值，将该比值作为归一化相关因子，记为C_xe(k,n)，以表示所述远端数字语音信号与所述误差数字语音信号中第n帧信号在第k个频点上的对应频域信号的归一化相关因子。

在其他实施例中，针对上述第二种情形下，参照上述公式(6)确定所述远端语音信号的功率与估计的回声语音信号的功率的乘积，根据所述乘积，以及所述远端语音信号与所述估计的回声语音信号之间的相关功率，计算归一化相关因子，归一化因子具体参照如下公式(6)’计算：

上述公式(6)’中的参数说明参见上述其他实施例。

S505、根据所述归一化相关因子与所述残余回声检测因子，对存在的残余回声进行定量分析。

本实施例中，根据所述归一化相关因子与所述残余回声检测因子，即所述归一化相关因子与所述残余回声检测因子结合，对存在的残余回声进行定量分析，其具体可以根据所述归一化相关因子与归一化相关因子门限的比对结果，以及所述残余回声检测因子与残余回声检测因子门限的比对结果，对存在的残余回声进行定量分析，大致估计出残余回声的多少，此处需要说明的是，残余回声的多少仅是相对概念，根据应用场景可以进行灵活设置，残余回声较多，即可认为存在残余回声，否则，即可认为不存在残余回声。

进一步地，本实施例中，为了进一步提高准确度，步骤S505中根据所述归一化相关因子与所述残余回声检测因子，对存在的残余回声进行定量分析时，首先根据双端通话检测器检测到的通话状态，即处于单端通话状态还是双端通话状态，之后再根据通话状态，利用所述残余回声检测因子，或者，利用所述残余回声检测因子以及所述归一化相关因子，对存在的残余回声进行定量分析。此处，所述残余回声检测因子参照上述公式(2)计算。

在一种应用场景中，如果通话状态为单端通话状态，则直接根据所述残余回声检测因子与残余回声检测因子门限进行比对，如果大于残余回声检测因子门限，则表明存在残余回声，否则，不存在残余回声，此处不存在残余回声可认为是存在较少残余回声，理想情况下可认为不存在残余回声。此处，需要说明的是，在单端通话状态，如果自适应滤波器消除回声的能力比较弱，由此会导致S_xe(k,n)与S_xy(k,n)两者就比较接近，从而使得参照上述公式(2)计算得到所述残余回声检测因子η_xe(k,n)较大，从而大于残余回声检测因子门限，表明残余回声较多。相反地，如果自适应滤波器消除回声的能力比较强，较为彻底的消除了回声，误差语音频域信号E(k)较小，基本趋近于0，计算出的η_xe(k,n)也比较小，从而小于残余回声检测因子门限，表明残余回声较少或者理论上根本不存在残余回声。

在其他实施例中，如果基于上述第二种情形计算残余回声检测因子，小于对应的残余回声检测因子门限，表明残余回声较多。大于对应的残余回声检测因子门限，表明残余回声较少或者理论上根本不存在残余回声。

当然，可替代地，如果是单端通话状态，也可以结合所述归一化相关因子进行残余回声的定量分析。但是，在实际实施中，考虑到残余回声检测的准确度要求不高的话，优选只用残余回声检测因子进行残余回声的定量分析。

在另一种应用场景中，针对上述第一种情形，如果通话状态为双端通话状态，由于此时存在近端说话者的语音信号，如果要避免进行残余回声的消除时误伤近端说话者的语音信号，在进行残余回声的定量分析时，除了要考虑残余回声检测因子，优选还要考虑所述归一化相关因子。

为此，为了提高残余回声检测的准确性，设置了残余回声检测因子门限的上限η_up以及下限η_low，以及归一化相关因子门限的上限C_up以及下限C_low，因此，进行残余回声的定量分析过程如下：

(1)如果η_xe(k,n)大于等于上限η_up，且C_xe(k,n)大于等于上限C_up，则表明残余回声较多；

(2)如果η_xe(k,n)大于等于上限η_up，且C_xe(k,n)小于下限C_low，此时表明残余回声较少；若C_xe(k,n)介于上限C_up和下限C_low之间，则表明存在中等量的残余回声。

(3)如果η_xe(k,n)介于门限η_low与η_up之间，则表明消除了部分回声，但是存在残余回声，进一步根据C_xe(k,n)进行残余回声的定量分析；若C_xe(k,n)大于等于上限C_up，则表明存在较多残余回声；若C_xe(k,n)介于上限C_up和下限C_low之间，则表明存在中等量的残余回声。

(4)如果η_xe(k,n)小于门限η_low，或者C_xe(k,n)小于C_low，则表明存在较少残余回声。

再一种应用场景中，针对上述第二种情形，利用对应的残余回声检测因子门限的上限η_up以及下限η_low，以及归一化相关因子门限的上限C_up以及下限C_low进行残余回声的检测与上述情形相反：

(1)’如果小于下限η_low，且小于下限C_low，则表明残余回声较多；

(2)’如果小于下限η_low，且大于等于上限C_up，此时表明残余回声较少；若介于上限C_up和下限C_low之间，则表明存在中等量的残余回声。

(3)’如果介于下限η_low与上限η_up之间，则表明消除了部分回声，但是存在残余回声，进一步根据进行残余回声的定量分析；若小于下限C_low，则表明存在较多残余回声；若介于上限C_up和下限C_low之间，则表明存在中等量的残余回声。

(4)’如果大于等于上限η_up，或者大于等于上限C_up，则表明存在较少残余回声。

单独采用第一种情形或者第二种情形，各自情形下对应的残余回声检测因子门限的上限η_up以及下限η_low的大小，以及归一化相关因子门限的上限C_up以及下限C_low的大小，根据检测准确度灵活设置。但是，如果要同时使用上述第一种情形或者第二种情形的话，第一种情形下的残余回声检测因子门限的上限η_up以及下限η_low分别对应第二种情形下的残余回声检测因子门限的下限η_low和上限η_up，第一种情形下的归一化相关因子门限的上限C_up以及下限C_low分别对应第二种情形下的归一化相关因子门限的下限C_low和上限C_up。

图6为本申请实施例中残余回声消除方法的流程示意图；再参照上述图3-图5任一实施例确定出存在应消除的残余回声之后，如图6所示，对残余回声进行消除的过程具体包括如下步骤：

S601、判断处于单端通话状态，还是双端通过状态；

S602、若处于单端通话状态，则根据针对单端通话状态下设置的残余回声消除机制进行残余回声的消除；

本实施例中，通话状态的结果来自双端通话检测器。

本实施例中，在一种应用场景中，在步骤S602中进行残余回声的消除时，设置的残余回声消除机制可以为：确定第一残余回声抑制因子。在确定第一残余回声抑制因子时，可以根据所述远端语音信号与误差语音信之间的相关功率、估计的回声语音信号的功率以及残余回声检测因子，确定所述第一残余回声抑制因子。

进一步地，如果对残余回声的消除程度要求不高或者不严格，则直接可以直接可将第一残余回声抑制因子作为有效残余回声抑制因子进行残余回声的消除。但是，如果考虑到要较为彻底的消除掉残余回声，则还可以根据归一化相关因子生成第二残余回声抑制因子，取所述第一残余回声抑制因子和第二残余回声抑制因子中的最小值作为有效残余回声抑制因子，以消除所述残余回声，有效残余回声抑制因子越小，则残余回声消除的力度越大，从而实现根据所述归一化相关因子以及所述第一残余回声抑制因子确定有效残余回声抑制因子，以消除所述残余回声。

具体地，在上述第一种情形时，针对上述单端通话状态时基于有效残余回声抑制因子进行残余回声消除使用的第一残余回声抑制因子和第二残余回声抑制因子可按照如下公式(7)和(8)来计算，而有效残余回声抑制因子可以按照如下公式(9)来计算。

G₁(k，n)＝1-C_xe(k，n)(8)

G′(k，n)＝min(G(k，n)，G₁(k，n))(9)

上述公式(7)中，G(k，n)表示第一残余回声抑制因子；上述公式(8)中，G₁(k，n)表示第二残余回声抑制因子；上述公式(9)中，G′(k，n)表示有效残余回声抑制因子。

参见上述公式(8)，推而广之，所述第二残余回声抑制因子为一稳定值与所述归一化因子的差值。该稳定值理论上等于1，但实际中由于各种其他影响，该稳定值可能大于1。

具体地，在上述第二种情形时，参照公式(7)’即通过根据所述远端语音信号与估计的回声语音信之间的相关功率、所述误差语音信号的功率以及所述残余回声检测因子，确定所述第一残余回声抑制因子，以根据所述第一残余回声抑制因子消除所述残余回声。若处于单端通话状态，则参照公式(8)’根据所述归一化相关因子生成第二残余回声抑制因子，参照公式(9)’取所述第一残余回声抑制因子和第二残余回声抑制因子中的最大值作为有效残余回声抑制因子，用于与所述误差语音信号进行乘积运算以消除所述残余回声。

G′(k，n)＝max(G(k，n)，G₁(k，n))(9)’

在得到有效残余回声抑制因子之后，可以参照如下公式(10)进行残余回声的消除。

上述公式(10)中，E(k，n)表示误差数字语音信号中第n帧信号在第k个频点上对应频域信号，表示经过残余回声消除后的误差数字语音信号中第n帧信号在第k个频点上对应频域信号，即有效残余回声抑制因子与所述误差语音信号进行乘积运算以消除所述残余回声。

本实施例中，在另一种应用场景中，针对单端通话状态的情形，则直接根据残余回声检测因子，调整自适应滤波器的滤波系数，以消除所述残余回声。进一步地，在根据残余回声检测因子，调整自适应滤波器的滤波系数，以消除所述残余回声时，具体根据残余回声检测因子，调整自适应滤波器的滤波系数更新步长，根据所述滤波器系数更新步长调整滤波器系数，以消除所述残余回声。

具体地，根据残余回声检测因子，调整自适应滤波器的滤波系数更新步长，包括：确定有效频点，并根据有效频点筛选有效的残余回声检测因子；计算有效的残余回声检测因子的均值以及滤波器系数最大更新步长的乘积；取所述乘积与滤波器系数的最大更新步长的最大值作为滤波器系数有效更新步长；根据所述滤波器系数有效更新步长更新所述滤波器系数，以消除所述残余回声，此残余回声对应到时域上。

本实施例中，根据人类语音的有效频率范围300-3400Hz筛选有效频点。

具体地，可以根据如下公式(11)去确定滤波器系数有效更新步长。

上述公式(11)中，μ表示有效的残余回声检测因子的均值以及滤波器系数最大更新步长的乘积，μ_max表示滤波器系数最大更新步长；μ_min表示滤波器系数最小更新步长；μ'表示滤波器系数有效更新步长，公式(11)中取最大更新步长可较快的实现滤波器系数的较快更新。

具体地，可以根据如下公式(12)在时域上更新所述滤波器系数。

上述公式(12)中，w(n)表示针对远端数字语音信号第n帧信号的滤波器系数；x(n)表示远端数字语音信号中第n帧信号；e(n)表示误差数字语音信号中第n帧信号；‖x(n)‖²表示远端数字语音信号中第n帧信号的能量。

上述滤波器系数更新步长是在时域上进行确定的。实际上，可替代地，也可以在频域进行滤波器系数有效更新步长的确定，即以频点为单位进行残余回声的消除，具体地，消除所述远端语音时域信号在每个频点上存在的残余回声。在频域上根据残余回声检测因子，以频点为单位调整自适应滤波器的滤波系数更新步长，对于第n帧信号，步长更新步骤包括：确定有效频点，并根据有效频点筛选有效的残余回声检测因子；针对有效频点k，计算有效的残余回声检测因子η(k，n)与滤波器系数最大更新步长μ_max的乘积为新的更新步长μ(k，n)；取计算出的新的步长μ(k，n)与滤波器系数最小更新步长μ_min的最大值作为所述有效频点的滤波器系数有效更新步长μ′(k，n)；根据所述滤波器系数有效更新步长更新所述滤波器系数，以逐一消除所述远端语音时域信号在有效频点上对应频域信号中存在的所述残余回声，此残余回声也是对应到频域上。在一种应用场景中的具体实现可参见下述公式(13)。

或者，针对频域上的情形，得到第k个频点滤波器系数有效更新步长时，具体根据第k个频点残余回声检测因子η(k，n)和选定的步长变换函数f(η(k，n))，确定第k个频点的有效滤波器更新步长，以消除所述远端语音时域信号在第k个频点上对应频域信号中存在的所述残余回声。在一种应用场景中的具体实现可参见下述公式(14)。相对于公式(13)计算滤波器系数有效更新步长的方式，公式(14)计算滤波器系数有效更新步长的方式更加简单，数据计算量较小。

具体地，可以参照如下公式(13)确定针对普遍适用于每一个频点上的滤波器系数有效更新步长。

μ(k，n)＝η(k，n)*μ_max

μ′(k，n)＝max(μ(k，n)，μ_min) (13)

按照公式(14)调整针对每一个频点的滤波器系数有效更新步长。

μ(k，n)＝μ′(k，n-1)+f(η(k，n))μ_step

μ′(k，n)＝max(μ(k，n)，μ_min) (14)

上述公式(13)、(14)中，η(k，n)表示远端数字语音信号中第n帧信号在第k个频点上对应的残余回声检测因子；μ(k，n)表示第n帧信号对应在第k个频点上有效的残余回声检测因子与滤波器系数最大更新步长的乘积；μ’(k，n)表示对应远端数字语音信号中第n帧信号在第k个频点上对应的滤波器系数有效更新步长；f(η(k，n))表示对应远端数字语音信号中第n帧信号在第k个频点上步长变换函数，其实质上是残余回声检测因子的函数，根据应用场景灵活设置，f(η(k，n))具体的数值可以为正数，也可以为负数，主要是为了满足应用场景的需要在更新步长时是减小还是增加；μ_step为每次步长的调节的步进，μ′(k，n-1)表示对应远端数字语音信号中第n-1帧信号在第k个频点上对应的滤波器系数有效更新步长，在公式(14)中取第k个频点新计算的步长μ(k，n)与滤波器系数最小更新步长μ_min的最小值中的最大值最为有效滤波器更新步长。

具体地，可以根据如下公式(15)在频域上更新所述滤波器系数。

w_n+1(k)表示针对远端数字语音信号中第n+1帧信号在第k个频点上对应频域信号的滤波器系数；w_n(k)表示针对远端数字语音信号中第n帧信号在第k个频点上对应频域信号的滤波器系数；||X(k，n)||²表示远端数字语音信号中第n帧信号在第k个频点上对应频域信号的能量；δ表示控制因子；X^*(k，n)表示远端数字语音信号中第n帧信号在第k个频点上对应频域信号的共轭；E(k，n)表示误差语音时域信号中第n帧信号在第k个频点上对应频域信号。

S603、若处于双端通话状态，则根据针对双端通话状态下设置的残余回声消除机制进行残余回声的消除。

本实施例中，本实施例中，在一种应用场景中，在步骤S602中进行残余回声的消除时已确定出所述第一残余回声抑制因子。因此，进一步地，针对双端通话状态下设置的残余回声消除机制为：根据估计的回声语音信号功率以及近端语音信号功率生成第三残余回声抑制因子，取所述第一残余回声抑制因子和第三残余回声抑制因子中的最大值作为有效残余回声抑制因子，并参照上述公式(10)消除所述残余回声。如前所述，取最大值的原因在于，由于有效残余回声抑制因子越大，残余回声消除的力度越大，当处于双端通话状态时，残余回声消除的力度越大，为了尽可能地消除掉残余回声又不会造成语音的误伤，为此，此处取最大值。

此处，在一具体的应用场景中，可以通过测试得到一个先验的估计的回声语音信号，并计算先验的估计的回声语音信号的功率，进一步与近端语音信号功率一起生成第三残余回声抑制因子，此处，如前所述，是在频域上计算先验的估计的回声语音信号的功率以及近端语音信号功率。

具体地，可参照如下公式(16)计算先验的估计的回声语音信号的功率以及近端语音信号功率，参照公式(17)计算第三残余回声抑制因子。

表示先验的估计回声数字语音信号中第n帧信号在第k个频点上对应频域信号的功率，表示先验的估计回声数字语音信号中第n-1帧信号在第k个频点上对应频域信号的功率，表示先验的估计回声数字语音信号中第n帧信号在第k个频点上对应频域信号，表示先验的估计回声数字语音信号中第n帧信号在第k个频点上对应频域信号的共轭；S_yy(k，n)表示近端数字语音信号中第n帧信号在第k个频点上对应频域信号的功率，S_yy(k，n-1)表示近端数字语音信号中第n-1帧信号在第k个频点上对应频域信号的功率；Y(k，n)表示近端数字语音信号中第n帧信号在第k个频点上对应频域信号，Y(k，n)^*表示近端数字语音信号中第n帧信号在第k个频点上对应频域信号的共轭。G₂(k，n)表示第三残余回声抑制因子，β表示控制因子，第三残余回声抑制因子的计算方式详细参见公式(17)。

另外，实际上也可以根据后验的估计回声数字语音信号中第n帧信号在第k个频点上对应频域信号的功率，后验的估计回声数字语音信号中第n-1帧信号在第k个频点上对应频域信号的功率，后验的估计回声数字语音信号中第n帧信号在第k个频点上对应频域信号，后验的估计回声数字语音信号中第n帧信号在第k个频点上对应频域信号的共轭来进行残余回声的检测。但是，相对来说，因为先验的估计回声数字语音信号中第n帧信号在第k个频点上对应频域信号的功率比较准确，因此，优选先验的估计回声数字语音信号中第n-1帧信号在第k个频点上对应频域信号的功率代入到上述公式(16)。

取所述第一残余回声抑制因子和第三残余回声抑制因子中的最大值作为有效残余回声抑制因子的具体计算方式如公式(18)所示。

G′(k，n)＝max(G(k，n)，G₂(k，n))(18)

上述公式(18)中，G(k,n)表示第一残余回声抑制因子，G₂(k,n)表示第三残余回声抑制因子，G'(k,n)表示有效残余回声抑制因子。

在得到针对双端通话状态时的有效残余回声抑制因子之后，参照上述公式(10)进行残余回声的消除。

优选地，如果所述归一化相关因子大于归一化相关因子门限的上限，则减小所述有效残余回声抑制因子以对所述有效残余回声抑制因子进行修正；或者，若所述归一化相关因子小于归一化相关因子门限的下限，则增大所述有效残余回声抑制因子以对所述有效残余回声抑制因子进行修正。比如针对双端通话状态时，可能会出现C_xe(k,n)大于等于上限C_up，或者，可能会出现C_xe(k,n)小于下限C_low。实际上如果C_xe(k,n)＞C_up，说明近端语音信号中第n帧信号在第k个频点上对应频域信号中残余回声较多，换句话说，是近端说话者语音信号的概率较小，因此，可以将近端语音信号中第n帧信号在第k个频点上对应频域信号设置的有效残余回声抑制因子G(k,n)稍微减小即实现修正；若C_xe(k,n)＜C_low，说明近端语音信号中第n帧信号在第k个频点上对应频域信号中残余回声较少，换句话说，是近端说话者语音信号的概率较小，为了减小语音损失的同时尽可能彻底的消除残余回声，将近端语音信号中第n帧信号在第k个频点上对应频域信号设置的有效残余回声抑制因子G'(k,n)稍微增大即实现修正。

在上述实施例中，还可以根据设定的残余回声检测因子有效门限，确定有效和无效的所述残余回声检测因子，根据有效的所述残余回声检测因子的均值对无效的所述残余回声检测因子进行修正。具体实施时，如果计算到的残余回声检测因子大于残余回声检测因子有效门限，对应频点的残余回声检测因子则无效，否则，对应频点的残余回声检测因子则有效。则优选对无效的残余回声检测因子进行修正。比如用有效的所述残余回声检测因子的均值代替无效的残余回声检测因子。或者更为直接地，对无效的残余回声检测因子不做任何处理，从而在残余回声消除处理上，直接忽略无效的残余回声检测因子对应的频点。

另外，在具体判断残余回声检测因子的无效或者有效时，如前所述，可以根据上述公式(2)和(4)计算得到的残余回声检测因子加和值来判断，在理论上这两个检测因子的加和值为1，但是在实际产品上，考虑到其他各种因素的影响这两个检测因子的结合值实际可能大于1，但基本上处于一个稳定值，为此，在实际中，如果上述公式(2)和(4)计算得到两个残余回声检测因子的加和值大于该稳定值，则表明对应频点处的残余回声检测因子无效，相反，表明对应频点处的残余回声检测因子有效。在对按照上述公式(2)计算得到的有效的残余回声检测因子求均值以代替无效的残余回声检测因子。

在具体实施时，可以将上述残余回声检测装置集成到语音处理芯片上。

本申请实施例提供一种电子设备，其包括本申请任一实施例所述的语音处理芯片。

本申请实施例的电子设备以多种形式存在，包括但不限于:

(1)移动通信设备:这类设备的特点是具备移动通信功能，并且以提供话音、数据通信为主要目标。这类终端包括:智能手机(例如iPhone)、多媒体手机、功能性手机，以及低端手机等。

(2)超移动个人计算机设备:这类设备属于个人计算机的范畴，有计算和处理功能，一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC设备等，例如iPad。

(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放器(例如iPod)，掌上游戏机，电子书，以及智能玩具和便携式车载导航设备。

(4)服务器:提供计算服务的设备，服务器的构成包括处理器810、硬盘、内存、***总线等，服务器和通用的计算机架构类似，但是由于需要提供高可靠的服务，因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。

(5)其他具有数据交互功能的电子装置。

至此，已经对本主题的特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作可以按照不同的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序，以实现期望的结果。在某些实施方式中，多任务处理和并行处理可以是有利的。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白，本申请的实施例可提供为方法、***、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括：但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本申请的实施例可提供为方法、***或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定事务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行事务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于***实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

Claims

1.一种残余回声检测方法，其特征在于，包括：

根据所述残余回声检测因子，检测是否存在残余回声。

2.根据权利要求1所述的方法，其特征在于，所述根据远端语音信号与近端语音信号之间的相关功率，确定残余回声检测因子，包括：根据所述远端语音信号与估计的回声语音信号之间的相关功率以及所述远端语音信号与近端语音信号之间的所述相关功率，确定所述残余回声检测因子。

3.根据权利要求1所述的方法，其特征在于，所述根据远端语音信号与近端语音信号之间的相关功率，确定残余回声检测因子，包括：根据所述远端语音信号与误差语音信号之间的相关功率以及所述远端语音信号与近端语音信号之间的所述相关功率，确定残余回声检测因子。

4.根据权利要求2所述的方法，其特征在于，根据所述远端语音信号与估计的回声语音信号之间的所述相关功率以及所述远端语音信号与近端语音信号之间的所述相关功率，确定所述残余回声检测因子，包括：确定所述远端语音信号与估计的回声语音信号之间的所述相关功率与所述远端语音信号与近端语音信号之间的所述相关功率的比值为所述残余回声检测因子。

5.根据权利要求3所述的方法，其特征在于，所述根据远端语音信号与误差语音信号之间的所述相关功率以及所述远端语音信号与近端语音信号之间的所述相关功率，确定残余回声检测因子，包括：确定所述远端语音信号与所述误差语音信号之间的所述相关功率与所述远端语音信号与近端语音信号之间的所述相关功率的比值为所述残余回声检测因子。

6.根据权利要求2所述的方法，其特征在于，所述检测是否存在残余回声，包括：若所述残余回声检测因子小于残余回声检测因子门限，则判定存在残余回声，否则判定不存在残余回声。

7.根据权利要求3所述的方法，其特征在于，所述检测是否存在残余回声，包括：若所述残余回声检测因子大于残余回声检测因子门限，则判定存在残余回声，否则判定不存在残余回声。

8.根据权利要求2所述的方法，其特征在于，还包括：确定所述远端语音信号的功率与估计的回声语音信号的功率的乘积，根据所述乘积，以及所述远端语音信号与所述估计的回声语音信号之间的相关功率，计算归一化相关因子，所述归一化相关因子与所述残余回声检测因子结合，以进行所述残余回声的检测。

9.根据权利要求3所述的方法，其特征在于，还包括：确定所述远端语音信号的功率与误差语音信号的功率的乘积，根据所述乘积，以及所述远端语音信号与所述误差语音信号之间的相关功率，计算归一化相关因子，所述归一化相关因子与所述残余回声检测因子结合，以进行所述残余回声的检测。

10.根据权利要求6或7所述的方法，其特征在于，所述归一化相关因子与所述残余回声检测因子结合，以进行残余回声的检测，包括：根据所述归一化相关因子与归一化相关因子门限的比对结果，以及所述残余回声检测因子与残余回声检测因子门限的比对结果，进行残余回声的检测。

11.根据权利要求10所述的方法，其特征在于，还包括：根据所述远端语音信号与误差语音信之间的相关功率、所述估计的回声语音信号的功率以及所述残余回声检测因子，确定所述第一残余回声抑制因子，以根据所述第一残余回声抑制因子消除所述残余回声。

12.根据权利要求10所述的方法，其特征在于，还包括：根据所述远端语音信号与估计的回声语音信之间的相关功率、所述误差语音信号的功率以及所述残余回声检测因子，确定所述第一残余回声抑制因子，以根据所述第一残余回声抑制因子消除所述残余回声。

13.根据权利要求12所述的方法，其特征在于，根据所述第一残余回声抑制因子消除所述残余回声，包括：若处于单端通话状态，则根据所述归一化相关因子生成第二残余回声抑制因子，取所述第一残余回声抑制因子和第二残余回声抑制因子中的最大值作为有效残余回声抑制因子，用于与所述误差语音信号进行乘积运算以消除所述残余回声。

14.根据权利要求11所述的方法，其特征在于，根据所述第一残余回声抑制因子消除所述残余回声，包括：若处于单端通话状态，则根据所述归一化相关因子生成第二残余回声抑制因子，取所述第一残余回声抑制因子和第二残余回声抑制因子中的最小值作为有效残余回声抑制因子，用于与所述误差语音信号进行乘积运算以消除所述残余回声。

15.根据权利要求13或者14所述的方法，其特征在于，所述第二残余回声抑制因子为一稳定值与所述归一化因子的差值。

16.根据权利要求11所述的方法，其特征在于，根据所述第一残余回声抑制因子消除所述残余回声，包括：若处于双端通话状态，则根据先验的估计的回声语音信号功率以及近端语音信号功率生成第三残余回声抑制因子，取所述第一残余回声抑制因子和第三残余回声抑制因子中的最大值作为有效残余回声抑制因子，以消除所述残余回声。

17.根据权利要求11或12所述的方法，其特征在于，根据所述第一残余回声抑制因子消除所述残余回声，包括：根据所述归一化相关因子以及所述第一残余回声抑制因子确定有效残余回声抑制因子，以消除所述残余回声。

18.根据权利要求13-17中任一项所述的方法，其特征在于，还包括：如果所述归一化相关因子大于归一化相关因子门限的上限，则减小所述有效残余回声抑制因子以对所述有效残余回声抑制因子进行修正；或者，若所述归一化相关因子小于归一化相关因子门限的下限，则增大所述有效残余回声抑制因子以对所述有效残余回声抑制因子进行修正。

19.根据权利要求1-18中任一项所述的方法，其特征在于，还包括：根据设定的残余回声检测因子有效门限，确定有效和无效的所述残余回声检测因子，根据有效的所述残余回声检测因子的均值对无效的所述残余回声检测因子进行修正。

20.根据权利要求13-18中任一项所述的方法，其特征在于，还包括：所述有效残余回声抑制因子与所述误差语音信号进行乘积运算，以消除所述残余回声。

21.根据权利要求1-20中任一项所述的方法，其特征在于，还包括：根据所述残余回声检测因子，调整自适应滤波器的滤波系数，以消除所述残余回声。

22.根据权利要求21所述的方法，其特征在于，根据所述残余回声检测因子，调整自适应滤波器的滤波系数，以消除所述残余回声，包括：根据所述残余回声检测因子，调整自适应滤波器的滤波系数更新步长，根据所述滤波器系数更新步长调整滤波器系数，以消除所述残余回声。

23.根据权利要求22所述的方法，其特征在于，根据所述残余回声检测因子，调整自适应滤波器的滤波系数更新步长，包括：确定有效的残余回声检测因子的均值以及滤波器系数最大更新步长的乘积，根据滤波器系数最小更新步长以及所述乘积，确定滤波器系数有效更新步长。

24.根据权利要求22所述的方法，其特征在于，根据所述残余回声检测因子，调整自适应滤波器的滤波系数更新步长，包括：确定有效的残余回声检测因子以及滤波器系数最大更新步长的乘积，根据滤波器系数最小更新步长以及所述乘积，确定滤波器系数有效更新步长。

25.根据权利要求22所述的方法，其特征在于，根据所述残余回声检测因子，调整自适应滤波器的滤波系数更新步长，包括：根据残余回声检测因子和步长变换函数，确定滤波器系数有效更新步长。

26.一种残余回声检测装置，其特征在于，包括：

27.一种语音处理芯片，其特征在于，包括：残余回声检测装置，所述残余回声检测装置包括：检测因子计算单元，用于根据远端语音信号与近端语音信号之间的相关功率，确定残余回声检测因子；残余回声检测单元，用于根据所述残余回声检测因子，检测是否存在残余回声。

28.一种电子设备，其特征在于，包括权利要求27所述的语音处理芯片。