CN108234793B

CN108234793B - 一种通讯方法、装置、电子设备和存储介质

Info

Publication number: CN108234793B
Application number: CN201711489581.XA
Authority: CN
Inventors: 周业恒
Original assignee: Beijing Vision World Technology Co ltd
Current assignee: Beijing Vision World Technology Co ltd
Priority date: 2017-12-29
Filing date: 2017-12-29
Publication date: 2021-11-30
Anticipated expiration: 2037-12-29
Also published as: CN108234793A

Abstract

本发明公开了一种通讯方法和装置。所述方法包括：接收第一端音频，采集第二端音频，所述第二端音频中混有所述第一端音频的回声，确定所述第一端音频中与所述第二端音频匹配的目标音频，根据所述目标音频，消除所述第二端音频中的回声，生成回声消除音频，将所述回声消除音频发送至所述第一端。上述方法中通过匹配，动态确定进行回声消除时参考的目标音频，不必针对各个设备机型来做配置，避免了静态配置参数导致回声消除效果不稳定的问题，减少了适配各种新设备所耗费大量测试时间，降低了适配成本。

Description

一种通讯方法、装置、电子设备和存储介质

技术领域

本发明涉及通讯技术领域，具体涉及一种通讯方法，一种通讯装置、一种电子设备和一种计算机可读存储介质。

背景技术

双向语音通话会产生声学回音，是由于在免提或者会议应用中，扬声器的声音多次反馈到麦克风引起的。

第一终端用户的语音信号传到第二终端所在的房间，由于空间的反射，形成回音重新从第二终端的麦克风输入，同时叠加了第二终端用户的语音信号。此时第一终端将会播放第二终端用户的声音叠加了第一终端用户自己的声音，影响了正常的通话质量。

针对声学回音的回声消除技术叫做声学回声消除(Acoustic EchoCancellation，AEC)，传统的AEC算法依赖于通话的两端的硬件特性，需要针对各个设备机型来做配置，效果不稳定，而且新的设备层出不穷，适配各种新设备，耗费大量测试时间，成本很高。

发明内容

鉴于上述问题，提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的通讯方法，通讯装置、电子设备和计算机可读存储介质。

依据本发明的一个方面，提供了一种通讯方法，应用在与第一端进行语音通讯的第二端，所述方法包括：

接收第一端音频；

采集第二端音频，所述第二端音频中混有所述第一端音频的回声；

确定所述第一端音频中与所述第二端音频匹配的目标音频；

根据所述目标音频，消除所述第二端音频中的回声，生成回声消除音频；

将所述回声消除音频发送至所述第一端。

可选地，在所述确定所述第一端音频中与所述第二端音频匹配的目标音频之前，所述方法还包括：

将所述第二端音频拆分为预设时间长度的多个第二子音频；

所述确定所述第一端音频中与所述第二端音频匹配的目标音频包括：

分别在所述第一端音频中查找与所述第二子音频匹配的第一子音频，作为与所述第二端音频的匹配的目标音频。

可选地，所述确定所述第一端音频中与所述第二端音频匹配的目标音频包括：

提取所述第一端音频和第二端音频的频谱特征；

确定所述预设时间长度的频谱特征的相似度；

将所述第一端音频中与所述第二端音频的相似度满足预设匹配要求的第一子音频确定为所述目标音频。

可选地，所述确定所述第一端音频中与所述第二端音频匹配的目标音频还包括：

从前次确定的目标音频的结束位置开始查找本次目标音频。

若本次未查找到目标音频，则以前次确定的目标音频的结束位置为本次查找的目标音频的起始位置。

可选地，在所述将所述回声消除音频发送至所述第一端之前，所述方法还包括：

在所述回声消除音频中消除异常音频。

可选地，所述在所述回声消除音频中消除异常音频包括：

在所述回声消除音频中查找频谱特征值高于/低于预设阈值的异常音频；

调整所述异常音频的频谱特征值。

根据本发明的另一方面，提供了一种通讯装置，应用在与第一端进行语音通讯的第二端，所述装置包括：

音频接收模块，用于接收第一端音频；

音频采集模块，用于采集第二端音频，所述第二端音频中混有所述第一端音频的回声；

音频确定模块，用于确定所述第一端音频中与所述第二端音频匹配的目标音频；

回声消除模块，用于根据所述目标音频，消除所述第二端音频中的回声，生成回声消除音频；

音频发送模块，用于将所述回声消除音频发送至所述第一端。

可选地，所述装置还包括：

音频拆分模块，用于在所述确定所述第一端音频中与所述第二端音频匹配的目标音频之前，将所述第二端音频拆分为预设时间长度的多个第二子音频；

所述音频确定模块包括：

音频查找子模块，用于分别在所述第一端音频中查找与所述第二子音频匹配的第一子音频，作为与所述第二端音频的匹配的目标音频。

可选地，所述音频确定模块包括：

特征提取子模块，用于提取所述第一端音频和第二端音频的频谱特征；

相似度确定子模块，用于确定所述预设时间长度的频谱特征的相似度；

音频确定子模块，用于将所述第一端音频中与所述第二端音频的相似度满足预设匹配要求的第一子音频确定为所述目标音频。

可选地，所述音频确定模块还包括：

音频查找子模块，用于从前次确定的目标音频的结束位置开始查找本次目标音频。

可选地，所述音频确定模块还包括：

位置确定子模块，用于若本次未查找到目标音频，则以前次确定的目标音频的结束位置为本次查找的目标音频的起始位置。

可选地，所述装置还包括：

异常消除模块，用于在所述回声消除音频中消除异常音频。

可选地，所述异常消除模块包括：

异常音频查找模块，用于在所述回声消除音频中查找频谱特征值高于/低于预设阈值的异常音频；

特征值调整模块，用于调整所述异常音频的频谱特征值。

根据本发明的另一方面，提供了一种电子设备，包括：处理器；以及被配置为存储计算机可执行指令的存储器，所述可执行指令在被执行时使所述电子设备执行根据上述的通讯方法。

根据本发明的另一方面，提供了一种计算机可读存储介质，所述计算机可读存储介质存储一个或多个程序，所述一个或多个程序当被电子设备执行时，使得所述电子设备执行根据上述的通讯方法。

根据本发明的一种通讯方法和相应的装置，通过接收第一端音频，采集第二端音频，所述第二端音频中混有所述第一端音频的回声，确定所述第一端音频中与所述第二端音频匹配的目标音频，根据所述目标音频，消除所述第二端音频中的回声，生成回声消除音频，将所述回声消除音频发送至所述第一端。上述方法中通过匹配，动态确定进行回声消除时参考的目标音频，不必针对各个设备机型来做配置，避免了静态配置参数导致回声消除效果不稳定的问题，减少了适配各种新设备所耗费大量测试时间，降低了适配成本。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1示出了根据本发明实施例一的通讯方法的步骤流程示意图；

图2示出了根据本发明实施例二的通讯方法的步骤流程示意图；

图3示出了根据本发明实施例三的通讯装置的示意性结构框图；

图4示意性地示出了用于执行根据本发明的计算设备的框图；以及

图5示意性地示出了用于保持或者携带实现根据本发明的程序代码的存储单元。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

本发明实施例所使用的终端可以包括各种形式，例如手机、平板、笔记本、可穿戴设备、智能摄像机等。将进行语音通讯的两个终端，记为第一端和第二端。

参照图1，示出了根据本发明实施例一的通讯方法的步骤流程示意图，应用在与第一端进行语音通讯的第二端，具体可以包括如下步骤：

步骤101，接收第一端音频。

在本发明实施例中，第一端音频是指从通讯的第一端传输来的音频信号，由第一端的麦克风采集，经通讯线路传输到第二端，并由第二端的扬声器播放出来。

步骤102，采集第二端音频。

在本发明实施例中，第二端音频是指由第二端的麦克风采集的音频信号。

由于第二端的扬声器将第一端音频播放后生成回声，回声会被第二端的麦克风采集到，因此第二端音频中混有第一端音频的回声。

步骤103，确定所述第一端音频中与所述第二端音频匹配的目标音频。

在本发明实施例中，第二端音频中混合的回声与第一端音频不完全相同，存在差异，但高度相关。要从一段第二端音频中消除回声，首先需要确定与这一段第二端音频中的回声对应的一段第一端音频，记为目标音频。

在本发明实施例中，由于设备的硬件特征不同、所处的网络环境不同等原因，导致第一端音频和采集到对应回声的时间差也是会变化的，以固定时间差确定目标音频对回声消除的效果无法保障。对第一端音频与第二端音频进行相似度比较，确定与第二端音频相似度满足设定要求的第一端音频，记为目标音频。

例如，针对15毫秒时长的第二端音频，在第一端音频中查找与该15毫秒时长的第二端音频的相似度满足设定要求的音频，作为目标音频。设定要求可以根据实际需要调试，具体可以包括任意适用的设定要求，本发明实施例对此不做限制。

步骤104，根据所述目标音频，消除所述第二端音频中的回声，生成回声消除音频。

在本发明实施例中，目标音频与第二端音频中第一端音频的回声不完全相同，但高度相关。将目标音频经过某种特定函数(该函数称为回音路径函数)滤波后，与第二端音频相减，就可以实现回声的消除。

在本发明实施例中，根据目标音频消除第二端音频中的回声可以采用自适应滤波器，其中该滤波器是随第一端音频和第二端音频的特征进行自适应调整的。自适应滤波器是将第一端音频和第二端音频的统计特性的估计为依据，采用某种特定的算法自动地进行滤波器系数的调整，使其达到最佳滤波特性的一种算法。

在本发明实施例中，将从第二端音频中消除回声得到的音频，记为回声消除音频。

步骤105，将所述回声消除音频发送至所述第一端。

根据本发明的上述通讯方法，通过接收第一端音频，采集第二端音频，所述第二端音频中混有所述第一端音频的回声，确定所述第一端音频中与所述第二端音频匹配的目标音频，根据所述目标音频，消除所述第二端音频中的回声，生成回声消除音频，将所述回声消除音频发送至所述第一端。上述方法中通过匹配，动态确定进行回声消除时参考的目标音频，不必针对各个设备机型来做配置，避免了静态配置参数导致回声消除效果不稳定的问题，减少了适配各种新设备所耗费大量测试时间，降低了适配成本。

在本发明实施例中，优选地，在确定所述第一端音频中与所述第二端音频匹配的目标音频之前，还可以包括：将所述第二端音频拆分为预设时间长度的多个第二子音频；确定所述第一端音频中与所述第二端音频匹配的目标音频的一种实现方式可以包括：分别在所述第一端音频中查找与所述第二子音频匹配的第一子音频，作为与所述第二端音频的匹配的目标音频。

确定目标音频时可以分段进行匹配，拆分第二端音频的预设时间长度可以根据实际需要设定任意适用的时长，本发明实施例对此不做限制。将第二端子音频拆分为多个第二子音频后，分别针对各个第二子音频，在第一端音频中查找匹配的第一子音频，作为与第二端音频的匹配的目标音频。

在本发明实施例中，优选地，在所述将所述回声消除音频发送至所述第一端之前，还可以包括：在所述回声消除音频中消除异常音频。

异常音频包括爆音、吞字等现象对应的音频，具体是指音频中出现异常的高于前后音频的音频、或者音频中出现被抑制的异常低于前后音频的音频，或者其他任意适用的异常音频，本发明实施例对此不做限制。

对异常音频进行调整，以消除掉异常音频，例如，调低或调高异常音频的功率等。

在本发明实施例中，优选地，所述在所述回声消除音频中消除异常音频包括：在所述回声消除音频中查找频谱特征值高于/低于预设阈值的异常音频；调整所述异常音频的频谱特征值。

频谱是频率谱密度的简称，是频率的分布曲线。复杂振荡分解为振幅不同和频率不同的谐振荡，这些谐振荡的幅值按频率排列的图形叫做频谱。

频谱特征包括将复杂的时间历程波形，经过傅里叶变换分解为若干单一的谐波分量，通过频率分析得到的振幅谱、相位谱、功率谱等的特征，用于反映不同信号之间的差异。例如，音色、音高、Mfcc(Mel-frequency cepstral coefficients，梅尔频率倒谱系数)、特征弧度、频谱能量等频谱特征。频谱特征可以包括多个频率区间上的信号大小，并且可以表示为数据序列。

频谱特征值为用于反映频谱特征的大小。在回声消除音频中查找音频特征值高于/低于预设阈值的异常音频，例如，振幅高于预设振幅阈值、或者功率高于预设功率阈值等，预设阈值可以根据实际需要调试得到，本发明实施例对此不做限制。对于异常音频进行调整，将异常音频的频谱特征值调整为正常的频谱特征值，以消除掉经过回声消除后音频中出现的音量过高的爆音等。

参照图2，示出了根据本发明实施例二的通讯方法的步骤流程示意图，应用在与第一端进行语音通讯的第二端，具体可以包括如下步骤：

步骤201，接收第一端音频。

在本发明实施例中，此步骤的具体实现方式可以参见前述实施例中的描述，本发明实施例对此不做限制。

步骤202，采集第二端音频。

步骤203，提取所述第一端音频和第二端音频的频谱特征。

在本发明实施例中，将第一端音频和第二端音频经过傅里叶变换分解为若干单一的谐波分量，通过频率分析得到的频谱特征。频谱特征可以包括多个频率区间上的信号大小，并且可以表示为数据序列。

步骤204，确定所述预设时间长度的频谱特征的相似度。

在本发明实施例中，通过比较预设时间长度的第二端音频的频谱特征，与预设时间长度的第一端音频的频谱特征，得到频谱特征的相似度。由于频谱特征可以表示为数据序列，利用计算数据序列的相似度的方法就可以得到频谱特征的相似度，具体可以包括任意适用的方法，本发明实施例对此不做限制。

针对每一段预设时间长度的第二端音频，从比该第二端音频早设定时间的第一端音频为基准开始计算相似度，执行步骤205，如果第一端音频与第二端音频的相似度不满足预设匹配要求，则按照设定步长，在基准两侧重新取一段预设时间长度的第一端音频的频谱特征，计算相似度，执行步骤205，直至取的第一子音频与预设时间长度的第二端音频的相似度满足预设匹配要求。预设匹配要求可以根据调试情况确定，具体可以包括任意适用的匹配要求，本发明实施例对此不做限制。例如，相似度高于预设的相似度阈值。

示例性地，针对当前待发送的第二端音频，取预设时间长度15毫秒的第二端音频，得到第二端音频的频谱特征，以50毫秒前接收的第一端音频为基准，取15毫秒的第一端音频，得到第一端音频的频谱特征，计算频谱特征的相似度，如果相似度无法满足预设匹配要求，则以75字节为步长，在第一端音频的基准之后75字节处为起始，取15毫秒的第一端音频，得到第一端音频的频谱特征，计算频谱特征的相似度，如果相似度仍然无法满足预设匹配要求，在在第一端音频的基准之前75字节处为起始，取15毫秒的第一端音频，得到第一端音频的频谱特征，计算频谱特征的相似度，依次75字节的步长不断取第一端音频，直至相似度满足预设匹配要求。

步骤205，将所述第一端音频中与所述第二端音频的相似度满足预设匹配要求的第一子音频确定为所述目标音频。

在本发明实施例中，优选地，确定所述第一端音频中与所述第二端音频匹配的目标音频的一种实现方式中还包括：从前次确定的目标音频的结束位置开始查找本次目标音频。

前次确定的目标音频是针对上一段预设时间长度的第二端音频的，本次针对后续的一段预设时间长度的第二端音频查找本次目标音频，可以从前次确定的目标音频的结束位置作为基准，开始查找本次目标音频，由于如果硬件特征没有发生变化，网络环境也没有发生变化，很可能本次目标音频的开始位置就是前次确定的目标音频的结束位置，而且如果发生的变化很小，也会很快查找到目标音频，所以可以节约查找时间，提高确定目标音频的效率。

在本发明实施例中，优选地，确定所述第一端音频中与所述第二端音频匹配的目标音频的一种实现方式中还包括：若本次未查找到目标音频，则以前次确定的目标音频的结束位置为本次查找的目标音频的起始位置。

如果无法查找到满足预设匹配要求的第一子音频，作为目标音频，就以前次确定的目标音频的结束位置为本次查找的目标音频的起始位置，取预设时间长度的第一端音频，作为本次目标音频。由于回声有时可能与第一端音频差异较大，对应的第二端音频和第一端音频的频谱特征的相似度无法满足预设匹配要求，可以直接取前次确定的目标音频的结束位置为本次查找的目标音频的起始位置，如果硬件特征没有发生变化，网络环境也没有发生变化，则定位的本次目标音频仍然很大可能是准确的，避免无法及时进行回声消除的问题。

步骤206，根据所述目标音频，消除所述第二端音频中的回声，生成回声消除音频。

步骤207，将所述回声消除音频发送至所述第一端。

根据本发明的上述通讯方法，通过接收第一端音频，采集第二端音频，提取所述第一端音频和第二端音频的频谱特征，确定所述预设时间长度的频谱特征的相似度，将所述第一端音频中与所述第二端音频的相似度满足预设匹配要求的第一子音频确定为所述目标音频，根据所述目标音频，消除所述第二端音频中的回声，生成回声消除音频，将所述回声消除音频发送至所述第一端。上述方法中通过匹配，动态确定进行回声消除时参考的目标音频，不必针对各个设备机型来做配置，避免了静态配置参数导致回声消除效果不稳定的问题，减少了适配各种新设备所耗费大量测试时间，降低了适配成本。

参照图3，示出了根据本发明实施例三的通讯装置的示意性结构框图，应用在与第一端进行语音通讯的第二端，具体可以包括如下模块：

音频接收模块301，用于接收第一端音频；

音频采集模块302，用于采集第二端音频，所述第二端音频中混有所述第一端音频的回声；

音频确定模块303，用于确定所述第一端音频中与所述第二端音频匹配的目标音频；

回声消除模块304，用于根据所述目标音频，消除所述第二端音频中的回声，生成回声消除音频；

音频发送模块305，用于将所述回声消除音频发送至所述第一端。

在本发明实施例中，优选地，所述装置还包括：

所述音频确定模块包括：

在本发明实施例中，优选地，所述音频确定模块包括：

在本发明实施例中，优选地，所述音频确定模块还包括：

在本发明实施例中，优选地，所述装置还包括：

异常消除模块，用于在所述回声消除音频中消除异常音频。

在本发明实施例中，优选地，所述异常消除模块包括：

特征值调整模块，用于调整所述异常音频的频谱特征值。

在此提供的算法和显示不与任何特定计算机、虚拟***或者其它设备固有相关。各种通用***也可以与基于在此的示教一起使用。根据上面的描述，构造这类***所要求的结构是显而易见的。此外，本发明也不针对任何特定编程语言。应当明白，可以利用各种编程语言实现在此描述的本发明的内容，并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本公开并帮助理解各个发明方面中的一个或多个，在上面对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如下面的权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在下面的权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的通讯方法和装置的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如，计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

本发明实施例提供了一种电子设备，包括处理器；以及被配置为存储计算机可执行指令的存储器，可执行指令在被执行时使所述电子装置执行根据上文任意实施例的通讯方法。

本发明实施例还提供了一种计算机存可读储介质，其中，计算机可读存储介质存储一个或多个程序，所述一个或多个程序当被电子设备执行时，使得电子设备执行根据上文任意实施例的通讯方法。

例如，图4示出了可以实现基于通讯方法的计算设备，即上文中的电子设备。该计算设备传统上包括处理器410和存储器420形式的计算机程序产品或者计算机可读介质。存储器420可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。存储器420具有存储用于执行上述方法中的任何方法步骤的程序代码431的存储空间430。例如，存储程序代码的存储空间430可以存储分别用于实现上面的方法中的各种步骤的各个程序代码431。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。这些计算机程序产品包括诸如硬盘，紧致盘(CD)、存储卡或者软盘之类的程序代码载体。这样的计算机程序产品通常为例如图5所示的便携式或者固定存储单元。该存储单元可以具有与图4的计算设备中的存储器420类似布置的存储段、存储空间等。程序代码可以例如以适当形式进行压缩。通常，存储单元包括用于执行本发明的方法步骤的计算机可读代码431′，即可以由诸如410之类的处理器读取的代码，当这些代码由计算设备运行时，导致该计算设备执行上面所描述的方法中的各个步骤。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

Claims

1.一种通讯方法，应用在与第一端进行语音通讯的第二端，所述方法包括：

接收第一端音频；

确定所述第一端音频中与所述第二端音频匹配的目标音频；

将所述回声消除音频发送至所述第一端；

在所述确定所述第一端音频中与所述第二端音频匹配的目标音频之前，所述方法还包括：

将所述第二端音频拆分为预设时间长度的多个第二子音频；

分别在所述第一端音频中查找与所述第二子音频匹配的第一子音频，作为与所述第二端音频的匹配的目标音频；

对于每一段预设时间长度的所述第二子音频，从比所述第二端音频早设定时间的第一端音频作为基准开始在所述第一端音频中查找与所述第二子音频匹配的第一子音频，若所述第一子音频与所述第二子音频不匹配，则按照设定步长，在所述基准的两侧重新取一段预设时间长度的第一子音频进行匹配。

2.根据权利要求1所述的方法，其中，所述确定所述第一端音频中与所述第二端音频匹配的目标音频包括：

提取所述第一端音频和第二端音频的频谱特征；

确定所述预设时间长度的频谱特征的相似度；

3.根据权利要求1或2所述的方法，其中，所述确定所述第一端音频中与所述第二端音频匹配的目标音频还包括：

从前次确定的目标音频的结束位置开始查找本次目标音频。

4.根据权利要求1或2所述的方法，其中，所述确定所述第一端音频中与所述第二端音频匹配的目标音频还包括：

5.根据权利要求1所述的方法，其中，在所述将所述回声消除音频发送至所述第一端之前，所述方法还包括：

在所述回声消除音频中消除异常音频。

6.根据权利要求5所述的方法，其中，所述在所述回声消除音频中消除异常音频包括：

调整所述异常音频的频谱特征值。

7.一种通讯装置，应用在与第一端进行语音通讯的第二端，所述装置包括：

音频接收模块，用于接收第一端音频；

音频发送模块，用于将所述回声消除音频发送至所述第一端；

所述装置还包括：

所述音频确定模块包括：

音频查找子模块，用于分别在所述第一端音频中查找与所述第二子音频匹配的第一子音频，作为与所述第二端音频的匹配的目标音频；

对于每一段预设时间长度的所述第二子音频，所述音频查找子模块从比所述第二端音频早设定时间的第一端音频作为基准开始在所述第一端音频中查找与所述第二子音频匹配的第一子音频，若所述第一子音频与所述第二子音频不匹配，则按照设定步长，在所述基准的两侧重新取一段预设时间长度的第一子音频进行匹配。

8.根据权利要求7所述的装置，其中，所述音频确定模块包括：

9.根据权利要求7或8所述的装置，其中，所述音频确定模块还包括：

10.根据权利要求7或8所述的装置，其中，所述音频确定模块还包括：

11.根据权利要求7所述的装置，其中，所述装置还包括：

异常消除模块，用于在所述回声消除音频中消除异常音频。

12.根据权利要求11所述的装置，其中，所述异常消除模块包括：

特征值调整模块，用于调整所述异常音频的频谱特征值。

13.一种电子设备，包括：

处理器；以及

被配置为存储计算机可执行指令的存储器，所述可执行指令在被执行时使所述电子设备执行根据权利要求1-6任一个所述的通讯方法。

14.一种计算机可读存储介质，所述计算机可读存储介质存储一个或多个程序，所述一个或多个程序当被电子设备执行时，使得所述电子设备执行根据权利要求1-6任一个所述的通讯方法。