CN106205628B

CN106205628B - 声音信号优化方法及装置

Info

Publication number: CN106205628B
Application number: CN201510226844.2A
Authority: CN
Inventors: 颜嘉甫; 王楠楠; 张鹏; 张柳军
Original assignee: Xiaomi Inc
Current assignee: Xiaomi Inc
Priority date: 2015-05-06
Filing date: 2015-05-06
Publication date: 2018-11-02
Anticipated expiration: 2035-05-06
Also published as: EP3091753B1; KR20160142217A; JP2017521024A; CN106205628A; RU2628473C2; BR112015031855A2; EP3091753A1; JP6314286B2; MX361588B; US20160330548A1; WO2016176951A1; US10499156B2; RU2015155321A; MX2015017147A

Abstract

本公开揭示了一种声音信号优化方法及装置，属于语音信号处理领域。所述方法用于包含有至少两个声音采集单元的终端中，包括：通过所述至少两个声音采集单元对所述终端周边的声源进行定位；从定位确定的各个声源中筛选出指定声源；根据定位获得的所述指定声源的空间位置，确定所述终端采集到的声音信号中由所述指定声源发出的声音信号；对所述指定声源发出的声音信号进行音量优化。本公开在采集声音信号时，通过对周边声源进行筛选，并对筛选出的声源发出的声音信号进行优化，从提高终端对声音信号的采集效果。

Description

声音信号优化方法及装置

技术领域

本公开涉及语音信号处理领域，特别涉及一种声音信号优化方法及装置。

背景技术

随着通讯和电子技术的不断发展，智能手机、平板电脑、电子书阅读器以及电子录音笔等支持语音通话或者录音功能的终端逐渐成为人们生活中不可缺少的工具，为人们的日常生活提供了极大的便利。

在此类终端的一种应用方式中，多个用户可以使用同一个支持录音功能终端进行会议录音，或者，多个用户可以使用同一个支持语音通话的终端与远端的其它用户进行电话会议；终端将录制的声音信号进行存储，或者，发送给语音通话的远端用户。

发明内容

本公开提供了一种声音信号优化方法及装置。所述技术方案如下：

第一方面，提供一种声音信号优化方法，用于包含有至少两个声音采集单元的终端中，所述方法包括：

通过所述至少两个声音采集单元对所述终端周边的声源进行定位；

从定位确定的各个声源中筛选出指定声源；

根据定位获得的所述指定声源的空间位置，确定所述终端采集到的声音信号中由所述指定声源发出的声音信号；

对所述指定声源发出的声音信号进行音量优化。

可选的，所述对所述指定声源发出的声音信号进行音量优化，包括：

将所述指定声源发出的声音信号的强度与预设的第一强度阈值和第二强度阈值进行比较，所述第一强度阈值大于或者等于所述第二强度阈值；

若所述指定声源发出的声音信号的强度大于所述第一强度阈值，则将所述指定声源发出的声音信号的强度降低至所述第一强度阈值；

若所述指定声源发出的声音信号的强度小于所述第二强度阈值，则将所述指定声源发出的声音信号的强度增加至所述第二强度阈值。

可选的，所述通过所述至少两个声音采集单元对所述终端周边的声源进行定位，包括：

获取一声源发出的声音信号达到所述至少两个声音采集单元的时间差和相位差；

根据所述声源发出的声音信号达到所述至少两个声音采集单元的时间差和相位差确定所述声源相对于所述终端的空间位置。

可选的，所述从定位确定的声源中筛选出指定声源，包括：

根据所述各个声源的声音信号的强度和/或声音信号的连续性，从所述各个声源中筛选出所述指定声源。

可选的，所述确定所述终端采集到的声音信号中由所述指定声源发出的声音信号之前，还包括：

通过所述终端中的姿态传感器获取所述终端的姿态；

根据所述终端的姿态对所述终端采集到的声音信号进行增益补偿；

所述确定所述终端采集到的声音信号中由所述指定声源发出的声音信号，包括：

确定经过增益补偿后的声音信号中，由所述指定声源发出的声音信号。

可选的，所述终端的姿态包括所述终端正面与水平面之间的夹角，所述根据所述终端的姿态对所述终端采集到的声音信号进行增益补偿，包括：

根据所述终端正面与水平面之间的夹角确定补偿数值，所述终端正面与水平面之间的夹角与所述补偿数值之间成正比例关系；

根据所述补偿数值对所述终端采集到的声音信号进行增益补偿。

在第二方面，提供一种声音信号优化装置，用于包含有至少两个声音采集单元的终端中，所述装置包括：

定位模块，用于通过所述至少两个声音采集单元对所述终端周边的声源进行定位；

筛选模块，用于从定位确定的各个声源中筛选出指定声源；

声音信号确定模块，用于根据定位获得的所述指定声源的空间位置，确定所述终端采集到的声音信号中由所述指定声源发出的声音信号；

优化模块，用于对所述指定声源发出的声音信号进行音量优化。

可选的，所述优化模块，包括：

比较子模块，用于将所述指定声源发出的声音信号的强度与预设的第一强度阈值和第二强度阈值进行比较，所述第一强度阈值大于或者等于所述第二强度阈值；

降低子模块，用于若所述指定声源发出的声音信号的强度大于所述第一强度阈值，则将所述指定声源发出的声音信号的强度降低至所述第一强度阈值；

增加子模块，用于若所述指定声源发出的声音信号的强度小于所述第二强度阈值，则将所述指定声源发出的声音信号的强度增加至所述第二强度阈值。

可选的，所述定位模块，包括：

获取子模块，用于获取一声源发出的声音信号达到所述至少两个声音采集单元的时间差和相位差；

定位子模块，用于根据所述声源发出的声音信号达到所述至少两个声音采集单元的时间差和相位差确定所述声源相对于所述终端的空间位置。

可选的，所述筛选模块，用于根据所述各个声源的声音信号的强度和/或声音信号的连续性，从所述各个声源中筛选出所述指定声源。

可选的，所述装置还包括：姿态获取模块和补偿模块；

所述姿态获取模块，用于在所述声音信号确定模块确定所述终端采集到的声音信号中由所述指定声源发出的声音信号之前，通过所述终端中的姿态传感器获取所述终端的姿态；

所述补偿模块，用于根据所述终端的姿态对所述终端采集到的声音信号进行增益补偿；

所述声音信号确定模块，用于确定经过增益补偿后的声音信号中，由所述指定声源发出的声音信号。

可选的，所述补偿模块，包括：

数值确定子模块，用于根据所述终端正面与水平面之间的夹角确定补偿数值，所述终端正面与水平面之间的夹角与所述补偿数值之间成正比例关系；

补偿子模块，用于根据所述补偿数值对所述终端采集到的声音信号进行增益补偿；

其中，所述终端的姿态包括所述终端正面与水平面之间的夹角。

第三方面，提供一种声音信号优化方法装置，用于包含有至少两个声音采集单元的终端中，所述装置包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为：

从定位确定的各个声源中筛选出指定声源；

对由所述指定声源发出的声音信号进行音量优化。。

本公开的实施例提供的技术方案可以包括以下有益效果：

通过至少两个声音采集单元对终端周边的声源进行定位，从定位确定的各个声源中筛选出指定声源，根据定位获得的该指定声源的空间位置，确定该终端采集到的声音信号中由该指定声源发出的声音信号，对该指定声源发出的声音信号进行音量优化；当终端在采集声音信号时，对周边声源进行筛选，并对筛选出的声源发出的声音信号进行优化，从提高终端对声音信号的采集效果。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并于说明书一起用于解释本发明的原理。

图1是根据一示例性实施例示出的一种声音信号优化方法的流程图；

图2是根据另一示例性实施例示出的一种声音信号优化方法的流程图；

图3是根据另一示例性实施例示出的一种定位方法的流程图；

图4是根据另一示例性实施例示出的一种增益补偿方法的流程图；

图5是根据一示例性实施例示出的一种声音信号优化装置的框图；

图6是根据另一示例性实施例示出的一种声音信号优化装置的框图；

图7是根据一示例性实施例示出的一种装置的框图。

具体实施方式

这里将详细地对示例性实施例执行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

图1是根据一示例性实施例示出的一种声音信号优化方法的流程图。该声音信号优化方法可以用于包含有至少两个声音采集单元的终端中，该终端可以是智能手机、平板电脑、电子书阅读器以及智能录音笔等支持语音通话或者录音功能的智能终端。如图1所示，该声音信号优化方法可以包括以下步骤。

在步骤102中，通过至少两个声音采集单元对终端周边的声源进行定位。

在步骤104中，从定位确定的各个声源中筛选出指定声源。

在步骤106中，根据定位获得的该指定声源的空间位置，确定该终端采集到的声音信号中由该指定声源发出的声音信号。

在步骤108中，对该指定声源发出的声音信号进行音量优化。

可选的，该对采集到的该指定声源发出的声音信号进行音量优化，包括：

将该指定声源发出的声音信号的强度与预设的第一强度阈值和第二强度阈值进行比较，该第一强度阈值大于或者等于该第二强度阈值；

若该指定声源发出的声音信号的强度大于该第一强度阈值，则将该指定声源发出的声音信号的强度降低至该第一强度阈值；

若该指定声源发出的声音信号的强度小于该第二强度阈值，则将该指定声源发出的声音信号的强度增加至该第二强度阈值。

可选的，该通过该至少两个声音采集单元对该终端周边的声源进行定位，包括：

获取一声源发出的声音信号达到该至少两个声音采集单元的时间差和相位差；

根据该声源发出的声音信号达到该至少两个声音采集单元的时间差和相位差确定该声源相对于该终端的空间位置。

可选的，该从定位确定的声源中筛选出指定声源，包括：

根据该各个声源的声音信号的强度和/或声音信号的连续性，从该各个声源中筛选出指定声源。

可选的，该确定终端采集到的声音信号中由指定声源发出的声音信号之前，还包括：

通过该终端中的姿态传感器获取该终端的姿态；

根据该终端的姿态对该终端采集到的声音信号进行增益补偿；

该确定终端采集到的声音信号中由指定声源发出的声音信号，包括：

确定经过增益补偿后的声音信号中，由该指定声源发出的声音信号。

可选的，该终端的姿态包括该终端正面与水平面之间的夹角，该根据该终端的姿态对该终端采集到的声音信号进行增益补偿，包括：

根据该终端正面与水平面之间的夹角确定补偿数值，该终端正面与水平面之间的夹角与该补偿数值之间成正比例关系；

根据该补偿数值对该终端采集到的声音信号进行增益补偿。

综上所述，本公开实施例中提供的声音信号优化方法，通过至少两个声音采集单元对终端周边的声源进行定位，从定位确定的各个声源中筛选出指定声源，根据定位获得的该指定声源的空间位置，确定该终端采集到的声音信号中由该指定声源发出的声音信号，对该指定声源发出的声音信号进行音量优化；当终端在采集声音信号时，对周边声源进行筛选，并对筛选出的声源发出的声音信号进行优化，从提高终端对声音信号的采集效果。

图2是根据另一示例性实施例示出的一种声音信号优化方法的流程图。该声音信号优化方法可以用于包含有至少两个声音采集单元的终端中，该终端可以是智能手机、平板电脑、电子书阅读器以及智能录音笔等支持语音通话或者录音功能的智能终端。如图2所示，该声音信号优化方法可以包括以下步骤。

在步骤202中，通过至少两个声音采集单元对终端周边的声源进行定位。

可选的，请参考图3所示的定位方法的流程图，该通过该至少两个声音采集单元对该终端周边的声源进行定位的步骤可以如下：

在步骤202a中，获取一声源发出的声音信号达到该至少两个声音采集单元的时间差和相位差。

其中，终端中包含的至少两个声音采集单元组成一个声音采集单元阵列，由于声源到该声音采集单元阵列中的各个声音采集单元的距离和方向都不相同，因此，该声源发出的声音传递到各个声音采集单元的时间和相位也不相同。终端可以获取该声音采集单元阵列中的各个声音采集单元采集到同一声源发出的声音的时间差和相位差。

在步骤202b中，根据该声源发出的声音信号达到该至少两个声音采集单元的时间差和相位差确定该声源相对于该终端的空间位置。

终端可以利用波束成形技术定位声源的位置，比如，终端可以根据该声源发出的声音信号达到该至少两个声音采集单元的时间差和相位差，通过延迟求和或者特征值分解等算法识别出声源相对于终端的位置。

利用波束成形技术，终端不仅可以准确的定位固定声源的空间位置，还可以对移动中的声源进行追踪，以便对移动中的声源发出的信号持续进行优化处理。

在步骤204中，根据该各个声源的声音信号的强度和/或声音信号的连续性，从该各个声源中筛选出指定声源。

终端在通话或者录音状态下时，通常只有用户说话时发出的声音信号才是有效的声音信号，其它的声音信号大多为噪声，在本公开实施例所示的方案中，终端可以根据各个声源的声音信号的强度和/或声音信号的连续性，从各个声源中筛选出最有可能是用户的声源，后续只对筛选出的最有可能是用户的声源进行优化。

比如，终端可以为声音信号的不同强度设置不同的权重，并为声音信号的不同连续时间也设置不同权重，终端接收到一个声源发出的声音信号后，分别确定其声音强度对应的权重和持续时间对应的权重进行加权，并对各个声源按照对应的加权进行排序，确定出加权最高的指定声源。

可选的，在为声音信号的不同强度设置不同的权重时，可以将最接近人说话声音的强度设置较高的权重，与人说话声音的强度之间的差值越大，对应设置的权重越低。比如，人平时说话正常的声音强度大约为40分贝，则可以对40分贝设置最高的加权，距离40分贝越远的声音强度，其权重越低。

同样的，在为声音信号的持续时间设置不同权重时，可以将最接近人说话时的声音信号的持续时间设置较高的权重，与人说话时的声音信号的持续时间之间的差值越大，对应设置的权重也越低。比如，人说话时，正常一句话的持续时间可能是2s，则可以对2s的持续时间设置最高的加权，与2s之间差距越大的持续时间，其权重越低。

由于录音或者通话时，同一时间通常只有一个或者两个用户在说话，为了避免对过多的声源进行不必要的优化处理，降低优化过程的复杂度，可以设置同时筛选出的指定声源的数量，比如，最多同一时间筛选出3个指定声源，后续同一时间最多只对3个声源发出的声音信号进行优化。

在步骤206中，根据定位获得的该指定声源的空间位置，确定该终端采集到的声音信号中由该指定声源发出的声音信号。

终端对接收到的声音信号进行处理时，可以根据指定声源的空间位置，只对该指定声源发出的声音信号进行处理。

在步骤208中，将指定声源发出的声音信号的强度与预设的第一强度阈值和第二强度阈值进行比较，该第一强度阈值大于或者等于该第二强度阈值。

在步骤210中，若该指定声源发出的声音信号的强度大于该第一强度阈值，则将该指定声源发出的声音信号的强度降低至该第一强度阈值。

在步骤212中，若该指定声源发出的声音信号的强度小于该第二强度阈值，则将该指定声源发出的声音信号的强度增加至该第二强度阈值。

可选的，若该指定声源发出的声音信号的强度不小于该第一强度阈值，且不大于该第二强度阈值，则不对指定声源发出的声音信号的强度进行处理。

终端可以按照人正常说话时的声音信号强度设置第一强度阈值和第二强度阈值，若指定声源的声音信号强度较大，则将该指定声源的声音信号的强度降低，若指定声源的声音信号强度较小，则将该指定声源的声音信号的强度提高，若指定声源的声音信号强度适中，则不对指定声源的声音信号的强度进行处理。从而使可能是用户的指定声源发出的声音信号的强度保持在一个预定的范围内，既不会太高，也不会太低，从而使录音或者通话的效果达到最佳。

比如，以用户A和用户B通过智能手机进行远程电话会议，或者，通过手机进行会议录音为例，控制智能手机进入录音状态或者通话状态时，将智能手机切换至会议录音模式，此时，智能手机通过至少两个麦克风采集周围的声音并确定各个声源的位置，当用户A或者用户B发言时，智能手机将发言者筛选为指定声源，并对该发言者说话时发出的声音信号进行优化，当该发言者说话时发出的声音信号强度小于30分贝时，将该发言者说话时发出的声音信号的强度提升为30分贝，当该发言者说话时发出的声音信号大于50分贝时，将该发言者说话时发出的声音信号降低至50分贝，对于30分贝至50分贝之间的声音信号，则不做任何处理。从而保证与智能手机之间的距离不同的各个用户，其录制或者被远端收听到的说话音量都处于一个适当的范围内，从而保证了录音效果或者电话会议的通话效果。

综上所述，本公开实施例中提供的声音信号优化方法，通过至少两个声音采集单元对终端周边的声源进行定位，从定位确定的各个声源中筛选出指定声源，根据定位获得的该指定声源的空间位置，确定该终端采集到的声音信号中由该指定声源发出的声音信号，并将该指定声源发出的声音信号的强度调整至预先设置的两个强度阈值之间，将终端采集到的指定声源发出的声音信号的强度调整到一个合适的范围之内，从提高终端在录音或者通话时，对声音信号的采集效果。

作为另一种可选的实施例，在执行上述图2所示实施例中的步骤206之前，还可以执行如图4所示的增益补偿方法的流程图中的步骤205a～步骤205c。

在步骤205a中，通过该终端中的姿态传感器获取该终端的姿态，该终端的姿态包括该终端正面与水平面之间的夹角。

正常情况下，在进行录音或者电话会议时，终端正面向上水平放置在桌面上，而在某一情况下，终端的姿态可能并不是水平的，比如，当终端搭置在书本或者其它物体上时，其正面并不是水平状态，此时，终端正面与水平面之间会呈一定的夹角，导致终端采集到的声音信号与理想状态之间有一定的偏差，与终端正面处于水平状态时采集到的声音信号相比偏小。

对此，终端从采集到的声音信号中确定出指定声源发出的声音信号之前并做优化处理之前，首先可以根据当前姿态对采集到的声音信号做一些补偿。

在步骤205b中，根据该终端正面与水平面之间的夹角确定补偿数值，该终端正面与水平面之间的夹角与该补偿数值之间成正比例关系。

当终端正面与水平面之间的夹角越大时，终端采集到的声音信号与理想状态(即终端正面处于水平状态)之间的偏差也越大，因此，终端可以根据终端正面与水平面之间的夹角，通过预先设置算法计算补偿数值，或者通过预先存储的对应关系查询需要补偿的数值。

在步骤205c中，根据该补偿数值对该终端采集到的声音信号进行增益补偿。

终端确定出补偿数值后，对采集到的所有声音信号进行增益补偿。

其中，终端在确定该终端采集到的声音信号中由该指定声源发出的声音信号时，可以确定经过增益补偿后的声音信号中，由该指定声源发出的声音信号。

综上所述，本公开实施例中提供的方法，通过在从采集到的声音信号中确定出指定声源的声音信号并做优化之前，获取终端的姿态，根据终端的姿态对终端采集到的声音信号进行增益补偿，进一步提高了终端在录音或者通话时，对声音信号的采集效果。

下述为本公开装置实施例，可以用于执行本公开方法实施例。对于本公开装置实施例中未披露的细节，请参照本公开方法实施例。

图5是根据一示例性实施例示出的一种声音信号优化装置的框图，该声音信号优化装置可以用于包含有至少两个声音采集单元的终端中，该终端可以是智能手机、平板电脑、电子书阅读器以及智能录音笔等支持语音通话或者录音功能的智能终端，执行如图1至4任一所示的方法。如图5所示，该声音信号优化装置包括但不限于：定位模块501、筛选模块502、声音信号确定模块503以及优化模块504；

所述定位模块501被设置为用于通过所述至少两个声音采集单元对所述终端周边的声源进行定位；

所述筛选模块502被设置为用于从定位确定的各个声源中筛选出指定声源；

所述声音信号确定模块503被设置为用于根据定位获得的所述指定声源的空间位置，确定所述终端采集到的声音信号中由所述指定声源发出的声音信号；

所述优化模块504被设置为用于对所述指定声源发出的声音信号进行音量优化。

综上所述，本公开实施例中提供的声音信号优化装置，通过至少两个声音采集单元对终端周边的声源进行定位，从定位确定的各个声源中筛选出指定声源，根据定位获得的该指定声源的空间位置，确定该终端采集到的声音信号中由该指定声源发出的声音信号，对该指定声源发出的声音信号进行音量优化；当终端在采集声音信号时，对周边声源进行筛选，并对筛选出的声源发出的声音信号进行优化，从提高终端对声音信号的采集效果。

图6是根据一示例性实施例示出的一种声音信号优化装置的框图，该声音信号优化装置可以用于包含有至少两个声音采集单元的终端中，该终端可以是智能手机、平板电脑、电子书阅读器以及智能录音笔等支持语音通话或者录音功能的智能终端，执行如图1至4任一所示的方法。如图6所示，该声音信号优化装置包括但不限于：定位模块501、筛选模块502、声音信号确定模块503以及优化模块504；

可选的，所述优化模块504，包括：比较子模块504a、降低子模块504b以及增加子模块504c；

所述比较子模块504a被设置为用于将所述指定声源发出的声音信号的强度与预设的第一强度阈值和第二强度阈值进行比较，所述第一强度阈值大于或者等于所述第二强度阈值；

所述降低子模块504b被设置为用于若所述指定声源发出的声音信号的强度大于所述第一强度阈值，则将所述指定声源发出的声音信号的强度降低至所述第一强度阈值；

所述增加子模块504c被设置为用于若所述指定声源发出的声音信号的强度小于所述第二强度阈值，则将所述指定声源发出的声音信号的强度增加至所述第二强度阈值。

可选的，所述定位模块501，包括：获取子模块501a以及定位子模块501b；

所述获取子模块501a被设置为用于获取一声源发出的声音信号达到所述至少两个声音采集单元的时间差和相位差；

所述定位子模块501b被设置为用于根据所述声源发出的声音信号达到所述至少两个声音采集单元的时间差和相位差确定所述声源相对于所述终端的空间位置。

可选的，所述筛选模块502被设置为用于根据所述各个声源的声音信号的强度和/或声音信号的连续性，从所述各个声源中筛选出所述指定声源。

可选的，所述装置还包括：姿态获取模块505和补偿模块506；

所述姿态获取模块505被设置为用于在所述声音信号确定模块503确定所述终端采集到的声音信号中由所述指定声源发出的声音信号之前，通过所述终端中的姿态传感器获取所述终端的姿态；

所述补偿模块506被设置为用于根据所述终端的姿态对所述终端采集到的声音信号进行增益补偿；

所述声音信号确定模块503被设置为用于确定经过增益补偿后的声音信号中，由所述指定声源发出的声音信号。

可选的，所述补偿模块506，包括：数值确定子模块506a以及补偿子模块506b；

所述数值确定子模块506a被设置为用于根据所述终端正面与水平面之间的夹角确定补偿数值，所述终端正面与水平面之间的夹角与所述补偿数值之间成正比例关系；

所述补偿子模块506b被设置为用于根据所述补偿数值对所述终端采集到的声音信号进行增益补偿；

综上所述，本公开实施例中提供的声音信号优化装置，通过至少两个声音采集单元对终端周边的声源进行定位，从定位确定的各个声源中筛选出指定声源，根据定位获得的该指定声源的空间位置，确定该终端采集到的声音信号中由该指定声源发出的声音信号，并将该指定声源发出的声音信号的强度调整至预先设置的两个强度阈值之间，将终端采集到的指定声源发出的声音信号的强度调整到一个合适的范围之内，从提高终端在录音或者通话时，对声音信号的采集效果。

此外，本公开实施例中提供的装置，通过在从采集到的声音信号中确定出指定声源的声音信号并做优化之前，获取终端的姿态，根据终端的姿态对终端采集到的声音信号进行增益补偿，进一步提高了终端在录音或者通话时，对声音信号的采集效果。

图7是根据一示例性实施例示出的一种装置700的框图。其中，该装置中包含至少两个声音采集单元。例如，装置700可以是移动电话，计算机，数字广播终端，消息收发设备，路由设备，游戏控制台，平板设备，医疗设备，健身设备，个人数字助理等。

参照图7，装置700可以包括以下一个或多个组件：处理组件702，存储器704，电源组件706，多媒体组件708，音频组件710，输入/输出(I/O)的接口712，传感器组件714，以及通信组件716。

处理组件702通常控制装置700的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理组件702可以包括一个或多个处理器718来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件702可以包括一个或多个模块，便于处理组件702和其他组件之间的交互。例如，处理组件702可以包括多媒体模块，以方便多媒体组件708和处理组件702之间的交互。

存储器704被配置为存储各种类型的数据以支持在装置700的操作。这些数据的示例包括用于在装置700上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器704可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。存储器704中还存储有一个或多个模块，该一个或多个模块被配置成由该一个或多个处理器720执行，以完成上述图1至4任一所示的方法的全部或部分步骤。

电源组件706为装置700的各种组件提供电力。电源组件706可以包括电源管理***，一个或多个电源，及其他与为装置700生成、管理和分配电力相关联的组件。

多媒体组件708包括在所述装置700和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件708包括一个前置摄像头和/或后置摄像头。当装置700处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜***或具有焦距和光学变焦能力。

音频组件710被配置为输出和/或输入音频信号。例如，音频组件710包括一个麦克风(MIC)，当装置700处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器704或经由通信组件716发送。在一些实施例中，音频组件710还包括一个扬声器，用于输出音频信号。

I/O接口712为处理组件702和***接口模块之间提供接口，上述***接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件714包括一个或多个传感器，用于为装置700提供各个方面的状态评估。例如，传感器组件714可以检测到装置700的打开/关闭状态，组件的相对定位，例如所述组件为装置700的显示器和小键盘，传感器组件714还可以检测装置700或装置700一个组件的位置改变，用户与装置700接触的存在或不存在，装置700方位或加速/减速和装置700的温度变化。传感器组件714可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件714还可以包括光传感器，如CMOS或CCD图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件714还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件716被配置为便于装置700和其他设备之间有线或无线方式的通信。装置700可以接入基于通信标准的无线网络，如WiFi，2G或3G，或它们的组合。在一个示例性实施例中，通信组件716经由广播信道接收来自外部广播管理***的广播信号或广播相关信息。在一个示例性实施例中，所述通信组件716还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(RFID)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝牙(BT)技术和其他技术来实现。

在示例性实施例中，装置700可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器704，上述指令可由装置700的处理器718执行以完成上述方法。例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中执行了详细描述，此处将不做详细阐述说明。

应当理解的是，本发明并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围执行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims

1.一种声音信号优化方法，其特征在于，用于包含有至少两个声音采集单元的终端中，所述方法包括：

从定位确定的各个声源中筛选出指定声源；

对所述指定声源发出的声音信号进行音量优化；

其中，从定位确定的各个声源中筛选出指定声源，包括：

根据所述各个声源的声音信号的强度和声音信号的连续性，从所述各个声源中筛选出所述指定声源；

其中，所述根据所述各个声源的声音信号的强度和声音信号的连续性，从所述各个声源中筛选出所述指定声源，包括：

根据所述各个声源的加权后的声音信号的强度和加权后的声音信号的持续时间，从所述各个声源中筛选出所述指定声源，在所述加权后的声音信号中所述最接近人说话声音的强度对应最高的权重，在所述加权后的声音信号的持续时间中所述最接近人说话时的声音信号的持续时间对应最高的权重。

2.根据权利要求1所述的方法，其特征在于，所述对所述指定声源发出的声音信号进行音量优化，包括：

3.根据权利要求1所述的方法，其特征在于，所述通过所述至少两个声音采集单元对所述终端周边的声源进行定位，包括：

4.根据权利要求1所述的方法，其特征在于，所述确定所述终端采集到的声音信号中由所述指定声源发出的声音信号之前，还包括：

通过所述终端中的姿态传感器获取所述终端的姿态；

5.根据权利要求4所述的方法，其特征在于，所述终端的姿态包括所述终端正面与水平面之间的夹角，所述根据所述终端的姿态对所述终端采集到的声音信号进行增益补偿，包括：

6.一种声音信号优化装置，其特征在于，用于包含有至少两个声音采集单元的终端中，所述装置包括：

筛选模块，用于从定位确定的各个声源中筛选出指定声源；

优化模块，用于对所述指定声源发出的声音信号进行音量优化；

所述筛选模块，用于根据所述各个声源的声音信号的强度和声音信号的连续性，从所述各个声源中筛选出所述指定声源；所述根据所述各个声源的声音信号的强度和声音信号的连续性，从所述各个声源中筛选出所述指定声源，包括：根据所述各个声源的加权后的声音信号的强度和加权后的声音信号的持续时间，从所述各个声源中筛选出所述指定声源，在所述加权后的声音信号中所述最接近人说话声音的强度对应最高的权重，在所述加权后的声音信号的持续时间中所述最接近人说话时的声音信号的持续时间对应最高的权重。

7.根据权利要求6所述的装置，其特征在于，所述优化模块，包括：

8.根据权利要求6所述的装置，其特征在于，所述定位模块，包括：

9.根据权利要求6所述的装置，其特征在于，所述装置还包括：姿态获取模块和补偿模块；

10.根据权利要求9所述的装置，其特征在于，所述补偿模块，包括：

11.一种声音信号优化方法装置，其特征在于，用于包含有至少两个声音采集单元的终端中，所述装置包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为：

从定位确定的各个声源中筛选出指定声源；

对由所述指定声源发出的声音信号进行音量优化；

其中，从定位确定的各个声源中筛选出指定声源，包括：

12.一种计算机可读存储介质，其特征在于，所述存储介质中包括指令，所述指令由处理器执行以实现如权利要求1至权利要求5任一所述的声音信号优化方法。