CN105163209A

CN105163209A - 一种接收声音的处理方法及装置

Info

Publication number: CN105163209A
Application number: CN201510546558.4A
Authority: CN
Inventors: 骆磊
Original assignee: Shenzhen Cloudminds Technology Co Ltd
Current assignee: Shenzhen Cloudminds Technology Co Ltd
Priority date: 2015-08-31
Filing date: 2015-08-31
Publication date: 2015-12-16
Also published as: JP6681405B2; JP2018511962A; US20170287468A1; US10306360B2; WO2017036323A1

Abstract

本申请提供了一种接收声音的处理方法及装置，方法可以包括：利用设备的至少三个麦克风接收声音；根据接收到的声音计算三维空间内发声点位置；根据所述三维空间内发声点位置和所述设备的最佳声音接收区域，调整所述设备的物理位置，以使得所述设备的最佳声音接收区域靠近或包含所述发声点位置。由于本申请实施例采用设备上的至少三个麦克风来接收声音，可以准确确定出三维空间内的发声点位置，并在确定发声点的位置以后，根据三维空间内发声点的位置以及设备自身的最佳声音接收区域，调整设备的状态，以确保声音接收效果最优化。

Description

一种接收声音的处理方法及装置

技术领域

本申请涉及声音采集技术领域，尤其涉及一种接收声音的处理方法及装置。

背景技术

现有技术中，同一设备上可能具备一个或多个麦克风(或简称麦克)来接收声音。以手机为例，包括一个手持时的主麦克、一个扬声模式时的主麦克和一个负责降噪的麦克。其他设备中，麦克风个数不等。

目前，现有设备大多是以被动的接收声音为主，也即，静态的位于一定位置，当检测到有声音时即接收该声音。然而，采用这种方式接收到的声音效果并不是很好，如果声音来自于非理想情况的方向，那么接收到的声音也是不理想的，可能还会进一步导致后续声音的识别也会比较困难。

现有技术不足在于：

现有设备大多为静态的接收声音，导致接收到的声音并不理想。

发明内容

本申请实施例提出了一种接收声音的处理方法及装置，以解决现有技术中现有设备大多为静态的接收声音，导致接收到的声音并不理想的技术问题。

本申请实施例提供了一种接收声音的处理方法，包括如下步骤：

利用设备的至少三个麦克风接收声音；

根据接收到的声音计算三维空间内发声点位置；

根据所述三维空间内发声点位置和所述设备的最佳声音接收区域，调整所述设备的物理位置，以使得所述设备的最佳声音接收区域靠近或包含所述发声点位置。

本申请实施例提供了一种接收声音的处理装置，包括：

接收模块，利用设备的至少三个麦克风接收声音；

发声点位置计算模块，用于根据接收到的声音计算三维空间内发声点位置；

位置调整模块，用于根据所述三维空间内发声点位置和所述设备的最佳声音接收区域，调整所述设备的物理位置，以使得所述设备的最佳声音接收区域靠近或包含所述发声点位置。

有益效果如下：

本申请实施例所提供的接收声音的处理方法及装置，利用设备的至少三个麦克风接收声音，并根据接收到的声音计算三维空间内发声点位置；最终根据三维空间内发声点位置和所述设备的最佳声音接收区域，调整所述设备的物理位置，以使得所述设备的最佳声音接收区域靠近或包含所述发声点位置。由于本申请实施例采用至少三个麦克风来接收声音，可以准确确定出三维空间内发声点的位置，并在确定发声点位置后，根据三维空间内发声点位置和设备自身的最佳声音接收区域，调整设备的物理位置，以使得所述设备的最佳声音接收区域靠近或包含所述发声点位置，以使声音接收效果最优化。

附图说明

下面将参照附图描述本申请的具体实施例，其中：

图1示出了本申请实施例中接收声音的处理方法实施的流程示意图；

图2示出了本申请实施例中设备上的麦克风摆放位置的示意图；

图3示出了本申请实施例中建立三维模型后的示意图；

图4示出了本申请实施例中接收声音的处理装置的结构示意图。

具体实施方式

为了使本申请的技术方案及优点更加清楚明白，以下结合附图对本申请的示例性实施例进行进一步详细的说明，显然，所描述的实施例仅是本申请的一部分实施例，而不是所有实施例的穷举。并且在不冲突的情况下，本说明书中的实施例及实施例中的特征可以互相结合。

发明人在发明过程中注意到：

现有设备大多以静态的接收声音为主，并不会判定声音的方向并调整到最佳接收声音的方向。

而且，以手机为例，虽然包括一个手持时的主麦克、一个扬声模式时的主麦克和一个负责降噪的麦克，但同一时刻最多只有两个麦克风在工作。手机本身无法判断声音来自哪个方向，也无法调整自身方向以达到最佳效果。

基于此，本申请实施例提出了一种接收声音的处理方法及装置，下面进行说明。

图1示出了本申请实施例中接收声音的处理方法实施的流程示意图，如图所示，所述接收声音的处理方法可以包括如下步骤：

步骤101、利用设备的至少三个麦克风接收声音；

步骤102、根据接收到的声音计算三维空间内发声点位置；

步骤103、根据所述三维空间内发声点位置和所述设备的最佳声音接收区域，调整所述设备的物理位置，以使得所述设备的最佳声音接收区域靠近或包含所述发声点位置。

在具体实施中，可以利用设备自身的3个、4个或更多麦克风来接收声音，麦克风的摆放位置可以根据实际需要进行设置。所述设备的最佳声音接收区域可以根据麦克风的摆放位置来确定，通常设备的硬件(如麦克风)位置确定后，设备的最佳声音接收区域即确定。本申请实施例中所述最佳声音接收区域为在所述设备的周围空间中所述设备的麦克风接收声音效果最好(或最佳)的区域，该区域与设备之间的位置关系相对固定。

一般情况下，声源对准麦克风中心轴线夹角为“0”的时候接收声音效果最佳，现有技术中，每种麦克风可能有不同的拾音范围，本申请实施例中，可以根据麦克风的摆放位置，确定这些麦克风的拾音范围的交集，即可确定设备的最佳声音接收区域。

本申请实施例中可以通过调整所述设备的物理位置，从而调整所述设备的最佳声音接收区域，来达到更好的声音接收效果。在具体实施中，可能存在以下两种情况：

一种情况是，所述设备的最佳声音接收区域包含所述发声点位置，这种情况也可以称为最佳声音接收状态。调整所述设备的物理位置，从而可以相应的调整所述设备的最佳声音接收区域，以使最佳声音接收区域包含发声点位置，由于发声点位置位于所述设备的最佳声音接收区域内，因此，可以确保所述设备接收声音的效果最佳。

设备最佳声音接收区域可以为一个具有优先级排序的点的集合，其中可以包括最佳声音接收点001、002...等。具体实施时，可以首先根据发声点位置和最佳声音接收点001来调整所述设备的物理位置，以使得所述最佳声音接收点001与所述发声点位置重合，如果设备由于各种原因无法满足最佳声音接收点001时，可以按照优先级排序选择002为最佳声音接收点，结合发声点位置调整所述设备的物理位置，以使得所述最佳声音接收点002与所述发声点位置重合。

另一种情况是，所述设备的最佳声音接收区域靠近所述发声点位置。

具体实施中，设备可能由于外界或自身原因无法调整至最佳声音接收状态，也即设备的最佳声音接收区域包含所述发声点位置的状态，例如：设备被其他事物所阻挡或者自身状态调整器件动力不足等。本申请实施例可以调整所述设备的物理位置，以使得所述设备的最佳声音接收区域靠近所述发声点位置即可，来实现比调整前更佳的声音接收效果。在这种情况中，只需要将所述设备的最佳声音接收区域靠近所述发声点位置即可，并不需要将所述最佳声音接收区域完全包含所述发声点位置。

本申请实施例上述所提供的两种情况，也即，最佳声音接收区域包含所述发声点位置，或者，最佳声音接收区域靠近所述发声点位置，均可以实现比调整前更佳的声音接收效果。

本申请实施例中所述设备的物理位置，可以包括设备的空间位置和朝向，例如，可以调整所述设备的空间位置以使得最佳声音接收区域靠近或包含所述发声点位置，例如将设备向左移动30cm；也可以调整所述设备的朝向(即，空间位置可以不改变，仅改变设备自身的朝向)以使得最佳声音接收区域靠近或包含所述发声点位置，例如将设备的当前朝向顺时针改变90度；还可以既调整设备的空间位置、又调整设备的朝向以使得最佳声音接收区域靠近或包含所述发声点位置，例如将设备向左移动30cm并将设备的当前朝向顺时针改变90度)。

由于本申请实施例是采用至少三个麦克风来接收声音，因此，在后续计算发声点位置时可以计算出三维空间内的发声点位置，确保发声点位置的计算更加准确。

而且，本申请实施例中不仅是根据三维空间内发声点位置来调整设备状态，还将三维空间内发声点位置与设备最佳声音接收区域结合起来调整所述设备的物理位置，以使得所述设备的最佳声音接收区域靠近或包含所述发声点位置，从而可以更加准确的将设备调整到声音接收效果更好的位置，确保声音接收效果更优。

实施中，所述根据接收到的声音计算三维空间内的发声点位置，具体可以为：

根据接收到声音的相位差计算发声点至每两个麦克风的距离差；

构建三维模型，计算至少三个三维曲面的交集；其中，所述三维曲面为到两个麦克风的距离的差值等于发声点至所述两个麦克风的距离差的点的集合；

根据所述至少三个三维曲面确定发声点位置。

具体实施中，由于不同麦克风所在位置不同，接收到声音的相位之间有一定的差别，本申请实施例可以在麦克风接收到声音后，在缓存中判定接收到声音的相位差，从而计算得到发声点位置到每两个麦克风的距离差。

例如，假设有麦克风mic1、mic2、mic3、mic4，计算得到发声点到mic2和mic1的距离差为b-a、发声点到mic3和mic2的距离差为c-b、发声点到mic4和mic3的距离差为d-c、发声点到mic3和mic1的距离差为c-a、发声点到mic4和mic1的距离差为d-a、发声点到mic4和mic2的距离差为d-b。

构建三维模型，得到多个三维曲面，分别可以为：

所有到mic2和mic1的距离的差等于b-a的点的集合(三维曲面1)；

所有到mic3和mic2的距离的差等于c-b的点的集合(三维曲面2)；

所有到mic4和mic3的距离的差等于d-c的点的集合(三维曲面3)；

所有到mic3和mic1的距离的差等于c-a的点的集合(三维曲面4)；

所有到mic4和mic1的距离的差等于d-a的点的集合(三维曲面5)；

所有到mic4和mic2的距离的差等于d-b的点的集合(三维曲面6)。

确定这些曲面的交集，即可确定发声点位置。

本申请实施例中根据至少三个麦克风接收的声音，通过构件三维模型，计算三维曲面的交集进行发声点位置的计算，进一步提高了发声点位置的计算精确度。

实施中，所述根据所述至少三个三维曲面的交集确定发声点位置，具体可以为：

当计算得到的交集为两个点时，可以根据麦克风收到的声音的强度，确定发声点所处的空间；所述空间包括设备的正面半空间和背面半空间；根据所述发声点所处的空间，确定两个点中的一个为发声点位置；

当计算得到的交集为一个点时，确定所述交集为发声点位置。

当曲面的交集为两个点时，可以知道这两个点一个为发声点、另一个为以麦克风平面的发声点的对称点。此时，需要进一步确定哪一个点才是发声点。考虑到麦克风一般不会朝向同一方向设置，因此，本申请实施例中，根据不同的麦克风收到的声音强度进行对比，即可知道发声点位置是位于设备的正面半空间还是背面半空间。

具体实施中，可以根据设备平面把空间划分为两个空间区域，将声音最强的麦克风的朝向作为发声点对应的空间区域。

本申请实施例在确定发声点位置时具体分为两种情况，一种为所述交集为一个点，那么该交集即为发声点位置，另一种则是所述交集为两个点，此时，通过将设备划分为正面半空间和背面半空间，来进一步确定发声点的位置，使得计算结果更加精确。

实施中，所述设备可以为机器人，所述调整设备状态，具体可以为：通过控制所述机器人的转向和行进，调整所述机器人的朝向和位置。

具体实施中，所述设备可以为机器人，可以利用机器人自身具备的麦克风来接收声音，并在计算出发声点位置后，根据三维空间内发声点位置和机器人自身最佳声音接收区域，控制机器人进行转向和行进等操作，从而调整机器人的朝向和位置，使得机器人可以更好的接收到声音。

在进行机器人语音交互的场景下，采用本申请实施例所提供的方案，可以确保机器人准确的接收到使用者所发出的声音，并在一定程度上提高了后续语音识别的准确度，从而提高机器人语音交互过程中的用户体验。

实施中，所述设备可以为移动终端，所述调整设备状态，具体可以为：根据震动马达的不同，震动所述移动终端在所处平面内转向。

具体实施中，所述设备可以为移动终端，如手机、平板电脑、笔记本电脑等设备，可以利用移动终端自身的至少三个麦克风接收声音，并计算三维空间为发声点位置，再根据移动终端上麦克风的摆放位置确定移动终端的最佳声音接收区域，最终根据发声点位置和最佳声音接收区域，控制震动器件进行震动，根据震动马达的不同，实现所述移动终端在所处平面内的转向。

采用本申请实施例所提供的方案，可以在通讯设备处于免提模式时，例如，用户在洗漱或吃饭时不方便手持电话时，开启免提模式接听来电，这时，手机就可以自行震动到最佳声音接收状态，让用户接收的声音效果更佳理想。

为了便于本申请的实施，下面以实例进行说明。

本申请实施例以具备三个麦克风的设备为例进行说明，图2示出了本申请实施例中设备上的麦克风摆放位置的示意图，设备上的三个麦克风如图所示，分别为mic1、mic2、mic3。假设声音来自A点，且A点到设备上三个麦克风的直线距离分别为a、b、c。

首先，设备可以控制三个麦克风同时接收声音，在缓存中判定接收到声音的相位差，从而计算得到发声点到两个麦克风的距离差。如图2所示，可以得到b-a、c-a和c-b的绝对数值。

由于设备自身知晓自身的麦克风的摆放位置(或称装配位置)，因此，可以得到设备平面与三个麦克风的平面，然后可以构建三维模型。

图3示出了本申请实施例中建立三维模型后的示意图，如图所示，所有到mic2与mic1的差等于b-a的点的集合为三维曲面S1、所有到mic3与mic1的差等于c-a的点的集合为三维曲面S2、所有到mic3与mic2的差等于c-b的点的集合为三维曲面S3。

计算三个曲面的交集，得到以下两种情形：

如果发声点位置处于三个麦克风组成的同一平面，则三个曲面的交集只有一个点，即可确定该点即为发声点位置；

反之，三个曲面的交集可以得到两个点，一个为发声点A，一个为以三个麦克风为平面的A点的对称点A’。

通常情况下，从设计的角度可以知道，三个麦克风一般不会全部朝向同一个方向，因此，根据三个麦克风收到的声音强度对比，即可得知发声点位于设备的正面半空间还是背面半空间。将设备所在空间分为正反两个区域的话，可以将声音最强的麦克风的朝向作为发声点所在空间。

可以根据三个麦克风的摆放位置确定自身最佳的声音接收区域在三维空间哪个区域，次佳区域在哪个区域等。

一般情况下，一旦三个麦克风的摆放位置确定，则会有一个区域是接收声音效果最好的，可以通过用户使用场景进行调试来确定设备最佳声音接收区域。通常，设备最佳声音接收区域为设备正前方的一块区域。例如，在3GPP降噪测试方案中，可以选取设备正前方30cm作为扬声模式降噪的测试点，也即，设备正前方30cm的区域为设备自身的最佳声音接收区域，而在往两侧或上下到一定角度后，测试结果会有一定恶化。

现有技术中，降噪方案、设备调试情况可能会对设备最佳声音接收区域的确定有一定的影响，本领域技术人员可以根据实际需要采用不同的方式确定设备的最佳声音接收区域，本申请在此不做赘述。

在具体实施中，对设备进行调试一般会根据用户使用场景进行，因此，对于不同的使用场景(例如，手机的扬声模式、手持模式等)，设备最佳声音接收区域可能也会有所不同。

本申请实施例中，设备可以根据三维空间内发声点和最佳声音接收区的位置，调整自身的朝向和位置，以实现最好的接收声音信号的目的。

在调整过程中，依然可以进行上述接收声音、计算发声点位置、确定最佳声音接收区域等步骤，以达到闭环运行，更精确、更快地完成调整。

本申请实施例可以通过在设备上三个或更多麦克风进行方向的识别并自动调整设备方向以使声音接收最优化。

基于同一发明构思，本申请实施例中还提供了一种接收声音的处理装置，由于这些设备解决问题的原理与一种接收声音的处理方法相似，因此这些设备的实施可以参见方法的实施，重复之处不再赘述。

图4示出了本申请实施例中接收声音的处理装置的结构示意图，如图所示，所述接收声音的处理装置可以包括：

接收模块401，利用设备的至少三个麦克风接收声音；

发声点位置计算模块402，用于根据接收到的声音计算三维空间内发声点位置；

位置调整模块403，用于根据所述三维空间内发声点位置和所述设备的最佳声音接收区域，调整所述设备的物理位置，以使得所述设备的最佳声音接收区域靠近或包含所述发声点位置。

实施中，所述发声点位置计算模块具体可以包括：

第一计算单元，用于根据接收到声音的相位差计算发声点至每两个麦克风的距离差；

第二计算单元，用于构建三维模型，计算至少三个三维曲面的交集；其中，所述三维曲面为到两个麦克风的距离的差值等于发声点至所述两个麦克风的距离差的点的集合；

确定单元，用于根据所述至少三个三维曲面的交集确定发声点位置。

实施中，所述确定单元可以具体用于当计算得到的交集为两个点时，根据麦克风收到的声音的强度，确定发声点所处的空间；所述空间包括设备的正面半空间和背面半空间；根据所述发声点所处的空间，确定两个点中的一个为发声点位置；当计算得到的交集为一个点时，确定所述交集为发声点位置。

实施中，所述位置调整模块可以进一步用于当所述设备状态无法调整至设备的最佳声音接收区域包含所述发声点位置时，从按照声音接收质量排序的设备声音接收区域中选择次佳声音接收区域，调整设备状态至所述设备的次佳声音接收区域包含所述发声点位置。

实施中，所述设备可以为机器人，所述位置调整模块具体可以用于通过控制所述机器人的转向和行进，调整所述机器人的朝向和位置。

实施中，所述设备可以为移动终端，所述位置调整模块具体可以用于根据震动马达的不同，震动所述移动终端在所处平面内转向。

上述实施例中，均可以采用现有的功能元器件模块来实施。例如，接收模块可以采用现有的声音接收元器件，至少，现有通讯设备中采用的听筒上便具备实现该功能元器件；至于发声点位置计算模块，进行的发声点位置计算可以采用现有的技术手段，本领域技术人员经过相应的设计开发即可实现；同时，位置调整模块则是任意一个具备调整设备状态功能的设备都具备的元器件。

为了描述的方便，以上所述装置的各部分以功能分为各种模块或单元分别描述。当然，在实施本申请时可以把各模块或单元的功能在同一个或多个软件或硬件中实现。

本领域内的技术人员应明白，本申请的实施例可提供为方法、***、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本申请的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。

Claims

1.一种接收声音的处理方法，其特征在于，包括如下步骤：

利用设备的至少三个麦克风接收声音；

根据接收到的声音计算三维空间内发声点位置；

2.如权利要求1所述的方法，其特征在于，所述根据接收到的声音计算三维空间内发声点位置，具体为：

根据所述至少三个三维曲面的交集确定发声点位置。

3.如权利要求2所述的方法，其特征在于，所述根据所述至少三个三维曲面的交集确定发声点位置，具体为：

当计算得到的交集为两个点时，根据麦克风收到的声音的强度，确定发声点所处的空间；所述空间包括设备的正面半空间和背面半空间；根据所述发声点所处的空间，确定两个点中的一个为发声点位置；

4.如权利要求1所述的方法，其特征在于，所述设备为机器人，所述调整设备状态，具体为：通过控制所述机器人的转向和行进，调整所述机器人的朝向和位置。

5.如权利要求1所述的方法，其特征在于，所述设备为移动终端，所述调整设备状态，具体为：根据震动马达的不同，震动所述移动终端在所处平面内转向。

6.一种接收声音的处理装置，其特征在于，包括：

接收模块，利用设备的至少三个麦克风接收声音；

发声点位置计算模块，用于根据接收到的声音计算三维空间内发声点位置：

7.如权利要求6所述的装置，其特征在于，所述发声点位置计算模块具体包括：

8.如权利要求7所述的装置，其特征在于，所述确定单元具体用于当计算得到的交集为两个点时，根据麦克风收到的声音的强度，确定发声点所处的空间；所述空间包括设备的正面半空间和背面半空间；根据所述发声点所处的空间，确定两个点中的一个为发声点位置；当计算得到的交集为一个点时，确定所述交集为发声点位置。

9.如权利要求6所述的装置，其特征在于，所述设备为机器人，所述位置调整模块具体用于通过控制所述机器人的转向和行进，调整所述机器人的朝向和位置。

10.如权利要求6所述的装置，其特征在于，所述设备为移动终端，所述位置调整模块具体用于根据震动马达的不同，震动所述移动终端在所处平面内转向。