CN110211578A

CN110211578A - 音箱控制方法、装置及设备

Info

Publication number: CN110211578A
Application number: CN201910304851.8A
Authority: CN
Inventors: 戚耀文
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd; Shanghai Xiaodu Technology Co Ltd
Priority date: 2019-04-16
Filing date: 2019-04-16
Publication date: 2019-09-06
Anticipated expiration: 2039-04-16
Also published as: CN110211578B

Abstract

本发明实施例提供一种音箱控制方法、装置及设备，该方法包括：在至少两个音箱检测到预设语音信息之后，获取所述至少两个音箱的收音能量信息，所述收音能量信息用于指示所述音箱接收到所述预设语音信息的声音大小；根据所述至少两个音箱的收音能量信息，在所述至少两个音箱中确定目标音箱，并唤醒所述目标音箱。提高了对音箱进行控制的精确度。

Description

音箱控制方法、装置及设备

技术领域

本发明实施例涉及计算机技术领域，尤其涉及一种音箱控制方法、装置及设备。

背景技术

目前，在很多场景(例如家庭场景、实验室场景等)中部署有智能音箱，用户可以通过语音控制智能音箱。

在实际应用过程中，在同一场景中可能部署多个智能音箱，在用户需要唤醒一个智能音箱时，用户可以说出唤醒词。然而，当用户的声音太小时，该音箱无法检测到用户的声音，导致该智能音箱无法被唤醒。当用户的声音太大时，在唤醒该智能音箱的同时，可能还会唤醒其它智能音箱，导致智能音箱被误唤醒。由上可知，对智能音箱进行控制的精确度较差。

发明内容

本发明实施例提供一种音箱控制方法、装置及设备，提高了对音箱进行控制的精确度。

第一方面，本发明实施例提供一种音箱控制方法，包括：

在至少两个音箱检测到预设语音信息之后，获取所述至少两个音箱的收音能量信息，所述收音能量信息用于指示所述音箱接收到所述预设语音信息的声音大小；

根据所述至少两个音箱的收音能量信息，在所述至少两个音箱中确定目标音箱，并唤醒所述目标音箱。

在一种可能的实施方式中，所述音箱中设置有至少两个麦克风，所述收音能量信息中包括每个麦克风接收到所述预设语音信息的收音能量值；所述根据所述至少两个音箱的收音能量信息，在所述至少两个音箱中确定目标音箱，包括：

根据每个音箱中的至少两个麦克风接收到所述预设语音信息的收音能量值，确定每个音箱的收音能量平均值；

根据每个音箱的收音能量平均值，在所述至少两个音箱中确定目标音箱。

在一种可能的实施方式中，所述根据每个音箱的收音能量平均值，在所述至少两个音箱中确定目标音箱，包括：

根据每个音箱的收音能量平均值，在所述至少两个音箱中确定至少一个第一音箱，在所述至少两个音箱中、所述第一音箱的收音能量平均值最大；

在所述至少一个第一音箱中确定所述目标音箱。

在一种可能的实施方式中，在所述至少一个第一音箱中确定所述目标音箱，包括：

当所述至少一个第一音箱的个数为1时，将至少一个第一音箱确定为所述目标音箱；

当所述至少一个第一音箱的个数大于1时，获取每个第一音箱对应的最大收音能量值，根据每个第一音箱对应的最大收音能量值在所述至少一个第一音箱中确定至少一个第二音箱，并在所述至少一个第二音箱中确定所述目标音箱；其中，所述最大收音能量值为所述第一音箱中的至少两个麦克风的收音能量值中的最大值，在所述至少一个第一音箱中、所述第二音箱的最大收音能量值最大。

在一种可能的实施方式中，在所述至少一个第二音箱中确定所述目标音箱，包括：

当所述至少一个第二音箱的个数为1时，将至少一个第二音箱确定为所述目标音箱；

当所述至少一个第二音箱的个数大于1时，获取每个第二音箱中收音能量值最大的麦克风与其相邻的麦克风之间的收音能量差值，并根据每个第二音箱对应的收音能量差值，确定所述目标音箱。

在一种可能的实施方式中，所述根据每个第二音箱对应的收音能量差值，确定所述目标音箱，包括：

在所述至少一个第二音箱中确定收音能量差值最小的至少一个第三音箱；

当所述至少一个第三音箱的个数为1时，则将所述至少一个第三音箱确定为所述目标音箱；

当所述至少一个第三音箱的个数大于1时，则将所述至少一个第三音箱中的任意一个音箱确定为所述目标音箱。

在一种可能的实施方式中，所述方法还包括：

在所述至少两个音箱检测到所述预设语音信息之后，获取所述预设语音信息；

获取每个音箱对应的预设声纹和所述预设语音信息对应的声纹；

根据每个音箱对应的预设声纹和所述预设语音信息对应的声纹，在所述至少两个音箱中确定目标音箱，并唤醒所述目标音箱，所述目标音箱的声纹与所述预设语音信息对应的声纹匹配。

在一种可能的实施方式中，所述至少两个音箱位于相同的局域网。

在一种可能的实施方式中，所述至少两个音箱为智能音箱。

第二方面，本发明实施例提供一种音箱控制装置，包括：第一获取模块、确定模块和唤醒模块，其中，

所述第一获取模块用于，在至少两个音箱检测到预设语音信息之后，获取所述至少两个音箱的收音能量信息，所述收音能量信息用于指示所述音箱接收到所述预设语音信息的声音大小；

所述确定模块用于，根据所述至少两个音箱的收音能量信息，在所述至少两个音箱中确定目标音箱；

所述唤醒模块用于，唤醒所述目标音箱。

在一种可能的实施方式中，所述音箱中设置有至少两个麦克风，所述收音能量信息中包括每个麦克风接收到所述预设语音信息的收音能量值；所述确定模块具体用于：

在一种可能的实施方式中，所述确定模块具体用于：

在所述至少一个第一音箱中确定所述目标音箱。

在一种可能的实施方式中，所述确定模块具体用于：

在一种可能的实施方式中，所述确定模块具体用于：：

在一种可能的实施方式中，所述装置还包括第二获取模块，其中，

所述第二获取模块用于，在所述至少两个音箱检测到所述预设语音信息之后，获取所述预设语音信息，以及获取每个音箱对应的预设声纹和所述预设语音信息对应的声纹；

所述确定模块还用于，根据每个音箱对应的预设声纹和所述预设语音信息对应的声纹，在所述至少两个音箱中确定目标音箱，所述目标音箱的声纹与所述预设语音信息对应的声纹匹配；

所述唤醒模块还用于，唤醒所述目标音箱。

在一种可能的实施方式中，所述至少两个音箱为智能音箱。

第三方面，本发明实施例提供一种音箱控制装置，包括：至少一个处理器和存储器；

所述存储器存储计算机执行指令；

所述至少一个处理器执行所述存储器存储的计算机执行指令，使得所述至少一个处理器执行如第一方面任一项所述的音箱控制方法。

第四方面，本发明实施例提供一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机执行指令，当处理器执行所述计算机执行指令时，实现如第一方面任一项所述的音箱控制方法。

本发明实施例提供的音箱控制方法、装置及设备，在至少两个音箱监听到预设语音信息之后，服务器可以获取至少两个音箱的收音能量信息，根据至少两个音箱的收音能量信息在至少两个音箱中确定目标音箱，并唤醒目标音箱。在上述过程中，即使多个音箱同时监听到了用户的预设语音信息，服务器依然可以在该多个音箱中选择一个收音效果最好的目标音箱，并唤醒目标音箱。避免了当用户的声音太大时，对过多音箱进行不必要的唤醒，减少了音箱被误唤醒的概率，进而提高了对音箱进行控制的精确度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的音箱控制方法的应用场景示意图；

图2为本发明实施例提供的音箱控制方法的流程示意图；

图3A为本发明实施例提供的音箱示意图；

图3B为本发明实施例提供的音箱示意图；

图4为本发明实施例提供的另一种音箱控制方法的流程示意图；

图5为本发明实施例提供的音箱控制方法的流程示意图；

图6为本发明实施例提供的又一种音箱控制方法的流程示意图；

图7为本发明实施例提供的一种音箱示意图；

图8为本发明实施例提供的一种音箱控制装置结构示意图；

图9为本发明实施例提供的另一种音箱控制装置结构示意图；

图10为本发明实施例提供的音箱控制装置的硬件结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1为本发明实施例提供的音箱控制方法的应用场景示意图。请参见图1，包括多个音箱(例如，音箱1、音箱2、音箱3和音箱4)和服务器，该多个音箱位于同一局域网，每个音箱均可以与服务器进行通信。音箱的状态包括休眠状态和唤醒状态，在音箱处于休眠状态时，音箱可以进行语音监听，在监听到预设语音信息之后，音箱可以获取接收到预设语音信息的收音能量信息，收音能量信息用于指示音箱接收到预设语音信息的声音大小。音箱将收音能量信息发送给服务器，服务器根据音箱的收音能量信息在多个音箱中选择一个音箱，并唤醒选择的该一个音箱，在音箱被唤醒之后，音箱可以进行音频播放。

在本申请中，即使多个音箱同时监听到了用户的预设语音信息，服务器依然可以在该多个音箱中选择一个语音识别效果最好的音箱，并唤醒选择的音箱。避免了当用户的声音太大时，对过多音箱进行不必要的唤醒，减少了音箱被误唤醒的概率，进而提高了对智能音箱进行控制的精确度。

下面，通过具体实施例对本申请所示的技术方案进行详细说明。需要说明的是，下面几个具体实施例可以相互结合，对于相同或相似的内容，在不同的实施例中不再进行重复说明。

图2为本发明实施例提供的音箱控制方法的流程示意图。请参见图2，该方法可以包括：

S201、在至少两个音箱检测到预设语音信息之后，获取至少两个音箱的收音能量信息。

本发明实施例的执行主体可以为服务器，也可以为设置在服务器中的音箱控制装置。可选的，音箱控制装置可以通过软件实现，也可以通过软件和硬件的结合实现。

可选的，本发明实施例中所涉及的音箱可以为智能音箱，即，本发明实施例所涉及的音箱至少具备语音监听、语音识别、对语音信息进行处理、与服务器进行通信等功能。

可选的，至少两个音箱位于相同的局域网，即，至少两个音箱可以接入相同的局域网，并通过相同的局域网与服务器进行通信。

可选的，至少两个音箱在局域网中的位置不同。例如，至少两个音箱可以摆放在家庭的不同位置。

其中，预设语音信息为唤醒音箱的唤醒词。例如，预设语音信息可以为“嗨，小度音箱”、“你好，音箱”、“小度小度”等。

同一局域网中每个音箱的唤醒词可以相同。即，通过相同的唤醒词可以唤醒局域网中的所有音箱。

在实际应用过程中，至少两个音箱可以进行语音监听，在至少两个音箱监听到预设语音信息之后，至少两个音箱可以分别获取各自的收音能量值，并向服务器发送各自的收音能量值。

可选的，在至少两个音箱向服务器发送各自的收音能量值时，还可以向服务器发送音箱所在的局域网的标识，以使服务器可以根据局域网的标识识别同一局域网中的所有的音箱。

其中，收音能量信息用于指示音箱接收到预设语音信息的声音大小。

可选的，一个音箱中可以设置多个麦克风，每个麦克风均可以接收语音信息，相应的，一个音箱的收音能量信息中可以包括该音箱中每个麦克风的收音能量值。麦克风的收音能量值越大，说明该麦克风接收到的声音大小越大。

S202、根据至少两个音箱的收音能量信息，在至少两个音箱中确定目标音箱。

可选的，可以根据至少两个音箱的收音能量信息，在至少两个音箱中确定收音效果最好的音箱，并将语音识别效果最好的音箱确定为目标音箱。收音效果最好的音箱通常为距离用户最近的音箱，且该音箱的语音播放效果也最好。

需要说明的是，在图4所示的实施例中对确定目标音箱的过程进行说明，此处不再进行赘述。

S203、唤醒目标音箱。

可选的，在服务器确定得到目标音箱之后，服务器可以向目标音箱发送唤醒指令，以使目标音箱根据唤醒指令切换为唤醒状态。

需要说明的是，当只有一个音箱检测到预设语音信息时，则服务器仅获取到一个音箱的收音能量信息，相应的，服务器则将该一个音箱确定为目标音箱，并唤醒该一个音箱。

本发明实施例提供的音箱控制方法，在至少两个音箱监听到预设语音信息之后，服务器可以获取至少两个音箱的收音能量信息，根据至少两个音箱的收音能量信息在至少两个音箱中确定目标音箱，并唤醒目标音箱。在上述过程中，即使多个音箱同时监听到了用户的预设语音信息，服务器依然可以在该多个音箱中选择一个收音效果最好的目标音箱，并唤醒目标音箱。避免了当用户的声音太大时，对过多音箱进行不必要的唤醒，减少了音箱被误唤醒的概率，进而提高了对音箱进行控制的精确度。

在图2所示实施例的基础上，可选的，音箱中设置有至少两个麦克风，每个麦克风可以接收语音信息。可选的，音箱可以为立体音箱，当音箱为圆柱体时，可以将位置相邻的麦克风称为相邻的麦克风。当音箱为立方体时，可以在音箱的不同侧面可以设置多个麦克风，可以将同一侧面设置的、位置相邻的多个麦克风称为相邻的麦克风，或者，还可以将不同面设置的、位置相邻的麦克风称为相邻的麦克风。下面，结合图3，对音箱中的麦克风进行说明。

图3A为本发明实施例提供的音箱示意图。请参见图3A，音箱为圆柱体，在音箱的侧面设置有麦克风A、麦克风B、麦克风C和麦克风D，则麦克风A与麦克风B、麦克风B和麦克风C、麦克风C和麦克风D为相邻的麦克风。

图3B为本发明实施例提供的音箱示意图。请参见图3B，音箱为立方体，在音箱的一个侧面设置有麦克风E、麦克风F和麦克风G，在音箱的另一个侧面设置有麦克风H和麦克风I，则麦克风E与麦克风F、麦克风F和麦克风G、麦克风H和麦克风I为相邻的麦克风。或者，还可以将麦克风G和麦克风H也称为相邻的麦克风。

图4为本发明实施例提供的另一种音箱控制方法的流程示意图。请参见图4，该方法可以包括：

S401、根据每个音箱中的至少两个麦克风接收到预设语音信息的收音能量值，确定每个音箱的收音能量平均值。

其中，针对任意一个音箱，该音箱的收音能量信息中包括该音箱中每个麦克风接收预设语音信息的收音能量值。

针对任意一个音箱，可以将该音箱中的麦克风的收音能量值的平均值确定为该音箱的收音能量平均值。

例如，假设一个音箱中设置有3个麦克风，分别记为麦克风1、麦克风2和麦克风3，假设麦克风1接收预设语音信息的收音能量值为a，麦克风2接收预设语音信息的收音能量值为b，麦克风3接收预设语音信息的收音能量值为c，相应的，该音箱的收音能量平均值为(a+b+c)/3。

S402、根据每个音箱的收音能量平均值，在至少两个音箱中确定至少一个第一音箱。

其中，在至少两个音箱中、第一音箱的收音能量平均值最大。

可选的，第一音箱的个数可能为1个，也可能为多个。

S403、判断第一音箱的个数是否大于1。

若是，则执行S405。

若否，则执行S404。

S404、将该一个第一音箱确定为目标音箱。

当第一音箱的个数不大于1时，则第一音箱的个数为1。由于第一音箱的个数为1，因此，可以将该一个第一音箱确定为目标音箱。

S405、获取每个第一音箱对应的最大收音能量值。

其中，最大收音能量值为第一音箱中的至少两个麦克风的收音能量值中的最大值。

例如，假设第一音箱中设置有3个麦克风，分别记为麦克风1、麦克风2和麦克风3，在麦克风1、麦克风2和麦克风3中，假设麦克风1的收音能量值最大，则将麦克风1的收音能量值确定为第一音箱对应的最大收音能量值。

S406、根据每个第一音箱对应的最大收音能量值在至少一个第一音箱中确定至少一个第二音箱。

其中，在至少一个第一音箱中、第二音箱的最大收音能量值最大。

可选的，第二音箱的个数可能为1个，也可能为多个。

S407、判断第二音箱的个数是否大于1。

若是，则执行S409。

若否，则执行S408。

S408、将该一个第二音箱确定为目标音箱。

当第二音箱的个数不大于1时，则第二音箱的个数为1。由于第二音箱的个数为1，因此，可以将该一个第二音箱确定为目标音箱。

S409、获取每个第二音箱中收音能量值最大的麦克风与其相邻的麦克风之间的收音能量差值。

例如，假设第二音箱如图3B所示，且第二音箱中的麦克风E的收音能量最大，麦克风E的相邻的麦克风为麦克风F，则第二音箱对应的收音能量差值为麦克风E和麦克风F之间的收音能量值的差值。

例如，假设第二音箱如图3B所示，且第二音箱中的麦克风F的收音能量最大，麦克风E的相邻的麦克风为麦克风E和麦克风G，假设麦克风F与麦克风E之间的收音能量值的差值为差值1，麦克风F和麦克风G之间的收音能量值的差值为差值2，则第二音箱对应的收音能量差值为：差值1和差值2中最小的差值。

S410、在至少一个第二音箱中确定收音能量差值最小的至少一个第三音箱。

可选的，第三音箱的个数可能为1，也可能大于1。

S411、判断第三音箱的个数是否大于1。

若是，则执行S413。

若否，则执行S412。

S412、将该一个第三音箱确定为目标音箱。

当第三音箱的个数不大于1时，则第三音箱的个数为1。由于第三音箱的个数为1，因此，可以将该一个第三音箱确定为目标音箱。

S413、将至少一个第三音箱中的任意一个音箱确定为目标音箱。

由于至少一个第三音箱中每个音箱的收音能量平均值相同、最大收音能量值相同、且收音能量差值相同，因此，可以在至少一个第三音箱中任意选择一个音箱作为目标音箱。

在图4所示的实施例中，先在至少两个音箱中确定收音能量平均值最大的至少一个第一音箱，若第一音箱的个数为1，则将该一个第一音箱确定为目标音箱。若第一音箱的个数大于1，则在至少一个第一音箱中确定最大收音能量值最大的至少一个第二音箱，若第二音箱的个数为1，则将该一个第二音箱确定为目标音箱。若第二音箱的个数大于1，则在至少一个第二音箱中确定收音能量差值最小的至少一个第三音箱，若第三音箱的个数为1，则将该一个第三音箱确定为目标音箱，若第三音箱的个数大于1，则在至少一个第三音箱中任意选择一个音箱作为目标音箱。在上述过程中，可以使得确定得到的目标音箱为收音效果最好的音箱。

下面，结合图5，通过具体示例，对上述方法实施例所示的音箱控制方法进行详细说明。

图5为本发明实施例提供的音箱控制方法的流程示意图。请参见图5，在局域网中设置有6个音箱，分别记为音箱1、音箱2、音箱3、音箱4、音箱5和音箱6。假设该6个音箱的唤醒词分别为“嗨，小度”。

在实际应用过程中，当用户需要唤醒距离自己最近(或者是收音效果最好)的一个音箱时，用户可以说“嗨，小度”。假设用户说了“嗨，小度”之后，距离用户较近的音箱2、音箱4、音箱5和音箱6监听到了该语音信息，则音箱2、音箱4、音箱5和音箱6分别将各自音箱的收音能量信息发送给服务器。其中，每个音箱的收音能量信息包括各自音箱中设置的麦克风的收音能量值发送给服务器。

服务器先根据音箱2、音箱4、音箱5和音箱6的收音能量信息确定收音能量平均值最大的音箱，假设确定得到收音能量平均值最大的音箱为音箱4、音箱5和音箱6。由于收音能量平均值最大的音箱的个数大于1，则服务器在音箱4、音箱5和音箱6中确定最大收音能量值最大的音箱，假设确定得到的最大收音能量值最大的音箱为音箱4和音箱6。由于最大收音能量值最大的音箱的个数大于1，则服务器在音箱4和音箱6中确定收音能量差值最小的音箱，假设收音能量差值最小的音箱为音箱6，则将音箱6确定为目标音箱，并唤醒音箱6。

在上述过程中，在用户说出对音箱的唤醒词“嗨，小度”之后，即使多个音箱监听到了该唤醒词，则服务器在该多个音箱中确定距离用户最近、收音效果最好的一个音箱，并唤醒该一个音箱，避免了当用户的声音太大时，对过多音箱进行不必要的唤醒，减少了音箱被误唤醒的概率，进而提高了对智能音箱进行控制的精确度。

在上述任意一个实施例的基础上，可选的，可以预先为每个音箱设置对应的预设声纹，相应的，只有该声纹的声音可以唤醒该音箱。下面，结合图6所示的实施例，对该种情况下的音箱控制方法进行说明。

图6为本发明实施例提供的又一种音箱控制方法的流程示意图。请参见图6，该方法可以包括：

S601、在至少两个音箱检测到预设语音信息之后，获取预设语音信息。

可选的，在至少两个音箱检测到预设语音信息之后，向服务器发送检测到预设语音信息。

可选的，该至少两个音箱向服务器发送的预设语音信息相同。

可选的，在至少两个音箱向服务器发送预设语音信息时，还可以向服务器发送音箱所在的局域网的标识，以使服务器可以根据局域网的标识识别同一局域网中的所有的音箱。

S602、获取每个音箱对应的预设声纹和预设语音信息对应的声纹。

可选的，可以在服务器中预先存储每个音箱对应的预设声纹。

服务器接收到预设语音信息之后，可以对语音信息进行识别处理，以识别得到预设语音信息对应的声纹。

S603、根据每个音箱对应的预设声纹和预设语音信息对应的声纹，在至少两个音箱中确定目标音箱。

其中，目标音箱的声纹与预设语音信息对应的声纹匹配。

可选的，音箱与预设声纹之间可以是一一对应的关系，因此，服务器根据预设语音信息可以在至少两个音箱中确定得到一个音箱。

可选的，音箱和预设声纹之间也可以是多对一的关系，即，一个预设声纹对应的声音可以唤醒多个音箱。相应的，服务器可能会识别得到多个与预设语音信息对应的声纹匹配的音箱，则可以将与预设语音信息对应的声纹匹配的任意一个音箱确定为目标音箱，或者，也可以通过图2-图5实施例所示的方法在与预设语音信息对应的声纹匹配的音箱中确定目标音箱。

S604、唤醒目标音箱。

需要说明的是，S604的执行过程可以参见S203的执行过程，此处不再进行赘述。

下面，结合图7，通过具体示例对图6实施例所示的方法进行说明。

图7为本发明实施例提供的一种音箱示意图。请参见图7，局域网中设置有音箱1、音箱2、音箱3和音箱4，假设预先设置用户1的声纹与音箱1对应，用户2的声纹与音箱2对应，用户3的声纹与音箱3对应，用户4的声纹与音箱4对应。即，只有用户1说的唤醒词可以唤醒音箱1，只有用户2说的唤醒词可以唤醒音箱2，只有用户3说的唤醒词可以唤醒音箱3，只有用户4说的唤醒词可以唤醒音箱4。

在实际应用过程中，当用户1说出唤醒词之后，假设音箱1、音箱2、音箱3和音箱4均监听到了该唤醒词，则分别将该唤醒词发送给服务器，服务器判断该唤醒词的声纹与音箱1对应，则服务器唤醒音箱1。

在图6-图7所示的实施例中，可以预先设置音箱和声纹的对应关系，这样，即使多个音箱同时监听到了用户的预设语音信息，服务器依然可以在该多个音箱中选择一个与预设语音信息的声纹匹配的音箱，并唤醒该音箱。避免了当用户的声音太大时，对过多音箱进行不必要的唤醒，减少了音箱被误唤醒的概率，进而提高了对智能音箱进行控制的精确度。

图8为本发明实施例提供的一种音箱控制装置结构示意图。请参见图8，音箱控制装置10包括：第一获取模块11、确定模块12和唤醒模块13，其中，

所述第一获取模块11用于，在至少两个音箱检测到预设语音信息之后，获取所述至少两个音箱的收音能量信息，所述收音能量信息用于指示所述音箱接收到所述预设语音信息的声音大小；

所述确定模块12用于，根据所述至少两个音箱的收音能量信息，在所述至少两个音箱中确定目标音箱；

所述唤醒模块13用于，唤醒所述目标音箱。

需要说明的是，本发明实施例提供的音箱控制装置可以执行上述方法实施例所示的技术方案，其实现原理以及有益效果类似，此次不再进行赘述。

在一种可能的实施方式中，所述音箱中设置有至少两个麦克风，所述收音能量信息中包括每个麦克风接收到所述预设语音信息的收音能量值；所述确定模块12具体用于：

在一种可能的实施方式中，所述确定模块12具体用于：

在所述至少一个第一音箱中确定所述目标音箱。

在一种可能的实施方式中所述确定模块12具体用于：

在一种可能的实施方式中，所述确定模块12具体用于：：

图9为本发明实施例提供的另一种音箱控制装置结构示意图。在图8所示实施例的基础上，请参见图9，音箱控制装置10还包括第二获取模块14，其中，

所述第二获取模块14用于，在所述至少两个音箱检测到所述预设语音信息之后，获取所述预设语音信息，以及获取每个音箱对应的预设声纹和所述预设语音信息对应的声纹；

所述确定模块12还用于，根据每个音箱对应的预设声纹和所述预设语音信息对应的声纹，在所述至少两个音箱中确定目标音箱，所述目标音箱的声纹与所述预设语音信息对应的声纹匹配；

所述唤醒模块13还用于，唤醒所述目标音箱。

在一种可能的实施方式中，所述至少两个音箱为智能音箱。

图10为本发明实施例提供的音箱控制装置的硬件结构示意图，如图10所示，该音箱控制装置20包括：至少一个处理器21和存储器22。其中，处理器21和存储器22通过总线23连接。

可选的，音箱控制装置20还可以包括通信部件，通信部件可以包括接收器和/或发送器。

在具体实现过程中，至少一个处理器21执行所述存储器22存储的计算机执行指令，使得至少一个处理器21执行如上的音箱控制方法。

处理器21的具体实现过程可参见上述方法实施例，其实现原理和技术效果类似，本实施例此处不再赘述。

在上述图10所示的实施例中，应理解，处理器可以是中央处理单元(英文：CentralProcessing Unit，简称：CPU)，还可以是其他通用处理器、数字信号处理器(英文：DigitalSignal Processor，简称：DSP)、专用集成电路(英文：Application Specific IntegratedCircuit，简称：ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合发明所公开的方法的步骤可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。

存储器可能包含高速RAM存储器，也可能还包括非易失性存储NVM，例如至少一个磁盘存储器。

总线可以是工业标准体系结构(Industry Standard Architecture，ISA)总线、外部设备互连(Peripheral Component，PCI)总线或扩展工业标准体系结构(ExtendedIndustry Standard Architecture，EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示，本申请附图中的总线并不限定仅有一根总线或一种类型的总线。

本申请还提供一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机执行指令，当处理器执行所述计算机执行指令时，实现如上所述的音箱控制方法。

上述的计算机可读存储介质，上述可读存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。可读存储介质可以是通用或专用计算机能够存取的任何可用介质。

一种示例性的可读存储介质耦合至处理器，从而使处理器能够从该可读存储介质读取信息，且可向该可读存储介质写入信息。当然，可读存储介质也可以是处理器的组成部分。处理器和可读存储介质可以位于专用集成电路(Application Specific IntegratedCircuits，简称：ASIC)中。当然，处理器和可读存储介质也可以作为分立组件存在于设备中。

所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个***，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

本领域普通技术人员可以理解：实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时，执行包括上述各方法实施例的步骤；而前述的存储介质包括：ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。本领域普通技术人员可以理解：实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时，执行包括上述各方法实施例的步骤；而前述的存储介质包括：ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims

1.一种音箱控制方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述音箱中设置有至少两个麦克风，所述收音能量信息中包括每个麦克风接收到所述预设语音信息的收音能量值；所述根据所述至少两个音箱的收音能量信息，在所述至少两个音箱中确定目标音箱，包括：

3.根据权利要求2所述的方法，其特征在于，所述根据每个音箱的收音能量平均值，在所述至少两个音箱中确定目标音箱，包括：

在所述至少一个第一音箱中确定所述目标音箱。

4.根据权利要求3所述的方法，其特征在于，在所述至少一个第一音箱中确定所述目标音箱，包括：

5.根据权利要求4所述的方法，其特征在于，在所述至少一个第二音箱中确定所述目标音箱，包括：

6.根据权利要求5所述的方法，其特征在于，所述根据每个第二音箱对应的收音能量差值，确定所述目标音箱，包括：

7.根据权利要求1-6任一项所述的方法，其特征在于，所述方法还包括：

8.根据权利要求1-7任一项所述的方法，其特征在于，所述至少两个音箱位于相同的局域网。

9.根据权利要求1-8任一项所述的方法，其特征在于，所述至少两个音箱为智能音箱。

10.一种音箱控制装置，其特征在于，包括：第一获取模块、确定模块和唤醒模块，其中，

所述唤醒模块用于，唤醒所述目标音箱。

11.根据权利要求10所述的装置，其特征在于，所述音箱中设置有至少两个麦克风，所述收音能量信息中包括每个麦克风接收到所述预设语音信息的收音能量值；所述确定模块具体用于：

12.根据权利要求11所述的装置，其特征在于，所述确定模块具体用于：

在所述至少一个第一音箱中确定所述目标音箱。

13.根据权利要求12所述的装置，其特征在于，所述确定模块具体用于：

14.根据权利要求13所述的装置，其特征在于，所述确定模块具体用于：

15.根据权利要求14所述的装置，其特征在于，所述确定模块具体用于：

16.根据权利要求10-15任一项所述的装置，其特征在于，所述装置还包括第二获取模块，其中，

所述唤醒模块还用于，唤醒所述目标音箱。

17.根据权利要求10-16任一项所述的装置，其特征在于，所述至少两个音箱位于相同的局域网。

18.根据权利要求10-17任一项所述的装置，其特征在于，所述至少两个音箱为智能音箱。

19.一种音箱控制装置，其特征在于，包括：至少一个处理器和存储器；

所述存储器存储计算机执行指令；

所述至少一个处理器执行所述存储器存储的计算机执行指令，使得所述至少一个处理器执行如权利要求1-9任一项所述的音箱控制方法。

20.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机执行指令，当处理器执行所述计算机执行指令时，实现如权利要求1-9任一项所述的音箱控制方法。