CN112164398A

CN112164398A - 语音设备及其唤醒方法、装置以及存储介质

Info

Publication number: CN112164398A
Application number: CN202011221993.7A
Authority: CN
Inventors: 霍伟明; 张新健; 陈柏仰
Original assignee: GD Midea Air Conditioning Equipment Co Ltd; Foshan Shunde Midea Electric Science and Technology Co Ltd
Current assignee: GD Midea Air Conditioning Equipment Co Ltd; Foshan Shunde Midea Electric Science and Technology Co Ltd
Priority date: 2020-11-05
Filing date: 2020-11-05
Publication date: 2021-01-01
Anticipated expiration: 2040-11-05
Also published as: CN112164398B

Abstract

本发明公开了一种语音设备及其唤醒方法、装置以及存储介质，语音设备的唤醒方法，包括以下步骤：第一语音设备响应语音唤醒指令时，播报预设语音信息，并接收至少一个第二语音设备播报的预设语音信息；所述第一语音设备根据至少一个第二语音设备播报的预设语音信息确定至少一个第二语音设备中是否存在与第一语音设备同类型的语音设备；如果至少一个第二语音设备中存在与第一语音设备同类型的语音设备，第一语音设备则根据预设规则确定是否进入交互环节。由此，该唤醒方法可以在多个语音设备均响应语音唤醒指令时，进一步进行唤醒修正，以便实现唯一唤醒功能，提升用户使用体验。

Description

语音设备及其唤醒方法、装置以及存储介质

技术领域

本申请涉及语音技术领域，尤其是涉及一种语音设备及其唤醒方法、装置以及存储介质。

背景技术

随着家电产品越来越智能化，语音识别技术日趋成熟，语音识别技术应用到家电产品已成趋势。目前，很多用户家庭普遍存在多种品类的语音设备，而各语音设备的唤醒方式大都相同，由此容易导致一次操作同时唤醒多个设备的情况的发生，影响用户使用。

发明内容

本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此，本发明的一个目的在于提出一种语音设备的唤醒方法，以实现多个语音设备的唯一唤醒。

本发明的第二个目的在于提出一种语音设备的唤醒装置。

本发明的第三个目的在于提出一种计算机可读存储介质。

本发明的第四个目的在于提出一种语音设备。

为达上述目的，本发明第一方面实施例提出了一种语音设备的唤醒方法，包括：

第一语音设备被语音唤醒指令唤醒时，播报预设语音信息，并接收至少一个第二语音设备播报的预设语音信息；

所述第一语音设备根据所述至少一个第二语音设备播报的预设语音信息确定所述至少一个第二语音设备中是否存在与所述第一语音设备同类型的语音设备；

如果所述至少一个第二语音设备中存在与所述第一语音设备同类型的语音设备，所述第一语音设备则根据预设规则确定是否进入交互环节。

根据本发明实施例的语音设备的唤醒方法，当语音唤醒指令唤醒第一语音设备和第二语音设备时，唤醒方法可以对唤醒过程进行修正，以实现唯一唤醒功能，提升用户使用体验。

根据本发明的一个实施例，所述预设语音信息包括预设回复语音，其中，所述根据所述至少一个第二语音设备播报的预设语音信息确定所述至少一个第二语音设备中是否存在与所述第一语音设备同类型的语音设备，包括：根据所述至少一个第二语音设备播报的回复语音进行特征运算，得到相应的特征信息；根据所述特征信息确定所述至少一个第二语音设备中是否存在与所述第一语音设备同类型的语音设备。

根据本发明的一个实施例，所述预设语音信息包括语音设备的版本信息，其中，所述根据所述至少一个第二语音设备播报的预设语音信息确定所述至少一个第二语音设备中是否存在与所述第一语音设备同类型的语音设备，包括：将所述至少一个第二语音设备播报的版本信息与所述第一语音设备的版本信息进行比对；根据比对结果确定所述至少一个第二语音设备中是否存在与所述第一语音设备同类型的语音设备。

根据本发明的一个实施例，在所述第一语音设备根据预设规则确定是否进入交互环节之前，所述唤醒方法还包括：所述第一语音设备接收第三语音设备播报的确认语音，其中，所述第三语音设备为所述至少一个第二语音设备中与所述第一语音设备同类型的语音设备。

根据本发明的一个实施例，所述第一语音设备根据预设规则确定进入交互环节时，所述唤醒方法还包括：所述第一语音设备发出交互提示信息，以进行语音交互提示。

根据本发明的一个实施例，所述预设规则包括如下规则中的至少一者：CPU处理能力强的优先、内存空闲大的优先、功能数量多的优先、软件版本高的优先、自定义排序在前的优先。

根据本发明的一个实施例，所述特征信息包括机械声纹信息、意图信息中的至少一者。

为达上述目的，本发明第二方面实施例提出了一种语音设备的唤醒装置，包括：

播报模块，用于在响应语音唤醒指令时，播报预设语音信息；

接收模块，用于接收其他语音设备播报的预设语音信息；

确定模块，用于根据所述其他语音设备播报的预设语音信息确定所述其他语音设备播报中是否存在与所述唤醒装置所属语音设备同类型的语音设备，以及在所述其他语音设备中存在与所述唤醒装置所属语音设备同类型的语音设备时，根据预设规则确定所述唤醒装置所属语音设备是否进入交互环节。

根据本发明实施例的唤醒装置，唤醒装置可以对语音设备的唤醒过程进行修正，以实现唯一唤醒功能，提升用户使用体验。

为达上述目的，本发明第三方面实施例提出了一种计算机可读存储介质，所述计算机程序被处理器执行时，实现如本发明第一方面实施例所述的语音设备的唤醒方法。

为达上述目的，本发明第四方面实施例提出了一种语音设备包括：如本发明第二方面实施例所述的语音设备的唤醒装置；或者存储器、处理器和存储在所述存储器上的计算机程序，所述计算机程序被所述处理器执行时，实现如本发明第一方面实施例所述的语音设备的唤醒方法。

本发明附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

图1是根据本发明实施例的语音设备的唤醒方法的流程图；

图2是根据本发明一个具体实施例的语音设备的唤醒方法的流程图；

图3是根据本发明另一个具体实施例的语音设备的唤醒方法的流程图；

图4是根据本发明实施例的语音设备的唤醒装置的结构框图；

图5是根据本发明一个实施例的语音设备的结构框图；

图6是根据本发明另一个实施例的语音设备的结构框图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本发明，而不能理解为对本发明的限制。

下面参考附图描述本发明实施例的语音设备及其唤醒方法、装置以及存储介质。

图1是根据本发明实施例的语音设备的唤醒方法的流程图。

如图1所示，该语音设备的唤醒方法包括以下步骤：

S101，第一语音设备响应语音唤醒指令时，播报预设语音信息，并接收至少一个第二语音设备播报的预设语音信息。

S102，第一语音设备根据至少一个第二语音设备播报的预设语音信息确定至少一个第二语音设备中是否存在与第一语音设备同类型的语音设备。

S103，如果至少一个第二语音设备中存在与第一语音设备同类型的语音设备，第一语音设备则根据预设规则确定是否进入交互环节。

在该实施例中，第一语音设备和至少一个第二语音设备均响应语音唤醒指令，可以是第一语音设备和至少一个第二语音设备根据接收到的语音唤醒指令确定唤醒语种为预设语种，如粤语，且语音能量值均相同。即言，仅仅通过语种、语音能量值，无法实现多个语音设备的唯一唤醒功能。

当多个语音设备均响应语音唤醒指令时，可播报预设语音信息，如可以通过扬声器播报预设语音信息，也可通过局域网向处于同一局域网内的其他语音设备或特定设备播报预设语音信息，还可向云端服务器发送预设语音信息。以语音设备接收到预设语音信息为例，第一语音设备可以根据接收到的所有第二语音设备的预设语音信息确定，至少一个第二语音设备中是否存在与第一语音设备属于同类型的语音设备。

当至少一个第二语音设备中存在与第一语音设备属于同类型的语音设备时，如至少一个第二语音设备包括柜式空调，第一语音设备为挂式空调时，第一语音设备可以根据预设规则确定是否进入交互环节，此时，与第一语音设备同类型的语音设备也可根据预设规则确定是否进入交互环节。当确定第一语音设备进入交互环节时，各第二语音设备可调节至休眠状态(即非唤醒状态)，此时第一语音设备可以被唯一唤醒并进入交互环节，以与用户交互。

举例而言，以两同类型的语音设备均为空调器为例，一个空调器设置在客厅，另一个设置在卧室，两空调器可以通过局域网实现通讯。当用户在客厅和卧室之间的位置发出语音唤醒指令时，两空调器均响应该语音唤醒指令，并播报预设语音信息。两空调器均可以接收到对方播报的预设语音信息，进而可根据接收到的预设语音信息确定存在于自身属于同类型的语音设备。此时，两空调器可按照预设规则(如使用频率高者优先)确认自身是否可进入交互环节。由于设置在客厅的空调器使用更为频繁，则设置在客厅的空调器可进入交互环节，并发出交互提示信息；而设置在卧室的空调器，可进入休眠状态。

由此，根据本发明实施例的语音设备的唤醒方法，可更好的保证实现唯一唤醒功能，提升用户使用体验。

需要说明的是，若存在多组同类型的语音设备响应语音唤醒指令，则可进一步根据语音唤醒指令确定用户身份信息，如用户是儿童、青年、老年，以便根据用户身份信息确定待唤醒语音设备的类型，再执行上述S103的步骤。

在本发明的一些实施例中，预设语音信息可包括预设回复语音。其中，参见图2，根据至少一个第二语音设备播报的预设语音信息确定至少一个第二语音设备中是否存在与第一语音设备同类型的语音设备，可包括：根据至少一个第二语音设备播报的回复语音进行特征运算，得到相应的特征信息，并根据特征信息确定上述的第二语音设备中是否存在与第一语音设备同类型的语音设备。

具体地，当语音设备响应语音唤醒指令唤醒时，语音设备将播报预设语音信息，多个语音设备之间可以相互接收其他语音设备播报的预设语音信息，而且每个语音设备可以根据接收到的回复语音进行特征运算，以确定该语音设备是否与其属于同类型的语音设备。即言，对于某一语音设备(记为第一语音设备)，可以根据其接收到的其他语音设备(记为至少一个第二语音设备)播报的回复语音进行特征运算得到特征信息，并根据特征信息确定第二语音设备与第一语音设备是否属于同类型的语音设备。

其中，特征信息可包括机械声纹信息、意图信息(如空气调节意图、视听娱乐意图等)中的至少一者，同类型的语音设备对应的机械声纹信息、意图信息相同或相似度大于一定值。基于此，可以通过语音设备对回复语音的特征运算获得机械声纹信息或意图信息，以确定至少一个第二语音设备中是否存在与第一语音设备属于同类型的语音设备。

在本发明的另一些实施例中，预设语音信息可包括语音设备的版本信息。其中，参见图3，根据至少一个第二语音设备播报的预设语音信息确定至少一个第二语音设备中是否存在与第一语音设备同类型的语音设备，可包括：将至少一个第二语音设备播报的版本信息与第一语音设备的版本信息进行比对；根据比对结果确定至少一个第二语音设备中是否存在与第一语音设备同类型的语音设备。

具体地，当语音设备被唤醒时，语音设备将播报预设语音信息，多个语音设备之间可以相互接收其他语音设备播报的预设语音信息，而且每个语音设备可以根据接收到的版本信息进行比对，以确定该语音设备是否与其属于同类型的语音设备。即言，对于某一语音设备(记为第一语音设备)，可以将其接收到的其他语音设备(记为至少一个第二语音设备)播报的版本信息与第一语音设备的版本信息进行比对，并根据比对结果确定至少一个第二语音设备中是否存在与第一语音设备属于同类型的语音设备。

其中，版本信息可以是语音设备安装的软件版本的信息，不同语音设备可以安装相同版本的软件，也可安装不同版本的软件，可通过版本信息对软件版本进行区别。

在本发明的又一些实施例中，预设语音信息可包括预设回复语音和语音设备的版本信息，进而在确定同类型语音设备时，既可进行声学判断，又可进行版本信息判断，由此，可更好的保证判断的准确性。

在本发明的一些实施例中，在第一语音设备根据预设规则确定是否进入交互环节之前，唤醒方法还可包括：第一语音设备接收第三语音设备播报的确认语音。其中，第三语音设备为至少一个第二语音设备中与第一语音设备同类型的语音设备。第一语音设备可以接收第三语音设备播报的确认语音，以进一步确认需通过预设规则确定进入交互环节的语音设备。

可以理解的是，第三语音设备与第一语音设备属于同类型的语音设备，为了实现唯一唤醒功能，需要在第一语音设备和第三语音设备中选择一个以进入交互环节。

在本发明的一些实施例中，第一语音设备根据预设规则确定进入交互环节时，唤醒方法还可包括：第一语音设备发出交互提示信息，以进行语音交互提示，从而可以提示用户可以进入正常的交互环节。如：当确认第一语音设备可以进入交互环节时，第一语音设备可以发出交互提示信息，以对用户进行提示，即提示用户可与当前发出交互提示信息的语音设备进行交互。其中，提示交互信息可以是“唯一唤醒结果已修正，请继续对我说”等，但不限于此。

在本发明的一些实施例中，预设规则包括如下规则中的至少一者：CPU处理能力强的优先、内存空闲大的优先、功能数量多的优先、软件版本高的优先、自定义排序在前的优先。根据预设规则，可以在同类型的第一语音设备和第二语音设备中选取适于进入交互环节的语音设备，以通过性能相对占优的语音设备与用户进行交互。

综上所述，本发明实施例的语音设备的唤醒方法，可在多个语音设备均响应语音唤醒指令时，进一步进行同类型语音设备的确认，以从同类型的语音设备中选择一个进行唤醒，进入交互环节。由此，可保证唯一唤醒的实现，提升用户体验。

图4是根据本发明实施例的语音设备的唤醒装置的结构框图。

如图4所示，语音设备的唤醒装置100包括：播报模块10、接收模块20和确定模块30。

播报模块10用于在响应语音唤醒指令时，播报预设语音信息。

接收模块20用于接收其他语音设备播报的预设语音信息。

确定模块30用于根据其他语音设备播报的预设语音信息确定其他语音设备播报中是否存在与唤醒装置100所属语音设备同类型的语音设备，以及在其他语音设备中存在与唤醒装置100所属语音设备同类型的语音设备时，根据预设规则确定唤醒装置100所属语音设备是否进入交互环节。

其中，预设规则包括如下规则中的至少一者：CPU处理能力强的优先、内存空闲大的优先、功能数量多的优先、软件版本高的优先、自定义排序在前的优先。

在一些实施例中，预设语音信息可包括预设回复语音，其中，确定模块30具体可用于根据其他语音设备播报的回复语音进行特征运算，得到相应的特征信息；根据特征信息确定其他语音设备播报中是否存在与唤醒装置100所属语音设备同类型的语音设备。

其中，特征信息包括机械声纹信息、意图信息中的至少一者。

在另一些实施例中，预设语音信息可包括语音设备的版本信息，其中，确定模块30具体可用于将其他语音设备播报的版本信息与唤醒装置100所属语音设备的版本信息进行比对；根据比对结果确定其他语音设备播报中是否存在与唤醒装置100所属语音设备同类型的语音设备。

在一些实施例中，接收模块20还用于在确定模块30根据预设规则确定唤醒装置100所属语音设备是否进入交互环节之前，接收其他语音设备中与唤醒装置100所属语音设备同类型的语音设备播报的确认语音。

在一些实施例中，确定模块30在根据预设规则确定唤醒装置100所属语音设备进入交互环节时，播报模块10还用于发出交互提示信息，以进行语音交互提示。

需要说明的是，本发明实施例的语音设备的唤醒装置的其他具体实施方式，可参见本发明上述实施例的语音设备的唤醒方法。

为了实现上述实施例，本发明还提出一种语音设备。

在本发明的一个实施例中，如图5所示，语音设备1000包括：上述的语音设备的唤醒装置100。

在本发明的另一个实施例中，如图6所示，语音设备1000包括：存储器200、处理器300和存储在存储器200上的计算机程序400，计算机程序400被处理器执行时，实现上述的语音设备的唤醒方法。

为了实现上述实施例，本发明实施例还提出一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时，实现上述的语音设备的唤醒方法。

需要说明的是，在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行***、装置或设备(如基于计算机的***、包括处理器的***或其他可以从指令执行***、装置或设备取指令并执行指令的***)使用，或结合这些指令执行***、装置或设备而使用。就本说明书而言，"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行***、装置或设备或结合这些指令执行***、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(RAM)，只读存储器(ROM)，可擦除可编辑只读存储器(EPROM或闪速存储器)，光纤装置，以及便携式光盘只读存储器(CDROM)。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。

应当理解，本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行***执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

在本发明中，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或成一体；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通或两个元件的相互作用关系，除非另有明确的限定。对于本领域的普通技术人员而言，可以根据具体情况理解上述术语在本发明中的具体含义。

在本发明中，除非另有明确的规定和限定，第一特征在第二特征“上”或“下”可以是第一和第二特征直接接触，或第一和第二特征通过中间媒介间接接触。而且，第一特征在第二特征“之上”、“上方”和“上面”可是第一特征在第二特征正上方或斜上方，或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方，或仅仅表示第一特征水平高度小于第二特征。

尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

1.一种语音设备的唤醒方法，其特征在于，包括以下步骤：

第一语音设备响应语音唤醒指令时，播报预设语音信息，并接收至少一个第二语音设备播报的预设语音信息；

2.如权利要求1所述的语音设备的唤醒方法，其特征在于，所述预设语音信息包括预设回复语音，其中，所述根据所述至少一个第二语音设备播报的预设语音信息确定所述至少一个第二语音设备中是否存在与所述第一语音设备同类型的语音设备，包括：

根据所述至少一个第二语音设备播报的回复语音进行特征运算，得到相应的特征信息；

根据所述特征信息确定所述至少一个第二语音设备中是否存在与所述第一语音设备同类型的语音设备。

3.如权利要求1所述的语音设备的唤醒方法，其特征在于，所述预设语音信息包括语音设备的版本信息，其中，所述根据所述至少一个第二语音设备播报的预设语音信息确定所述至少一个第二语音设备中是否存在与所述第一语音设备同类型的语音设备，包括：

将所述至少一个第二语音设备播报的版本信息与所述第一语音设备的版本信息进行比对；

根据比对结果确定所述至少一个第二语音设备中是否存在与所述第一语音设备同类型的语音设备。

4.如权利要求1所述的语音设备的唤醒方法，其特征在于，在所述第一语音设备根据预设规则确定是否进入交互环节之前，所述唤醒方法还包括：

所述第一语音设备接收第三语音设备播报的确认语音，其中，所述第三语音设备为所述至少一个第二语音设备中与所述第一语音设备同类型的语音设备。

5.如权利要求1所述的语音设备的唤醒方法，其特征在于，所述第一语音设备根据预设规则确定进入交互环节时，所述唤醒方法还包括：

所述第一语音设备发出交互提示信息，以进行语音交互提示。

6.如权利要求1所述的语音设备的唤醒方法，其特征在于，所述预设规则包括如下规则中的至少一者：

CPU处理能力强的优先、内存空闲大的优先、功能数量多的优先、软件版本高的优先、自定义排序在前的优先。

7.如权利要求2所述的语音设备的唤醒方法，其特征在于，所述特征信息包括机械声纹信息、意图信息中的至少一者。

8.一种语音设备的唤醒装置，其特征在于，包括：

接收模块，用于接收其他语音设备播报的预设语音信息；

9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时，实现如权利要求1-7中任一项所述的语音设备的唤醒方法。

10.一种语音设备，其特征在于，包括：

如权利要求8所述的语音设备的唤醒装置；或者

存储器、处理器和存储在所述存储器上的计算机程序，所述计算机程序被所述处理器执行时，实现如权利要求1-7中任一项所述的语音设备的唤醒方法。