CN111081251A

CN111081251A - 语音唤醒方法及装置

Info

Publication number: CN111081251A
Application number: CN201911180720.XA
Authority: CN
Inventors: 陈晓松; 许东星; 俞华伟
Original assignee: Unisound Intelligent Technology Co Ltd
Current assignee: Unisound Intelligent Technology Co Ltd
Priority date: 2019-11-27
Filing date: 2019-11-27
Publication date: 2020-04-28
Anticipated expiration: 2039-11-27
Also published as: CN111081251B

Abstract

本发明是关于语音唤醒方法及装置。该方法包括：确定语音唤醒阈值；接收输入的当前唤醒语音；首次对所述当前唤醒语音进行语音识别，获得首次唤醒识别结果以及所述首次唤醒识别结果的置信度；根据所述置信度和所述语音唤醒阈值，判断所述首次唤醒识别结果是否为有效唤醒；根据判断结果，唤醒目标设备。通过本发明的技术方案，可尽量利用较少次数的语音唤醒识别操作即可确认是否接收到了有效唤醒操作，进而减少唤醒延时，提高唤醒效率，进而提高用户的唤醒体验。

Description

语音唤醒方法及装置

技术领域

本发明涉及语音技术领域，尤其涉及语音唤醒方法及装置。

背景技术

目前，很多设备都支持语音识别功能，用户可通过语音对设备进行唤醒，但相关技术中在确定是否为有效唤醒时，需要通过多次语音识别才能确认是否为有效唤醒，如此，就存在较长的唤醒延时，如存在300毫秒以上的延时，这将大大影响设备唤醒效率以及严重影响用户体验。

发明内容

本发明实施例提供了语音唤醒方法及装置。所述技术方案如下：

根据本发明实施例的第一方面，提供一种语音唤醒方法，包括：

确定语音唤醒阈值；

接收输入的当前唤醒语音；

首次对所述当前唤醒语音进行语音识别，获得首次唤醒识别结果以及所述首次唤醒识别结果的置信度；

根据所述置信度和所述语音唤醒阈值，判断所述首次唤醒识别结果是否为有效唤醒；

根据判断结果，唤醒目标设备。

在一个实施例中，所述根据判断结果，唤醒目标设备，包括：

当所述首次唤醒识别结果为有效唤醒时，唤醒所述目标设备。

当所述首次唤醒识别结果为无效唤醒时，对所述当前唤醒语音再次进行语音识别，获得再次唤醒识别结果以及所述再次唤醒识别结果的置信度；

当所述再次唤醒识别结果的置信度大于所述语音唤醒阈值时，确定所述再次唤醒识别结果为有效唤醒；

根据所述再次唤醒识别结果，唤醒所述目标设备。

在一个实施例中，所述根据所述置信度和所述语音唤醒阈值，判断所述首次唤醒识别结果是否为有效唤醒，包括：

当所述置信度大于所述语音唤醒阈值时，判定所述首次唤醒识别结果为有效唤醒；

当所述置信度小于或等于所述语音唤醒阈值时，判定所述首次唤醒识别结果为无效唤醒。

根据本发明实施例的第二方面，提供一种语音唤醒装置，包括：

确定模块，用于确定语音唤醒阈值；

接收模块，用于接收输入的当前唤醒语音；

语音识别模块，用于首次对所述当前唤醒语音进行语音识别，获得首次唤醒识别结果以及所述首次唤醒识别结果的置信度；

判断模块，用于根据所述置信度和所述语音唤醒阈值，判断所述首次唤醒识别结果是否为有效唤醒；

唤醒模块，用于根据判断结果，唤醒目标设备。

在一个实施例中，所述唤醒模块包括：

第一唤醒子模块，用于当所述首次唤醒识别结果为有效唤醒时，唤醒所述目标设备。

在一个实施例中，所述唤醒模块包括：

语音识别子模块，用于当所述首次唤醒识别结果为无效唤醒时，对所述当前唤醒语音再次进行语音识别，获得再次唤醒识别结果以及所述再次唤醒识别结果的置信度；

确定子模块，用于当所述再次唤醒识别结果的置信度大于所述语音唤醒阈值时，确定所述再次唤醒识别结果为有效唤醒；

第二唤醒子模块，用于根据所述再次唤醒识别结果，唤醒所述目标设备。

在一个实施例中，所述判断模块包括：

第一判定子模块，用于当所述置信度大于所述语音唤醒阈值时，判定所述首次唤醒识别结果为有效唤醒；

第二判定子模块，用于当所述置信度小于或等于所述语音唤醒阈值时，判定所述首次唤醒识别结果为无效唤醒。

本发明的实施例提供的技术方案可以包括以下有益效果：

在接收到当前唤醒语音时，可对当前唤醒语音进行首次语音识别，然后获得首次唤醒识别结果以及首次唤醒识别结果的置信度，进而根据置信度和语音唤醒阈值，判断所述首次唤醒识别结果是否为有效唤醒，进而根据判断结果，唤醒目标设备，从而可尽量利用较少次数的语音唤醒识别操作即可确认是否接收到了有效唤醒操作，进而减少唤醒延时，提高唤醒效率，进而提高用户的唤醒体验。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本发明。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。

图1是根据一示例性实施例示出的一种语音唤醒方法的流程图。

图2是根据一示例性实施例示出的一种语音唤醒装置的框图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

为了解决上述技术问题，本发明实施例提供了一种语音唤醒方法，该方法可用于语音唤醒程序、***或装置中，且该方法对应的执行主体可以是终端或服务器，如图1所示，该方法包括步骤S101至步骤S103：

在步骤S101中，确定语音唤醒阈值；

在步骤S102中，接收输入的当前唤醒语音；

在步骤S103中，首次对所述当前唤醒语音进行语音识别，获得首次唤醒识别结果以及所述首次唤醒识别结果的置信度；

在步骤S104中，根据所述置信度和所述语音唤醒阈值，判断所述首次唤醒识别结果是否为有效唤醒；

在步骤S105中，根据判断结果，唤醒目标设备。

在确定首次唤醒识别结果为有效唤醒时，可立即唤醒所述目标设备，以减少语音唤醒次数，从而避免每次都需要多次语音识别才能确认是否为有效唤醒，如此有利于提高唤醒效率，进而提高用户的唤醒体验。

当然，再次进行语音识别可以是第2次、第3次等多次语音识别。

再次唤醒识别结果的置信度大于所述语音唤醒阈值指的是第i次语音识别的置信度大于该语音唤醒阈值，i为大于或等于2的正整数。

根据所述再次唤醒识别结果，唤醒所述目标设备。

当首次唤醒识别结果为无效唤醒时，说明初步判断的是不进行语音唤醒，但还有可能是误判，所以，可对当前唤醒语音再次进行语音识别，以获得再次唤醒识别结果以及该再次唤醒识别结果的置信度，然后若再次唤醒识别结果的置信度大于所述语音唤醒阈值，则说明之前是误判，因而，可确定再次唤醒识别结果为有效唤醒，从而根据所述再次唤醒识别结果，自动唤醒所述目标设备，这样可在尽可能减少唤醒延时的基础上，自动唤醒目标设备，且能尽可能确保目标设备的唤醒正确率。

当该置信度大于语音唤醒阈值时，说明本次的语音识别正确率较高，因而，可确定首次唤醒识别结果为有效唤醒；而当置信度小于或等于所述语音唤醒阈值时，说明本次的语音识别正确率较低，则可确定首次唤醒识别结果为无效唤醒，即不能依据本次唤醒识别结果立即唤醒目标设备。

最后，需要明确的是：本领域技术人员可根据实际需求，将上述多个实施例进行自由组合。

对应本发明实施例提供的上述语音唤醒方法，本发明实施例还提供一种语音唤醒装置，如图2所示，该装置包括：

确定模块201，用于确定语音唤醒阈值；

接收模块202，用于接收输入的当前唤醒语音；

语音识别模块203，用于首次对所述当前唤醒语音进行语音识别，获得首次唤醒识别结果以及所述首次唤醒识别结果的置信度；

判断模块204，用于根据所述置信度和所述语音唤醒阈值，判断所述首次唤醒识别结果是否为有效唤醒；

唤醒模块205，用于根据判断结果，唤醒目标设备。

在一个实施例中，所述唤醒模块包括：

在一个实施例中，所述判断模块包括：

本领域技术人员在考虑说明书及实践这里发明的发明后，将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未发明的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本发明的真正范围和精神由下面的权利要求指出。

应当理解的是，本发明并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims

1.一种语音唤醒方法，其特征在于，包括：

确定语音唤醒阈值；

接收输入的当前唤醒语音；

根据判断结果，唤醒目标设备。

2.根据权利要求1所述的方法，其特征在于，

所述根据判断结果，唤醒目标设备，包括：

3.根据权利要求1所述的方法，其特征在于，

所述根据判断结果，唤醒目标设备，包括：

根据所述再次唤醒识别结果，唤醒所述目标设备。

4.根据权利要求1至3中任一项所述的方法，其特征在于，

所述根据所述置信度和所述语音唤醒阈值，判断所述首次唤醒识别结果是否为有效唤醒，包括：

5.一种语音唤醒装置，其特征在于，包括：

确定模块，用于确定语音唤醒阈值；

接收模块，用于接收输入的当前唤醒语音；

唤醒模块，用于根据判断结果，唤醒目标设备。

6.根据权利要求5所述的装置，其特征在于，

所述唤醒模块包括：

7.根据权利要求5所述的装置，其特征在于，

所述唤醒模块包括：

8.根据权利要求5至7中任一项所述的装置，其特征在于，

所述判断模块包括：