CN111128155A

CN111128155A - 一种智能设备的唤醒方法、装置、设备及介质

Info

Publication number: CN111128155A
Application number: CN201911236140.8A
Authority: CN
Inventors: 高杰
Original assignee: Gree Electric Appliances Inc of Zhuhai
Current assignee: Gree Electric Appliances Inc of Zhuhai
Priority date: 2019-12-05
Filing date: 2019-12-05
Publication date: 2020-05-08
Anticipated expiration: 2039-12-05
Also published as: CN111128155B

Abstract

本发明公开了一种智能设备的唤醒方法、装置、设备及介质，用以解决现有唤醒智能设备唤醒方法导致的唤醒率低、误唤醒率高的问题。本发明实施例若语音段的属性特征满足预设的阈值调整条件，则对当前保存的目标唤醒阈值的大小进行调整，根据调整后的目标唤醒阈值，确定是否唤醒智能设备。由于可以根据语音段是否满足阈值调整条件，调整智能设备的目标唤醒阈值，避免了可能为唤醒语音信息的语音信息无法唤醒智能设备的情况的发生，提高了智能设备的唤醒率，同时也避免了可能为非唤醒语音信息的语音信息被误检为唤醒语音信息，唤醒智能设备，降低了智能设备的误唤醒率。

Description

一种智能设备的唤醒方法、装置、设备及介质

技术领域

本发明涉及自然语言处理技术领域，尤其涉及一种智能设备的唤醒方法、装置、设备及介质。

背景技术

近年来，随着自然语音处理技术领域的发展，智能设备和语音交互应用逐渐普及，如何高效且准确的唤醒智能设备成为近年来研究的一个热点。

现有技术中，智能设备的唤醒主要依赖于唤醒词的波形编码分析的精确程度。图1为现有技术中唤醒智能设备的流程示意图，如图1所示，智能设备获取到语音信息包含唤醒词的语音段后，通过唤醒词语义相似模型，获取该语音段与预设的唤醒词的相似度，判断该相似度是否大于设定的唤醒阈值，若大于，则唤醒智能设备，否则，不唤醒智能设备。

其中，唤醒阈值的大小是能否改善唤醒率和误唤醒率的关键，但唤醒率和误唤醒率也是一个比较矛盾的存在，如果希望提高智能设备的唤醒率，避免唤醒语音信息被误检为非唤醒语音信息，可以将智能设备的唤醒阈值设置的低一些，但由于智能设备会采集人们正常交流过程中的非唤醒语音信息，如果该非唤醒语音信息中包含唤醒词，智能设备又很容易被误唤醒。

发明内容

本发明实施例提供了一种智能设备的唤醒方法、装置、设备及介质，用以解决现有唤醒智能设备唤醒方法导致的唤醒率低、误唤醒率高的问题。

本发明实施例提供了一种智能设备的唤醒方法，所述方法包括：

获取待处理的语音信息中包含唤醒词的语音段；

若所述语音段的属性特征满足预设的阈值调整条件，则对当前保存的目标唤醒阈值的大小进行调整；

根据通过唤醒词语义模型获取的所述语音段与唤醒词的相似度，以及调整后的所述目标唤醒阈值，确定是否唤醒智能设备。

进一步地，所述根据通过唤醒词语义模型获取的所述语音段与唤醒词的相似度，以及调整后的所述目标唤醒阈值，确定是否唤醒智能设备包括：

判断通过唤醒词语义模型获取的所述语音段与唤醒词的相似度，是否大于调整后的所述目标唤醒阈值；

若是，确定唤醒智能设备；

否则，确定不唤醒智能设备。

进一步地，若所述语音段的属性特征不满足预设的阈值调整条件，所述方法还包括：

判断通过唤醒词语义模型获取的所述语音段与唤醒词的相似度，是否大于所述当前保存的目标唤醒阈值；

若是，确定唤醒智能设备；

否则，确定不唤醒智能设备。

进一步地，所述语音段的属性特征为所述语音段的声纹特征，或所述语音段的信号能量。

进一步地，若语音段的属性特征为所述语音段的声纹特征，所述若所述语音段的属性特征满足预设的阈值调整条件，则对当前保存的目标唤醒阈值的大小进行调整包括：

若所述语音段的声纹特征与当前保存的优先级较高的声纹特征匹配，则降低所述当前保存的目标唤醒阈值的大小。

进一步地，所述方法还包括：

若所述智能设备被唤醒，且所述语音段的声纹特征与当前保存的任一目标声纹特征匹配，对所述目标声纹特征对应的唤醒次数进行更新，并根据更新后的唤醒次数，对所述目标声纹特征对应的优先级进行调整。

进一步地，若语音段的属性特征为所述语音段的信号能量，所述若所述语音段的属性特征满足预设的阈值调整条件，则对当前保存的目标唤醒阈值的大小进行调整包括：

若所述语音段的起始端点处的信号能量小于设定的第一能量阈值，且所述语音段的结束端点处的信号能量小于设定的第二能量阈值，则降低所述当前保存的目标唤醒阈值的大小；否则，则升高所述当前保存的目标唤醒阈值的大小。

本发明实施例提供了一种智能设备的唤醒装置，所述装置包括：

获取单元，用于获取待处理的语音信息中包含唤醒词的语音段；

调整单元，用于若所述语音段的属性特征满足预设的阈值调整条件，则对当前保存的目标唤醒阈值的大小进行调整；

确定单元，用于根据通过唤醒词语义模型获取的所述语音段与唤醒词的相似度，以及调整后的所述目标唤醒阈值，确定是否唤醒智能设备。

进一步地，所述确定单元，具体用于判断通过唤醒词语义模型获取的所述语音段与唤醒词的相似度，是否大于调整后的所述目标唤醒阈值；若是，确定唤醒智能设备；否则，确定不唤醒智能设备。

进一步地，所述确定单元，还用于若所述语音段的属性特征不满足预设的阈值调整条件，判断通过唤醒词语义模型获取的所述语音段与唤醒词的相似度，是否大于所述当前保存的目标唤醒阈值；若是，确定唤醒智能设备；否则，确定不唤醒智能设备。

进一步地，所述调整单元，具体用于当语音段的属性特征为所述语音段的声纹特征时，若所述语音段的声纹特征与当前保存的优先级较高的声纹特征匹配，则降低所述当前保存的目标唤醒阈值的大小。

进一步地，所述调整单元，还用于若所述智能设备被唤醒，且所述语音段的声纹特征与当前保存的任一目标声纹特征匹配，对所述目标声纹特征对应的唤醒次数进行更新，并根据更新后的唤醒次数，对所述目标声纹特征对应的优先级进行调整。

进一步地，所述调整单元，具体用于当若语音段的属性特征为所述语音段的信号能量，若所述语音段的起始端点处的信号能量小于设定的第一能量阈值，且所述语音段的结束端点处的信号能量小于设定的第二能量阈值，则降低所述当前保存的目标唤醒阈值的大小；否则，则升高所述当前保存的目标唤醒阈值的大小。

本发明实施例提供了一种电子设备，所述电子设备包括处理器，所述处理器用于执行存储器中存储的计算机程序时实现如上述任一所述智能设备的唤醒方法的步骤。

本发明实施例提供了一种计算机可读存储介质，其存储有计算机程序，所述计算机程序被处理器执行时实现如上述任一所述智能设备的唤醒方法的步骤。

本发明实施例若语音段的属性特征满足预设的阈值调整条件，则对当前保存的目标唤醒阈值的大小进行调整，根据调整后的目标唤醒阈值，确定是否唤醒智能设备。由于可以根据语音段是否满足阈值调整条件，调整智能设备的目标唤醒阈值，避免了可能为唤醒语音信息的语音信息无法唤醒智能设备的情况，提高了智能设备的唤醒率，同时也避免了可能为非唤醒语音信息的语音信息被误检为唤醒语音信息，唤醒智能设备，降低了智能设备的误唤醒率。

附图说明

图1为现有技术中唤醒智能设备的流程示意图；

图2为本发明实施例提供的一种智能设备的唤醒过程示意图；

图3为本发明实施例提供的具体的智能设备的唤醒方法实施流程示意图；

图4为本发明实施例提供的具体的智能设备的唤醒方法实施流程示意图；

图5为本发明实施例提供的具体的智能设备的唤醒方法实施流程示意图；

图6为本发明实施例提供的一种智能设备的唤醒装置结构示意图；

图7为本发明实施例提供的一种电子设备结构示意图。

具体实施方式

为了使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明作进一步地详细描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

为了改善智能设备的唤醒率和误唤醒率，本发明实施例提供了一种智能设备的唤醒方法、装置、设备及介质。

实施例1：

图2为本发明实施例提供的一种智能设备的唤醒过程示意图，该过程包括以下步骤：

S201：获取待处理的语音信息中包含唤醒词的语音段。

本发明实施例提供的智能设备的唤醒方法应用于电子设备，该电子设备可以是被唤醒的智能设备本身，也可以是除该智能设备外的、进行唤醒识别并控制该智能设备唤醒的其他设备，智能设备可以是移动终端、智能音箱、智能空调等智能家居设备，进行唤醒识别并控制该智能设备唤醒的其他设备可以是服务器、移动终端等设备。

采集到待处理的语音信息后，电子设备可以对该待处理的语音信息进行识别、语义解析处理，获取其中包含唤醒词的语音段，并基于获取的该语音段进行后续处理。如果在待处理的语音信息中无法获取到包含唤醒词的语音段，则可以将该语音信息直接忽略，不进行后续处理。

需要说明的是，具体的检测采集的语音信息中是否包含唤醒词的语音段的方法为现有技术，在此不再赘述。

S202：若所述语音段的属性特征满足预设的阈值调整条件，则对当前保存的目标唤醒阈值的大小进行调整。

为了提高唤醒率，降低误唤醒率，在本发明实施例中，可以对智能设备的目标唤醒阈值进行调整。而为了确定是否进行目标唤醒阈值的调整，可以预先设置有阈值调整条件，若语音段的属性特征满足该预设的阈值调整条件，则确定进行目标唤醒阈值的调整，若语音段的属性特征不满足该预设的阈值调整条件，则确定不对当前保存的目标唤醒阈值进行调整。

其中，预设的阈值调整条件可以是检测待处理的语音信息中是否包含了连续多个包含唤醒词的语音段，比如：“格力金贝格力金贝”等，当电子设备检测到语音段的个数为至少两个时，可以确定该语音段满足预设的阈值调整条件，将当前保存的目标唤醒阈值进行调整。

在语音段的属性特征满足预设的阈值调整条件时，进行目标唤醒阈值的大小进行调整，可以是将目标唤醒阈值的大小升高，也可以是将目标唤醒阈值的大小降低，具体可以语音段的属性特征满足哪个阈值调整条件来确定。

S203：根据通过唤醒词语义模型获取的所述语音段与唤醒词的相似度，以及调整后的所述目标唤醒阈值，确定是否唤醒智能设备。

在本发明实施例中，电子设备中保存有唤醒词语义模型，通过该唤醒词语义模型，可以获取输入的语音段与唤醒词的相似度。当获取到调整后的目标阈值后，判断语音段与唤醒词的相似度是否大于该调整后的目标唤醒阈值，从而确定是否唤醒智能设备。

其中，具体的通过唤醒词语义模型获取语音段与唤醒词的相似度的方法属于现有技术，在此不再赘述。

本发明实施例若语音段的属性特征满足预设的阈值调整条件，则对当前保存的目标唤醒阈值的大小进行调整，根据调整后的目标唤醒阈值，确定是否唤醒智能设备。由于可以根据语音段是否满足阈值调整条件，调整智能设备的目标唤醒阈值，避免了可能为唤醒语音信息的语音信息无法唤醒智能设备的情况的发生，提高了智能设备的唤醒率，同时也避免了可能为非唤醒语音信息的语音信息被误检为唤醒语音信息，唤醒智能设备，降低了智能设备的误唤醒率。

实施例2：

为了改善智能设备的唤醒率和误唤醒率，在上述实施例的基础上，在本发明实施例中，所述语音段的属性特征为所述语音段的声纹特征，或，所述语音段的信号能量。

声纹特征是唯一标识用户语音特征的信息，根据语音段的声纹特征，可以确定唤醒智能设备的用户的身份，从而可以根据用户的身份确定是否对目标唤醒阈值的大小进行调整。

为了进一步准确地确定是否唤醒智能设备，若语音段的属性特征为所述语音段的声纹特征，所述若所述语音段的属性特征满足预设的阈值调整条件，则对当前保存的目标唤醒阈值的大小进行调整包括：

声纹特征可以标识用户的身份，因此可以根据用户的身份，确定其对应的声纹特征的优先级，比如：如果是家里的男主人的声纹特征A，该声纹特征A的优先级为4，如果是家里的女主人的声纹特征B，该声纹特征B的优先级是3，如果是家里的孩子的声纹特征C，该声纹特征C的优先级是2，则该家庭中的优先级的高低顺序是优先级4高于优先级3高于优先级2，因此声纹特征的优先级的高低顺序是声纹特征A高于声纹特征B、声纹特征B高于声纹特征C。

因此，在确定是否调整目标唤醒阈值时，可以是判断语音段的声纹特征是否与当前保存的任一声纹特征匹配，如果存在匹配的声纹特征，则获取该匹配的声纹特征的优先级，并为了对目标唤醒阈值的大小进行调整，预先设置有优先级范围，将该优先级范围内的优先级作为优先级较高的优先级。

还以上述的例子进行说明，可以将该家中优先级4和优先级3为可以进行目标唤醒阈值调整的优先级范围，即该优先级4和优先级3为优先级较高的优先级。因此，如果匹配的声纹特征的为声纹特征B，则调整目标唤醒阈值；如果匹配的声纹特征的优先级不为优先级较高的优先级，例如匹配的声纹特征为声纹特征C，则不调整目标唤醒阈值。

声纹特征的优先级较高，说明该声纹特征对应的用户较重要，为了增大该用户唤醒智能设备的唤醒率，当语音段的声纹特征为该用户对应的声纹特征时，可以适当的将目标唤醒阈值降低。降低多少可以根据匹配的声纹特征的优先级确定，如果该匹配的声纹特征优先级较高，目标唤醒阈值的大小就降低得多一些，如果该匹配的声纹特征优先级低，目标唤醒阈值的大小可以降低得少一些，当然，也可以是无论匹配的声纹特征的优先级的高低，目标唤醒阈值的大小可以降低相同值。

例如，预设的优先级范围是优先级4和优先级3，如果匹配的声纹特征的优先级在该优先级范围内，目标唤醒阈值降低0.1。当前电子设备获取的待处理的语音信息的语音段的声纹特征，该语音段的声纹特征与当前保存的声纹特征A匹配，该匹配的声纹特征A对应的优先级为优先级3，将当前保存的目标唤醒阈值0.85降低0.1，调整后的目标唤醒阈值为0.75。

为了进一步有效地改善智能设备的唤醒率和误唤醒率，所述智能设备的唤醒方法还包括：

优先级可以预先设置，为了能进一步提高唤醒率，在本发明实施例中，还可以根据智能设备被任一目标声纹特征唤醒的次数，确定该目标声纹特征的优先级。若某一目标声纹特征唤醒智能设备的次数越多，则该目标声纹特征的优先级越高；若该目标声纹特征唤醒智能设备的次数越少，则该目标声纹特征的优先级越低。

例如，声纹特征A、声纹特征B、声纹特征C分别唤醒智能设备的次数为16、15、21，则该三个声纹特征的优先级由高到低为声纹特征C、声纹特征A、声纹特征B。因此，当每次智能设备被唤醒后，判断该语音段的声纹特征与当前保存的任一目标声纹特征是否匹配，若该语音段的声纹特征与当前保存的任一目标声纹特征匹配，则对该目标声纹特征对应的唤醒次数进行更新。当更新完该目标声纹特征对应的唤醒次数后，将当前保存的所有目标声纹特征按照唤醒次数的多少进行排序，从而对目标声纹特征对应的优先级进行调整。

为了确定每个次数对应的优先级，每个优先级对应的次数范围可以预先进行设定。另外智能设备接收到的语音信息的数量是在持续增加的，因此目标声纹特征对应的唤醒次数也是在不断的变化的，为了方便进行优先级的确定，可以根据总的唤醒次数，及预先设定的优先级的数量，确定每个优先级对应的次数范围。

为了进一步准确地确定是否唤醒智能设备，若语音段的属性特征为所述语音段的信号能量，所述若所述语音段的属性特征满足预设的阈值调整条件，则对当前保存的目标唤醒阈值的大小进行调整包括：

在正常的语音信息中，语音信息每相邻的两个语音帧之间的信号能量是相关的，并且相互影响，因此，在本发明实施例中，可以根据该语音段的信号能量，确定该语音段是否受待处理的语音信息中其它语音段的影响，从而确定该待处理的语音信息是否是只包含唤醒词的语音信息，即待处理的语音信息中只有包含唤醒词的语音段。

电子设备获取到的待处理的语音信息可能是包含唤醒词的语音信息，也可能是不包含唤醒词的语音信息。其中，当待处理的语音信息是包含唤醒词的语音信息时，该待处理的语音信息中可能只包含有唤醒词的语音段，也可能是不只包含唤醒词的语音段，即包含唤醒词的语音段是在一段话中。

而一般只包含唤醒词的语音段的待处理的语音信息为唤醒语音信息的可能性比较大，不只包含唤醒词的语音段的语音信息为非唤醒语音信息的可能性比较大。因此，为了方便的识别待处理的语音信息中是否只包含唤醒词的语音段，在本发明实施例中，可以采用能量检测的方法进行判定待处理的语音信息中是否只包含唤醒词的语音段。

当待处理的语音信息中只包含唤醒词的语音段时，因为该待处理的语音信息中并没有其它语音段可以影响该语音段的信号能量，因此该语音段的起始端点和结束端点处的能量会很弱。而当待处理的语音信息中不只包含唤醒词的语音段时，即包含唤醒词的语音段是在一段话中，该语音段的信号能量会受到待处理的语音信息中其它语音段的影响，因此该语音段起始端点和/或结束端点处的能量会很强。

基于此，可以根据语音段的信号能量，确定是否对目标唤醒阈值的大小进行调整。为了进一步准确地确定是否唤醒智能设备，在本发明实施例中，可以预先设置第一能量阈值和第二能量阈值，判断语音段的起始端点处的信号能量是否小于设定的第一能量阈值，且语音段的结束端点处的信号能量是否小于设定的第二能量阈值，从而确定是否对当前保存的目标唤醒阈值进行调整。

具体实施中，若语音段的起始端点处的信号能量小于设定的第一能量阈值，且语音段的结束端点处的信号能量小于设定的第二能量阈值，则该待处理的语音信息中只包含唤醒词的语音段，该待处理的语音信息极有可能为唤醒语音信息，则降低当前保存的目标唤醒阈值的大小；否则，说明该待处理的语音信息中并不只包含唤醒词的语音段，即包含唤醒词的语音段是在一段话中，该待处理的语音信息很有可能是非唤醒语音信息，则升高当前保存的目标唤醒阈值的大小。

为了确定第一能量阈值和第二能量阈值，在本发明实施例中，可以预先对大量的包含唤醒词的语音段，通过如下公式获取该语音段的起始端点和结束端点的信号能量进行分析，确定第一能量阈值和第二能量阈值：

其中，X(m)为第m帧的信号，n为第n时刻，W(n-m)为是窗函数序列，En表示信号在第n时刻开始加窗函数时的短时能量。其中，具体通过上述公式获取该语音段起始端点和结束端点的信号能量进行分析的过程属于现有技术，在此不再进行赘述。

升高目标唤醒阈值的大小可以根据场景的不同，设置不同的值，如果希望尽可能的降低智能设备的误唤醒率，可以将目标唤醒阈值升高得多一些；如果为了避免将唤醒语音信息误检为非唤醒语音信息，则可以将目标唤醒阈值升高得少一些。

相应的，降低目标唤醒阈值的大小，也可以根据场景的不同，设置不同的值，如果希望尽可能的提高智能设备的唤醒率，可以将目标唤醒阈值降低得多一些；如果为了避免将非唤醒语音信息误检为唤醒语音信息，则可以将目标唤醒阈值降低得少一些。

由于本发明实施例通过判断语音段的属性特征是否满足预设的阈值调整条件，从而相应的对目标唤醒阈值进行调整，减少了非唤醒语音信息唤醒智能设备的情况的发生，以及降低了可能为唤醒语音信息唤醒智能设备的难度，从而改善了智能设备的误唤醒率和唤醒率。

实施例3：

为了进一步改善智能设备的唤醒率和误唤醒率，在上述各实施例的基础上，在本发明实施例中，所述根据通过唤醒词语义模型获取的所述语音段与唤醒词的相似度，以及调整后的所述目标唤醒阈值，确定是否唤醒智能设备包括：

若是，确定唤醒智能设备；

否则，确定不唤醒智能设备。

基于上述的实施例，当判断是否需要对目标唤醒阈值进行调整后，即可根据判断的结果，确定用于判断是否唤醒智能设备的目标唤醒阈值，从而根据该目标唤醒阈值，以及通过唤醒词语义模型获取的所述语音段与唤醒词的相似度，确定是否唤醒智能设备。

如果进行了目标唤醒阈值的调整，则此时电子设备保存的目标唤醒阈值为调整后的目标唤醒阈值，为了进一步改善智能设备的唤醒率和误唤醒率，在本发明实施例中，在获取到调整后的目标唤醒阈值后，判断通过唤醒词语义模型获取的语音段与唤醒词的相似度，是否大于调整后的目标唤醒阈值，从而确定是否唤醒智能设备。

若通过本地保存的唤醒词语义模型获取的语音段与唤醒词的相似度，大于当前保存的目标唤醒阈值，说明该待处理的语音信息为唤醒语音信息，则确定唤醒智能设备；若通过本地保存的唤醒词语义模型获取的语音段与唤醒词的相似度，不大于当前保存的目标唤醒阈值，说明该待处理的语音信息为非唤醒语音信息，则确定不唤醒智能设备。

如果控制智能设备唤醒的电子设备为智能设备本身，若通过本地保存的唤醒词语义模型获取的语音段与唤醒词的相似度，大于调整后的目标唤醒阈值，则该智能设备直接唤醒；若通过本地保存的唤醒词语义模型获取的语音段与唤醒词的相似度，不大于调整后的目标唤醒阈值，则该智能设备不唤醒。

如果控制智能设备唤醒的电子设备为其它设备，若通过本地保存的唤醒词语义模型获取的语音段与唤醒词的相似度，大于调整后的目标唤醒阈值，则其它设备确定唤醒智能设备，向该智能设备发送唤醒智能设备的控制指令，以唤醒智能设备；若通过本地保存的唤醒词语义模型获取的语音段与唤醒词的相似度，不大于调整后的目标唤醒阈值，则其它设备确定不唤醒智能设备。

其中，具体的通过唤醒词语义模型获取的语音段与唤醒词的相似度属于现有技术，在此不再赘述。

为了进一步改善智能设备的唤醒率和误唤醒率，若所述语音段的属性特征不满足预设的阈值调整条件，所述方法还包括：

若是，确定唤醒智能设备；

否则，确定不唤醒智能设备。

如果对目标唤醒阈值不进行调整，则此时电子设备保存的目标唤醒阈值是未调整的目标唤醒阈值，该目标唤醒阈值可以是预先设置的阈值，为了确定是否唤醒设备，在确定不调整目标唤醒阈值后，判断通过唤醒词语义模型获取的语音段与唤醒词的相似度，是否大于当前保存的目标唤醒阈值，从而确定是否唤醒智能设备。

如果控制智能设备唤醒的电子设备为智能设备本身，若通过本地保存的唤醒词语义模型获取的语音段与唤醒词的相似度，大于当前保存的目标唤醒阈值，则该智能设备直接唤醒；若通过本地保存的唤醒词语义模型获取的语音段与唤醒词的相似度，不大于当前保存的目标唤醒阈值，则该智能设备不唤醒。

如果控制智能设备唤醒的电子设备为其它设备，若通过本地保存的唤醒词语义模型获取的语音段与唤醒词的相似度，大于当前保存的目标唤醒阈值，则其它设备确定唤醒智能设备，向该智能设备发送唤醒智能设备的控制指令，以唤醒智能设备；若通过本地保存的唤醒词语义模型获取的语音段与唤醒词的相似度，不大于当前保存的目标唤醒阈值，则其它设备确定不唤醒智能设备。

实施例4：

图3为本发明实施例提供的具体的智能设备的唤醒方法实施流程示意图，该流程以执行主体为智能设备，语音段的属性特征为语音段的信号能量进行详细地说明：

S301：智能设备获取待处理的语音信息中包含唤醒词的语音段。

S302：智能设备判断该语音段的起始端点处的信号能量是否小于设定的第一能量阈值，且语音段的结束端点处的信号能量是否小于设定的第二能量阈值，若是，执行S303，否则，执行S304。

S303：智能设备降低当前保存的目标唤醒阈值的大小，然后执行S305。

S304：智能设备升高当前保存的目标唤醒阈值的大小，然后执行S305。

S305：智能设备判断通过唤醒词语义模型获取的语音段与唤醒词的相似度，是否大于调整后的目标唤醒阈值，若是，执行S306，否则，执行S307。

S306：智能设备直接唤醒。

S307：智能设备不唤醒。

图4为本发明实施例提供的具体的智能设备的唤醒方法实施流程示意图，该流程以执行主体为其它设备，语音段的属性特征为语音段的声纹特征进行详细地说明：

S401：其它设备获取待处理的语音信息中包含唤醒词的语音段。

S402：其它设备判断语音段的声纹特征与当前保存的优先级较高的声纹特征是否匹配，若是，执行S403，否则，执行S404。

S403：其它设备降低当前保存的目标唤醒阈值的大小，然后执行S405。

S404：其它设备确定该语音段的声纹特征不满足预设的阈值调整条件，不调整当前保存的目标唤醒阈值，然后执行S406。

S405：其它设备判断通过唤醒词语义模型获取的语音段与唤醒词的相似度，是否大于调整后的目标唤醒阈值，若是，执行S407，否则，执行S408。

S406：其它设备判断通过唤醒词语义模型获取的语音段与唤醒词的相似度，是否大于当前保存的目标唤醒阈值，若是，执行S407，否则，执行S408。

S407：其它设备确定唤醒智能设备，并向智能设备发送唤醒指令，以控制智能设备唤醒，然后执行S409。

S408：其它设备确定不唤醒智能设备。

S409：其它设备判断语音段的声纹特征与当前保存的任一目标声纹特征匹配，若是，执行S410，否则，执行S411。

S410：其它设备对目标声纹特征对应的唤醒次数进行更新，并根据更新后的唤醒次数，对目标声纹特征对应的优先级进行调整。

S411：其它设备将该语音段的声纹特征保存为目标声纹特征。

图5为本发明实施例提供的具体的智能设备的唤醒方法实施流程示意图，如图5所示，在获取到待处理的语音信息后，提取待处理的语音信息中包含唤醒词的语音段后，电子设备可以通过语音段的声纹特征是否满足预设的阈值调整条件，确定是否调整目标唤醒阈值，或者通过语音段的信号能量是否满足预设的阈值调整条件，确定是否调整目标唤醒阈值。获取到调整后的目标唤醒阈值后，判断通过唤醒词语义模型获取的语音段与唤醒词的相似度，是否大于该调整后的目标唤醒阈值，从而确定是否唤醒智能设备。

实施例5：

图6为本发明实施例提供的一种智能设备的唤醒装置结构示意图，所述装置包括：

获取单元61，用于获取待处理的语音信息中包含唤醒词的语音段；

调整单元62，用于若所述语音段的属性特征满足预设的阈值调整条件，则对当前保存的目标唤醒阈值的大小进行调整；

确定单元63，用于根据通过唤醒词语义模型获取的所述语音段与唤醒词的相似度，以及调整后的所述目标唤醒阈值，确定是否唤醒智能设备。

其中，所述确定单元63，具体用于判断通过唤醒词语义模型获取的所述语音段与唤醒词的相似度，是否大于调整后的所述目标唤醒阈值；若是，确定唤醒智能设备；否则，确定不唤醒智能设备。

在另一种可能的实施方式中，所述确定单元63，还用于若所述语音段的属性特征不满足预设的阈值调整条件，判断通过唤醒词语义模型获取的所述语音段与唤醒词的相似度，是否大于所述当前保存的目标唤醒阈值；若是，确定唤醒智能设备；否则，确定不唤醒智能设备。

在一种可能的实施方式中，所述调整单元62，具体用于当语音段的属性特征为所述语音段的声纹特征时，若所述语音段的声纹特征与当前保存的优先级较高的声纹特征匹配，则降低所述当前保存的目标唤醒阈值的大小。

进一步地，所述调整单元62，还用于若所述智能设备被唤醒，且所述语音段的声纹特征与当前保存的任一目标声纹特征匹配，对所述目标声纹特征对应的唤醒次数进行更新，并根据更新后的唤醒次数，对所述目标声纹特征对应的优先级进行调整。

在另一种可能的实施方式中，所述调整单元62，具体用于当若语音段的属性特征为所述语音段的信号能量，若所述语音段的起始端点处的信号能量小于设定的第一能量阈值，且所述语音段的结束端点处的信号能量小于设定的第二能量阈值，则降低所述当前保存的目标唤醒阈值的大小；否则，则升高所述当前保存的目标唤醒阈值的大小。

实施例6：

如图7为本发明实施例提供的一种电子设备结构示意图，在上述各实施例的基础上，本发明实施例中还提供了一种电子设备，包括处理器71和存储器72；

处理器71用于执行存储器72中存储的计算机程序时实现上述智能设备的唤醒方法的步骤。

可选的，处理器71可以是CPU(中央处埋器)、ASIC(Application SpecificIntegrated Circuit，专用集成电路)、FPGA(Field－Programmable Gate Array，现场可编程门阵列)或CPLD(Complex Programmable Logic Device，复杂可编程逻辑器件)。

处理器71，用于按照存储器72中存储的计算机程序时执行如下步骤：

获取待处理的语音信息中包含唤醒词的语音段；

其中，处理器71，具体用于判断通过唤醒词语义模型获取的所述语音段与唤醒词的相似度，是否大于调整后的所述目标唤醒阈值；若是，确定唤醒智能设备；否则，确定不唤醒智能设备。

在另一种可能的实施方式中，处理器71，还用于若所述语音段的属性特征不满足预设的阈值调整条件，判断通过唤醒词语义模型获取的所述语音段与唤醒词的相似度，是否大于所述当前保存的目标唤醒阈值；若是，确定唤醒智能设备；否则，确定不唤醒智能设备。

在一种可能的实施方式中，处理器71，具体用于当语音段的属性特征为所述语音段的声纹特征时，若所述语音段的声纹特征与当前保存的优先级较高的声纹特征匹配，则降低所述当前保存的目标唤醒阈值的大小。

进一步地，处理器71，还用于若所述智能设备被唤醒，且所述语音段的声纹特征与当前保存的任一目标声纹特征匹配，对所述目标声纹特征对应的唤醒次数进行更新，并根据更新后的唤醒次数，对所述目标声纹特征对应的优先级进行调整。

在另一种可能的实施方式中，处理器71，具体用于当若语音段的属性特征为所述语音段的信号能量，若所述语音段的起始端点处的信号能量小于设定的第一能量阈值，且所述语音段的结束端点处的信号能量小于设定的第二能量阈值，则降低所述当前保存的目标唤醒阈值的大小；否则，则升高所述当前保存的目标唤醒阈值的大小。

实施例8：

在上述各实施例的基础上，本发明实施例提供的一种计算机可读存储介质，所述计算机可读存储介质内存储有可由电子设备执行的计算机程序，当所述程序在所述电子设备上运行时，使得所述电子设备执行时实现如下步骤：

获取待处理的语音信息中包含唤醒词的语音段；

在一种可能的实施方式中，所述根据通过唤醒词语义模型获取的所述语音段与唤醒词的相似度，以及调整后的所述目标唤醒阈值，确定是否唤醒智能设备包括：

若是，确定唤醒智能设备；

否则，确定不唤醒智能设备。

在另一种可能的实施方式中，若所述语音段的属性特征不满足预设的阈值调整条件，所述方法还包括：

若是，确定唤醒智能设备；

否则，确定不唤醒智能设备。

具体地，所述语音段的属性特征为所述语音段的声纹特征，或所述语音段的信号能量。

在一种可能的实施方式中，若语音段的属性特征为所述语音段的声纹特征，所述若所述语音段的属性特征满足预设的阈值调整条件，则对当前保存的目标唤醒阈值的大小进行调整包括：

进一步地，所述方法还包括：

在另一种可能的实施方式中，若语音段的属性特征为所述语音段的信号能量，所述若所述语音段的属性特征满足预设的阈值调整条件，则对当前保存的目标唤醒阈值的大小进行调整包括：

本领域内的技术人员应明白，本申请的实施例可提供为方法、***、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然，本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样，倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包含这些改动和变型在内。

Claims

1.一种智能设备的唤醒方法，其特征在于，所述方法包括：

获取待处理的语音信息中包含唤醒词的语音段；

2.根据权利要求1所述的方法，其特征在于，所述根据通过唤醒词语义模型获取的所述语音段与唤醒词的相似度，以及调整后的所述目标唤醒阈值，确定是否唤醒智能设备包括：

若是，确定唤醒智能设备；

否则，确定不唤醒智能设备。

3.根据权利要求1所述的方法，其特征在于，若所述语音段的属性特征不满足预设的阈值调整条件，所述方法还包括：

若是，确定唤醒智能设备；

否则，确定不唤醒智能设备。

4.根据权利要求1-3任一项所述的方法，其特征在于，所述语音段的属性特征为所述语音段的声纹特征，或所述语音段的信号能量。

5.根据权利要求1-3任一项所述的方法，其特征在于，若语音段的属性特征为所述语音段的声纹特征，所述若所述语音段的属性特征满足预设的阈值调整条件，则对当前保存的目标唤醒阈值的大小进行调整包括：

6.根据权利要求5所述的方法，其特征在于，所述方法还包括：

7.根据权利要求1-3任一项所述的方法，其特征在于，若语音段的属性特征为所述语音段的信号能量，所述若所述语音段的属性特征满足预设的阈值调整条件，则对当前保存的目标唤醒阈值的大小进行调整包括：

8.一种智能设备的唤醒装置，其特征在于，所述装置包括：

9.根据权利要求8所述的装置，其特征在于，所述确定单元，具体用于判断通过唤醒词语义模型获取的所述语音段与唤醒词的相似度，是否大于调整后的所述目标唤醒阈值；若是，确定唤醒智能设备；否则，确定不唤醒智能设备。

10.根据权利要求8所述的装置，其特征在于，所述确定单元，还用于若所述语音段的属性特征不满足预设的阈值调整条件，判断通过唤醒词语义模型获取的所述语音段与唤醒词的相似度，是否大于所述当前保存的目标唤醒阈值；若是，确定唤醒智能设备；否则，确定不唤醒智能设备。

11.根据权利要求8-10任一项所述的装置，其特征在于，所述调整单元，具体用于当语音段的属性特征为所述语音段的声纹特征时，若所述语音段的声纹特征与当前保存的优先级较高的声纹特征匹配，则降低所述当前保存的目标唤醒阈值的大小。

12.根据权利要求11所述的装置，其特征在于，所述调整单元，还用于若所述智能设备被唤醒，且所述语音段的声纹特征与当前保存的任一目标声纹特征匹配，对所述目标声纹特征对应的唤醒次数进行更新，并根据更新后的唤醒次数，对所述目标声纹特征对应的优先级进行调整。

13.根据权利要求8-10任一项所述的装置，其特征在于，所述调整单元，具体用于当若语音段的属性特征为所述语音段的信号能量，若所述语音段的起始端点处的信号能量小于设定的第一能量阈值，且所述语音段的结束端点处的信号能量小于设定的第二能量阈值，则降低所述当前保存的目标唤醒阈值的大小；否则，则升高所述当前保存的目标唤醒阈值的大小。

14.一种电子设备，其特征在于，所述电子设备包括处理器，所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1-7中任一所述智能设备的唤醒方法的步骤。

15.一种计算机可读存储介质，其特征在于，其存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1-7中任一所述智能设备的唤醒方法的步骤。