CN115294986B

CN115294986B - 一种降低智能语音交互误唤醒的方法

Info

Publication number: CN115294986B
Application number: CN202211228563.7A
Authority: CN
Inventors: 徐绍杰
Original assignee: Shenzhen Xinyi Network Technology Co ltd
Current assignee: Shenzhen Xinyi Network Technology Co ltd
Priority date: 2022-10-09
Filing date: 2022-10-09
Publication date: 2023-01-10
Anticipated expiration: 2042-10-09
Also published as: CN115294986A

Abstract

本发明属于语音交互技术领域，公开了一种降低智能语音交互误唤醒的方法，包括：数据分析设备接收同一时刻x个声音数据y1，所述声音数据由智能语音交互设备采集，将记录n个声音指纹数据与采集的声音数据y比对分析，若匹配则发送数据分析设备，并将此次获得该声音数据标记为y1，声音指纹数据包括预存声音频率与预存唤醒词；将x个声音数据y1建立数据集，并分析数据集，确定本次唤醒对象，确定唤醒对象后，生成唤醒指令，并将唤醒指令发送至唤醒对象对应的智能语音交互设备，对应的智能语音交互设备根据唤醒指令唤醒；让最近的智能语音交互设备与使用者交互，交互效果更好，可避免同一区域多台语音交互设备同时被唤醒，有效提升交互体验。

Description

一种降低智能语音交互误唤醒的方法

技术领域

本发明属于语音交互技术领域，具体涉及一种降低智能语音交互误唤醒的方法。

背景技术

随着智能电子产品的普及以及语音技术的发展，越来越多的电子产品都可以利用语音控制进行语音交互操作。如智能音箱，在处于休眠状态时可以通过说出预定的唤醒词来唤醒，接受用户发出的语音指令进行语音交互。目前存在的问题是同一商家的一系列产品设置了同样的唤醒词，因此在拥有多个产品的场景中，任何一个人说出的唤醒词可以把唤醒范围内的所有设备都唤醒，出现“一呼百应”的现象，影响用户体验。

现有技术中也有防止误唤醒的方法，通常对不同的智能音箱设置不同的唤醒词，但是这样无疑增加了用户记忆负担，让智能音箱反而成为用户负担。

鉴于此，本申请发明人发明了一种降低智能语音交互误唤醒的方法。

发明内容

本发明旨在解决上述技术问题，提供一种降低智能语音交互误唤醒的方法。

本发明的技术方案为：一种降低智能语音交互误唤醒的方法，应用于数据分析设备中，包括如下步骤：

数据分析设备接收同一时刻x个声音数据y1，所述声音数据y由智能语音交互设备采集，

声音数据y包括声音频率以及采集该声音的时间；将记录n个声音指纹数据与采集的声音数据y比对分析，若匹配则发送数据分析设备，并将此次获得该声音数据标记为y1，若不匹配，则不发送数据分析设备，n取值为大于1的整数，声音指纹数据包括预存声音频率与预存唤醒词；x为小于或等于m且大于0的整数，将x个声音数据y1建立数据集，并分析数据集，确定本次唤醒对象，确定唤醒对象后，生成唤醒指令，并将唤醒指令发送至唤醒对象对应的智能语音交互设备，对应的智能语音交互设备根据唤醒指令唤醒。

优选的，在上述中，将采集的声音数据与声音指纹数据比对分析过程如下：

获取采集声音数据中词语，将声音频率与预存声音频率比对，将词语与预存唤醒词比对，若声音频率与预存声音频率相匹配，词语与预存唤醒词相匹配，则将此次获得该声音数据y1发送至数据分析设备；反之，则不发送。

优选的，在上述中，将x个声音数据y1建立数据集，并分析数据集，确定本次唤醒对象，确定过程包括：获取x个声音数据y1中的时间t1，将数据集内最小的时间t1对应的智能语音交互设备作为本次唤醒对象。

优选的，在上述中，声音数据还包括音量值z，若时间t1数量为多个时，获取x个声音数据y1中的音量值z，将时间t1与时间t1相对应的音量值z之和标记为表现系数k，将数据集内最大的表现系数k1对应的智能语音交互设备作为本次唤醒对象；若表现系数k1数量为多个时，则任意确定一个表现系数k1，将表现系数k1对应的智能语音交互设备作为本次唤醒对象。

优选的，在上述中，在采集的声音数据与声音指纹数据比对分析之前，将词语中与预存唤醒词相匹配的内容标记为p1和时刻s1，将词语中与预存唤醒词相匹配内容后一部分内容标记为p2和时刻s2，将s1减除s2的绝对值标记为s，根据绝对值s的大小判定是否继续将采集的声音数据与声音指纹数据比对分析；

将绝对值s的大小与时刻阈值比对分析，若绝对值s小于或等于时刻阈值，则不继续将采集的声音数据与声音指纹数据比对分析；若绝对值s大于时刻阈值，则继续将采集的声音数据与声音指纹数据比对分析。

一种降低智能语音交互误唤醒的方法，应用于智能语音交互设备中，包括如下步骤：

智能语音交互设备采集声音数据y，声音数据y包括声音频率以及采集该声音的时间；将记录n个声音指纹数据与采集的声音数据y比对分析，若匹配则发送数据分析设备，并将此次获得该声音数据标记为y1，若不匹配，则不发送数据分析设备，n取值为大于1的整数，声音指纹数据包括预存声音频率与预存唤醒词；数据分析设备接收同一时刻x个声音数据y1，x为小于或等于m且大于0的整数，将x个声音数据y1建立数据集，并分析数据集，确定本次唤醒对象，确定唤醒对象后，生成唤醒指令，并将唤醒指令发送至唤醒对象对应的智能语音交互设备，对应的智能语音交互设备根据唤醒指令唤醒。

由于采用上述技术方案，本发明的有益效果为：

（1）通过若干个智能语音交互设备接收的匹配的声音数据，通过确定声音数据时间与声音大小值，确定离声源最近的语音交互设备，让最近的智能语音交互设备与使用者交互，交互效果更好，可避免同一区域多台语音交互设备同时被唤醒，有效提升交互体验。

（2）在使用者使用预设唤醒词谈论语音交互设备时，通过预存唤醒词出现的时间以及预存唤醒词后部分内容出现时间，通过计算这两种时间的差值，决定是否对语音交互设备进行唤醒，对语音交互设备增加一个唤醒条件，避免在该种情形中语音交互设备被误唤醒，增加了语音交互设备的智能程度以及提升使用体验。

附图说明

为了更清楚地说明本发明实施方式的技术方案，下面将对实施方式中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本发明实施例中降低智能语音交互误唤醒的方法示意图。

具体实施方式

下面将对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例一

如图1所示，本实施例所述的一种降低智能语音交互误唤醒的方法，包括m个智能语音交互设备与数据分析设备，m个智能语音交互设备与数据分析设备信号连接。

智能语音交互设备采集声音数据y，声音数据y包括声音频率、以及采集该声音的时间；记录n个声音指纹数据，n取值为大于1的整数，由使用者事先录入，声音指纹数据包括预存声音频率与预存唤醒词，预存唤醒词为唤醒智能设备的词语，如“小王同学”。

智能语音交互设备将采集的声音数据y与声音指纹数据比对分析，若匹配则发送数据分析设备，并将此次获得该声音数据标记为y1发送至数据分析设备；若不匹配，则不发送。

数据分析设备接收同一时刻x个声音数据y1，x为小于或等于m且大于0的整数，将x个声音数据y1建立数据集，并分析数据集，确定本次唤醒对象，确定唤醒对象后，生成唤醒指令，并将唤醒指令发送至唤醒对象对应的智能语音交互设备。

其中，将采集的声音数据与声音指纹数据比对分析过程如下：

其中，将x个声音数据y1建立数据集，并分析数据集，确定本次唤醒对象，确定步骤包括：获取x个声音数据y1中的时间t1，将数据集内最小的时间t1对应的智能语音交互设备作为本次唤醒对象，若时间t1数量为多个时，获取x个声音数据y1中的音量值z，将时间t1与时间t1相对应的音量值z之和标记为表现系数k，将数据集内最大的表现系数k1对应的智能语音交互设备作为本次唤醒对象；若表现系数k1数量为多个时，则任意确定一个表现系数k1，将表现系数k1对应的智能语音交互设备作为本次唤醒对象。

通过若干个智能语音交互设备接收的匹配的声音数据，通过确定声音数据时间与声音大小值，确定离声源最近的语音交互设备，让最近的智能语音交互设备与使用者交互，交互效果更好，可避免同一区域多台语音交互设备同时被唤醒，有效提升交互体验。

在语音交互设备在实际使用过程中，经常会用预设唤醒词代替语音交互设备本身，与家人或朋友讨论语音交互设备的使用体验，即用“小王同学”代替语音交互设备，在与家人或朋友讨论“小王同学”的使用体验时，此过程中声音数据中出出现了“小王同学”，但是并不想使用“小王同学”，此时语音交互设备易被唤醒，影响使用体验。

为解决上述情况，进一步改进设计；在采集的声音数据与声音指纹数据比对分析之前，将词语中与预存唤醒词相匹配的内容标记为p1和时刻s1，将词语中与预存唤醒词相匹配内容后一部分内容标记为p2和时刻s2，将s1减除s2的绝对值标记为s，根据绝对值s的大小判定是否继续将采集的声音数据与声音指纹数据比对分析。

将绝对值s的大小与时刻阈值比对分析，若绝对值s小于或等于时刻阈值，时刻阈值可以由使用者自行设置或开发者设置，则不继续将采集的声音数据与声音指纹数据比对分析；若绝对值s大于时刻阈值，则继续将采集的声音数据与声音指纹数据比对分析。

例如：“小王同学使用使用体验还不错”，句中“小王同学”为p1，“使用使用体验还不错”为p2。

在使用者使用预设唤醒词谈论语音交互设备时，通过预存唤醒词出现的时间以及预存唤醒词后部分内容出现时间，通过计算这两种时间的差值，决定是否对语音交互设备进行唤醒，对语音交互设备增加一个唤醒条件，避免在该种情形中语音交互设备被误唤醒，增加了语音交互设备的智能程度以及提升使用体验。

实施例二

一种降低智能语音交互误唤醒的方法，包括m个智能语音交互设备与数据分析设备，m个智能语音交互设备与数据分析设备信号连接。

智能语音交互设备包括数据采集模块、声音身份记录模块、验证模块。

数据采集模块采集声音数据y，声音数据y包括声音频率、以及采集该声音的时间。

声音身份记录模块记录n个声音指纹数据，n取值为大于1的整数，由使用者事先录入，声音指纹数据包括预存声音频率与预存唤醒词，预存唤醒词为唤醒智能设备的词语，如“小王同学”。

验证模块，将采集的声音数据y与声音指纹数据比对分析，若匹配则发送数据分析设备，并将此次获得该声音数据标记为y1发送至数据分析设备；若不匹配，则不发送。

在采集的声音数据与声音指纹数据比对分析之前，将词语中与预存唤醒词相匹配的内容标记为p1和时刻s1，将词语中与预存唤醒词相匹配内容后一部分内容标记为p2和时刻s2，将s1减除s2的绝对值标记为s，根据绝对值s的大小判定是否继续将采集的声音数据与声音指纹数据比对分析。

在本说明书的描述中，参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节，也不限制该发明仅为的具体实施方式。显然，根据本说明书的内容，可做很多的修改和变化。本说明书选取并具体描述这些实施例，是为了更好地解释本发明的原理和实际应用，从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。

Claims

1.一种降低智能语音交互误唤醒的方法，应用于数据分析设备中，其特征在于，包括如下步骤：

数据分析设备接收同一时刻x个声音数据y1，所述声音数据y由智能语音交互设备采集，声音数据y包括声音频率以及采集该声音的时间；将记录n个声音指纹数据与采集的声音数据y比对分析，若匹配则发送数据分析设备，并将此次获得该声音数据标记为y1，若不匹配，则不发送数据分析设备，n取值为大于1的整数，声音指纹数据包括预存声音频率与预存唤醒词；x为小于或等于m且大于0的整数，将x个声音数据y1建立数据集，并分析数据集，确定本次唤醒对象，确定唤醒对象后，生成唤醒指令，并将唤醒指令发送至唤醒对象对应的智能语音交互设备，对应的智能语音交互设备根据唤醒指令唤醒；

将采集的声音数据与声音指纹数据比对分析过程如下：

获取采集声音数据中词语，将声音频率与预存声音频率比对，将词语与预存唤醒词比对，若声音频率与预存声音频率相匹配，词语与预存唤醒词相匹配，则将此次获得该声音数据y1发送至数据分析设备；反之，则不发送；

将x个声音数据y1建立数据集，并分析数据集，确定本次唤醒对象，确定过程包括：获取x个声音数据y1中的时间t1，将数据集内最小的时间t1对应的智能语音交互设备作为本次唤醒对象；

声音数据还包括音量值z，若时间t1数量为多个时，获取x个声音数据y1中的音量值z，将时间t1与时间t1相对应的音量值z之和标记为表现系数k，将数据集内最大的表现系数k1对应的智能语音交互设备作为本次唤醒对象；若表现系数k1数量为多个时，则任意确定一个表现系数k1，将表现系数k1对应的智能语音交互设备作为本次唤醒对象；

在采集的声音数据与声音指纹数据比对分析之前，将词语中与预存唤醒词相匹配的内容标记为p1和时刻s1，将词语中与预存唤醒词相匹配内容后一部分内容标记为p2和时刻s2，将s1减除s2的绝对值标记为s，根据绝对值s的大小判定是否继续将采集的声音数据与声音指纹数据比对分析；

2.一种降低智能语音交互误唤醒的方法，应用于智能语音交互设备中，其特征在于，包括如下步骤：

智能语音交互设备采集声音数据y，声音数据y包括声音频率以及采集该声音的时间；将记录n个声音指纹数据与采集的声音数据y比对分析，若匹配则发送数据分析设备，并将此次获得该声音数据标记为y1，若不匹配，则不发送数据分析设备，n取值为大于1的整数，声音指纹数据包括预存声音频率与预存唤醒词；数据分析设备接收同一时刻x个声音数据y1，x为小于或等于m且大于0的整数，将x个声音数据y1建立数据集，并分析数据集，确定本次唤醒对象，确定唤醒对象后，生成唤醒指令，并将唤醒指令发送至唤醒对象对应的智能语音交互设备，对应的智能语音交互设备根据唤醒指令唤醒；

将采集的声音数据与声音指纹数据比对分析过程如下：