CN111415657A

CN111415657A - 一种去中心化设备、多设备***及其语音控制方法

Info

Publication number: CN111415657A
Application number: CN201910011444.8A
Authority: CN
Inventors: 何云鹏; 高君效
Original assignee: Chipintelli Technology Co Ltd
Current assignee: Chipintelli Technology Co Ltd
Priority date: 2019-01-07
Filing date: 2019-01-07
Publication date: 2020-07-14

Abstract

一种去中心化设备，包括语音识别模块、能量值计算模块、能量值筛选排序模块、收发模块和执行模块;所述能量值计算模块、收发模块、执行模块均与所述能量值筛选排序模块信号连接，所述能量值计算模块还与所述语音识别模块和收发模块信号连接，不同设备的收发模块之间可互相通信。一种去中心化多设备***,包括多个如上所述设备。本发明将多设备识别采用去中心化处理方式，不仅去掉了中心化的处理设备，将识别转化为设备自行处理还将复杂的计算分解到多个设备中并行进行，提高计算速度的同时降低了网络带宽要求，提升了***的响应速度，提高了用户的体验感。

Description

一种去中心化设备、多设备***及其语音控制方法

技术领域

本发明属于人工智能领域，涉及语音识别技术，具体涉及一种去中心化设备、多设备***及其语音控制方法。

背景技术

随着语音识别功能的兴起，可能在同一场景如大厅中就有很多的智能语音设备，这些设备在使用时需要用唤醒词进行唤醒。但如果这些设备的唤醒词相同，这时就有可能出现多个设备响应用户的唤醒词，干扰用户的真实需求。例如图1中所示的一个具体场景中，用户发出语音命令，设备A1、A2、A3的唤醒词完全一样，都可能识别出命令并执行。

为解决上述问题，现有技术的普遍做法是通过一个处理中心，如云端服务器进行统一判断用户离哪个设备近，就由哪个设备响应用户的唤醒指令，但该方法需要用一个额外的服务器进行判断，增加了成本；现有技术可以通过直接接收语音信息再运算进行计算排序，通过计算各个设备的距离来选择执行命令的设备，这种由一个中心处理多设备的唤醒距离计算，如果设备较多，可能由于中心处理能力不够，计算反馈太慢，造成设备响应用户有较大延迟，同时直接上传数据量大的原始语音信息，对于网络带宽也有要求，增加了应用成本。

发明内容

为克服现有技术存在的缺陷，本发明公开了一种去中心化设备、多设备***及其语音控制方法。

本发明所述去中心化设备，包括语音识别模块、能量值计算模块、能量值筛选排序模块、收发模块和执行模块;所述能量值计算模块、收发模块、执行模块均与所述能量值筛选排序模块信号连接，所述能量值计算模块还与所述语音识别模块和收发模块信号连接，不同设备的收发模块之间可互相通信。

本发明所述去中心化多设备***,包括多个如上所述设备，多个所述设备中至少有两个设备的唤醒词相同。

本发明还公开了一种去中心化多设备***语音控制方法，包括以下步骤:

S1设备识别出语音中的唤醒词WS；

S2设备计算自身接收到的语音信号能量值PA，并将计算结果和识别出的唤醒词WS打包向***内所有设备发送，同时接收***内其他设备发送的包含唤醒词和能量值的数据包；

S3识别出所有数据包中的唤醒词后，筛选出与本设备匹配的唤醒词；

上述筛选范围包括自身识别出的唤醒词WS和接收到的唤醒词；

S4将筛选出的唤醒词按照能量值大小排序，如果排名最高的是本设备识别出的唤醒词对应的语音信号能量值PA则执行命令，否则终止进程。

优选的，所述能量值为音频信号能量值或音频信号能量与环境噪声的信噪比值。

优选的，所述S1中设备识别出语音中的唤醒词WS后首先比对是否与自身匹配,是则继续进行后续步骤,否则终止后续步骤。

本发明将多设备识别采用去中心化处理方式，不仅去掉了中心化的处理设备，将识别转化为设备自行处理还将复杂的计算分解到多个设备中并行进行，提高计算速度的同时降低了网络带宽要求，提升了***的响应速度，提高了用户的体验感。

附图说明

图1给出本发明的一种具体应用场景示意图；图1中字母A1、A2、A3、B表示不同的设备。

图2给出本发明所述设备的一种具体实施方式内部模块示意图。

图3给出本发明所述语音控制方法的一种具体实施方式流程示意图。

具体实施方式

下面对本发明的具体实施方式作进一步的详细说明。

本发明所述去中心化设备、多设备***及其语音控制方法，主要用于解决如何选择性的从多个唤醒词相同的设备中选出执行命令的设备的问题。

例如图1所示的场景中，存在设备A1、A2、A3、B,其中设备A1、A2、A3的唤醒词相同均为A0,设备B的唤醒词为B0,用户发出唤醒词A0后,设备A1、A2、A3均识别出唤醒词,但用户一般来说,真实目的是希望离自己最近的设备A1动作。

所谓唤醒词是指语音识别中用于唤醒设备的专用词,每个设备都具有自己唯一的唤醒词,语音识别环境下,设备首先识别出唤醒词并核实与自身吻合,才会继续进行后续命令识别或执行命令等操作。

为解决上述问题,本发明公开了一种去中心化设备，包括语音识别模块、能量值计算模块、能量值筛选排序模块、收发模块和执行模块;所述能量值计算模块、收发模块、执行模块均与所述能量值筛选排序模块信号连接，所述能量值计算模块还与所述语音识别模块和收发模块信号连接，不同设备的收发模块之间可互相通信。

对于由多个上述设备组成且其中至少有两个设备唤醒词相同的***,例如一个礼堂中的若干位置不同的吸顶灯,同一套房屋中不同房间的空调等具体应用。

本发明所述去中心化多设备***语音控制方法，包括以下步骤

S1设备识别出语音中的唤醒词WS；

以图1的应用场景为例说明应用本发明的语音识别过程如下:

用户发出唤醒词A0,***中的各个设备A1、A2、A3、B均识别到该唤醒词后,其中A1、A2、A3接收到唤醒词后,计算自身接收到的语音信号能量值分别为PA1、PA2、PA3;各自将识别后的唤醒词与能量值通过收发模块打包发送。

所述能量值通常为音频信号能量值或音频信号能量与环境噪声的信噪比值,能量值与波形的幅度平方成正比。

收发模块直接向其他设备的收发模块传送，传送的是识别后的信息，一般只有很少字节，采用室内短距无线传输方式例如蓝牙等即可，一般不用额外采用有线或占用较大的带宽。

各个设备收发模块之间的通信可以采用有线或无线方式进行，对于无线短距应用，可以采用蓝牙、WIFI、2.4G无线模块等方式进行收发模块之间的通信。

本发明以语音的设备本地识别为前提,不再需要将语音信息上传云端或到其他中心服务器进行识别周转,本发明中设备的语音识别模块可以利用申请人启英泰伦公司的CI1006系列语音识别芯片进行本地识别;能量值计算、能量值筛选排序等功能也可以利用编写软件在申请人启英泰伦公司的CI1006系列语音识别芯片中实现。

对于自身唤醒词不是A0的设备B,可以如A1、A2、A3一样计算发送,也可以首先比对是否与自身匹配,是则继续进行后续步骤,否则终止后续步骤,以节省无谓功耗。

设备A1计算出自身接收到的唤醒词能量值PA1后,与接收到的由设备A2,A3传送的唤醒词能量值PA2和PA3在能量值筛选排序模块中进行排序,如果发现PA1能量值最高,则由设备A1执行命令,否则不执行并终止进程。

设备A1、A2、A3中,由识别出自身识别的能量值最高的设备执行命令。

对于同时接收到多个不同唤醒词的情况,能量值筛选排序模块接收到各种唤醒词后,首先筛选出与本设备匹配的唤醒词,筛选范围包括自身识别出的唤醒词WS和接收到的唤醒词;再进行排序。

对于用户,发出命令时一般是想控制离自己最近的设备,设备越近则音频信号在传播路径上衰减越少,被接收到的能量值越高,通过能量值排序,定义出需要执行命令的设备。

前文所述的为本发明的各个优选实施例，各个优选实施例中的优选实施方式如果不是明显自相矛盾或以某一优选实施方式为前提，各个优选实施方式都可以任意叠加组合使用，所述实施例以及实施例中的具体参数仅是为了清楚表述发明人的发明验证过程，并非用以限制本发明的专利保护范围，本发明的专利保护范围仍然以其权利要求书为准，凡是运用本发明的说明书内容所作的等同结构变化，同理均应包含在本发明的保护范围内。

Claims

1.一种去中心化设备，其特征在于,包括语音识别模块、能量值计算模块、能量值筛选排序模块、收发模块和执行模块;所述能量值计算模块、收发模块、执行模块均与所述能量值筛选排序模块信号连接，所述能量值计算模块还与所述语音识别模块和收发模块信号连接，不同设备的收发模块之间可互相通信。

2.一种去中心化多设备***,其特征在于,包括多个如权利要求1所述设备，多个所述设备中至少有两个设备的唤醒词相同。

3.一种去中心化多设备***语音控制方法，其特征在于，包括以下步骤:

S1设备识别出语音中的唤醒词WS；

4.如权利要求3所述的去中心化多设备语音控制方法，其特征在于，所述能量值为音频信号能量值或音频信号能量与环境噪声的信噪比值。

5.如权利要求3所述的去中心化多设备语音控制方法，其特征在于，所述 S1中设备识别出语音中的唤醒词WS后首先比对是否与自身匹配,是则继续进行后续步骤,否则终止后续步骤。