CN111415657A - 一种去中心化设备、多设备***及其语音控制方法 - Google Patents
一种去中心化设备、多设备***及其语音控制方法 Download PDFInfo
- Publication number
- CN111415657A CN111415657A CN201910011444.8A CN201910011444A CN111415657A CN 111415657 A CN111415657 A CN 111415657A CN 201910011444 A CN201910011444 A CN 201910011444A CN 111415657 A CN111415657 A CN 111415657A
- Authority
- CN
- China
- Prior art keywords
- energy value
- module
- devices
- voice
- awakening
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 20
- 238000004364 calculation method Methods 0.000 claims abstract description 23
- 238000012216 screening Methods 0.000 claims abstract description 16
- 238000004891 communication Methods 0.000 claims abstract description 5
- 230000005236 sound signal Effects 0.000 claims description 7
- 238000012545 processing Methods 0.000 abstract description 9
- 238000010586 diagram Methods 0.000 description 2
- 210000004072 lung Anatomy 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000002618 waking effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/32—Multiple recognisers used in sequence or in parallel; Score combination systems therefor, e.g. voting systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Selective Calling Equipment (AREA)
Abstract
一种去中心化设备,包括语音识别模块、能量值计算模块、能量值筛选排序模块、收发模块和执行模块;所述能量值计算模块、收发模块、执行模块均与所述能量值筛选排序模块信号连接,所述能量值计算模块还与所述语音识别模块和收发模块信号连接,不同设备的收发模块之间可互相通信。一种去中心化多设备***,包括多个如上所述设备。本发明将多设备识别采用去中心化处理方式,不仅去掉了中心化的处理设备,将识别转化为设备自行处理还将复杂的计算分解到多个设备中并行进行,提高计算速度的同时降低了网络带宽要求,提升了***的响应速度,提高了用户的体验感。
Description
技术领域
本发明属于人工智能领域,涉及语音识别技术,具体涉及一种去中心化设备、多设备***及其语音控制方法。
背景技术
随着语音识别功能的兴起,可能在同一场景如大厅中就有很多的智能语音设备,这些设备在使用时需要用唤醒词进行唤醒。但如果这些设备的唤醒词相同,这时就有可能出现多个设备响应用户的唤醒词,干扰用户的真实需求。例如图1中所示的一个具体场景中,用户发出语音命令,设备A1、A2、A3的唤醒词完全一样,都可能识别出命令并执行。
为解决上述问题,现有技术的普遍做法是通过一个处理中心,如云端服务器进行统一判断用户离哪个设备近,就由哪个设备响应用户的唤醒指令,但该方法需要用一个额外的服务器进行判断,增加了成本;现有技术可以通过直接接收语音信息再运算进行计算排序,通过计算各个设备的距离来选择执行命令的设备,这种由一个中心处理多设备的唤醒距离计算,如果设备较多,可能由于中心处理能力不够,计算反馈太慢,造成设备响应用户有较大延迟,同时直接上传数据量大的原始语音信息,对于网络带宽也有要求,增加了应用成本。
发明内容
为克服现有技术存在的缺陷,本发明公开了一种去中心化设备、多设备***及其语音控制方法。
本发明所述去中心化设备,包括语音识别模块、能量值计算模块、能量值筛选排序模块、收发模块和执行模块;所述能量值计算模块、收发模块、执行模块均与所述能量值筛选排序模块信号连接,所述能量值计算模块还与所述语音识别模块和收发模块信号连接,不同设备的收发模块之间可互相通信。
本发明所述去中心化多设备***,包括多个如上所述设备,多个所述设备中至少有两个设备的唤醒词相同。
本发明还公开了一种去中心化多设备***语音控制方法,包括以下步骤:
S1设备识别出语音中的唤醒词WS;
S2设备计算自身接收到的语音信号能量值PA,并将计算结果和识别出的唤醒词WS打包向***内所有设备发送,同时接收***内其他设备发送的包含唤醒词和能量值的数据包;
S3识别出所有数据包中的唤醒词后,筛选出与本设备匹配的唤醒词;
上述筛选范围包括自身识别出的唤醒词WS和接收到的唤醒词;
S4将筛选出的唤醒词按照能量值大小排序,如果排名最高的是本设备识别出的唤醒词对应的语音信号能量值PA则执行命令,否则终止进程。
优选的,所述能量值为音频信号能量值或音频信号能量与环境噪声的信噪比值。
优选的,所述S1中设备识别出语音中的唤醒词WS后首先比对是否与自身匹配,是则继续进行后续步骤,否则终止后续步骤。
本发明将多设备识别采用去中心化处理方式,不仅去掉了中心化的处理设备,将识别转化为设备自行处理还将复杂的计算分解到多个设备中并行进行,提高计算速度的同时降低了网络带宽要求,提升了***的响应速度,提高了用户的体验感。
附图说明
图1给出本发明的一种具体应用场景示意图;图1中字母A1、A2、A3、B表示不同的设备。
图2给出本发明所述设备的一种具体实施方式内部模块示意图。
图3给出本发明所述语音控制方法的一种具体实施方式流程示意图。
具体实施方式
下面对本发明的具体实施方式作进一步的详细说明。
本发明所述去中心化设备、多设备***及其语音控制方法,主要用于解决如何选择性的从多个唤醒词相同的设备中选出执行命令的设备的问题。
例如图1所示的场景中,存在设备A1、A2、A3、B,其中设备A1、A2、A3的唤醒词相同均为A0,设备B的唤醒词为B0,用户发出唤醒词A0后,设备A1、A2、A3均识别出唤醒词,但用户一般来说,真实目的是希望离自己最近的设备A1动作。
所谓唤醒词是指语音识别中用于唤醒设备的专用词,每个设备都具有自己唯一的唤醒词,语音识别环境下,设备首先识别出唤醒词并核实与自身吻合,才会继续进行后续命令识别或执行命令等操作。
为解决上述问题,本发明公开了一种去中心化设备,包括语音识别模块、能量值计算模块、能量值筛选排序模块、收发模块和执行模块;所述能量值计算模块、收发模块、执行模块均与所述能量值筛选排序模块信号连接,所述能量值计算模块还与所述语音识别模块和收发模块信号连接,不同设备的收发模块之间可互相通信。
对于由多个上述设备组成且其中至少有两个设备唤醒词相同的***,例如一个礼堂中的若干位置不同的吸顶灯,同一套房屋中不同房间的空调等具体应用。
本发明所述去中心化多设备***语音控制方法,包括以下步骤
S1设备识别出语音中的唤醒词WS;
S2设备计算自身接收到的语音信号能量值PA,并将计算结果和识别出的唤醒词WS打包向***内所有设备发送,同时接收***内其他设备发送的包含唤醒词和能量值的数据包;
S3识别出所有数据包中的唤醒词后,筛选出与本设备匹配的唤醒词;
上述筛选范围包括自身识别出的唤醒词WS和接收到的唤醒词;
S4将筛选出的唤醒词按照能量值大小排序,如果排名最高的是本设备识别出的唤醒词对应的语音信号能量值PA则执行命令,否则终止进程。
以图1的应用场景为例说明应用本发明的语音识别过程如下:
用户发出唤醒词A0,***中的各个设备A1、A2、A3、B均识别到该唤醒词后,其中A1、A2、A3接收到唤醒词后,计算自身接收到的语音信号能量值分别为PA1、PA2、PA3;各自将识别后的唤醒词与能量值通过收发模块打包发送。
所述能量值通常为音频信号能量值或音频信号能量与环境噪声的信噪比值,能量值与波形的幅度平方成正比。
收发模块直接向其他设备的收发模块传送,传送的是识别后的信息,一般只有很少字节,采用室内短距无线传输方式例如蓝牙等即可,一般不用额外采用有线或占用较大的带宽。
各个设备收发模块之间的通信可以采用有线或无线方式进行,对于无线短距应用,可以采用蓝牙、WIFI、2.4G无线模块等方式进行收发模块之间的通信。
本发明以语音的设备本地识别为前提,不再需要将语音信息上传云端或到其他中心服务器进行识别周转,本发明中设备的语音识别模块可以利用申请人启英泰伦公司的CI1006系列语音识别芯片进行本地识别;能量值计算、能量值筛选排序等功能也可以利用编写软件在申请人启英泰伦公司的CI1006系列语音识别芯片中实现。
对于自身唤醒词不是A0的设备B,可以如A1、A2、A3一样计算发送,也可以首先比对是否与自身匹配,是则继续进行后续步骤,否则终止后续步骤,以节省无谓功耗。
设备A1计算出自身接收到的唤醒词能量值PA1后,与接收到的由设备A2,A3传送的唤醒词能量值PA2和PA3在能量值筛选排序模块中进行排序,如果发现PA1能量值最高,则由设备A1执行命令,否则不执行并终止进程。
设备A1、A2、A3中,由识别出自身识别的能量值最高的设备执行命令。
对于同时接收到多个不同唤醒词的情况,能量值筛选排序模块接收到各种唤醒词后,首先筛选出与本设备匹配的唤醒词,筛选范围包括自身识别出的唤醒词WS和接收到的唤醒词;再进行排序。
对于用户,发出命令时一般是想控制离自己最近的设备,设备越近则音频信号在传播路径上衰减越少,被接收到的能量值越高,通过能量值排序,定义出需要执行命令的设备。
本发明将多设备识别采用去中心化处理方式,不仅去掉了中心化的处理设备,将识别转化为设备自行处理还将复杂的计算分解到多个设备中并行进行,提高计算速度的同时降低了网络带宽要求,提升了***的响应速度,提高了用户的体验感。
前文所述的为本发明的各个优选实施例,各个优选实施例中的优选实施方式如果不是明显自相矛盾或以某一优选实施方式为前提,各个优选实施方式都可以任意叠加组合使用,所述实施例以及实施例中的具体参数仅是为了清楚表述发明人的发明验证过程,并非用以限制本发明的专利保护范围,本发明的专利保护范围仍然以其权利要求书为准,凡是运用本发明的说明书内容所作的等同结构变化,同理均应包含在本发明的保护范围内。
Claims (5)
1.一种去中心化设备,其特征在于,包括语音识别模块、能量值计算模块、能量值筛选排序模块、收发模块和执行模块;所述能量值计算模块、收发模块、执行模块均与所述能量值筛选排序模块信号连接,所述能量值计算模块还与所述语音识别模块和收发模块信号连接,不同设备的收发模块之间可互相通信。
2.一种去中心化多设备***,其特征在于,包括多个如权利要求1所述设备,多个所述设备中至少有两个设备的唤醒词相同。
3.一种去中心化多设备***语音控制方法,其特征在于,包括以下步骤:
S1设备识别出语音中的唤醒词WS;
S2设备计算自身接收到的语音信号能量值PA,并将计算结果和识别出的唤醒词WS打包向***内所有设备发送,同时接收***内其他设备发送的包含唤醒词和能量值的数据包;
S3识别出所有数据包中的唤醒词后,筛选出与本设备匹配的唤醒词;
上述筛选范围包括自身识别出的唤醒词WS和接收到的唤醒词;
S4将筛选出的唤醒词按照能量值大小排序,如果排名最高的是本设备识别出的唤醒词对应的语音信号能量值PA则执行命令,否则终止进程。
4.如权利要求3所述的去中心化多设备语音控制方法,其特征在于,所述能量值为音频信号能量值或音频信号能量与环境噪声的信噪比值。
5.如权利要求3所述的去中心化多设备语音控制方法,其特征在于,所述 S1中设备识别出语音中的唤醒词WS后首先比对是否与自身匹配,是则继续进行后续步骤,否则终止后续步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910011444.8A CN111415657A (zh) | 2019-01-07 | 2019-01-07 | 一种去中心化设备、多设备***及其语音控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910011444.8A CN111415657A (zh) | 2019-01-07 | 2019-01-07 | 一种去中心化设备、多设备***及其语音控制方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111415657A true CN111415657A (zh) | 2020-07-14 |
Family
ID=71493995
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910011444.8A Pending CN111415657A (zh) | 2019-01-07 | 2019-01-07 | 一种去中心化设备、多设备***及其语音控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111415657A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112652310A (zh) * | 2020-12-31 | 2021-04-13 | 乐鑫信息科技(上海)股份有限公司 | 分布式语音处理***及方法 |
CN113010216A (zh) * | 2021-03-12 | 2021-06-22 | 深圳市超维实业有限公司 | 一种基于吸顶灯唤醒事件管理方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100004930A1 (en) * | 2008-07-02 | 2010-01-07 | Brian Strope | Speech Recognition with Parallel Recognition Tasks |
CN106030699A (zh) * | 2014-10-09 | 2016-10-12 | 谷歌公司 | 多个设备上的热词检测 |
US20170083285A1 (en) * | 2015-09-21 | 2017-03-23 | Amazon Technologies, Inc. | Device selection for providing a response |
CN107919119A (zh) * | 2017-11-16 | 2018-04-17 | 百度在线网络技术(北京)有限公司 | 多设备交互协同的方法、装置、设备及计算机可读介质 |
CN108766422A (zh) * | 2018-04-02 | 2018-11-06 | 青岛海尔科技有限公司 | 语音设备的响应方法、装置、存储介质及计算机设备 |
CN108766432A (zh) * | 2018-07-02 | 2018-11-06 | 珠海格力电器股份有限公司 | 一种控制家电间协同工作的方法 |
-
2019
- 2019-01-07 CN CN201910011444.8A patent/CN111415657A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100004930A1 (en) * | 2008-07-02 | 2010-01-07 | Brian Strope | Speech Recognition with Parallel Recognition Tasks |
CN106030699A (zh) * | 2014-10-09 | 2016-10-12 | 谷歌公司 | 多个设备上的热词检测 |
US20170083285A1 (en) * | 2015-09-21 | 2017-03-23 | Amazon Technologies, Inc. | Device selection for providing a response |
CN107919119A (zh) * | 2017-11-16 | 2018-04-17 | 百度在线网络技术(北京)有限公司 | 多设备交互协同的方法、装置、设备及计算机可读介质 |
CN108766422A (zh) * | 2018-04-02 | 2018-11-06 | 青岛海尔科技有限公司 | 语音设备的响应方法、装置、存储介质及计算机设备 |
CN108766432A (zh) * | 2018-07-02 | 2018-11-06 | 珠海格力电器股份有限公司 | 一种控制家电间协同工作的方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112652310A (zh) * | 2020-12-31 | 2021-04-13 | 乐鑫信息科技(上海)股份有限公司 | 分布式语音处理***及方法 |
CN113010216A (zh) * | 2021-03-12 | 2021-06-22 | 深圳市超维实业有限公司 | 一种基于吸顶灯唤醒事件管理方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111223497B (zh) | 一种终端的就近唤醒方法、装置、计算设备及存储介质 | |
CN106910500B (zh) | 对带麦克风阵列的设备进行语音控制的方法及设备 | |
US11354089B2 (en) | System and method for dialog interaction in distributed automation systems | |
US10601599B2 (en) | Voice command processing in low power devices | |
CN201129826Y (zh) | 空调控制装置 | |
CN206097455U (zh) | 一种语音识别控制设备 | |
CN107767867B (zh) | 基于语音控制网络的实现方法、装置、***及存储介质 | |
CN108320749A (zh) | 远场语音控制设备和远场语音控制*** | |
US9911417B2 (en) | Internet of things system with voice-controlled functions and method for processing information of the same | |
CN109949801A (zh) | 一种基于耳机的智能家居设备语音控制方法及*** | |
CN111415657A (zh) | 一种去中心化设备、多设备***及其语音控制方法 | |
WO2020015283A1 (zh) | 设备的控制方法及装置、存储介质和电子装置 | |
CN108572554A (zh) | 一种智能家居控制***、方法及相关设备 | |
CN110782897B (zh) | 一种基于自然语义编码的语音终端通信方法及*** | |
CN112585675A (zh) | 选择地使用多个语音数据接收装置进行智能服务的方法、装置和*** | |
CN107529146B (zh) | 结合音频的多传感室内定位方法、装置、***及存储介质 | |
KR20050030906A (ko) | 집합적 음성인식 시스템 및 그 시스템에서의 음성인식 방법 | |
CN206322472U (zh) | 一种ZigBee语音控制器 | |
WO2021088582A1 (zh) | 一种物联网传感器管理方法以及无线访问点 | |
CN110808042A (zh) | 一种语音交互组网***及方法 | |
CN106847280B (zh) | 音频信息处理方法、智能终端及语音控制终端 | |
CN207704206U (zh) | 一种家居环境智能*** | |
KR20200062623A (ko) | 전자 장치 및 그것의 타 전자 장치를 제어하는 방법 | |
CN111415658A (zh) | 一种去中心化语音控制多设备***及其控制方法 | |
CN103716246A (zh) | 一种智能无线路由器及其功率控制方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200714 |