CN115312049A - 指令的响应方法、存储介质及电子装置 - Google Patents
指令的响应方法、存储介质及电子装置 Download PDFInfo
- Publication number
- CN115312049A CN115312049A CN202210764421.6A CN202210764421A CN115312049A CN 115312049 A CN115312049 A CN 115312049A CN 202210764421 A CN202210764421 A CN 202210764421A CN 115312049 A CN115312049 A CN 115312049A
- Authority
- CN
- China
- Prior art keywords
- target
- awakening
- audio energy
- time range
- cloud server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000004044 response Effects 0.000 title claims abstract description 79
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000004364 calculation method Methods 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 7
- PCTMTFRHKVHKIS-BMFZQQSSSA-N (1s,3r,4e,6e,8e,10e,12e,14e,16e,18s,19r,20r,21s,25r,27r,30r,31r,33s,35r,37s,38r)-3-[(2r,3s,4s,5s,6r)-4-amino-3,5-dihydroxy-6-methyloxan-2-yl]oxy-19,25,27,30,31,33,35,37-octahydroxy-18,20,21-trimethyl-23-oxo-22,39-dioxabicyclo[33.3.1]nonatriaconta-4,6,8,10 Chemical compound C1C=C2C[C@@H](OS(O)(=O)=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2.O[C@H]1[C@@H](N)[C@H](O)[C@@H](C)O[C@H]1O[C@H]1/C=C/C=C/C=C/C=C/C=C/C=C/C=C/[C@H](C)[C@@H](O)[C@@H](C)[C@H](C)OC(=O)C[C@H](O)C[C@H](O)CC[C@@H](O)[C@H](O)C[C@H](O)C[C@](O)(C[C@H](O)[C@H]2C(O)=O)O[C@H]2C1 PCTMTFRHKVHKIS-BMFZQQSSSA-N 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000005406 washing Methods 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 238000004887 air purification Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 235000019504 cigarettes Nutrition 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011112 process operation Methods 0.000 description 1
- 238000010408 sweeping Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/34—Adaptation of a single recogniser for parallel processing, e.g. by use of multiple processors or cloud computing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Telephonic Communication Services (AREA)
Abstract
本申请公开了一种指令的响应方法、存储介质及电子装置,涉及智能家居/智慧家庭技术领域,该指令的响应方法包括:当目标设备的预唤醒模块接收到目标用户发出的唤醒词语时,目标设备获取在第一时间范围内接收到的第一音频能量;目标设备将第一音频能量发送至云端服务器,云端服务器用于通过第一音频能量确定目标设备是否为目标用户的响应设备;所述目标设备接收所述云端服务器发送的唤醒结果,并将所述唤醒结果进行缓存,其中,所述唤醒结果用于指示所述目标设备是否为所述目标用户的响应设备。通过本发明解决了多个设备对用户指令进行响应,导致用户体验差的问题。
Description
技术领域
本申请涉及智能家居/智慧家庭领域,具体而言,涉及一种指令的响应方法、存储介质及电子装置。
背景技术
用户家中的添加智能语音功能的设备越来越多,从智能音箱、智能电视拓展到智能空调、智能冰箱、智能热水器等。用户通过向设备发送唤醒指令以唤醒设备进行工作,然而对于同一厂家的智能设备往往具有相同的唤醒指令。这样用户发出唤醒指令后可能同时唤醒多个设备,多个设备均会对用户发出的指令进行响应,这样导致用户体验差的问题。
针对上述问题,目前尚未存在有效的解决方案。
发明内容
本发明实施例提供了一种指令的响应方法、存储介质及电子装置,以至少解决多个设备对用户指令进行响应,导致用户体验差的问题。
根据本发明的一个实施例,提供了一种指令的响应方法,包括:当目标设备的预唤醒模块接收到目标用户发出的唤醒词语时,所述目标设备获取在第一时间范围内接收到的第一音频能量;所述目标设备将所述第一音频能量发送至云端服务器,其中,所述云端服务器用于通过所述第一音频能量确定所述目标设备是否为所述目标用户的响应设备;所述目标设备接收所述云端服务器发送的唤醒结果,并将所述唤醒结果进行缓存,其中,所述唤醒结果用于指示所述目标设备是否为所述目标用户的响应设备。
在一个示例性实施例中,所述目标设备获取在第一时间范围内接收到的第一音频能量,包括:在所述预唤醒模块接收到所述唤醒词语的时刻为第一时刻的情况下,将所述第一时刻至所述第一时刻之前的预设时间范围确定为所述第一时间范围;所述目标设备获取在所述第一时间范围内接收到的音频;所述目标设备通过音频能量计算模块,确定在所述第一时间范围内接收到的所述第一音频能量。
在一个示例性实施例中,在所述目标设备接收所述云端服务器发送的唤醒结果之后,所述方法还包括:在目标缓存中存在所述唤醒结果的情况下,所述目标设备在所述目标缓存中读取所述唤醒结果;在所述唤醒结果指示所述目标设备为所述目标用户的响应设备的情况下,所述目标设备对所述目标用户发出的指令进行响应。
在一个示例性实施例中,所述方法还包括:在目标缓存中不存在所述唤醒结果,且所述目标设备的唤醒模块接收到所述目标用户发出的唤醒词语的情况下,所述目标设备获取在第二时间范围内接收到的第二音频能量;所述目标设备将所述第二音频能量发送至所述云端服务器,其中,所述云端服务器用于通过所述第二音频能量确定所述目标设备是否为所述目标用户的响应设备;在确定所述目标设备为所述目标用户的响应设备的情况下,所述目标设备对所述目标用户的指令进行响应。
在一个示例性实施例中,所述目标设备获取在第二时间范围内接收到的第二音频能量,包括:在所述唤醒模块接收到所述唤醒词语的时刻为第二时刻的情况下,将所述第二时刻至所述第二时刻之前的所述预设时间范围确定为所述第二时间范围;所述目标设备获取在所述第二时间范围内接收到的音频;所述目标设备通过音频能量计算模块,确定在第二时间范围内接收到的第二音频能量。
在一个示例性实施例中,所述云端服务器用于接收多个设备发送的多个音频能量,并根据所述多个音频能量在所述多个设备中确定出所述目标用户的响应设备,其中,所述多个音频能量中的每个音频能量是对应的设备在接收到所述目标用户发出的唤醒词语时,在相应的时间段内获取到的音频能量,所述多个设备包括所述目标设备。
在一个示例性实施例中,所述根据所述多个音频能量在所述多个设备中确定出所述目标用户的响应,包括:所述云端服务器用于将所述多个音频能量中能量最大的音频能量确定为目标音频能量;所述云端服务器还用于将所述目标音频能量对应的设备确定为所述目标用户的响应设备。
根据本发明的另一个实施例,提供了指令的响应装置,包括:获取单元,用于当目标设备的预唤醒模块接收到目标用户发出的唤醒词语时,获取在第一时间范围内接收到的第一音频能量;发送单元,用于将所述第一音频能量发送至云端服务器,其中,所述云端服务器用于通过所述第一音频能量确定所述目标设备是否为所述目标用户的响应设备;响应单元,用于在确定所述目标设备为所述目标用户的响应设备的情况下,对所述目标用户的指令进行响应。
根据本发明的另一个实施例,提供了指令的响应设备,应用于上述指令的响应方法,包括:语音采集模块,用于采集目标用户发出的唤醒词语,以及所述目标用户发出的指令;预唤醒模块,用于当接收到所述目标用户发出的唤醒词语时,将预唤醒事件发送至应用模块;唤醒模块,用于当接收到所述目标用户发出的唤醒词语时,将唤醒事件发送至应用模块;应用模块,用于在接收到所述预唤醒事件时,调用音频能量计算模块计算所述目标设备在第一时间范围内接收到的第一音频能量,并将所述第一音频能量发送至云端服务器,其中,所述云端服务器用于通过所述第一音频能量确定所述目标设备是否为所述目标用户的响应设备,所述第一时间范围是第一时刻至所述第一时刻之前的预设时间范围,所述第一时刻是所述预唤醒模块接收到所述唤醒词语的时刻;所述应用模块还用于,在接收到所述唤醒事件,且未接收到所述预唤醒事件时,调用音频能量计算模块计算所述目标设备在第二时间范围内接收到的第二音频能量,并将所述第二音频能量发送至云端服务器,其中,所述云端服务器用于通过所述第二音频能量确定所述目标设备是否为所述目标用户的响应设备,其中,所述第二时间范围是第二时刻至所述第二时刻之前的预设时间范围,所述第二时刻是所述唤醒模块接收到所述唤醒词语的时刻;音频能量计算模块,用于计算所述目标设备在所述第一时间范围内接收到的第一音频能量,还用于计算所述目标设备在所述第二时间范围内接收到的所述第二音频能量。
根据本发明的又一个实施例,还提供了一种计算机可读的存储介质,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
根据本发明的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
通过本发明,当目标设备的预唤醒模块接收到目标用户发出的唤醒词语时,目标设备获取在第一时间范围内接收到的第一音频能量;目标设备将所述第一音频能量发送至云端服务器,云端服务器可以通过所述第一音频能量确定目标设备是否为所述目标用户的响应设备;目标设备接收云端服务器发送的唤醒结果,并将唤醒结果进行缓存,根据唤醒结果确定目标设备是否为目标用户的响应设备。本申请通过云端服务器根据设备接收到的音频能量确定对目标用户的指令进行响应的设备,这样可以避免多个设备同时对目标用户的指令进行响应,进而解决了多个设备对用户指令进行响应,导致用户体验差的问题。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是根据本申请实施例的一种指令的响应方法的硬件环境示意图;
图2是根据本申请实施例的一种指令的响应方法的流程示意图;
图3是根据本申请实施例的一种流程示意图;
图4是根据本申请实施例的一种指令的响应设备的结构图;
图5是根据本申请实施例的一种指令的响应设备的网络连接示意图;
图6是根据本发明实施例的指令的响应装置的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本申请实施例的一个方面,提供了一种指令的响应方法。该指令的响应方法广泛应用于智慧家庭(Smart Home)、智能家居、智能家用设备生态、智慧住宅(IntelligenceHouse)生态等全屋智能数字化控制应用场景。可选地,在本实施例中,上述指令的响应方法可以应用于如图1所示的由终端设备102和服务器104所构成的硬件环境中。如图1所示,服务器104通过网络与终端设备102进行连接,可用于为终端或终端上安装的客户端提供服务(如应用服务等),可在服务器上或独立于服务器设置数据库,用于为服务器104提供数据存储服务,可在服务器上或独立于服务器配置云计算和/或边缘计算服务,用于为服务器104提供数据运算服务。
上述网络可以包括但不限于以下至少之一:有线网络,无线网络。上述有线网络可以包括但不限于以下至少之一:广域网,城域网,局域网,上述无线网络可以包括但不限于以下至少之一:WIFI(Wireless Fidelity,无线保真),蓝牙。终端设备102可以并不限定于为PC、手机、平板电脑、智能空调、智能烟机、智能冰箱、智能烤箱、智能炉灶、智能洗衣机、智能热水器、智能洗涤设备、智能洗碗机、智能投影设备、智能电视、智能晾衣架、智能窗帘、智能影音、智能插座、智能音响、智能音箱、智能新风设备、智能厨卫设备、智能卫浴设备、智能扫地机器人、智能擦窗机器人、智能拖地机器人、智能空气净化设备、智能蒸箱、智能微波炉、智能厨宝、智能净化器、智能饮水机、智能门锁等。
基于上述的移动终端或网络架构,在本实施例中提供了一种指令的响应方法,图2是根据本发明实施例的基指令的响应方法的流程示意图,如图2所示,该流程包括如下步骤:
步骤S202,当目标设备的预唤醒模块接收到目标用户发出的唤醒词语时,所述目标设备获取在第一时间范围内接收到的第一音频能量;
其中,上述目标设备可以是智能家居***中的智能家居设备,例如智能洗衣机、智能空调、智能音箱等。上述预唤醒模块是目标设备中的模块。上述第一时间范围可以根据实际情况而定,例如3秒、4秒等,上述第一时间范围的时长可以与唤醒词语相关,假设在正常语速下用户发出唤醒词语的时长是5秒,则第一时间范围可以设置为5秒。上述唤醒词语用户唤醒智能家居设备,唤醒词语可以根据实际情况设置。
步骤S204,所述目标设备将所述第一音频能量发送至云端服务器,其中,所述云端服务器用于通过所述第一音频能量确定所述目标设备是否为所述目标用户的响应设备;
步骤S206,所述目标设备接收所述云端服务器发送的唤醒结果,并将所述唤醒结果进行缓存,其中,所述唤醒结果用于指示所述目标设备是否为所述目标用户的响应设备。
在一个示例性实施例中,所述目标设备获取在第一时间范围内接收到的第一音频能量,包括:在所述预唤醒模块接收到所述唤醒词语的时刻为第一时刻的情况下,将所述第一时刻至所述第一时刻之前的预设时间范围确定为所述第一时间范围;所述目标设备获取在所述第一时间范围内接收到的音频;所述目标设备通过音频能量计算模块,确定在所述第一时间范围内接收到的所述第一音频能量。
作为一个可选的实施方式,目标设备在睡眠状态时,其语音采集模块是工作状态(采集音频)。假设上述唤醒词语为“ABCD”,假设预唤醒模块接收到“ABCD”中“D”的时刻为上述第一时刻,则将第一时刻之前的预设时间范围确定为第一时间范围,上述预设时间范围可以根据实际情况而定,例如3秒、4秒等。假设预设时间范围为3秒,第一时刻为8:53,则将8:50至8:53确定为第一时间范围。目标设备的语音采集模块在目标设备睡眠状态也处于工作状态,接收音频信号。获取目标设备在第一时间范围接收到的音频,并通过目标设备中的音频能量计算模块计算第一时间范围内接收到的音频能量,音频能量计算模块可以采用现有技术中计算音频能量的方法计算目标设备在第一时间范围内接收到的音频能量。
在一个示例性实施例中,在所述目标设备接收所述云端服务器发送的唤醒结果之后,所述方法还包括:在目标缓存中存在所述唤醒结果的情况下,所述目标设备在所述目标缓存中读取所述唤醒结果;在所述唤醒结果指示所述目标设备为所述目标用户的响应设备的情况下,所述目标设备对所述目标用户发出的指令进行响应。
作为一个可选的实施方式,云端服务器根据目标设备上传的第一音频能量确定目标设备是否为响应设备,如果是云端服务器向目标设备唤醒结果1,如果不是唤醒结果为0。目标设备在接收到唤醒结果后,将唤醒结果存储在目标缓存。目标设备在目标缓存中读取唤醒结果,读取到唤醒结果为1的情况下,对目标用户发出的指令进行响应,读取到0的情况下不响应。
在一个示例性实施例中,所述方法还包括:在目标缓存中不存在所述唤醒结果,且所述目标设备的唤醒模块接收到所述目标用户发出的唤醒词语的情况下,所述目标设备获取在第二时间范围内接收到的第二音频能量;所述目标设备将所述第二音频能量发送至所述云端服务器,其中,所述云端服务器用于通过所述第二音频能量确定所述目标设备是否为所述目标用户的响应设备;在确定所述目标设备为所述目标用户的响应设备的情况下,所述目标设备对所述目标用户的指令进行响应。
作为一个可选的实施方式,上述唤醒模块也是目标设备中的模块,预唤醒模块与唤醒模块的区别在于,唤醒模块的算法能力更强,算法的复杂性更高,但是唤醒的速度较慢。而预唤醒模块的算法复杂性低,唤醒的速度快。
如果目标缓存中不存在上述唤醒结果,则检测目标设备的唤醒模块是否接收到唤醒词语,若唤醒模块接收到唤醒词语,获取目标设备在第二时间范围内的音频能量。
目标设备将第二时间范围内接收到的第二音频能量发送给云端服务器,云端服务器根据第二音频能量确定目标设备是否为目标用户的响应设备,若目标设备是响应设备,则目标设备对目标用户的指令进行响应。
在一个示例性实施例中,所述目标设备获取在第二时间范围内接收到的第二音频能量,包括:在所述唤醒模块接收到所述唤醒词语的时刻为第二时刻的情况下,将所述第二时刻至所述第二时刻之前的所述预设时间范围确定为所述第二时间范围;所述目标设备获取在所述第二时间范围内接收到的音频;所述目标设备通过音频能量计算模块,确定在第二时间范围内接收到的第二音频能量。
作为一个可选的实施方式,假设上述唤醒词语为“ABCD”,假设唤醒模块接收到“ABCD”中“D”的时刻为上述第额时刻,则将第二时刻之前的预设时间范围确定为第二时间范围,上述预设时间范围可以根据实际情况而定,例如3秒、4秒等。假设预设时间范围为3秒,第二时刻为8:56,则将8:53至8:56确定为第二时间范围。目标设备的语音采集模块在目标设备睡眠状态也处于工作状态,接收音频信号。获取目标设备在第二时间范围接收到的音频,并通过目标设备中的音频能量计算模块计算第二时间范围内接收到的音频能量,音频能量计算模块可以采用现有技术中计算音频能量的方法计算目标设备在第二时间范围内接收到的音频能量。
在一个示例性实施例中,所述云端服务器用于接收多个设备发送的多个音频能量,并根据所述多个音频能量在所述多个设备中确定出所述目标用户的响应设备,其中,所述多个音频能量中的每个音频能量是对应的设备在接收到所述目标用户发出的唤醒词语时,在相应的时间段内获取到的音频能量,所述多个设备包括所述目标设备。
作为一个可选的实施方式,上述多个设备中包括目标设备,多个设备中的每个设备向云端服务器发送其在一定时间范围内接收到的音频能量,云端服务器根据多个设备发送的多个音频能量,确定用户响应目标用户的响应设备。
在一个示例性实施例中,所述根据所述多个音频能量在所述多个设备中确定出所述目标用户的响应,包括:所述云端服务器用于将所述多个音频能量中能量最大的音频能量确定为目标音频能量;所述云端服务器还用于将所述目标音频能量对应的设备确定为所述目标用户的响应设备。
作为一个可选的实施方式,云端服务器将音频能量最大的设备确定为目标用户的响应设备。
如图3所示的流程图中,可以包括以下步骤:
步骤S31,目标设备开机,启动预唤醒模块;
其中,预唤醒模块是轻量级预唤醒模块。对于唤醒模块执行较慢,即给出唤醒事件的时间相对于其他设备较慢的设备,可添加轻量级预唤醒模块,此预唤醒模块的运算速度快,能够及时的上报唤醒事件给目标设备中的应用模块(应用模块可以是应用程序APP)。
步骤S32,预唤醒模块检测到用户发出的唤醒词语,上报给应用模块;
其中,目标设备启动后,正常的唤醒模块和轻量级预唤醒模块会同时运行,预唤醒模块会提前检测到用户发出的唤醒词语,并上报给应用模块处理。
步骤S33,应用模块记录预唤醒事件并调用音频能量计算模块;
其中,在T1时刻,应用模块收到预唤醒模块上报的预唤醒事件,调用音频能量计算模块获取音频能量。
步骤S34,音频能量计算模块计算用户的音频能量;
其中,音频能量计算模块计算由应用模块调用时刻T1至T1时刻之前一定时间长度的音频的能量(第一音频能量),时间长度通常比唤醒词的长度稍大。
步骤S35,应用模块将音频能量发送到云端服务器;
其中,应用模块获取到音频能量Ei后上报给云端服务器。
步骤S36,接收云端服务器返回的唤醒指令;
在T2时刻,目标设备等待接收云端服务器返回的唤醒结果,通常用1表示该目标设备需要响应用户,0标识不响应。
步骤S37,唤醒模块上报用户唤醒事件;
在T3时刻,正常的唤醒模块检测到用户发出的唤醒词语。应用模块收到唤醒模块上报的唤醒事件。
步骤S38,没预唤醒,唤醒模块上报音频能量到云端;
如果预唤醒模块每接收到唤醒词语,或者预唤醒模块没有向云端服务器发送预唤醒事件。唤醒模块调用音频能量计算模块T3时至T13时刻之前一定时间长度刻获取音频能量。音频能量计算模块计算由应用模块调用时刻T3至T13时刻之前一定时间长度的音频的能量(第二音频能量)。应用模块将第二音频能量发送到云端服务器。此步骤是用来处理预唤醒模块没有检测到用户唤醒时的兜底处理。
步骤S39,判断云端服务器的唤醒结果,并进入新的唤醒检测
云端服务器返回的结果为1,则由目标设备响应用户,并重新进入预唤醒检测和正常唤醒的检测状态。
因T1、T2在T3之前,即在唤醒时已提前获得了云端唤醒结果,结果为1时可立即响应用户,大大缩短了整体的响应时间,同时其他设备也不会因等待时间超时而同时唤醒,提高了用户体验。
在上述实施例中,添加轻量级预唤醒模块,提前处理计算音频能量、网络传输、云端处理等操作,缩短了唤醒响应时间,提高了响应准确性。通过预设轻量级预唤醒模块,从而提高了分布式设备的唤醒响应速度,同时也提高了响应的准确率。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
在本实施例中还提供了一种指令的响应设备,应用于上述指令的响应方法,如图4所示该设备包括:语音采集模块,用于采集目标用户发出的唤醒词语,以及所述目标用户发出的指令;预唤醒模块,用于当接收到所述目标用户发出的唤醒词语时,将预唤醒事件发送至应用模块;唤醒模块,用于当接收到所述目标用户发出的唤醒词语时,将唤醒事件发送至应用模块;应用模块,用于在接收到所述预唤醒事件时,调用音频能量计算模块计算所述目标设备在第一时间范围内接收到的第一音频能量,并将所述第一音频能量发送至云端服务器,其中,所述云端服务器用于通过所述第一音频能量确定所述目标设备是否为所述目标用户的响应设备,所述第一时间范围是第一时刻至所述第一时刻之前的预设时间范围,所述第一时刻是所述预唤醒模块接收到所述唤醒词语的时刻;所述应用模块还用于,在接收到所述唤醒事件,且未接收到所述预唤醒事件时,调用音频能量计算模块计算所述目标设备在第二时间范围内接收到的第二音频能量,并将所述第二音频能量发送至云端服务器,其中,所述云端服务器用于通过所述第二音频能量确定所述目标设备是否为所述目标用户的响应设备,其中,所述第二时间范围是第二时刻至所述第二时刻之前的预设时间范围,所述第二时刻是所述唤醒模块接收到所述唤醒词语的时刻;音频能量计算模块,用于计算所述目标设备在所述第一时间范围内接收到的第一音频能量,还用于计算所述目标设备在所述第二时间范围内接收到的所述第二音频能量。
作为一个可选的实施方式,如图5所示上述指令的响应设备与云端服务器通过网络进行连接,指令的响应设备可以将音频能量发送给云端服务器,云端服务器根据接收到的多个设备发送的音频能量,在多个设备中确定用于响应用户指令的设备,并将结果返回给各个设备。
在本实施例中还提供了一种指令的响应装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“单元”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图6是根据本发明实施例的指令的响应装置的结构框图,如图6所示,该装置包括:获取单元62,用于当目标设备的预唤醒模块接收到目标用户发出的唤醒词语时,获取在第一时间范围内接收到的第一音频能量;发送单元64,用于将所述第一音频能量发送至云端服务器,其中,所述云端服务器用于通过所述第一音频能量确定所述目标设备是否为所述目标用户的响应设备;接收单元66,用于接收所述云端服务器发送的唤醒结果,并将所述唤醒结果进行缓存,其中,所述唤醒结果用于指示所述目标设备是否为所述目标用户的响应设备。
在一个示例性实施例中,上述装置还用于在所述预唤醒模块接收到所述唤醒词语的时刻为第一时刻的情况下,将所述第一时刻至所述第一时刻之前的预设时间范围确定为所述第一时间范围;获取在所述第一时间范围内接收到的音频;通过音频能量计算模块,确定在所述第一时间范围内接收到的所述第一音频能量。
在一个示例性实施例中,上述装置还用于在所述目标设备接收所述云端服务器发送的唤醒结果之后,在目标缓存中存在所述唤醒结果的情况下,在所述目标缓存中读取所述唤醒结果;在所述唤醒结果指示所述目标设备为所述目标用户的响应设备的情况下,对所述目标用户发出的指令进行响应。
在一个示例性实施例中,上述装置还用于在目标缓存中不存在所述唤醒结果,且所述目标设备的唤醒模块接收到所述目标用户发出的唤醒词语的情况下,所述目标设备获取在第二时间范围内接收到的第二音频能量;所述目标设备将所述第二音频能量发送至所述云端服务器,其中,所述云端服务器用于通过所述第二音频能量确定所述目标设备是否为所述目标用户的响应设备;在确定所述目标设备为所述目标用户的响应设备的情况下,所述目标设备对所述目标用户的指令进行响应。
在一个示例性实施例中,上述装置还用于在所述唤醒模块接收到所述唤醒词语的时刻为第二时刻的情况下,将所述第二时刻至所述第二时刻之前的所述预设时间范围确定为所述第二时间范围;获取在所述第二时间范围内接收到的音频;所述目标设备通过音频能量计算模块,确定在第二时间范围内接收到的第二音频能量。
在一个示例性实施例中,所述云端服务器用于接收多个设备发送的多个音频能量,并根据所述多个音频能量在所述多个设备中确定出所述目标用户的响应设备,其中,所述多个音频能量中的每个音频能量是对应的设备在接收到所述目标用户发出的唤醒词语时,在相应的时间段内获取到的音频能量,所述多个设备包括所述目标设备。
在一个示例性实施例中,所述云端服务器用于将所述多个音频能量中能量最大的音频能量确定为目标音频能量;所述云端服务器还用于将所述目标音频能量对应的设备确定为所述目标用户的响应设备。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
Claims (11)
1.一种指令的响应方法,其特征在于,包括:
当目标设备的预唤醒模块接收到目标用户发出的唤醒词语时,所述目标设备获取在第一时间范围内接收到的第一音频能量;
所述目标设备将所述第一音频能量发送至云端服务器,其中,所述云端服务器用于通过所述第一音频能量确定所述目标设备是否为所述目标用户的响应设备;
所述目标设备接收所述云端服务器发送的唤醒结果,并将所述唤醒结果进行缓存,其中,所述唤醒结果用于指示所述目标设备是否为所述目标用户的响应设备。
2.根据权利要求1所述的方法,其特征在于,所述目标设备获取在第一时间范围内接收到的第一音频能量,包括:
在所述预唤醒模块接收到所述唤醒词语的时刻为第一时刻的情况下,将所述第一时刻至所述第一时刻之前的预设时间范围确定为所述第一时间范围;
所述目标设备获取在所述第一时间范围内接收到的音频;
所述目标设备通过音频能量计算模块,确定在所述第一时间范围内接收到的所述第一音频能量。
3.根据权利要求1所述的方法,其特征在于,在所述目标设备接收所述云端服务器发送的唤醒结果之后,所述方法还包括:
在目标缓存中存在所述唤醒结果的情况下,所述目标设备在所述目标缓存中读取所述唤醒结果;
在所述唤醒结果指示所述目标设备为所述目标用户的响应设备的情况下,所述目标设备对所述目标用户发出的指令进行响应。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在目标缓存中不存在所述唤醒结果,且所述目标设备的唤醒模块接收到所述目标用户发出的唤醒词语的情况下,所述目标设备获取在第二时间范围内接收到的第二音频能量;
所述目标设备将所述第二音频能量发送至所述云端服务器,其中,所述云端服务器用于通过所述第二音频能量确定所述目标设备是否为所述目标用户的响应设备;
在确定所述目标设备为所述目标用户的响应设备的情况下,所述目标设备对所述目标用户的指令进行响应。
5.根据权利要求4所述的方法,其特征在于,所述目标设备获取在第二时间范围内接收到的第二音频能量,包括:
在所述唤醒模块接收到所述唤醒词语的时刻为第二时刻的情况下,将所述第二时刻至所述第二时刻之前的预设时间范围确定为所述第二时间范围;
所述目标设备获取在所述第二时间范围内接收到的音频;
所述目标设备通过音频能量计算模块,确定在第二时间范围内接收到的第二音频能量。
6.根据权利要求1所述的方法,其特征在于,所述云端服务器用于接收多个设备发送的多个音频能量,并根据所述多个音频能量在所述多个设备中确定出所述目标用户的响应设备,其中,所述多个音频能量中的每个音频能量是对应的设备在接收到所述目标用户发出的唤醒词语时,在相应的时间段内获取到的音频能量,所述多个设备包括所述目标设备。
7.根据权利要求6所述的方法,其特征在于,所述根据所述多个音频能量在所述多个设备中确定出所述目标用户的响应,包括:
所述云端服务器用于将所述多个音频能量中能量最大的音频能量确定为目标音频能量;
所述云端服务器还用于将所述目标音频能量对应的设备确定为所述目标用户的响应设备。
8.一种指令的响应装置,其特征在于,包括:
获取单元,用于当目标设备的预唤醒模块接收到目标用户发出的唤醒词语时,获取在第一时间范围内接收到的第一音频能量;
发送单元,用于将所述第一音频能量发送至云端服务器,其中,所述云端服务器用于通过所述第一音频能量确定所述目标设备是否为所述目标用户的响应设备;
接收单元,用于接收所述云端服务器发送的唤醒结果,并将所述唤醒结果进行缓存,其中,所述唤醒结果用于指示所述目标设备是否为所述目标用户的响应设备。
9.一种指令的响应设备,其特征在于,应用于上述权利要求1至7中任一项所述的方法,包括:
语音采集模块,用于采集目标用户发出的唤醒词语,以及所述目标用户发出的指令;
预唤醒模块,用于当接收到所述目标用户发出的唤醒词语时,将预唤醒事件发送至应用模块;
唤醒模块,用于当接收到所述目标用户发出的唤醒词语时,将唤醒事件发送至应用模块;
应用模块,用于在接收到所述预唤醒事件时,调用音频能量计算模块计算所述目标设备在第一时间范围内接收到的第一音频能量,并将所述第一音频能量发送至云端服务器,其中,所述云端服务器用于通过所述第一音频能量确定所述目标设备是否为所述目标用户的响应设备,所述第一时间范围是第一时刻至所述第一时刻之前的预设时间范围,所述第一时刻是所述预唤醒模块接收到所述唤醒词语的时刻;
所述应用模块还用于,在接收到所述唤醒事件,且未接收到所述预唤醒事件时,调用音频能量计算模块计算所述目标设备在第二时间范围内接收到的第二音频能量,并将所述第二音频能量发送至云端服务器,其中,所述云端服务器用于通过所述第二音频能量确定所述目标设备是否为所述目标用户的响应设备,其中,所述第二时间范围是第二时刻至所述第二时刻之前的预设时间范围,所述第二时刻是所述唤醒模块接收到所述唤醒词语的时刻;
音频能量计算模块,用于计算所述目标设备在所述第一时间范围内接收到的第一音频能量,还用于计算所述目标设备在所述第二时间范围内接收到的所述第二音频能量。
10.一种计算机可读的存储介质,其特征在于,所述计算机可读的存储介质包括存储的程序,其中,所述程序运行时执行权利要求1至7中任一项所述的方法。
11.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行权利要求1至7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210764421.6A CN115312049B (zh) | 2022-06-30 | 2022-06-30 | 指令的响应方法、存储介质及电子装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210764421.6A CN115312049B (zh) | 2022-06-30 | 2022-06-30 | 指令的响应方法、存储介质及电子装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115312049A true CN115312049A (zh) | 2022-11-08 |
CN115312049B CN115312049B (zh) | 2024-06-25 |
Family
ID=83855759
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210764421.6A Active CN115312049B (zh) | 2022-06-30 | 2022-06-30 | 指令的响应方法、存储介质及电子装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115312049B (zh) |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101150809A (zh) * | 2007-11-03 | 2008-03-26 | 青岛海信移动通信技术股份有限公司 | 移动终端处理器串口唤醒与流控的方法 |
CN103647820A (zh) * | 2013-12-09 | 2014-03-19 | 华为数字技术(苏州)有限公司 | 用于分布式集群***的仲裁方法及仲裁装置 |
CN105246137A (zh) * | 2015-09-07 | 2016-01-13 | 浙江正泰仪器仪表有限责任公司 | 一种微功率无线网络数据传输方法及*** |
CN105955444A (zh) * | 2016-04-25 | 2016-09-21 | 深圳市万普拉斯科技有限公司 | 对齐唤醒方法及装置 |
CN108335696A (zh) * | 2018-02-09 | 2018-07-27 | 百度在线网络技术(北京)有限公司 | 语音唤醒方法和装置 |
WO2018188587A1 (zh) * | 2017-04-10 | 2018-10-18 | 北京猎户星空科技有限公司 | 一种语音响应方法、装置及智能设备 |
CN108962262A (zh) * | 2018-08-14 | 2018-12-07 | 苏州思必驰信息科技有限公司 | 语音数据处理方法和装置 |
CN109378000A (zh) * | 2018-12-19 | 2019-02-22 | 科大讯飞股份有限公司 | 语音唤醒方法、装置、***、设备、服务器及存储介质 |
CN110223684A (zh) * | 2019-05-16 | 2019-09-10 | 华为技术有限公司 | 一种语音唤醒方法及设备 |
US20190304449A1 (en) * | 2018-04-02 | 2019-10-03 | Baidu Online Network Technology (Beijing) Co., Ltd | Method, apparatus and storage medium for wake-up processing of application |
CN110364143A (zh) * | 2019-08-14 | 2019-10-22 | 腾讯科技(深圳)有限公司 | 语音唤醒方法、装置及其智能电子设备 |
CN111402883A (zh) * | 2020-03-31 | 2020-07-10 | 云知声智能科技股份有限公司 | 一种复杂环境下分布式语音交互***中就近响应***和方法 |
US20200401938A1 (en) * | 2019-05-29 | 2020-12-24 | The Board Of Trustees Of The Leland Stanford Junior University | Machine learning based generation of ontology for structural and functional mapping |
US11043218B1 (en) * | 2019-06-26 | 2021-06-22 | Amazon Technologies, Inc. | Wakeword and acoustic event detection |
CN114373462A (zh) * | 2022-02-17 | 2022-04-19 | 海信视像科技股份有限公司 | 语音交互设备及其控制方法、控制装置 |
-
2022
- 2022-06-30 CN CN202210764421.6A patent/CN115312049B/zh active Active
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101150809A (zh) * | 2007-11-03 | 2008-03-26 | 青岛海信移动通信技术股份有限公司 | 移动终端处理器串口唤醒与流控的方法 |
CN103647820A (zh) * | 2013-12-09 | 2014-03-19 | 华为数字技术(苏州)有限公司 | 用于分布式集群***的仲裁方法及仲裁装置 |
CN105246137A (zh) * | 2015-09-07 | 2016-01-13 | 浙江正泰仪器仪表有限责任公司 | 一种微功率无线网络数据传输方法及*** |
CN105955444A (zh) * | 2016-04-25 | 2016-09-21 | 深圳市万普拉斯科技有限公司 | 对齐唤醒方法及装置 |
WO2018188587A1 (zh) * | 2017-04-10 | 2018-10-18 | 北京猎户星空科技有限公司 | 一种语音响应方法、装置及智能设备 |
CN108335696A (zh) * | 2018-02-09 | 2018-07-27 | 百度在线网络技术(北京)有限公司 | 语音唤醒方法和装置 |
US20190304449A1 (en) * | 2018-04-02 | 2019-10-03 | Baidu Online Network Technology (Beijing) Co., Ltd | Method, apparatus and storage medium for wake-up processing of application |
CN108962262A (zh) * | 2018-08-14 | 2018-12-07 | 苏州思必驰信息科技有限公司 | 语音数据处理方法和装置 |
CN109378000A (zh) * | 2018-12-19 | 2019-02-22 | 科大讯飞股份有限公司 | 语音唤醒方法、装置、***、设备、服务器及存储介质 |
CN110223684A (zh) * | 2019-05-16 | 2019-09-10 | 华为技术有限公司 | 一种语音唤醒方法及设备 |
WO2020228815A1 (zh) * | 2019-05-16 | 2020-11-19 | 华为技术有限公司 | 一种语音唤醒方法及设备 |
US20200401938A1 (en) * | 2019-05-29 | 2020-12-24 | The Board Of Trustees Of The Leland Stanford Junior University | Machine learning based generation of ontology for structural and functional mapping |
US11043218B1 (en) * | 2019-06-26 | 2021-06-22 | Amazon Technologies, Inc. | Wakeword and acoustic event detection |
CN110364143A (zh) * | 2019-08-14 | 2019-10-22 | 腾讯科技(深圳)有限公司 | 语音唤醒方法、装置及其智能电子设备 |
CN111402883A (zh) * | 2020-03-31 | 2020-07-10 | 云知声智能科技股份有限公司 | 一种复杂环境下分布式语音交互***中就近响应***和方法 |
CN114373462A (zh) * | 2022-02-17 | 2022-04-19 | 海信视像科技股份有限公司 | 语音交互设备及其控制方法、控制装置 |
Also Published As
Publication number | Publication date |
---|---|
CN115312049B (zh) | 2024-06-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110363888B (zh) | 门锁管理方法、装置、电子设备及可读取存储介质 | |
CN109450747B (zh) | 一种唤醒智能家居设备的方法、装置及计算机存储介质 | |
CN115312049A (zh) | 指令的响应方法、存储介质及电子装置 | |
CN116225834A (zh) | 告警信息的发送方法、装置、存储介质及电子装置 | |
US11177975B2 (en) | Movable smart device for appliances | |
CN112583664B (zh) | 数据处理方法及相关装置 | |
CN114915514A (zh) | 意图的处理方法和装置、存储介质及电子装置 | |
CN114691731A (zh) | 使用偏好的确定方法和装置、存储介质及电子装置 | |
CN115312050A (zh) | 指令的响应方法、存储介质及电子装置 | |
CN115148204B (zh) | 语音唤醒的处理方法及装置、存储介质及电子装置 | |
CN115167163B (zh) | 场景执行方法及装置、存储介质及电子装置 | |
CN117542355A (zh) | 分布式语音唤醒方法和装置、存储介质及电子装置 | |
CN116483449A (zh) | 设备唤醒方法和装置、存储介质及电子装置 | |
CN115312048A (zh) | 设备唤醒方法及装置、存储介质及电子装置 | |
CN115616930A (zh) | 控制指令的发送方法及装置、存储介质及电子装置 | |
CN116092498A (zh) | 语音指令的响应方法和装置、存储介质及电子装置 | |
CN117542356A (zh) | 智能设备的语音唤醒方法、存储介质及电子装置 | |
CN115955386A (zh) | 断开原因的确定方法和装置、存储介质及电子装置 | |
CN117914788A (zh) | 一种针对智能家居设备的消息限流处理方法及装置 | |
CN117240874A (zh) | 设备联动方法及装置、存储介质及电子装置 | |
CN117221517A (zh) | 摄像装置长稳测试方法、装置、存储介质及电子装置 | |
CN116403575A (zh) | 免唤醒语音交互方法、装置、存储介质及电子装置 | |
CN117015008A (zh) | 设备唤醒方法和装置、存储介质及电子装置 | |
CN116506247A (zh) | 设备状态更新方法、装置、存储介质及电子装置 | |
CN117316147A (zh) | 音频数据处理方法、装置及家电设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |