CN115985323B - 语音唤醒方法、装置、电子设备及可读存储介质 - Google Patents
语音唤醒方法、装置、电子设备及可读存储介质 Download PDFInfo
- Publication number
- CN115985323B CN115985323B CN202310273455.XA CN202310273455A CN115985323B CN 115985323 B CN115985323 B CN 115985323B CN 202310273455 A CN202310273455 A CN 202310273455A CN 115985323 B CN115985323 B CN 115985323B
- Authority
- CN
- China
- Prior art keywords
- signal value
- value
- signal
- sample
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 230000001960 triggered effect Effects 0.000 claims abstract description 31
- 230000002618 waking effect Effects 0.000 claims abstract description 19
- 238000004364 calculation method Methods 0.000 claims abstract description 8
- 238000004590 computer program Methods 0.000 claims description 6
- 230000006870 function Effects 0.000 description 13
- 238000004891 communication Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 238000001514 detection method Methods 0.000 description 5
- 238000003062 neural network model Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000007613 environmental effect Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 238000009432 framing Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000010897 surface acoustic wave method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Telephone Function (AREA)
Abstract
本申请公开了一种语音唤醒方法、装置、电子设备及可读存储介质,所述语音唤醒方法包括:在预设时长内采集样本信号;统计所述样本信号中每帧样本帧对应的信号值;基于统计的信号值计算所述样本信号对应的背景信号值;当检测到针对目标设备触发的语音唤醒操作,根据所述背景信号值唤醒所述目标设备。本申请提供的语音唤醒方案无需耗费设备大量的算力进行长时待机唤醒,避免出现设备发热而降低设备寿命的情况。
Description
技术领域
本申请涉及通信领域,具体涉及一种语音唤醒方法、装置、电子设备及可读存储介质。
背景技术
随着移动互联网和人工智能时代的来临,语音交互近些年获得了前所未有的增长,其中,语音唤醒技术作为一种特别的语音识别技术,成为用户和机器进行交互重要组成部分。语音唤醒***的目标,是在无手动操作的情况下,对设备进行唤醒。
目前的语音唤醒方案中,通常采用惯性滤波器或基于神经网络模型的方案进行语音唤醒,然而,在上述两种方案下,需要耗费设备大量的算力进行长时待机唤醒,会导致设备发热,从而降低了设备的寿命。
发明内容
针对上述技术问题,本申请提供一种语音唤醒方法、装置、电子设备及可读存储介质,无需耗费设备大量的算力进行长时待机唤醒,避免出现设备发热而降低设备寿命的情况。
为解决上述技术问题,本申请提供一种语音唤醒方法,包括:
在预设时长内采集样本信号;
统计所述样本信号中每帧样本帧对应的信号值;
基于统计的信号值计算所述样本信号对应的背景信号值;
当检测到针对目标设备触发的语音唤醒操作,根据所述背景信号值唤醒所述目标设备。
可选的,在本申请的一些实施例中,所述基于统计的信号值计算所述样本信号对应的背景信号值,包括:
获取历史时间内的历史信号值;
根据所述历史信号值以及统计的信号值之间的波动,计算所述样本信号对应的背景信号值。
可选的,在本申请的一些实施例中,所述根据所述历史信号值以及统计的信号值之间的波动,计算所述样本信号对应的背景信号值,包括:
在统计的信号值中确定初始信号值;
计算所述初始信号值与所述历史信号值之间的差值;
根据所述差值调整所述历史信号值,得到调整后信号值;
根据除所述初始信号值外其他信号值之间的波动,对调整后信号值进行调整,得到所述样本信号对应的背景信号值。
可选的,在本申请的一些实施例中,所述根据所述差值调整所述历史信号值,得到调整后信号值,包括:
当检测到所述差值大于阈值时,计算所述历史信号值与所述预设数值的和,得到调整后信号值;
当检测到所述差值小于阈值时,计算所述历史信号值与所述预设数值的差,得到调整后信号值。
可选的,在本申请的一些实施例中,所述当检测到针对目标设备触发的语音唤醒操作,根据所述背景信号值唤醒所述目标设备,包括:
当检测到针对目标设备触发的语音唤醒操作,获取所述语音唤醒操作对应的操作信号值;
检测所述操作信号值是否大于所述背景信号值;
当检测到所述操作信号值大于所述背景信号值时,唤醒所述目标设备。
可选的,在本申请的一些实施例中,还包括:
周期性更新所述背景信号值,得到更新后背景信号值;
所述当检测到针对目标设备触发的语音唤醒操作,根据所述背景信号值唤醒所述目标设备,包括:当检测到针对目标设备触发的语音唤醒操作,根据所述更新后背景信号值唤醒所述目标设备。
相应的,本申请还提供一种语音唤醒装置,包括:
采集模块,用于在预设时长内采集样本信号;
统计模块,用于统计所述样本信号中每帧样本帧对应的信号值;
计算模块,用于基于统计的信号值计算所述样本信号对应的背景信号值;
唤醒模块,用于当检测到针对目标设备触发的语音唤醒操作,根据所述背景信号值唤醒所述目标设备。
可选的,在本申请的一些实施例中,所述计算模块包括:
获取单元,用于获取历史时间内的历史信号值;
计算单元,用于根据所述历史信号值以及统计的信号值之间的波动,计算所述样本信号对应的背景信号值。
本申请还提供一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如上述方法的步骤。
本申请还提供一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述方法的步骤。
如上所述,本申请提供一种语音唤醒方法、装置、电子设备及可读存储介质,该语音唤醒方法包括:在预设时长内采集样本信号;统计所述样本信号中每帧样本帧对应的信号值;基于统计的信号值计算所述样本信号对应的背景信号值;当检测到针对目标设备触发的语音唤醒操作,根据所述背景信号值唤醒所述目标设备。在本申请提供的语音唤醒方案中,利用样本信号中每帧样本帧对应的信号值,计算样本信号对应的背景信号值,并利用该计算的背景信号值唤醒目标设备,不用通过惯性滤波器或基于神经网络模型的方案进行语音唤醒,无需耗费设备大量的算力进行长时待机唤醒,避免出现设备发热而降低设备寿命的情况。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。为了更清楚地说明本申请实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的语音唤醒***的结构示意图;
图2是本申请实施例提供的语音唤醒方法的流程示意图;
图3是本申请实施例提供的语音唤醒装置的结构示意图;
图4是本申请实施例提供的语音唤醒装置的另一结构示意图;
图5是本申请实施例提供的智能终端的结构示意图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素,此外,本申请不同实施例中具有同样命名的部件、特征、要素可能具有相同含义,也可能具有不同含义,其具体含义需以其在该具体实施例中的解释或者进一步结合该具体实施例中上下文进行确定。
应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或者“单元”的后缀仅为了有利于本申请的说明,其本身没有特定的意义。因此,“模块”、“部件”或者“单元”可以混合地使用。
以下对本申请涉及的实施例进行具体描述,需要说明的是,在本申请中对实施例的描述顺序不作为对实施例优先顺序的限定。
本申请实施例提供一种语音唤醒方法、装置、存储介质及电子设备。具体地,本申请实施例的语音唤醒方法可以由电子设备执行,其中,该电子设备可以为终端。该电子设备可以为智能手机、平板电脑、笔记本电脑、触控屏幕、游戏机、个人计算机(PC,PersonalComputer)、个人数字助理(Personal Digital Assistant,PDA)等电子设备,电子设备还可以包括客户端,该客户端可以是语音唤醒客户端或其他客户端。电子设备可以通过有线或无线的方式与服务器连接,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式***,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。
例如,当该语音唤醒方法运行于电子设备时,电子设备在预设时长内采集样本信号后,电子设备统计样本信号中每帧样本帧对应的信号值,接着,电子基于统计的信号值计算样本信号对应的背景信号值,电子设备当检测到针对目标设备触发的语音唤醒操作,根据背景信号值唤醒目标设备。
请参阅图1,图1为本申请实施例提供的语音唤醒装置的***示意图。该***可以包括至少一个电子设备1000,至少一个服务器或个人电脑2000。用户持有的电子设备1000可以通过网络连接到不同的服务器或个人电脑。电子设备1000可以是具有计算硬件的电子设备,该计算硬件能够支持和执行与多媒体对应的软件产品。另外,电子设备1000还可以具有用于感测和获得用户通过在一个或者多个触控显示屏的多个点执行的触摸或者滑动操作的输入的一个或者多个多触敏屏幕。另外,电子设备1000可以通过网络与服务器或个人电脑2000相互连接。网络可以是无线网络或者有线网络,比如无线网络为无线局域网(WLAN)、局域网(LAN)、蜂窝网络、2G网络、3G网络、4G网络、5G网络等。另外,不同的电子设备1000之间也可以使用自身的蓝牙网络或者热点网络连接到其他嵌入式平台或者连接到服务器以及个人电脑等。服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式***,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。
本申请实施例提供了一种语音唤醒方法,该方法可以由电子设备执行。其中,该电子设备包括触控显示屏和处理器,该触控显示屏用于呈现图形用户界面以及接收用户作用于图形用户界面产生的操作指令。用户通过触控显示屏对图形用户界面进行操作时,该图形用户界面可以通过响应于接收到的操作指令控制电子设备本地的内容,也可以通过响应于接收到的操作指令控制服务器端的内容。例如,用户作用于图形用户界面产生的操作指令包括用于对初始音频数据进行处理的指令,处理器被配置为在接收到用户提供的指令之后启动对应的应用程序。此外,处理器被配置为在触控显示屏上渲染和绘制与应用程序相关联的图形用户界面。触控显示屏是能够感测屏幕上的多个点同时执行的触摸或者滑动操作的多触敏屏幕。用户在使用手指在图形用户界面上执行触控操作,图形用户界面在检测到触控操作时,控制应用的图形用户界面中显示对应的操作。
本申请提供的语音唤醒方案,利用样本信号中每帧样本帧对应的信号值,计算样本信号对应的背景信号值,并利用该计算的背景信号值唤醒目标设备,不用通过惯性滤波器或基于神经网络模型的方案进行语音唤醒,无需耗费设备大量的算力进行长时待机唤醒,避免出现设备发热而降低设备寿命的情况。
以下分别进行详细说明。需说明的是,以下实施例的描述顺序不作为对实施例优先顺序的限定。
一种语音唤醒方法,包括:在预设时长内采集样本信号;统计样本信号中每帧样本帧对应的信号值;基于统计的信号值计算样本信号对应的背景信号值;当检测到针对目标设备触发的语音唤醒操作,根据背景信号值唤醒目标设备。
请参阅图2,图2为本申请实施例提供的语音唤醒方法的流程示意图。该数语音唤醒方法的具体流程可以如下:
101、在预设时长内采集样本信号。
其中,样本信号为预设时长内采集的到音频信号,该样本信号可以包括人声信号、环境声音信号以及其他类型的声音信号,该声音信号可以内置于电子设备的声音传感器(如麦克风)进行采集,预设时长可以为10分钟、20分钟或100分钟,也可以为50秒、120秒或300秒,具体可以根据实际情况进行设置,在此不再赘述。
102、统计样本信号中每帧样本帧对应的信号值。
例如,具体的,可以对样本信号进行分帧处理,得到样本信号对应的多个样本帧,需要说明的是,由于样本信号中可能会存在人声信号(即语音信号),语音信号在宏观上是不平稳的,在微观上是平稳的,具有短时平稳性(10---30ms内可以认为语音信号近似不变),为了便于后续进行语音唤醒,可以将长时间的样本信号划分为一些短段来处理,每一个短段则为本申请的样本帧,在这一帧内,语音信号的特性可是视为是稳定的,而分帧的原则在于它必须足够短来保证帧内信号是平稳的,一帧的长度应该小于一个音素的长度,正常语速下一个音素持续时间大约为50ms。此外,要进行傅里叶分析这一帧必须包含足够多的振动周期,考虑到男声在 100赫兹左右,女声在 200 赫兹左右,换算成周期就是 10ms和5 ms,即,每一帧样本帧长度介于10ms~40ms,具体可以根据实际情况选择每一帧样本帧的长度。
进一步的,对一帧信号可以施加离散傅里叶变换(也叫短时离散傅里叶变换),来获取信号在这一帧内,有关频率-能量的分布信息,将各帧在频域的图像拼接起来,用横轴是频率,纵轴是幅度,即可得到样本信号的频谱图,而在本申请中,将幅度确定为样本帧对应的信号值。
103、基于统计的信号值计算样本信号对应的背景信号值。
例如,具体的,可以获取一个参考值,确定统计的信号值之间的波动,并基于该波动与参考值之间的差异,计算样本信号对应的背景信号值,即,可选地,在一些实施例中,步骤“基于统计的信号值计算样本信号对应的背景信号值”,具体可以包括:
(11)获取历史时间内的历史信号值;
(12)根据历史信号值以及统计的信号值之间的波动,计算样本信号对应的背景信号值。
例如,可以在统计的信号值中,确定初始信号值,如将该样本信号的第一帧样本帧的信号值确定为初始信号值,随后,计算该初始信号值与历史信号值之间的差值,并基于该差值以及统计的信号值之间的波动,计算样本信号对应的背景信号值,即,可选的,在一些实施例中,步骤“根据历史信号值以及统计的信号值之间的波动,计算样本信号对应的背景信号值”,具体可以包括:
(21)在统计的信号值中确定初始信号值;
(22)计算初始信号值与历史信号值之间的差值;
(23)根据差值调整历史信号值,得到调整后信号值;
(24)根据除初始信号值外其他信号值之间的波动,对调整后信号值进行调整,得到样本信号对应的背景信号值。
例如,具体的,将样本信号的第一帧样本帧的信号值确定为初始信号后,获取历史信号值,该历史信号值可以是历史时长内采集的信号值对应的平均值,并且,该历史信号值可以作为环境背景音噪声,进一步的,计算初始信号值与历史信号值之间的差值,并基于该差值调整历史信号值,随后,计算初始信号值的下一帧信号对应的信号值与调整后历史信号值之间的差值,并基于该差值对调整后历史信号值进一步调整,直到样本信号中所有样本帧均处理完毕,最后,计算所有调整后历史信号值的平均值,得到样本信号对应的背景信号值。
需要说明的是,本申请采用加减1器对历史信号值进行调整,即,大于设定值+1,等于设定值不调整,小于设定值-1的方式对历史信号值进行调整,也即,可选的,在一些实施例中,步骤“根据差值调整历史信号值,得到调整后信号值”,具体可以包括:
(31)当检测到差值大于阈值时,计算历史信号值与预设数值的和,得到调整后信号值;
(32)当检测到差值小于阈值时,计算历史信号值与预设数值的差,得到调整后信号值。
104、当检测到针对目标设备触发的语音唤醒操作,根据背景信号值唤醒目标设备。
例如,具体的,当检测到针对目标设备触发的语音唤醒操作,获取语音唤醒操作对应的操作信号值,通过比较操作信号值与背景信号值之间的大小,触发目标设备进行唤醒模式,即,可选的,在一些实施例中,步骤“当检测到针对目标设备触发的语音唤醒操作,根据背景信号值唤醒目标设备”,具体可以包括:
(41)当检测到针对目标设备触发的语音唤醒操作,获取语音唤醒操作对应的操作信号值;
(42)检测操作信号值是否大于背景信号值;
(43)当检测到操作信号值大于背景信号值时,唤醒目标设备。
例如,具体的,在目标设备的芯片上电时,采集声音信号,经过长时间统计计算出平均统计量,作为该应用场景的环境背景音噪声(即历史信号值),随后,目标设备持续采集样本信号,并统计每帧样本帧对应的信号值,接着,目标设备计算信号值与历史信号值的差值,并不断更新背景信号值,当检测到针对目标设备触发的语音唤醒操作,根据背景信号值唤醒目标设备,即,可以理解的是,在一些实施例中,本申请的语音唤醒方法具体还可以包括周期性更新背景信号值,得到更新后背景信号值,步骤“当检测到针对目标设备触发的语音唤醒操作,根据背景信号值唤醒目标设备”,具体可以包括:当检测到针对目标设备触发的语音唤醒操作,根据更新后背景信号值唤醒目标设备。
以上完成本申请的语音唤醒流程。
由上可知,本申请提供一种语音唤醒方法,在预设时长内采集样本信号,然后,统计样本信号中每帧样本帧对应的信号值,接着,基于统计的信号值计算样本信号对应的背景信号值,当检测到针对目标设备触发的语音唤醒操作,根据背景信号值唤醒目标设备,在本申请提供的语音唤醒方案,利用样本信号中每帧样本帧对应的信号值,计算样本信号对应的背景信号值,并利用该计算的背景信号值唤醒目标设备,不用通过惯性滤波器或基于神经网络模型的方案进行语音唤醒,无需耗费设备大量的算力进行长时待机唤醒,避免出现设备发热而降低设备寿命的情况。
为便于更好的实施本申请的语音唤醒方法,本申请还提供一种基于上述语音唤醒装置。其中名词的含义与上述语音唤醒方法中相同,具体实现细节可以参考方法实施例中的说明。
请参阅图3,图3为本申请提供的语音唤醒装置的结构示意图,其中该语音唤醒装置可以包括采集模块201、统计模块202、计算模块203以及唤醒模块204,具体可以如下:
采集模块201,用于在预设时长内采集样本信号。
其中,样本信号为预设时长内采集的到音频信号,该样本信号可以包括人声信号、环境声音信号以及其他类型的声音信号,该声音信号可以内置于电子设备的声音传感器(如麦克风)进行采集,预设时长可以为10分钟、20分钟或100分钟,也可以为50秒、120秒或300秒,具体可以根据实际情况进行设置,在此不再赘述。
统计模块202,用于统计样本信号中每帧样本帧对应的信号值。
计算模块203,用于基于统计的信号值计算样本信号对应的背景信号值。
例如,具体的,可以获取一个参考值,确定统计的信号值之间的波动,并基于该波动与参考值之间的差异,计算样本信号对应的背景信号值,即,可选的,在一些实施例中,计算模块203具体可以包括:
获取单元,用于获取历史时间内的历史信号值;
计算单元,用于根据历史信号值以及统计的信号值之间的波动,计算样本信号对应的背景信号值。
可选的,在一些实施例中,计算单元具体可以包括:
确定子单元,用于在统计的信号值中确定初始信号值;
计算子单元,用于计算初始信号值与历史信号值之间的差值;
调整子单元,用于根据差值调整历史信号值,得到调整后信号值;
调整子单元,用于根据除初始信号值外其他信号值之间的波动,对调整后信号值进行调整,得到样本信号对应的背景信号值。
可选的,在一些实施例中,调整子单元具体可以用于:当检测到差值大于阈值时,计算历史信号值与预设数值的和,得到调整后信号值;当检测到差值小于阈值时,计算历史信号值与预设数值的差,得到调整后信号值。
唤醒模块204,用于当检测到针对目标设备触发的语音唤醒操作,根据背景信号值唤醒目标设备。
例如,具体的,当检测到针对目标设备触发的语音唤醒操作,获取语音唤醒操作对应的操作信号值,通过比较操作信号值与背景信号值之间的大小,触发目标设备进行唤醒模式,可选的,在一些实施例中,唤醒模块204具体可以用于:当检测到针对目标设备触发的语音唤醒操作,获取语音唤醒操作对应的操作信号值;检测操作信号值是否大于背景信号值;当检测到操作信号值大于背景信号值时,唤醒目标设备。
可选的,在一些实施例中,请参阅图4,本申请的语音唤醒装置具体还可以包括更新模块205,该更新模块205具体可以用于:周期性更新背景信号值,得到更新后背景信号值。
可选的,在一些实施例中,唤醒模块204具体还可以用于:当检测到针对目标设备触发的语音唤醒操作,根据更新后背景信号值唤醒目标设备。
以上完成本申请的语音唤醒流程。
由上可知,本申请提供一种语音唤醒装置,采集模块201在预设时长内采集样本信号,然后,统计模块202统计样本信号中每帧样本帧对应的信号值,接着,计算模块203基于统计的信号值计算样本信号对应的背景信号值,唤醒模块204,当检测到针对目标设备触发的语音唤醒操作,根据背景信号值唤醒目标设备,在本申请提供的语音唤醒方案,利用样本信号中每帧样本帧对应的信号值,计算样本信号对应的背景信号值,并利用该计算的背景信号值唤醒目标设备,不用通过惯性滤波器或基于神经网络模型的方案进行语音唤醒,无需耗费设备大量的算力进行长时待机唤醒,避免出现设备发热而降低设备寿命的情况。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
本发明实施例还提供一种电子设备500,如图5所示,该电子设备500可以集成上述语音唤醒装置,还可以进一步包括射频(RF,Radio Frequency)电路501、包括有一个或一个以上计算机可读存储介质的存储器502、输入单元503、显示单元504、传感器505、音频电路506、无线保真(WiFi,Wireless Fidelity)模块507、包括有一个或者一个以上处理核心的处理器508、以及电源509等部件。本领域技术人员可以理解,图5中示出的电子设备500结构并不构成对电子设备500的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
RF电路501可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,交由一个或者一个以上处理器508处理;另外,将涉及上行的数据发送给基站。通常,RF电路501包括但不限于天线、至少一个放大器、调谐器、一个或多个振荡器、用户身份模块(SIM,SubscriberIdentity Module)卡、收发信机、耦合器、低噪声放大器(LNA,Low NoiseAmplifier)、双工器等。此外,RF电路501还可以通过无线通信与网络和其他设备通信。无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯***(GSM,Global Systemof Mobile communication)、通用分组无线服务(GPRS ,GeneralPacketRadio Service)、码分多址(CDMA,Code DivisionMultiple Access)、宽带码分多址(WCDMA,Wideband CodeDivision Multiple Access)、长期演进(LTE,LongTermEvolution)、电子邮件、短消息服务(SMS,ShortMessaging Service)等。
存储器502可用于存储软件程序以及模块,处理器508通过运行存储在存储器502的软件程序以及模块,从而执行各种功能应用以及信息处理。存储器502可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序(比如声音播放功能、目标数据播放功能等)等;存储数据区可存储根据电子设备500的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器502可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器502还可以包括存储器控制器,以提供处理器508和输入单元503对存储器502的访问。
输入单元503可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地,在一个具体的实施例中,输入单元503可包括触敏表面以及其他输入设备。触敏表面,也称为触摸显示屏或者触控板,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触敏表面上或在触敏表面附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触敏表面可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器508,并能接收处理器508发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触敏表面。除了触敏表面,输入单元503还可以包括其他输入设备。具体地,其他输入设备可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元504可用于显示由用户输入的信息或提供给用户的信息以及电子设备500的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元504可包括显示面板,可选的,可以采用液晶显示器(LCD,Liquid CrystalDisplay)、有机发光二极管(OLED,Organic Light-EmittingDiode)等形式来配置显示面板。进一步的,触敏表面可覆盖显示面板,当触敏表面检测到在其上或附近的触摸操作后,传送给处理器508以确定触摸事件的类型,随后处理器508根据触摸事件的类型在显示面板上提供相应的视觉输出。虽然在图5中,触敏表面与显示面板是作为两个独立的部件来实现输入和输入功能,但是在某些实施例中,可以将触敏表面与显示面板集成而实现输入和输出功能。
电子设备500还可包括至少一种传感器505,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板的亮度,接近传感器可在电子设备500移动到耳边时,关闭显示面板和/或背光。作为运动传感器的一种,重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于电子设备500还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路506、扬声器,传声器可提供用户与电子设备500之间的音频接口。音频电路506可将接收到的音频数据转换后的电信号,传输到扬声器,由扬声器转换为样本信号输出;另一方面,传声器将收集的样本信号转换为电信号,由音频电路506接收后转换为音频数据,再将音频数据输出处理器508处理后,经RF电路501以发送给比如另一电子设备500,或者将音频数据输出至存储器502以便进一步处理。音频电路506还可能包括耳塞插孔,以提供外设耳机与电子设备500的通信。
WiFi属于短距离无线传输技术,电子设备500通过WiFi模块507可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图5示出了WiFi模块507,但是可以理解的是,其并不属于电子设备500的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器508是电子设备500的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器502内的软件程序和/或模块,以及调用存储在存储器502内的数据,执行电子设备500的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器508可包括一个或多个处理核心;优选的,处理器508可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作***、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器508中。
电子设备500还包括给各个部件供电的电源509(比如电池),优选的,电源可以通过电源管理***与处理器508逻辑相连,从而通过电源管理***实现管理充电、放电、以及功耗管理等功能。电源509还可以包括一个或一个以上的直流或交流电源、再充电***、电源故障检测电路、电源转换器或者逆变器、电源数据指示器等任意组件。
尽管未示出,电子设备500还可以包括摄像头、蓝牙模块等,在此不再赘述。具体在本实施例中,电子设备500中的处理器508会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器502中,并由处理器508来运行存储在存储器502中的应用程序,从而实现各种功能:
获取虚拟内存的预设存储容量;将初始相位设置为预设值;启动BIST电路,并基于设置后的初始相位,在BIST电路的控制进行相位扫描;当检测到BIST电路扫描至终止相位时,计算最佳相位。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见上文语音唤醒方法的详细描述,此处不再赘述。
由上可知,本发明实施例的电子设备500可以利用BIST电路进行相位扫描,并基于扫描结果计算最佳相位,最后,根据该最佳相位进行语音唤醒,可以保证负荷重且快地进行语音唤醒,并且无需增加额外的电路。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本申请实施例还提供一种存储介质,其上存储有多条指令,所述指令适于处理器进行加载,以执行上述语音唤醒方法中的步骤。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该存储介质可以包括:只读存储器(ROM,Read OnlyMemory)、随机存取记忆体(RAM,Random AccessMemory)、磁盘或光盘等。
由于该存储介质中所存储的指令,可以执行本发明实施例所提供的任一种语音唤醒方法中的步骤,因此,可以实现本发明实施例所提供的任一种语音唤醒方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
以上对本发明实施例所提供的语音唤醒方法、装置、***及存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (7)
1.一种语音唤醒方法,其特征在于,包括:
在预设时长内采集样本信号;
统计所述样本信号中每帧样本帧对应的信号值;
获取历史时间内的历史信号值;
在统计的信号值中确定初始信号值;
计算所述初始信号值与所述历史信号值之间的第一差值;
根据所述第一差值调整所述历史信号值,得到调整后信号值;
依次计算除所述初始信号值外其他信号值与调整后信号值之间的第二差值,并基于所述第二差值对调整后信号值进一步调整,直到所述样本信号中所有样本帧均处理完毕;
计算所有调整后信号值的平均值,得到所述样本信号对应的背景信号值;
当检测到针对目标设备触发的语音唤醒操作,根据所述背景信号值唤醒所述目标设备。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一差值调整所述历史信号值,得到调整后信号值,包括:
当检测到所述第一差值大于阈值时,计算所述历史信号值与预设数值的和,得到调整后信号值;
当检测到所述第一差值小于阈值时,计算所述历史信号值与预设数值的差,得到调整后信号值。
3.根据权利要求1或2所述的方法,其特征在于,所述当检测到针对目标设备触发的语音唤醒操作,根据所述背景信号值唤醒所述目标设备,包括:
当检测到针对目标设备触发的语音唤醒操作,获取所述语音唤醒操作对应的操作信号值;
检测所述操作信号值是否大于所述背景信号值;
当检测到所述操作信号值大于所述背景信号值时,唤醒所述目标设备。
4.根据权利要求1或2所述的方法,其特征在于,还包括:
周期性更新所述背景信号值,得到更新后背景信号值;
所述当检测到针对目标设备触发的语音唤醒操作,根据所述背景信号值唤醒所述目标设备,包括:当检测到针对目标设备触发的语音唤醒操作,根据所述更新后背景信号值唤醒所述目标设备。
5.一种语音唤醒装置,其特征在于,包括:
采集模块,用于在预设时长内采集样本信号;
统计模块,用于统计所述样本信号中每帧样本帧对应的信号值;
计算模块,用于获取历史时间内的历史信号值,在统计的信号值中确定初始信号值;计算所述初始信号值与所述历史信号值之间的第一差值;根据所述第一差值调整所述历史信号值,得到调整后信号值;依次计算除所述初始信号值外其他信号值与调整后信号值之间的第二差值,并基于所述第二差值对调整后信号值进一步调整,直到所述样本信号中所有样本帧均处理完毕;计算所有调整后信号值的平均值,得到所述样本信号对应的背景信号值;
唤醒模块,用于当检测到针对目标设备触发的语音唤醒操作,根据所述背景信号值唤醒所述目标设备。
6.一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至4中任一项所述语音唤醒方法的步骤。
7.一种可读存储介质,其特征在于,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至4中任一项所述语音唤醒方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310273455.XA CN115985323B (zh) | 2023-03-21 | 2023-03-21 | 语音唤醒方法、装置、电子设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310273455.XA CN115985323B (zh) | 2023-03-21 | 2023-03-21 | 语音唤醒方法、装置、电子设备及可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115985323A CN115985323A (zh) | 2023-04-18 |
CN115985323B true CN115985323B (zh) | 2023-06-16 |
Family
ID=85959970
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310273455.XA Active CN115985323B (zh) | 2023-03-21 | 2023-03-21 | 语音唤醒方法、装置、电子设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115985323B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116456441B (zh) * | 2023-06-16 | 2023-10-31 | 荣耀终端有限公司 | 声音处理装置、方法和电子设备 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110211579A (zh) * | 2019-04-28 | 2019-09-06 | 北京蓦然认知科技有限公司 | 一种语音指令识别方法、装置及*** |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9886968B2 (en) * | 2013-03-04 | 2018-02-06 | Synaptics Incorporated | Robust speech boundary detection system and method |
CN103943105A (zh) * | 2014-04-18 | 2014-07-23 | 安徽科大讯飞信息科技股份有限公司 | 一种语音交互方法及*** |
CN108495212A (zh) * | 2018-05-09 | 2018-09-04 | 惠州超声音响有限公司 | 一种与智能音响交互的*** |
CN111261143B (zh) * | 2018-12-03 | 2024-03-22 | 嘉楠明芯(北京)科技有限公司 | 一种语音唤醒方法、装置及计算机可读存储介质 |
CN110600048B (zh) * | 2019-08-23 | 2022-03-25 | Oppo广东移动通信有限公司 | 音频校验方法、装置、存储介质及电子设备 |
CN115731927A (zh) * | 2021-08-30 | 2023-03-03 | 华为技术有限公司 | 语音唤醒的方法、装置、设备、存储介质及程序产品 |
-
2023
- 2023-03-21 CN CN202310273455.XA patent/CN115985323B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110211579A (zh) * | 2019-04-28 | 2019-09-06 | 北京蓦然认知科技有限公司 | 一种语音指令识别方法、装置及*** |
Also Published As
Publication number | Publication date |
---|---|
CN115985323A (zh) | 2023-04-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102354275B1 (ko) | 음성 인식 방법 및 장치, 그리고 저장 매체 | |
CN109509473B (zh) | 语音控制方法及终端设备 | |
WO2017008569A1 (zh) | 消息更新方法、装置及终端 | |
CN111093259A (zh) | 一种蓝牙功率调整方法、装置、存储介质及终端 | |
CN115985323B (zh) | 语音唤醒方法、装置、电子设备及可读存储介质 | |
CN110022405B (zh) | 射频参数调整方法、装置及存储介质 | |
CN111443803A (zh) | 模式切换方法、装置、存储介质及移动终端 | |
CN116486833B (zh) | 音频增益调整方法、装置、存储介质及电子设备 | |
CN113393838A (zh) | 语音处理方法、装置、计算机可读存储介质及计算机设备 | |
CN110277097B (zh) | 数据处理方法及相关设备 | |
CN111966206B (zh) | 一种指纹感应器的省电控制方法、装置及移动终端 | |
CN112542867B (zh) | 移动终端供电控制方法、装置、终端设备及存储介质 | |
CN112312542B (zh) | 星历信息收集方法、装置、存储介质及移动终端 | |
CN111027406B (zh) | 图片识别方法、装置、存储介质及电子设备 | |
CN115995231B (zh) | 语音唤醒方法、装置、电子设备及可读存储介质 | |
CN108681467B (zh) | 一种***唤醒方法、终端 | |
CN108287755B (zh) | 一种应用程序的控制方法及移动终端 | |
CN112433694B (zh) | 光强度调整方法及装置、存储介质和动终端 | |
CN110891304B (zh) | 一种移动终端gps耗电控制方法 | |
CN117387655B (zh) | 计步方法、装置、终端及存储介质 | |
CN109561481B (zh) | 一种数据发送方法、终端和存储介质 | |
CN111405649B (zh) | 一种信息传输方法、装置及移动终端 | |
CN111182129B (zh) | 一种目标位置的确定方法、装置和存储介质 | |
CN117193898A (zh) | 一种应用图标管理方法、装置、电子设备和存储介质 | |
CN117112045A (zh) | 一种应用程序启动方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right |
Denomination of invention: Voice wake-up method, device, electronic device, and readable storage medium Granted publication date: 20230616 Pledgee: Jiang Wei Pledgor: BEIJING INTENGINE TECHNOLOGY Co.,Ltd. Registration number: Y2024980019734 |