CN113470659A - 一种基于光强的语音唤醒阈值调整方法及装置 - Google Patents
一种基于光强的语音唤醒阈值调整方法及装置 Download PDFInfo
- Publication number
- CN113470659A CN113470659A CN202110605171.7A CN202110605171A CN113470659A CN 113470659 A CN113470659 A CN 113470659A CN 202110605171 A CN202110605171 A CN 202110605171A CN 113470659 A CN113470659 A CN 113470659A
- Authority
- CN
- China
- Prior art keywords
- light intensity
- ambient light
- threshold
- voice
- wake
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 18
- 238000001514 detection method Methods 0.000 claims description 35
- 230000006870 function Effects 0.000 description 8
- 230000000694 effects Effects 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 238000005286 illumination Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000004907 flux Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004020 luminiscence type Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01J—MEASUREMENT OF INTENSITY, VELOCITY, SPECTRAL CONTENT, POLARISATION, PHASE OR PULSE CHARACTERISTICS OF INFRARED, VISIBLE OR ULTRAVIOLET LIGHT; COLORIMETRY; RADIATION PYROMETRY
- G01J1/00—Photometry, e.g. photographic exposure meter
- G01J1/42—Photometry, e.g. photographic exposure meter using electric radiation detectors
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
- G10L17/24—Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Electric Clocks (AREA)
Abstract
本申请公开了一种基于光强的语音唤醒阈值调整方法,包括如下步骤。步骤S1:检测当前环境光强度。步骤S2:根据当前环境光强度确定并更新语音唤醒阈值;当前环境光强度越大,则对应的更新后的语音唤醒阈值越小;当前环境光强度越小,则对应的更新后的语音唤醒阈值越大。本申请通过环境光强度协助判断用户休息状态,从而提高语音唤醒阈值,这能够降低误唤醒概率。
Description
技术领域
本申请涉及一种语音唤醒设备的语音唤醒阈值的调整方法。
背景技术
具有声音采集单元(例如麦克风)的电子设备中,有些提供了语音唤醒功能,称为语音唤醒设备。所述语音唤醒(keyword spotting)是指一旦电子设备检测到特定关键词(称为唤醒词)的语音出现,就将自身从休眠状态切换至运行状态,从而实现相互对话、或者执行后续语音的指令等。在智能音箱、智能手机、具有麦克风的智能手表、具有麦克风的智能手环、智能耳机等产品中,往往设有语音唤醒功能。语音唤醒功能的好坏直接决定语音唤醒设备的语音体验。语音唤醒既要保证在检测到唤醒词时正确唤醒,又要保证在收到其他声音时不被唤醒。
语音唤醒阈值是指决定语音检测单元是否工作的阈值。当声音采集单元采集到音频信号后,只有当音频信号的能量大于或等于语音唤醒阈值,才会由语音检测单元进行语音激活检测以判断音频信号中是否包含唤醒词。现有技术一般通过时间来调整语音唤醒阈值,例如在夜间提升语音唤醒阈值,这样可以避免语音唤醒设备在夜间被错误唤醒而打扰用户。但是仅根据时间来调整调整语音唤醒阈值较为死板,对于作息规律不同的用户会有较大偏差。
目前,语音唤醒功能有些是在语音唤醒设备本地实现的,另一些则是由语音唤醒设备与网络服务器相互通讯并由两者共同实现的。通过网络服务器端参与语音唤醒的检测能够提高唤醒准确率、降低误唤醒率。无论采用哪一种方案,现有技术在唤醒准确率一定的情况下,如果在某些环境下增加唤醒准确率往往会同时增加误唤醒的概率,如果在某些环境下降低误唤醒的概率往往会同时降低唤醒准确率,因此成为亟待解决的一个技术问题。
发明内容
本申请所要解决的技术问题是提出一种支持语音唤醒的智能电子设备的语音唤醒阈值的调整方法,基于环境光强度来调整语音唤醒阈值。
为解决上述技术问题,本申请提出了一种基于光强的语音唤醒阈值调整方法,包括如下步骤。步骤S1:检测当前环境光强度。步骤S2:根据当前环境光强度确定并更新语音唤醒阈值;当前环境光强度越大,则对应的更新后的语音唤醒阈值越小;当前环境光强度越小,则对应的更新后的语音唤醒阈值越大。
进一步地,所述步骤S1中,环境光强度是指环境光的发光强度。
或者,所述步骤S1中,环境光强度是指环境光的照度。
或者,所述步骤S1中,环境光强度是指环境光的亮度。
进一步地,所述步骤S2中,将环境光强度的检测值分为N段,相近范围内的一段检测值对应于同一个语音唤醒阈值,N段检测值分别对应于N个不同的语音唤醒阈值,并且越大的检测值对应于越小的语音唤醒阈值。
或者,所述步骤S2中,将环境光强度的检测值分为N段,相近范围内的一段检测值对应于同一个语音唤醒阈值,N段检测值对应于M个不同的语音唤醒阈值,N>M,相邻的一段或几段检测值对应于同一个语音唤醒阈值,并且总的趋势是越大的检测值对应于越小的语音唤醒阈值。
或者,所述步骤S2中,根据当前环境光强度n在指定函数的计算结果作为新的语音唤醒阈值m;所述指定函数为m=[M×n÷N],其中M表示语音唤醒阈值的取值数量,语音唤醒阈值的取值是1到M之间的正整数,m的取值范围是1到M的正整数。N表示环境光强度的分段数量,环境光强度的取值是1到N之间的正整数,n的取值范围是1到N的正整数,[]表示向下取整。
本申请还提出了一种基于光强的语音唤醒阈值调整装置,包括光强检测单元、阈值调整单元。所述光强检测单元用来检测当前环境光强度。所述阈值调整单元用来根据当前环境光强度确定并更新语音唤醒阈值;当前环境光强度越大,则对应的更新后的语音唤醒阈值越小。当前环境光强度越小,则对应的更新后的语音唤醒阈值越大。
进一步地,所述光强检测单元为光敏电阻。
本申请取得的技术效果是:第一,通过环境光强度协助判断用户休息状态,从而提高语音唤醒阈值,这能够降低误唤醒概率。虽然同时也会降低唤醒成功率,但在用户休息时基本不会语音唤醒电子设备,因此没有影响。第二,实现成本低,例如可通过光敏电阻采集当前环境光强度。
附图说明
图1是本申请提出的基于光强的语音唤醒阈值调整方法的流程示意图。
图2是本申请提出的基于光强的语音唤醒阈值调整装置的结构示意图。
图中附图标记说明:光强检测单元1、阈值调整单元2。
具体实施方式
请参阅图1,本申请提出的基于光强的语音唤醒阈值调整方法包括如下步骤。
步骤S1:检测当前环境光强度。环境光(Ambient Lighting)是指环境周围存在的光,通常是由错综复杂的光线与凹凸不平的物体表面相互反射形成的,并非来自任何特定的光源。
所述环境光强度例如是指环境光的发光强度(Luminous intensity),简称光强或光度,这是一个用于表示光源给定方向上单位立体角内发光强弱程度的物理量。
或者,所述环境光强度例如是指环境光的照度(Illuminance),这是指每单位面积所接收到的光通量。照度的大小取决于光源的发光强度,及被照体和光源之间的距离。
或者,所述环境光强度例如是指环境光的亮度,又称辉度(luminance),是表示人眼对发光体或被照射物体表面的发光或反射光强度实际感受的物理量。
步骤S2:根据当前环境光强度确定并更新语音唤醒阈值。总的原则是:当前环境光强度越大,则对应的更新后的语音唤醒阈值越小。当前环境光强度越小,则对应的更新后的语音唤醒阈值越大。其背后逻辑为:环境光强度越大,表明用户处于活跃状态的可能性越大,需要较小的语音唤醒阈值以确保较高的唤醒成功率。环境光强度越小,表明用户处于休息状态(例如睡眠)的可能性越大,需要较大的语音唤醒阈值以确保较低的误唤醒率。
例如,将环境光强度的检测值分为N段,相近范围内的一段检测值对应于同一个语音唤醒阈值,N段检测值分别对应于N个不同的语音唤醒阈值,并且越大的检测值对应于越小的语音唤醒阈值。或者,N段检测值对应于M个不同的语音唤醒阈值,N>M,相邻的一段或几段检测值对应于同一个语音唤醒阈值,并且总的趋势是越大的检测值对应于越小的语音唤醒阈值。
又如,根据当前环境光强度n在指定函数的计算结果,作为新的语音唤醒阈值m。所述指定函数例如为m=[M×n÷N],其中M表示语音唤醒阈值的取值数量,语音唤醒阈值的取值是1到M之间的正整数,m的取值范围是1到M的正整数。N表示环境光强度的分段数量,环境光强度的取值是1到N之间的正整数,n的取值范围是1到N的正整数。[]表示向下取整。
请参阅图2,本申请提出的基于光强的语音唤醒阈值调整装置包括光强检测单元1、阈值调整单元2。图2所示装置与图1所示方法相对应。
所述光强检测单元1用来检测当前环境光强度,例如采用光敏电阻。
所述阈值调整单元2用来根据当前环境光强度确定并更新语音唤醒阈值。当前环境光强度越大,则对应的更新后的语音唤醒阈值越小。当前环境光强度越小,则对应的更新后的语音唤醒阈值越大。
本申请提出的基于光强的语音唤醒阈值调整方法及装置仅需极低成本——例如光敏电阻——就能达到减小误唤醒概率的效果。通过检测环境光强度协助判断用户状态,当环境光强度较小时,预测用户为休息状态,则提高语音唤醒阈值以降低误唤醒率。
以上仅为本申请的优选实施例,并不用于限定本申请。对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (9)
1.一种基于光强的语音唤醒阈值调整方法,其特征是,包括如下步骤;
步骤S1:检测当前环境光强度;
步骤S2:根据当前环境光强度确定并更新语音唤醒阈值;当前环境光强度越大,则对应的更新后的语音唤醒阈值越小;当前环境光强度越小,则对应的更新后的语音唤醒阈值越大。
2.根据权利要求1所述的基于光强的语音唤醒阈值调整方法,其特征是,所述步骤S1中,环境光强度是指环境光的发光强度。
3.根据权利要求1所述的基于光强的语音唤醒阈值调整方法,其特征是,所述步骤S1中,环境光强度是指环境光的照度。
4.根据权利要求1所述的基于光强的语音唤醒阈值调整方法,其特征是,所述步骤S1中,环境光强度是指环境光的亮度。
5.根据权利要求1所述的基于光强的语音唤醒阈值调整方法,其特征是,所述步骤S2中,将环境光强度的检测值分为N段,相近范围内的一段检测值对应于同一个语音唤醒阈值,N段检测值分别对应于N个不同的语音唤醒阈值,并且越大的检测值对应于越小的语音唤醒阈值。
6.根据权利要求1所述的基于光强的语音唤醒阈值调整方法,其特征是,所述步骤S2中,将环境光强度的检测值分为N段,相近范围内的一段检测值对应于同一个语音唤醒阈值,N段检测值对应于M个不同的语音唤醒阈值,N>M,相邻的一段或几段检测值对应于同一个语音唤醒阈值,并且总的趋势是越大的检测值对应于越小的语音唤醒阈值。
7.根据权利要求1所述的基于光强的语音唤醒阈值调整方法,其特征是,所述步骤S2中,根据当前环境光强度n在指定函数的计算结果作为新的语音唤醒阈值m;所述指定函数为m=[M×n÷N],其中M表示语音唤醒阈值的取值数量,语音唤醒阈值的取值是1到M之间的正整数,m的取值范围是1到M的正整数;N表示环境光强度的分段数量,环境光强度的取值是1到N之间的正整数,n的取值范围是1到N的正整数,[]表示向下取整。
8.一种基于光强的语音唤醒阈值调整装置,其特征是,包括光强检测单元、阈值调整单元;
所述光强检测单元用来检测当前环境光强度;
所述阈值调整单元用来根据当前环境光强度确定并更新语音唤醒阈值;当前环境光强度越大,则对应的更新后的语音唤醒阈值越小;当前环境光强度越小,则对应的更新后的语音唤醒阈值越大。
9.根据权利要求8所述的基于光强的语音唤醒阈值调整装置,其特征是,所述光强检测单元为光敏电阻。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110605171.7A CN113470659A (zh) | 2021-05-31 | 2021-05-31 | 一种基于光强的语音唤醒阈值调整方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110605171.7A CN113470659A (zh) | 2021-05-31 | 2021-05-31 | 一种基于光强的语音唤醒阈值调整方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113470659A true CN113470659A (zh) | 2021-10-01 |
Family
ID=77871950
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110605171.7A Pending CN113470659A (zh) | 2021-05-31 | 2021-05-31 | 一种基于光强的语音唤醒阈值调整方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113470659A (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105912092A (zh) * | 2016-04-06 | 2016-08-31 | 北京地平线机器人技术研发有限公司 | 人机交互中的语音唤醒方法及语音识别装置 |
CN109346071A (zh) * | 2018-09-26 | 2019-02-15 | 出门问问信息科技有限公司 | 唤醒处理方法、装置及电子设备 |
CN109920418A (zh) * | 2019-02-20 | 2019-06-21 | 北京小米移动软件有限公司 | 调整唤醒灵敏度的方法及装置 |
CN110500721A (zh) * | 2019-08-21 | 2019-11-26 | 宁波奥克斯电气股份有限公司 | 一种空调语音控制方法、装置以及空调器 |
CN110853619A (zh) * | 2018-08-21 | 2020-02-28 | 上海博泰悦臻网络技术服务有限公司 | 人机交互方法、控制装置、被控装置及存储介质 |
CN111240634A (zh) * | 2020-01-08 | 2020-06-05 | 百度在线网络技术(北京)有限公司 | 音箱工作模式调整方法和装置 |
CN111968644A (zh) * | 2020-08-31 | 2020-11-20 | 深圳市欧瑞博科技股份有限公司 | 智能设备唤醒方法、装置及电子设备 |
CN112700782A (zh) * | 2020-12-25 | 2021-04-23 | 维沃移动通信有限公司 | 语音处理方法和电子设备 |
-
2021
- 2021-05-31 CN CN202110605171.7A patent/CN113470659A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105912092A (zh) * | 2016-04-06 | 2016-08-31 | 北京地平线机器人技术研发有限公司 | 人机交互中的语音唤醒方法及语音识别装置 |
CN110853619A (zh) * | 2018-08-21 | 2020-02-28 | 上海博泰悦臻网络技术服务有限公司 | 人机交互方法、控制装置、被控装置及存储介质 |
CN109346071A (zh) * | 2018-09-26 | 2019-02-15 | 出门问问信息科技有限公司 | 唤醒处理方法、装置及电子设备 |
CN109920418A (zh) * | 2019-02-20 | 2019-06-21 | 北京小米移动软件有限公司 | 调整唤醒灵敏度的方法及装置 |
CN110500721A (zh) * | 2019-08-21 | 2019-11-26 | 宁波奥克斯电气股份有限公司 | 一种空调语音控制方法、装置以及空调器 |
CN111240634A (zh) * | 2020-01-08 | 2020-06-05 | 百度在线网络技术(北京)有限公司 | 音箱工作模式调整方法和装置 |
CN111968644A (zh) * | 2020-08-31 | 2020-11-20 | 深圳市欧瑞博科技股份有限公司 | 智能设备唤醒方法、装置及电子设备 |
CN112700782A (zh) * | 2020-12-25 | 2021-04-23 | 维沃移动通信有限公司 | 语音处理方法和电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100533541C (zh) | 以视觉绩效自动调整显示器参数的装置及其方法 | |
US9955341B2 (en) | Method for preventing call-up operation errors and system using the same | |
WO2018045536A1 (zh) | 声音信号处理的方法、终端和耳机 | |
CN105556595A (zh) | 用于调整用于激活话音辅助功能的检测阈值的方法及设备 | |
CN101009887A (zh) | 移动终端及其通信事件提示方法 | |
CN108874357A (zh) | 一种提示方法及移动终端 | |
CN109215683B (zh) | 一种提示方法及终端 | |
CN102801865A (zh) | 用于移动终端的来电提示***及方法 | |
WO2018058978A1 (zh) | 提醒方法和装置、电子设备及计算机存储介质 | |
CN111783174A (zh) | 息屏显示控制方法、装置、终端设备和可读存储介质 | |
CN108322614B (zh) | 事件提醒方法、装置、存储介质及电子设备 | |
CN104506730A (zh) | 一种点亮手机屏幕的方法及其移动终端 | |
CN114172983A (zh) | 一种接近光传感器控制方法及相关设备 | |
US20110260882A1 (en) | Method and apparatus for proximity sensing of a portable terminal | |
CN113542963B (zh) | 声音模式控制方法、装置、电子设备及存储介质 | |
CN109246298B (zh) | 一种提示信息的方法和移动终端 | |
CN110930964A (zh) | 一种显示屏亮度调节方法、装置、存储介质及终端 | |
CN110418003A (zh) | 一种亮度调节方法、亮度调节装置及移动终端 | |
CN113470659A (zh) | 一种基于光强的语音唤醒阈值调整方法及装置 | |
CN109062024A (zh) | 智能手表提醒方式的切换方法、装置、设备及存储介质 | |
CN108769384A (zh) | 来电处理方法、终端及计算机可读存储介质 | |
CN113039518B (zh) | 播放控制方法和装置、计算机可读存储介质、电子设备 | |
CN106990830A (zh) | 一种信息显示方法及装置 | |
CN206149367U (zh) | 一种具有亮度与音量自适应调整功能的手机主板 | |
CN103701974B (zh) | 一种通话提醒的方法、装置和终端设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |