CN113470658A - 一种智能耳机及其语音唤醒阈值调整方法 - Google Patents
一种智能耳机及其语音唤醒阈值调整方法 Download PDFInfo
- Publication number
- CN113470658A CN113470658A CN202110605170.2A CN202110605170A CN113470658A CN 113470658 A CN113470658 A CN 113470658A CN 202110605170 A CN202110605170 A CN 202110605170A CN 113470658 A CN113470658 A CN 113470658A
- Authority
- CN
- China
- Prior art keywords
- intelligent earphone
- mobile phone
- voice awakening
- voice
- state
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 23
- 238000001514 detection method Methods 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
- G10L17/24—Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/10—Earpieces; Attachments therefor ; Earphones; Monophonic headphones
- H04R1/1091—Details not provided for in groups H04R1/1008 - H04R1/1083
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Telephone Function (AREA)
Abstract
本申请公开了一种智能耳机的语音唤醒阈值调整方法,包括如下步骤。步骤S1:具有语音唤醒功能的智能耳机判断自身当前是否处于声音播放状态;如果是,则将自身的语音唤醒阈值设为常规值;否则进入步骤S2。步骤S2:该智能耳机获取所连接的手机的使用状态。步骤S3:该智能耳机根据所连接的手机的使用状态确定并更新自身的语音唤醒阈值;如果该智能耳机所连接的手机当前为繁忙状态、或者该智能耳机当前无法获取到所连接的手机的使用状态,则将该智能耳机的语音唤醒阈值设为常规值;如果该智能耳机所连接的手机当前为空闲状态,则将该智能耳机的语音唤醒阈值在常规值的基础上提高。本申请降低了用户休息时语音唤醒设备被误唤醒的概率。
Description
技术领域
本申请涉及一种语音唤醒阈值的调整方法。
背景技术
具有声音采集单元(例如麦克风)的电子设备中,有些提供了语音唤醒功能。所述语音唤醒(keyword spotting)是指一旦电子设备检测到特定关键词(称为唤醒词)的语音出现,就将自身从休眠状态切换至运行状态,从而实现相互对话、或者执行后续语音的指令等。在智能音箱、智能手机、具有麦克风的智能手表、具有麦克风的智能手环中,往往设有语音唤醒功能。语音唤醒功能的好坏直接决定智能设备的语音体验。语音唤醒既要保证在检测到唤醒词时正确唤醒,又要保证在收到其他声音时不被唤醒。
语音唤醒阈值是指决定语音检测单元是否工作的阈值。当声音采集单元采集到音频信号后,只有当音频信号的能量大于或等于语音唤醒阈值,才会由语音检测单元进行语音激活检测以判断音频信号中是否包含特定关键词。现有技术一般通过时间的判定来调整语音唤醒阈值,例如在夜间提升语音唤醒阈值,这样可以避免电子设备在夜间被错误唤醒而打扰用户。但是仅根据时间来调整调整语音唤醒阈值较为死板,对于作息规律不同的用户会有较大偏差。
发明内容
本申请所要解决的技术问题是提出一种支持语音唤醒的智能耳机的语音唤醒阈值的调整方法,基于该智能耳机自身的声音播放状态以及该智能耳机所连接的手机的使用状态来调整语音唤醒阈值。
为解决上述技术问题,本申请提出了一种智能耳机的语音唤醒阈值调整方法,包括如下步骤。步骤S1:具有语音唤醒功能的智能耳机判断自身当前是否处于声音播放状态;如果是,则将自身的语音唤醒阈值设为常规值;否则进入步骤S2。步骤S2:该智能耳机获取所连接的手机的使用状态。步骤S3:该智能耳机根据所连接的手机的使用状态确定并更新自身的语音唤醒阈值;如果该智能耳机所连接的手机当前为繁忙状态、或者该智能耳机当前无法获取到所连接的手机的使用状态,则将该智能耳机的语音唤醒阈值设为常规值;如果该智能耳机所连接的手机当前为空闲状态,则将该智能耳机的语音唤醒阈值在常规值的基础上提高。
进一步地,所述步骤S2中,如果该智能耳机所连接的手机的指定单元正在工作、或者所连接的手机的CPU使用率大于或等于第一阈值,则判定所连接的手机当前为繁忙状态。
进一步地,所述步骤S2中,如果所连接的手机的指定单元均未工作、并且所连接的手机的CPU使用率小于第一阈值,则判定所连接的手机当前为空闲状态。
进一步地,所述步骤S2中,所述指定单元是指手机的屏幕、扬声器的任一种。
进一步地,所述步骤S2中,所述第一阈值为10%、20%、30%、40%、50%的任一种。
进一步地,所述步骤S2中,还包括该智能耳机当前无法获取到所连接的手机的使用状态的情形。
进一步地,所述步骤S2中,该智能耳机与所连接的手机之间采用蓝牙方式进行通信。
进一步地,所述步骤S3中,语音唤醒阈值共有两个取值,分别称为常规值和提高值;当该智能耳机所连接的手机当前为繁忙状态、或者该智能耳机当前无法获取到所连接的手机的使用状态,则将语音唤醒阈值更新为常规值;当该智能耳机所连接的手机当前为空闲状态,则将语音唤醒阈值更新为提高值。
本申请还提出了一种智能耳机,具有语音唤醒功能,包括判断单元、获取单元和调整单元。所述判断单元用来判断该智能耳机当前是否处于声音播放状态。所述获取单元用来在所述判断单元判定该智能耳机当前未处于声音播放状态时,获取该智能耳机所连接的手机的使用状态。所述调整单元用来在所述判断单元判定该智能耳机当前处于声音播放状态时,将该智能耳机的语音唤醒阈值设为常规值;所述调整单元还用来根据该智能耳机所连接的手机的使用状态确定并更新自身的语音唤醒阈值;如果该智能耳机所连接的手机当前为繁忙状态、或者该智能耳机当前无法获取到所连接的手机的使用状态,则将该智能耳机的语音唤醒阈值设为常规值;如果该智能耳机所连接的手机当前为空闲状态,则将该智能耳机的语音唤醒阈值在常规值的基础上提高。
本申请取得的技术效果是根据智能耳机自身的声音播放状态、智能耳机所连接的手机的使用状态协助判断用户状态,从而调整语音唤醒设备的语音唤醒阈值。当智能耳机正在播放声音、或者手机为繁忙状态、或者无法获取手机的使用状态时,判定用户很可能为活跃状态,语音唤醒阈值较低,从而可提高唤醒率,但也会提高误唤醒率。当智能手机未在播放声音、且手机为空闲状态时,判定用户很可能为休息状态,语音唤醒阈值较高,从而可降低误唤醒率,提升用户体验,但也会降低唤醒率。
附图说明
图1是本申请提出的智能耳机的语音唤醒阈值调整方法的流程示意图。
图2是本申请提出的智能耳机的结构示意图。
图中附图标记说明:判断单元1、获取单元2和调整单元3。
具体实施方式
请参阅图1,本申请提出的智能耳机的语音唤醒阈值调整方法包括如下步骤。
步骤S1:具有语音唤醒功能的智能耳机判断自身当前是否处于声音播放状态。如果智能耳机当前处于声音播放状态,则将自身的语音唤醒阈值设为常规值。如果智能耳机当前未处于声音播放状态,则进入步骤S2。
步骤S2:该智能耳机获取所连接的手机的使用状态。如果所连接的手机的指定单元正在工作、或者所连接的手机的CPU使用率大于或等于第一阈值,则判定所连接的手机当前为繁忙状态。如果所连接的手机的指定单元均未工作、并且所连接的手机的CPU使用率小于第一阈值,则判定所连接的手机当前为空闲状态。所述第一阈值例如为10%、20%、30%、40%、50%的任一种。还有一种情况是该智能耳机当前无法获取到所连接的手机的使用状态,例如该智能耳机当前未连接到手机。
所述指定单元是指手机的屏幕、扬声器的任一种。所述指定单元正在工作是指手机的屏幕亮起、或扬声器正在播放音频的任一种。所述指定单元均未工作是指手机的屏幕未亮起、并且扬声器未在播放音频。
优选地,该智能耳机与所连接的手机之间采用蓝牙方式进行通信。
步骤S3:该智能耳机根据所连接的手机的使用状态确定并更新自身的语音唤醒阈值。总的原则是:如果该智能耳机所连接的手机当前为繁忙状态、或者该智能耳机当前无法获取到所连接的手机的使用状态,则表明用户当前很可能处于活跃状态,则将该智能耳机的语音唤醒阈值设为常规值。如果该智能耳机所连接的手机当前为空闲状态,则表明用户当前很可能处于休息(例如睡眠)状态,则将该智能耳机的语音唤醒阈值在常规值的基础上提高。提高语音唤醒阈值有助于降低误唤醒率,但同时也会降低唤醒率;当该智能耳机所连接的手机当前为空闲状态时,用户很可能处于休息或睡眠状态,不需要语音唤醒该智能耳机,因此降低唤醒率不会影响语音唤醒体验。
所述步骤S3中,语音唤醒阈值共有两个取值,分别称为常规值和提高值。当该智能耳机所连接的手机当前为繁忙状态、或者该智能耳机当前无法获取到所连接的手机的使用状态,则将语音唤醒阈值更新为常规值;当该智能耳机所连接的手机当前为空闲状态,则将语音唤醒阈值更新为提高值。
请参阅图2,本申请提出的智能耳机包括判断单元1、获取单元2和调整单元3。图2所示装置与图1所示方法相对应。
所述判断单元1用来判断具有语音唤醒功能的智能耳机当前是否处于声音播放状态。
所述获取单元2用来在所述判断单元1判定该智能耳机当前未处于声音播放状态时,获取该智能耳机所连接的手机的使用状态。
所述调整单元3用来在所述判断单元1判定该智能耳机当前处于声音播放状态时,将该智能耳机的语音唤醒阈值设为常规值。所述调整单元3还用来根据该智能耳机所连接的手机的使用状态确定并更新自身的语音唤醒阈值。总的原则是:如果该智能耳机所连接的手机当前为繁忙状态、或者该智能耳机当前无法获取到所连接的手机的使用状态,则将该智能耳机的语音唤醒阈值设为常规值。如果该智能耳机所连接的手机当前为空闲状态,则将该智能耳机的语音唤醒阈值在常规值的基础上提高。
本申请提出的智能耳机及其语音唤醒阈值调整方法通过判断智能耳机的声音播放状态、获取该智能耳机所连接的手机的使用状态,协助判断用户为活跃状态还是休息状态,从而有针对性地设置语音唤醒阈值为常规值或提高值,以降低用户休息时语音唤醒设备被误唤醒的概率。
以上仅为本申请的优选实施例,并不用于限定本申请。对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (9)
1.一种智能耳机的语音唤醒阈值调整方法,其特征是,包括如下步骤;
步骤S1:具有语音唤醒功能的智能耳机判断自身当前是否处于声音播放状态;如果是,则将自身的语音唤醒阈值设为常规值;否则进入步骤S2;
步骤S2:该智能耳机获取所连接的手机的使用状态;
步骤S3:该智能耳机根据所连接的手机的使用状态确定并更新自身的语音唤醒阈值;如果该智能耳机所连接的手机当前为繁忙状态、或者该智能耳机当前无法获取到所连接的手机的使用状态,则将该智能耳机的语音唤醒阈值设为常规值;如果该智能耳机所连接的手机当前为空闲状态,则将该智能耳机的语音唤醒阈值在常规值的基础上提高。
2.根据权利要求1所述的智能耳机的语音唤醒阈值调整方法,其特征是,所述步骤S2中,如果该智能耳机所连接的手机的指定单元正在工作、或者所连接的手机的CPU使用率大于或等于第一阈值,则判定所连接的手机当前为繁忙状态。
3.根据权利要求1所述的智能耳机的语音唤醒阈值调整方法,其特征是,所述步骤S2中,如果所连接的手机的指定单元均未工作、并且所连接的手机的CPU使用率小于第一阈值,则判定所连接的手机当前为空闲状态。
4.根据权利要求2或3所述的智能耳机的语音唤醒阈值调整方法,其特征是,所述步骤S2中,所述指定单元是指手机的屏幕、扬声器的任一种。
5.根据权利要求2或3所述的智能耳机的语音唤醒阈值调整方法,其特征是,所述步骤S2中,所述第一阈值为10%、20%、30%、40%、50%的任一种。
6.根据权利要求1所述的智能耳机的语音唤醒阈值调整方法,其特征是,所述步骤S2中,还包括该智能耳机当前无法获取到所连接的手机的使用状态的情形。
7.根据权利要求1所述的智能耳机的语音唤醒阈值调整方法,其特征是,所述步骤S2中,该智能耳机与所连接的手机之间采用蓝牙方式进行通信。
8.根据权利要求1所述的智能耳机的语音唤醒阈值调整方法,其特征是,所述步骤S3中,语音唤醒阈值共有两个取值,分别称为常规值和提高值;当该智能耳机所连接的手机当前为繁忙状态、或者该智能耳机当前无法获取到所连接的手机的使用状态,则将语音唤醒阈值更新为常规值;当该智能耳机所连接的手机当前为空闲状态,则将语音唤醒阈值更新为提高值。
9.一种智能耳机,具有语音唤醒功能,其特征是,包括判断单元、获取单元和调整单元;
所述判断单元用来判断该智能耳机当前是否处于声音播放状态;
所述获取单元用来在所述判断单元判定该智能耳机当前未处于声音播放状态时,获取该智能耳机所连接的手机的使用状态;
所述调整单元用来在所述判断单元判定该智能耳机当前处于声音播放状态时,将该智能耳机的语音唤醒阈值设为常规值;所述调整单元还用来根据该智能耳机所连接的手机的使用状态确定并更新自身的语音唤醒阈值;如果该智能耳机所连接的手机当前为繁忙状态、或者该智能耳机当前无法获取到所连接的手机的使用状态,则将该智能耳机的语音唤醒阈值设为常规值;如果该智能耳机所连接的手机当前为空闲状态,则将该智能耳机的语音唤醒阈值在常规值的基础上提高。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110605170.2A CN113470658A (zh) | 2021-05-31 | 2021-05-31 | 一种智能耳机及其语音唤醒阈值调整方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110605170.2A CN113470658A (zh) | 2021-05-31 | 2021-05-31 | 一种智能耳机及其语音唤醒阈值调整方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113470658A true CN113470658A (zh) | 2021-10-01 |
Family
ID=77871955
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110605170.2A Pending CN113470658A (zh) | 2021-05-31 | 2021-05-31 | 一种智能耳机及其语音唤醒阈值调整方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113470658A (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3089945U (ja) * | 2002-05-14 | 2002-11-22 | 明毅 劉 | 定時覚醒設定制御装置を具えたイヤホン |
CN105912092A (zh) * | 2016-04-06 | 2016-08-31 | 北京地平线机器人技术研发有限公司 | 人机交互中的语音唤醒方法及语音识别装置 |
CN108962240A (zh) * | 2018-06-14 | 2018-12-07 | 百度在线网络技术(北京)有限公司 | 一种基于耳机的语音控制方法及*** |
CN109729455A (zh) * | 2017-10-27 | 2019-05-07 | 北京金锐德路科技有限公司 | 用于脖戴式语音交互耳机的语音唤醒装置 |
CN109920418A (zh) * | 2019-02-20 | 2019-06-21 | 北京小米移动软件有限公司 | 调整唤醒灵敏度的方法及装置 |
CN110312235A (zh) * | 2019-05-16 | 2019-10-08 | 深圳市豪恩声学股份有限公司 | 实时语音唤醒的音频设备、运行方法、装置及存储介质 |
CN110853619A (zh) * | 2018-08-21 | 2020-02-28 | 上海博泰悦臻网络技术服务有限公司 | 人机交互方法、控制装置、被控装置及存储介质 |
CN111968644A (zh) * | 2020-08-31 | 2020-11-20 | 深圳市欧瑞博科技股份有限公司 | 智能设备唤醒方法、装置及电子设备 |
CN112700782A (zh) * | 2020-12-25 | 2021-04-23 | 维沃移动通信有限公司 | 语音处理方法和电子设备 |
-
2021
- 2021-05-31 CN CN202110605170.2A patent/CN113470658A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3089945U (ja) * | 2002-05-14 | 2002-11-22 | 明毅 劉 | 定時覚醒設定制御装置を具えたイヤホン |
CN105912092A (zh) * | 2016-04-06 | 2016-08-31 | 北京地平线机器人技术研发有限公司 | 人机交互中的语音唤醒方法及语音识别装置 |
CN109729455A (zh) * | 2017-10-27 | 2019-05-07 | 北京金锐德路科技有限公司 | 用于脖戴式语音交互耳机的语音唤醒装置 |
CN108962240A (zh) * | 2018-06-14 | 2018-12-07 | 百度在线网络技术(北京)有限公司 | 一种基于耳机的语音控制方法及*** |
CN110853619A (zh) * | 2018-08-21 | 2020-02-28 | 上海博泰悦臻网络技术服务有限公司 | 人机交互方法、控制装置、被控装置及存储介质 |
CN109920418A (zh) * | 2019-02-20 | 2019-06-21 | 北京小米移动软件有限公司 | 调整唤醒灵敏度的方法及装置 |
CN110312235A (zh) * | 2019-05-16 | 2019-10-08 | 深圳市豪恩声学股份有限公司 | 实时语音唤醒的音频设备、运行方法、装置及存储介质 |
CN111968644A (zh) * | 2020-08-31 | 2020-11-20 | 深圳市欧瑞博科技股份有限公司 | 智能设备唤醒方法、装置及电子设备 |
CN112700782A (zh) * | 2020-12-25 | 2021-04-23 | 维沃移动通信有限公司 | 语音处理方法和电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108989931B (zh) | 听力保护耳机及其听力保护方法、计算机可读存储介质 | |
CN107509153B (zh) | 声音播放器件的检测方法、装置、存储介质及终端 | |
JP5996783B2 (ja) | 声紋特徴モデルを更新するための方法及び端末 | |
US20190227767A1 (en) | Volume Adjustment Method and Terminal | |
CN109509473B (zh) | 语音控制方法及终端设备 | |
CN107580113B (zh) | 提示方法、装置、存储介质及终端 | |
CN104780259B (zh) | 通话语音质量自动调节***与方法 | |
CN107231473B (zh) | 一种音频输出调控方法、设备及计算机可读存储介质 | |
JP2015130554A (ja) | 音声処理装置、音声処理システム、音声処理方法、音声処理プログラム | |
CN103501375A (zh) | 音效控制方法及装置 | |
MXPA06011372A (es) | Sensor de protector de pantalla. | |
CN103325378A (zh) | 一种终端语音降噪方法及终端 | |
CN111010608B (zh) | 视频播放的方法及电子设备 | |
CN109918039A (zh) | 一种音量调节方法及移动终端 | |
CN112822585B (zh) | 一种入耳式耳机的音频播放方法、装置及*** | |
CN111491236A (zh) | 一种主动降噪耳机及其唤醒方法、装置及可读存储介质 | |
CN105163216A (zh) | 一种自动播放音乐的方法及耳机 | |
WO2022068694A1 (zh) | 电子设备及其唤醒方法 | |
CN112995833A (zh) | 耳机的语音收集方法、耳机及可读存储介质 | |
CN113470658A (zh) | 一种智能耳机及其语音唤醒阈值调整方法 | |
CN113039518B (zh) | 播放控制方法和装置、计算机可读存储介质、电子设备 | |
CN110677770B (zh) | 发声控制方法、电子设备及介质 | |
CN107493376A (zh) | 一种铃声音量调节方法和装置 | |
CN113470660A (zh) | 一种基于路由器流量的语音唤醒阈值调整方法及*** | |
CN201349244Y (zh) | 一种自动调节语音的手机 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB03 | Change of inventor or designer information | ||
CB03 | Change of inventor or designer information |
Inventor after: Zu Donghui Inventor after: Liu Dawei Inventor after: Liu Sen Inventor after: Liu Shoubin Inventor before: Zu Donghui Inventor before: Liu Dawei Inventor before: Liu Sen Inventor before: Liu Shoubin Inventor before: Jiang Peichen |