CN110364147A - 一种唤醒训练词采集***及方法 - Google Patents
一种唤醒训练词采集***及方法 Download PDFInfo
- Publication number
- CN110364147A CN110364147A CN201910810723.0A CN201910810723A CN110364147A CN 110364147 A CN110364147 A CN 110364147A CN 201910810723 A CN201910810723 A CN 201910810723A CN 110364147 A CN110364147 A CN 110364147A
- Authority
- CN
- China
- Prior art keywords
- wake
- word
- training word
- data terminal
- mobile data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 230000002618 waking effect Effects 0.000 claims description 11
- 230000007613 environmental effect Effects 0.000 claims description 6
- 238000005070 sampling Methods 0.000 claims description 3
- 230000007717 exclusion Effects 0.000 claims description 2
- 241000208340 Araliaceae Species 0.000 claims 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 claims 1
- 235000003140 Panax quinquefolius Nutrition 0.000 claims 1
- 235000008434 ginseng Nutrition 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 5
- 230000006870 function Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 241001672694 Citrus reticulata Species 0.000 description 1
- 230000037007 arousal Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/34—Adaptation of a single recogniser for parallel processing, e.g. by use of multiple processors or cloud computing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Electrically Operated Instructional Devices (AREA)
- Telephone Function (AREA)
Abstract
本发明属于语音交换设备和技术领域,尤其涉及一种唤醒训练词采集***及方法,具体包括移动数据终端、云端存储设备和语音识别云端平台;移动数据终端对采集到的特定唤醒训练词语音数据进行初步判断;若初步判断有效,移动数据终端将采集到的特定唤醒训练词语音数据提交到语音识别云端平台进行解析获得相应文本;文本返回移动数据终端;移动数据终端将文本与特定唤醒训练词语音数据进行匹配;若判断特定有效,移动数据终端将特定唤醒词语音数据作为样本唤醒词。有益效果:通过开放性采集模式,克服现有唤醒训练词采集过程中存在采集不方便及语音质量不稳定等问题,不断强化唤醒词训练效果,提升***对唤醒词识别精度。
Description
技术领域
本发明属于语音交换设备和技术领域,尤其涉及一种唤醒训练词采集***及方法。
背景技术
随着人工智能和大数据技术发展,语音识别技术凭借成本与算法复杂程度低、算力强等优势,在车载***、机器人、家庭服务、银行、医疗、工业控制等领域得到越来越广泛的应用。
语音唤醒词是触发交互设备唤醒功能的语音口令,语音唤醒是指用户通过说出预设唤醒词实现设备从待机状态恢复到正常工作状态的过程。用户发出准确语音唤醒词是交互过程中关键环节之一。
语音唤醒技术中的唤醒训练词的采集对训练效果尤为重要,直接决定***对唤醒词识别的精确度。但现有技术方案中至少存在以下缺陷:
一是对具有方言及带有方言口音的普通话识别精度不高;
二是由于我国方言众多,部分使用人群较少的方言目前仍无法识别;
三是语料采集若单纯依靠实验室采集进度将十分缓慢且词汇量有限;若开放权限允许给各自营语音平台进行采集,虽可广泛采集数据,但可能涉及用户隐私的侵犯;
四是通过与现有自营语音平台对接获取语料,其中免费资源的准确率有限,付费资源虽然效果较好但成本昂。
发明内容
为解决上述技术问题,本发明提供了一种唤醒训练词采集***及方法,通过优化***结构和方法步骤流程,克服了唤醒训练词采集不方便,及采集到的音频质量不稳定等情况,通过开放性的采集,提高唤醒训练词语音数据采集流程的便捷性,满足用户的个性化需求,且利于获取具有深层价值的音频数据。
具体技术方案为:一种唤醒训练词采集***,包括移动数据终端、云端存储设备和语音识别云端平台;
移动数据终端对采集到的特定唤醒训练词语音数据进行初步判断;
若初步判断有效,移动数据终端将采集到的特定唤醒训练词语音数据提交到语音识别云端平台进行解析获得相应文本;文本返回移动数据终端;
移动数据终端将文本与特定唤醒训练词语音数据进行匹配,根据匹配程度判断特定唤醒训练词语音数据是否有效;
若判断特定唤醒训练词语音数据有效,移动数据终端将特定唤醒训练词语音数据发送云端存储设备保持为样本唤醒词。
优选的,基于唤醒训练词采集***的一种唤醒训练词采集方法,包括以下步骤:
步骤一(S101)、用户启动1个或1个以上移动数据终端并初始化***参数;***参数包括录音权限、地理位置权限;
步骤二(S102)、1个或1个以上移动数据终端从云端存储设备下载唤醒训练词语料;
步骤三(S103)、移动数据终端在采集唤醒训练词语音数据前,先行采集环境噪声音频并提交云端存储设备;
步骤四(S104)、1个或1个以上移动数据终端采集唤醒训练词语音数据;
步骤五(S105)、移动数据终端对已采集唤醒训练词语音数据作初步分析处理,初步判断是否可作为样本唤醒词;若初步判断可作为样本唤醒词,移动数据终端将采集到的特定唤醒训练词语音数据提交到语音识别云端平台进行解析获得相应文本;文本返回移动数据终端;移动数据终端将文本与特定唤醒训练词语音数据进行匹配,根据匹配程度判断可作为样本唤醒词;
步骤六(S106)、若判断可作为样本唤醒词,移动数据终端将唤醒训练词语音数据发送云端存储设备保持为样本唤醒词;
步骤七(S107)、移动数据终端按预设置次数对样本唤醒词进行反复采集,并提交云端存储设备;
步骤八(S108)、移动数据终端结束唤醒训练词语音数据采集。
优选的,本唤醒训练词采集***及方法中,步骤一具体为:录音权限用于启动移动数据终端录音功能采集语音录音数据;地理位置权限用于启动移动数据终端GPS功能模块记录语音录音数据的地理位置信息。
优选的,本唤醒训练词采集***及方法中,步骤二具体为:移动数据终端从云端存储设备下载唤醒训练词语料及语料编码、语料录音次数。
优选的,本唤醒训练词采集***及方法中,步骤三具体为:在每次唤醒训练词语音数据采集之前,移动数据终端提示用户在10秒内勿发声,先采集一段10秒环境噪音;采集完成后,保存文件并将环境噪音录音数据上传云端存储设备;
噪音文件名定义:
语料编码 +“_” + 移动数据终端DeviceID +“_” + NOISE +“_” +时间戳。
优选的,本唤醒训练词采集***及方法中,步骤四具体为:移动数据终端在监听到采集唤醒训练词语音数据指令后,初始化录音参数;录音参数包括音频采样频率、声道设置、编码制式和采样大小;在用户录入语料后,移动数据终端根据VAD计算及时停止音频采集,再根据声音能量截取有效音频,然后保存文件;
唤醒训练词语音数据文件名定义:
语料编码 +“_” + 移动数据终端DeviceID +“_” + 轮号 +“_” +时间戳。
优选的,本唤醒训练词采集***及方法中,步骤五具体为:移动数据终端对唤醒训练词语音数据有效性进行判断,即排除无效语音数据;若初步分析为有效,移动数据终端将采集到的唤醒训练词语音数据提交到语音识别云端平台进行解析;语音识别云端平台对语音数据进行解析获得相应文本,并返回移动数据终端分析结果;移动数据终端根据返回文本与语料作匹配,相似度超过70%,则认为有效,否则无效。
优选的,本唤醒训练词采集***及方法中,步骤六具体为:移动数据终端在判断特定唤醒训练词语音数据有效的情况下,将特定唤醒训练词语音数据提交云端存储设备保存为样本。
优选的,本唤醒训练词采集***及方法中,步骤七具体为:移动数据终端按预设置次数采集唤醒训练词语音数据,即为重复执行步骤四(S104)至步骤六(S106)。
优选的,本唤醒训练词采集***及方法中,步骤八具体为:用户移动数据终端结束特定唤醒训练词语音数据采集,从步骤四(S104)起重新启动其他特定唤醒训练词语音数据的采集。
优选的,本唤醒训练词采集***及方法中,移动数据终端为智能手机、平板电脑、笔记本电脑、智能穿戴设备。
优选的,本唤醒训练词采集***及方法中,用户通过操控APP来控制智能手机。
采用了上述技术方案后,本发明的有益效果是:
相对于已披露的技术方案,本技术方案提供一种唤醒训练词采集***及方法,优化***及方法步骤,通过开放性采集模式,克服现有唤醒训练词采集过程中存在采集不方便及采集语音质量不稳定等问题,且将确定为样本唤醒词的唤醒词多次进行采集,不断强化唤醒词训练效果,提升***对唤醒词识别精度,可满足用户的个性化需求,也有利于获取具有深层价值的音频数据。
附图说明
图1是一种唤醒训练词采集***的结构示意图;
图2是一种唤醒训练词采集方法步骤的流程示意图。
具体实施方式
如图1所示的***,包括移动数据终端、云端存储设备和语音识别云端平台;
移动数据终端对采集到的特定唤醒训练词语音数据进行初步判断;
若初步判断有效,移动数据终端将采集到的特定唤醒训练词语音数据提交到语音识别云端平台进行解析获得相应文本;文本返回移动数据终端;
移动数据终端将文本与特定唤醒训练词语音数据进行匹配,根据匹配程度判断特定唤醒训练词语音数据是否有效;
若判断特定唤醒训练词语音数据有效,移动数据终端将特定唤醒训练词语音数据发送云端存储设备保持为样本唤醒词。
其中,移动数据终端可以是智能手机、平板电脑、笔记本电脑、智能穿戴设备等;本实施例移动数据终端以一部智能手机为例。
请参阅图2,为一种唤醒训练词采集方法,其主要包括以下步骤:
步骤一(S101)、用户启动1个或1个以上智能手机APP并初始化***参数;***参数包括录音权限、地理位置权限;录音权限用于启动智能手机录音功能采集语音录音数据;地理位置权限用于启动智能手机GPS功能模块记录语音录音数据的地理位置信息。
步骤二(S102)、1个或1个以上智能手机从云端存储设备下载唤醒训练词语料及语料编码、语料录音次数。
步骤三(S103)、智能手机在采集唤醒训练词语音数据前,先行采集环境噪声音频并提交云端存储设备;在每次唤醒训练词语音数据采集之前,智能手机提示用户在10秒内勿发声,先采集一段10秒环境噪音;采集完成后,保存文件并将环境噪音录音数据上传云端存储设备;
噪音文件名定义:
语料编码 +“_” + 智能手机DeviceID +“_” + NOISE +“_” +时间戳。
步骤四(S104)、1个或1个以上智能手机采集唤醒训练词语音数据;智能手机在监听到采集唤醒训练词语音数据指令后,初始化录音参数;所述录音参数包括音频采样频率、声道设置、编码制式和采样大小;在用户录入语料后,智能手机根据VAD计算及时停止音频采集,再根据声音能量截取有效音频,然后保存文件;
唤醒训练词语音数据文件名定义:
语料编码 +“_” + 智能手机DeviceID +“_” + 轮号 +“_” +时间戳。
步骤五(S105)、智能手机APP对已采集唤醒训练词语音数据作初步分析处理,智能手机APP对唤醒训练词语音数据有效性进行判断,即排除无效语音数据;若初步分析为有效,智能手机将采集到的唤醒训练词语音数据提交到语音识别云端平台进行解析;语音识别云端平台对语音数据进行解析获得相应文本,并返回智能手机分析结果;智能手机根据返回文本与语料作匹配,相似度超过70%,则认为有效,否则无效。
步骤六(S106)、智能手机APP在判断特定唤醒训练词语音数据有效的情况下,将特定唤醒训练词语音数据提交云端存储设备保存为样本。
步骤七(S107)、智能手机APP按预设置次数对样本唤醒词进行反复采集,并提交云端存储设备;智能手机APP按预设置次数采集唤醒训练词语音数据,即为重复执行步骤四(S104)至步骤六(S106)。
步骤八(S108)、智能手机结束唤醒训练词语音数据采集。用户智能手机结束特定唤醒训练词语音数据采集,从步骤四(S104)起重新启动其他特定唤醒训练词语音数据的采集。
由技术常识可知,本技术方案可以通过其它的不脱离其精神实质或必要特征的实施方案来实现。因此,上述公开的实施方案,就各方面而言,都只是举例说明,并不是仅有的。所有在本发明范围内或在等同于本发明的范围内的改变均被本发明包含。
Claims (10)
1.一种唤醒训练词采集***,包括移动数据终端、云端存储设备和语音识别云端平台;其特征在于:
移动数据终端对采集到的特定唤醒训练词语音数据进行初步判断;
若初步判断有效,移动数据终端将采集到的特定唤醒训练词语音数据提交到语音识别云端平台进行解析获得相应文本;文本返回移动数据终端;
移动数据终端将文本与特定唤醒训练词语音数据进行匹配,根据匹配程度判断特定唤醒训练词语音数据是否有效;
若判断特定唤醒训练词语音数据有效,移动数据终端将特定唤醒训练词语音数据发送云端存储设备保持为样本唤醒词。
2.基于权利要求1所述的唤醒训练词采集***的一种唤醒训练词采集方法,其特征在于包括以下步骤:
步骤一(S101)、用户启动1个或1个以上移动数据终端并初始化***参数;所述***参数包括录音权限、地理位置权限;
步骤二(S102)、1个或1个以上移动数据终端从云端存储设备下载唤醒训练词语料;
步骤三(S103)、移动数据终端在采集唤醒训练词语音数据前,先行采集环境噪声音频并提交云端存储设备;
步骤四(S104)、1个或1个以上移动数据终端采集唤醒训练词语音数据;
步骤五(S105)、移动数据终端对已采集唤醒训练词语音数据作初步分析处理,初步判断是否可作为样本唤醒词;若初步判断可作为样本唤醒词,移动数据终端将采集到的特定唤醒训练词语音数据提交到语音识别云端平台进行解析获得相应文本;文本返回移动数据终端;移动数据终端将文本与特定唤醒训练词语音数据进行匹配,根据匹配程度判断可作为样本唤醒词;
步骤六(S106)、若判断可作为样本唤醒词,移动数据终端将唤醒训练词语音数据发送云端存储设备保持为样本唤醒词;
步骤七(S107)、移动数据终端按预设置次数对样本唤醒词进行反复采集,并提交云端存储设备;
步骤八(S108)、移动数据终端结束唤醒训练词语音数据采集。
3.根据权利要求2所述的一种唤醒训练词采集方法,其特征在于步骤一具体为:所述录音权限用于启动移动数据终端录音功能采集语音录音数据;所述地理位置权限用于启动移动数据终端GPS功能模块记录语音录音数据的地理位置信息。
4.根据权利要求2所述的一种唤醒训练词采集方法,其特征在于步骤二具体为:移动数据终端从云端存储设备下载唤醒训练词语料及语料编码、语料录音次数。
5.根据权利要求2所述的一种唤醒训练词采集方法,其特征在于步骤三具体为:在每次唤醒训练词语音数据采集之前,移动数据终端提示用户在10秒内勿发声,先采集一段10秒环境噪音;采集完成后,保存文件并将环境噪音录音数据上传云端存储设备;
噪音文件名定义:
语料编码 +“_” + 移动数据终端DeviceID +“_” + NOISE +“_” +时间戳。
6.根据权利要求2所述的一种唤醒训练词采集方法,其特征在于步骤四具体为:移动数据终端在监听到采集唤醒训练词语音数据指令后,初始化录音参数;所述录音参数包括音频采样频率、声道设置、编码制式和采样大小;在用户录入语料后,移动数据终端根据VAD计算及时停止音频采集,再根据声音能量截取有效音频,然后保存文件;
唤醒训练词语音数据文件名定义:
语料编码 +“_” + 移动数据终端DeviceID +“_” + 轮号 +“_” +时间戳。
7.根据权利要求2所述的一种唤醒训练词采集方法,其特征在于步骤五具体为:移动数据终端对唤醒训练词语音数据有效性进行判断,即排除无效语音数据;若初步分析为有效,移动数据终端将采集到的唤醒训练词语音数据提交到语音识别云端平台进行解析;语音识别云端平台对语音数据进行解析获得相应文本,并返回移动数据终端分析结果;移动数据终端根据返回文本与语料作匹配,相似度超过70%,则认为有效,否则无效。
8.根据权利要求2所述的一种唤醒训练词采集方法,其特征在于步骤六具体为:移动数据终端在判断特定唤醒训练词语音数据有效的情况下,将特定唤醒训练词语音数据提交云端存储设备保存为样本。
9.根据权利要求2所述的一种唤醒训练词采集方法,其特征在于步骤七具体为:移动数据终端按预设置次数采集唤醒训练词语音数据,即为重复执行步骤四(S104)至步骤六(S106)。
10.根据权利要求2所述的一种唤醒训练词采集方法,其特征在于步骤八具体为:用户移动数据终端结束特定唤醒训练词语音数据采集,从步骤四(S104)起重新启动其他特定唤醒训练词语音数据的采集。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910810723.0A CN110364147B (zh) | 2019-08-29 | 2019-08-29 | 一种唤醒训练词采集***及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910810723.0A CN110364147B (zh) | 2019-08-29 | 2019-08-29 | 一种唤醒训练词采集***及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110364147A true CN110364147A (zh) | 2019-10-22 |
CN110364147B CN110364147B (zh) | 2021-08-20 |
Family
ID=68225569
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910810723.0A Active CN110364147B (zh) | 2019-08-29 | 2019-08-29 | 一种唤醒训练词采集***及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110364147B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111128150A (zh) * | 2019-11-27 | 2020-05-08 | 云知声智能科技股份有限公司 | 一种唤醒智能语音设备的方法及装置 |
WO2021082572A1 (zh) * | 2019-10-28 | 2021-05-06 | 苏宁云计算有限公司 | 一种唤醒模型生成方法、智能终端唤醒方法及装置 |
CN113593549A (zh) * | 2021-06-29 | 2021-11-02 | 青岛海尔科技有限公司 | 确定语音设备的唤醒率的方法及装置 |
Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103646646A (zh) * | 2013-11-27 | 2014-03-19 | 联想(北京)有限公司 | 一种语音控制方法及电子设备 |
US20160267380A1 (en) * | 2015-03-13 | 2016-09-15 | Nuance Communications, Inc. | Method and System for Training a Neural Network |
CN106847283A (zh) * | 2017-02-28 | 2017-06-13 | 广东美的制冷设备有限公司 | 智能家电控制方法和装置 |
CN107134279A (zh) * | 2017-06-30 | 2017-09-05 | 百度在线网络技术(北京)有限公司 | 一种语音唤醒方法、装置、终端和存储介质 |
CN107358954A (zh) * | 2017-08-29 | 2017-11-17 | 成都启英泰伦科技有限公司 | 一种实时更换唤醒词的设备及方法 |
CN107704275A (zh) * | 2017-09-04 | 2018-02-16 | 百度在线网络技术(北京)有限公司 | 智能设备唤醒方法、装置、服务器及智能设备 |
CN108958810A (zh) * | 2018-02-09 | 2018-12-07 | 北京猎户星空科技有限公司 | 一种基于声纹的用户识别方法、装置及设备 |
CN109036393A (zh) * | 2018-06-19 | 2018-12-18 | 广东美的厨房电器制造有限公司 | 家电设备的唤醒词训练方法、装置及家电设备 |
CN109360552A (zh) * | 2018-11-19 | 2019-02-19 | 广东小天才科技有限公司 | 一种自动过滤唤醒词的方法及*** |
CN109584860A (zh) * | 2017-09-27 | 2019-04-05 | 九阳股份有限公司 | 一种语音唤醒词定义方法和*** |
CN109817220A (zh) * | 2017-11-17 | 2019-05-28 | 阿里巴巴集团控股有限公司 | 语音识别方法、装置及*** |
US10332517B1 (en) * | 2017-06-02 | 2019-06-25 | Amazon Technologies, Inc. | Privacy mode based on speaker identifier |
CN109949808A (zh) * | 2019-03-15 | 2019-06-28 | 上海华镇电子科技有限公司 | 兼容普通话和方言的语音识别家电控制***和方法 |
CN110097876A (zh) * | 2018-01-30 | 2019-08-06 | 阿里巴巴集团控股有限公司 | 语音唤醒处理方法和被唤醒设备 |
US10388274B1 (en) * | 2016-03-31 | 2019-08-20 | Amazon Technologies, Inc. | Confidence checking for speech processing and query answering |
-
2019
- 2019-08-29 CN CN201910810723.0A patent/CN110364147B/zh active Active
Patent Citations (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103646646A (zh) * | 2013-11-27 | 2014-03-19 | 联想(北京)有限公司 | 一种语音控制方法及电子设备 |
US20160267380A1 (en) * | 2015-03-13 | 2016-09-15 | Nuance Communications, Inc. | Method and System for Training a Neural Network |
US10388274B1 (en) * | 2016-03-31 | 2019-08-20 | Amazon Technologies, Inc. | Confidence checking for speech processing and query answering |
CN106847283A (zh) * | 2017-02-28 | 2017-06-13 | 广东美的制冷设备有限公司 | 智能家电控制方法和装置 |
US10332517B1 (en) * | 2017-06-02 | 2019-06-25 | Amazon Technologies, Inc. | Privacy mode based on speaker identifier |
CN107134279A (zh) * | 2017-06-30 | 2017-09-05 | 百度在线网络技术(北京)有限公司 | 一种语音唤醒方法、装置、终端和存储介质 |
CN107358954A (zh) * | 2017-08-29 | 2017-11-17 | 成都启英泰伦科技有限公司 | 一种实时更换唤醒词的设备及方法 |
CN107704275A (zh) * | 2017-09-04 | 2018-02-16 | 百度在线网络技术(北京)有限公司 | 智能设备唤醒方法、装置、服务器及智能设备 |
CN109584860A (zh) * | 2017-09-27 | 2019-04-05 | 九阳股份有限公司 | 一种语音唤醒词定义方法和*** |
CN109817220A (zh) * | 2017-11-17 | 2019-05-28 | 阿里巴巴集团控股有限公司 | 语音识别方法、装置及*** |
CN110097876A (zh) * | 2018-01-30 | 2019-08-06 | 阿里巴巴集团控股有限公司 | 语音唤醒处理方法和被唤醒设备 |
CN108958810A (zh) * | 2018-02-09 | 2018-12-07 | 北京猎户星空科技有限公司 | 一种基于声纹的用户识别方法、装置及设备 |
CN109036393A (zh) * | 2018-06-19 | 2018-12-18 | 广东美的厨房电器制造有限公司 | 家电设备的唤醒词训练方法、装置及家电设备 |
CN109360552A (zh) * | 2018-11-19 | 2019-02-19 | 广东小天才科技有限公司 | 一种自动过滤唤醒词的方法及*** |
CN109949808A (zh) * | 2019-03-15 | 2019-06-28 | 上海华镇电子科技有限公司 | 兼容普通话和方言的语音识别家电控制***和方法 |
Non-Patent Citations (2)
Title |
---|
FENGPEI GE ET AL.: "《Deep neural network based wake-up-word speech recognition with two-stage detection》", 《2017 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP)》 * |
邢安昊等: "《利用二重打分方法的激活词语音识别》", 《声学技术》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021082572A1 (zh) * | 2019-10-28 | 2021-05-06 | 苏宁云计算有限公司 | 一种唤醒模型生成方法、智能终端唤醒方法及装置 |
CN111128150A (zh) * | 2019-11-27 | 2020-05-08 | 云知声智能科技股份有限公司 | 一种唤醒智能语音设备的方法及装置 |
CN113593549A (zh) * | 2021-06-29 | 2021-11-02 | 青岛海尔科技有限公司 | 确定语音设备的唤醒率的方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110364147B (zh) | 2021-08-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107767861B (zh) | 语音唤醒方法、***及智能终端 | |
CN107767863A (zh) | 语音唤醒方法、***及智能终端 | |
WO2022057712A1 (zh) | 电子设备及其语义解析方法、介质和人机对话*** | |
CN106502649A (zh) | 一种机器人服务唤醒方法及装置 | |
CN110047481B (zh) | 用于语音识别的方法和装置 | |
CN110364147A (zh) | 一种唤醒训练词采集***及方法 | |
CN104575504A (zh) | 采用声纹和语音识别进行个性化电视语音唤醒的方法 | |
CN103729193A (zh) | 一种人机交互方法及装置 | |
CN103714815A (zh) | 语音控制方法及其设备 | |
CN110534099A (zh) | 语音唤醒处理方法、装置、存储介质及电子设备 | |
CN112735418B (zh) | 一种语音交互的处理方法、装置、终端及存储介质 | |
CN108766441A (zh) | 一种基于离线声纹识别和语音识别的语音控制方法及装置 | |
EP3526789B1 (en) | Voice capabilities for portable audio device | |
CN110111789B (zh) | 语音交互方法、装置、计算设备和计算机可读介质 | |
CN102831195B (zh) | 个性化语音采集与语义确定***及其方法 | |
CN113129867B (zh) | 语音识别模型的训练方法、语音识别方法、装置和设备 | |
CN110570873A (zh) | 声纹唤醒方法、装置、计算机设备以及存储介质 | |
CN107122807A (zh) | 一种家庭监控方法、服务端及计算机可读存储介质 | |
CN108711429A (zh) | 电子设备及设备控制方法 | |
CN113674746B (zh) | 人机交互方法、装置、设备以及存储介质 | |
CN110866090A (zh) | 用于语音交互的方法、装置、电子设备和计算机存储介质 | |
CN110706707B (zh) | 用于语音交互的方法、装置、设备和计算机可读存储介质 | |
WO2023193394A1 (zh) | 语音唤醒模型的训练、唤醒方法、装置、设备及存储介质 | |
CN105869622B (zh) | 中文热词检测方法和装置 | |
CN114242065A (zh) | 语音唤醒方法及装置、语音唤醒模块的训练方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |