CN111161731A - 智能家电离线语音控制装置 - Google Patents
智能家电离线语音控制装置 Download PDFInfo
- Publication number
- CN111161731A CN111161731A CN201911395573.8A CN201911395573A CN111161731A CN 111161731 A CN111161731 A CN 111161731A CN 201911395573 A CN201911395573 A CN 201911395573A CN 111161731 A CN111161731 A CN 111161731A
- Authority
- CN
- China
- Prior art keywords
- voice
- control
- control function
- function item
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013500 data storage Methods 0.000 claims description 57
- 238000012545 processing Methods 0.000 claims description 57
- 239000013598 vector Substances 0.000 claims description 48
- 230000002708 enhancing effect Effects 0.000 abstract 1
- 238000000034 method Methods 0.000 description 16
- 230000008569 process Effects 0.000 description 9
- 238000010276 construction Methods 0.000 description 8
- 230000004048 modification Effects 0.000 description 8
- 238000012986 modification Methods 0.000 description 8
- 230000005236 sound signal Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 238000004378 air conditioning Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Selective Calling Equipment (AREA)
Abstract
本发明实施例公开一种智能家电离线语音控制装置,在本地存储包含至少一个控制功能项目及与每个控制功能项目具有对应关系的至少两个控制命令词的控制指令包,采集识别用户的语音指令信息语音指令信息得到语音识别结果,查找与语音识别结果匹配的控制命令词,按照控制命令词在本地查找与控制命令词对应的控制功能项目,并控制智能家电执行控制功能项目。本发明实施例在离线模式实现应多个控制命令词对应控制功能项目,实现多个控制命令词控制一个控制功能项目,以提高语音控制有效率,增强用户对智能家电的控制体验。
Description
技术领域
本发明涉及智能家电领域,尤其涉及一种智能家电离线语音控制装置。
背景技术
随着计算机技术和大数据处理技术的不断发展与进步,语音技术得到迅速发展,语音识别技术被广泛应用在了智能家电的控制功能上。具有语音控制功能的智能家电,用户通过发出语音指令便可对智能家电进行控制,比如用户可以通过语音指令控制冰箱开门、调节冰箱的温度和模式等。
目前对智能家电进行语音控制,离线控制命令词多是由家电生产厂商预置在设备本地,且语音控制指令与家电控制功能一一对应。只有当用户说出的语音指令与预置的控制命令词相同,设备才能判定语音识别成功,从而执行语音指令对应的设备控制功能。
但是用户在实际使用语音控制智能家电的过程中,往往由于记不住家电预置的控制命令词,或是由于语音控制针对的是不同用户,他们有不同的说话***时的说话习惯。导致用户在使用语音控制智能家电的过程中不能及时说出控制指令或是说出错误的控制指令,从而会导致语音识别过程超时、语音识别错误、语音识别无效。从而降低语音控制有效率,影响用户对智能家电的控制体验。
发明内容
本发明实施例提供一种智能家电离线语音控制装置,能够提高语音控制有效率,增强用户对智能家电的控制体验。
本发明实施例采用如下技术方案:
一种智能家电离线语音控制装置,该装置用于智能家电离线语音控制,该装置包括:数据存储模块、语音采集模块、语音处理模块、数据处理模块、控制模块;
所述数据存储模块设置在本地,用于在本地存储控制指令包,所述控制指令包包含至少一个控制功能项目及与每个控制功能项目具有对应关系的至少两个控制命令词;
所述语音采集模块,用于所述智能家电进入语音采集模式时采集用户的语音指令信息,并将所述语音指令信息传输至所述语音处理模块;
所述语音处理模块,用于识别语音指令信息得到语音识别结果;
所述数据处理模块,用于查找与所述语音识别结果匹配的第一控制命令词;
所述控制模块,用于按照所述第一控制命令词在所述数据存储模块查找与所述第一控制命令词对应的第一控制功能项目,并控制智能家电执行所述第一控制功能项目。
可选的,所述数据存储模块,还用于根据用户编辑的与第二控制功能项目对应的控制命令词,更新所述控制指令包,所述第二控制功能项目为所述至少一个控制功能项目中任一控制功能项目。
可选的,还包括:显示模块;
所述显示模块,用于控制显示页面显示所述控制指令包包含的至少一个控制功能项目及与每个控制功能项目具有对应关系的至少两个控制命令词;
所述显示模块还用于,向用户显示编辑与所述第二控制功能项目的显示页面,并发出编辑与所述第二控制功能项目的提示,获取用户通过所述显示页面编辑的与所述第二控制功能项目对应的控制命令词;或者,在所述显示页面显示所述控制指令包包含的至少一个控制功能项目及与每个控制功能项目具有对应关系的至少两个控制命令词时向用户显示通过语音编辑与所述第二控制功能项目的提示,所述语音采集模块还用于,接收用户通过语音编辑的与所述第二控制功能项目对应的控制命令词。
可选的,所述数据处理模块还用于,通过所述语音采集模块获取用户语音编辑的与所述第二控制功能项目对应的控制命令词。
可选的,所述数据存储模块还用于,所述数据处理模块未查找到与所述语音识别结果匹配的第一控制命令词时,从所述语音识别结果中提取控制命令词,并根据用户指令将提取的控制命令词与所述至少一个控制功能项目中第三控制功能项目对应,更新所述控制指令包。
可选的,所述数据存储模块还用于,获取标定命令词组合规则的命令词语法文件,确定与所述命令词语法文件相关的语音识别模型文件,所述语音识别模型文件包含所述控制指令包中全部控制命令词的标准语音特征向量。
可选的,所述语音处理模块,用于将语音指令信息转换为语音特征向量,将所述语音特征向量与所述语音识别模型文件中的标准语音特征向量匹配,从所述语音识别模型文件中获取最接近所述语音特征向量的标准语音特征向量,确定所述语音识别结果。
可选的,所述语音处理模块得到的所述语音识别结果为文字;
数据处理模块,还用于如所述文字包含在存储单元命令词和所述命令词语法文件中,则根据所述文字从所述存储模块查找匹配的所述第一控制命令词。
可选的,所述数据存储模块用于向所述每个控制功能项目分配ID;建立存储表,所述存储表中实时将所述每个控制功能项目的ID,与所述每个控制功能项目各自具有对应关系的全部控制命令词对应存储。
可选的,所述语音处理模块还用于,确定语音识别阈值;
所述语音处理模块还用于,比较所述语音识别阈值与预设的门限值,所述语音识别阈值大于所述门限值则所述语音识别结果准确,所述语音识别阈值小于所述门限值则所述语音识别结果无效。
基于上述技术方案的智能家电离线语音控制装置,通过在本地存储包含至少一个控制功能项目及与每个控制功能项目具有对应关系的至少两个控制命令词的控制指令包,采集识别用户的语音指令信息语音指令信息得到语音识别结果,查找与语音识别结果匹配的控制命令词,按照控制命令词在本地查找与控制命令词对应的控制功能项目,并控制智能家电执行控制功能项目,从而在离线模式实现应多个控制命令词对应控制功能项目,实现多个控制命令词控制一个控制功能项目,以提高语音控制有效率,增强用户对智能家电的控制体验。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1为本发明实施例提供的一种智能家电离线语音控制装置的结构示意图;
图2为本发明实施例提供的另一种智能家电离线语音控制装置的结构示意图;
图3为本发明实施例提供的又一种智能家电离线语音控制装置的结构示意图;
图4为本发明实施例提供的一种应用智能家电离线语音控制装置进行智能家电离线语音控制的方法流程图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
本发明实施例的智能家电离线语音控制装置,能够解决用户在使用语音指令控制智能家电设备的过程中,由于记不住家电预置的控制命令词,或是由于预置控制命令词不符合他们的说话习惯,致使用户不能及时说出控制指令或是说出错误的控制指令,从而导致语音控制无效的技术问题。
本发明实施例的智能家电离线语音控制装置应用于智能家电设备,该智能家电设备可以为冰箱、电视、空调等设备。
本发明实施例中,第一控制功能项目、第二控制功能项目、第三控制功能项目仅为描述方便而划分,该换分不够成对本发明实施例的限定,不同的场景中可以为相同或者不同的控制功能项目。
实施例1
如图1所示,本实施例一种智能家电离线语音控制装置,该装置应用于智能家电设备离线状态(即未联连接网络状态),该装置包括:数据存储模块11、语音采集模块12、语音处理模块13、数据处理模块14、控制模块15。
所述数据存储模块11设置在本地(例如智能家电设备),用于在本地存储控制指令包,所述控制指令包包含至少一个控制功能项目及与每个控制功能项目具有对应关系的至少两个控制命令词。
本实施例中,控制功能项目为智能家电设备可以实现的功能,不同的智能家电设备可以不同。例如,空调升温降温、电视调节音量等。不同的实施例中,控制功能项目可以为实现控制特定功能的程序,也可以为控制特定功能实现的模块。
本实施例中,每个控制功能项目具有对应关系的控制命令词为至少两个,至少两个控制命令词可以根据不同用户习惯设置,也可以根据不同的表述方式设置,从而可以增加控制命令词与控制功能项目匹配的成功率,增强用户体验。在存储控制功能项目及与其有对应关系的至少两个控制命令词时,可以建立对应关系表,表中记录控制功能项目、与控制功能项目对应的多个(至少两个) 控制命令词、控制功能项目与该多个控制命令词的对应关系。
所述语音采集模块12,用于所述智能家电进入语音采集模式时采集用户的语音指令信息,并将所述语音指令信息传输至语音处理模块13。
其中,所述智能家电的语音采集模式可以根据用户的指令启动,进入语音采集模式后语音采集模块12采集用户语音输入指令信息。
本实施例中,语音采集模块12可以设置在智能家电设备的外面板或者用户操作界面周围,以便于采集用户语音。语音采集模块12可以设置手动按钮开关及工作指示灯,以便于用户手动开启关闭以及了解语音采集模块12工作状态。
本实施例中,语音采集模块12可以为一个或者多个麦克风,多个麦克风时可以分布设置,里如分布设置在用户操作界面周围。
所述语音处理模块13,用于识别语音采集模块12采集的语音指令信息得到语音识别结果。
所述数据处理模块14,用于查找与所述语音识别结果匹配的第一控制命令词。
所述控制模块15,用于按照所述第一控制命令词在所述数据存储模块11 查找与所述第一控制命令词对应的第一控制功能项目,并控制智能家电执行所述第一控制功能项目。
上述智能家电离线语音控制装置,通过在本地存储包含至少一个控制功能项目及与每个控制功能项目具有对应关系的至少两个控制命令词的控制指令包,采集识别用户的语音指令信息语音指令信息得到语音识别结果,查找与语音识别结果匹配的控制命令词,按照控制命令词在本地查找与控制命令词对应的控制功能项目,并控制智能家电执行控制功能项目,从而在离线模式实现应多个控制命令词对应控制功能项目,实现多个控制命令词控制一个控制功能项目,以提高语音控制有效率,增强用户对智能家电的控制体验。
在一个实施例中,所述数据存储模块11,还用于根据用户编辑的与第二控制功能项目对应的控制命令词,更新所述控制指令包,所述第二控制功能项目为所述至少一个控制功能项目中任一控制功能项目,即所述第二控制功能项目可以为所述第一控制功能项目,也可以为其他控制功能项目。
其中,编辑所述第二控制功能项目可以为修改、新增、删除对应的控制命令词,相应的保存编辑后的控制命令词及控制命令词与所述第二控制功能项目的对应关系。
在一个实施例中,如图2所示,该装置还包括:显示模块16,所述显示模块16可以为触摸显示屏(例如lcd触摸显示屏),设置在智能家电设备的外壳上。
所述显示模块16,用于控制显示页面显示所述控制指令包包含的至少一个控制功能项目及与每个控制功能项目具有对应关系的至少两个控制命令词。具体的,所述显示模块16可以根据用户指令显示该至少一个控制功能项目及与每个控制功能项目具有对应关系的至少两个控制命令词。以便于用户了解控制功能项目与控制命令词的对应关系。
例如,所述显示模块16显示数据存储模块11存储的语音命令词和与其匹配的控制功能项目对应关系在屏幕上,用户可以在屏幕上编辑、新增和删除语音命令词,选择与语音命令词相匹配的控制功能程序,测试和保存自定义修改,还可以恢复语音控制功能的出厂设置。
在一个实施例中,所述显示模块16还用于,向用户显示编辑与所述第二控制功能项目的显示页面,并发出编辑与所述第二控制功能项目的提示,获取用户通过所述显示页面编辑的与所述第二控制功能项目(数据存储模块11存储的控制功能项目中任意一个)对应的控制命令词。或者,该实施例中在所述显示页面显示所述控制指令包包含的至少一个控制功能项目及与每个控制功能项目具有对应关系的至少两个控制命令词时向用户显示通过语音编辑与所述第二控制功能项目的提示,所述语音采集模块还用于,接收用户通过语音编辑的与所述第二控制功能项目(数据存储模块11存储的控制功能项目中任意一个)对应的控制命令词。
其中,编辑所述第二控制功能项目可以为修改、新增、删除对应的控制命令词,相应的保存编辑后的控制命令词及控制命令词与所述第二控制功能项目的对应关系。
在一个实施例中,所述数据处理模块14还用于,通过所述语音采集模块12获取用户语音编辑的与所述第二控制功能项目(数据存储模块11存储的控制功能项目中任意一个)对应的控制命令词。其中,编辑所述第二控制功能项目可以为修改、新增、删除对应的控制命令词,相应的保存编辑后的控制命令词及控制命令词与所述第二控制功能项目的对应关系。
在一个实施例中,所述数据存储模块11还用于,所述数据处理模块11未查找到与所述语音识别结果匹配的第一控制命令词时,从所述语音识别结果中提取控制命令词,并根据用户指令将提取的控制命令词与所述至少一个控制功能项目中第三控制功能项目对应,更新所述控制指令包。
具体的,如果用户发出的语音指令为匹配到对应的控制命令词,则向用户发出将该语音指令对应控制功能项目的提示,根据用户操作将该语音指令与控制功能项目对应并存储到数据存储模块11。例如,用户欲调大音量,发出的语音指令为大声,未匹配到对应调大音量控制功能,则可以根据用户操作将语音指令为大声与调大音量对应。
在一个实施例中,所述数据存储模块11还用于,获取标定命令词组合规则的命令词语法文件,确定与所述命令词语法文件相关的语音识别模型文件,所述语音识别模型文件包含所述控制指令包中全部控制命令词的标准语音特征向量。
本实施例可以采用多种命令词语法文件,此处以anbf语法文件为例。
数据存储模块11本地存储文件和软件常量,例如,家电厂商预置的控制命令词、语音识别初始化阶段进行语法构建的命令词语法文件,语法构建后的语音识别模型文件、智能家电设备控制功能相关联的控制程序、控制命令词与控制程序之间的对应关系。anbf语法文件标定语音命令词的组合规则。所述语法构建是通过编译原理分析anbf语法文件,该语音识别模型文件为语法文件中各语音命令词语音特征向量的一个集合。
在一个实施例中,所述语音处理模块13,用于将语音指令信息转换为语音特征向量,将所述语音特征向量与所述语音识别模型文件中的标准语音特征向量匹配,从所述语音识别模型文件中获取最接近所述语音特征向量的标准语音特征向量,确定所述语音识别结果。
具体的,所述语音处理模块13分析和处理语音采集模块12采集的音频信号,将音频信号通过编码运算得到一组语音特征向量,将此语音特征向量与语音识别模型文件中的模型向量相比较匹配,从模型文件中获取出最接近所述语音特征向量的特征向量,通过特征向量计算分析出语音识别结果。
在一个实施例中,所述语音处理模块13得到的所述语音识别结果为文字;
所述数据处理模块14,还用于如所述文字包含在存储单元命令词和所述命令词语法文件中,则根据所述文字从所述存储模块查找匹配的所述第一控制命令词。
在一个实施例中,所述数据存储模块11用于向所述每个控制功能项目分配ID;建立存储表,所述存储表中实时将所述每个控制功能项目的ID与所述每个控制功能项目各自具有对应关系的全部控制命令词对应存储。
具体的,以一项控制功能项目为一段软件控制程序为例,数据存储存储模块11为每个控制程序定义一个标识id,例如增大音量的id为1,此id对应了增大音量的控制程序;减小音量的id为2,此id对应了减小音量的控制程序,用户在新增控制命令词选择控制功能项目的时候,实际为选择控制功能项目的 id与命令词匹配组合。
这样,可以便于存储时将控制功能项目与控制命令词相对应,也便于调用对应的控制功能项目。
在一个实施例中,所述语音处理模块13还用于,确定语音识别阈值;
所述数据处理模块还用于,比较所述语音识别阈值与预设的门限值,所述语音识别阈值大于所述门限值则所述语音识别结果准确,所述语音识别阈值小于所述门限值则所述语音识别结果无效。
具体的,所述语音处理模块13得出语音识别结果的同时得出语音识别阈值,将该阈值与***预置的门限值作比较,阈值大于门限值表示语音识别结果准确,当阈值小于门限值表示识别结果无效。
本实施例的智能家电离线语音控制装置,通过在本地存储包含至少一个控制功能项目及与每个控制功能项目具有对应关系的至少两个控制命令词的控制指令包,采集识别用户的语音指令信息语音指令信息得到语音识别结果,查找与语音识别结果匹配的控制命令词,按照控制命令词在本地查找与控制命令词对应的控制功能项目,并控制智能家电执行控制功能项目,从而在离线模式实现应多个控制命令词对应控制功能项目,实现多个控制命令词控制一个控制功能项目,以提高语音控制有效率,增强用户对智能家电的控制体验。
实施例2
本实施例一种智能家电离线语音控制装置,该装置的架构图可以参照图3所示,本实施例中,数据存储模块11、语音处理模块13、数据处理模块14、控制模块15设置在智能家电设备内部,语音采集模块12、显示模块16设置在智能家电设备外壳上或者嵌入在外壳上。
本实施例的智能家电离线语音控制装置应用于智能家电设备离线模式(即未联连接网络状态),将采集的语音信号在本地进行分析和处理,不需要将语音信号传送到云端服务器进行分析和处理。
数据存储模块11用于本地数据库存储、本地文件存储和软件常量存储,例如家电厂商预置的控制命令词、语音识别初始化阶段进行语法构建的命令词语法文件,语法构建后的语音识别模型文件、智能家电控制功能相关联的控制程序、控制命令词与控制程序项目之间的对应关系。所述语法文件为anbf语法文件,anbf语法文件标定了语音命令词的组合规则。所述语法构建通过编译原理分析anbf语法文件,训练出语法文件相关的语音识别模型文件。所述语音识别模型文件为语法文件中各语音命令词语音特征向量的一个集合。
所述数据存储模块11预置智能家电设备出厂控制命令词和对应的控制功能项目,控制命令词对应的anbf语法文件,本实施例中,用户可以对控制命令词进行编辑更改但不可以对控制功能项目进行编辑更改。所述数据处理模块11 存储软件分析用户与智能家电设备间交互的数据,用户对数据存储模块11和 anbf语法文件的更新修改。
所述数据存储模块11预置***默认的控制命令词、设备控制功能程序,在数据存储模块11中存储命令词和控制功能项目对应关系,数据存储模块11 存储包含所有默认的语音命令词的anbf语法文件。
其中,控制命令词可以由用户编辑,控制功能程序不能被用户更新修改,用户更新修改控制命令词后,同步更新修改anbf语法文件。
所述数据存储模块11用于向所述每个控制功能项目分配ID;建立存储表,所述存储表中实时将所述每个控制功能项目的ID。具体的,以一项控制功能项目为一段软件控制程序为例,数据存储存储模块11为每个控制程序定义一个标识id,例如增大音量的id为1,此id对应了增大音量的控制程序;减小音量的id为2,此id对应了减小音量的控制程序,用户在新增控制命令词选择控制功能项目时,选择控制功能项目的id与语音命令词匹配组合。
所述数据存储模块11重构建anbf语法文件,通过语法编译引擎编译生成语音识别模型文件,模型文件中存在所有语音命令词的标准语音特征向量,将所述语音处理单模块13输出的命令词语音特征向量依次与模型文件中的特征向量比对,得出匹配度最高的特征向量。
所述显示模块16可以为lcd触摸屏,用于用户同设备存储数据间进行交互,控制命令词与控制功能项目(控制程序)的对应关系通过显示模块16展示给用户,用户可以通过显示模块16修改、新增、删除和保存控制命令词,选择与控制命令词相关联的控制功能项目(控制程序),测试和保存自定义修改,恢复语音控制功能的出厂设置。
所述显示模块16接收用户在编辑页面修改、新增、删除控制命令词,修改和新增的命令词可以长度为4-6个汉字。本实施例中为增加识别度,修改和新增的语音命令词避免读音相同或相近,如读音相同或相近可以发出提示。新增语音命令词后,根据用户选择确定与该语音命令词相对应的控制功能项目,一个语音命令词只能对应一个控制功能,一个控制功能可以被多个语音命令词对应。
所述语音采集模块11为双麦克风语音采集设备,用于采集用户的语音指令音频信息,并将采集的音频信息传输致语音处理模块13。具体的,所述语音处理模块13分析和处理语音采集模块12采集的音频信号,将音频信号通过编码运算得到一组语音特征向量,将此语音特征向量与语音识别模型文件中的模型向量相比较匹配,从模型文件中获取出最接近所述语音特征向量的特征向量,通过特征向量计算分析出语音识别结果。
所述语音处理模块13软件分析麦克风采集的音频信号,将音频信号编码成一组语音特征向量,对比分析音频特征向量和模型文件中的特征向量分析计算得出语音识别结果。
本实施例中,语音识别结果可以为文本文字,此文字包含在数据存储模块 11命令词和anbf语法文件中,根据文字从数据存储模块11匹配出控制功能的 id,即可将id传输到控制模块15实现对设备的准确控制。
本实施例中,所述语音处理模块13得出语音识别结果的同时得出语音识别阈值,将该阈值与***预置的门限值作比较,阈值大于门限值表示语音识别结果准确,当阈值小于门限值表示识别结果无效。
所述数据处理模块14,实现对数据存储模块11的更新、新增、删除和保存等操作,对anbf语法文件的更新修改,对更新后anbf语法文件的重新构建生成语音识别模型文件,对语音识别结果的分析及处理。
所述控制模块15,根据数据存储模块11预置的设备控制程序控制智能家电设备执行相应的控制操作项目。
本实施例的使用场景为,调节智能家电设备(如冰箱)喇叭音量大小,生产厂商预置的控制命令词为增大音量、减小音量,预置控制命令词预存在数据存储模块11且被写入在anbf语法文件中,预置控制命令词在数据存储模块11 关联了调节音量的功能程序,语音识别初始化阶段语法构建时,生成的语音识别模型文件包括增大音量、减小音量命令词的语音特征向量。用户在用语音调节音量大小时,说出增大音量、减小音量命令词语音指令被识别执行。当用户或家庭成员感觉增大音量、减小音量喊起来比较拗口,不适合自己平时的说话习惯时,可以在显示单元新编辑或增适合自己说话习惯的语音命令词,比如大声一点、小声一点,编辑或新增命令词的同时,数据存储模块11更新anbf语法文件内容。新增命令词后用户在功能列表选择与新增语音命令词相匹配的控制程序,在数据存储模块11保存语音命令词与控制程序匹配关系,数据存储模块11对anbf语法进行重新构建,生成新的语音识别模型文件,覆盖之前的语音识别模型文件,大声一点、小声一点命令词的语音特征将被构建到新的语音识别模型文件中。在语音识别重新初始化过后,用户说出大声一点、小声一点等命令词,将会被语音识别模块13识别,从而通过计算单元分析出语音识别结果,结合控制模块15可以实现控制冰箱喇叭音量大小。
本实施例的智能家电离线语音控制装置,用户修改前和删除的语音命令词,在语法构建阶段将不会被构建到语音识别模型文件,在语音特征匹配及分析计算时不会得到识别结果,用户修改后和新增的语音命令词,在语法构建阶段将会被构建到语音识别模型文件,在语音特征匹配及分析计算时容易得到识别结果,能够解决用户在使用语音指令控制智能家电设备的过程中,由于记不清智能家电设备预置的控制命令词,或是由于预置控制命令词不符合他们的说话习惯,致使用户不能及时说出控制指令或是说出错误的控制指令,从而导致不能实现语音控制的技术问题。
本实施例的智能家电离线语音控制装置,通过在本地存储包含多个控制功能项目及与每个控制功能项目具有对应关系的至少两个控制命令词的控制指令包,采集识别用户的语音指令信息语音指令信息得到语音识别结果,查找与语音识别结果匹配的控制命令词,按照控制命令词在本地查找与控制命令词对应的控制功能项目,并控制智能家电执行控制功能项目,从而在离线模式实现应多个控制命令词对应控制功能项目,实现多个控制命令词控制一个控制功能项目,以提高语音控制有效率,增强用户对智能家电的控制体验。
实施例3
本实施例提供一种应用上述实施例1、实施例2提供的智能家电离线语音控制装置进行智能家电离线语音控制的方法,如图4所示,该智能家电离线语音控制方法包括:
401、根据用户指令显示语音命令词编辑界面,编辑界面显示了语音命令词和与之对应的设备控制功能。
402、检测用户语音命令词编辑指令,修改、新增或删除语音命令词。
403a、修改语音命令词;403b、新增语音命令词;403c、删除语音命令词。
403d、选择与新增命令词相匹配的控制功能项目。
该步骤根据用户指令进行匹配。
404、更新语音命令词和控制功能项目的对应关系。
该步骤由数据存储模块11实现。
405、更新anbf语法文件。
具体步骤为,读取anbf语法文件内容,根据数据存储模块11现有语音命令词进行更新和保存。
406、重新构建anbf语法文件,生成新的语音识别资源文件,覆盖之前生成的语音识别模型文件。
该步骤由数据存储模块11实现。
407、检测用户语音控制指令。
该步骤由语音湖区模块12实现。
408、分析计算出用户语音的语音特征信息。
该步骤由语音处理模块13实现。
409、将获取的语音特征信息与语音识别模型文件中的各语音特征依次对比,从语音识别模型文件中获取出匹配度最高的语音特征,得到语音识别结果。
该步骤由语音处理模块13实现。
410、将语音识别结果的阈值与预置的语音识别门限值比较。
411、比较是否阈值>门限值。
如阈值>门限值则执行412,否则结束,该步骤由语音处理模块13实现。
412、根据语音识别结果配控制功能项目,根据控制功能项目实现对设备的控制。
具体的,根据语音识别结果从数据存储模块11匹配控制功能项目,根据控制功能项目实现对设备的控制
该步骤由数据处理模块14、控制模块15实现。
本实施例的应用场景为,当用户在使用语音控制智能家电设备的过程中体验到家电厂商预置或者之前修改的某些语音命令词不符合自己平时的说话习惯时,可以在lcd显示屏上进入命令词编辑页面,编辑页面显示本地数据存储模块所有的语音命令词,并匹配与每个语音命令词相对应设备控制功能项目,如增大音量命令词对应着控制扬声器声音增大的功能。用户可以在编辑页面对命令词进行修改、新增、删除等修改操作,用户修改语音命令词,此操作没有改变命令词对应的控制功能;用户在数据存储模块11添加语音命令词,并选择与之匹配的控制功能项目,一个语音命令词只能对应一个控制功能项目,一个控制功能项目可对应多个不同的语音命令词;用户从数据存储模块11删除语音命令词,并解除与之对应的控制功能项目。用户修改、新增的命令词以4-6 个汉字为识别结果最佳,为增加识别成功率可以避免语音命令词中有读音相近的语音命令词。用户在修改页面操作完成后,更新数据存储存储模块语音命令词,更新命令词与控制功能项目的对应关系。根据数据存储模块11的语音命令词更新本地anbf语法文件,anbf语法文件更新保存完毕,对anbf语法文件进行语法重新构建,重新生成语音识别相关的模型文件。当用户说出语音命令词,语音采集模块12采集到用户的语音信息,将语音信息传输到语音处理模块13,语音处理模块13对接收到的音频信号进行降噪和回声消除后将音频信号通过编码运算得到一组特征向量即语音特征向量,将此语音特征向量与语音识别模型文件中的语音特征向量相比较匹配,从模型文件中获取出最接近所述语音特征向量的特征向量,软件通过特征向量计算分析出语音识别结果。语音处理模块13在输出语音识别结果的同时会附带一个特诊向量的匹配分数,即阈值,此阈值用于表征语音识别结果与用于语音的匹配度,阈值越大,语音识别结果越准确。预先设置门限值(可以设置变更),阈值大于门限值语音识别结果准确,阈值小于门限值识别结果无效。在阈值大于门限值时根据语音识别结果从数据存储模块11匹配出控制功能,将控制功能发送到控制模块15实现对智能家电设备的控制。
本实施例的智能家电离线语音控制方法应用于上述实施例的智能家电离线语音控制装置,从而在离线模式实现应多个控制命令词对应控制功能项目,实现多个控制命令词控制一个控制功能项目,以提高语音控制有效率,增强用户对智能家电的控制体验。
以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种智能家电离线语音控制装置,其特征在于,该装置用于智能家电离线语音控制,该装置包括:数据存储模块、语音采集模块、语音处理模块、数据处理模块、控制模块;
所述数据存储模块设置在本地,用于在本地存储控制指令包,所述控制指令包包含至少一个控制功能项目及与每个控制功能项目具有对应关系的至少两个控制命令词;
所述语音采集模块,用于所述智能家电进入语音采集模式时采集用户的语音指令信息,并将所述语音指令信息传输至所述语音处理模块;
所述语音处理模块,用于识别语音指令信息得到语音识别结果;
所述数据处理模块,用于查找与所述语音识别结果匹配的第一控制命令词;
所述控制模块,用于按照所述第一控制命令词在所述数据存储模块查找与所述第一控制命令词对应的第一控制功能项目,并控制智能家电执行所述第一控制功能项目。
2.根据权利要求1所述的装置,其特征在于,所述数据存储模块,还用于根据用户编辑的与第二控制功能项目对应的控制命令词,更新所述控制指令包,所述第二控制功能项目为所述至少一个控制功能项目中任一控制功能项目。
3.根据权利要求2所述的装置,其特征在于,还包括:显示模块;
所述显示模块,用于控制显示页面显示所述控制指令包包含的至少一个控制功能项目及与每个控制功能项目具有对应关系的至少两个控制命令词;
所述显示模块还用于,向用户显示编辑与所述第二控制功能项目的显示页面,并发出编辑与所述第二控制功能项目的提示,获取用户通过所述显示页面编辑的与所述第二控制功能项目对应的控制命令词;或者,在所述显示页面显示所述控制指令包包含的至少一个控制功能项目及与每个控制功能项目具有对应关系的至少两个控制命令词时向用户显示通过语音编辑与所述第二控制功能项目的提示,所述语音采集模块还用于,接收用户通过语音编辑的与所述第二控制功能项目对应的控制命令词。
4.根据权利要求2所述的装置,其特征在于,所述数据处理模块还用于,通过所述语音采集模块获取用户语音编辑的与所述第二控制功能项目对应的控制命令词。
5.根据权利要求2所述的装置,其特征在于,所述数据存储模块还用于,所述数据处理模块未查找到与所述语音识别结果匹配的第一控制命令词时,从所述语音识别结果中提取控制命令词,并根据用户指令将提取的控制命令词与所述至少一个控制功能项目中第三控制功能项目对应,更新所述控制指令包。
6.根据权利要求1所述的装置,其特征在于,所述数据存储模块还用于,获取标定命令词组合规则的命令词语法文件,确定与所述命令词语法文件相关的语音识别模型文件,所述语音识别模型文件包含所述控制指令包中全部控制命令词的标准语音特征向量。
7.根据权利要求6所述的装置,其特征在于,所述语音处理模块,用于将语音指令信息转换为语音特征向量,将所述语音特征向量与所述语音识别模型文件中的标准语音特征向量匹配,从所述语音识别模型文件中获取最接近所述语音特征向量的标准语音特征向量,确定所述语音识别结果。
8.根据权利要求6或7所述的装置,其特征在于,所述语音处理模块得到的所述语音识别结果为文字;
所述数据处理模块,还用于如所述文字包含在存储单元命令词和所述命令词语法文件中,则根据所述文字从所述存储模块查找匹配的所述第一控制命令词。
9.根据权利要求1至7中任一项所述的装置,其特征在于,所述数据存储模块用于向所述每个控制功能项目分配ID;建立存储表,所述存储表中实时将所述每个控制功能项目的ID与所述每个控制功能项目各自具有对应关系的全部控制命令词对应存储。
10.根据权利要求1至7中任一项所述的装置,其特征在于,所述语音处理模块还用于,确定语音识别阈值;
所述语音处理模块还用于,比较所述语音识别阈值与预设的门限值,所述语音识别阈值大于所述门限值则所述语音识别结果准确,所述语音识别阈值小于所述门限值则所述语音识别结果无效。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911395573.8A CN111161731A (zh) | 2019-12-30 | 2019-12-30 | 智能家电离线语音控制装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911395573.8A CN111161731A (zh) | 2019-12-30 | 2019-12-30 | 智能家电离线语音控制装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111161731A true CN111161731A (zh) | 2020-05-15 |
Family
ID=70559020
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911395573.8A Pending CN111161731A (zh) | 2019-12-30 | 2019-12-30 | 智能家电离线语音控制装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111161731A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112581952A (zh) * | 2020-11-09 | 2021-03-30 | 金茂智慧科技(广州)有限公司 | 一种在线与离线语音结合的智能设备控制方法 |
CN112885347A (zh) * | 2021-01-22 | 2021-06-01 | 海信电子科技(武汉)有限公司 | 一种显示设备的语音控制方法、显示设备及服务器 |
CN115064171A (zh) * | 2022-08-18 | 2022-09-16 | 安徽立诺威智能科技有限公司 | 一种用于智能空气消毒设备的语音唤醒方法和*** |
CN117784632A (zh) * | 2024-02-28 | 2024-03-29 | 深圳市轻生活科技有限公司 | 一种基于离线语音识别的智能家居控制*** |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104978957A (zh) * | 2014-04-14 | 2015-10-14 | 美的集团股份有限公司 | 基于声纹识别的语音控制方法和*** |
CN105096940A (zh) * | 2015-06-30 | 2015-11-25 | 百度在线网络技术(北京)有限公司 | 用于进行语音识别的方法和装置 |
CN106550132A (zh) * | 2016-10-25 | 2017-03-29 | 努比亚技术有限公司 | 一种移动终端及其控制方法 |
CN106817144A (zh) * | 2017-01-18 | 2017-06-09 | 上海洪洋通信科技有限公司 | 多维度机器人*** |
CN108364644A (zh) * | 2018-01-17 | 2018-08-03 | 深圳市金立通信设备有限公司 | 一种语音交互方法、终端及计算机可读介质 |
CN108731183A (zh) * | 2018-05-31 | 2018-11-02 | 奥克斯空调股份有限公司 | 一种智能空调***及空调 |
CN108766441A (zh) * | 2018-05-29 | 2018-11-06 | 广东声将军科技有限公司 | 一种基于离线声纹识别和语音识别的语音控制方法及装置 |
CN109036393A (zh) * | 2018-06-19 | 2018-12-18 | 广东美的厨房电器制造有限公司 | 家电设备的唤醒词训练方法、装置及家电设备 |
CN109495360A (zh) * | 2018-12-18 | 2019-03-19 | 深圳国美云智科技有限公司 | 一种智能家居物联平台、离线语音控制方法及*** |
-
2019
- 2019-12-30 CN CN201911395573.8A patent/CN111161731A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104978957A (zh) * | 2014-04-14 | 2015-10-14 | 美的集团股份有限公司 | 基于声纹识别的语音控制方法和*** |
CN105096940A (zh) * | 2015-06-30 | 2015-11-25 | 百度在线网络技术(北京)有限公司 | 用于进行语音识别的方法和装置 |
CN106550132A (zh) * | 2016-10-25 | 2017-03-29 | 努比亚技术有限公司 | 一种移动终端及其控制方法 |
CN106817144A (zh) * | 2017-01-18 | 2017-06-09 | 上海洪洋通信科技有限公司 | 多维度机器人*** |
CN108364644A (zh) * | 2018-01-17 | 2018-08-03 | 深圳市金立通信设备有限公司 | 一种语音交互方法、终端及计算机可读介质 |
CN108766441A (zh) * | 2018-05-29 | 2018-11-06 | 广东声将军科技有限公司 | 一种基于离线声纹识别和语音识别的语音控制方法及装置 |
CN108731183A (zh) * | 2018-05-31 | 2018-11-02 | 奥克斯空调股份有限公司 | 一种智能空调***及空调 |
CN109036393A (zh) * | 2018-06-19 | 2018-12-18 | 广东美的厨房电器制造有限公司 | 家电设备的唤醒词训练方法、装置及家电设备 |
CN109495360A (zh) * | 2018-12-18 | 2019-03-19 | 深圳国美云智科技有限公司 | 一种智能家居物联平台、离线语音控制方法及*** |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112581952A (zh) * | 2020-11-09 | 2021-03-30 | 金茂智慧科技(广州)有限公司 | 一种在线与离线语音结合的智能设备控制方法 |
CN112885347A (zh) * | 2021-01-22 | 2021-06-01 | 海信电子科技(武汉)有限公司 | 一种显示设备的语音控制方法、显示设备及服务器 |
CN115064171A (zh) * | 2022-08-18 | 2022-09-16 | 安徽立诺威智能科技有限公司 | 一种用于智能空气消毒设备的语音唤醒方法和*** |
CN117784632A (zh) * | 2024-02-28 | 2024-03-29 | 深圳市轻生活科技有限公司 | 一种基于离线语音识别的智能家居控制*** |
CN117784632B (zh) * | 2024-02-28 | 2024-05-14 | 深圳市轻生活科技有限公司 | 一种基于离线语音识别的智能家居控制*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111161731A (zh) | 智能家电离线语音控制装置 | |
CN107454508B (zh) | 麦克风阵列的电视机及电视*** | |
CN108831469B (zh) | 语音命令定制方法、装置和设备及计算机存储介质 | |
JP6640502B2 (ja) | ディスプレイ装置、音声取得装置およびその音声認識方法 | |
CN107644638B (zh) | 语音识别方法、装置、终端和计算机可读存储介质 | |
KR102004872B1 (ko) | 전자장치, 서버 및 그 제어방법 | |
CN109378006B (zh) | 一种跨设备声纹识别方法及*** | |
KR102411619B1 (ko) | 전자 장치 및 그 제어 방법 | |
CN105791931A (zh) | 智能电视及其语音控制方法 | |
CN107958668B (zh) | 智能电视的声控选播方法、声控选播*** | |
CN104978964B (zh) | 语音控制指令纠错方法和*** | |
JP7159475B2 (ja) | 音声制御方法、クラウドサーバおよび端末装置 | |
KR20140089871A (ko) | 대화형 서버, 그 제어 방법 및 대화형 시스템 | |
JP2014132370A (ja) | 映像処理装置及びその制御方法、並びに映像処理システム | |
KR20140092634A (ko) | 전자장치와 그 제어방법 | |
KR20150089145A (ko) | 음성 제어를 수행하는 디스플레이 장치 및 그 음성 제어 방법 | |
US20160210966A1 (en) | Voice recognition processing device, voice recognition processing method, and display device | |
KR20140089836A (ko) | 대화형 서버, 디스플레이 장치 및 그 제어 방법 | |
JP6675078B2 (ja) | 誤認識訂正方法、誤認識訂正装置及び誤認識訂正プログラム | |
WO2020079941A1 (ja) | 情報処理装置及び情報処理方法、並びにコンピュータプログラム | |
KR102501655B1 (ko) | 디스플레이장치, 음성취득장치 및 그 음성인식방법 | |
KR20170051994A (ko) | 음성인식 디바이스 및 이의 동작 방법 | |
US20180332339A1 (en) | Set-Top Box with Enhanced Functionality and System and Method for Use of Same | |
EP2757557B1 (en) | Electronic apparatus and voice processing method thereof | |
EP4184309A1 (en) | Display device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200515 |