CN113778226A - 一种基于语音识别技术控制智能家居的红外ai智能眼镜 - Google Patents
一种基于语音识别技术控制智能家居的红外ai智能眼镜 Download PDFInfo
- Publication number
- CN113778226A CN113778226A CN202110987518.9A CN202110987518A CN113778226A CN 113778226 A CN113778226 A CN 113778226A CN 202110987518 A CN202110987518 A CN 202110987518A CN 113778226 A CN113778226 A CN 113778226A
- Authority
- CN
- China
- Prior art keywords
- module
- voice signal
- sub
- signal
- infrared
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000005516 engineering process Methods 0.000 title claims abstract description 35
- 239000011521 glass Substances 0.000 title claims abstract description 23
- 238000012545 processing Methods 0.000 claims abstract description 83
- 238000004458 analytical method Methods 0.000 claims abstract description 53
- 230000001276 controlling effect Effects 0.000 claims abstract description 29
- 238000007781 pre-processing Methods 0.000 claims abstract description 6
- 230000001105 regulatory effect Effects 0.000 claims abstract description 5
- 238000012216 screening Methods 0.000 claims description 32
- 238000011156 evaluation Methods 0.000 claims description 26
- 230000001629 suppression Effects 0.000 claims description 26
- 230000011218 segmentation Effects 0.000 claims description 25
- 239000004984 smart glass Substances 0.000 claims description 20
- 238000001228 spectrum Methods 0.000 claims description 16
- 238000000605 extraction Methods 0.000 claims description 13
- 238000012937 correction Methods 0.000 claims description 6
- 238000013145 classification model Methods 0.000 claims description 5
- 238000009432 framing Methods 0.000 claims description 5
- 238000012163 sequencing technique Methods 0.000 claims description 5
- 230000008030 elimination Effects 0.000 claims description 4
- 238000003379 elimination reaction Methods 0.000 claims description 4
- 230000033228 biological regulation Effects 0.000 claims description 2
- 230000009286 beneficial effect Effects 0.000 description 11
- 230000005540 biological transmission Effects 0.000 description 10
- 230000036651 mood Effects 0.000 description 7
- 238000000034 method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000002708 enhancing effect Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000003062 neural network model Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000032683 aging Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- General Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本发明公开了一种基于语音识别技术控制智能家居的红外AI智能眼镜,包括:获取模块,用于获取用户的第一语音信号;处理模块,用于对所述第一语音信号进行预处理,得到第二语音信号;分析模块,用于提取第二语音信号中的文本信息,对所述文本信息进行语义分析,得到分析结果,根据所述分析结果生成对智能家居的红外控制指令;第一控制模块,用于基于所述红外控制指令对所述智能家居进行调控。有益效果:通过对用户的语音进行识别,进而控制室内的智能家居,提高用户的体验感,实现智能化控制。
Description
技术领域
本发明设计智能眼镜技术领域,特别涉及一种基于语音识别技术控制智能家居的红外AI智能眼镜。
背景技术
目前,可穿戴设备逐步走入人们的日常生活,尤其是智能眼镜,可以给用户的生活带来很多便利。相关技术中,智能眼镜具有一些通知提示功能,比如,显示绑定终端的来电通知或短信通知等,佩戴过久时提醒用户缓解疲劳等。然而,这些通知都非常简单,给用户带来的便利十分有限,因此,如何进一步扩展智能眼镜的功能,成为目前亟待解决的技术问题。
发明内容
本发明旨在至少一定程度上解决上述技术中的技术问题之一。为此,本发明的目的在于提出了一种基于语音识别技术控制智能家居的红外AI智能眼镜,通过对用户的语音进行识别,进而控制室内的智能家居,提高用户的体验感,实现智能化控制。
为达到上述目的,本发明实施例提出了一种基于语音识别技术控制智能家居的红外AI智能眼镜,包括:
获取模块,用于获取用户的第一语音信号;
处理模块,用于对所述第一语音信号进行预处理,得到第二语音信号;
分析模块,用于提取第二语音信号中的文本信息,对所述文本信息进行语义分析,得到分析结果,根据所述分析结果生成对智能家居的红外控制指令;
第一控制模块,用于基于所述红外控制指令对所述智能家居进行调控。
进一步地,所述的基于语音识别技术控制智能家居的红外AI智能眼镜,还包括:
判断模块,用于在所述获取模块获取第一语音信号后,判断所述第一语音信号是否满足预设条件,在确定所述第一语音信号满足预设条件时,将所述第一语音信号发送至所述处理模块;反之将所述第一语音信号进行剔除处理。
进一步地,所述判断模块包括:
提取单元,用于对所述第一语音信号进行特征提取,得到所述第一语音信号的声纹特征;
匹配单元,用于将所述声纹特征与预设声纹特征进行匹配,计算得到匹配度,在确定所述匹配度大于预设匹配度时,表示所述第一语音信号满足预设条件;反之,表示所述第一语音信号不满足预设条件。
进一步地,所述根据所述分析结果生成对智能家居的红外控制指令包括:
根据所述分析结果得到智能家具的类型信息,根据所述类型信息查询预设智能家具红外码值库,得到所述类型信息相对应的红外码值,根据所述红外码值生成红外控制指令。
进一步地,所述的基于语音识别技术控制智能家居的红外AI智能眼镜,还包括:
蓝牙模块,用于与用户终端建立蓝牙配对连接,并接收用户终端发送的音乐数据;
播放模块,用于将所述音乐数据进行播放。
进一步地,所述处理模块包括:
抑制模块,用于:
对所述第一语音信号进行快速傅里叶变换,得到第一频域语音信号,对所述第一频域语音信号进行非线性处理,对非线性处理后的第一频域语音信号进行信号分割处理,得到若干个子第一频域语音信号;
获取每个子第一频域语音信号的频率,筛选出所述频率小于预设频率的子第一频域信号,得到第一集合;
筛选出所述频率大于等于预设频率的子第一频域信号,得到第二集合;
获取所述第一集合中每个子第一频域信号的第一功率并进行排序,筛选出最大的第一功率,将最大的第一功率作为目标功率;
获取所述第二集合中每个子第一频域信号的第二功率,将所述第二功率与所述目标功率进行比较,对所述第二功率大于所述目标功率的子第一频域信号进行功率抑制处理;
根据所述第一集合中的子第一频域信号、所述第二集合中未经过功率抑制处理的子第一频域信号及经过功率抑制处理后的子第一频域信号生成第二频域信号并进行快速傅里叶逆变换,得到待增强语音信号;
增强模块,与所述抑制模块连接,用于对所述待增强语音信号进行分帧处理,得到若干帧子待增强语音信号,分别获取每帧子待增强语音信号的类型;所述类型包括清音帧和浊音帧;
将所述类型为清音帧的子待增强语音信号作为保留信号;
将所述类型为浊音帧的子待增强语音信号作为待处理信号;
计算每个待处理信号的频谱包络线,提取每条频谱包络线上的共振峰,获取每个共振峰的幅值;其中,一个待处理信号对应一条频谱包络线;
根据所述幅值确定汉宁窗滤波器的增强系数,根据所述增强系数将相对应的待处理信号输入所述汉宁窗滤波器中进行增强处理;
根据所述保留信号与所述增强处理后的待处理信号生成第二语音信号。进一步地,所述分别获取每帧子待增强语音信号的类型包括:
将所述每帧子待增强语音信号分别输入预先训练好的分类模型中,输出每帧子待增强语音信号相对应的类型。
进一步地,所述的基于语音识别技术控制智能家居的红外AI智能眼镜,还包括:
功率调节模块,用于调节所述蓝牙模块的接收功率;
第二控制模块,用于在所述用户终端向所述蓝牙模块传输所述音乐数据时,计算所述蓝牙模块的目标接收功率,并控制所述功率调节模块调节根据所述目标接收功率对所述蓝牙模块的接收功率进行调节。
进一步地,所述分析模块包括:
文本生成模块,用于基于语音识别技术对所述第二语音信号进行识别,得到第一文本;
文本处理模块,与所述文本生成模块连接,用于:
判断所述第一文本中是否存在语气词,在确定所述第一文本中存在语气词时,将所述语气词进行删除;
对语气词删除后的第一文本进行分词处理,得到若干个第一分词,分别判断每个第一分词是否存在于预设正确词库中,筛选出存在于预设正确词库中的第一分词,作为有效分词;筛选出不存在于预设正确词库中的第一分词,作为待处理分词;
分别将每个待处理分词输入预先训练好的纠错模型中,输出每个待处理分词相对应的正确分词,根据所述正确分词对相对应的待处理分词进行替换处理;
根据所述有效分词与所述替换处理后的待处理分词生成第二文本;
关键词提取模块,与所述文本处理模块连接,用于:
对所述第二文本进行分词处理,得到若干个第二分词,分别获取每个第二分词的属性信息;所述属性信息包括分词的词性、长度及在所述第二文本中的位置;
根据所述属性信息对相对应的第二分词进行评价,得到对每个第二分词的评价值;
分别将每个第二分词的所述评价值与预设评价值进行比较,筛选出所述评价值大于预设评价值的第二分词,作为关键词;
语义分析模块,与所述关键词提取模块连接,用于对所述关键词进行语义分析,得到分析结果。
进一步地,所述播放模块包括扬声器。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明一种基于语音识别技术控制智能家居的红外AI智能眼镜的框图;
图2为红外AI智能眼镜主体结构图;
图3为根据本发明一实施例的一种基于语音识别技术控制智能家居的红外AI智能眼镜的框图;
图4为根据本发明有一实施例的一种基于语音识别技术控制智能家居的红外AI智能眼镜的框图。
附图标记:
获取模块1、处理模块2、分析模块3、第一控制模块4、镜片5、镜框6、鼻托7、镜腿8、抑制模块9、增强模块10、文本生成模块11、文本处理模块12、关键词提取模块13、语义分析模块14。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
下面参考图1至图4来描述本发明实施例提出的一种基于语音识别技术控制智能家居的红外AI智能眼镜。
如图1所示,一种基于语音识别技术控制智能家居的红外AI智能眼镜,包括:
获取模块1,用于获取用户的第一语音信号;
处理模块2,用于对所述第一语音信号进行预处理,得到第二语音信号;
分析模块3,用于提取第二语音信号中的文本信息,对所述文本信息进行语义分析,得到分析结果,根据所述分析结果生成对智能家居的红外控制指令;
第一控制模块4,用于基于所述红外控制指令对所述智能家居进行调控。
上述方案的工作原理:获取模块1用于获取用户的第一语音信号;处理模块2用于对所述第一语音信号进行预处理,得到第二语音信号;分析模块3用于提取第二语音信号中的文本信息,对所述文本信息进行语义分析,得到分析结果,根据所述分析结果生成对智能家居的红外控制指令;第一控制模块4用于基于所述红外控制指令对所述智能家居进行调控。
上述方案的有益效果:处理模块2对所述第一语音信号进行预处理,使得得到的第二语音信号更加的清晰,增加最后识别结果的精确性,分析模块3用于提取第二语音信号中的文本信息,对所述文本信息进行语义分析,得到分析结果,根据所述分析结果生成对智能家居的红外控制指令;第一控制模块4用于基于所述红外控制指令对所述智能家居进行调控,进而控制室内的智能家居,提高用户的体验感,实现智能化控制。
如图2所示,一种基于语音识别技术控制智能家居的红外AI智能眼镜,包括红外AI智能眼镜主体,所述红外A I智能眼镜主体包括镜片5、镜框6、鼻托7、镜腿8;所述镜片5镶嵌在所述镜框6上;所述鼻托7安装在所述镜框6上;所述镜腿8与所述镜框6铰链连接。
上述方案的工作原理及有益效果:所述红外AI智能眼镜主体包括镜片5、镜框6、鼻托7、镜腿8;所述镜片5镶嵌在所述镜框6上;所述鼻托7安装在所述镜框6上;所述镜腿8与所述镜框6铰链连接。
根据本发明的一些实施例,所述的基于语音识别技术控制智能家居的红外AI智能眼镜,还包括:
判断模块,用于在所述获取模块1获取第一语音信号后,判断所述第一语音信号是否满足预设条件,在确定所述第一语音信号满足预设条件时,将所述第一语音信号发送至所述处理模块2;反之将所述第一语音信号进行剔除处理。
上述方案的工作原理:判断模块于在所述获取模块1获取第一语音信号后,判断所述第一语音信号是否满足预设条件,在确定所述第一语音信号满足预设条件时,将所述第一语音信号发送至所述处理模块2;反之将所述第一语音信号进行剔除处理。
上述方案的有益效果:对所述第一语音信号设置预设条件,增加用户语音的唯一性,进而提高用户的体验感。
根据本发明的一些实施例,所述的基于语音识别技术控制智能家居的红外AI智能眼镜,所述判断模块包括:
提取单元,用于对所述第一语音信号进行特征提取,得到所述第一语音信号的声纹特征;
匹配单元,用于将所述声纹特征与预设声纹特征进行匹配,计算得到匹配度,在确定所述匹配度大于预设匹配度时,表示所述第一语音信号满足预设条件;反之,表示所述第一语音信号不满足预设条件。
上述方案的工作原理:提取单元用于对所述第一语音信号进行特征提取,得到所述第一语音信号的声纹特征;匹配单元用于将所述声纹特征与预设声纹特征进行匹配,计算得到匹配度,在确定所述匹配度大于预设匹配度时,表示所述第一语音信号满足预设条件;反之,表示所述第一语音信号不满足预设条件。
上述方案的有益效果:每个人的声纹特征都是不同的,通过计算所述声纹特征与预设声纹特征的匹配度,增加对第一语音信号筛选的准确性。
根据本发明的一些实施例,所述的基于语音识别技术控制智能家居的红外AI智能眼镜,所述根据所述分析结果生成对智能家居的红外控制指令包括:
根据所述分析结果得到智能家具的类型信息,根据所述类型信息查询预设智能家具红外码值库,得到所述类型信息相对应的红外码值,根据所述红外码值生成红外控制指令。
上述方案的工作原理:根据所述分析结果得到智能家具的类型信息,根据所述类型信息查询预设智能家具红外码值库,得到所述类型信息相对应的红外码值,根据所述红外码值生成红外控制指令。
上述方案的有益效果:根据所述分析结果得到智能家具的类型信息,根据所述类型信息查询预设智能家具红外码值库,使得得到的红外码值更加的精确,提高最后生成的红外控制指令的精确性。
根据本发明的一些实施例,所述的基于语音识别技术控制智能家居的红外AI智能眼镜,还包括:
蓝牙模块,用于与用户终端建立蓝牙配对连接,并接收用户终端发送的音乐数据;
播放模块,用于将所述音乐数据进行播放。
上述方案的工作原理:蓝牙模块用于与用户终端建立蓝牙配对连接,并接收用户终端发送的音乐数据;播放模块用于将所述音乐数据进行播放。
上述方案的有益效果:对音乐数据进行播放,增加眼镜的智能性。
如图3所示,根据本发明的一些实施例,所述处理模块2包括:
抑制模块9,用于:
对所述第一语音信号进行快速傅里叶变换,得到第一频域语音信号,对所述第一频域语音信号进行非线性处理,对非线性处理后的第一频域语音信号进行信号分割处理,得到若干个子第一频域语音信号;
获取每个子第一频域语音信号的频率,筛选出所述频率小于预设频率的子第一频域信号,得到第一集合;
筛选出所述频率大于等于预设频率的子第一频域信号,得到第二集合;
获取所述第一集合中每个子第一频域信号的第一功率并进行排序,筛选出最大的第一功率,将最大的第一功率作为目标功率;
获取所述第二集合中每个子第一频域信号的第二功率,将所述第二功率与所述目标功率进行比较,对所述第二功率大于所述目标功率的子第一频域信号进行功率抑制处理;
根据所述第一集合中的子第一频域信号、所述第二集合中未经过功率抑制处理的子第一频域信号及经过功率抑制处理后的子第一频域信号生成第二频域信号并进行快速傅里叶逆变换,得到待增强语音信号;
增强模块10,与所述抑制模块9连接,用于对所述待增强语音信号进行分帧处理,得到若干帧子待增强语音信号,分别获取每帧子待增强语音信号的类型;所述类型包括清音帧和浊音帧;
将所述类型为清音帧的子待增强语音信号作为保留信号;
将所述类型为浊音帧的子待增强语音信号作为待处理信号;
计算每个待处理信号的频谱包络线,提取每条频谱包络线上的共振峰,获取每个共振峰的幅值;其中,一个待处理信号对应一条频谱包络线;
根据所述幅值确定汉宁窗滤波器的增强系数,根据所述增强系数将相对应的待处理信号输入所述汉宁窗滤波器中进行增强处理;
根据所述保留信号与所述增强处理后的待处理信号生成第二语音信号。
上述方案的工作原理:抑制模块9用于对所述第一语音信号进行快速傅里叶变换,得到第一频域语音信号,对所述第一频域语音信号进行非线性处理,对非线性处理后的第一频域语音信号进行信号分割处理,得到若干个子第一频域语音信号;获取每个子第一频域语音信号的频率,筛选出所述频率小于预设频率的子第一频域信号,得到第一集合;筛选出所述频率大于等于预设频率的子第一频域信号,得到第二集合;获取所述第一集合中每个子第一频域信号的第一功率并进行排序,筛选出最大的第一功率,将最大的第一功率作为目标功率;获取所述第二集合中每个子第一频域信号的第二功率,将所述第二功率与所述目标功率进行比较,对所述第二功率大于所述目标功率的子第一频域信号进行功率抑制处理;根据所述第一集合中的子第一频域信号、所述第二集合中未经过功率抑制处理的子第一频域信号及经过功率抑制处理后的子第一频域信号生成第二频域信号并进行快速傅里叶逆变换,得到待增强语音信号;增强模块10,与所述抑制模块9连接,用于对所述待增强语音信号进行分帧处理,得到若干帧子待增强语音信号,分别获取每帧子待增强语音信号的类型;所述类型包括清音帧和浊音帧;将所述类型为清音帧的子待增强语音信号作为保留信号;将所述类型为浊音帧的子待增强语音信号作为待处理信号;计算每个待处理信号的频谱包络线,提取每条频谱包络线上的共振峰,获取每个共振峰的幅值;其中,一个待处理信号对应一条频谱包络线;根据所述幅值确定汉宁窗滤波器的增强系数,根据所述增强系数将相对应的待处理信号输入所述汉宁窗滤波器中进行增强处理;根据所述保留信号与所述增强处理后的待处理信号生成第二语音信号。
上述方案的有益效果:第一语音信号在采集的过程中,周围的噪声及采集设备的老化等因素,会第一语音信号的质量造成影响,本方案提供一种提高语音信号质量的方法,具有全自动、速度快、精确高的优点;抑制模块9用于对所述第一语音信号进行快速傅里叶变换,得到第一频域语音信号,对所述第一频域语音信号进行非线性处理,对非线性处理后的第一频域语音信号进行信号分割处理,得到若干个子第一频域语音信号;获取每个子第一频域语音信号的频率,筛选出所述频率小于预设频率的子第一频域信号,得到第一集合;所述第一集合为所述第一频域语音信号中的低频信号;筛选出所述频率大于等于预设频率的子第一频域信号,得到第二集合;所述第二集合为所述第一频域语音信号中的高频信号;一般,高频信号中往往都伴随着噪声;获取所述第一集合中每个子第一频域信号的第一功率并进行排序,筛选出最大的第一功率,将最大的第一功率作为目标功率;所述目标功率为噪声抑制功率;获取所述第二集合中每个子第一频域信号的第二功率,将所述第二功率与所述目标功率进行比较,对所述第二功率大于所述目标功率的子第一频域信号进行功率抑制处理;将所述第二功率大于所述目标功率的子第一频域信号的功率抑制到所述目标功率往下;通过上述方法,可在不影响语音的情况下有效抑制噪声根据所述第一集合中的子第一频域信号、所述第二集合中未经过功率抑制处理的子第一频域信号及经过功率抑制处理后的子第一频域信号生成第二频域信号并进行快速傅里叶逆变换,得到待增强语音信号;对语音信号中的噪声进行处理后,在对所述语音信号的细节进行增强,增强模块10用于对所述待增强语音信号进行分帧处理,得到若干帧子待增强语音信号,分别获取每帧子待增强语音信号的类型;所述类型包括清音帧和浊音帧;将所述类型为清音帧的子待增强语音信号作为保留信号;将所述类型为浊音帧的子待增强语音信号作为待处理信号;计算每个待处理信号的频谱包络线,提取每条频谱包络线上的共振峰,获取每个共振峰的幅值;其中,一个待处理信号对应一条频谱包络线;根据所述幅值确定汉宁窗滤波器的增强系数,根据所述增强系数将相对应的待处理信号输入所述汉宁窗滤波器中进行增强处理;根据所述保留信号与所述增强处理后的待处理信号生成第二语音信号,通过频谱包络线上的共振峰的幅值确定宁窗滤波器的增强系数,从而达到增强语音的目的,提高语音可懂度和音质;同时具有计算简单、鲁棒性好的优点,提高语音识别的精确性,增加最后语义识别的准确性,进而使得最终生成的智能家具控制质量更加的精确,提高用户的体验感。
根据本发明的一些实施例,所述分别获取每帧子待增强语音信号的类型包括:
将所述每帧子待增强语音信号分别输入预先训练好的分类模型中,输出每帧子待增强语音信号相对应的类型。
上述方案的工作原理及有益效果:将所述每帧子待增强语音信号分别输入预先训练好的分类模型中,使得得到的每帧子待增强语音信号相对应的类型更加的精确;所述分类模型为样本语音信号与样本语音信号相对应的类型通过训练得到的神经网络模型。
根据本发明的一些实施例,所述的基于语音识别技术控制智能家居的红外AI智能眼镜,还包括:
功率调节模块,用于调节所述蓝牙模块的接收功率;
第二控制模块,用于在所述用户终端向所述蓝牙模块传输所述音乐数据时,计算所述蓝牙模块的目标接收功率,并控制所述功率调节模块调节根据所述目标接收功率对所述蓝牙模块的接收功率进行调节;
所述计算所述蓝牙模块的目标接收功率,包括:
计算所述音乐数据在传输时的传输损耗γ,如公式(1)所示:
其中,v为对所述音乐数据的传输速度;f为对所述音乐数据的传输频率;L为所述用户终端与所述蓝牙模块的距离;
根据所述音乐数据在时的传输损耗γ,计算所述蓝牙模块的目标接收功率P1,如公式(2)所示:
其中,P2为所述用户终端的发射功率。
上述方案的工作原理:功率调节模块用于调节所述蓝牙模块的接收功率;第二控制模块用于在所述用户终端向所述蓝牙模块传输所述音乐数据时,计算所述蓝牙模块的目标接收功率,并控制所述功率调节模块调节根据所述目标接收功率对所述蓝牙模块的接收功率进行调节。
上述方案的有益效果:蓝牙模块的接收功率与音乐数据在时的传输损耗决定着接收音乐数据的速度,若音乐数据在时的传输损耗过大且蓝牙模块的接收功率太小时,会造成数据的接收不及时,进而使得音乐播放不及时,大大的影响用户的体验感,因此,计算蓝牙模块的目标接收功率是必要的,第二控制模块在计算所述蓝牙模块的目标接收功率时,考虑所述用户终端的发射功率、所述音乐数据在传输时的传输损耗、所述音乐数据的传输速度等因素,使得计算出来的目标接收功率更加的精确,进而控制所述功率调节模块调节根据所述目标接收功率对所述蓝牙模块的接收功率进行调节,保证蓝牙模块的接收速度,进而保证音乐播放的及时性,提高用户的体验感。
如图4所示,根据本发明的一些实施例,所述分析模块3包括:
文本生成模块11,用于基于语音识别技术对所述第二语音信号进行识别,得到第一文本;
文本处理模块12,与所述文本生成模块11连接,用于:
判断所述第一文本中是否存在语气词,在确定所述第一文本中存在语气词时,将所述语气词进行删除;
对语气词删除后的第一文本进行分词处理,得到若干个第一分词,分别判断每个第一分词是否存在于预设正确词库中,筛选出存在于预设正确词库中的第一分词,作为有效分词;筛选出不存在于预设正确词库中的第一分词,作为待处理分词;
分别将每个待处理分词输入预先训练好的纠错模型中,输出每个待处理分词相对应的正确分词,根据所述正确分词对相对应的待处理分词进行替换处理;
根据所述有效分词与所述替换处理后的待处理分词生成第二文本;
关键词提取模块13,与所述文本处理模块12连接,用于:
对所述第二文本进行分词处理,得到若干个第二分词,分别获取每个第二分词的属性信息;所述属性信息包括分词的词性、长度及在所述第二文本中的位置;
根据所述属性信息对相对应的第二分词进行评价,得到对每个第二分词的评价值;
分别将每个第二分词的所述评价值与预设评价值进行比较,筛选出所述评价值大于预设评价值的第二分词,作为关键词;
语义分析模块14,与所述关键词提取模块13连接,用于对所述关键词进行语义分析,得到分析结果。
上述方案的工作原理:文本生成模块11用于基于语音识别技术对所述第二语音信号进行识别,得到第一文本;文本处理模块12用于判断所述第一文本中是否存在语气词,在确定所述第一文本中存在语气词时,将所述语气词进行删除;对语气词删除后的第一文本进行分词处理,得到若干个第一分词,分别判断每个第一分词是否存在于预设正确词库中,筛选出存在于预设正确词库中的第一分词,作为有效分词;筛选出不存在于预设正确词库中的第一分词,作为待处理分词;分别将每个待处理分词输入预先训练好的纠错模型中,输出每个待处理分词相对应的正确分词,根据所述正确分词对相对应的待处理分词进行替换处理;根据所述有效分词与所述替换处理后的待处理分词生成第二文本;关键词提取模块13用于对所述第二文本进行分词处理,得到若干个第二分词,分别获取每个第二分词的属性信息;所述属性信息包括分词的词性、长度及在所述第二文本中的位置;根据所述属性信息对相对应的第二分词进行评价,得到对每个第二分词的评价值;分别将每个第二分词的所述评价值与预设评价值进行比较,筛选出所述评价值大于预设评价值的第二分词,作为关键词;语义分析模块14用于对所述关键词进行语义分析,得到分析结果。
上述方案的有益效果:获取到第二语音信号后,如何精确的根据第二语音信号生成红外控制指令是重中之重,本方案提供了具体的实施方式;文本生成模块11用于基于语音识别技术对所述第二语音信号进行识别,得到第一文本;文本处理模块12用于判断所述第一文本中是否存在语气词,在确定所述第一文本中存在语气词时,将所述语气词进行删除,语气词为句子末尾的“嗯,啊”等,简化了接下来的识别步骤,加快了识别速度;对语气词删除后的第一文本进行分词处理,得到若干个第一分词,分别判断每个第一分词是否存在于预设正确词库中,筛选出存在于预设正确词库中的第一分词,作为有效分词;筛选出不存在于预设正确词库中的第一分词,作为待处理分词;分别将每个待处理分词输入预先训练好的纠错模型中,输出每个待处理分词相对应的正确分词,根据所述正确分词对相对应的待处理分词进行替换处理;其中,所述纠错模块为样本待处理分词与所述样本待处理分词对应的正确分词通过训练得到的神经网络模型;根据所述有效分词与所述替换处理后的待处理分词生成第二文本;使得第二文本更加的精确,提高最后提取关键词的准确率;关键词提取模块13用于对所述第二文本进行分词处理,得到若干个第二分词,分别获取每个第二分词的属性信息;所述属性信息包括分词的词性、长度及在所述第二文本中的位置;词性包括专有名称、普通名词、成语、动词、形容词和副词;词的长度是指每个词中字的数目;词的位置表示词在第二文本中的位置。根据所述属性信息对相对应的第二分词进行评价,得到对每个第二分词的评价值;每个词的词性对应的分值从高到低依次为:专有名词对应的分值、普通名词对应的分值、形容词对应的分值、动词对应的分值、成语对应的分值、副词对应的分值以及其他词对应的分值;分别将每个第二分词的所述评价值与预设评价值进行比较,筛选出所述评价值大于预设评价值的第二分词,作为关键词;根据每个第二分词的所述评价值进行筛选得到的关键词更加的精确,语义分析模块14用于对所述关键词进行语义分析,得到分析结果,根据对所述关键词进行语义分析,不仅减少语义识别的复杂性,而且提高了语义识别的精确性。
根据本发明的一些实施例,所述播放模块包括扬声器。
上述方案的工作原理及有益效果:通过扬声器播放的音乐更加的清晰。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.一种基于语音识别技术控制智能家居的红外AI智能眼镜,其特征在于,包括:
获取模块,用于获取用户的第一语音信号;
处理模块,用于对所述第一语音信号进行预处理,得到第二语音信号;
分析模块,用于提取第二语音信号中的文本信息,对所述文本信息进行语义分析,得到分析结果,根据所述分析结果生成对智能家居的红外控制指令;
第一控制模块,用于基于所述红外控制指令对所述智能家居进行调控。
2.根据权利要求1所述的基于语音识别技术控制智能家居的红外AI智能眼镜,其特征在于,还包括:
判断模块,用于在所述获取模块获取第一语音信号后,判断所述第一语音信号是否满足预设条件,在确定所述第一语音信号满足预设条件时,将所述第一语音信号发送至所述处理模块;反之将所述第一语音信号进行剔除处理。
3.根据权利要求2所述的基于语音识别技术控制智能家居的红外AI智能眼镜,其特征在于,所述判断模块包括:
提取单元,用于对所述第一语音信号进行特征提取,得到所述第一语音信号的声纹特征;
匹配单元,用于将所述声纹特征与预设声纹特征进行匹配,计算得到匹配度,在确定所述匹配度大于预设匹配度时,表示所述第一语音信号满足预设条件;反之,表示所述第一语音信号不满足预设条件。
4.根据权利要求1所述的基于语音识别技术控制智能家居的红外AI智能眼镜,其特征在于,所述根据所述分析结果生成对智能家居的红外控制指令包括:
根据所述分析结果得到智能家具的类型信息,根据所述类型信息查询预设智能家具红外码值库,得到所述类型信息相对应的红外码值,根据所述红外码值生成红外控制指令。
5.根据权利要求1所述的基于语音识别技术控制智能家居的红外AI智能眼镜,其特征在于,还包括:
蓝牙模块,用于与用户终端建立蓝牙配对连接,并接收用户终端发送的音乐数据;
播放模块,用于将所述音乐数据进行播放。
6.根据权利要求1所述的基于语音识别技术控制智能家居的红外AI智能眼镜,其特征在于,所述处理模块包括:
抑制模块,用于:
对所述第一语音信号进行快速傅里叶变换,得到第一频域语音信号,对所述第一频域语音信号进行非线性处理,对非线性处理后的第一频域语音信号进行信号分割处理,得到若干个子第一频域语音信号;
获取每个子第一频域语音信号的频率,筛选出所述频率小于预设频率的子第一频域信号,得到第一集合;
筛选出所述频率大于等于预设频率的子第一频域信号,得到第二集合;
获取所述第一集合中每个子第一频域信号的第一功率并进行排序,筛选出最大的第一功率,将最大的第一功率作为目标功率;
获取所述第二集合中每个子第一频域信号的第二功率,将所述第二功率与所述目标功率进行比较,对所述第二功率大于所述目标功率的子第一频域信号进行功率抑制处理;
根据所述第一集合中的子第一频域信号、所述第二集合中未经过功率抑制处理的子第一频域信号及经过功率抑制处理后的子第一频域信号生成第二频域信号并进行快速傅里叶逆变换,得到待增强语音信号;
增强模块,与所述抑制模块连接,用于对所述待增强语音信号进行分帧处理,得到若干帧子待增强语音信号,分别获取每帧子待增强语音信号的类型;所述类型包括清音帧和浊音帧;
将所述类型为清音帧的子待增强语音信号作为保留信号;
将所述类型为浊音帧的子待增强语音信号作为待处理信号;
计算每个待处理信号的频谱包络线,提取每条频谱包络线上的共振峰,获取每个共振峰的幅值;其中,一个待处理信号对应一条频谱包络线;
根据所述幅值确定汉宁窗滤波器的增强系数,根据所述增强系数将相对应的待处理信号输入所述汉宁窗滤波器中进行增强处理;
根据所述保留信号与所述增强处理后的待处理信号生成第二语音信号。
7.根据权利要求6所述的基于语音识别技术控制智能家居的红外AI智能眼镜,其特征在于,所述分别获取每帧子待增强语音信号的类型包括:
将所述每帧子待增强语音信号分别输入预先训练好的分类模型中,输出每帧子待增强语音信号相对应的类型。
8.根据权利要求5所述的基于语音识别技术控制智能家居的红外AI智能眼镜,其特征在于,还包括:
功率调节模块,用于调节所述蓝牙模块的接收功率;
第二控制模块,用于在所述用户终端向所述蓝牙模块传输所述音乐数据时,计算所述蓝牙模块的目标接收功率,并控制所述功率调节模块调节根据所述目标接收功率对所述蓝牙模块的接收功率进行调节。
9.根据权利要求1所述的基于语音识别技术控制智能家居的红外AI智能眼镜,其特征在于,所述分析模块包括:
文本生成模块,用于基于语音识别技术对所述第二语音信号进行识别,得到第一文本;
文本处理模块,与所述文本生成模块连接,用于:
判断所述第一文本中是否存在语气词,在确定所述第一文本中存在语气词时,将所述语气词进行删除;
对语气词删除后的第一文本进行分词处理,得到若干个第一分词,分别判断每个第一分词是否存在于预设正确词库中,筛选出存在于预设正确词库中的第一分词,作为有效分词;筛选出不存在于预设正确词库中的第一分词,作为待处理分词;
分别将每个待处理分词输入预先训练好的纠错模型中,输出每个待处理分词相对应的正确分词,根据所述正确分词对相对应的待处理分词进行替换处理;
根据所述有效分词与所述替换处理后的待处理分词生成第二文本;
关键词提取模块,与所述文本处理模块连接,用于:
对所述第二文本进行分词处理,得到若干个第二分词,分别获取每个第二分词的属性信息;所述属性信息包括分词的词性、长度及在所述第二文本中的位置;
根据所述属性信息对相对应的第二分词进行评价,得到对每个第二分词的评价值;
分别将每个第二分词的所述评价值与预设评价值进行比较,筛选出所述评价值大于预设评价值的第二分词,作为关键词;
语义分析模块,与所述关键词提取模块连接,用于对所述关键词进行语义分析,得到分析结果。
10.根据权利要求1所述的基于语音识别技术控制智能家居的红外AI智能眼镜,其特征在于,所述播放模块包括扬声器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110987518.9A CN113778226A (zh) | 2021-08-26 | 2021-08-26 | 一种基于语音识别技术控制智能家居的红外ai智能眼镜 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110987518.9A CN113778226A (zh) | 2021-08-26 | 2021-08-26 | 一种基于语音识别技术控制智能家居的红外ai智能眼镜 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113778226A true CN113778226A (zh) | 2021-12-10 |
Family
ID=78839472
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110987518.9A Pending CN113778226A (zh) | 2021-08-26 | 2021-08-26 | 一种基于语音识别技术控制智能家居的红外ai智能眼镜 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113778226A (zh) |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102779527A (zh) * | 2012-08-07 | 2012-11-14 | 无锡成电科大科技发展有限公司 | 基于窗函数共振峰增强的语音增强方法 |
CN103680514A (zh) * | 2013-12-13 | 2014-03-26 | 广州华多网络科技有限公司 | 网络语音通信中的信号处理方法和*** |
WO2017156893A1 (zh) * | 2016-03-18 | 2017-09-21 | 深圳Tcl数字技术有限公司 | 语音控制方法及智能电视 |
CN107997314A (zh) * | 2018-01-03 | 2018-05-08 | 潘荣兰 | 一种智能医疗手环 |
CN108171951A (zh) * | 2018-01-03 | 2018-06-15 | 李文清 | 一种基于蓝牙的智能家居遥控器 |
CN108917283A (zh) * | 2018-07-12 | 2018-11-30 | 四川虹美智能科技有限公司 | 一种智能冰箱控制方法、***、智能冰箱和云端服务器 |
CN109410919A (zh) * | 2018-11-28 | 2019-03-01 | 深圳朗昇贸易有限公司 | 一种智能家居控制*** |
CN110675870A (zh) * | 2019-08-30 | 2020-01-10 | 深圳绿米联创科技有限公司 | 一种语音识别方法、装置、电子设备及存储介质 |
CN111128213A (zh) * | 2019-12-10 | 2020-05-08 | 展讯通信(上海)有限公司 | 一种分频段进行处理的噪声抑制方法及其*** |
CN111276141A (zh) * | 2020-01-19 | 2020-06-12 | 珠海格力电器股份有限公司 | 语音交互方法、装置、存储介质、处理器和电子设备 |
CN111681655A (zh) * | 2020-05-21 | 2020-09-18 | 北京声智科技有限公司 | 语音控制方法、装置、电子设备及存储介质 |
CN112016275A (zh) * | 2020-10-30 | 2020-12-01 | 北京淇瑀信息科技有限公司 | 一种语音识别文本的智能纠错方法、***和电子设备 |
CN112201246A (zh) * | 2020-11-19 | 2021-01-08 | 深圳市欧瑞博科技股份有限公司 | 基于语音的智能控制方法、装置、电子设备及存储介质 |
CN112230877A (zh) * | 2020-10-16 | 2021-01-15 | 惠州Tcl移动通信有限公司 | 一种语音操作方法、装置、存储介质及电子设备 |
CN112382296A (zh) * | 2020-10-12 | 2021-02-19 | 绍兴市爱丘科技有限公司 | 一种声纹遥控无线音频设备的方法和装置 |
CN113050445A (zh) * | 2021-03-23 | 2021-06-29 | 安徽阜南县向发工艺品有限公司 | 一种智能家居用语音控制*** |
-
2021
- 2021-08-26 CN CN202110987518.9A patent/CN113778226A/zh active Pending
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102779527A (zh) * | 2012-08-07 | 2012-11-14 | 无锡成电科大科技发展有限公司 | 基于窗函数共振峰增强的语音增强方法 |
CN103680514A (zh) * | 2013-12-13 | 2014-03-26 | 广州华多网络科技有限公司 | 网络语音通信中的信号处理方法和*** |
WO2017156893A1 (zh) * | 2016-03-18 | 2017-09-21 | 深圳Tcl数字技术有限公司 | 语音控制方法及智能电视 |
CN107997314A (zh) * | 2018-01-03 | 2018-05-08 | 潘荣兰 | 一种智能医疗手环 |
CN108171951A (zh) * | 2018-01-03 | 2018-06-15 | 李文清 | 一种基于蓝牙的智能家居遥控器 |
CN108917283A (zh) * | 2018-07-12 | 2018-11-30 | 四川虹美智能科技有限公司 | 一种智能冰箱控制方法、***、智能冰箱和云端服务器 |
CN109410919A (zh) * | 2018-11-28 | 2019-03-01 | 深圳朗昇贸易有限公司 | 一种智能家居控制*** |
CN110675870A (zh) * | 2019-08-30 | 2020-01-10 | 深圳绿米联创科技有限公司 | 一种语音识别方法、装置、电子设备及存储介质 |
CN111128213A (zh) * | 2019-12-10 | 2020-05-08 | 展讯通信(上海)有限公司 | 一种分频段进行处理的噪声抑制方法及其*** |
CN111276141A (zh) * | 2020-01-19 | 2020-06-12 | 珠海格力电器股份有限公司 | 语音交互方法、装置、存储介质、处理器和电子设备 |
CN111681655A (zh) * | 2020-05-21 | 2020-09-18 | 北京声智科技有限公司 | 语音控制方法、装置、电子设备及存储介质 |
CN112382296A (zh) * | 2020-10-12 | 2021-02-19 | 绍兴市爱丘科技有限公司 | 一种声纹遥控无线音频设备的方法和装置 |
CN112230877A (zh) * | 2020-10-16 | 2021-01-15 | 惠州Tcl移动通信有限公司 | 一种语音操作方法、装置、存储介质及电子设备 |
CN112016275A (zh) * | 2020-10-30 | 2020-12-01 | 北京淇瑀信息科技有限公司 | 一种语音识别文本的智能纠错方法、***和电子设备 |
CN112201246A (zh) * | 2020-11-19 | 2021-01-08 | 深圳市欧瑞博科技股份有限公司 | 基于语音的智能控制方法、装置、电子设备及存储介质 |
CN113050445A (zh) * | 2021-03-23 | 2021-06-29 | 安徽阜南县向发工艺品有限公司 | 一种智能家居用语音控制*** |
Non-Patent Citations (1)
Title |
---|
张卫钢: "《通信原理与通信技术》", vol. 1, 西安电子科技大学出版社, pages: 336 - 339 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109326302B (zh) | 一种基于声纹比对和生成对抗网络的语音增强方法 | |
US10997970B1 (en) | Methods and systems implementing language-trainable computer-assisted hearing aids | |
US7593849B2 (en) | Normalization of speech accent | |
CN105206271A (zh) | 智能设备的语音唤醒方法及实现所述方法的*** | |
CN107945790A (zh) | 一种情感识别方法和情感识别*** | |
CN111862934B (zh) | 语音合成模型的改进方法和语音合成方法及装置 | |
KR20080023030A (ko) | 온라인 방식에 의한 화자 인식 방법 및 이를 위한 장치 | |
CN111370030A (zh) | 语音情感检测方法与装置、存储介质、电子设备 | |
US5995924A (en) | Computer-based method and apparatus for classifying statement types based on intonation analysis | |
CN116665669A (zh) | 一种基于人工智能的语音交互方法及*** | |
CN111489763B (zh) | 一种基于gmm模型的复杂环境下说话人识别自适应方法 | |
WO2023185006A1 (zh) | 一种工作模式设置方法及装置 | |
CN114783464A (zh) | 认知检测方法及相关装置、电子设备和存储介质 | |
CN111798846A (zh) | 语音命令词识别方法、装置、会议终端及会议终端*** | |
CN112017690B (zh) | 一种音频处理方法、装置、设备和介质 | |
CN110853669A (zh) | 音频识别方法、装置及设备 | |
Saba et al. | The effects of Lombard perturbation on speech intelligibility in noise for normal hearing and cochlear implant listeners | |
CN115104151A (zh) | 一种离线语音识别方法和装置、电子设备和可读存储介质 | |
WO2023185004A1 (zh) | 一种音色切换方法及装置 | |
CN113778226A (zh) | 一种基于语音识别技术控制智能家居的红外ai智能眼镜 | |
KR20230043080A (ko) | 대화기반 정신장애선별방법 및 그 장치 | |
Shufang | Design of an automatic english pronunciation error correction system based on radio magnetic pronunciation recording devices | |
CN112767961B (zh) | 一种基于云端计算的口音矫正方法 | |
CN112466335B (zh) | 基于重音突现度的英语发音质量评价方法 | |
Salim et al. | Automatic Speaker Verification System for Dysarthria Patients. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |