CN113793610A - 一种语音控制物业管理的方法、***、设备及介质 - Google Patents
一种语音控制物业管理的方法、***、设备及介质 Download PDFInfo
- Publication number
- CN113793610A CN113793610A CN202111063874.8A CN202111063874A CN113793610A CN 113793610 A CN113793610 A CN 113793610A CN 202111063874 A CN202111063874 A CN 202111063874A CN 113793610 A CN113793610 A CN 113793610A
- Authority
- CN
- China
- Prior art keywords
- voice
- feature vector
- vector
- comparison
- standard
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 239000013598 vector Substances 0.000 claims abstract description 198
- 238000001208 nuclear magnetic resonance pulse sequence Methods 0.000 claims abstract description 46
- 230000001276 controlling effect Effects 0.000 claims abstract description 27
- 238000001914 filtration Methods 0.000 claims description 12
- 238000001228 spectrum Methods 0.000 claims description 8
- 230000005540 biological transmission Effects 0.000 claims description 7
- 238000006243 chemical reaction Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 5
- 238000012216 screening Methods 0.000 claims description 4
- 238000004891 communication Methods 0.000 claims description 3
- 230000004913 activation Effects 0.000 claims 2
- 238000007726 management method Methods 0.000 description 46
- 230000008569 process Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 210000005069 ears Anatomy 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 241001672694 Citrus reticulata Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/16—Real estate
- G06Q50/163—Real estate management
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/14—Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
- G10L15/142—Hidden Markov Models [HMMs]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/24—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Business, Economics & Management (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Primary Health Care (AREA)
- Signal Processing (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Probability & Statistics with Applications (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明提出了一种语音控制物业管理的方法、***、设备及介质,涉及语音控制技术领域。包括利用客户端设备采集多个用于控制物业管理的原始语音信息,提取语音脉冲序列中的语音特征矢量,并量化成标准语音特征矢量;在客户端设备上和后台终端均设置隐马尔可夫模型对多次提取的标准语音特征矢量进行概率统计,得出最佳标准语音特征矢量;将最佳标准语音特征矢量与对比语音矢量进行比较,若最佳标准语音特征矢量与任一对比语音矢量相匹配,向对比语音矢量对应的控制设备发送启动信号;反之则不发送启动信号。其能够采用声音控制的方法,迅速地使对应的控制设备在接收到语音信息后进行对应的控制,节约了寻找的时间,由此提高了便捷性。
Description
技术领域
本发明涉及语音控制技术领域,具体而言,涉及一种语音控制物业管理的方法、***、设备及介质。
背景技术
由于人民生活水平和生活质量的不断提高,当前居住人员对居住的安全要求也水涨船高,居住安全已然成为当前物业管理的首要任务。在这种趋势下,智能小区的物业管理重要性日益凸显。其中对于物业管理中的操作例如每户的燃气开关、水电开关等等,现有技术需要对各种开关进行寻找,由于开关数量较多种类繁杂,管理起来费时费力,故而需要一种可以直接进行语音控制物业管理方法。
发明内容
本发明的目的在于提供一种语音控制物业管理的方法,其能够采用声音控制的方法,迅速地使对应的控制设备在接收到语音信息后进行对应的控制,节约了寻找的时间,由此提高了便捷性。
本发明的实施例是这样实现的:
第一方面,本申请实施例提供一种语音控制物业管理的方法,其包括利用客户端设备采集多个用于控制物业管理的原始语音信息,将任一所述原始语音信息利用声电转换器转换成语音脉冲序列进行传输;对任一所述语音脉冲序列滤除干扰信号后,提取所述语音脉冲序列中的语音特征矢量,并将提取的所述语音特征矢量量化成标准语音特征矢量;在所述客户端设备上建立本地隐马尔可夫模型,在后台终端设置终端隐马尔可夫模型;当所述客户端设备与所述后台终端无互联网连接时,利用所述本地隐马尔可夫模型对多次提取的所述标准语音特征矢量进行概率统计,得出最佳标准语音特征矢量;当客户端设备与后台终端有互联网连接时,利用所述终端隐马尔可夫模型对多次提取的所述标准语音特征矢量进行概率统计,得出最佳标准语音特征矢量;预设语音模板库,在所述语音模板库内储存关联控制物业管理相关操作的对比语音矢量;将所述最佳标准语音特征矢量与所述对比语音矢量进行比较,若所述最佳标准语音特征矢量与任一对比语音矢量相匹配,向所述对比语音矢量对应的控制设备发送启动信号;反之则不发送启动信号。
基于第一方面,在本发明的一些实施例中,提取所述语音脉冲序列中的语音特征矢量的步骤包括:对所述语音脉冲序列的每一帧提取,将每一帧语音脉冲序列进行傅里叶变换得到语音频谱,根据所述语音频谱进行三角滤波转换得到梅尔频率倒谱,将得到的所述梅尔频率倒谱保存为语音特征矢量。
基于第一方面,在本发明的一些实施例中,将所述最佳标准语音特征矢量与所述对比语音矢量进行比较的步骤包括:利用动态时间规整算法分别计算所述标准语音特征矢量和对比特征矢量每一帧对应的欧式距离,若相邻两帧对应的欧式距离在预设范围内,则判定为标准语音特征矢量和对比特征矢量匹配,反之则不匹配。
基于第一方面,在本发明的一些实施例中,所述语音模板库中多个对比特征矢量对应一个控制物业管理的控制设备。
基于第一方面,在本发明的一些实施例中,还包括所述后台终端利用互联网将所述客户端设备的提取的所述标准语音特征矢量保存至储存单元,将其中与所述对比语音矢量适配的标准语音特征矢量作为新的对比语音矢量保存至所述语音模板库。
基于第一方面,在本发明的一些实施例中,还包括所述后台终端通过互联网对所述客户端设备的语音模板库进行实时更新。
基于第一方面,在本发明的一些实施例中,反之则不发送启动信号的步骤之后还包括:利用播放器播放用于提示未能识别的预设语音,并重新采集语音信息,当在预设时间内没有再次采集到语音信息,停止工作。
第二方面,本申请实施例提供一种语音控制物业管理的***,其包括采集模块,用于利用客户端设备采集多个用于控制物业管理的原始语音信息,将任一所述原始语音信息利用声电转换器转换成语音脉冲序列进行传输;
转换模块,用于对任一所述语音脉冲序列滤除干扰信号后,提取所述语音脉冲序列中的语音特征矢量,并将提取的所述语音特征矢量量化成标准语音特征矢量;
筛选识别模块,用于在所述客户端设备上建立本地隐马尔可夫模型,在后台终端设置终端隐马尔可夫模型;当所述客户端设备与所述后台终端无互联网连接时,利用所述本地隐马尔可夫模型对多次提取的所述标准语音特征矢量进行概率统计,得出最佳标准语音特征矢量;当客户端设备与后台终端有互联网连接时,利用所述终端隐马尔可夫模型对多次提取的所述标准语音特征矢量进行概率统计,得出最佳标准语音特征矢量;
模型预设模块,用于预设语音模板库,在所述语音模板库内储存关联控制物业管理相关操作的对比语音矢量;
判断模块,用于将所述最佳标准语音特征矢量与所述对比语音矢量进行比较,若所述最佳标准语音特征矢量与任一对比语音矢量相匹配,向所述对比语音矢量对应的控制设备发送启动信号;反之则不发送启动信号。
第三方面,本申请实施例提供一种电子设备,其包括至少一个处理器、至少一个存储器和数据总线;其中:所述处理器与所述存储器通过所述数据总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令以执行一种语音控制物业管理的方法。
第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现一种语音控制物业管理的方法。
相对于现有技术,本发明的实施例至少具有如下优点或有益效果:
一种语音控制物业管理的方法,鉴于物业管理中由于用户数量较多,需要物业管理的开关种类数量庞大,由此发明采用声音控制的方法,可以迅速地使对应的开关在接收到语音信息后进行对应的控制,由此提高了便捷性。对于声音信息的采集,采用现有技术中较为成熟的方式,即利用录音机或录音笔进行声音录制,而后通过声电转换器换成语音脉冲序列,利用电信号的方式进行传输。由于在对声音信号进行录制的过程中,会伴有电流杂音或其他干扰,本发明采用陷波滤波器,并且鉴于人耳最敏感声音频率范围是1KHZ-3KHZ之间的声音,对小于1KHZ,大于3KHZ频率声音对应的信号进行滤除。同时对滤除后的语音脉冲序列提取语音特征矢量,再量化成标准语音特征矢量。建立隐马尔可夫模型,主要用于对标准语音特征矢量进行概率统计,得出最佳标准语音特征矢量;而在客户端设备和后台终端上均设置隐马尔可夫模型,主要是为了避免断网时客户端设备无法与后台终端进行实时通讯,导致无法使用。由此在客户端设备上设置本地隐马尔可夫模型对多次提取的标准语音特征矢量进行概率统计,得出最佳标准语音特征矢量;在后台终端上设置终端隐马尔可夫模型对多次提取的标准语音特征矢量进行概率统计,得出最佳标准语音特征矢量。在客户端设置以及后台终端接收到标准语音特征矢量,需要对其进行判定,而判定的操作需要进行对比,由此设置语音模板库,并在其内设置关联控制物业管理相关操作的对比语音矢量。当物业管理的控制设备接收到语音信息后,例如使用者发出“打开104房间燃气开关”,控制设备在进行上述语音匹配确认后,打开104房间燃气开关,由此完成语音控制物业管理,提高了便捷性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明中一种语音控制物业管理的方法的流程图;
图2为本发明中一种语音控制物业管理的方法的另一种流程图;
图3为本发明中一种语音控制物业管理的方法的再一种流程图;
图4为本发明中一种语音控制物业管理的***的结构示意流程图;
图5为本发明中一种电子设备的结构示意流程图。
图标:1、采集模块;2、转换模块;3、筛选识别模块;4、模型预设模块;5、判断模块;6、处理器;7、存储器;8、数据总线。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
在本申请的描述中,需要说明的是,术语“上”、“下”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,或者是该申请产品使用时惯常摆放的方位或位置关系,仅是为了便于描述本申请和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本申请的限制。
在本申请的描述中,还需要说明的是,除非另有明确的规定和限定,术语“设置”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本申请中的具体含义。
下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的各个实施例及实施例中的各个特征可以相互组合。
实施例1
请参阅图1,为本申请实施例提供的一种语音控制物业管理的方法,鉴于物业管理中由于用户数量较多,需要物业管理的开关种类数量庞大,由此发明采用声音控制的方法,可以迅速地使对应的开关在接收到语音信息后进行对应的控制,由此提高了便捷性。
S101:利用客户端设备采集多个用于控制物业管理的原始语音信息,将任一原始语音信息利用声电转换器转换成语音脉冲序列进行传输;
对于声音信息的采集,采用现有技术中较为成熟的方式,即利用录音机或录音笔进行声音录制,而后通过声电转换器换成语音脉冲序列,利用电信号的方式进行传输。
S102:对任一语音脉冲序列滤除干扰信号后,提取语音脉冲序列中的语音特征矢量,并将提取的语音特征矢量量化成标准语音特征矢量;
由于在对声音信号进行录制的过程中,会伴有电流杂音或其他干扰,本发明采用陷波滤波器,并且鉴于人耳最敏感声音频率范围是1KHZ至3KHZ之间的声音,对小于1KHZ,大于3KHZ频率声音对应的信号进行滤除。同时对滤除后的语音脉冲序列提取语音特征矢量,再量化成标准语音特征矢量。
S103:在客户端设备上建立本地隐马尔可夫模型,在后台终端设置终端隐马尔可夫模型;当客户端设备与后台终端无互联网连接时,利用本地隐马尔可夫模型对多次提取的标准语音特征矢量进行概率统计,得出最佳标准语音特征矢量;当客户端设备与后台终端有互联网连接时,利用终端隐马尔可夫模型对多次提取的标准语音特征矢量进行概率统计,得出最佳标准语音特征矢量;
建立隐马尔可夫模型,主要用于对标准语音特征矢量进行概率统计,得出最佳标准语音特征矢量;而在客户端设备和后台终端上均设置隐马尔可夫模型,主要是为了避免断网时客户端设备无法与后台终端进行实时通讯,导致无法使用。由此在客户端设备上设置本地隐马尔可夫模型对多次提取的标准语音特征矢量进行概率统计,得出最佳标准语音特征矢量;在后台终端上设置终端隐马尔可夫模型对多次提取的标准语音特征矢量进行概率统计,得出最佳标准语音特征矢量。
S104:预设语音模板库,在语音模板库内储存关联控制物业管理相关操作的对比语音矢量;
在客户端设置以及后台终端接收到标准语音特征矢量,需要对其进行判定,而判定的操作需要进行对比,由此设置语音模板库,并在其内设置关联控制物业管理相关操作的对比语音矢量。
S105:将最佳标准语音特征矢量与对比语音矢量进行比较,若最佳标准语音特征矢量与任一对比语音矢量相匹配,向对比语音矢量对应的控制设备发送启动信号;反之则不发送启动信号。
当物业管理的控制设备接收到语音信息后,例如使用者发出“打开104房间燃气开关”,控制设备在进行上述语音匹配确认后,打开104房间燃气开关,由此完成语音控制物业管理,提高了便捷性。
在本发明的一些实施例中,提取语音脉冲序列中的语音特征矢量的步骤包括:
对语音脉冲序列的每一帧提取,将每一帧语音脉冲序列进行傅里叶变换得到语音频谱,根据语音频谱进行三角滤波转换得到梅尔频率倒谱,将得到的梅尔频率倒谱保存为语音特征矢量。
在本发明的一些实施例中,对于语音脉冲序列中特征进行提取,其无法直接在脉冲序列信号上进行识别,由此将语音脉冲序列进行可视化操作,即利用傅里叶变换将脉冲序列信号的每一帧转换为语音频谱,在将语音频谱上关于语音脉冲序列对应的矢量利用三角滤波转换得到梅尔频率倒谱,由于便可得到最终的语音特征矢量。
在本发明的一些实施例中,将最佳标准语音特征矢量与对比语音矢量进行比较的步骤包括:
利用动态时间规整算法分别计算标准语音特征矢量和对比特征矢量每一帧对应的欧式距离,若相邻两帧对应的欧式距离在预设范围内,则判定为标准语音特征矢量和对比特征矢量匹配,反之则不匹配。
在本发明的一些实施例中,在比对最佳标准语音特征矢量与对比语音矢量过程中,通常采用比对最佳标准语音特征矢量和对比语音矢量形状的相似度,但由于计算机无法像人一样可以直观的用肉眼进行比对,由此采用动态时间规整算法计算每一帧的欧式距离,其中相邻两帧欧式距离在差值在-2MM至3MM的区间内,判定标准语音特征矢量和对比特征矢量匹配,反之则不匹配。
在本发明的一些实施例中,语音模板库中多个对比特征矢量对应一个控制物业管理的控制设备。
在本发明的一些实施例中,鉴于在现实生活中,除了普通话以为还有多种方言,为了尽可能地进行适配,本实施将多种方言作为对比特征矢量保存至语音模板库中,并将同一语意的对比特征矢量关联同一个控制物业管理的控制设备,由此提高了适配性。
请参阅图2,在本发明的一些实施例中,S106:还包括后台终端利用互联网将客户端设备的提取的标准语音特征矢量保存至储存单元,将其中与对比语音矢量适配的标准语音特征矢量作为新的对比语音矢量保存至语音模板库。
在本发明的一些实施例中,由于不同的人说话的声音有差别,为了尽可能的避免匹配失误,对于与后台终端连接的客户端设备的所有使用者每一次的标准语音特征矢量进行保存,并利用后台终端将作为新的对比语音矢量,从而使得匹配更为精确。
请参阅图3,在本发明的一些实施例中,S107:还包括后台终端通过互联网对客户端设备的语音模板库进行实时更新。
在本发明的一些实施例中,为了离线情况下进一步提高匹配的精确性,利用互联网将后台终端中新的对比语音矢量同步至客户端设备中,实时更新语音模板库。
在本发明的一些实施例中,反之则不发送启动信号的步骤之后还包括:利用播放器播放用于提示未能识别的预设语音,并重新采集语音信息,当在预设时间内没有再次采集到语音信息,停止工作。
在本发明的一些实施例中,在物业管理人员对控制设备进行操作时,如果未能成功启动控制设备,应当进行实时提醒,具体实施方式为利用播放器播放用于提示未能识别的预设语音,例如预设语音为:“无法识别您的命令,请重复命令”等,同时重新采集语音信息;而在5分钟内没有再次采集到语音信息,即判断该无命令下达,停止工作。
实施例2
请参阅图4,为本申请实施例提供的一种语音控制物业管理的***,包括
采集模块1,用于利用客户端设备采集多个用于控制物业管理的原始语音信息,将任一原始语音信息利用声电转换器转换成语音脉冲序列进行传输;
转换模块2,用于对任一语音脉冲序列滤除干扰信号后,提取语音脉冲序列中的语音特征矢量,并将提取的语音特征矢量量化成标准语音特征矢量;
筛选识别模块3,用于在客户端设备上建立本地隐马尔可夫模型,在后台终端设置终端隐马尔可夫模型;当客户端设备与后台终端无互联网连接时,利用本地隐马尔可夫模型对多次提取的标准语音特征矢量进行概率统计,得出最佳标准语音特征矢量;当客户端设备与后台终端有互联网连接时,利用终端隐马尔可夫模型对多次提取的标准语音特征矢量进行概率统计,得出最佳标准语音特征矢量;
模型预设模块4,用于预设语音模板库,在语音模板库内储存关联控制物业管理相关操作的对比语音矢量;
判断模块5,用于将最佳标准语音特征矢量与对比语音矢量进行比较,若最佳标准语音特征矢量与任一对比语音矢量相匹配,向对比语音矢量对应的控制设备发送启动信号;反之则不发送启动信号。
实施例3
请参阅图5,为本申请实施例提供的一种电子设备,包括至少一个处理器6、至少一个存储器7和数据总线8;其中:处理器6与存储器7通过数据总线8完成相互间的通信;存储器7存储有可被处理器6执行的程序指令,处理器6调用程序指令以执行一种语音控制物业管理的方法。例如实现:
利用客户端设备采集多个用于控制物业管理的原始语音信息,将任一所述原始语音信息利用声电转换器转换成语音脉冲序列进行传输;对任一所述语音脉冲序列滤除干扰信号后,提取所述语音脉冲序列中的语音特征矢量,并将提取的所述语音特征矢量量化成标准语音特征矢量;在所述客户端设备上建立本地隐马尔可夫模型,在后台终端设置终端隐马尔可夫模型;当所述客户端设备与所述后台终端无互联网连接时,利用所述本地隐马尔可夫模型对多次提取的所述标准语音特征矢量进行概率统计,得出最佳标准语音特征矢量;当客户端设备与后台终端有互联网连接时,利用所述终端隐马尔可夫模型对多次提取的所述标准语音特征矢量进行概率统计,得出最佳标准语音特征矢量;预设语音模板库,在所述语音模板库内储存关联控制物业管理相关操作的对比语音矢量;将所述最佳标准语音特征矢量与所述对比语音矢量进行比较,若所述最佳标准语音特征矢量与任一对比语音矢量相匹配,向所述对比语音矢量对应的控制设备发送启动信号;反之则不发送启动信号。
其中,存储器7可以是但不限于,随机存取存储器7(RANDOM ACCESS MEMORY,RAM),只读存储器(READ ONLY MEMORY,ROM),可编程只读存储器(PROGRAMMABLE READ-ONLYMEMORY,PROM),可擦除只读存储器(ERASABLE PROGRAMMABLE READ-ONLY MEMORY,EPROM),电可擦除只读存储器(ELECTRIC ERASABLE PROGRAMMABLE READ-ONLY MEMORY,EEPROM)等。
处理器6可以是一种集成电路芯片,具有信号处理能力。该处理器6可以是通用处理器,包括中央处理器(CENTRAL PROCESSING UNIT,CPU)、网络处理器(NETWORKPROCESSOR,NP)等;还可以是数字信号处理器(DIGITAL SIGNAL PROCESSING,DSP)、专用集成电路(APPLICATION SPECIFIC INTEGRATED CIRCUIT,ASIC)、现场可编程门阵列(FIELD-PROGRAMMABLE GATE ARRAY,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
实施例4
为本申请实施例提供的一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器6执行时实现一种语音控制物业管理的方法。例如实现:
利用客户端设备采集多个用于控制物业管理的原始语音信息,将任一所述原始语音信息利用声电转换器转换成语音脉冲序列进行传输;对任一所述语音脉冲序列滤除干扰信号后,提取所述语音脉冲序列中的语音特征矢量,并将提取的所述语音特征矢量量化成标准语音特征矢量;在所述客户端设备上建立本地隐马尔可夫模型,在后台终端设置终端隐马尔可夫模型;当所述客户端设备与所述后台终端无互联网连接时,利用所述本地隐马尔可夫模型对多次提取的所述标准语音特征矢量进行概率统计,得出最佳标准语音特征矢量;当客户端设备与后台终端有互联网连接时,利用所述终端隐马尔可夫模型对多次提取的所述标准语音特征矢量进行概率统计,得出最佳标准语音特征矢量;预设语音模板库,在所述语音模板库内储存关联控制物业管理相关操作的对比语音矢量;将所述最佳标准语音特征矢量与所述对比语音矢量进行比较,若所述最佳标准语音特征矢量与任一对比语音矢量相匹配,向所述对比语音矢量对应的控制设备发送启动信号;反之则不发送启动信号。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,READ-ONLY MEMORY)、随机存取存储器(RAM,RANDOM ACCESS MEMORY)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其它的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
Claims (10)
1.一种语音控制物业管理的方法,其特征在于,包括
利用客户端设备采集多个用于控制物业管理的原始语音信息,将任一所述原始语音信息利用声电转换器转换成语音脉冲序列进行传输;
对任一所述语音脉冲序列滤除干扰信号后,提取所述语音脉冲序列中的语音特征矢量,并将提取的所述语音特征矢量量化成标准语音特征矢量;
在所述客户端设备上建立本地隐马尔可夫模型,在后台终端设置终端隐马尔可夫模型;当所述客户端设备与所述后台终端无互联网连接时,利用所述本地隐马尔可夫模型对多次提取的所述标准语音特征矢量进行概率统计,得出最佳标准语音特征矢量;当客户端设备与后台终端有互联网连接时,利用所述终端隐马尔可夫模型对多次提取的所述标准语音特征矢量进行概率统计,得出最佳标准语音特征矢量;
预设语音模板库,在所述语音模板库内储存关联控制物业管理相关操作的对比语音矢量;
将所述最佳标准语音特征矢量与所述对比语音矢量进行比较,若所述最佳标准语音特征矢量与任一对比语音矢量相匹配,向所述对比语音矢量对应的控制设备发送启动信号;反之则不发送启动信号。
2.如权利要求1所述的一种语音控制物业管理的方法,其特征在于,提取所述语音脉冲序列中的语音特征矢量的步骤包括:
对所述语音脉冲序列的每一帧提取,将每一帧语音脉冲序列进行傅里叶变换得到语音频谱,根据所述语音频谱进行三角滤波转换得到梅尔频率倒谱,将得到的所述梅尔频率倒谱保存为语音特征矢量。
3.如权利要求1所述的一种语音控制物业管理的方法,其特征在于,将所述最佳标准语音特征矢量与所述对比语音矢量进行比较的步骤包括:
利用动态时间规整算法分别计算所述标准语音特征矢量和对比特征矢量每一帧对应的欧式距离,若相邻两帧对应的欧式距离在预设范围内,则判定为标准语音特征矢量和对比特征矢量匹配,反之则不匹配。
4.如权利要求3所述的一种语音控制物业管理的方法,其特征在于,所述语音模板库中多个对比特征矢量对应一个控制物业管理的控制设备。
5.如权利要求1所述的一种语音控制物业管理的方法,其特征在于,还包括所述后台终端利用互联网将所述客户端设备的提取的所述标准语音特征矢量保存至储存单元,将其中与所述对比语音矢量适配的标准语音特征矢量作为新的对比语音矢量保存至所述语音模板库。
6.如权利要求5所述的一种语音控制物业管理的方法,其特征在于,还包括所述后台终端通过互联网对所述客户端设备的语音模板库进行实时更新。
7.如权利要求1所述的一种语音控制物业管理的方法,其特征在于,反之则不发送启动信号的步骤之后还包括:利用播放器播放用于提示未能识别的预设语音,并重新采集语音信息,当在预设时间内没有再次采集到语音信息,停止工作。
8.一种语音控制物业管理的***,其特征在于,包括:
采集模块,用于利用客户端设备采集多个用于控制物业管理的原始语音信息,将任一所述原始语音信息利用声电转换器转换成语音脉冲序列进行传输;
转换模块,用于对任一所述语音脉冲序列滤除干扰信号后,提取所述语音脉冲序列中的语音特征矢量,并将提取的所述语音特征矢量量化成标准语音特征矢量;
筛选识别模块,用于在所述客户端设备上建立本地隐马尔可夫模型,在后台终端设置终端隐马尔可夫模型;当所述客户端设备与所述后台终端无互联网连接时,利用所述本地隐马尔可夫模型对多次提取的所述标准语音特征矢量进行概率统计,得出最佳标准语音特征矢量;当客户端设备与后台终端有互联网连接时,利用所述终端隐马尔可夫模型对多次提取的所述标准语音特征矢量进行概率统计,得出最佳标准语音特征矢量;
模型预设模块,用于预设语音模板库,在所述语音模板库内储存关联控制物业管理相关操作的对比语音矢量;
判断模块,用于将所述最佳标准语音特征矢量与所述对比语音矢量进行比较,若所述最佳标准语音特征矢量与任一对比语音矢量相匹配,向所述对比语音矢量对应的控制设备发送启动信号;反之则不发送启动信号。
9.一种电子设备,其特征在于,包括至少一个处理器、至少一个存储器和数据总线;其中:所述处理器与所述存储器通过所述数据总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令以执行如权利要求1-7任一所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111063874.8A CN113793610A (zh) | 2021-09-10 | 2021-09-10 | 一种语音控制物业管理的方法、***、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111063874.8A CN113793610A (zh) | 2021-09-10 | 2021-09-10 | 一种语音控制物业管理的方法、***、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113793610A true CN113793610A (zh) | 2021-12-14 |
Family
ID=79183113
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111063874.8A Pending CN113793610A (zh) | 2021-09-10 | 2021-09-10 | 一种语音控制物业管理的方法、***、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113793610A (zh) |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6804642B1 (en) * | 1997-06-24 | 2004-10-12 | Itt Manufacturing Enterprises, Inc. | Apparatus and method for continuous speech recognition on a PCMCIA card |
CN105653233A (zh) * | 2015-12-30 | 2016-06-08 | 芜湖美智空调设备有限公司 | 关联语音信号与控制指令的方法及控制终端 |
CN105845139A (zh) * | 2016-05-20 | 2016-08-10 | 北方民族大学 | 一种离线语音控制方法和装置 |
CN107015969A (zh) * | 2017-05-19 | 2017-08-04 | 四川长虹电器股份有限公司 | 可自我更新的语义理解***与方法 |
CN107199971A (zh) * | 2017-05-03 | 2017-09-26 | 深圳车盒子科技有限公司 | 车载语音交互方法、终端及计算机可读存储介质 |
US20170322534A1 (en) * | 2016-05-04 | 2017-11-09 | Johnson Controls Technology Company | Systems and methods for agent interaction with building management system |
CN107424607A (zh) * | 2017-07-04 | 2017-12-01 | 珠海格力电器股份有限公司 | 语音控制模式切换方法、装置及具有该装置的设备 |
CN107633841A (zh) * | 2016-07-19 | 2018-01-26 | 浙江星星冷链集成股份有限公司 | 一种语音控制机器人的方法 |
CN108733795A (zh) * | 2018-05-15 | 2018-11-02 | 南昌市微轲联信息技术有限公司 | 检测标准更新方法、装置、可读存储介质及计算机设备 |
CN109947925A (zh) * | 2019-03-21 | 2019-06-28 | 中山安信通机器人制造有限公司 | 车载机器人自然语言自学习方法、计算机装置及计算机可读存储介质 |
CN109979452A (zh) * | 2019-03-21 | 2019-07-05 | 中山安信通机器人制造有限公司 | 车载机器人自然语言处理方法、计算机装置及计算机可读存储介质 |
US20200027462A1 (en) * | 2016-09-29 | 2020-01-23 | Hefei Hualing Co., Ltd. | Voice control system, wakeup method and wakeup apparatus therefor, electrical appliance and co-processor |
CN112037785A (zh) * | 2020-08-14 | 2020-12-04 | 深圳市欧瑞博科技股份有限公司 | 智能设备的控制方法、装置、电子设备及存储介质 |
CN113053369A (zh) * | 2019-12-26 | 2021-06-29 | 青岛海尔空调器有限总公司 | 智能家电的语音控制方法及装置、智能家电 |
-
2021
- 2021-09-10 CN CN202111063874.8A patent/CN113793610A/zh active Pending
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6804642B1 (en) * | 1997-06-24 | 2004-10-12 | Itt Manufacturing Enterprises, Inc. | Apparatus and method for continuous speech recognition on a PCMCIA card |
CN105653233A (zh) * | 2015-12-30 | 2016-06-08 | 芜湖美智空调设备有限公司 | 关联语音信号与控制指令的方法及控制终端 |
US20170322534A1 (en) * | 2016-05-04 | 2017-11-09 | Johnson Controls Technology Company | Systems and methods for agent interaction with building management system |
CN105845139A (zh) * | 2016-05-20 | 2016-08-10 | 北方民族大学 | 一种离线语音控制方法和装置 |
CN107633841A (zh) * | 2016-07-19 | 2018-01-26 | 浙江星星冷链集成股份有限公司 | 一种语音控制机器人的方法 |
US20200027462A1 (en) * | 2016-09-29 | 2020-01-23 | Hefei Hualing Co., Ltd. | Voice control system, wakeup method and wakeup apparatus therefor, electrical appliance and co-processor |
CN107199971A (zh) * | 2017-05-03 | 2017-09-26 | 深圳车盒子科技有限公司 | 车载语音交互方法、终端及计算机可读存储介质 |
CN107015969A (zh) * | 2017-05-19 | 2017-08-04 | 四川长虹电器股份有限公司 | 可自我更新的语义理解***与方法 |
CN107424607A (zh) * | 2017-07-04 | 2017-12-01 | 珠海格力电器股份有限公司 | 语音控制模式切换方法、装置及具有该装置的设备 |
CN108733795A (zh) * | 2018-05-15 | 2018-11-02 | 南昌市微轲联信息技术有限公司 | 检测标准更新方法、装置、可读存储介质及计算机设备 |
CN109947925A (zh) * | 2019-03-21 | 2019-06-28 | 中山安信通机器人制造有限公司 | 车载机器人自然语言自学习方法、计算机装置及计算机可读存储介质 |
CN109979452A (zh) * | 2019-03-21 | 2019-07-05 | 中山安信通机器人制造有限公司 | 车载机器人自然语言处理方法、计算机装置及计算机可读存储介质 |
CN113053369A (zh) * | 2019-12-26 | 2021-06-29 | 青岛海尔空调器有限总公司 | 智能家电的语音控制方法及装置、智能家电 |
CN112037785A (zh) * | 2020-08-14 | 2020-12-04 | 深圳市欧瑞博科技股份有限公司 | 智能设备的控制方法、装置、电子设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
杨旭方;: "基于凌阳单片机实现的智能别墅语音控制***", 职业技术, no. 05, pages 109 - 110 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10388279B2 (en) | Voice interaction apparatus and voice interaction method | |
JP6857699B2 (ja) | 音声対話設備のウェイクアップ方法、装置、設備、記憶媒体、及びプログラム | |
CN107799126B (zh) | 基于有监督机器学习的语音端点检测方法及装置 | |
EP3998557B1 (en) | Audio signal processing method and related apparatus | |
US10573307B2 (en) | Voice interaction apparatus and voice interaction method | |
TW557443B (en) | Method and apparatus for voice recognition | |
CN107767869A (zh) | 用于提供语音服务的方法和装置 | |
CN102404278A (zh) | 一种基于声纹识别的点歌***及其应用方法 | |
CN106469555B (zh) | 一种语音识别方法及终端 | |
CN109920435B (zh) | 一种声纹识别方法及声纹识别装置 | |
CN111554284A (zh) | 一种倒闸操作监控方法、装置、设备及存储介质 | |
CN110827853A (zh) | 语音特征信息提取方法、终端及可读存储介质 | |
CN111554302A (zh) | 基于声纹识别的策略调整方法、装置、终端及存储介质 | |
CN111048099A (zh) | 声音源的识别方法、装置、服务器及存储介质 | |
JP2020095210A (ja) | 議事録出力装置および議事録出力装置の制御プログラム | |
CN105550361B (zh) | 日志处理方法及装置和问答信息处理方法及装置 | |
Battaglino et al. | Acoustic context recognition using local binary pattern codebooks | |
CN115457938A (zh) | 识别唤醒词的方法、装置、存储介质及电子装置 | |
CN111640423B (zh) | 一种词边界估计方法、装置及电子设备 | |
CN101222703A (zh) | 一种基于语音辨识的移动终端的身份验证方法 | |
JP2014145932A (ja) | 話者認識装置、話者認識方法及び話者認識プログラム | |
CN111710339A (zh) | 一种基于数据可视化展示技术的语音识别交互***及方法 | |
KR20190021421A (ko) | 오디오 인식을 위한 방법 및 디바이스 | |
CN113793610A (zh) | 一种语音控制物业管理的方法、***、设备及介质 | |
WO2007095413A2 (en) | Method and apparatus for detecting affects in speech |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |