CN105303794A - 一种可通过声纹识别进行报警综合处置管理*** - Google Patents

一种可通过声纹识别进行报警综合处置管理*** Download PDF

Info

Publication number
CN105303794A
CN105303794A CN201510859779.7A CN201510859779A CN105303794A CN 105303794 A CN105303794 A CN 105303794A CN 201510859779 A CN201510859779 A CN 201510859779A CN 105303794 A CN105303794 A CN 105303794A
Authority
CN
China
Prior art keywords
voice
module
dictionary
scene
management system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510859779.7A
Other languages
English (en)
Inventor
阚涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
XUNMEI ELECTRONICS TECHNOLOGY Co Ltd
Original Assignee
XUNMEI ELECTRONICS TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by XUNMEI ELECTRONICS TECHNOLOGY Co Ltd filed Critical XUNMEI ELECTRONICS TECHNOLOGY Co Ltd
Priority to CN201510859779.7A priority Critical patent/CN105303794A/zh
Publication of CN105303794A publication Critical patent/CN105303794A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08BSIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
    • G08B25/00Alarm systems in which the location of the alarm condition is signalled to a central station, e.g. fire or police telegraphic systems
    • G08B25/01Alarm systems in which the location of the alarm condition is signalled to a central station, e.g. fire or police telegraphic systems characterised by the transmission medium
    • G08B25/012Alarm systems in which the location of the alarm condition is signalled to a central station, e.g. fire or police telegraphic systems characterised by the transmission medium using recorded signals, e.g. speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/04Training, enrolment or model building

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Emergency Management (AREA)
  • General Physics & Mathematics (AREA)
  • Alarm Systems (AREA)

Abstract

本发明公开一种可通过声纹识别进行报警综合处置管理***,该***包括:词典场景语音模块,适于对用户词汇表中的词典、场景语音依次进行采集,并将采集的特征矢量作为模版进行保存;相似度比较模块,适于将输入语音信号的特征矢量依次与词典场景语音模块中保存的每个特征矢量模版进行相似度比较,将相似度最高者作为语音识别结果输出;语音识别引擎模块,适于根据语音识别结果寻找一个词模型序列以描述语音输入信号,从而得到词解码序列,并根据转换后的词解码序列在报警管理数据库中搜索到各个子***的目标信息。本发明能快速找到各个子***中的目标信息如视频、报警地点等进行描述、辨认、检索和快速执行,从而能将各个子***有机整合在一起。

Description

一种可通过声纹识别进行报警综合处置管理***
技术领域
本发明属于报警综合处置管理领域,具体涉及一种可通过声纹识别进行报警综合处置管理***。
背景技术
报警***包括防盗报警***和智能安防报警***等多种类型;具体地,所述防盗报警***的设备一般包括前端探测器和报警控制器,其中,报警控制器是一台主机如电脑的主机一样,用来控制包括有线/无线信号的处理,***本身故障的检测,电源部分,信号输入,信号输出,内置拨号器等这几个方面,一个防盗报警***中报警控制器是必不可少的。前端探测器包括有门磁开关、玻璃破碎探测器、红外探测器、红外/微波双鉴器和紧急呼救按钮。
所述智能安防报警***是同家庭的各种传感器、功能键、探测器和执行器共同构成家庭的安防体系,是家庭安防体系的"大脑"。报警功能包括防火、防盗、煤气泄露报警及紧急求助等功能,报警***采用先进智能型控制网络技术,由微机管理控制,实现对匪情、盗窃、火灾、煤气、紧急求助等意外事故的自动报警。
但是,本发明的发明人经过研究发现,在现有的各种报警***中,存储的与报警相关的报警数量较多,当收到报警提示信息时,需要通过手工查看视频录像等来了解案件原由,即需要人工手动操作来处置报警,因而效率低下;同时,报警***中的各个子***如视频、地图、处置预案、附近工作人员及现场防护设备等各自运行,不能快速将各个子***快速响应整合在一起,容易导致延误处置。
发明内容
针对现有技术存在的技术问题,本发明提供一种可通过声纹识别进行报警综合处置管理***,该***能快速找到视频、报警地点等进行描述、辨认、检索和快速执行,从而能将各个子***有机整合在一起。
为了实现上述目的,本发明采用如下技术方案:
一种可通过声纹识别进行报警综合处置管理***,该***包括:
词典场景语音模块,适于对用户词汇表中的词典、场景语音依次进行采集,并将采集的特征矢量作为模版进行保存;
相似度比较模块,适于将输入语音信号的特征矢量依次与所述词典场景语音模块中保存的每个特征矢量模版进行相似度比较,将相似度最高者作为语音识别结果输出;
语音识别引擎模块,适于根据所述语音识别结果寻找一个词模型序列以描述语音输入信号,从而得到词解码序列,并根据转换后的词解码序列在报警管理数据库中搜索到各个子***中的目标信息。
本发明提供的可通过声纹识别进行报警综合处置管理***,通过相似度比较,在模版数据库中找出与输入人体语音波纹信号相似度最高的语音识别结果即相应的文本,并根据语音识别结果即相应的文本获得词解码序列,即将相应的文本转换成机器执行代码或命令进行执行查找,代替传统的通过人工手动操作来进行检索查找,因而能快速找到各个子***中的目标信息如目标视频、录像视频、报警地点等,工作效率高,智能化程度高,定位速度快,所以能更快满足用户对各个子***中的目标信息如目标视频、录像视频、报警地点等进行描述、辨认、检索、快速执行如拖拉播放的需要,从而能够将各个子***中的多个信息整合在一起进行整合分析。
进一步,所述词典场景语音模块中的模版包括监控***术语模版和人体语音加词典模版。
进一步,所述语音识别引擎模块中搜索所依据的是对公式中的声学模型打分和语言模型打分。
附图说明
图1是本发明提供的可通过声纹识别进行报警综合处置管理***原理示意图。
图中,1、词典场景语音模块;2、相似度比较模块;3、语音识别引擎模块。
具体实施方式
为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体图示,进一步阐述本发明。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
请参考图1所示,本发明公开一种可通过声纹识别进行报警综合处置管理***,该***包括:
词典场景语音模块1,适于对用户词汇表中的词典、场景语音依次进行采集,并将采集的特征矢量作为模版进行保存;
相似度比较模块2,适于将输入语音信号的特征矢量依次与所述词典场景语音模块中保存的每个特征矢量模版进行相似度比较,将相似度最高者作为语音识别结果输出;
语音识别引擎模块3,适于根据所述语音识别结果寻找一个词模型序列以描述语音输入信号,从而得到词解码序列,并根据转换后的词解码序列在报警管理数据库中搜索到各个子***中的目标信息。
本发明提供的可通过声纹识别进行报警综合处置管理***,通过相似度比较,在模版数据库中找出与输入人体语音波纹信号相似度最高的语音识别结果即相应的文本,并根据语音识别结果即相应的文本获得词解码序列,即将相应的文本转换成机器执行代码或命令进行执行查找,代替传统的通过人工手动操作来进行检索查找,因而能快速找到各个子***中的目标信息如目标视频、录像视频、报警地点等,工作效率高,智能化程度高,定位速度快,所以能更快满足用户对各个子***中的目标信息如目标视频、录像视频、报警地点等进行描述、辨认、检索、快速执行如拖拉播放的需要,从而能够将各个子***中的多个信息整合在一起进行整合分析。
作为具体实施例,所述词典场景语音模块1中的模版包括监控***术语模版和人体语音加词典模版,所述监控***术语模版中包括例如网络摄像机(IPC)、网络硬盘录像机(NVR)、出入口控制管理***等术语;所述人体语音加词典模版中包括例如"XX支行XX网点加钞间视频"等人体语音,即将语音智能识别分成两种识别库进行综合分析并转换成***可执行语言,由此可以提高语音识别的全面性和准确性。
作为具体实施例,所述相似度比较模块2适于将输入语音信号的特征矢量依次与所述词典场景语音模块中保存的每个特征矢量模版进行相似度比较,将相似度最高者作为语音识别结果输出;即所述相似度比较模块2处于识别学习阶段,对输入的人体语音波纹信号进行语言综合分析和语音库比对综合分析,得到与输入人体语音波纹信号相似度最高的相应文本。
作为具体实施例,所述语音识别引擎模块3中预设有词模型序列,当得到相似度最高的语音识别结果后,可根据该相似度最高的语音识别结果在所述语音识别引擎模块3中进行寻找,以找到一个能够准确描述语音输入信号的词模型序列,并将该词模型序列作为所述语音输入信号的词解码序列,并根据转换后的词解码序列在报警管理数据库中搜索到各个子***的目标信息如目标视频、录像视频、报警地点等。其中,通过语音识别引擎模块3搜索所依据的是对公式中的声学模型打分和语言模型打分,具体为:1、声韵调是适合汉语的音位***;2、声学模型所运用的语音特征要首先区分发音方法进而区分发音部位;3、在音节层面上就要利用语言模型。其主要是利用市面上成熟的语音识别引擎模块进行检索,通过所述语音识别引擎模块,可以将得到的相应文本转换成机器执行代码或命令进行执行查找,代替了传统的通过人工手动操作来进行检索查找等操作,因而能够快速查找和调用报警管理***中的各个子***如视频、地图、处置预案、附近工作人员以及现场防护设备等,能够快速将各个子***快速响应整合在一起,工作效率高,智能化程度高。
以上仅为本发明的实施方式,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构,直接或间接运用在其他相关的技术领域,均同理在本发明的专利保护范围之内。

Claims (3)

1.一种可通过声纹识别进行报警综合处置管理***,其特征在于,该***包括:
词典场景语音模块,适于对用户词汇表中的词典、场景语音依次进行采集,并将采集的特征矢量作为模版进行保存;
相似度比较模块,适于将输入语音信号的特征矢量依次与所述词典场景语音模块中保存的每个特征矢量模版进行相似度比较,将相似度最高者作为语音识别结果输出;
语音识别引擎模块,适于根据所述语音识别结果寻找一个词模型序列以描述语音输入信号,从而得到词解码序列,并根据转换后的词解码序列在报警管理数据库中搜索到各个子***中的目标信息。
2.根据权利要求1所述的可通过声纹识别进行报警综合处置管理***,其特征在于,所述词典场景语音模块中的模版包括监控***术语模版和人体语音加词典模版。
3.根据权利要求1所述的可通过声纹识别进行报警综合处置管理***,其特征在于,所述语音识别引擎模块中搜索所依据的是对公式中的声学模型打分和语言模型打分。
CN201510859779.7A 2015-11-30 2015-11-30 一种可通过声纹识别进行报警综合处置管理*** Pending CN105303794A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510859779.7A CN105303794A (zh) 2015-11-30 2015-11-30 一种可通过声纹识别进行报警综合处置管理***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510859779.7A CN105303794A (zh) 2015-11-30 2015-11-30 一种可通过声纹识别进行报警综合处置管理***

Publications (1)

Publication Number Publication Date
CN105303794A true CN105303794A (zh) 2016-02-03

Family

ID=55200995

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510859779.7A Pending CN105303794A (zh) 2015-11-30 2015-11-30 一种可通过声纹识别进行报警综合处置管理***

Country Status (1)

Country Link
CN (1) CN105303794A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107945471A (zh) * 2017-11-23 2018-04-20 郑州庭淼软件科技有限公司 一种基于语境语义分析技术的智能求助***
CN109243468A (zh) * 2018-11-14 2019-01-18 北京羽扇智信息科技有限公司 语音识别方法、装置、电子设备及存储介质
CN110010134A (zh) * 2019-04-17 2019-07-12 伍劲松 一种基于语音识别的安防***
CN110782625A (zh) * 2018-12-17 2020-02-11 北京嘀嘀无限科技发展有限公司 乘车安全报警方法、装置、电子设备及存储介质
CN110832409A (zh) * 2017-07-13 2020-02-21 三菱电机大楼技术服务株式会社 楼宇管理***以及楼宇管理装置
CN110838305A (zh) * 2019-11-15 2020-02-25 中国汽车工程研究院股份有限公司 基于声音识别的智能车辆adas预警测试方法和***
CN112489656A (zh) * 2020-11-30 2021-03-12 珠海格力电器股份有限公司 一种报警方法、装置、电子设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101158947A (zh) * 2006-09-22 2008-04-09 株式会社东芝 机器翻译的方法和装置
CN101179802A (zh) * 2007-11-23 2008-05-14 深圳华为通信技术有限公司 通信设备、网络设备以及报警方法
CN102411833A (zh) * 2011-08-02 2012-04-11 杭州威威网络科技有限公司 基于音频识别的联网报警装置
US20120249328A1 (en) * 2009-10-10 2012-10-04 Dianyuan Xiong Cross Monitoring Method and System Based on Voiceprint Recognition and Location Tracking
CN103150876A (zh) * 2013-02-04 2013-06-12 长春凤凰惠邦科技有限责任公司 一种语音报警定位方法
CN104392721A (zh) * 2014-11-28 2015-03-04 东莞中国科学院云计算产业技术创新与育成中心 基于语音识别的智能应急指挥***及其语音识别方法
CN104462262A (zh) * 2014-11-21 2015-03-25 北京奇虎科技有限公司 一种实现语音搜索的方法、装置和浏览器客户端
CN105096940A (zh) * 2015-06-30 2015-11-25 百度在线网络技术(北京)有限公司 用于进行语音识别的方法和装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101158947A (zh) * 2006-09-22 2008-04-09 株式会社东芝 机器翻译的方法和装置
CN101179802A (zh) * 2007-11-23 2008-05-14 深圳华为通信技术有限公司 通信设备、网络设备以及报警方法
US20120249328A1 (en) * 2009-10-10 2012-10-04 Dianyuan Xiong Cross Monitoring Method and System Based on Voiceprint Recognition and Location Tracking
CN102411833A (zh) * 2011-08-02 2012-04-11 杭州威威网络科技有限公司 基于音频识别的联网报警装置
CN103150876A (zh) * 2013-02-04 2013-06-12 长春凤凰惠邦科技有限责任公司 一种语音报警定位方法
CN104462262A (zh) * 2014-11-21 2015-03-25 北京奇虎科技有限公司 一种实现语音搜索的方法、装置和浏览器客户端
CN104392721A (zh) * 2014-11-28 2015-03-04 东莞中国科学院云计算产业技术创新与育成中心 基于语音识别的智能应急指挥***及其语音识别方法
CN105096940A (zh) * 2015-06-30 2015-11-25 百度在线网络技术(北京)有限公司 用于进行语音识别的方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
杜卫卫: ""英语翻译器语音识别***设计及其应用"", 《电子测试》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110832409A (zh) * 2017-07-13 2020-02-21 三菱电机大楼技术服务株式会社 楼宇管理***以及楼宇管理装置
CN110832409B (zh) * 2017-07-13 2024-01-30 三菱电机楼宇解决方案株式会社 楼宇管理***以及楼宇管理装置
CN107945471A (zh) * 2017-11-23 2018-04-20 郑州庭淼软件科技有限公司 一种基于语境语义分析技术的智能求助***
CN109243468A (zh) * 2018-11-14 2019-01-18 北京羽扇智信息科技有限公司 语音识别方法、装置、电子设备及存储介质
CN110782625A (zh) * 2018-12-17 2020-02-11 北京嘀嘀无限科技发展有限公司 乘车安全报警方法、装置、电子设备及存储介质
CN110010134A (zh) * 2019-04-17 2019-07-12 伍劲松 一种基于语音识别的安防***
CN110838305A (zh) * 2019-11-15 2020-02-25 中国汽车工程研究院股份有限公司 基于声音识别的智能车辆adas预警测试方法和***
CN110838305B (zh) * 2019-11-15 2022-03-18 中国汽车工程研究院股份有限公司 基于声音识别的智能车辆adas预警测试方法和***
CN112489656A (zh) * 2020-11-30 2021-03-12 珠海格力电器股份有限公司 一种报警方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN105303794A (zh) 一种可通过声纹识别进行报警综合处置管理***
CN108399923B (zh) 多人发言中发言人识别方法以及装置
Ntalampiras et al. On acoustic surveillance of hazardous situations
CN104078044B (zh) 移动终端及其录音搜索的方法和装置
Manocha et al. Content-based representations of audio using siamese neural networks
CN103198838A (zh) 一种用于嵌入式***的异常声音监控方法和监控装置
JP2022545342A (ja) オーディオシーン認識のためのシーケンスモデル
CN110689906A (zh) 一种基于语音处理技术的执法检测方法及***
CN111581348A (zh) 一种基于知识图谱的查询分析***
Gandhe et al. Using web text to improve keyword spotting in speech
Bai et al. High-resolution attention network with acoustic segment model for acoustic scene classification
CN105338327A (zh) 一种可通过语音识别的视频监控联网***
US20200143823A1 (en) Methods and devices for obtaining an event designation based on audio data
CN206553008U (zh) 一种语音识别紧急求助***
Lecouteux et al. Combined low level and high level features for out-of-vocabulary word detection
Ramabhadran et al. Fast decoding for open vocabulary spoken term detection
CN114627581A (zh) 一种智能门锁的胁迫指纹联动报警方法及***
Wang et al. The DKU-Duke-Lenovo system description for the third DIHARD speech diarization challenge
Chandra et al. Keyword spotting: an audio mining technique in speech processing–a survey
Pálfy et al. Pattern search in dysfluent speech
Lin et al. SVM-based sound classification based on MPEG-7 audio LLDs and related enhanced features
Zhu et al. Sensitive keyword spotting for voice alarm systems
Norouzian et al. Facilitating open vocabulary spoken term detection using a multiple pass hybrid search algorithm
CN113506584B (zh) 数据处理方法以及设备
CN107945471A (zh) 一种基于语境语义分析技术的智能求助***

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20160203