CN111784947A - 一种基于图像与声纹的主动预警方法、***和设备 - Google Patents

一种基于图像与声纹的主动预警方法、***和设备 Download PDF

Info

Publication number
CN111784947A
CN111784947A CN202010661932.6A CN202010661932A CN111784947A CN 111784947 A CN111784947 A CN 111784947A CN 202010661932 A CN202010661932 A CN 202010661932A CN 111784947 A CN111784947 A CN 111784947A
Authority
CN
China
Prior art keywords
information
voiceprint
image
dangerous
early warning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010661932.6A
Other languages
English (en)
Inventor
李旭滨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Maosheng Intelligent Technology Co ltd
Original Assignee
Shanghai Maosheng Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Maosheng Intelligent Technology Co ltd filed Critical Shanghai Maosheng Intelligent Technology Co ltd
Priority to CN202010661932.6A priority Critical patent/CN111784947A/zh
Publication of CN111784947A publication Critical patent/CN111784947A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08BSIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
    • G08B21/00Alarms responsive to a single specified undesired or abnormal condition and not otherwise provided for
    • G08B21/02Alarms for ensuring the safety of persons
    • G08B21/0202Child monitoring systems using a transmitter-receiver system carried by the parent and the child
    • G08B21/0205Specific application combined with child monitoring using a transmitter-receiver system
    • G08B21/0208Combination with audio or video communication, e.g. combination with "baby phone" function
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • GPHYSICS
    • G08SIGNALLING
    • G08BSIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
    • G08B21/00Alarms responsive to a single specified undesired or abnormal condition and not otherwise provided for
    • G08B21/02Alarms for ensuring the safety of persons
    • G08B21/0202Child monitoring systems using a transmitter-receiver system carried by the parent and the child
    • G08B21/0233System arrangements with pre-alarms, e.g. when a first distance is exceeded
    • GPHYSICS
    • G08SIGNALLING
    • G08BSIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
    • G08B3/00Audible signalling systems; Audible personal calling systems
    • G08B3/10Audible signalling systems; Audible personal calling systems using electric transmission; using electromagnetic transmission
    • G08B3/1008Personal calling arrangements or devices, i.e. paging systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/02Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Child & Adolescent Psychology (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Business, Economics & Management (AREA)
  • Emergency Management (AREA)
  • Social Psychology (AREA)
  • Psychiatry (AREA)
  • Theoretical Computer Science (AREA)
  • Electromagnetism (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Alarm Systems (AREA)

Abstract

本申请涉及一种基于图像与声纹的主动预警方法、***及设备,其中,该主动预警方法包括识别图像信息以及声纹信息;在图像信息包括预设危险行为和/或声纹信息包括预设声纹特征的情况下,发送预警呼叫指令;基于预警呼叫指令,形成预警呼叫信息,其中,预警呼叫信息包括危险事件信息、危险事件信息发生时间、危险事件信息发生地点、危险人员信息、危险人员实时位置。通过本申请,解决了人员逃避监控拍摄、时效延后性高、出现监控遗漏的问题,实现了图像与声纹双重自动识别、基于预警呼叫信息自动呼叫的技术效果。

Description

一种基于图像与声纹的主动预警方法、***和设备
技术领域
本申请涉及监控预警技术领域,特别是涉及一种基于图像与声纹的主动预警方法、***和设备。
背景技术
为了提高对公共区域或人流密集区域发生违法犯罪事件的响应度,通常会在公共区域、人流密集区域设置多路图像监控设备,以获取公共区域、人流密集区域的实时图像信息,并通过监控中心的监控大屏进行实时监控,以便在出现违法犯罪事件的情况下,及时向位于出现违法犯罪事件地点附近的安保人员发送通知,以便安保人员赶往相关地点,从而解决相关问题。
然而,上述监控方法具有一定的缺陷:
1)图像监控设备具有一定的盲区,违法犯罪人员或危险人员信息会通过戴帽子、戴口罩的方式遮挡面部,以避免图像监控设备获取其图像信息;
2)具有一定的时效延后性,从图像监控设备传输的实时图像信息判断违法犯罪行为,到通知调度相关地点附近的安保人员,当安保人员抵达相关地点时,违法犯罪事件已经发生甚至已经完成,导致无辜人员受到侵害;
3)图像监控设备数量繁多,监控人员无法同一时刻观察到每一个图像监控设备传输的实时图像信息,导致出现遗漏、忽略等问题。
因此,针对相关技术中人员逃避监控拍摄、时效延后性高、出现监控遗漏等问题,尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种基于图像与声纹的主动预警方法、***和设备,以至少解决相关技术中人员逃避监控拍摄、时效延后性高、出现监控遗漏等问题。
第一方面,本申请实施例提供了一种基于图像与声纹的主动预警方法,包括:
识别图像信息以及声纹信息;
在所述图像信息包括预设危险行为和/或所述声纹信息包括预设声纹特征的情况下,发送预警呼叫指令;
基于所述预警呼叫指令,形成预警呼叫信息,其中,所述预警呼叫信息包括危险事件信息、危险事件信息发生时间、危险事件信息发生地点、危险人员信息、危险人员实时位置。
在其中的一些实施例中,在形成预警呼叫信息之后,所述方法还包括:
将所述预警呼叫信息发送至预设范围内的至少一个呼叫终端,其中,所述预设范围指以所述危险事件信息发生地点和/或所述危险人员实时位置为中心、以预设距离为半径的范围;
获取至少一个所述呼叫终端的与所述预警呼叫信息相对应的出警信息,其中,所述出警信息包括出警人员、出警人员实时位置;
基于所述危险事件信息发生地点和/或所述危险人员实时位置、所述出警人员实时位置,生成动态路径信息。
在其中的一些实施例中,基于所述危险事件信息发生地点和所述出警人员实时位置,生成第一动态路径信息。
在其中的一些实施例中,基于所述危险人员实时位置和所述出警人员实时位置,生成第二动态路径信息。
在其中的一些实施例中,识别图像信息包括:
将图像信息输入至行为模型,以生成行为信息,其中,所述行为信息包括人员信息、动作信息;
在所述行为信息为预设危险行为和/或所述人员信息为预设危险人员信息的情况下,持续获取预设时间段的包括所述人员信息的若干图像信息,以生成图像流信息。
在其中的一些实施例中,识别声纹信息包括:
提取声纹信息的声纹特征;
将所述声纹特征输入至声纹库;
在所述声纹特征与所述声纹库中的一预设声纹特征匹配的情况下,将所述声纹信息与所述预设声纹特征对应的属性信息关联,其中,所述属性信息包括危险人员信息、危险行为信息。
在其中的一些实施例中,在所述声纹特征与所述声纹库中的一预设声纹特征匹配的情况下,基于所述声纹特征,更新所述声纹库。
在其中的一些实施例中,所述声纹特征至少为以下之一:能量特征、谐波噪声比特征、梅尔倒谱系数特征。
第二方面,本申请实施例提供了一种基于图像与声纹的主动预警***,包括:
若干图像采集设备,用于获取不同位置的图像信息;
若干声纹采集设备,用于获取不同位置的声纹信息;
图像识别单元,与若干所述图像采集设备连接,用于识别若干所述图像设备传输的所述图像信息,以生成图像识别信息,其中,所述图像识别信息用于指示所述图像信息是否包括预设危险行为;
声纹识别单元,与若干声纹采集设备连接,用于识别若干所述声纹采集设备传输的所述声纹信息,以生成声纹识别信息,其中,所述声纹识别信息用于指示所述声纹信息是否包括预设声纹特征;
指令单元,与所述图像识别单元、声纹识别单元连接,用于在所述图像信息包括所述预设危险行为和/或所述声纹信息包括预设声纹特征的情况下,生成预警呼叫指令
呼叫服务器,与所述指令单元连接,用于基于所述预警呼叫指令形成预警呼叫信息,其中,所述预警呼叫信息包括危险事件信息、危险事件信息发生时间、危险事件信息发生地点、危险人员信息、危险人员实时位置;
若干呼叫终端,与所述呼叫服务器连接,用于接收所述呼叫服务器传输的所述预警呼叫信息。
在其中的一些实施例中,还包括:
位置计算单元,与所述呼叫服务器连接,用于以所述危险事件信息发生地点和/或所述危险人员实时位置为中心、以预设距离为半径生成预设范围;
所述呼叫服务器用于将所述预警呼叫信息发送至所述预设范围内的至少一个所述呼叫终端。
在其中的一些实施例中,还包括:
监控单元,所述监控单元分别与若干所述图像采集设备、若干所述声纹采集设备、所述图像识别单元、所述声纹识别单元、所述指令单元、所述呼叫服务器、若干所述呼叫终端连接,用于监控若干所述图像采集设备传输的所述图像信息以及若干所述声纹采集设备传输的所述声纹信息,以及用于获取所述图像识别单元传输的所述图像识别信息、获取所述声纹识别单元传输的所述声纹识别信息、获取所述指令单元传输的所述预警呼叫指令、获取所述呼叫服务器传输的所述预警呼叫信息,以及用于向若干所述呼叫终端传输所述预警呼叫信息。
第三方面,本申请实施例提供了一种计算机设备,包括:
至少一个处理器;
以及与所述至少一个处理器通信连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器执行第一方面所述的基于图像与声纹的主动预警方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现如第一方面所述的基于图像与声纹的主动预警方法。
相比于相关技术,本申请实施例提供的一种基于图像与声纹的主动预警方法、***及设备,通过识别图像信息以及声纹信息;在图像信息包括预设危险行为和/或声纹信息包括预设声纹特征的情况下,发送预警呼叫指令;基于预警呼叫指令,形成预警呼叫信息,其中,预警呼叫信息包括危险事件信息、危险事件信息发生时间、危险事件信息发生地点、危险人员信息、危险人员实时位置,解决了人员逃避监控拍摄、时效延后性高、出现监控遗漏的问题,实现了图像与声纹双重自动识别、基于预警呼叫信息自动呼叫的技术效果。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的主动预警***的结构框图(一);
图2是根据本申请实施例的主动预警***的结构框图(二);
图3是根据本申请实施例的主动预警***的结构框图(三);
图4是根据本申请实施例的主动预警方法的流程图(一);
图5是根据本申请实施例的主动预警方法的流程图(二);
图6是根据本申请实施例的主动预警方法的流程图(三);
图7是根据本申请实施例的主动预警方法的流程图(四)。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行描述和说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本申请提供的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
显而易见地,下面描述中的附图仅仅是本申请的一些示例或实施例,对于本领域的普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图将本申请应用于其他类似情景。此外,还可以理解的是,虽然这种开发过程中所作出的努力可能是复杂并且冗长的,然而对于与本申请公开的内容相关的本领域的普通技术人员而言,在本申请揭露的技术内容的基础上进行的一些设计,制造或者生产等变更只是常规的技术手段,不应当理解为本申请公开的内容不充分。
在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是,本申请所描述的实施例在不冲突的情况下,可以与其它实施例相结合。
除非另作定义,本申请所涉及的技术术语或者科学术语应当为本申请所属技术领域内具有一般技能的人士所理解的通常意义。本申请所涉及的“一”、“一个”、“一种”、“该”等类似词语并不表示数量限制,可表示单数或复数。本申请所涉及的术语“包括”、“包含”、“具有”以及它们任何变形,意图在于覆盖不排他的包含;例如包含了一系列步骤或模块(单元)的过程、方法、***、产品或设备没有限定于已列出的步骤或单元,而是可以还包括没有列出的步骤或单元,或可以还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。本申请所涉及的“连接”、“相连”、“耦接”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电气的连接,不管是直接的还是间接的。本申请所涉及的“多个”是指两个或两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。本申请所涉及的术语“第一”、“第二”、“第三”等仅仅是区别类似的对象,不代表针对对象的特定排序。
图1是根据本申请实施例的主动预警***的结构框图(一)。如图1所示,主动预警***100包括若干图像采集设备110、若干声纹采集设备120、图像识别单元130、声纹识别单元140、指令单元150、呼叫服务器160和若干呼叫终端170。其中,图像识别单元130分别与若干图像采集设备110通信连接,声纹识别单元140分别与若干声纹采集设备120通信连接,指令单元150分别与图像识别单元130、声纹识别单元140、呼叫服务器160通信连接,呼叫服务器160分别与若干呼叫终端170通信连接。
若干图像采集设备110安装于不同位置,用于实时获取不同位置的图像信息。在一些实施例中,图像采集设备110可以是监控摄像装置,也可以是抓拍装置。
若干声纹采集设备120安装于不同位置,用于实时获取不同位置的声纹信息。
在一些实施例中,在同一位置可以同时安装图像采集设备110和声纹采集设备120,可以仅安装图像采集设备110或声纹采集设备120。在该主动预警***中,可以通过声纹采集设备120的安装,以解决图像采集设备110具有监控盲区的问题。
图像识别单元130与若干图像采集设备110通信连接,用于对若干图像采集设备110传输的图像信息进行识别,以生成图像识别信息,其中,图像识别信息用于指示图像信息是否包括预设危险行为。
在一些实施例中,图像识别单元130可以是单独的图像识别服务器,也可以是能够进行图像识别的云平台。
声纹识别单元140与若干声纹采集设备120通信连接,用于对若干声纹采集设备120传输的声纹信息进行识别,以生成声纹识别信息,其中,声纹识别信息用于指示声纹信息是否包括预设声纹特征。
在一些实施例中,声纹识别单元140可以是单独的声纹识别服务器,也可以是能够进行声纹识别的云平台。
指令单元150获取图像识别单元130传输的图像识别信息以及获取声纹识别单元140传输的声纹识别信息,并且在图像信息包括预设危险行为和/或声纹信息包括预设声纹特征的情况下,生成预警呼叫指令。
在一些实施例中,指令单元150可以与图像识别单元130集成在一起,以及指令单元150可以与声纹识别单元140集成在一起。即指令单元150为两个,分别与图像识别单元130、声纹识别单元140集成。
呼叫服务器160用于获取指令单元150传输的预警呼叫指令,并基于预警呼叫指令形成预警呼叫信息,其中,预警呼叫信息包括危险事件信息、危险事件信息发生时间、危险事件信息发生地点、危险人员信息、危险人员实时位置。
在一些实施例中,指令单元150与呼叫服务器160可以集成在一起。
呼叫服务器160将预警呼叫信息发送至若干呼叫终端170,以使装配有呼叫终端170的安保人员根据预警呼叫信息前往危险事件发生地点或危险人员实时位置。
在其中一些实施例中,呼叫终端170可以是智能手机、智能平板、对讲机等设备。
呼叫终端170还用于生成与预警呼叫信息相对应的出警信息,其中,出警信息包括出警人员、出警人员实时位置。
通信连接通过网络进行连接,可以是有线网络连接,也可以是无线网络连接。在其中的一些实施例中,网络可以包括公共网络(例如,因特网)、专用网络(例如,局域网(LAN)、广域网(WAN)等)、无线网络(例如,802.11网络、Wi-Fi网络等)、蜂窝网络(例如,4G网络、5G网络等)、帧中继网络、虚拟专用网络(VPN)、卫星网络、路由器、集线器、交换机、服务器等或者其任意组合。仅作为示例,网络可包括电缆网络、有线网络、光纤网络、电信网络、内联网、无线局域网(WLAN)、城域网(MAN)、公共电话交换网(PSTN)等或者其任意组合。在一些实施例中,网络可包括一个或多个网络接入点。例如,网络可包括有线和/或无线网络接入点,诸如基站和/或因特网交换点,主动预警***100的各个装置可通过这些接入点连接到网络以交换信息和/或数据。
在相关技术中,通过工作人员进行人工监控,容易出现监控盲区、时效延后性高、监控遗漏等问题。通过本实施例的图像识别单元和声纹识别单元,可以自动对图像信息和声纹信息进行识别,从而自动形成预警呼叫指令以及预警呼叫信息,并通过呼叫服务器主动向若干呼叫终端发送预警呼叫信息,解决了监控盲区、时效延后性以及监控遗漏等问题。
图2是根据本申请实施例的主动预警***的结构框图(二)。如图2所述,主动预警***100还包括位置计算单元180,位置计算单元180与呼叫服务器160通信连接。
位置计算单元180用于提取预警呼叫信息中的危险事件发生地点和危险人员实时位置,并以危险事件发生地点和/或危险人员实时位置为中心、预设距离为半径生成预设范围。
基于预设范围,呼叫服务器160将预警呼叫信息发送至处于预设范围内的若干呼叫终端170。
在本实施例中,通过设置预设范围,减少呼叫服务器160传输量,使预设范围内的装配有呼叫终端170的安保人员能够快速前往危险事件发生地点和/或危险人员实时位置,扼杀危险事件苗头或制止危险事件。
图3是根据本申请实施例的主动预警***的结构框图(三)。如图3所述,主动预警***100还包括监控单元190,监控单元190分别与若干图像采集设备110、若干声纹采集设备120、图像识别单元130、声纹识别单元140、指令单元150、呼叫服务器160、若干呼叫终端170通信连接。
监控单元190用于监控若干图像采集设备110传输的图像信息以及若干声纹采集设备120传输的声纹信息,以及用于获取图像识别单元130传输的图像识别信息、获取声纹识别单元140传输的声纹识别信息、获取指令单元150传输的预警呼叫指令、获取呼叫服务器160传输的预警呼叫信息,以及用于向若干呼叫终端170传输预警呼叫信息。
在一些实施例中,监控单元190为监控中心或监控大屏。
在该实施例中,通过人工识别和自动识别,解决了监控盲区、时效延后性以及监控遗漏等问题,实现了监控无盲区、时效性强、无监控遗漏的技术效果。
此外,主动预警***100还包括路径生成单元,路径生成单元与呼叫服务器160、若干呼叫终端170、监控单元190通信连接,用于基于预警呼叫信息和出警信息生成动态路径信息。
在其中的一些实施例中,路径生成单元基于危险事件发生地点和出警人员实时位置,生成第一动态路径信息,并将第一动态路径信息发送至监控单元190进行显示。
在其中的一些实施例中,路径生成单元基于危险人员实时位置和出警人员实时位置,生成第二动态路径信息,并将第二动态路径信息发送至监控单元190进行显示。
通过本实施例的路径生成单元,能够在监控单元中实时显示危险人员和出警人员的实时位置信息,便于监控工作人员实时了解相关情况。
在其中的一些实施例中,在图像识别信息指示图像信息包括预设危险行为的情况下,基于预警呼叫信息中的危险人员信息,若干图像采集设备110持续获取预设时间段的包括危险人员信息的图像信息,并生成图像流信息。
具体地,通过人脸追踪的方式获取关于危险人员的一定时间段的视频信息,以便安保人员和监控人员实时掌握危险人员的行踪。
图4是根据本申请实施例的主动预警方法的流程图(一)。如图4所述,主动预警方法包括:
步骤S402,识别图像信息以及声纹信息;
步骤S404,在图像信息包括预设危险行为和/或声纹信息包括预设声纹特征的情况下,发送预警呼叫指令;
步骤S406,基于预警呼叫指令,形成预警呼叫信息,其中,预警呼叫信息包括危险事件信息、危险事件发生时间、危险事件发生地点、危险人员信息、危险人员实时位置。
在其中的一些实施例中,通过识别图像采集设备传输的图像信息以获得图像识别信息,用于指示图像信息是否包括预设危险行为。其中,图像识别信息可以以文本形式呈现,也可以以图像形式呈现。在以文本形式呈现时,图像识别信息为包括预设危险行为或不包括预设危险行为;在以图像形式呈现时,图像识别信息为原有的图像信息(即不包括预设危险行为)或在原有的图像信息的基础上进行标注(即包括预设危险行为)。具体地,在原有的图像信息的基础上进行标注包括圈出危险人员、圈出受害人员等。
在其中的一些实施例中,通过识别声纹采集设备传输的声纹信息以获得声纹识别信息,用于指示声纹信息是否包括预设声纹特征。其中,声纹识别信息可以以文本形式呈现,也可以以声纹形式呈现。在以文本形式呈现时,声纹识别信息为包括预设声纹特征或不包括预设声纹特征;在以声纹形式呈现时,声纹识别信息为原有的声纹信息(即不包括预设声纹特征)或在原有的声纹信息的基础上进行标注(即包括预设声纹特征)。具体地,在原有的声纹信息的基础上进行标注包括圈出关键声纹特征等。
在相关技术中,通过工作人员进行人工监控,容易出现监控盲区、时效延后性高、监控遗漏等问题。通过本实施例的自动识别图像信息和声纹信息,可以自动形成预警呼叫指令以及预警呼叫信息,并通过呼叫服务器主动向若干呼叫终端发送预警呼叫信息,解决了监控盲区、时效延后性以及监控遗漏等问题。
图5是根据本申请实施例的主动预警方法的流程图(二)。如图5所述,在形成预警呼叫信息之后,还包括:
步骤S502,将预警呼叫信息发送至预设范围内的至少一个呼叫终端,其中,预设范围指以危险事件发生地点和/或危险人员实时位置为中心、以预设距离为半径的范围;
步骤S504,获取至少一个呼叫终端的与预警呼叫信息相对应的出警信息,其中,出警信息包括出警人员、出警人员实时位置;
步骤S506,基于危险事件发生地点和/或危险人员实时位置、出警人员实时位置,生成动态路径信息。
其中,预设距离为200m~1000m。
在其中的一些实施例中,在一些极端情况下,如在预设范围内没有呼叫终端的情况下,通常会在原有的预设距离的基础上增加至少200m,以扩大预设范围的覆盖面积,从而找到距离危险事件发生地点和/或危险人员实时位置最近的呼叫终端。
在其中的一些实施例中,由于危险人员实时位置会发生动态变化,因此,会不断更新预设范围,从而确保至少有一个装配有呼叫终端的安保人员与危险人员实时位置之间的距离最小。
在其中的一些实施例中,呼叫终端在接收预警呼叫信息后,会基于自身状态,决定是否生成出警信息。如装配有呼叫终端的安保人员正在处理其他事务,在其呼叫终端接收预警呼叫信息后,安保人员不会出警,因此,不会生成出警信息。
在其中的一些实施例中,基于危险事件发生地点和出警人员实时位置,生成第一动态路径信息;基于危险人员实时位置和出警人员实时位置,生成第二动态路径信息。通过第一动态路径信息和第二动态路径信息,可以确保至少有一个装配有呼叫终端的安保人员前往危险事件发生地点,以及至少有一个装配有呼叫终端的安保人员追踪危险人员。
在相关技术中,在危险行为发生的情况下,监控工作人员一般会进行全局呼叫,以使全部的呼叫终端接收预警信息,会导致传输预警信息的精确度低,且会占用大量的网络带宽。通过本实施例的向预设范围内的呼叫终端发送预警呼叫信息,可以提高传输精确度,减少网络带宽的占用,以使距离危险事件发生地点或危险人员实时位置最近的装配有呼叫终端的安保人员及时快速地前往。
图6是根据本申请实施例的主动预警方法的流程图(三)。如图6所示,识别图像信息包括:
步骤S602,将图像信息输入至行为模型,以生成行为信息,其中,行为信息包括人员信息、动作信息;
步骤S604,在行为信息为预设危险行为和/或人员信息为预设危险人员的情况下,持续获取预设时间段的包括人员信息的若干图像信息,以生成图像流信息。
其中,人员信息包括正常人员信息和通缉人员信息,动作信息包括打架、斗殴、摔跤等动作。
在其中的一些实施例中,行为模型是基于深度神经网络模型构建的,通过输入大量的包括危险行为的图像信息、不包括危险行为的图像信息以及相关人员信息(如通缉犯图像信息)进行训练,以提高识别准确率。
在其中的一些实施例中,预设时间段为5min~30min。通过5min~30min的图像流信息,可以持续监控危险行为或危险人员,便于实时获取具体情况。
图7是根据本申请实施例的主动预警方法的流程图(四)。如图7所示,识别声纹信息包括:
步骤S702,提取声纹信息的声纹特征;
步骤S704,将声纹特征输入至声纹库;
步骤S706,在声纹特征与声纹库中的一预设声纹特征匹配的情况下,将声纹信息与预设声纹特征对应的属性信息关联,其中,属性信息包括危险人员信息、危险行为信息。
其中,声纹库存储有若干危险人员的声纹特征、危险行为的声纹特征、受害人员的声纹特征,包括但不限于大喊大叫、呼救、哭泣等声纹特征。
在其中的一些实施例中,基于输入的声纹特征,在声纹库中进行检索比对。若声纹库返回的检索结果为无或空,即表明该声纹特征为正常的声纹特征;若声纹库返回的检索结果为非空,则选择相似度最高或匹配度最高的预设声纹特征,从而判断声纹信息属于何种情况。
在其中的一些实施例中,声纹特征包括能量特征、谐波噪声比特征、梅尔倒谱系数特征中的至少一个。
具体地,根据不同的应用环境,可以仅提取声纹信息的能量特征,可以仅提取声纹信息的谐波噪声比特征,可以仅提取声纹信息的梅尔倒谱系数特征。
通过本实施例的对声纹信息提取声纹特征,可以快速对获取的声纹信息进行判断并赋予属性信息,能够辅助识别图像信息,进而更精准快速地对危险行为、危险人员进行定位,解决了相关技术中存在监控盲区、时效延迟性高的问题。
另外,本申请实施例的主动预警方法可以由计算机设备来实现。计算机设备的组件可以包括但不限于处理器以及存储有计算机程序指令的存储器。
在一些实施例中,处理器可以包括中央处理器(CPU),或者特定集成电路(ApplicationSpecificIntegratedCircuit,简称为ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
在一些实施例中,存储器可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器可包括硬盘驱动器(HardDiskDrive,简称为HDD)、软盘驱动器、固态驱动器(SolidStateDrive,简称为SSD)、闪存、光盘、磁光盘、磁带或通用串行总线(UniversalSerialBus,简称为USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器可在数据处理装置的内部或外部。在特定实施例中,存储器是非易失性(Non-Volatile)存储器。在特定实施例中,存储器包括只读存储器(Read-OnlyMemory,简称为ROM)和随机存取存储器(RandomAccessMemory,简称为RAM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(ProgrammableRead-OnlyMemory,简称为PROM)、可擦除PROM(ErasableProgrammableRead-OnlyMemory,简称为EPROM)、电可擦除PROM(ElectricallyErasableProgrammableRead-Only Memory,简称为EEPROM)、电可改写ROM(ElectricallyAlterableRead-Only Memory,简称为EAROM)或闪存(FLASH)或者两个或更多个以上这些的组合。在合适的情况下,该RAM可以是静态随机存取存储器(StaticRandom-Access Memory,简称为SRAM)或动态随机存取存储器(DynamicRandomAccess Memory,简称为DRAM),其中,DRAM可以是快速页模式动态随机存取存储器(FastPageModeDynamicRandomAccessMemory,简称为FPMDRAM)、扩展数据输出动态随机存取存储器(ExtendedDateOutDynamicRandomAccess Memory,简称为EDODRAM)、同步动态随机存取内存(SynchronousDynamic Random-AccessMemory,简称SDRAM)等。
存储器可以用来存储或者缓存需要处理和/或通信使用的各种数据文件,以及处理器所执行的可能的计算机程序指令。
处理器通过读取并执行存储器中存储的计算机程序指令,以实现上述实施例中的任意一种主动预警方法。
在其中一些实施例中,计算机设备还可包括通信接口和总线。其中,处理器、存储器、通信接口通过总线连接并完成相互间的通信。
通信接口用于实现本申请实施例中各模块、装置、单元和/或设备之间的通信。通信接口还可以实现与其他部件例如:外接设备、图像/数据采集设备、数据库、外部存储以及图像/数据处理工作站等之间进行数据通信。
总线包括硬件、软件或两者,将计算机设备的部件彼此耦接在一起。总线包括但不限于以下至少之一:数据总线(DataBus)、地址总线(AddressBus)、控制总线(ControlBus)、扩展总线(ExpansionBus)、局部总线(LocalBus)。举例来说而非限制,总线可包括图形加速接口(AcceleratedGraphicsPort,简称为AGP)或其他图形总线、增强工业标准架构(ExtendedIndustryStandard Architecture,简称为EISA)总线、前端总线(FrontSideBus,简称为FSB)、超传输(HyperTransport,简称为HT)互连、工业标准架构(IndustryStandardArchitecture,简称为ISA)总线、无线带宽(InfiniBand)互连、低引脚数(Low PinCount,简称为LPC)总线、存储器总线、微信道架构(MicroChannel Architecture,简称为MCA)总线、***组件互连(PeripheralComponent Interconnect,简称为PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SerialAdvancedTechnologyAttachment,简称为SATA)总线、视频电子标准协会局部(VideoElectronicsStandardsAssociationLocalBus,简称为VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。
该计算机设备可以执行本申请实施例中的主动预警方法。
另外,结合上述实施例中的主动预警方法,本申请实施例可提供一种计算机可读存储介质来实现。该计算机可读存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种主动预警方法。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种基于图像与声纹的主动预警方法,其特征在于,包括:
识别图像信息以及声纹信息;
在所述图像信息包括预设危险行为和/或所述声纹信息包括预设声纹特征的情况下,发送预警呼叫指令;
基于所述预警呼叫指令,形成预警呼叫信息,其中,所述预警呼叫信息包括危险事件信息、危险事件信息发生时间、危险事件信息发生地点、危险人员信息、危险人员实时位置。
2.根据权利要求1所述的基于图像与声纹的主动预警方法,其特征在于,在形成预警呼叫信息之后,所述方法还包括:
将所述预警呼叫信息发送至预设范围内的至少一个呼叫终端,其中,所述预设范围指以所述危险事件信息发生地点和/或所述危险人员实时位置为中心、以预设距离为半径的范围;
获取至少一个所述呼叫终端的与所述预警呼叫信息相对应的出警信息,其中,所述出警信息包括出警人员、出警人员实时位置;
基于所述危险事件信息发生地点和/或所述危险人员实时位置、所述出警人员实时位置,生成动态路径信息。
3.根据权利要求1所述的基于图像与声纹的主动预警方法,其特征在于,识别图像信息包括:
将图像信息输入至行为模型,以生成行为信息,其中,所述行为信息包括人员信息、动作信息;
在所述行为信息为预设危险行为和/或所述人员信息为预设危险人员信息的情况下,持续获取预设时间段的包括所述人员信息的若干图像信息,以生成图像流信息。
4.根据权利要求1所述的基于图像与声纹的主动预警方法,其特征在于,识别声纹信息包括:
提取声纹信息的声纹特征;
将所述声纹特征输入至声纹库;
在所述声纹特征与所述声纹库中的一预设声纹特征匹配的情况下,将所述声纹信息与所述预设声纹特征对应的属性信息关联,其中,所述属性信息包括危险人员信息、危险行为信息。
5.根据权利要求4所述的基于图像与声纹的主动预警方法,其特征在于,所述声纹特征至少为以下之一:能量特征、谐波噪声比特征、梅尔倒谱系数特征。
6.一种基于图像与声纹的主动预警***,其特征在于,包括:
若干图像采集设备,用于获取不同位置的图像信息;
若干声纹采集设备,用于获取不同位置的声纹信息;
图像识别单元,与若干所述图像采集设备连接,用于识别若干所述图像设备传输的所述图像信息,以生成图像识别信息,其中,所述图像识别信息用于指示所述图像信息是否包括预设危险行为;
声纹识别单元,与若干声纹采集设备连接,用于识别若干所述声纹采集设备传输的所述声纹信息,以生成声纹识别信息,其中,所述声纹识别信息用于指示所述声纹信息是否包括预设声纹特征;
指令单元,与所述图像识别单元、声纹识别单元连接,用于在所述图像信息包括所述预设危险行为和/或所述声纹信息包括预设声纹特征的情况下,生成预警呼叫指令
呼叫服务器,与所述指令单元连接,用于基于所述预警呼叫指令形成预警呼叫信息,其中,所述预警呼叫信息包括危险事件信息、危险事件信息发生时间、危险事件信息发生地点、危险人员信息、危险人员实时位置;
若干呼叫终端,与所述呼叫服务器连接,用于接收所述呼叫服务器传输的所述预警呼叫信息。
7.根据权利要求6所述的基于图像与声纹的主动预警***,其特征在于,还包括:
位置计算单元,与所述呼叫服务器连接,用于以所述危险事件信息发生地点和/或所述危险人员实时位置为中心、以预设距离为半径生成预设范围;
所述呼叫服务器用于将所述预警呼叫信息发送至所述预设范围内的至少一个所述呼叫终端。
8.根据权利要求6所述的基于图像与声纹的主动预警***,其特征在于,还包括:
监控单元,所述监控单元分别与若干所述图像采集设备、若干所述声纹采集设备、所述图像识别单元、所述声纹识别单元、所述指令单元、所述呼叫服务器、若干所述呼叫终端连接,用于监控若干所述图像采集设备传输的所述图像信息以及若干所述声纹采集设备传输的所述声纹信息,以及用于获取所述图像识别单元传输的所述图像识别信息、获取所述声纹识别单元传输的所述声纹识别信息、获取所述指令单元传输的所述预警呼叫指令、获取所述呼叫服务器传输的所述预警呼叫信息,以及用于向若干所述呼叫终端传输所述预警呼叫信息。
9.一种计算机设备,其特征在于,包括:
至少一个处理器;
以及与所述至少一个处理器通信连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器执行权利要求1至5中任一项所述的基于图像与声纹的主动预警方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现如权利要求1~5中任一项所述的基于图像与声纹的主动预警方法。
CN202010661932.6A 2020-07-10 2020-07-10 一种基于图像与声纹的主动预警方法、***和设备 Pending CN111784947A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010661932.6A CN111784947A (zh) 2020-07-10 2020-07-10 一种基于图像与声纹的主动预警方法、***和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010661932.6A CN111784947A (zh) 2020-07-10 2020-07-10 一种基于图像与声纹的主动预警方法、***和设备

Publications (1)

Publication Number Publication Date
CN111784947A true CN111784947A (zh) 2020-10-16

Family

ID=72767177

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010661932.6A Pending CN111784947A (zh) 2020-07-10 2020-07-10 一种基于图像与声纹的主动预警方法、***和设备

Country Status (1)

Country Link
CN (1) CN111784947A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112907809A (zh) * 2021-01-29 2021-06-04 深圳市兴海物联科技有限公司 一种管理方法、***、设备及计算机存储介质
CN114845026A (zh) * 2022-05-02 2022-08-02 北京万合恒安科技有限公司 一种基于大数据的动态监控通讯装置及其使用方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102622818A (zh) * 2011-01-26 2012-08-01 北京海鑫智圣技术有限公司 一种银行atm机全方位智能监控方法
CN105679313A (zh) * 2016-04-15 2016-06-15 福建新恒通智能科技有限公司 一种音频识别报警***及方法
CN106713868A (zh) * 2017-01-03 2017-05-24 捷开通讯(深圳)有限公司 一种监控随机目标的方法及***
CN108010289A (zh) * 2017-12-28 2018-05-08 深圳市永达电子信息股份有限公司 一种基于声纹识别的互联网报警方法及***
CN108257362A (zh) * 2018-01-11 2018-07-06 广州广大声像灯光科技有限公司 基于gis的交互式电子治安警察警备方法、***及装置
CN109598885A (zh) * 2018-12-21 2019-04-09 广东中安金狮科创有限公司 监控***及其报警方法
CN110675585A (zh) * 2019-09-23 2020-01-10 北京华毅东方展览有限公司 一种展会安全控制***
CN110830771A (zh) * 2019-11-11 2020-02-21 广州国音智能科技有限公司 智能监控方法、装置、设备及计算机可读存储介质
CN110992609A (zh) * 2019-11-11 2020-04-10 云知声智能科技股份有限公司 一种基于声纹检测的自动呼救***及方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102622818A (zh) * 2011-01-26 2012-08-01 北京海鑫智圣技术有限公司 一种银行atm机全方位智能监控方法
CN105679313A (zh) * 2016-04-15 2016-06-15 福建新恒通智能科技有限公司 一种音频识别报警***及方法
CN106713868A (zh) * 2017-01-03 2017-05-24 捷开通讯(深圳)有限公司 一种监控随机目标的方法及***
CN108010289A (zh) * 2017-12-28 2018-05-08 深圳市永达电子信息股份有限公司 一种基于声纹识别的互联网报警方法及***
CN108257362A (zh) * 2018-01-11 2018-07-06 广州广大声像灯光科技有限公司 基于gis的交互式电子治安警察警备方法、***及装置
CN109598885A (zh) * 2018-12-21 2019-04-09 广东中安金狮科创有限公司 监控***及其报警方法
CN110675585A (zh) * 2019-09-23 2020-01-10 北京华毅东方展览有限公司 一种展会安全控制***
CN110830771A (zh) * 2019-11-11 2020-02-21 广州国音智能科技有限公司 智能监控方法、装置、设备及计算机可读存储介质
CN110992609A (zh) * 2019-11-11 2020-04-10 云知声智能科技股份有限公司 一种基于声纹检测的自动呼救***及方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112907809A (zh) * 2021-01-29 2021-06-04 深圳市兴海物联科技有限公司 一种管理方法、***、设备及计算机存储介质
CN114845026A (zh) * 2022-05-02 2022-08-02 北京万合恒安科技有限公司 一种基于大数据的动态监控通讯装置及其使用方法

Similar Documents

Publication Publication Date Title
CN107278369B (zh) 人员查找的方法、装置及通信***
CN109583278B (zh) 人脸识别报警的方法、装置、***及计算机设备
CN109815818B (zh) 目标人物追踪方法、***及相关装置
CN109672853B (zh) 基于视频监控的预警方法、装置、设备及计算机存储介质
JP2022082561A (ja) 解析サーバ、監視システム、監視方法及びプログラム
CN105847769A (zh) 一种建筑现场行为分析***及分析方法
CN110555918B (zh) 考勤管理的方法和考勤管理设备
JP2023174753A (ja) 映像共有システム、映像共有方法およびプログラム
US9942520B2 (en) Interactive and targeted monitoring service
WO2018146938A1 (ja) 人物検出システム
CN106503666A (zh) 一种安全监控方法、装置及电子设备
CN111784947A (zh) 一种基于图像与声纹的主动预警方法、***和设备
CA2983316C (en) Monitoring system having personal information protection function and method thereof
CN107959748A (zh) 自动报警方法及装置
WO2020042637A1 (zh) 监管方法、装置、***、云端服务器及存储介质
KR20160074208A (ko) 비콘신호를 이용한 안전 서비스 제공 시스템 및 방법
CN115880631A (zh) 一种配电站故障识别***、方法、介质
CN109800656B (zh) 定位方法及相关产品
CN111540020A (zh) 目标行为的确定方法及装置、存储介质、电子装置
CN117238120B (zh) 安全监控方法、装置、设备及介质
US11100784B2 (en) Method and system for detecting and notifying actionable events during surveillance
CN112511807A (zh) 一种消防通道监控联动方法
CN115836516A (zh) 监视***
KR102367584B1 (ko) 스켈레톤 영상 분석 기법을 이용한 자동 영상 감시 시스템
Park et al. Multi-log analysis platform for supporting public safety service

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20201016

RJ01 Rejection of invention patent application after publication