CN113434573A - 多维度图像检索***、方法及设备 - Google Patents
多维度图像检索***、方法及设备 Download PDFInfo
- Publication number
- CN113434573A CN113434573A CN202110725358.0A CN202110725358A CN113434573A CN 113434573 A CN113434573 A CN 113434573A CN 202110725358 A CN202110725358 A CN 202110725358A CN 113434573 A CN113434573 A CN 113434573A
- Authority
- CN
- China
- Prior art keywords
- retrieval
- distributed
- information
- image
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000012544 monitoring process Methods 0.000 claims abstract description 31
- 238000012545 processing Methods 0.000 claims abstract description 21
- 238000000605 extraction Methods 0.000 claims description 15
- 230000006399 behavior Effects 0.000 claims description 12
- 239000000284 extract Substances 0.000 claims description 5
- 238000004422 calculation algorithm Methods 0.000 claims description 4
- 239000000126 substance Substances 0.000 claims description 3
- 230000002159 abnormal effect Effects 0.000 abstract description 2
- 230000005021 gait Effects 0.000 abstract description 2
- 230000001364 causal effect Effects 0.000 description 13
- 230000008569 process Effects 0.000 description 12
- 238000004891 communication Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- 230000009471 action Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 9
- 238000004590 computer program Methods 0.000 description 7
- 230000000007 visual effect Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000012916 structural analysis Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 210000001503 joint Anatomy 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- PWPJGUXAGUPAHP-UHFFFAOYSA-N lufenuron Chemical compound C1=C(Cl)C(OC(F)(F)C(C(F)(F)F)F)=CC(Cl)=C1NC(=O)NC(=O)C1=C(F)C=CC=C1F PWPJGUXAGUPAHP-UHFFFAOYSA-N 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2471—Distributed queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Probability & Statistics with Applications (AREA)
- Mathematical Physics (AREA)
- Fuzzy Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Library & Information Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明属于图像处理与检索技术领域,具体涉及一种多维度图像检索***、方法及设备,旨在解决现有技术中图像检索***的检索条件单一,导致***可拓展性不足、实用性差的问题。本申请提供的多维度图像检索***基于zookeeper的分布式架构构建,该***包括平台客户端、监控终端、分布式计算节点、分布式缓存***、分布式文件***和分布式数据库。本申请能够实现黑白名单、异常事件、步态多类别及时间、空间、属性多维度联合查询检索同时还融合了预测事件演化,能够在海量视频图片库中秒级反馈结果,综合检索准确度高,应用可扩展性强,且极大的提高了大数据下目标图片检索的效率。
Description
技术领域
本发明属于图像处理与检索技术领域,具体涉及一种多维度 图像检索***、方法及设备。
背景技术
专利“US20110075950A1 IMAGE RETRIEVAL DEVICE AND COMPUTER PROGRAM FORIMAGE RETRIEVAL APPLICABLE TO THE IMAGE RETRIEVAL DEVICE”是一种图像检索装置,其基于搜 索目标图像的属性和输入图像的属性特征量与组件/组合图像相关联的搜 索目标图像进行比对,来搜索相似的图像。
专利“CN111177469A人脸检索方法及人脸检索装置”描述 了一种人脸检索方法及人脸检索装置。该方法从分布式文件***的文件 夹中获取与该文件夹对应监控终端拍摄的帧图像,从帧图像中提取出人 脸面部特征,将提取的人脸面部特征作为检索条件,在注册库中进行人 脸检索。方法采用Storm提升***的并行计算能力,使得人脸检索相对于 单点架构的方式具有更良好的实时性和扩展性。
专利“US20110075950A1 IMAGE RETRIEVAL DEVICE AND COMPUTER PROGRAM FORIMAGE RETRIEVAL APPLICABLE TO THE IMAGE RETRIEVAL DEVICE”所描述的图像检索方法是基于图 像属性及属性特征量来进行检索,检索维度较单一,缺少多维度(如时间、 空间等)检索条件,且其检索类型比较单一,缺乏多类型目标(如事件等) 检索.专利“CN111177469A人脸检索方法及人脸检索装置”是在人脸检 索方面的分布式实时检索应用,缺乏在多维度检索条件下海量图像数据 的实时、高准确度分析。
在大范围复杂视觉大数据的实际应用场景中,数据往往是多 维度的,涉及跨时空(时间点、空间点)、跨场景(卡口、进出口等)、 跨层次(如个体、群体等),而当前的图像检索***大多是针对单一维 度的数据进行检索,检索条件单一,导致***可拓展性不足、实用性差。 因此,根据实际应用的需要,亟需提出一种对视频大数据的时间、空间、 属性、图片、事件类型等多维度的高效检索方法,来解决现阶段公共安 全领域多维度海量视频图片高准度实时检索的难点。
发明内容
为了解决现有技术中的上述问题,即为了解决现有技术中图 像检索***的检索条件单一,导致***可拓展性不足、实用性差的问题。 本申请第一方面提供了一种多维度图像检索***,该***基于zookeeper 的分布式架构构建,主要包括平台客户端、监控终端、分布式计算节点、 分布式缓存***、分布式文件***和分布式数据库;
所述监控终端包括分布于各监控点的图像获取装置,所述图 像获取装置能够基于控制指令采集目标图像信息,并将目标图像信息发 送至所述分布式缓存***、所述分布式文件***和所述分布式数据库进 行存储;
所述平台客户端配置为:实时获取装置采集的图像信息,并 提取人脸特征数据,将所述人脸特征数据与分布式数据库中预存储的黑 白名单人脸特征值库进行匹配;根据匹配结果执行相应处理操作,并发 送处理结果至平台客户端显示;和
将所述平台客户端的输入信息作为检索任务,将所述检索任 务分配至空闲的计算节点,计算节点根据检索任务中的检索条件查询所 述分布式数据库,并将检索结果反馈给平台客户端进行显示;所述检索 条件包括时间、空间、属性、事件类型和图片中的任意一者或多者的组 合。
在一些优选技术方案中,所述预存储的黑白名单人脸特征值 库的构建方法为:将黑白名单图像库中每一个名单图像输入预训练的人 脸特征提取模型中,获取目标人脸面部特征值;基于人脸抓拍程序通过 图像获取装置对各监控点实时人脸抓拍,并按照时间和空间信息对应存 储到所述分布式文件***对应的文件夹中。
在一些优选技术方案中,当所述检索条件包括图片时,计算 节点通过特征提取算法提取出待检索图片特征值,并根据检索任务中非 图片的检索条件查询所述分布式数据库,筛选出目标信息;
根据筛选出的目标信息查询所述分布式缓存***中预存储 的目标特征值,并构造待检索图片的特征值库;
将待检索图片特征值与所述检索图片的特征值库进行比对, 获取相似度值后排序,将大于预设阈值的目标信息发送给客户端,客户 端根据时间顺序排序显示检索结果。
在一些优选技术方案中,所述属性包括车辆信息和目标人物 信息,所述目标人物信息包括目标人物姓名、目标人物行为、目标人物 外貌和目标人物轨迹;所述车辆信息包括车辆类型、车辆颜色、车辆品 牌和车辆车牌号。
在一些优选技术方案中,所述分布式缓存***为Redis集群 的主从模式。
在一些优选技术方案中,所述分布式文件***为Hadoop旗 下开源的HDFS。
在一些优选技术方案中,所述分布式数据库为开源关系型数 据库MySQL。
本申请第二方面提供了一种多维度图像检索方法,包括以下 步骤:
步骤S100,基于zookeeper的分布式架构构建多维度图像检 索***,该***包括平台客户端、监控终端、分布式计算节点、Redis集 群分布式缓存***、HDFS分布式文件***和MySQL分布式数据库;所 述监控终端包括若干个分布于各监控点的图像获取装置;
步骤S200,将黑白名单图像库中每一个名单图像输入预训 练的人脸特征提取模型中,获取目标人脸面部特征值;基于人脸抓拍程 序通过图像获取装置对各监控点实时人脸抓拍,并按照时间和空间信息 对应存储到所述分布式文件***对应的文件夹中;
步骤S300,配置所述平台客户端实时获取各图像获取装置 采集的图像信息,并提取人脸特征数据,将所述人脸特征数据与分布式 数据库中预存储的黑白名单人脸特征值库进行匹配;根据匹配结果执行 相应处理操作,并发送处理结果至平台客户端显示;
步骤S400,将所述平台客户端的输入信息作为检索任务, 将所述检索任务分配至空闲的计算节点,计算节点根据检索任务中的检 索条件查询所述分布式数据库,并将检索结果反馈给平台客户端进行显 示;所述检索条件包括时间、空间、属性、事件类型和图片中的任意一 者或多者的组合。
本申请第三方面提供了一种电子设备,包括:
至少一个处理器;以及
与至少一个所述处理器通信连接的存储器;其中,
所述存储器存储有可被所述处理器执行的指令,所述指令用 于被所述处理器执行以实现上述技术方案所述的多维度图像检索方法。
本申请第四方面提供了一种计算机可读存储介质,所述计算 机可读存储介质存储有计算机指令,所述计算机指令用于被所述计算机 执行以实现上述技术方案所述的多维度图像检索方法。
本发明的有益效果:
本发明提供了一种基于时间、空间、属性、图片、事件类型 等多维度检索方法,对视觉大数据场景中海量图片的高准度实时检索。 本申请能够实现人脸(黑白名单)、异常事件、步态多类别及时间、空 间、属性多维度联合查询检索,能够在海量视频图片库中秒级反馈结果, 综合检索准确度高,应用可扩展性强,且极大的提高了大数据下目标图 片检索的效率。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详 细描述,本申请的其它特征、目的和优点将会变得更明显:
图1为本发明一种实施例的多维度图像检索***整体结构 示意图;
图2为本发明一种实施例中多维度图像检索***的检索流 程示意图;
图3为本发明一种实施例的适于用来实现本申请实施例的 电子设备的计算机***的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合 附图对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描 述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明 中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得 的所有其他实施例,都属于本发明保护的范围。
下面结合附图和实施例对本申请作进一步的详细说明。可以 理解的是,此处所描述的具体实施例仅用于解释相关发明,而非对该发 明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有 关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实 施例中的特征可以相互组合。
本发明的一种多维度图像检索***,如图1所示,该***基 于zookeeper分布式架构构建,主要包括平台客户端、监控终端、分布式 计算节点、分布式缓存***、分布式文件***和分布式数据库;
所述监控终端包括分布于各监控点的图像获取装置,所述图 像获取装置能够基于控制指令采集目标图像信息,并将目标图像信息发 送至所述分布式缓存***、所述分布式文件***和所述分布式数据库进 行存储;
所述平台客户端配置为:实时获取各图像获取装置采集的图 像信息,并提取人脸特征数据,将所述人脸特征数据与分布式数据库中 预存储的黑白名单人脸特征值库进行匹配;根据匹配结果执行相应处理 操作,并发送处理结果至平台客户端显示;和
将所述平台客户端的输入信息作为检索任务,将所述检索任 务分配至空闲的计算节点,计算节点根据检索任务中的检索条件查询所 述分布式数据库,并将检索结果反馈给平台客户端进行显示;所述检索 条件包括时间、空间、属性、事件类型和图片中的任意一者或多者的组 合。本发明能够实现分布式多维的实时图像检索展示、公共安全领域多 维度海量视频图片高准度实时检索。
为了更清晰地对本发明多维度图像检索***进行说明,下面 结合附图对本发明***实施例展开详述。
本申请的多维度图像检索***基于zookeeper的分布式架构 构建,其稳定性更好,检索效率更高。该***包括平台客户端、监控终 端、分布式计算节点、分布式缓存***、分布式文件***和分布式数据 库。该***是一个分布式的、可扩展性的,高可靠性的多维实时图像检 索***。
具体地,本申请基于zookeeper的分布式架构构建可以方便 地在一个计算机集群中进行复杂的大数据计算,在大规模计算任务处理 时,分布式计算***可以保证所有任务均衡分配处理。
本申请的监控终端与流媒体服务对接,该终端包括分布于各 个监控点(比如,交通路口、园区路口、小区路口及各个地方出入口等) 的图像获取装置。优选地,图像获取装置为摄像机,其能够基于控制指 令采集目标图像信息,并将目标图像信息发送至所述分布式缓存***、 所述分布式文件***和所述分布式数据库进行存储。具体而言,***会 在某些终端运行抓拍服务,抓拍服务会检测目标并抓拍有目标的图像, 获取对应信息后将结构化数据保存到分布式数据库,然后将图片保存到 分布式文件***。可以理解的是,该控制指令可以为程序自定义的自动 采集设定也可以为人为输入的控制指令。
在一些优选技术方案中,本申请的分布式文件***采用 Hadoop旗下开源的HDFS,不仅能够提高本申请的容错性和可扩展性, 而且非常易于扩展,节省部署成本。同时,HDFS能提供高吞吐量的数据 访问,非常适合大规模数据集上的应用。文件***中建立有与各个抓拍 像机对应的文件夹,用于存储对应像机抓拍的目标图像。
更进一步地,由于抓拍图片存在多维信息,需要关系型数据 库存储对应数据信息,因此在一些优选实施例中,本申请分布式数据库 主要采用开源关系型数据库MySQL,其存储对应数据信息的同时能够与 分布式缓存服务配合,能够方便高效的为大数据检索服务。
在另一些优选技术方案中,本申请的分布式缓存服务主要使 用Redis集群的主从模式。该模式保证了数据的高可用性及***的扩展性, 同时,主从模式提供多个副本,具有读写分离的优点,非常符合做*** 检索服务。目标图像通过特征提取后,会将特征值存储到Redis集群,然 后将目标结构化信息存储到关系型数据库。在检索服务开启后,待检索目标图像特征值会和Redis集群中存储的黑白名单库或人车特征库进行 配对,然后将结果输出至平台客户端。
本申请技术方案的多维检索流程图请参照图2。多维检索系 统通过平台客户端可以实现人车检索、属性检索、事件检索、黑白名单 检索、以图搜图等检索功能。其中,黑白名单检索功能为实时检索,其 他均为非实时目标检索。实时检索服务是24小时不间断检索,在开启人 脸抓拍服务后,会根据实时抓拍图来和黑白名单库进行比对,比对成功 则主动推送至平台客户端。目标检索主要是通过平台客户端输入不同检 索类型的条件,如检索属性、时间、摄像头点位、图片等条件,通过通 信模块负载均衡地派发任务给分布式计算节点。计算节点根据检索条件 及检索类型,调用不同的服务,如流媒体服务、文件***服务、数据库 服务、缓存服务等,通过大数据计算得到检索结果,并通过通信模块返 回给平台客户端。
参阅图2,本申请***能够实时获取各图像获取装置采集的 图像信息,并提取人脸特征数据,将所述人脸特征数据与分布式数据库 中预存储的黑白名单人脸特征值库进行匹配;根据匹配结果执行相应处 理操作,并发送处理结果至平台客户端显示,进而实现实时黑白名单检 索。
具体地,本申请实时黑白名单检索方法包括以下步骤:从分 布式文件***中获取监控终端抓拍的人脸图像,对该抓拍图像进行人脸 检测,并提取出人脸特征值;再将提取的人脸特征值作为检索比对的输 入值,将该值与黑白名单人脸特征值库进行比对,得到所有比对的相似 度值,排序后得到最大相似度值,若该值大于提前设定的比对阈值,则 输出该比对结果,该结果为黑白名单库中匹配到的目标信息。该过程还 包括二个子步骤:A100,提前通过客户端导入黑白名单图像库,将每一 个名单图像输入提前训练好的人脸特征提取模型中,得到目标人脸面部 特征值,再将图像库中所有的名单信息及特征值存入数据库及缓存***。 A200,通过人脸抓拍程序对各个监控点实时人脸抓拍,并按照时间及空 间信息对应存储到分布式文件***对应的文件夹中。当本申请的***检 索到目标人物属于白名单时自动放行,当检索到目标人物属于黑名单时 报警提示继续实时跟踪目标人物,或禁止通行。
此外,本申请***还能够实现将平台客户端的输入信息作为 检索任务,将检索任务分配至空闲的计算节点,计算节点根据检索任务 中的检索条件查询分布式数据库,并将检索结果反馈给平台客户端进行 显示;检索条件包括时间、空间、属性、事件类型和图片中的任意一者 或多者的组合。具体地,属性包括车辆信息和目标人物信息,所述目标 人物信息包括目标人物姓名、目标人物行为、目标人物外貌和目标人物 轨迹;所述车辆信息包括车辆类型、车辆颜色、车辆品牌和车辆车牌号。 进而,本申请能够实现人车检索、属性检索、事件检索、以图搜图检索 功能。当检索条件包括图片时,计算节点通过特征提取算法提取出待检 索图片特征值,并根据检索任务中非图片的检索条件查询分布式数据库, 筛选出目标信息;根据筛选出的目标信息查询分布式缓存***中预存储 的目标特征值,并构造待检索图片的特征值库;将待检索图片特征值与 检索图片的特征值库进行比对,获取相似度值后排序,将大于预设阈值 的目标信息发送给客户端,客户端根据时间顺序排序显示检索结果。
具体地,本申请实现人车检索方法包括以下步骤:
通过客户端输入人名或车牌号等检索条件,负载均衡通过通 信模块发送给空闲计算节点,计算节点根据检索条件查询数据库对应表, 然后将检索结果反馈给客户端,客户端显示检索到的目标信息。
本申请实现属性检索方法包括以下步骤:
通过客户端输入属性、时间、空间等检索条件,通过通信模 块发送给空闲计算节点,计算节点根据检索条件查询数据库对应表,然 后将检索结果反馈给客户端,客户端显示检索到的目标信息。优选地, 该属性还包括目标人物的衣着种类、颜色、衣着特征(背包、眼镜等), 进而实现属性检索。
本申请实现事件检索方法包括以下步骤:
通过客户端输入事件类型、时间、空间等检索条件,通过通 信模块发送给空闲计算节点,计算节点根据检索条件查询数据库事件表, 然后将检索结果反馈给客户端,客户端显示检索到的事件报警信息。优 选地,事件类型可以为聚众、打架、奔跑等行为特征。
本申请实现以图搜图方法包括以下步骤:
通过客户端输入待检索图片、时间、空间等检索条件,通过 通信模块发送给空闲计算节点,计算节点通过特征提取算法提取出图片 特征值,同时计算节点根据检索条件查询数据库对应表,筛选出目标信 息,根据筛选出的目标查询Redis集群中保存的目标特征值,构造特征值 库,然后将待检索图片特征与特征值库进行比对,获取相似度值后排序,将大于预设阈值的目标信息发送给客户端,客户端根据时间顺序排序显 示检索结果。
更进一步地,本申请的多维度图像检索***还融合了预测事 件演化,具体地,其包括视频输入模块、视觉解析模块、事件抽取模块、 报警模块、事件关联模块、存储模块、事件预测模块和可视化模块;
所述视频输入模块,配置为对输入的视频流进行解码,创建 一个包含最新N帧图像数据的缓存队列;
所述视觉解析模块,配置为对缓存队列的N帧图像数据进 行分析计算,获取视频中的结构化语义信息;
所述事件抽取模块,配置为抽取事件类型、置信度、空间信 息、目标信息及动作行为信息;
所述报警模块,配置为对抽取的事件信息进行判断,若满足 预设条件则推送报警;
所述事件关联模块,配置为通过抽取的事件信息和时空线索, 与动态处理的事件子图进行关联和合并;
所述存储模块,配置为存储事件时序因果关系图和动态处理 的事件子图;
所述事件预测模块,配置为对事件未来发展态势进行预测;
所述可视化模块,配置为把已发生事件和预测事件在时间轴 上展开进行展示,或者,把已发生事件和预测事件在地图上按空间分布 进行展示,或者,按图结构的形式展示更新的事件子图的关联结构。
本发明第二实施例的一种多维度图像检索方法,该包括以下 步骤:
步骤S100,基于zookeeper的分布式架构构建的多维度图像 检索***,该***包括平台客户端、监控终端、Redis集群分布式缓存系 统、HDFS分布式文件***和MySQL分布式数据库;所述监控终端包括 若干个分布于各监控点的图像获取装置;
步骤S200,将黑白名单图像库中每一个名单图像输入预训 练的人脸特征提取模型中,获取目标人脸面部特征值;基于人脸抓拍程 序通过图像获取装置对各监控点实时人脸抓拍,并按照时间和空间信息 对应存储到所述分布式文件***对应的文件夹中;
步骤S300,配置所述平台客户端实时获取各图像获取装置 采集的图像信息,并提取人脸特征数据,将所述人脸特征数据与分布式 数据库中预存储的黑白名单人脸特征值库进行匹配;根据匹配结果执行 相应处理操作,并发送处理结果至平台客户端显示;
步骤S400,将所述平台客户端的输入信息作为检索任务, 将所述检索任务分配至空闲的计算节点,计算节点根据检索任务中的检 索条件查询所述分布式数据库,并将检索结果反馈给平台客户端进行显 示;所述检索条件包括时间、空间、属性、事件类型和图片中的任意一 者或多者的组合。
更进一步地,本申请还提供一种基于视频的事件演化预测方 法,该方法包括以下步骤:步骤A100,对输入的视频流进行解码,获得 序列数据;以队列方式缓存与当前时刻对应的N帧视频图像;步骤A200, 对N帧视频图像进行视频结构化分析;视频结构化分析包括对视频数据 进行预处理后,输入第一信息,输出第二信息;其中,第一信息包括目 标检测、目标跟踪、个体身份识别、个体动作识别、群体行为识别、跨 场景目标再识别等神经网络;第二信息包括事件的类型、置信度、时间 信息、空间信息、目标信息和动作行为信息;步骤A300,判断第二信息 中的各类事件的置信度是否大于阈值,若存在某类事件的置信度大于阈 值时,则判定为第一类型,执行步骤A400;第一类型为当前时刻有某些 事件发生;若所有事件类型对应的置信度小于阈值,则返回至步骤A100; 步骤A400,抽取当前时刻对应事件,获取当前事件的总体特征;总体特 征为et,et={事件类型,置信度,时间信息,空间信息,目标信息,动作行为信 息};步骤A500,基于总体特征,将当前事件节点与历史事件节点进行关 联和合并,更新当前场景对应的初始事件子图,获得第一事件子图;步 骤A600,基于第一事件子图,获取每个候选事件的预测分数,按照分数 值降序输出预测的事件节点。需要说明的是,某类指代任一预设类,例 如打架事件、抢劫事件、斗殴事件、群架事件。
进一步地,步骤A400中的“将所述总体特征与历史事件节 点进行关联和合并”具体包括:步骤A410,对获取的总体特征建立索引;
步骤A420,按照时间倒序,将当前事件的目标信息、动作 行为信息,依次与初始事件子图中的历史事件节点的对应信息进行比对;
步骤A430,若当前事件的目标信息的相似度或当前事件的 动作行为信息的相似度大于阈值,则与初始事件子图中的节点进行关联 和合并;
判断当前事件与初始事件子图中的历史事件节点的类型是 否相同,若相同,则与初始事件子图中的历史事件节点对应的节点合并, 并更新对应节点的特征信息;
若不同,则在初始事件子图中增加当前事件节点;
步骤A440,若当前事件的目标信息的相似度或当前事件的 动作行为信息的相似度小于阈值,则将当前事件标记为初始触发事件, 以该节点为起点提取新的事件子图。
进一步地,初始事件子图的获取包括:基于获取的对应场景 下的多路视频,抽取历史事件节点、历史事件节点所对应的候选事件节 点;基于构建的事件时序因果关系图,根据事件之间的关系进行有向连 接,获得初始事件子图。
事件时序因果关系图的构建方法具体为:步骤B10,基于获 取的大规模视频数据,利用视频结构化对视频数据进行分析;
步骤B20,抽取视频数据中所有事件及对应视频画面的语义 特征信息;其中,语义特征信息包括视频中事件类型、置信度、时间信 息、空间信息、目标信息、动作行为信息;
步骤B30,提取事件链和事件对,获取事件对集合:
步骤B40,基于事件对集合,结合相关性统计或互信息,构 建事件无向图骨架,获取事件节点Vi之间的邻接矩阵;
步骤B50,基于分布不对称性,采用因果生成神经网络对事 件节点Vi之间的二元和多元因果机制进行建模:
其中,代表Vi的父节点集合,Ei表 示未观测到的随机变量;因果机制fi由包含若干层神经元的生成网络对事 件的联合分布进行建模,并采用最大平均差异进行评价;为所构建的事 件时序因果关系图,事件时序因果关系图中的有向边用于表示对应变量 之间的时序或因果关系;
步骤B60,存储事件时序因果关系图,以用于对事件未来发 展态势进行预测。
进一步地,预测分数为S(vcj|v1,v2,...,vK);
Δti表示事件节点vi距离当前时刻的时间差,发生时间越久远 的历史事件节点在预测分数中的权重越小;v1,v2,...,vK为历史事件节点; 为候选事件节点。本发明可针对实际应用中事件演化过程的复杂性, 从多层次、多维度对事件演化过程进行建模和分析,实现对事件未来发 展的预测;本发明所用的视频数据与文本数据相比,具有丰富的视觉语 义信息。本申请公开的方案可自动构建事件间的时序因果关系,并对视 频中事件的演化趋势进行预测,进而将预测结果通过平台客户端进行显 示。
本申请的多维度图像检索***还能够利用视频中的视觉语 义信息,丰富了事件的信息维度,实现对事件隐含线索和复杂关系的建 模,增强事件特征的表达能力;利用事件时序因果关系对视频中的事件 演化趋势进行预测,提高了视频分析***的智能化水平;本发明预测事 件演化应用于本申请的多维度图像检索***能够实现对未来可能发生事件的主动预测和事前防范,提高对公共安全事件的管控能力。即本申请 不仅可以进行多维度图像检索,还能够利用事件时序因果关系对视频中 的事件演化趋势进行预测。
可以理解的是,本申请的多维度图像检索方法是基于上述技 术方案的多维度图像检索***实现的。所属技术领域的技术人员可以清 楚的了解到,为描述的方便和简洁,上述描述的方法具体的工作过程及 有关说明,可以参考前述***实施例中的对应过程,在此不再赘述。
需要说明的是,上述实施例提供的多维度图像检索***,仅 以上述各功能模块的划分进行举例说明,在实际应用中,可以根据需要 而将上述功能分配由不同的功能模块来完成,即将本发明实施例中的模 块或者步骤再分解或者组合,例如,上述实施例的模块可以合并为一个 模块,也可以进一步拆分成多个子模块,以完成以上描述的全部或者部 分功能。对于本发明实施例中涉及的模块、步骤的名称,仅仅是为了区 分各个模块或者步骤,不视为对本发明的不当限定。
本发明第三实施例,提出了一种设备,包括:至少一个处理 器;以及与至少一个所述处理器通信连接的存储器;其中,所述存储器 存储有可被所述处理器执行的指令,所述指令用于被所述处理器执行以 实现上述的多维度图像检索方法。
本发明第四实施例,提出了一种计算机可读存储介质,其特 征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令 用于被所述计算机执行以实现上述的多维度图像检索方法。
所属技术领域的技术人员可以清楚的了解到,为描述的方便 和简洁,上述描述的存储装置、处理装置的具体工作过程及有关说明, 可以参考前述方法实例中的对应过程,在此不再赘述。
下面参考图3,其示出了适于用来实现本申请方法、***、 设备实施例的服务器的计算机***的结构示意图。图3示出的服务器仅 仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图3所示,计算机***包括中央处理单元(CPU,Central Processing Unit)601,其可以根据存储在只读存储器(ROM,Read Only Memory)602中的程序或者从存储部分608加载到随机访问存储器(RAM, Random Access Memory)603中的程序而执行各种适当的动作和处理。在 RAM603中,还存储有***操作所需的各种程序和数据。CPU601、ROM 602以及RAM603通过总线604彼此相连。输入/输出(I/O,Input/Output) 接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部 分606;包括诸如阴极射线管(CRT,Cathode Ray Tube)、液晶显示器(LCD, Liquid Crystal Display)等以及扬声器等的输出部分607;包括硬盘等的存 储部分608;以及包括诸如LAN(局域网,Local AreaNetwork)卡、调制 解调器等的网络接口卡的通讯部分609。通讯部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸 介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装 在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存 储部分608。
特别地,根据本公开的实施例,上文参考流程图描述的过程 可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机 程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程 序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该 计算机程序可以通过通讯部分609从网络上被下载和安装,和/或从可拆 卸介质611被安装。在该计算机程序被中央处理单元(CPU601执行时, 执行本申请的方法中限定的上述功能。需要说明的是,本申请上述的计 算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者 是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于 ——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者 任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限 于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访 问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM 或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、 磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存 储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行 ***、装置或者器件使用或者与其结合使用。而在本申请中,计算机可 读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号, 其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种 形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算 机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读 介质,该计算机可读介质可以发送、传播或者传输用于由指令执行***、 装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的 程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光 缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行 本申请的操作的计算机程序代码,上述程序设计语言包括面向对象的程 序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计 语言—诸如C语言或类似的程序设计语言。程序代码可以完全地在用户 计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执 行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计 算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通 过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户 计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通 过因特网连接)。
附图中的流程图和框图,图示了按照本申请各种实施例的系 统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这 点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码 的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现 规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中, 方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如, 两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按 相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流 程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行 规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
术语“第一”、“第二”等是用于区别类似的对象,而不是用 于描述或表示特定的顺序或先后次序。
术语“包括”或者任何其它类似用语旨在涵盖非排他性的包 含,从而使得包括一系列要素的过程、方法、物品或者设备/装置不仅包 括那些要素,而且还包括没有明确列出的其它要素,或者还包括这些过 程、方法、物品或者设备/装置所固有的要素。
至此,已经结合附图所示的优选实施方式描述了本发明的技 术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然 不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域 技术人员可以对相关技术特征做出等同的更改或替换,这些更改或替换 之后的技术方案都将落入本发明的保护范围之内。
Claims (10)
1.一种多维度图像检索***,其特征在于,该***基于zookeeper的分布式架构构建,该***包括平台客户端、监控终端、分布式计算节点、分布式缓存***、分布式文件***和分布式数据库;
所述监控终端包括分布于各监控点的图像获取装置,所述图像获取装置能够基于控制指令采集目标图像信息,并将目标图像信息发送至所述分布式缓存***、所述分布式文件***和所述分布式数据库进行存储;
所述平台客户端配置为:实时获取各图像获取装置采集的图像信息,并提取人脸特征数据,将所述人脸特征数据与分布式数据库中预存储的黑白名单人脸特征值库进行匹配;根据匹配结果执行相应处理操作,并发送处理结果至平台客户端显示;和
将所述平台客户端的输入信息作为检索任务,将所述检索任务分配至空闲的计算节点,计算节点根据检索任务中的检索条件查询所述分布式数据库,并将检索结果反馈给平台客户端进行显示;所述检索条件包括时间、空间、属性、事件类型和图片中的任意一者或多者的组合。
2.根据权利要求1所述的多维度图像检索***,其特征在于,所述预存储的黑白名单人脸特征值库的构建方法为:将黑白名单图像库中每一个名单图像输入预训练的人脸特征提取模型中,获取目标人脸面部特征值;基于人脸抓拍程序通过图像获取装置对各监控点实时人脸抓拍,并按照时间和空间信息对应存储到所述分布式文件***对应的文件夹中。
3.根据权利要求1所述的多维度图像检索***,其特征在于,当所述检索条件包括图片时,计算节点通过特征提取算法提取出待检索图片特征值,并根据检索任务中非图片的检索条件查询所述分布式数据库,筛选出目标信息;
根据筛选出的目标信息查询所述分布式缓存***中预存储的目标特征值,并构造待检索图片的特征值库;
将待检索图片特征值与所述检索图片的特征值库进行比对,获取相似度值后排序,将大于预设阈值的目标信息发送给客户端,客户端根据时间顺序排序显示检索结果。
4.根据权利要求1所述的多维度图像检索***,其特征在于,所述属性包括车辆信息和目标人物信息,所述目标人物信息包括目标人物姓名、目标人物行为、目标人物外貌和目标人物轨迹;所述车辆信息包括车辆类型、车辆颜色、车辆品牌和车辆车牌号。
5.根据权利要求1所述的多维度图像检索***,其特征在于,所述分布式缓存***为Redis集群的主从模式。
6.根据权利要求1所述的多维度图像检索***,其特征在于,所述分布式文件***为Hadoop旗下开源的HDFS。
7.根据权利要求1所述的多维度图像检索***,其特征在于,所述分布式数据库为开源关系型数据库MySQL。
8.一种多维度图像检索方法,其特征在于,包括以下步骤:
步骤S100,基于zookeeper的分布式架构构建多维度图像检索***,该***包括平台客户端、监控终端、分布式计算节点、Redis集群分布式缓存***、HDFS分布式文件***和MySQL分布式数据库;所述监控终端包括若干个分布于各监控点的图像获取装置;
步骤S200,将黑白名单图像库中每一个名单图像输入预训练的人脸特征提取模型中,获取目标人脸面部特征值;基于人脸抓拍程序通过图像获取装置对各监控点实时人脸抓拍,并按照时间和空间信息对应存储到所述分布式文件***对应的文件夹中;
步骤S300,配置所述平台客户端实时获取各图像获取装置采集的图像信息,并提取人脸特征数据,将所述人脸特征数据与分布式数据库中预存储的黑白名单人脸特征值库进行匹配;根据匹配结果执行相应处理操作,并发送处理结果至平台客户端显示;
步骤S400,将所述平台客户端的输入信息作为检索任务,将所述检索任务分配至空闲的计算节点,计算节点根据检索任务中的检索条件查询所述分布式数据库,并将检索结果反馈给平台客户端进行显示;所述检索条件包括时间、空间、属性、事件类型和图片中的任意一者或多者的组合。
9.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与至少一个所述处理器通信连接的存储器;其中,
所述存储器存储有可被所述处理器执行的指令,所述指令用于被所述处理器执行以实现权利要求8所述的多维度图像检索方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于被所述计算机执行以实现权利要求8所述的多维度图像检索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110725358.0A CN113434573B (zh) | 2021-06-29 | 2021-06-29 | 多维度图像检索***、方法及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110725358.0A CN113434573B (zh) | 2021-06-29 | 2021-06-29 | 多维度图像检索***、方法及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113434573A true CN113434573A (zh) | 2021-09-24 |
CN113434573B CN113434573B (zh) | 2023-03-24 |
Family
ID=77757621
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110725358.0A Active CN113434573B (zh) | 2021-06-29 | 2021-06-29 | 多维度图像检索***、方法及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113434573B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114661936A (zh) * | 2022-05-19 | 2022-06-24 | 中山大学深圳研究院 | 一种应用于工业视觉中的图像检索的方法及电子设备 |
CN116453173A (zh) * | 2022-12-16 | 2023-07-18 | 南京奥看信息科技有限公司 | 一种基于图片区域分割技术的图片处理方法 |
CN116756354A (zh) * | 2023-08-24 | 2023-09-15 | 北京电子科技学院 | 一种照片档案分析管理*** |
CN117216317A (zh) * | 2023-06-09 | 2023-12-12 | 青岛尘元科技信息有限公司 | 视频事件检索***和方法、存储介质及电子设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101840422A (zh) * | 2010-04-09 | 2010-09-22 | 江苏东大金智建筑智能化***工程有限公司 | 基于目标特征和报警行为的智能视频检索***和方法 |
US20120114256A1 (en) * | 2009-06-30 | 2012-05-10 | Koninklijke Philips Electronics N.V. | Relevance feedback for content-based image retrieval |
CN110210340A (zh) * | 2019-05-20 | 2019-09-06 | 深圳供电局有限公司 | 一种人脸特征值比对方法及其***、可读存储介质 |
-
2021
- 2021-06-29 CN CN202110725358.0A patent/CN113434573B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120114256A1 (en) * | 2009-06-30 | 2012-05-10 | Koninklijke Philips Electronics N.V. | Relevance feedback for content-based image retrieval |
CN101840422A (zh) * | 2010-04-09 | 2010-09-22 | 江苏东大金智建筑智能化***工程有限公司 | 基于目标特征和报警行为的智能视频检索***和方法 |
CN110210340A (zh) * | 2019-05-20 | 2019-09-06 | 深圳供电局有限公司 | 一种人脸特征值比对方法及其***、可读存储介质 |
Non-Patent Citations (1)
Title |
---|
彭俊: "基于内容的图像分布式处理平台的设计与实现", 《中国优秀硕士学位论文全文数据库》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114661936A (zh) * | 2022-05-19 | 2022-06-24 | 中山大学深圳研究院 | 一种应用于工业视觉中的图像检索的方法及电子设备 |
CN114661936B (zh) * | 2022-05-19 | 2022-10-14 | 中山大学深圳研究院 | 一种应用于工业视觉中的图像检索的方法及电子设备 |
CN116453173A (zh) * | 2022-12-16 | 2023-07-18 | 南京奥看信息科技有限公司 | 一种基于图片区域分割技术的图片处理方法 |
CN116453173B (zh) * | 2022-12-16 | 2023-09-08 | 南京奥看信息科技有限公司 | 一种基于图片区域分割技术的图片处理方法 |
CN117216317A (zh) * | 2023-06-09 | 2023-12-12 | 青岛尘元科技信息有限公司 | 视频事件检索***和方法、存储介质及电子设备 |
CN116756354A (zh) * | 2023-08-24 | 2023-09-15 | 北京电子科技学院 | 一种照片档案分析管理*** |
Also Published As
Publication number | Publication date |
---|---|
CN113434573B (zh) | 2023-03-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113434573B (zh) | 多维度图像检索***、方法及设备 | |
US9002060B2 (en) | Object retrieval in video data using complementary detectors | |
US8660368B2 (en) | Anomalous pattern discovery | |
US11720627B2 (en) | Systems and methods for efficiently sending video metadata | |
US20180181872A1 (en) | Knowledge management system | |
CN111177469A (zh) | 人脸检索方法及人脸检索装置 | |
CN107992937B (zh) | 基于深度学习的非结构化数据判决方法和装置 | |
CN112733819B (zh) | 一种基于深度学习图像处理的多模式安保监测方法 | |
US20230267147A1 (en) | Systems and methods for searching for events within video content | |
KR20190088087A (ko) | 움직임 정보를 이용한 인공지능 학습기반의 이동객체 영상 분류처리 방법 | |
CN115001934A (zh) | 一种工控安全风险分析***及方法 | |
WO2022148108A1 (en) | Systems, devices and methods for distributed hierarchical video analysis | |
Valentín et al. | A cloud-based architecture for smart video surveillance | |
CN112925899B (zh) | 排序模型建立方法、案件线索推荐方法、装置及介质 | |
US11532158B2 (en) | Methods and systems for customized image and video analysis | |
Silva et al. | Using micro-services and artificial intelligence to analyze images in criminal evidences | |
CN110661999A (zh) | 一种基于大数据的视频监控*** | |
US20230205817A1 (en) | Systems and methods for identifying events within video content using intelligent search query | |
CN112306985A (zh) | 一种数字视网膜多模态特征联合精准检索方法 | |
CN113486754A (zh) | 基于视频的事件演化预测方法、*** | |
CN113468540A (zh) | 基于网络安全大数据的安全画像处理方法及网络安全*** | |
CN111737371A (zh) | 可动态预测的数据流量检测分类方法及装置 | |
Jaleel et al. | Towards Proactive Surveillance through CCTV Cameras under Edge‐Computing and Deep Learning | |
Liu | Deep Learning based method for Fire Detection | |
Mallick et al. | Artificial Intelligence based Video Monitoring System for Security Applications. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |