CN115830641B - 一种员工识别方法、装置、电子设备及存储介质 - Google Patents
一种员工识别方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN115830641B CN115830641B CN202310080028.XA CN202310080028A CN115830641B CN 115830641 B CN115830641 B CN 115830641B CN 202310080028 A CN202310080028 A CN 202310080028A CN 115830641 B CN115830641 B CN 115830641B
- Authority
- CN
- China
- Prior art keywords
- image data
- personnel
- staff
- probability distribution
- learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Image Analysis (AREA)
Abstract
本申请实施例涉及人员识别技术领域,提供了一种员工识别方法、装置、电子设备及存储介质,包括:基于实时监控图像,获取人员图像数据;基于所述人员图像数据的像素值,构建针对于所述人员图像数据的高斯概率分布;计算针对于所述人员图像数据的高斯概率分布与员工特征概率分布之间的KL散度,若所述KL散度小于识别阈值,将所述人员图像数据确定为员工图像数据。本申请基于实时图像中的人员图像数据的高斯分布与预学习的员工高斯分布的散度来判断实时图像中的人员图像与员工图像的相似性,该方案无需进行海量模型训练,且处理时间快、计算成本低,实现了轻量、高效的实现员工识别。
Description
技术领域
本申请实施例涉及人员识别技术领域,具体而言,涉及一种员工识别方法、装置、电子设备及存储介质。
背景技术
在危险作业场景下,例如,油气站、化工厂等等,进行作业的员工需要经过严格的培训后方能上岗工作,而未经培训的员工或其他无关人员(如顾客等)进入作业场景内可能会因操作和行为不规范酿成重大安全事故,因此,快速识别危险作业场景下的员工和非员工对于判断行为规范、规避安全事故具有重要意义。
当前针对危险作业场景下的员工识别方法主要是安保人员通过现场实时监控画面基于经验进行识别,或是通过训练好的深度学习模型进行识别。然而,这些方案一方面具有较高的人力成本和时间成本,无论是安保人员或训练深度学习模型需要的数据采集、标注和清洗,均需要大量人力且耗费大量时间;另一方面,深度学习模型的训练和运行需要消耗大量计算资源。因此,如何轻量、高效的实现员工识别,成为当前本领域技术人员亟待解决的问题。
发明内容
本申请实施例在于提供一种员工识别方法、装置、电子设备及存储介质,旨在解决如何轻量、高效的实现员工识别的问题。
本申请实施例第一方面提供一种员工识别方法,包括:
基于实时监控图像,获取人员图像数据;
基于所述人员图像数据的像素值,构建针对于所述人员图像数据的高斯概率分布;
计算针对于所述人员图像数据的高斯概率分布与员工特征概率分布之间的KL散度,若所述KL散度小于识别阈值,将所述人员图像数据确定为员工图像数据。
在一种可选的实施方式中,基于所述人员图像数据的像素值,构建针对于所述人员图像数据的高斯概率分布,包括:
基于所述人员图像数据的像素值,获取目标数量的聚类中心;
将到每个聚类中心的距离最近的所述人员图像数据的像素值,作为所述每个聚类中心对应的像素值;
计算所述每个聚类中心对应的像素值的均值和方差,基于所有聚类中心对应的像素值的均值和方差,构建所述针对于所述人员图像数据的高斯概率分布。
在一种可选的实施方式中,员工特征概率分布,按照如下方式获取:
对预设参考图像数据进行像素合并,得到预学习数据,所述预设参考图像数据包括多个员工图像数据;
基于所述预学习数据的像素值,构建针对于所述预学习数据的高斯概率分布,作为所述员工特征概率分布。
在一种可选的实施方式中,基于所述预学习数据的像素值,构建针对于所述预学习数据的高斯概率分布,包括:
基于所述预学习数据的像素值,获取目标数量的预学习聚类中心;
将到每个预学习聚类中心的距离最近的所述预学习数据的像素值,作为所述每个预学习聚类中心对应的像素值;
计算所述每个预学习聚类中心对应的像素值的均值和方差,基于所有预学习聚类中心对应的像素值的均值和方差,构建所述针对于所述预学习数据的高斯概率分布。
在一种可选的实施方式中,基于实时监控图像,获取人员图像数据,包括:
获取所述实时监控图像中人员位置,对所述人员位置进行分割,得到人员分割结果;
基于所述人员分割结果对所述实时监控图像进行裁剪,将所述人员分割结果作为前景图像,将背景图像设置为黑色;
将所述前景图像和所述背景图像组成所述人员图像数据。
在一种可选的实施方式中,所述人员图像数据为BGR颜色空间图像数据,在获取人员图像数据之后,所述方法,还包括:
将所述人员图像数据转换为HSV颜色空间图像数据;
将所述HSV颜色空间图像数据的V通道图像数据的均值和方差归一化至预设参考图像数据的均值和方差,得到新的HSV颜色空间图像数据;
将所述新的HSV颜色空间图像数据转换为BGR颜色空间图像数据,作为所述人员图像数据。
在一种可选的实施方式中,在将所述新的HSV颜色空间图像数据转换为BGR颜色空间图像数据之后,所述方法,还包括:
将所述BGR颜色空间图像数据转换为CLELAB颜色空间图像数据;
将所述CLELAB颜色空间图像数据的均值和方差归一化至所述预设参考图像数据对应的CLELAB颜色空间中的均值和方差,得到新的CLELAB颜色空间图像数据;
将所述新的CLELAB颜色空间图像数据转换为BGR颜色空间图像数据,作为所述人员图像数据。
本申请实施例第二方面提供了一种员工识别装置,包括:
人员图像获取模块,用于基于实时监控图像,获取人员图像数据;
概率分布获取模块,用于基于所述人员图像数据的像素值,构建针对于所述人员图像数据的高斯概率分布;
员工识别模块,用于计算针对于所述人员图像数据的高斯概率分布与员工特征概率分布之间的KL散度,若所述KL散度小于识别阈值,将所述人员图像数据确定为员工图像数据。
其中,概率分布获取模块,包括:
聚类中心获取子模块,用于基于所述人员图像数据的像素值,获取目标数量的聚类中心;
聚类获取子模块,用于将到每个聚类中心的距离最近的所述人员图像数据的像素值,作为所述每个聚类中心对应的像素值;
分布构建子模块,用于计算所述每个聚类中心对应的像素值的均值和方差,基于所有聚类中心对应的像素值的均值和方差,构建所述针对于所述人员图像数据的高斯概率分布。
其中,所述装置,还包括:
预学习数据获取子模块,用于对预设参考图像数据进行像素合并,得到预学习数据,所述预设参考图像数据包括多个员工图像数据;
员工分布获取子模块,用于基于所述预学习数据的像素值,构建针对于所述预学习数据的高斯概率分布,作为所述员工特征概率分布。
其中,所述员工分布获取子模块,包括:
预学习聚类中心获取子单元,用于基于所述预学习数据的像素值,获取目标数量的预学习聚类中心;
预学习聚类获取子单元,用于将到每个预学习聚类中心的距离最近的所述预学习数据的像素值,作为所述每个预学习聚类中心对应的像素值;
员工分布构建子单元,用于计算所述每个预学习聚类中心对应的像素值的均值和方差,基于所有预学习聚类中心对应的像素值的均值和方差,构建所述针对于所述预学习数据的高斯概率分布。
其中,所述人员图像获取模块,包括:
分割子模块,用于获取所述实时监控图像中人员位置,对所述人员位置进行分割,得到人员分割结果;
裁剪子模块,用于基于所述人员分割结果对所述实时监控图像进行裁剪,将所述人员分割结果作为前景图像,将背景图像设置为黑色;
人员图像获取子模块,用于将所述前景图像和所述背景图像组成所述人员图像数据。
其中,所述装置,还包括:
第一颜色空间转换模块,用于将所述人员图像数据转换为HSV颜色空间图像数据;
第一归一化模块,用于将所述HSV颜色空间图像数据的V通道图像数据的均值和方差归一化至预设参考图像数据的均值和方差,得到新的HSV颜色空间图像数据;
亮度增强模块,用于将所述新的HSV颜色空间图像数据转换为BGR颜色空间图像数据,作为所述人员图像数据。
其中,所述装置,包括:
第二颜色空间转换模块,用于将所述BGR颜色空间图像数据转换为CLELAB颜色空间图像数据;
第二归一化模块,用于将所述CLELAB颜色空间图像数据的均值和方差归一化至所述预设参考图像数据对应的CLELAB颜色空间中的均值和方差,得到新的CLELAB颜色空间图像数据;
颜色增强模块,用于将所述新的CLELAB颜色空间图像数据转换为BGR颜色空间图像数据,作为所述人员图像数据。
本申请实施例第三方面提供了一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,所述处理器执行所述计算机程序以实现第一方面中任一所述的一种员工识别方法中的步骤。
本申请实施例第四方面提供了一种计算机可读存储介质,其上存储有计算机程序/指令,该计算机程序/指令被处理器执行时实现第一方面中任一所述的一种员工识别方法中的步骤。
有益效果
本申请实施例提供了一种员工识别方法、装置、电子设备及存储介质,包括:基于实时监控图像,获取人员图像数据;基于所述人员图像数据的像素值,构建针对于所述人员图像数据的高斯概率分布;计算针对于所述人员图像数据的高斯概率分布与员工特征概率分布之间的KL散度,若所述KL散度小于识别阈值,将所述人员图像数据确定为员工图像数据。本申请基于实时图像中的人员图像数据的高斯分布与预学习的员工高斯分布的散度来判断实时图像中的人员图像与员工图像的相似性,该方案无需进行海量模型训练,且处理时间快、计算成本低,实现了轻量、高效的实现员工识别。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是现有技术进行员工识别方法流程图;
图2是本申请一实施例提出的一种员工识别方法流程图;
图3是本申请一实施例提出的一种员工识别方法示意图;
图4是本申请一实施例提出的一种员工识别装置示意图;
图5是本申请一实施例提出的一种电子设备示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
相关技术中,针对危险作业场景下的员工识别方法主要是安保人员通过现场实时监控画面基于经验进行识别,或是通过训练好的深度学习模型进行识别。然而,这些方案一方面具有较高的人力成本和时间成本,无论是安保人员或训练深度学习模型需要的数据采集、标注和清洗,均需要大量人力且耗费大量时间;另一方面,深度学习模型的训练和运行需要消耗大量计算资源。
具体而言,图1示出了一种现有技术进行员工识别方法流程图,如图1所示,采用图像识别网络进行员工识别,该种方法通过对油气站员工数据进行采集、标注和清洗后,对深度模型进行训练,完成训练后部署运行。然而,用于训练深度模型需要的数据采集、标注和清洗均需要大量人力,且数据准备、标注、清洗以及深度模型训练均需要耗费较长时间,深度模型的训练和线上运行均存在大量计算资源消耗的问题。
有鉴于此,本申请实施例提出一种员工识别方法,图2示出了一种员工识别方法流程图,如图2所示,包括如下步骤:
S101、基于实时监控图像,获取人员图像数据。
S102、基于所述人员图像数据的像素值,构建针对于所述人员图像数据的高斯概率分布。
S103、计算针对于所述人员图像数据的高斯概率分布与员工特征概率分布之间的KL散度,若所述KL散度小于识别阈值,将所述人员图像数据确定为员工图像数据。
本申请实施例中,实时监控图像为作业场景中布控的监控摄像头实时捕捉的摄像头视野范围内的实时图像,例如,所述作业场景可以为危险作业场景,危险作业场景为可能因不规范动作或设备故障等引发重大安全事故的场景,例如,油气站、化工厂等作业场景。由于在危险作业场景中进行作业的人员必须经过严格的培训后方能上岗工作,而未经培训的员工或其他无关人员(如顾客等)进入作业场景内可能会因操作和行为不规范酿成重大安全事故,因此,需要快速识别危险作业场景下的员工和非员工,以规避安全事故的发生。
其中,所述监控摄像头为高清防爆摄像头,所述摄像头为200万像素(1920*1080)的高清摄像头,并采用ipx6级防水。布防区域距离摄像头距离为9米。本申请实施例中,具体的监控摄像头参数和布防区域距离可根据实际情况进行确定,本申请在此不作限制。
本申请实施例中,人员图像数据为实时监控图像中的人员图像,该人员图像可以为摄像头视野范围内的穿有员工服的员工,也可以为穿有非员工服的任意服装的非员工人员。
本申请实施例中,所述人员图像数据是由BGR颜色空间的像素组成的,通过对BGR颜色空间的像素值进行聚类,生成聚类中心以及聚类中心对应的像素,从而构建针对于该人员图像数据的像素对应的三元独立高斯概率分布。
本申请实施例中,人员图像数据的像素对应的三元独立高斯概率分布用于表征人员图像衣服颜色信息,员工特征概率分布用于表征员工服装衣服颜色信息,通过计算两者之间的KL散度(Kullback-Leibler divergence)来衡量人员图像数据与员工特征的相似度,当人员图像数据对应的三元独立高斯概率分布与员工特征概率分布之间的KL散度小于识别阈值时,则认为所述人员图像数据中的人员为员工;当人员图像数据对应的三元独立高斯概率分布与员工特征概率分布之间的KL散度大于或等于识别阈值时,则认为所述人员图像数据中的人员为非员工。
本申请实施例中,用于计算三元独立高斯分布和KL散度的计算平台包含1张1080Ti的计算机,内存为8G,处理器主频为2.3GHz。具体计算平台的配置可根据具体情况确定,本申请在此不作限制。
图3示出了一种员工识别方法示意图,如图3所示,为了使本领域技术人员更好的理解本申请的方案,结合图3对本申请的方案进行详细描述:
具体执行步骤S101时,首先获取场景中布控的摄像头视野范围内的实时监控图像,该实时监控图像中包含至少一个人员图像。随后选定该帧的实时监控图像中的一个人员图像数据,将其单独分割出来进行后续处理,具体而言,基于实时监控图像中的动态区域和静态区域,获取动态区域中的人员区域的位置,作为所述实时监控图像中人员位置,该人员位置为所述人员图像在所述该帧的实时监控图像中的位置;在确定了该人员位置之后,对所述人员位置进行分割,得到人员分割结果。需要说明的是,所述目标检测技术和图像分割技术可参见现有技术,本申请在此不再赘述。
随后,基于所述人员分割结果对所述实时监控图像进行裁剪,将所述人员分割结果从当前帧的实时监控图像中裁剪出来,作为前景图像,同时,将背景图像设置为黑色,将所述前景图像和所述背景图像组成所述人员图像数据。该人员图像数据中的前景图像为人员图像数据的像素,背景图像为黑色防止后续对前景图像的像素进行处理时产生不良影响。需要说明的是,所述裁剪和背景置为黑色的方法可参见现有技术,本申请在此不再赘述。
在一种可选的实施方式中,在得到人员图像数据之后,对该人员图像数据进行预处理,提升后续处理过程的识别效率和准确率。具体而言,在获取所述人员图像数据之后,需要将该人员图像数据的亮度进行增强,使得该人员图像数据的亮度信息与用于生成所述员工特征概率分布的预学习数据的亮度信息统一。
由于人员图像数据的像素为BGR颜色空间的像素,为了调整该人员图像数据的亮度(明度)信息,在一种可选的实施方式中,先将所述人员图像数据转换为HSV或HSI颜色空间图像数据。以将所述人员图像数据转换为HSV颜色空间图像数据为例,HSV(Hue,Saturation, Value)颜色空间为是根据颜色的直观特性创建的一种颜色空间,也称六角锥体模型(Hexcone Model),这个模型中颜色的参数分别是色调(H)、饱和度(S)和明度(V);获取所述HSV颜色空间图像数据中的V通道数据,该V通道数据表征了该图像数据的亮度信息;随后计算所述V通道数据的均值与方差,将所述HSV颜色空间图像数据的V通道图像数据的均值和方差归一化至预设参考图像数据的均值和方差,得到新的HSV颜色空间图像数据,其中预设参考图像数据为用于构建员工特征概率分布的预学习数据;最后将所述新的HSV颜色空间图像数据转换回BGR颜色空间图像数据,作为所述人员图像数据,至此完成对人员图像数据的亮度增强,与预设参考图像数据的亮度相同。
在一种可选的实施方式中,在得到亮度增强的人员图像数据之后,还需要对该亮度增强的人员图像数据进行进一步处理,提升后续处理过程的识别效率和准确率。具体而言,在获取亮度增强后的人员图像数据之后,需要将该亮度增强后的人员图像数据的颜色进行增强,使得该人员图像数据的颜色的信息与用于生成所述员工特征概率分布的预学习数据的颜色信息统一。
由于人员图像数据的像素为BGR颜色空间的像素,为了调整该人员图像数据的颜色信息,因此需要先将所述人员图像数据转换为CLELAB颜色空间图像数据,其中,CLELAB颜色空间是一种设备无关的颜色空间,也是一种基于生理特征的颜色***,该颜色空间色域更大,是用数字化的方法来描述的视觉感应;随后计算CLELAB颜色空间图像数据的均值与方差,将所述CLELAB颜色空间图像数据的均值和方差归一化至预设参考图像数据的均值和方差,得到新的CLELAB颜色空间图像数据,其中预设参考图像数据为用于构建员工特征概率分布的预学习数据;最后将所述新的CLELAB颜色空间图像数据转换回BGR颜色空间图像数据,作为所述人员图像数据,至此完成对人员图像数据的颜色增强,与预设参考图像数据的颜色强度相同。
具体执行步骤S102时,基于所述人员图像数据的像素值,通过K均值聚类(K-means)的方式构建针对于所述人员图像数据的高斯概率分布。具体而言,首先对人员图像数据的像素值进行逐像素展开,得到人员图像数据的像素值对应的多个三维向量,该三维向量c为BGR像素值对应的向量(b,g,r);随后,将该人员图像数据的像素值对应的所有三维向量作为样本值,随机选择其中目标数量个样本值作为第一聚类中心,计算所有样本值到所述第一聚类中心的欧式距离,将与每个第一聚类中心最近的所有样本值作为该第一聚类中心对应的聚类;然后计算每个聚类内所有样本值的均值,作为新的聚类中心。重复迭代上述聚类过程,直至聚类中心的位置不再发生改变,将最后一次更新的聚类中心作为输出的聚类中心。
基于上述聚类中心的获取过程,得到目标数量的聚类中心,该聚类中心为经过上述迭代过程位置不再发生改变的聚类中心,并将到每个聚类中心的距离最近的所述人员图像数据的像素值,作为所述每个聚类中心对应的像素值,每个聚类中心对应的像素值的三维向量为cp=(bp,gp,rp);根据对应于每个聚类中心的聚类中的像素值的三维向量,计算每个聚类的均值μp和方差∑p;最后,基于所有聚类中心对应的像素值的μp和方差∑p,构建所述针对于所述人员图像数据的三元独立高斯概率分布Np~(μp,∑p),该三元独立高斯分布表征了图像中该人员的服装信息,所述服装信息可以为员工所穿着的上衣、下衣、帽子、鞋子等服装。由于员工的服装为与日常服装区别较大的工作服装,基于工作服装对人员图像数据进行聚类并获取的高斯分布可以用于表征与员工服装信息之间的差别,例如,若该针对于所述人员图像数据的三元独立高斯概率分布与针对于员工图像数据的高斯分布之间相似度较低,说明该人员图像数据中的人员的服装为员工服装的可能性较低,则该人员为员工的概率较小。
需要说明的是,聚类中心的目标数量的员工服装先验信息决定,该聚类中心至少为2个,示例性地,所述聚类中心可以取2-3个。具体的聚类中心的目标数量可根据实际情况确定,本申请在此不作限制。
以图3为例,对人员图像数据的像素值进行逐像素展开,并进行K均值聚类,得到每个聚类中心对应的三维向量。其中,每个聚类中心对应的像素值的三维向量为c,具体而言,对于图3中左侧的员工图像数据来说,每个聚类中心对应的员工图像数据像素值的三维向量为cs,其中,在第一维度上对应的向量为,其均值为/>,方差/>;在第二维度上对应的向量为/>,其均值为/>,方差/>;在第三维度上对应的向量为/>,其均值为/>,方差/>。对于图3中右侧的非员工图像数据来说,每个聚类中心对应的员工图像数据像素值的三维向量为cp,其中,在第一维度上对应的向量为/>,其均值为/>,方差/>;在第二维度上对应的向量为/>,其均值为/>,方差/>;在第三维度上对应的向量为/>,其均值为/>,方差。
至此获取了针对于人员图像数据的三元独立高斯分布,用于表征该人员图像的着装特征信息,接下来需要确定与员工特征概率分布之间的相似度,以此为判断标准确定该人员为员工或是非员工。
具体执行步骤S103时,首先获取员工特征概率分布,用于作为判断所述针对于人员图像数据的三元独立高斯分布的标准。在一种可选的实施方式中,所述员工特征概率分布按照如下方式获取:
首先,获取事先存储的多个员工图像数据,该员工图像数据中的人员为穿有员工服装的员工,将多个员工图像数据作为预设参考图像,用于获取针对于员工图像数据的三元独立高斯分布,将多个员工图像数据进行合并,得到预学习数据,该预学习数据包含了多个员工图像数据中BGR颜色空间的像素值。
基于所述预学习数据的像素值,通过K均值聚类(K-means)的方式构建针对于所述预学习数据的高斯概率分布。具体而言,首先对预学习数据的像素值进行逐像素展开,得到人员图像数据的像素值对应的多个三维向量,该三维向量cs为BGR像素值对应的向量(bs,gs,rs);随后,将该预学习数据的像素值对应的所有三维向量作为样本值,随机选择其中目标数量个样本值作为第一预学习聚类中心,计算所有样本值到所述第一预学习聚类中心的欧式距离,将与每个第一预学习聚类中心最近的所有样本值作为该第一预学习聚类中心对应的聚类;然后计算每个聚类内所有样本值的均值,作为新的预学习聚类中心。重复迭代上述聚类过程,直至预学习聚类中心的位置不再发生改变,将最后一次更新的预学习聚类中心作为输出的预学习聚类中心。
基于上述预学习聚类中心的获取过程,得到目标数量的预学习聚类中心,该预学习聚类中心为经过上述迭代过程位置不再发生改变的预学习聚类中心,并将到每个预学习聚类中心的距离最近的所述预学习数据的像素值,作为所述每个预学习聚类中心对应的像素值,每个预学习聚类中心对应的像素值的三维向量为cs=(bs,gs,rs);根据对应于每个预学习聚类中心的聚类中的像素值的三维向量,计算每个聚类的均值μs和方差∑s;最后,基于所有预学习聚类中心对应的像素值的均值μs和方差∑s,构建所述针对于所述预学习数据的三元独立高斯概率分布Ns~(μs,∑s),该三元独立高斯分布表征了预学习数据中预设参考图像中员工的服装信息,所述服装信息可以为员工所穿着的上衣、下衣、帽子、鞋子等服装。该针对于预学习数据的三元独立高斯分布表征了员工服装信息,作为员工识别的标准,若针对于人员图像数据的三元独立高斯分布与所述针对于预学习数据的三元独立高斯分布之间相似度较高,说明该人员图像数据中的人员为员工的可能性较大;若针对于人员图像数据的三元独立高斯分布与所述针对于预学习数据的三元独立高斯分布之间相似度较低,说明该人员图像数据中的人员为员工的可能性较低。
需要说明的是,预学习聚类中心的目标数量基于员工服装先验信息决定,该预学习聚类中心至少为2个,一般取2-3个。具体的预学习聚类中心的目标数量可根据实际情况确定,本申请在此不作限制。
在获取所述针对于人员图像数据的三元独立高斯分布与所述针对于预学习数据的三元独立高斯分布之后,计算两者之间的KL散度(Kullback-Leibler divergence)来表征两者的相似度。在统计学意义上来说,KL散度可以用来衡量两个分布之间的差异程度。若两者差异越小,KL散度越小;反之,若两者差异越大,KL散度越大;当两者分布一致时,其KL散度为0。
在本申请实施例中,设置了识别阈值来区分KL散度的计算结果。具体而言,若针对于人员图像数据的三元独立高斯分布Np与所述针对于预学习数据的三元独立高斯分布Ns之间的KL散度小于识别阈值,说明针对于人员图像数据的三元独立高斯分布Np与所述针对于预学习数据的三元独立高斯分布Ns之间差异较小,此时说明人员图像数据与预学习数据之间相似度较高,将所述人员图像数据确定为员工图像数据,人员图像数据中的人员为员工;若针对于人员图像数据的三元独立高斯分布Np与所述针对于预学习数据的三元独立高斯分布Ns之间的KL散度大于或等于识别阈值,说明针对于人员图像数据的三元独立高斯分布Np与所述针对于预学习数据的三元独立高斯分布Ns之间差异较大,此时说明人员图像数据与预学习数据之间相似度较低,将所述人员图像数据确定为非员工图像数据,人员图像数据中的人员为非员工的人员。示例性地,所述识别阈值一般取30.0KL散度,需要说明的是,所述识别阈值可根据实际情况确定,本申请在此不作限制。
在一种可选的实施方式中,在得到识别结果之后,该识别结果可用于后续下游任务的输入信息,例如对危险作业场景下的危险行为进行识别,有效规避危险事件的发生。例如,可支撑油气站员工着装是否规范判断、周界入侵检测、加油区长期无工作人员识别、员工上班打瞌睡检测等下游任务的算法。在基于本申请的方案完成油气站内人员身份识别后,才执行对应下游任务的算法逻辑运算,避免因所有算法一起推理造成的计算资源浪费问题,节约了计算成本。
本申请实施例提供了一种员工识别方法,包括:基于实时监控图像,获取人员图像数据;基于所述人员图像数据的像素值,构建针对于所述人员图像数据的高斯概率分布;计算针对于所述人员图像数据的高斯概率分布与员工特征概率分布之间的KL散度,若所述KL散度小于识别阈值,将所述人员图像数据确定为员工图像数据。本申请基于实时图像中的人员图像数据的高斯分布与预学习的员工高斯分布的散度来判断实时图像中的人员图像与员工图像的相似性,该方案无需进行海量模型训练,且处理时间快、计算成本低,实现了轻量、高效的实现员工识别。
基于同一发明构思,本申请实施例公开一种员工识别装置,图4示出了一种员工识别装置示意图,如图4所示,包括:
人员图像获取模块,用于基于实时监控图像,获取人员图像数据;
概率分布获取模块,用于基于所述人员图像数据的像素值,构建针对于所述人员图像数据的高斯概率分布;
员工识别模块,用于计算针对于所述人员图像数据的高斯概率分布与员工特征概率分布之间的KL散度,若所述KL散度小于识别阈值,将所述人员图像数据确定为员工图像数据。
其中,概率分布获取模块,包括:
聚类中心获取子模块,用于基于所述人员图像数据的像素值,获取目标数量的聚类中心;
聚类获取子模块,用于将到每个聚类中心的距离最近的所述人员图像数据的像素值,作为所述每个聚类中心对应的像素值;
分布构建子模块,用于计算所述每个聚类中心对应的像素值的均值和方差,基于所有聚类中心对应的像素值的均值和方差,构建所述针对于所述人员图像数据的高斯概率分布。
其中,所述装置,还包括:
预学习数据获取子模块,用于对预设参考图像数据进行像素合并,得到预学习数据,所述预设参考图像数据包括多个员工图像数据;
员工分布获取子模块,用于基于所述预学习数据的像素值,构建针对于所述预学习数据的高斯概率分布,作为所述员工特征概率分布。
其中,所述员工分布获取子模块,包括:
预学习聚类中心获取子单元,用于基于所述预学习数据的像素值,获取目标数量的预学习聚类中心;
预学习聚类获取子单元,用于将到每个预学习聚类中心的距离最近的所述预学习数据的像素值,作为所述每个预学习聚类中心对应的像素值;
员工分布构建子单元,用于计算所述每个预学习聚类中心对应的像素值的均值和方差,基于所有预学习聚类中心对应的像素值的均值和方差,构建所述针对于所述预学习数据的高斯概率分布。
其中,所述人员图像获取模块,包括:
分割子模块,用于获取所述实时监控图像中人员位置,对所述人员位置进行分割,得到人员分割结果;
裁剪子模块,用于基于所述人员分割结果对所述实时监控图像进行裁剪,将所述人员分割结果作为前景图像,将背景图像设置为黑色;
人员图像获取子模块,用于将所述前景图像和所述背景图像组成所述人员图像数据。
其中,所述装置,还包括:
第一颜色空间转换模块,用于将所述人员图像数据转换为HSV颜色空间图像数据;
第一归一化模块,用于将所述HSV颜色空间图像数据的V通道图像数据的均值和方差归一化至预设参考图像数据的均值和方差,得到新的HSV颜色空间图像数据;
亮度增强模块,用于将所述新的HSV颜色空间图像数据转换为BGR颜色空间图像数据,作为所述人员图像数据。
其中,所述装置,包括:
第二颜色空间转换模块,用于将所述BGR颜色空间图像数据转换为CLELAB颜色空间图像数据;
第二归一化模块,用于将所述CLELAB颜色空间图像数据的均值和方差归一化至所述预设参考图像数据对应的CLELAB颜色空间中的均值和方差,得到新的CLELAB颜色空间图像数据;
颜色增强模块,用于将所述新的CLELAB颜色空间图像数据转换为BGR颜色空间图像数据,作为所述人员图像数据。
基于同一发明构思,本申请实施例公开了一种电子设备,图5示出了本申请实施例公开的电子设备示意图,如图5所示,电子设备100包括:存储器110和处理器120,存储器110与处理器120之间通过总线通信连接,存储器110中存储有计算机程序,该计算机程序可在处理器120上运行,以实现本申请实施例公开的一种员工识别方法中的步骤。
基于同一发明构思,本申请实施例公开了一种计算机可读存储介质,其上存储有计算机程序/指令,该计算机程序/指令被处理器执行时实现本申请实施例公开的一种员工识别方法中的步骤。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本发明实施例是参照根据本发明实施例的方法、装置、电子设备和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种员工识别方法、装置、电子设备及存储介质,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (9)
1.一种员工识别方法,其特征在于,包括:
基于实时监控图像,获取人员图像数据;
对所述人员图像数据进行亮度增强,以使所述人员图像数据的亮度与预设参考图像数据的亮度相同;
对所述人员图像数据进行颜色增强,以使所述人员图像数据的颜色强度与所述预设参考图像数据的颜色强度相同;
基于所述人员图像数据的像素值,构建针对于所述人员图像数据的高斯概率分布,所述针对于所述人员图像数据的高斯概率分布用于表征所述人员图像数据的服装信息;
对所述预设参考图像数据进行像素合并,得到预学习数据,所述预设参考图像数据包括多个员工图像数据,所述员工图像数据为BGR颜色空间的数据;
基于所述预学习数据的像素值,构建针对于所述预学习数据的高斯概率分布,作为员工特征概率分布,所述员工特征概率分布用于表征所述员工图像数据的服装信息;
计算针对于所述人员图像数据的高斯概率分布与所述员工特征概率分布之间的KL散度,若所述KL散度小于识别阈值,将所述人员图像数据确定为员工图像数据。
2.根据权利要求1所述的一种员工识别方法,其特征在于,基于所述人员图像数据的像素值,构建针对于所述人员图像数据的高斯概率分布,包括:
基于所述人员图像数据的像素值,获取目标数量的聚类中心;
将到每个聚类中心的距离最近的所述人员图像数据的像素值,作为所述每个聚类中心对应的像素值;
计算所述每个聚类中心对应的像素值的均值和方差,基于所有聚类中心对应的像素值的均值和方差,构建所述针对于所述人员图像数据的高斯概率分布。
3.根据权利要求1所述的一种员工识别方法,其特征在于,基于所述预学习数据的像素值,构建针对于所述预学习数据的高斯概率分布,包括:
基于所述预学习数据的像素值,获取目标数量的预学习聚类中心;
将到每个预学习聚类中心的距离最近的所述预学习数据的像素值,作为所述每个预学习聚类中心对应的像素值;
计算所述每个预学习聚类中心对应的像素值的均值和方差,基于所有预学习聚类中心对应的像素值的均值和方差,构建所述针对于所述预学习数据的高斯概率分布。
4.根据权利要求1所述的一种员工识别方法,其特征在于,基于实时监控图像,获取人员图像数据,包括:
获取所述实时监控图像中人员位置,对所述人员位置进行分割,得到人员分割结果;
基于所述人员分割结果对所述实时监控图像进行裁剪,将所述人员分割结果作为前景图像,将背景图像设置为黑色;
将所述前景图像和所述背景图像组成所述人员图像数据。
5.根据权利要求1所述的一种员工识别方法,其特征在于,所述人员图像数据为BGR颜色空间图像数据,对所述人员图像数据进行亮度增强,以使所述人员图像数据的亮度与预设参考图像数据的亮度相同,包括:
将所述人员图像数据转换为HSV颜色空间图像数据;
将所述HSV颜色空间图像数据的V通道图像数据的均值和方差归一化至预设参考图像数据的均值和方差,得到新的HSV颜色空间图像数据;
将所述新的HSV颜色空间图像数据转换为BGR颜色空间图像数据,作为所述人员图像数据。
6.根据权利要求5所述的一种员工识别方法,其特征在于,对所述人员图像数据进行颜色增强,以使所述人员图像数据的颜色强度与所述预设参考图像数据的颜色强度相同,包括:
将所述BGR颜色空间图像数据转换为CLELAB颜色空间图像数据;
将所述CLELAB颜色空间图像数据的均值和方差归一化至所述预设参考图像数据对应的CLELAB颜色空间中的均值和方差,得到新的CLELAB颜色空间图像数据;
将所述新的CLELAB颜色空间图像数据转换为BGR颜色空间图像数据,作为所述人员图像数据。
7.一种员工识别装置,其特征在于,包括:
人员图像获取模块,用于基于实时监控图像,获取人员图像数据;
亮度增强模块,用于对所述人员图像数据进行亮度增强,以使所述人员图像数据的亮度与预设参考图像数据的亮度相同;
颜色增强模块,用于对所述人员图像数据进行颜色增强,以使所述人员图像数据的颜色强度与所述预设参考图像数据的颜色强度相同;
概率分布获取模块,用于基于所述人员图像数据的像素值,构建针对于所述人员图像数据的高斯概率分布,所述针对于所述人员图像数据的高斯概率分布用于表征所述人员图像数据的服装信息;
预学习数据获取模块,用于对所述预设参考图像数据进行像素合并,得到预学习数据,所述预设参考图像数据包括多个员工图像数据,所述员工图像数据为BGR颜色空间的数据;
员工分布获取模块,用于基于所述预学习数据的像素值,构建针对于所述预学习数据的高斯概率分布,作为所述员工特征概率分布,所述员工特征概率分布用于表征所述员工图像数据的服装信息;
员工识别模块,用于计算针对于所述人员图像数据的高斯概率分布与员工特征概率分布之间的KL散度,若所述KL散度小于识别阈值,将所述人员图像数据确定为员工图像数据。
8.一种电子设备,其特征在于,包括存储器、处理器及存储在存储器上的计算机程序,所述处理器执行所述计算机程序以实现权利要求1-6中任一所述的一种员工识别方法中的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现权利要求1-6中任一所述的一种员工识别方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310080028.XA CN115830641B (zh) | 2023-02-08 | 2023-02-08 | 一种员工识别方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310080028.XA CN115830641B (zh) | 2023-02-08 | 2023-02-08 | 一种员工识别方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115830641A CN115830641A (zh) | 2023-03-21 |
CN115830641B true CN115830641B (zh) | 2023-06-09 |
Family
ID=85520885
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310080028.XA Active CN115830641B (zh) | 2023-02-08 | 2023-02-08 | 一种员工识别方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115830641B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116958707B (zh) * | 2023-08-18 | 2024-04-23 | 武汉市万睿数字运营有限公司 | 一种基于球机监控设备的图像分类方法、装置及相关介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110991389A (zh) * | 2019-12-16 | 2020-04-10 | 西安建筑科技大学 | 判断目标行人在非重叠相机视角中出现的匹配方法 |
CN114581792A (zh) * | 2022-03-09 | 2022-06-03 | 山东原产地信息科技有限公司 | 基于卫星遥感图像的农业灾害监测方法和*** |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101188018B (zh) * | 2007-12-06 | 2010-08-25 | 北大方正集团有限公司 | 一种在排版过程中进行自动退地的方法及装置 |
CN105243653A (zh) * | 2015-11-05 | 2016-01-13 | 北京航天泰坦科技股份有限公司 | 一种基于动态匹配的无人机遥感影像快速拼接技术 |
CN107507138B (zh) * | 2017-07-27 | 2019-07-05 | 北京大学深圳研究生院 | 一种基于Retinex模型的水下图像增强方法 |
US11803974B2 (en) * | 2018-10-05 | 2023-10-31 | The Trustees Of Princeton University | Automated system to measure multi-animal body part dynamics |
CN111080649B (zh) * | 2019-12-10 | 2023-05-30 | 桂林电子科技大学 | 一种基于黎曼流形空间的图像分割处理方法及*** |
EP3944138A1 (en) * | 2020-07-24 | 2022-01-26 | Sony Semiconductor Solutions Corporation | Method and apparatus for image recognition |
CN112749645B (zh) * | 2020-12-30 | 2023-08-01 | 成都云盯科技有限公司 | 基于监控视频的服装颜色检测方法、装置和设备 |
CN113807319A (zh) * | 2021-10-15 | 2021-12-17 | 云从科技集团股份有限公司 | 人脸识别优化方法、装置、设备和介质 |
-
2023
- 2023-02-08 CN CN202310080028.XA patent/CN115830641B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110991389A (zh) * | 2019-12-16 | 2020-04-10 | 西安建筑科技大学 | 判断目标行人在非重叠相机视角中出现的匹配方法 |
CN114581792A (zh) * | 2022-03-09 | 2022-06-03 | 山东原产地信息科技有限公司 | 基于卫星遥感图像的农业灾害监测方法和*** |
Non-Patent Citations (2)
Title |
---|
Efficient contrast enhancement using adaptive gamma correction with weighting distribution;Huang S C等;《IEEE transactions on image processing》;第22卷(第3期);1032-1041 * |
基于三边滤波的HSV色彩空间Retinex图像增强算法;秦绪等;《小型微型计算机***》;第37卷(第1期);168-172 * |
Also Published As
Publication number | Publication date |
---|---|
CN115830641A (zh) | 2023-03-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10452925B2 (en) | Video monitoring method and video monitoring device | |
KR101640998B1 (ko) | 화상 처리 장치 및 화상 처리 방법 | |
CN113361495B (zh) | 人脸图像相似度的计算方法、装置、设备及存储介质 | |
US9418426B1 (en) | Model-less background estimation for foreground detection in video sequences | |
CN112464850B (zh) | 图像处理方法、装置、计算机设备及介质 | |
JP2014041476A (ja) | 画像処理装置、画像処理方法及びプログラム | |
CN112101260B (zh) | 一种作业人员安全带识别方法、装置、设备和存储介质 | |
CN115830641B (zh) | 一种员工识别方法、装置、电子设备及存储介质 | |
JP2004062605A (ja) | シーン識別方法および装置ならびにプログラム | |
CN114241542A (zh) | 基于图像拼接的人脸识别方法 | |
Liu et al. | Scene background estimation based on temporal median filter with Gaussian filtering | |
CN111274964A (zh) | 一种基于无人机视觉显著性分析水面污染物的检测方法 | |
CN112560880A (zh) | 目标分类方法、目标分类装置及计算机可读存储介质 | |
Aakroum et al. | Deep learning for inferring the surface solar irradiance from sky imagery | |
Tuba et al. | Forest fires detection in digital images based on color features | |
CN116030417B (zh) | 一种员工识别方法、装置、设备、介质及产品 | |
CN110795995A (zh) | 数据处理方法、装置及计算机可读存储介质 | |
KR101419837B1 (ko) | 분할 이미지 셀을 이용하는 아다부스트 기반의 보행자 검출 방법 및 장치 | |
CN114677667A (zh) | 一种基于深度学习的变电站电气设备红外故障识别方法 | |
Lin et al. | Foreground object detection in highly dynamic scenes using saliency | |
CN112418248A (zh) | 基于fpga加速器的目标检测方法及*** | |
Shemshaki et al. | Face detection based on fuzzy granulation and skin color segmentation | |
Higashi et al. | New feature for shadow detection by combination of two features robust to illumination changes | |
Jayasinghe et al. | Adaptive free cylindrical mixture model for foreground estimation in rapidly fluctuating dynamic background conditions | |
CN109389582B (zh) | 一种图像主体亮度的识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP01 | Change in the name or title of a patent holder | ||
CP01 | Change in the name or title of a patent holder |
Address after: No. 1, Floor 10, Building 2, No. 11, Wuke East 4th Road, Wuhou District, Chengdu, Sichuan, 610041 Patentee after: Sichuan Honghe Digital Intelligence Group Co.,Ltd. Address before: No. 1, Floor 10, Building 2, No. 11, Wuke East 4th Road, Wuhou District, Chengdu, Sichuan, 610041 Patentee before: Sichuan Honghe Communication Group Co.,Ltd. |