CN114783042A - 基于多移动目标的人脸识别方法、装置、设备及存储介质 - Google Patents

基于多移动目标的人脸识别方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN114783042A
CN114783042A CN202210718844.4A CN202210718844A CN114783042A CN 114783042 A CN114783042 A CN 114783042A CN 202210718844 A CN202210718844 A CN 202210718844A CN 114783042 A CN114783042 A CN 114783042A
Authority
CN
China
Prior art keywords
region
pedestrian
face
area
features
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210718844.4A
Other languages
English (en)
Inventor
孙成智
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Jvt Technology Co ltd
Original Assignee
Shenzhen Jvt Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Jvt Technology Co ltd filed Critical Shenzhen Jvt Technology Co ltd
Priority to CN202210718844.4A priority Critical patent/CN114783042A/zh
Publication of CN114783042A publication Critical patent/CN114783042A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及人工智能技术,揭露了一种基于多移动目标的人脸识别方法,包括:从待检测图像集合的图像中提取候选区域集合,从候选区域集合中生成行人候选区域,提取行人候选区域中的HOG特征及CLBP特征并进行特征融合,得到混合特征,利用预训练的分类器对行人候选区域中的行人进行定位,得到行人定位区域,利用几何先验算法进行人脸区域粗定位,得到原始人脸区域,基于预设的颜色空间模型对原始人脸区域进行精定位,得到标准人脸区域,利用预训练的卷积神经网络对标准人脸区域进行人脸识别,得到人脸识别结果。本发明还提出一种基于多移动目标的人脸识别方法装置、电子设备以及计算机可读存储介质。本发明可以解决人脸识别准确度不高的问题。

Description

基于多移动目标的人脸识别方法、装置、设备及存储介质
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于多移动目标的人脸识别方法、装置、电子设备及计算机可读存储介质。
背景技术
随着人工智能的快速发展和视频监控***的日渐普及,人脸识别研究在安防领域具有重大的意义。相比于其他生物识别技术,人脸识别具有交互友好性,方便性等优势。
目前,针对约束性场景下的人脸识别已经达到商用的程度,但是在自然场景中,例如监控场景、宿舍门禁中,人脸由于受角度,光照,分辨率等诸多因素的影响,造成了识别上的困难,导致人脸识别准确率不高。
发明内容
本发明提供一种基于多移动目标的人脸识别方法、装置、电子设备及可读存储介质,其主要目的在于解决人脸识别准确度不高的问题。
为实现上述目的,本发明提供的一种基于多移动目标的人脸识别方法,包括:
获取目标视频数据,从所述目标视频数据中读取待检测图像集合;
基于选择性搜索算法从所述待检测图像集合的图像中提取候选区域集合;
基于窗口筛选算法从所述候选区域集合中生成行人候选区域,提取所述行人候选区域中的HOG 特征,以及提取所述行人候选区域中的CLBP 特征,对所述HOG 特征及所述CLBP 特征进行特征融合,得到混合特征;
基于所述混合特征,利用预训练的分类器对所述行人候选区域中的行人进行定位,得到行人定位区域;
利用几何先验算法对所述行人定位区域进行人脸区域粗定位,得到原始人脸区域;
基于预设的颜色空间模型对所述原始人脸区域进行精定位,得到标准人脸区域;
利用预训练的卷积神经网络对所述标准人脸区域进行人脸识别,得到人脸识别结果。
可选地,所述基于选择性搜索算法从所述待检测图像集合的图像中提取候选区域集合,包括:
对所述待检测图像集合中的图像进行随机分割,得到子区域集合;
计算所述子区域集合中相邻子区域的局部相似度,并在所述局部相似度满足预设的相似阈值时,将相邻子区域进行合并,得到更新后的子区域;
从所述子区域集合中移除与所述合并子区域相关的子区域,并返回所述计算所述子区域集合中相邻子区域的局部相似度的步骤,直至满足预设的迭代条件时,汇总所有的合并子区域得到合并子区域集合;
对所述合并子区域集合进行窗口筛选,得到所述候选区域集合。
可选地,所述提取所述行人候选区域中的HOG 特征,包括:
根据Gamma校正法对所述行人候选区域进行颜色空间归一化处理,得到矫正区域;
计算所述矫正区域内水平方向及垂直方向的梯度直方图;
利用预设方向及幅度的细胞单元收集所述梯度直方图中的特征,得到所述HOG特征。
可选地,所述提取所述行人候选区域中的CLBP 特征,包括:
利用预设的采集窗口对所述行人候选区域进行采样,得到采样区域;
计算所述采样区域内中心点的灰度特征、差值符号特征及差值幅度特征;
串联所述差值符号特征、所述差值幅度特征及所述中心点的灰度特征,得到所述CLBP 特征。
可选地,所述利用预训练的分类器对所述行人候选区域中的行人进行定位之前,所述方法还包括:
获取行人训练图像集合,对所述行人训练图像集合中的图像进行数据增广处理,得到标准训练图像集合;
提取所述标准训练图像集合中图像的HOG 特征及CLBP 特征;
基于PCA算法对所述标准训练图像集合中图像的HOG 特征及CLBP 特征进行降维并串联融合;
利用串联融合后的特征训练预设的SVM分类器,在所述SVM分类器不收敛时,将SVM分类器分类错误的图像重新添加至所述行人训练图像集合,并返回所述对所述行人训练图像集合中的图像进行数据增广处理的步骤,直至所述SVM分类器收敛时,得到所述预训练的分类器。
可选地,所述基于预设的颜色空间模型对所述原始人脸区域进行精定位,得到标准人脸区域,包括:
基于所述颜色空间模型识别出所述原始人脸区域中的肤色区域;
对所述肤色区域进行腐蚀、膨胀及连通域检测处理,得到标准肤色区域;
确定所述标准肤色区域的最大外接矩阵为所述标准人脸区域。
可选地,利用下述公式计算所述采样区域内中心点的灰度特征、差值符号特征及差值幅度特征:
Figure 100002_DEST_PATH_IMAGE001
Figure 875791DEST_PATH_IMAGE002
Figure 100002_DEST_PATH_IMAGE003
Figure 452397DEST_PATH_IMAGE004
其中,
Figure 100002_DEST_PATH_IMAGE005
为所述采样区域内中心点的灰度特征,
Figure 37093DEST_PATH_IMAGE006
表示中心点的像素灰度 值,
Figure 100002_DEST_PATH_IMAGE007
表示在中心点不断移动时关于
Figure 846786DEST_PATH_IMAGE006
的灰度均值,
Figure 11182DEST_PATH_IMAGE008
表示采样窗口数,
Figure 160404DEST_PATH_IMAGE009
为所述 采样区域的差值符号特征,
Figure 368531DEST_PATH_IMAGE010
表示采样区域内采样点个数,
Figure 353936DEST_PATH_IMAGE011
表示与中心点相邻的第
Figure 571291DEST_PATH_IMAGE012
个 像素点的灰度值,
Figure 309440DEST_PATH_IMAGE013
为所述采样区域的差值幅度特征,
Figure 970359DEST_PATH_IMAGE014
Figure 426748DEST_PATH_IMAGE015
为中心 点移动幅度均值。
为了解决上述问题,本发明还提供一种基于多移动目标的人脸识别装置,所述装置包括:
候选区域提取模块,用于获取目标视频数据,从所述目标视频数据中读取待检测图像集合,基于选择性搜索算法从所述待检测图像集合的图像中提取候选区域集合;
特征混合模块,用于基于窗口筛选算法从所述候选区域集合中生成行人候选区域,提取所述行人候选区域中的HOG 特征,以及提取所述行人候选区域中的CLBP 特征,对所述HOG 特征及所述CLBP 特征进行特征融合,得到混合特征;
行人区域定位模块,用于基于所述混合特征,利用预训练的分类器对所述行人候选区域中的行人进行定位,得到行人定位区域;
人脸区域定位模块,用于利用几何先验算法对所述行人定位区域进行人脸区域粗定位,得到原始人脸区域,基于预设的颜色空间模型对所述原始人脸区域进行精定位,得到标准人脸区域;
人脸识别模块,用于利用预训练的卷积神经网络对所述标准人脸区域进行人脸识别,得到人脸识别结果。
为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
存储器,存储至少一个计算机程序;及
处理器,执行所述存储器中存储的计算机程序以实现上述所述的基于多移动目标的人脸识别方法。
为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个计算机程序,所述至少一个计算机程序被电子设备中的处理器执行以实现上述所述的基于多移动目标的人脸识别方法。
本实施例通过选择性搜索算法从待检测图像集合的图像中提取候选区域集合,并基于窗口筛选算法从候选区域集合中生成行人候选区域,可以筛选出大量无效区域,从而提高人脸识别检测的效率。同时,提取行人候选区域中的HOG 特征及提取行人候选区域中的CLBP 特征,并进行特征融合,得到混合特征,可以更加关注图像的局部特征,从而提高对行人检测的准确率。并且,通过几何先验算法及颜色空间模型来对人脸区域进行粗定位及精定位,提高了人脸定位的精度,并基于卷积神经网络来对最后得到的标准人脸区域进行人脸识别,可以进一步提高对人脸识别的准确率。因此本发明提出的基于多移动目标的人脸识别方法、装置、电子设备及计算机可读存储介质,可以解决人脸识别准确度不高的问题。
附图说明
图1为本发明一实施例提供的基于多移动目标的人脸识别方法的流程示意图;
图2为本发明一实施例提供的基于多移动目标的人脸识别装置的功能模块图;
图3为本发明一实施例提供的实现所述基于多移动目标的人脸识别方法的电子设备的结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本申请实施例提供一种基于多移动目标的人脸识别方法。所述基于多移动目标的人脸识别方法的执行主体包括但不限于服务端、终端等能够被配置为执行本申请实施例提供的该方法的电子设备中的至少一种。换言之,所述基于多移动目标的人脸识别方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。所述服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content DeliveryNetwork,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
参照图1所示,为本发明一实施例提供的基于多移动目标的人脸识别方法的流程示意图。在本实施例中,所述基于多移动目标的人脸识别方法包括:
S1、获取目标视频数据,从所述目标视频数据中读取待检测图像集合。
本发明实施例中,所述目标视频数据可以为离线视频数据、实时视频数据等。例如,在学校、企业等场景下,离线视频视频可以为历史存储的视频文件(宿舍门口等场景中),实时视频数据可以为***连接 USB 摄像头实时采集的视频流。
本发明一可选实施例中, 可以按照预设的采集间隔对所述目标视频数据中的视频流进行截图,得到待检测图像集合。
需解释的是,由于本发明应用于视频中多移动目标的人脸识别,在视频中人脸会因为光照、遮挡等干扰因素导致识别不准确,因此可以通过逐帧读取目标视频数据中的图像,尽可能的扩大检测图像的数量,从而提高人脸识别的准确率。
S2、基于选择性搜索算法从所述待检测图像集合的图像中提取候选区域集合。
本发明实施例中,图像中物体可能存在的物体应该是有某些相似性或者连续性区域的,因此,本发明实施例采用选择性搜索算法(Selective Search)采用子区域合并的方法提取候选边界框(即候选区域)。首先,对输入图像进行分割算法产生许多小的子区域。其次,根据这些子区域之间相似性(相似性标准主要有颜色、纹理、大小等等)进行区域合并,不断的进行区域迭代合并,得到候选区域。
具体的,所述基于选择性搜索算法从所述待检测图像集合的图像中提取候选区域集合,包括:
对所述待检测图像集合中的图像进行随机分割,得到子区域集合;
计算所述子区域集合中相邻子区域的局部相似度,并在所述局部相似度满足预设的相似阈值时,将相邻子区域进行合并,得到更新后的子区域;
从所述子区域集合中移除与所述合并子区域相关的子区域,并返回所述计算所述子区域集合中相邻子区域的局部相似度的步骤,直至满足预设的迭代条件时,汇总所有的合并子区域得到合并子区域集合;
对所述合并子区域集合进行窗口筛选,得到所述候选区域集合。
本发明实施例中,所述局部相似度包括颜色、纹理、大小、吻合度的相似度。进一步地,本发明实施例可以利用下述公式计算相邻子区域的局部相似度:
Figure 447794DEST_PATH_IMAGE016
Figure 306029DEST_PATH_IMAGE017
Figure 872270DEST_PATH_IMAGE018
Figure 815955DEST_PATH_IMAGE019
其中,
Figure 375113DEST_PATH_IMAGE020
Figure 838586DEST_PATH_IMAGE021
Figure 90576DEST_PATH_IMAGE022
Figure 521557DEST_PATH_IMAGE023
分别表示相邻区域
Figure 618826DEST_PATH_IMAGE024
的颜色、纹 理、大小及吻合度的相似度,
Figure 214104DEST_PATH_IMAGE025
表示颜色直方图维数,
Figure 636995DEST_PATH_IMAGE026
表示相邻区域
Figure 306005DEST_PATH_IMAGE024
的第
Figure 206965DEST_PATH_IMAGE027
个 颜色直方图,
Figure 159878DEST_PATH_IMAGE028
表示 SIFT 特征的特征维数,
Figure 504403DEST_PATH_IMAGE029
表示相邻区域
Figure 644397DEST_PATH_IMAGE024
的SIFT 特征的第
Figure 83468DEST_PATH_IMAGE027
维特征值,
Figure 890887DEST_PATH_IMAGE030
表示区域
Figure 140734DEST_PATH_IMAGE031
的大小,
Figure 33604DEST_PATH_IMAGE032
表示区域
Figure 276366DEST_PATH_IMAGE033
的大小,
Figure 954604DEST_PATH_IMAGE034
表示整幅 图像的大小,
Figure 624619DEST_PATH_IMAGE035
表示合并子区域的大小。
本发明一可选实施例中,由于选择性搜索算法基于颜色、纹理、大小、吻合度的相似度子区域合并策略,所以可以包含各种大小的疑似区域,从而提高行人检测的准确率。
S3、基于窗口筛选算法从所述候选区域集合中生成行人候选区域,提取所述行人候选区域中的HOG 特征,以及提取所述行人候选区域中的CLBP 特征,对所述HOG 特征及所述CLBP 特征进行特征融合,得到混合特征。
本发明实施例中,所述窗口筛选算法是指利用预设范围的窗口固定所述候选区域集合中的区域大小,由于本发明用于人脸识别,因此通过上述窗口筛选算法来进一步提高对行人检测的准确率。
详细地,所述基于窗口筛选算法从所述候选区域集合中生成行人候选区域,包括:
计算所述候选区域集合中各候选区域的窗口比例,并利用下述窗口范围公式从所述候选区域集合中筛选出满足预设窗口范围的行人候选区域:
Figure 473627DEST_PATH_IMAGE036
其中,
Figure 536392DEST_PATH_IMAGE037
为预设窗口范围的下限,
Figure 52824DEST_PATH_IMAGE038
为预设窗口范围的上限,
Figure 159320DEST_PATH_IMAGE039
为窗口比例,
Figure 495623DEST_PATH_IMAGE040
为 候选区域的宽度,
Figure 830921DEST_PATH_IMAGE041
为候选区域的高度。
本发明实施例中,HOG 特征能够对物体的形状以及边缘分布进行很好的描述,因此适用于行人检测,而 CLBP特征保留了原始的LBP 特征所没有的空间结构信息,能提取更加充分的纹理特征,通过HOG 特征与 CLBP 特征融合,可以提高对局部特征的关注,从而提高识别的准确率。
详细地,所述提取所述行人候选区域中的HOG 特征,包括:
根据Gamma校正法对所述行人候选区域进行颜色空间归一化处理,得到矫正区域;
计算所述矫正区域内水平方向及垂直方向的梯度直方图;
利用预设方向及幅度的细胞单元收集所述梯度直方图中的特征,得到所述HOG特征。
本发明一可选实施例中,所述Gamma校正法及梯度直方图的计算方法为现有公知技术,在此不再赘述。同时细胞单元的大小可以为8×8的像素点,并以8个像素为滑动步长幅度在水平方向和垂直方向进行扫描,且每2×2个的细胞单元构成一个块,通过组合块中梯度直方图中的特征得到HOG特征。
具体地,所述提取所述行人候选区域中的CLBP 特征,包括:
利用预设的采集窗口对所述行人候选区域进行采样,得到采样区域;
计算所述采样区域内中心点的灰度特征、差值符号特征及差值幅度特征;
串联所述差值符号特征、所述差值幅度特征及所述中心点的灰度特征,得到所述CLBP 特征。
本发明一可选实施例中,可以利用下述公式计算所述采样区域内中心点的灰度特征、差值符号特征及差值幅度特征:
Figure 467439DEST_PATH_IMAGE042
Figure 744836DEST_PATH_IMAGE043
Figure 584747DEST_PATH_IMAGE044
Figure 973003DEST_PATH_IMAGE045
其中,
Figure 729607DEST_PATH_IMAGE005
为所述采样区域内中心点的灰度特征,
Figure 663059DEST_PATH_IMAGE006
表示中心点的像素灰度 值,
Figure 973954DEST_PATH_IMAGE007
表示在中心点不断移动时关于
Figure 165901DEST_PATH_IMAGE006
的灰度均值,
Figure 262165DEST_PATH_IMAGE008
表示采样窗口数,
Figure 881365DEST_PATH_IMAGE009
为所述 采样区域的差值符号特征,
Figure 679556DEST_PATH_IMAGE010
表示采样区域内采样点个数,
Figure 425927DEST_PATH_IMAGE011
表示与中心点相邻的第
Figure 360385DEST_PATH_IMAGE012
个 像素点的灰度值,
Figure 150486DEST_PATH_IMAGE013
为所述采样区域的差值幅度特征,
Figure 701553DEST_PATH_IMAGE014
Figure 986035DEST_PATH_IMAGE015
为中心 点移动幅度均值。
本发明一可选实施例中,采用串联方法融合上述三种局部纹理特征,即 CLBP_S/M/C,得到CLBP特征。
进一步地,所述对所述HOG 特征及所述CLBP 特征进行特征融合,得到混合特征,包括:
利用PCA算法对所述HOG 特征及所述CLBP 特征进行降维;
对降维后的特征进行串联得到所述混合特征。
本发明一可选实施例中,所述PCA算法为现有公知技术,在此不再赘述。
本发明实施例中,通过窗口筛选算法可以减少对大量无效区域进行检测,提高了检测效率,同时使用对HOG 特征及CLBP 特征进行特征融合,提高了对行人检测的检测精度。
S4、基于所述混合特征,利用预训练的分类器对所述行人候选区域中的行人进行定位,得到行人定位区域。
本发明实施例中,由于行人检测是一个二分类问题,因此预训练的分类器可以为二分类器SVM。
具体地,所述利用预训练的分类器对所述行人候选区域中的行人进行定位之前,所述方法还包括:
获取行人训练图像集合,对所述行人训练图像集合中的图像进行数据增广处理,得到标准训练图像集合;
提取所述标准训练图像集合中图像的HOG 特征及CLBP 特征;
基于PCA算法对所述标准训练图像集合中图像的HOG 特征及CLBP 特征进行降维并串联融合;
利用串联融合后的特征训练预设的SVM分类器,在所述SVM分类器不收敛时,将SVM分类器分类错误的图像重新添加至所述行人训练图像集合,并返回所述对所述行人训练图像集合中的图像进行数据增广处理的步骤,直至所述SVM分类器收敛时,得到所述预训练的分类器。
本发明一可选实施例中,数据增广处理包括随机填充、随机裁剪、随机翻转等。HOG特征及CLBP 特征提取与上述S3一致,在此不再赘述。
本发明实施例中,通过混合特征训练的二分类器可以更加准确地从图像中定位出行人区域。
S5、利用几何先验算法对所述行人定位区域进行人脸区域粗定位,得到原始人脸区域。
本发明实施例中,由于行人定位区域中是框住整个人体的矩形框集合,存在虚检部位,即对人脸识别没有作用的部分,因此通过几何先验算法对整个矩形框进行修剪及微调,从而保证人脸区域的完整性。
详细地,所述利用几何先验算法对所述行人定位区域进行人脸区域粗定位,得到原始人脸区域,包括:
计算所述行人定位区域中矩形框的宽高比,并去除宽高比不满足预设条件的矩形框;
选取满足所述预设条件的矩形框的上半部分,并对选取的上半部分进行向上延拓处理,得到所述原始人脸区域。
本发明一可选实施例中,例如,通过宽高比筛选出不满足条件的矩形框,然后考虑到人脸位于行人区域上方,所以选取矩形框上半部,最后为了保证人脸区域的完整性,采用向上方延拓 1/5 个矩形高度进行微调,得到原始人脸区域。
S6、基于预设的颜色空间模型对所述原始人脸区域进行精定位,得到标准人脸区域。
本发明实施例中,肤色是人脸不同于其他物体的一种整体特征,因为肤色的颜色 分布与大多数背景存在明显的差异,而且其分布特征不会受到人脸姿态或者表情的影响, 所以可以利用人脸的肤色特性来定位人脸区域。所述预设的颜色空间模型可以为HSV 颜色 空间模型,其中,建模范围为
Figure 40579DEST_PATH_IMAGE046
Figure 736002DEST_PATH_IMAGE047
Figure 525098DEST_PATH_IMAGE048
详细地,所述基于预设的颜色空间模型对所述原始人脸区域进行精定位,得到标准人脸区域,包括:
基于所述颜色空间模型识别出所述原始人脸区域中的肤色区域;
对所述肤色区域进行腐蚀、膨胀及连通域检测处理,得到标准肤色区域;
确定所述标准肤色区域的最大外接矩阵为所述标准人脸区域。
本发明实施例中,腐蚀、膨胀及连通域检测处理为现有公知技术,在此不再赘述。
S7、利用预训练的卷积神经网络对所述标准人脸区域进行人脸识别,得到人脸识别结果。
本发明实施例中,所述预训练的卷积神经网络可以为改进后的 DeepID1 分类网络模型,包括:4个卷积层,3个最大池化层,1个隐藏特征层,1个 Dropout操作,1个Softmax分类概率层,另外训练时损失函数使用的是交叉熵损失函数。
详细地,所述利用预训练的卷积神经网络对所述标准人脸区域进行人脸识别,得到人脸识别结果,包括:
利用所述卷积神经网络提取所述标准人脸区域中的标准人脸特征;
计算所述标准人脸特征与预设的人脸特征库中人脸特征的余弦相似度;
若所述余弦相似度大于等于预设相似阈值,所述人脸识别结果为识别成功;
若所述余弦相似度小于所述预设相似阈值,所述人脸识别结果为识别失败。
本发明一可选实施例中,所述预设的人脸特征库也是通过所述卷积神经网络提取构建。例如,通过所述卷积神经网络提取企业员工照片的人脸特征构建人脸特征库,并用于打卡时对人脸进行识别。同时,由于所述标准人脸区域通过人脸粗定位及人脸精定位得到,可以提高人脸识别的准确率。
本实施例通过选择性搜索算法从待检测图像集合的图像中提取候选区域集合,并基于窗口筛选算法从候选区域集合中生成行人候选区域,可以筛选出大量无效区域,从而提高人脸识别检测的效率。同时,提取行人候选区域中的HOG 特征及提取行人候选区域中的CLBP 特征,并进行特征融合,得到混合特征,可以更加关注图像的局部特征,从而提高对行人检测的准确率。并且,通过几何先验算法及颜色空间模型来对人脸区域进行粗定位及精定位,提高了人脸定位的精度,并基于卷积神经网络来对最后得到的标准人脸区域进行人脸识别,可以进一步提高对人脸识别的准确率。因此本发明提出的基于多移动目标的人脸识别方法,可以解决人脸识别准确度不高的问题。
如图2所示,是本发明一实施例提供的基于多移动目标的人脸识别装置的功能模块图。
本发明所述基于多移动目标的人脸识别装置100可以安装于电子设备中。根据实现的功能,所述基于多移动目标的人脸识别装置100可以包括候选区域提取模块101、特征混合模块102、行人区域定位模块103、人脸区域定位模块104及人脸识别模块105。本发明所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
在本实施例中,关于各模块/单元的功能如下:
所述候选区域提取模块101,用于获取目标视频数据,从所述目标视频数据中读取待检测图像集合,基于选择性搜索算法从所述待检测图像集合的图像中提取候选区域集合;
所述特征混合模块102,用于基于窗口筛选算法从所述候选区域集合中生成行人候选区域,提取所述行人候选区域中的HOG 特征,以及提取所述行人候选区域中的CLBP 特征,对所述HOG 特征及所述CLBP 特征进行特征融合,得到混合特征;
所述行人区域定位模块103,用于基于所述混合特征,利用预训练的分类器对所述行人候选区域中的行人进行定位,得到行人定位区域;
所述人脸区域定位模块104,用于利用几何先验算法对所述行人定位区域进行人脸区域粗定位,得到原始人脸区域,基于预设的颜色空间模型对所述原始人脸区域进行精定位,得到标准人脸区域;
所述人脸识别模块105,用于利用预训练的卷积神经网络对所述标准人脸区域进行人脸识别,得到人脸识别结果。
详细地,所述基于多移动目标的人脸识别装置100各模块的具体实施方式如下:
步骤一、获取目标视频数据,从所述目标视频数据中读取待检测图像集合。
本发明实施例中,所述目标视频数据可以为离线视频数据、实时视频数据等。例如,在学校、企业等场景下,离线视频视频可以为历史存储的视频文件(宿舍门口等场景中),实时视频数据可以为***连接 USB 摄像头实时采集的视频流。
本发明一可选实施例中, 可以按照预设的采集间隔对所述目标视频数据中的视频流进行截图,得到待检测图像集合。
需解释的是,由于本发明应用于视频中多移动目标的人脸识别,在视频中人脸会因为光照、遮挡等干扰因素导致识别不准确,因此可以通过逐帧读取目标视频数据中的图像,尽可能的扩大检测图像的数量,从而提高人脸识别的准确率。
步骤二、基于选择性搜索算法从所述待检测图像集合的图像中提取候选区域集合。
本发明实施例中,图像中物体可能存在的物体应该是有某些相似性或者连续性区域的,因此,本发明实施例采用选择性搜索算法(Selective Search)采用子区域合并的方法提取候选边界框(即候选区域)。首先,对输入图像进行分割算法产生许多小的子区域。其次,根据这些子区域之间相似性(相似性标准主要有颜色、纹理、大小等等)进行区域合并,不断的进行区域迭代合并,得到候选区域。
具体的,所述基于选择性搜索算法从所述待检测图像集合的图像中提取候选区域集合,包括:
对所述待检测图像集合中的图像进行随机分割,得到子区域集合;
计算所述子区域集合中相邻子区域的局部相似度,并在所述局部相似度满足预设的相似阈值时,将相邻子区域进行合并,得到更新后的子区域;
从所述子区域集合中移除与所述合并子区域相关的子区域,并返回所述计算所述子区域集合中相邻子区域的局部相似度的步骤,直至满足预设的迭代条件时,汇总所有的合并子区域得到合并子区域集合;
对所述合并子区域集合进行窗口筛选,得到所述候选区域集合。
本发明实施例中,所述局部相似度包括颜色、纹理、大小、吻合度的相似度。进一步地,本发明实施例可以利用下述公式计算相邻子区域的局部相似度:
Figure 862538DEST_PATH_IMAGE016
Figure 771589DEST_PATH_IMAGE049
Figure 919804DEST_PATH_IMAGE050
Figure 914305DEST_PATH_IMAGE051
其中,
Figure 55436DEST_PATH_IMAGE020
Figure 818993DEST_PATH_IMAGE021
Figure 138110DEST_PATH_IMAGE022
Figure 885486DEST_PATH_IMAGE023
分别表示相邻区域
Figure 299150DEST_PATH_IMAGE024
的颜色、纹 理、大小及吻合度的相似度,
Figure 199104DEST_PATH_IMAGE025
表示颜色直方图维数,
Figure 672811DEST_PATH_IMAGE026
表示相邻区域
Figure 907483DEST_PATH_IMAGE024
的第
Figure 129431DEST_PATH_IMAGE027
个 颜色直方图,
Figure 867579DEST_PATH_IMAGE028
表示 SIFT 特征的特征维数,
Figure 777767DEST_PATH_IMAGE029
表示相邻区域
Figure 984888DEST_PATH_IMAGE024
的SIFT 特征的第
Figure 5934DEST_PATH_IMAGE027
维特征值,
Figure 129748DEST_PATH_IMAGE030
表示区域
Figure 430410DEST_PATH_IMAGE031
的大小,
Figure 639674DEST_PATH_IMAGE032
表示区域
Figure 198832DEST_PATH_IMAGE033
的大小,
Figure 662305DEST_PATH_IMAGE034
表示整幅 图像的大小,
Figure 914295DEST_PATH_IMAGE035
表示合并子区域的大小。
本发明一可选实施例中,由于选择性搜索算法基于颜色、纹理、大小、吻合度的相似度子区域合并策略,所以可以包含各种大小的疑似区域,从而提高行人检测的准确率。
步骤三、基于窗口筛选算法从所述候选区域集合中生成行人候选区域,提取所述行人候选区域中的HOG 特征,以及提取所述行人候选区域中的CLBP 特征,对所述HOG 特征及所述CLBP 特征进行特征融合,得到混合特征。
本发明实施例中,所述窗口筛选算法是指利用预设范围的窗口固定所述候选区域集合中的区域大小,由于本发明用于人脸识别,因此通过上述窗口筛选算法来进一步提高对行人检测的准确率。
详细地,所述基于窗口筛选算法从所述候选区域集合中生成行人候选区域,包括:
计算所述候选区域集合中各候选区域的窗口比例,并利用下述窗口范围公式从所述候选区域集合中筛选出满足预设窗口范围的行人候选区域:
Figure 79697DEST_PATH_IMAGE036
其中,
Figure 176966DEST_PATH_IMAGE037
为预设窗口范围的下限,为预设窗口范围的上限,
Figure 26105DEST_PATH_IMAGE039
为窗口比例,为候选 区域的宽度,
Figure 183416DEST_PATH_IMAGE041
为候选区域的高度。
本发明实施例中,HOG 特征能够对物体的形状以及边缘分布进行很好的描述,因此适用于行人检测,而 CLBP特征保留了原始的LBP 特征所没有的空间结构信息,能提取更加充分的纹理特征,通过HOG 特征与 CLBP 特征融合,可以提高对局部特征的关注,从而提高识别的准确率。
详细地,所述提取所述行人候选区域中的HOG 特征,包括:
根据Gamma校正法对所述行人候选区域进行颜色空间归一化处理,得到矫正区域;
计算所述矫正区域内水平方向及垂直方向的梯度直方图;
利用预设方向及幅度的细胞单元收集所述梯度直方图中的特征,得到所述HOG特征。
本发明一可选实施例中,所述Gamma校正法及梯度直方图的计算方法为现有公知技术,在此不再赘述。同时细胞单元的大小可以为8×8的像素点,并以8个像素为滑动步长幅度在水平方向和垂直方向进行扫描,且每2×2个的细胞单元构成一个块,通过组合块中梯度直方图中的特征得到HOG特征。
具体地,所述提取所述行人候选区域中的CLBP 特征,包括:
利用预设的采集窗口对所述行人候选区域进行采样,得到采样区域;
计算所述采样区域内中心点的灰度特征、差值符号特征及差值幅度特征;
串联所述差值符号特征、所述差值幅度特征及所述中心点的灰度特征,得到所述CLBP 特征。
本发明一可选实施例中,可以利用下述公式计算所述采样区域内中心点的灰度特征、差值符号特征及差值幅度特征:
Figure 101694DEST_PATH_IMAGE052
Figure 753386DEST_PATH_IMAGE002
Figure 706299DEST_PATH_IMAGE003
Figure 34512DEST_PATH_IMAGE004
其中,
Figure 925239DEST_PATH_IMAGE005
为所述采样区域内中心点的灰度特征,
Figure 629889DEST_PATH_IMAGE006
表示中心点的像素灰度 值,
Figure 437308DEST_PATH_IMAGE007
表示在中心点不断移动时关于
Figure 687155DEST_PATH_IMAGE006
的灰度均值,
Figure 580025DEST_PATH_IMAGE008
表示采样窗口数,
Figure 822788DEST_PATH_IMAGE009
为所述 采样区域的差值符号特征,
Figure 219134DEST_PATH_IMAGE010
表示采样区域内采样点个数,
Figure 905461DEST_PATH_IMAGE011
表示与中心点相邻的第
Figure 20048DEST_PATH_IMAGE012
个 像素点的灰度值,
Figure 66501DEST_PATH_IMAGE013
为所述采样区域的差值幅度特征,
Figure 68086DEST_PATH_IMAGE014
Figure 174583DEST_PATH_IMAGE015
为中心 点移动幅度均值。
本发明一可选实施例中,采用串联方法融合上述三种局部纹理特征,即 CLBP_S/M/C,得到CLBP特征。
进一步地,所述对所述HOG 特征及所述CLBP 特征进行特征融合,得到混合特征,包括:
利用PCA算法对所述HOG 特征及所述CLBP 特征进行降维;
对降维后的特征进行串联得到所述混合特征。
本发明一可选实施例中,所述PCA算法为现有公知技术,在此不再赘述。
本发明实施例中,通过窗口筛选算法可以减少对大量无效区域进行检测,提高了检测效率,同时使用对HOG 特征及CLBP 特征进行特征融合,提高了对行人检测的检测精度。
步骤四、基于所述混合特征,利用预训练的分类器对所述行人候选区域中的行人进行定位,得到行人定位区域。
本发明实施例中,由于行人检测是一个二分类问题,因此预训练的分类器可以为二分类器SVM。
具体地,所述利用预训练的分类器对所述行人候选区域中的行人进行定位之前,所述方法还包括:
获取行人训练图像集合,对所述行人训练图像集合中的图像进行数据增广处理,得到标准训练图像集合;
提取所述标准训练图像集合中图像的HOG 特征及CLBP 特征;
基于PCA算法对所述标准训练图像集合中图像的HOG 特征及CLBP 特征进行降维并串联融合;
利用串联融合后的特征训练预设的SVM分类器,在所述SVM分类器不收敛时,将SVM分类器分类错误的图像重新添加至所述行人训练图像集合,并返回所述对所述行人训练图像集合中的图像进行数据增广处理的步骤,直至所述SVM分类器收敛时,得到所述预训练的分类器。
本发明一可选实施例中,数据增广处理包括随机填充、随机裁剪、随机翻转等。HOG特征及CLBP 特征提取与上述步骤三一致,在此不再赘述。
本发明实施例中,通过混合特征训练的二分类器可以更加准确地从图像中定位出行人区域。
步骤五、利用几何先验算法对所述行人定位区域进行人脸区域粗定位,得到原始人脸区域。
本发明实施例中,由于行人定位区域中是框住整个人体的矩形框集合,存在虚检部位,即对人脸识别没有作用的部分,因此通过几何先验算法对整个矩形框进行修剪及微调,从而保证人脸区域的完整性。
详细地,所述利用几何先验算法对所述行人定位区域进行人脸区域粗定位,得到原始人脸区域,包括:
计算所述行人定位区域中矩形框的宽高比,并去除宽高比不满足预设条件的矩形框;
选取满足所述预设条件的矩形框的上半部分,并对选取的上半部分进行向上延拓处理,得到所述原始人脸区域。
本发明一可选实施例中,例如,通过宽高比筛选出不满足条件的矩形框,然后考虑到人脸位于行人区域上方,所以选取矩形框上半部,最后为了保证人脸区域的完整性,采用向上方延拓 1/5 个矩形高度进行微调,得到原始人脸区域。
步骤六、基于预设的颜色空间模型对所述原始人脸区域进行精定位,得到标准人脸区域。
本发明实施例中,肤色是人脸不同于其他物体的一种整体特征,因为肤色的颜色 分布与大多数背景存在明显的差异,而且其分布特征不会受到人脸姿态或者表情的影响, 所以可以利用人脸的肤色特性来定位人脸区域。所述预设的颜色空间模型可以为HSV 颜色 空间模型,其中,建模范围为
Figure 776465DEST_PATH_IMAGE046
Figure 377342DEST_PATH_IMAGE047
Figure 748280DEST_PATH_IMAGE048
详细地,所述基于预设的颜色空间模型对所述原始人脸区域进行精定位,得到标准人脸区域,包括:
基于所述颜色空间模型识别出所述原始人脸区域中的肤色区域;
对所述肤色区域进行腐蚀、膨胀及连通域检测处理,得到标准肤色区域;
确定所述标准肤色区域的最大外接矩阵为所述标准人脸区域。
本发明实施例中,腐蚀、膨胀及连通域检测处理为现有公知技术,在此不再赘述。
步骤七、利用预训练的卷积神经网络对所述标准人脸区域进行人脸识别,得到人脸识别结果。
本发明实施例中,所述预训练的卷积神经网络可以为改进后的 DeepID1 分类网络模型,包括:4个卷积层,3个最大池化层,1个隐藏特征层,1个 Dropout操作,1个Softmax分类概率层,另外训练时损失函数使用的是交叉熵损失函数。
详细地,所述利用预训练的卷积神经网络对所述标准人脸区域进行人脸识别,得到人脸识别结果,包括:
利用所述卷积神经网络提取所述标准人脸区域中的标准人脸特征;
计算所述标准人脸特征与预设的人脸特征库中人脸特征的余弦相似度;
若所述余弦相似度大于等于预设相似阈值,所述人脸识别结果为识别成功;
若所述余弦相似度小于所述预设相似阈值,所述人脸识别结果为识别失败。
本发明一可选实施例中,所述预设的人脸特征库也是通过所述卷积神经网络提取构建。例如,通过所述卷积神经网络提取企业员工照片的人脸特征构建人脸特征库,并用于打卡时对人脸进行识别。同时,由于所述标准人脸区域通过人脸粗定位及人脸精定位得到,可以提高人脸识别的准确率。
本实施例通过选择性搜索算法从待检测图像集合的图像中提取候选区域集合,并基于窗口筛选算法从候选区域集合中生成行人候选区域,可以筛选出大量无效区域,从而提高人脸识别检测的效率。同时,提取行人候选区域中的HOG 特征及提取行人候选区域中的CLBP 特征,并进行特征融合,得到混合特征,可以更加关注图像的局部特征,从而提高对行人检测的准确率。并且,通过几何先验算法及颜色空间模型来对人脸区域进行粗定位及精定位,提高了人脸定位的精度,并基于卷积神经网络来对最后得到的标准人脸区域进行人脸识别,可以进一步提高对人脸识别的准确率。因此本发明提出的基于多移动目标的人脸识别装置,可以解决人脸识别准确度不高的问题。
如图3所示,是本发明一实施例提供的实现所述基于多移动目标的人脸识别方法的电子设备的结构示意图。
所述电子设备可以包括处理器10、存储器11、通信接口12和总线13,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序,如基于多移动目标的人脸识别程序。
其中,所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备的内部存储单元,例如该电子设备的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备的外部存储设备,例如电子设备上配备的插接式移动硬盘、智能存储卡(Smart Media Card, SMC)、安全数字(SecureDigital, SD)卡、闪存卡(Flash Card)等。进一步地,所述存储器11还可以既包括电子设备的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备的应用软件及各类数据,例如基于多移动目标的人脸识别程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备的控制核心(Control Unit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(例如基于多移动目标的人脸识别程序等),以及调用存储在所述存储器11内的数据,以执行电子设备的各种功能和处理数据。
所述通信接口12用于上述电子设备与其他设备之间的通信,包括网络接口和用户接口。可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备与其他电子设备之间建立通信连接。所述用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备中处理的信息以及用于显示可视化的用户界面。
所述总线13可以是外设部件互连标准(peripheral component interconnect,简称PCI)总线或扩展工业标准结构(extended industry standard architecture,简称EISA)总线等。该总线13可以分为地址总线、数据总线、控制总线等。所述总线13被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。
图3仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图3示出的结构并不构成对所述电子设备的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
例如,尽管未示出,所述电子设备还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
进一步地,所述电子设备还可以包括网络接口,可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备与其他电子设备之间建立通信连接。
可选地,该电子设备还可以包括用户接口,用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备中处理的信息以及用于显示可视化的用户界面。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
所述电子设备中的所述存储器11存储的基于多移动目标的人脸识别程序是多个指令的组合,在所述处理器10中运行时,可以实现:
获取目标视频数据,从所述目标视频数据中读取待检测图像集合;
基于选择性搜索算法从所述待检测图像集合的图像中提取候选区域集合;
基于窗口筛选算法从所述候选区域集合中生成行人候选区域,提取所述行人候选区域中的HOG 特征,以及提取所述行人候选区域中的CLBP 特征,对所述HOG 特征及所述CLBP 特征进行特征融合,得到混合特征;
基于所述混合特征,利用预训练的分类器对所述行人候选区域中的行人进行定位,得到行人定位区域;
利用几何先验算法对所述行人定位区域进行人脸区域粗定位,得到原始人脸区域;
基于预设的颜色空间模型对所述原始人脸区域进行精定位,得到标准人脸区域;
利用预训练的卷积神经网络对所述标准人脸区域进行人脸识别,得到人脸识别结果。
具体地,所述处理器10对上述指令的具体实现方法可参考附图对应实施例中相关步骤的描述,在此不赘述。
进一步地,所述电子设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。所述计算机可读存储介质可以是易失性的,也可以是非易失性的。例如,所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。
本发明还提供一种计算机可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序在被电子设备的处理器所执行时,可以实现:
获取目标视频数据,从所述目标视频数据中读取待检测图像集合;
基于选择性搜索算法从所述待检测图像集合的图像中提取候选区域集合;
基于窗口筛选算法从所述候选区域集合中生成行人候选区域,提取所述行人候选区域中的HOG 特征,以及提取所述行人候选区域中的CLBP 特征,对所述HOG 特征及所述CLBP 特征进行特征融合,得到混合特征;
基于所述混合特征,利用预训练的分类器对所述行人候选区域中的行人进行定位,得到行人定位区域;
利用几何先验算法对所述行人定位区域进行人脸区域粗定位,得到原始人脸区域;
基于预设的颜色空间模型对所述原始人脸区域进行精定位,得到标准人脸区域;
利用预训练的卷积神经网络对所述标准人脸区域进行人脸识别,得到人脸识别结果。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互***、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。***权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

Claims (10)

1.一种基于多移动目标的人脸识别方法,其特征在于,所述方法包括:
获取目标视频数据,从所述目标视频数据中读取待检测图像集合;
基于选择性搜索算法从所述待检测图像集合的图像中提取候选区域集合;
基于窗口筛选算法从所述候选区域集合中生成行人候选区域,提取所述行人候选区域中的HOG 特征,以及提取所述行人候选区域中的CLBP 特征,对所述HOG 特征及所述CLBP特征进行特征融合,得到混合特征;
基于所述混合特征,利用预训练的分类器对所述行人候选区域中的行人进行定位,得到行人定位区域;
利用几何先验算法对所述行人定位区域进行人脸区域粗定位,得到原始人脸区域;
基于预设的颜色空间模型对所述原始人脸区域进行精定位,得到标准人脸区域;
利用预训练的卷积神经网络对所述标准人脸区域进行人脸识别,得到人脸识别结果。
2.如权利要求1中所述的基于多移动目标的人脸识别方法,其特征在于,所述基于选择性搜索算法从所述待检测图像集合的图像中提取候选区域集合,包括:
对所述待检测图像集合中的图像进行随机分割,得到子区域集合;
计算所述子区域集合中相邻子区域的局部相似度,并在所述局部相似度满足预设的相似阈值时,将相邻子区域进行合并,得到更新后的子区域;
从所述子区域集合中移除与所述合并子区域相关的子区域,并返回所述计算所述子区域集合中相邻子区域的局部相似度的步骤,直至满足预设的迭代条件时,汇总所有的合并子区域得到合并子区域集合;
对所述合并子区域集合进行窗口筛选,得到所述候选区域集合。
3.如权利要求1所述的基于多移动目标的人脸识别方法,其特征在于,所述提取所述行人候选区域中的HOG 特征,包括:
根据Gamma校正法对所述行人候选区域进行颜色空间归一化处理,得到矫正区域;
计算所述矫正区域内水平方向及垂直方向的梯度直方图;
利用预设方向及幅度的细胞单元收集所述梯度直方图中的特征,得到所述HOG特征。
4.如权利要求1所述的基于多移动目标的人脸识别方法,其特征在于,所述提取所述行人候选区域中的CLBP 特征,包括:
利用预设的采集窗口对所述行人候选区域进行采样,得到采样区域;
计算所述采样区域内中心点的灰度特征、差值符号特征及差值幅度特征;
串联所述差值符号特征、所述差值幅度特征及所述中心点的灰度特征,得到所述CLBP特征。
5.如权利要求4所述的基于多移动目标的人脸识别方法,其特征在于,所述计算所述采样区域内中心点的灰度特征、差值符号特征及差值幅度特征,包括:
利用下述公式计算所述采样区域内中心点的灰度特征、差值符号特征及差值幅度特征:
Figure DEST_PATH_IMAGE001
Figure 120542DEST_PATH_IMAGE002
Figure DEST_PATH_IMAGE003
Figure 6458DEST_PATH_IMAGE004
其中,
Figure DEST_PATH_IMAGE005
为所述采样区域内中心点的灰度特征,
Figure 942184DEST_PATH_IMAGE006
表示中心点的像素灰度值,
Figure DEST_PATH_IMAGE007
表示在中心点不断移动时关于
Figure 246258DEST_PATH_IMAGE006
的灰度均值,
Figure 960136DEST_PATH_IMAGE008
表示采样窗口数,
Figure 552923DEST_PATH_IMAGE009
为所述采 样区域的差值符号特征,
Figure 744869DEST_PATH_IMAGE010
表示采样区域内采样点个数,
Figure 841133DEST_PATH_IMAGE011
表示与中心点相邻的第
Figure 460333DEST_PATH_IMAGE012
个像 素点的灰度值,
Figure 524104DEST_PATH_IMAGE013
为所述采样区域的差值幅度特征,
Figure 270474DEST_PATH_IMAGE014
Figure 470511DEST_PATH_IMAGE015
为中心点 移动幅度均值。
6.如权利要求1所述的基于多移动目标的人脸识别方法,其特征在于,所述基于预设的颜色空间模型对所述原始人脸区域进行精定位,得到标准人脸区域,包括:
基于所述颜色空间模型识别出所述原始人脸区域中的肤色区域;
对所述肤色区域进行腐蚀、膨胀及连通域检测处理,得到标准肤色区域;
确定所述标准肤色区域的最大外接矩阵为所述标准人脸区域。
7.如权利要求1至6中任意一项所述的基于多移动目标的人脸识别方法,其特征在于,所述利用预训练的分类器对所述行人候选区域中的行人进行定位之前,所述方法还包括:
获取行人训练图像集合,对所述行人训练图像集合中的图像进行数据增广处理,得到标准训练图像集合;
提取所述标准训练图像集合中图像的HOG 特征及CLBP 特征;
基于PCA算法对所述标准训练图像集合中图像的HOG 特征及CLBP 特征进行降维并串联融合;
利用串联融合后的特征训练预设的SVM分类器,在所述SVM分类器不收敛时,将SVM分类器分类错误的图像重新添加至所述行人训练图像集合,并返回所述对所述行人训练图像集合中的图像进行数据增广处理的步骤,直至所述SVM分类器收敛时,得到所述预训练的分类器。
8.一种基于多移动目标的人脸识别装置,其特征在于,所述装置包括:
候选区域提取模块,用于获取目标视频数据,从所述目标视频数据中读取待检测图像集合,基于选择性搜索算法从所述待检测图像集合的图像中提取候选区域集合;
特征混合模块,用于基于窗口筛选算法从所述候选区域集合中生成行人候选区域,提取所述行人候选区域中的HOG 特征,以及提取所述行人候选区域中的CLBP 特征,对所述HOG 特征及所述CLBP 特征进行特征融合,得到混合特征;
行人区域定位模块,用于基于所述混合特征,利用预训练的分类器对所述行人候选区域中的行人进行定位,得到行人定位区域;
人脸区域定位模块,用于利用几何先验算法对所述行人定位区域进行人脸区域粗定位,得到原始人脸区域,基于预设的颜色空间模型对所述原始人脸区域进行精定位,得到标准人脸区域;
人脸识别模块,用于利用预训练的卷积神经网络对所述标准人脸区域进行人脸识别,得到人脸识别结果。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至7中任意一项所述的基于多移动目标的人脸识别方法。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任意一项所述的基于多移动目标的人脸识别方法。
CN202210718844.4A 2022-06-23 2022-06-23 基于多移动目标的人脸识别方法、装置、设备及存储介质 Pending CN114783042A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210718844.4A CN114783042A (zh) 2022-06-23 2022-06-23 基于多移动目标的人脸识别方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210718844.4A CN114783042A (zh) 2022-06-23 2022-06-23 基于多移动目标的人脸识别方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN114783042A true CN114783042A (zh) 2022-07-22

Family

ID=82422330

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210718844.4A Pending CN114783042A (zh) 2022-06-23 2022-06-23 基于多移动目标的人脸识别方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN114783042A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116363538A (zh) * 2023-06-01 2023-06-30 贵州交投高新科技有限公司 一种基于无人机的桥梁检测方法及***

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113705469A (zh) * 2021-08-30 2021-11-26 平安科技(深圳)有限公司 人脸识别方法、装置、电子设备及计算机可读存储介质

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113705469A (zh) * 2021-08-30 2021-11-26 平安科技(深圳)有限公司 人脸识别方法、装置、电子设备及计算机可读存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
吴云鹏: "基于深度学习的自然场景人脸识别", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》 *
尧佼等: "基于候选区域定位与HOG-CLBP特征组合的行人检测", 《激光与光电子学进展》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116363538A (zh) * 2023-06-01 2023-06-30 贵州交投高新科技有限公司 一种基于无人机的桥梁检测方法及***
CN116363538B (zh) * 2023-06-01 2023-08-01 贵州交投高新科技有限公司 一种基于无人机的桥梁检测方法及***

Similar Documents

Publication Publication Date Title
Gonçalves et al. Benchmark for license plate character segmentation
Ye et al. Text detection and recognition in imagery: A survey
CN105868758B (zh) 图像中文本区域检测方法、装置及电子设备
Jiao et al. A configurable method for multi-style license plate recognition
US20180336683A1 (en) Multi-Label Semantic Boundary Detection System
Pan et al. A robust system to detect and localize texts in natural scene images
CN111241989A (zh) 图像识别方法及装置、电子设备
Molina-Moreno et al. Efficient scale-adaptive license plate detection system
CN112418216A (zh) 一种复杂自然场景图像中的文字检测方法
CN114092938B (zh) 图像的识别处理方法、装置、电子设备及存储介质
CN111639704A (zh) 目标识别方法、装置及计算机可读存储介质
CN114463767A (zh) 信用证识别方法、装置、计算机设备和存储介质
CN115203408A (zh) 一种多模态试验数据智能标注方法
CN112906671B (zh) 面审虚假图片识别方法、装置、电子设备及存储介质
CN114783042A (zh) 基于多移动目标的人脸识别方法、装置、设备及存储介质
CN114581928A (zh) 一种表格识别方法及***
CN113780116A (zh) ***分类方法、装置、计算机设备和存储介质
CN112528903A (zh) 人脸图像获取方法、装置、电子设备及介质
KR102026280B1 (ko) 딥 러닝을 이용한 씬 텍스트 검출 방법 및 시스템
CN115601684A (zh) 突发事件预警方法、装置、电子设备及存储介质
CN112101139B (zh) 人形检测方法、装置、设备及存储介质
US11481881B2 (en) Adaptive video subsampling for energy efficient object detection
CN114708230A (zh) 基于图像分析的车架质量检测方法、装置、设备及介质
CN114187476A (zh) 基于图像分析的车险信息核对方法、装置、设备及介质
Misra et al. Text extraction and recognition from image using neural network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20220722