CN111209822A - 一种热红外图像的人脸检测方法 - Google Patents

一种热红外图像的人脸检测方法 Download PDF

Info

Publication number
CN111209822A
CN111209822A CN201911394420.1A CN201911394420A CN111209822A CN 111209822 A CN111209822 A CN 111209822A CN 201911394420 A CN201911394420 A CN 201911394420A CN 111209822 A CN111209822 A CN 111209822A
Authority
CN
China
Prior art keywords
frame
thermal infrared
prediction
neural network
convolutional neural
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911394420.1A
Other languages
English (en)
Inventor
张天序
郭诗嘉
李正涛
苏轩
郭婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Huatu Information Technology Co ltd
Original Assignee
Nanjing Huatu Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Huatu Information Technology Co ltd filed Critical Nanjing Huatu Information Technology Co ltd
Priority to CN201911394420.1A priority Critical patent/CN111209822A/zh
Publication of CN111209822A publication Critical patent/CN111209822A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种热红外图像的人脸检测方法,包括以下步骤:(1)获取训练集的正样本和负样本,以及测试集,对正样本的每张热红外图像分别框出人脸框作为标定框;(2)获取训练标签;(3)搭建卷积神经网络,将训练集及训练标签一起输入卷积神经网络进行训练,利用损失函数来优化卷积神经网络,从而获得所需的卷积神经网络的训练模型;(4)输入测试集中的热红外图像,通过卷积神经网络获得人脸检测框。本发明通过将热红外图像输入卷积神经网络进行训练获得满足要求的卷积神经网络,可实现对热红外图像的自动检测从而准确框选出人脸范围,减少检测错误率。

Description

一种热红外图像的人脸检测方法
技术领域
本发明属于生物特征识别技术领域,更具体地,涉及一种人脸检测方法。
背景技术
人脸检测,即得到图片中所有人脸的具***置,具***置通常使用一个矩形框表示,矩形框内的物体即为人脸,矩形框外的部分为背景。
可见光的人脸检测技术已经广泛应用到海关、车站、考勤、自动驾驶和疑犯追踪等领域。但可见光的人脸检测技术无法在无外界光源的情况下进行工作,无法对面部有遮挡物的人脸进行检测。可见光也不可以进行活体检测,无法判定成像是真人,因此易被照片欺骗,易被有妆容打扮的人脸欺骗,导致人脸检测的结果不准确,受限的因素较多。
热红外的图像是热辐射成像,它是根据物体的红外辐射差异成像,红外热成像仪能够把物体表面的自然发射的红外辐射分布转变为可见图像。由于不同物体或同一物体的不同部位通常具有不同的热辐射特性,如温差、发射率等,在进行热红外成像后,热红外图像中的物体因为其热辐射的差异而区别开来。因此热红外图像可以轻松解决活体检验的作用,人脸相较其他物体是高温物体,在灰度图中成像为白色,面部不同器官分布不同的毛细血管,导致热辐射不同,可以呈现面部五官。
目前主动近红外人脸识别开始兴起,但该技术需要主动光源,而且限制距离在50-100cm。并且主动光源会在眼镜上产生明显的反光,降低了眼睛的定位的精度,主动光源在长期使用后,会出现损坏和衰减。目前国内无对热红外图像的人脸检测方法。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种热红外图像的人脸检测方法,其在无需任何光源的情况下,可以在热红外图像中清楚的框出人脸的位置,满足对于热红外图像的检测需求。
为实现上述目的,按照本发明的一个方面,提供了一种热红外图像的人脸检测方法,其特征在于,包括以下步骤:
(1)将N张热红外图像作为正样本及L张未显示人脸的热红外图像作为负样本一起组成训练集,获取M张热红外图像作为测试集,对正样本的每张热红外图像分别框出人脸框作为标定框;正样本中每张热红外图像的标记均为1,负样本中每张热红外图像的标记均为0;
(2)每张热红外图像的标定框的中心点坐标值和宽度、高度尺寸值按比例缩小,缩小后的中心点坐标值、宽度、高度尺寸值与该张热红外图像的标记一起存在一个独立的txt文件中,则共计获得N个txt文件;
此外,将训练集中每张热红外图像的路径和负样本中所有热红外图像的标记一起存在另一个txt文件中;
以此方式,共获得N+1个txt文件作为训练标签;
(3)搭建卷积神经网络,将训练集及训练标签一起输入卷积神经网络进行训练,利用损失函数来优化卷积神经网络,从而获得所需的卷积神经网络的训练模型;
(4)输入测试集中的热红外图像,通过卷积神经网络获得人脸检测框。
优选地,步骤(1)中,采用红外热像仪采集热红外图像,采集情况如下:每个人的人脸与中波红外热像仪采用多组距离、多组设定时间来录制视频,视频按设定帧数裁剪后选取设定数量的照片,然后挑选出N张热红外图像作为训练集。
优选地,步骤(2)中生成训练标签具体如下:
(2.1)存标定框的中心点的相对坐标:
Figure BDA0002345901300000031
其中,(x1,y1),(x2,y2)表示标定框上的对角位置的两个坐标,由(x1,y1),(x2,y2)确定该标定框,x1和x2表示x-y图像坐标系下的宽度坐标,y1和y2表示x-y图像坐标系下的高度坐标,并且x1>x2,y1>y2
centrex表示标定框的中心点在x-y图像坐标系下的宽度坐标,centrey表示标定框的中心点在x-y图像坐标系下的长度坐标,w表示标定框所在的热红外图像的长度,h表示标定框所在的热红外图像的高度;
(2.2)存标定框的长度对于其所在的热红外图像的相对尺寸:
Figure BDA0002345901300000032
其中,framex表示标定框的相对宽度,framey表示标定框的相对高度;
将以上的centrex、centrey、framex、framey和正样本中热红外图像的标记存入同一个txt文件中,正样本中不同热红外图像的标记和标定框的centrex、centrey、framex、framey存入不同的txt文件。
优选地,所述卷积神经网络采用Darknet框架和Yolo网络,Darknet框架用于对输入的热红外图像进行卷积、最大池化以及归一化的操作,以获取卷积神经网络的权重,Yolo网络用于进行对卷积神经网络的权重进行处理,以进行人脸判定以及位置回归。
优选地,标定框与卷积神经网络构建的预测框的尺寸关系如下:
ax=dx+Δ(mx)
ay=dy+Δ(my)
Figure BDA0002345901300000033
Figure BDA0002345901300000034
其中,ax,ay分别表示u-v图像坐标系下标定框的中心坐标的宽度和高度,aw和ah表示标定框的宽度和高度,Δ(mx),Δ(my)分别表示标定框中心到预测框中心的宽度方向的偏移量和高度方向的偏移量,dx,dy分别表示预测框的中心坐标的宽度和高度,pw,ph分别表示为预测框的宽度和高度,mw,mh分别为预测框的宽缩放比和高缩放比,Δ函数为sigmoid函数。
优选地,卷积神经网络构建的预测框为六个并且分为两个规模,这六个预测框的高度按从大至小排序后分别为预测框I、预测框II、预测框III、预测框IV、预测框V和预测框VI,其中第一个规模分配预测框I、预测框III和预测框IV,第二个规模分配预测框II、预测框IV和预测框VI。
优选地,步骤(3)中,损失函数进行对卷积神经网络进行优化的具体如下:
Figure BDA0002345901300000041
其中,loss表示损失,S2表示卷积神经网络的网格数,B表示每个单元格预测框的个数,
Figure BDA0002345901300000042
表示第i个网格的第j个anchor box是否负责这个目标,不负责时取值为0,负责时取值为1,
Figure BDA0002345901300000043
表示i个网格的第j个预测框不负责的目标,有目标的情况取值为1,没有目标的情况取值为0,λcoord=5,λnoobj=0.5,xi,yi分别表示第i个预测框的中心点坐标的宽度和高度,
Figure BDA0002345901300000044
分别表示第i个标定框的中心点坐标的宽度和高度,wi,hi分别表示第i个预测框的宽度和高度,
Figure BDA0002345901300000045
分别表示第i个标定框的宽度和高度,ci表示第i个预测框的置信度,选中的预测框的取值为1,未选中的预测框的取值为0,
Figure BDA0002345901300000046
表示第i个标定框的置信度,选中的标定框的取值为1,未选中的标定框的取值为0,pi表示第i个预测框中为人脸的分类概率,
Figure BDA0002345901300000047
表示表示第i个标定框中为人脸的分类概率,c表示有无人脸的类,classes表示有人脸和没有人脸的类的集合;
获得损失loss后,采用随机梯度下降算法进行更新,卷积神经网络不断选择和判断当前目标下最优的参数,根据损失loss的结果,对卷积神经网络中的参数更新,卷积神经网络达到所需的指标后停止更新。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,能够取得下列有益效果:
1)本发明通过将热红外图像输入卷积神经网络进行训练获得满足要求的卷积神经网络,可以实现对热红外图像的自动检测从而准确框选出人脸范围,减少人脸检测的错误率。
2)本发明通过热红外技术进行人脸检测,在无需任何光源的情况下,可以在热红外图像中清楚的框出人脸的位置,满足对于热红外图像的检测需求。
附图说明
图1是本发明的流程示意图;
图2是本发明中获取训练标签的流程示意图;
图3是本发明中卷积神经网络获得损失计算的流程图;
图4是待检测的热红外图像;
图5是对图4的热红外图像进行检测后的示意图;
图6是第一个规模中的三个预测框的示意图;
图7是第二个规模中的三个预测框的示意图;
图8是对两个人脸进行检测的示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
参照各附图,一种热红外图像的人脸检测方法,包括以下步骤:
(1)将N张热红外图像作为正样本及L张未显示人脸的热红外图像作为负样本一起组成训练集,获取M张热红外图像作为测试集。
为了保证足够量的热红外图像,就需要保证足够的实验数据。具体地,可采用德国的IRCAM公司型号为TAURUS-110kM的中波红外热像仪,数据的测试环境为:人脸距离相机的距离为2米,3米,5米不同距离的人脸,过对每个人录制设定时间的视频,每个视频按设定帧数裁剪后选取设定数量的照片,可以选择200个人进行拍摄,采用50帧的截取视频的形式,包括了不同的姿态,不同场景背景的影响,有无外来光源的场景,通过大量实验保证了人脸检测模型后续使用的准确性。然后可对上述视频截取的热红外图像进行筛选,将不符合训练要求的图片除去,对训练数据筛选是为了去掉一些无用数据,防止在深度学习中,计算机学习了这些参数,影响到了真实参数,比如裁剪图片的时候,易出现在姿态转换中出现的模糊图像,一般会将这些模糊图像除去,最终可得到14万张的热红外图像作为训练集,获得M=6万张热红外图像作为测试集,而训练集选取N=3.5万张热红外图像作为正样本及L=10.5万张热红外图像作为负样本,正样本中的热红外图像均露显示了人脸及能将人脸框选出来,而负样本中的图像则未显示人脸,譬如只显示了设备、衣服、墙壁等。
然后对正样本的每张热红外图像分别框出人脸框作为标定框;正样本中每张热红外图像的标记均为1,负样本中每张热红外图像的标记均为0;
(2)每张热红外图像的标定框的中心点坐标值和宽度、高度尺寸值按比例缩小,缩小后的中心点坐标值、宽度、高度尺寸值与该张热红外图像的标记一起存在一个独立的txt文件中,则共计获得N个txt文件;
此外,将训练集中每张热红外图像的路径和负样本中所有热红外图像的标记一起存在另一个txt文件中;
以此方式,共获得N+1个txt文件作为训练标签,具体如下:
(2.1)存标定框的中心点的相对坐标:
Figure BDA0002345901300000071
其中,(x1,y1),(x2,y2)表示标定框上的对角位置的两个坐标,由(x1,y1),(x2,y2)确定该标定框,x1和x2表示x-y图像坐标系下的宽度坐标,y1和y2表示x-y图像坐标系下的高度坐标,并且x1>x2,y1>y2
centrex表示标定框的中心点在x-y图像坐标系下的宽度坐标,centrey表示标定框的中心点在x-y图像坐标系下的长度坐标,w表示标定框所在的热红外图像的长度,h表示标定框所在的热红外图像的高度;
(2.2)存标定框的长度对于其所在的热红外图像的相对尺寸:
Figure BDA0002345901300000072
其中,framex表示标定框的相对宽度,framey表示标定框的相对高度;
将以上的centrex、centrey、framex、framey和正样本中热红外图像的标记存入同一个txt文件中,正样本中不同热红外图像的标记和标定框的centrex、centrey、framex、framey存入不同的txt文件。
本发明只需要存标定框中心点的相对坐标和标定框的相对尺寸即可,节省了大量参数的获取时间,由于采用的是相对值,所以可以加速收敛。
(3)搭建卷积神经网络,将训练集及训练标签一起输入卷积神经网络进行训练,利用损失函数来优化卷积神经网络,从而获得所需的卷积神经网络的训练模型;
所述卷积神经网络采用Darknet框架,Darknet框架用于对输入的热红外图像进行卷积、最大池化以及归一化的操作,以获取卷积神经网络的权重,具体地,Darknet框架训练了53层网络,提供了106层完全卷积的底层架构。前向传播过程中,张量的尺寸变换是通过改变卷积核的步长来实现的,如stride=(2,2),这就等于将图像边长缩小了一半(即面积缩小到原来的1/4)。在网络中,要经历5次缩小,会将特征图缩小到原输入尺寸的1/25,即1/32。输入为416x416,则输出为13x13(416/32=13)。backbone会将输出特征图缩小到输入的1/32。
卷积神经网络还采用了Yolo网络,用于进行对卷积神经网络的权重进行处理,以进行人脸判定以及位置回归,其通过设计Fast Anchor(快速预测框算法),搭建了六个预测框并且它们分为两个规模,这六个预测框的高度按从大至小排序后分别为预测框I、预测框II、预测框III、预测框IV、预测框V和预测框VI,其中第一个规模分配预测框I、预测框III和预测框IV,第二个规模分配预测框II、预测框IV和预测框VI。
标定框与卷积神经网络构建的预测框的尺寸关系如下:
ax=dx+Δ(mx)
ay=dy+Δ(my)
Figure BDA0002345901300000081
Figure BDA0002345901300000082
其中,ax,ay分别表示u-v图像坐标系下标定框的中心坐标的宽度和高度,aw和ah表示标定框的宽度和高度,Δ(mx),Δ(my)分别表示标定框中心到预测框中心的宽度方向的偏移量和高度方向的偏移量,dx,dy分别表示预测框的中心坐标的宽度和高度,pw,ph分别表示为预测框的宽度和高度,mw,mh分别为预测框的宽缩放比和高缩放比;Δ函数为sigmoid函数,将预测量缩放到0-1之内,目的是可以快速收敛。在检测是否是人脸时,长宽比例近似为1∶1,不会出现长宽比例差距很大的预测框。
损失函数进行对卷积神经网络进行优化的具体如下:
Figure BDA0002345901300000091
上式中,对w,h的损失函数采用总方差,置信度的损失函数用二值交叉熵。第一行的式子为总方误差,用来作为位置预测的损失函数,第二行的式子用根号总方差作为高度和宽度的损失函数,第三行和第四行的式子用二值交叉熵作为置信度的损失函数,第五行的式子用SSE作类别概率的损失函数。
其中,loss表示损失,S2表示卷积神经网络的网格数,B表示每个单元格预测框的个数,
Figure BDA0002345901300000092
表示第i个网格的第j个anchor box是否负责这个目标,不负责时取值为0,负责时取值为1,
Figure BDA0002345901300000093
表示i个网格的第j个预测框不负责的目标,有目标的情况取值为1,没有目标的情况取值为0,λcoord=5,λnoobj=0.5,xi,yi分别表示第i个预测框的中心点坐标的宽度和高度,
Figure BDA0002345901300000094
分别表示第i个标定框的中心点坐标的宽度和高度,wi,hi分别表示第i个预测框的宽度和高度,
Figure BDA0002345901300000095
分别表示第i个标定框的宽度和高度,ci表示第i个预测框的置信度,选中的预测框的取值为1,未选中的预测框的取值为0,
Figure BDA0002345901300000096
表示第i个标定框的置信度,选中的标定框的取值为1,未选中的标定框的取值为0,pi表示第i个预测框中为人脸的分类概率,
Figure BDA0002345901300000097
表示表示第i个标定框中为人脸的分类概率,c表示有无人脸的类,classes表示有人脸和没有人脸的类的集合;
获得损失loss后,采用随机梯度下降算法进行更新,卷积神经网络不断选择和判断当前目标下最优的参数,根据损失loss的结果对卷积神经网络中的参数更新从而保证卷积神经网络的输出结果与训练标签相同,卷积神经网络达到所需的指标后停止更新。
(4)输入待检测的热红外图像,获得人脸检测结果。本发明可以实现单张图0.024s的处理,且精度高,正确率可达98.6%以上。
此外,本发明中提到的坐标都是指u-v图像坐标系下的坐标,热红外图像和框的宽度都为左右方向的边长尺寸,高度均为竖直方向的边长尺寸。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种热红外图像的人脸检测方法,其特征在于,包括以下步骤:
(1)将N张热红外图像作为正样本及L张未显示人脸的热红外图像作为负样本一起组成训练集,获取M张热红外图像作为测试集,对正样本的每张热红外图像分别框出人脸框作为标定框;正样本中每张热红外图像的标记均为1,负样本中每张热红外图像的标记均为0;
(2)每张热红外图像的标定框的中心点坐标值和宽度、高度尺寸值按比例缩小,缩小后的中心点坐标值、宽度、高度尺寸值与该张热红外图像的标记一起存在一个独立的txt文件中,则共计获得N个txt文件;
此外,将训练集中每张热红外图像的路径和负样本中所有热红外图像的标记一起存在另一个txt文件中;
以此方式,共获得N+1个txt文件作为训练标签;
(3)搭建卷积神经网络,将训练集及训练标签一起输入卷积神经网络进行训练,利用损失函数来优化卷积神经网络,从而获得所需的卷积神经网络的训练模型;
(4)输入测试集中的热红外图像,通过卷积神经网络获得人脸检测框。
2.根据权利要求1所述的一种热红外图像的人脸检测方法,其特征在于,步骤(1)中,采用红外热像仪采集热红外图像,采集情况如下:每个人的人脸与中波红外热像仪采用多组距离、多组设定时间来录制视频,视频按设定帧数裁剪后选取设定数量的照片,然后获得训练集和测试集。
3.根据权利要求1所述的一种热红外图像的人脸检测方法,其特征在于,步骤(2)中生成训练标签具体如下:
(2.1)存标定框的中心点的相对坐标:
Figure RE-FDA0002445217690000011
其中,(x1,y1),(x2,y2)表示标定框上的对角位置的两个坐标,由(x1,y1),(x2,y2)确定该标定框,x1和x2表示x-y图像坐标系下的宽度坐标,y1和y2表示x-y图像坐标系下的高度坐标,并且x1>x2,y1>y2
centrex表示标定框的中心点在x-y图像坐标系下的宽度坐标,centrey表示标定框的中心点在x-y图像坐标系下的长度坐标,w表示标定框所在的热红外图像的长度,h表示标定框所在的热红外图像的高度;
(2.2)存标定框的长度对于其所在的热红外图像的相对尺寸:
Figure RE-FDA0002445217690000021
其中,framex表示标定框的相对宽度,framey表示标定框的相对高度;
将以上的centrex、centrey、framex、framey和正样本中热红外图像的标记存入同一个txt文件中,正样本中不同热红外图像的标记和标定框的centrex、centrey、framex、framey存入不同的txt文件。
4.根据权利要求1所述的一种热红外图像的人脸检测方法,其特征在于,所述卷积神经网络采用Darknet框架和Yolo网络,Darknet框架用于对输入的热红外图像进行卷积、最大池化以及归一化的操作,以获取卷积神经网络的权重,Yolo网络用于进行对卷积神经网络的权重进行处理,以进行人脸判定以及位置回归。
5.根据权利要求1所述的一种热红外图像的人脸检测方法,其特征在于,标定框与卷积神经网络构建的预测框的尺寸关系如下:
ax=dx+Δ(mx)
ay=dy+Δ(my)
Figure RE-FDA0002445217690000022
Figure RE-FDA0002445217690000023
其中,ax,ay分别表示u-v图像坐标系下标定框的中心坐标的宽度和高度,aw和ah表示标定框的宽度和高度,Δ(mx),Δ(my)分别表示标定框中心到预测框中心的宽度方向的偏移量和高度方向的偏移量,dx,dy分别表示预测框的中心坐标的宽度和高度,pw,ph分别表示为预测框的宽度和高度,mw,mh分别为预测框的宽缩放比和高缩放比,Δ函数为sigmoid函数。
6.根据权利要求5所述的一种热红外图像的人脸检测方法,其特征在于,卷积神经网络构建的预测框为六个并且分为两个规模,这六个预测框的高度按从大至小排序后分别为预测框I、预测框II、预测框III、预测框IV、预测框V和预测框VI,其中第一个规模分配预测框I、预测框III和预测框IV,第二个规模分配预测框II、预测框IV和预测框VI。
7.根据权利要求1所述的一种热红外图像的人脸检测方法,其特征在于,步骤(3)中,损失函数进行对卷积神经网络进行优化的具体如下:
Figure RE-RE-FDA0002445217690000031
其中,loss表示损失,S2表示卷积神经网络的网格数,B表示每个单元格预测框的个数,
Figure RE-RE-FDA0002445217690000032
表示第i个网格的第j个anchor box是否负责这个目标,不负责时取值为0,负责时取值为1,
Figure RE-RE-FDA0002445217690000033
表示i个网格的第j个预测框不负责的目标,有目标的情况取值为1,没有目标的情况取值为0,λcoord=5,λnoobj=0.5,xi,yi分别表示第i个预测框的中心点坐标的宽度和高度,
Figure RE-RE-FDA0002445217690000034
分别表示第i个标定框的中心点坐标的宽度和高度,wi,hi分别表示第i个预测框的宽度和高度,
Figure RE-RE-FDA0002445217690000035
分别表示第i个标定框的宽度和高度,ci表示第i个预测框的置信度,选中的预测框的取值为1,未选中的预测框的取值为0,
Figure RE-RE-FDA0002445217690000037
表示第i个标定框的置信度,选中的标定框的取值为1,未选中的标定框的取值为0,pi表示第i个预测框中为人脸的分类概率,
Figure RE-RE-FDA0002445217690000036
表示表示第i个标定框中为人脸的分类概率,c表示有无人脸的类,classes表示有人脸和没有人脸的类的集合;
获得损失loss后,采用随机梯度下降算法进行更新,卷积神经网络不断选择和判断当前目标下最优的参数,根据损失loss的结果,对卷积神经网络中的参数更新,卷积神经网络达到所需的指标后停止更新。
CN201911394420.1A 2019-12-30 2019-12-30 一种热红外图像的人脸检测方法 Pending CN111209822A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911394420.1A CN111209822A (zh) 2019-12-30 2019-12-30 一种热红外图像的人脸检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911394420.1A CN111209822A (zh) 2019-12-30 2019-12-30 一种热红外图像的人脸检测方法

Publications (1)

Publication Number Publication Date
CN111209822A true CN111209822A (zh) 2020-05-29

Family

ID=70786541

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911394420.1A Pending CN111209822A (zh) 2019-12-30 2019-12-30 一种热红外图像的人脸检测方法

Country Status (1)

Country Link
CN (1) CN111209822A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111985374A (zh) * 2020-08-12 2020-11-24 汉王科技股份有限公司 人脸定位方法、装置、电子设备及存储介质
CN112115838A (zh) * 2020-09-11 2020-12-22 南京华图信息技术有限公司 一种热红外图像光谱融合的人脸分类方法
CN112199993A (zh) * 2020-09-01 2021-01-08 广西大学 基于人工智能识别任意方向变电站绝缘子红外图像检测模型的方法
CN112232208A (zh) * 2020-10-16 2021-01-15 蓝普金睛(北京)科技有限公司 红外人脸测温***及其方法
CN112285706A (zh) * 2020-11-18 2021-01-29 北京望远四象科技有限公司 一种fod探测方法、装置及***
CN112529947A (zh) * 2020-12-07 2021-03-19 北京市商汤科技开发有限公司 标定方法及装置、电子设备及存储介质
CN112926478A (zh) * 2021-03-08 2021-06-08 新疆爱华盈通信息技术有限公司 性别识别方法、***、电子装置及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108038474A (zh) * 2017-12-28 2018-05-15 深圳云天励飞技术有限公司 人脸检测方法、卷积神经网络参数的训练方法、装置及介质
CN108764057A (zh) * 2018-05-03 2018-11-06 武汉高德智感科技有限公司 一种基于深度学习的远红外人体面部检测方法及***
CN109902556A (zh) * 2019-01-14 2019-06-18 平安科技(深圳)有限公司 行人检测方法、***、计算机设备及计算机可存储介质
CN110399905A (zh) * 2019-07-03 2019-11-01 常州大学 施工场景中安全帽佩戴情况的检测及描述方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108038474A (zh) * 2017-12-28 2018-05-15 深圳云天励飞技术有限公司 人脸检测方法、卷积神经网络参数的训练方法、装置及介质
CN108764057A (zh) * 2018-05-03 2018-11-06 武汉高德智感科技有限公司 一种基于深度学习的远红外人体面部检测方法及***
CN109902556A (zh) * 2019-01-14 2019-06-18 平安科技(深圳)有限公司 行人检测方法、***、计算机设备及计算机可存储介质
CN110399905A (zh) * 2019-07-03 2019-11-01 常州大学 施工场景中安全帽佩戴情况的检测及描述方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
蔡成涛 等: "《海洋浮标目标探测技术》", 哈尔滨工程大学出版社, pages: 51 - 53 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111985374A (zh) * 2020-08-12 2020-11-24 汉王科技股份有限公司 人脸定位方法、装置、电子设备及存储介质
CN111985374B (zh) * 2020-08-12 2022-11-15 汉王科技股份有限公司 人脸定位方法、装置、电子设备及存储介质
CN112199993A (zh) * 2020-09-01 2021-01-08 广西大学 基于人工智能识别任意方向变电站绝缘子红外图像检测模型的方法
CN112199993B (zh) * 2020-09-01 2022-08-09 广西大学 基于人工智能识别任意方向变电站绝缘子红外图像检测模型的方法
CN112115838A (zh) * 2020-09-11 2020-12-22 南京华图信息技术有限公司 一种热红外图像光谱融合的人脸分类方法
CN112115838B (zh) * 2020-09-11 2024-04-05 南京华图信息技术有限公司 一种热红外图像光谱融合的人脸分类方法
CN112232208A (zh) * 2020-10-16 2021-01-15 蓝普金睛(北京)科技有限公司 红外人脸测温***及其方法
CN112285706A (zh) * 2020-11-18 2021-01-29 北京望远四象科技有限公司 一种fod探测方法、装置及***
CN112529947A (zh) * 2020-12-07 2021-03-19 北京市商汤科技开发有限公司 标定方法及装置、电子设备及存储介质
CN112926478A (zh) * 2021-03-08 2021-06-08 新疆爱华盈通信息技术有限公司 性别识别方法、***、电子装置及存储介质

Similar Documents

Publication Publication Date Title
CN111209822A (zh) 一种热红外图像的人脸检测方法
CN108549873B (zh) 三维人脸识别方法和三维人脸识别***
CN113705478B (zh) 一种基于改进YOLOv5的红树林单木目标检测方法
CN111882579A (zh) 基于深度学习和目标跟踪的大输液异物检测方法、***、介质及设备
CN110532970B (zh) 人脸2d图像的年龄性别属性分析方法、***、设备和介质
JP4559437B2 (ja) デジタルカラー画像における空の検出
CN111476827B (zh) 目标跟踪方法、***、电子装置及存储介质
KR102521386B1 (ko) 치수 계측 장치, 치수 계측 방법 및 반도체 제조 시스템
CN111429448B (zh) 一种基于弱分割信息的生物荧光目标计数方法
CN113435282B (zh) 基于深度学习的无人机影像麦穗识别方法
CN109253722A (zh) 融合语义分割的单目测距***、方法、设备及存储介质
CN104240264A (zh) 一种运动物体的高度检测方法和装置
CN116448019B (zh) 建筑节能工程质量平面度智能检测装置及方法
US8094971B2 (en) Method and system for automatically determining the orientation of a digital image
CN109191434A (zh) 一种细胞分化中的图像检测***及检测方法
CN110232387A (zh) 一种基于kaze-hog算法的异源图像匹配方法
CN111914761A (zh) 一种热红外人脸识别的方法及***
CN109190458A (zh) 一种基于深度学习的小人头检测方法
CN111860587A (zh) 一种用于图片小目标的检测方法
CN111862040B (zh) 人像图片质量评价方法、装置、设备及存储介质
CN113313107A (zh) 一种斜拉桥缆索表面多类型病害智能检测和识别方法
CN108154513A (zh) 基于双光子成像数据的细胞自动探测和分割方法
CN105654042B (zh) 玻璃温度计的检定温度字符识别方法
CN112541403B (zh) 一种利用红外摄像头的室内人员跌倒检测方法
CN111274986B (zh) 一种基于图像分析的菜品识别分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination