CN111046792A - 人脸检测方法、装置、电子设备和计算机可读存储介质 - Google Patents
人脸检测方法、装置、电子设备和计算机可读存储介质 Download PDFInfo
- Publication number
- CN111046792A CN111046792A CN201911268526.7A CN201911268526A CN111046792A CN 111046792 A CN111046792 A CN 111046792A CN 201911268526 A CN201911268526 A CN 201911268526A CN 111046792 A CN111046792 A CN 111046792A
- Authority
- CN
- China
- Prior art keywords
- face
- image
- detection model
- detected
- full convolution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 131
- 238000000034 method Methods 0.000 claims description 40
- 238000004590 computer program Methods 0.000 claims description 7
- 238000004422 calculation algorithm Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000004080 punching Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G07—CHECKING-DEVICES
- G07C—TIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
- G07C1/00—Registering, indicating or recording the time of events or elapsed time, e.g. time-recorders for work people
- G07C1/10—Registering, indicating or recording the time of events or elapsed time, e.g. time-recorders for work people together with the recording, indicating or registering of other data, e.g. of signs of identity
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明实施例提供的人脸检测方法、装置、电子设备和计算机可读存储介质,涉及计算机视觉领域,其中,该人脸检测方法包括:获取抓拍机的图像,所述图像包含待检测人脸;将所述图像输入至预先训练的全卷积网络检测模型中,得到所述待检测人脸的人脸边界框。因此,本实施例提供的技术方案,针对抓拍机拍摄的图像,直接采用基于FCN的网络结构的全卷积网络检测模型进行人脸检测,避免了现有技术中基于FPN网络的人脸检测方式依赖特征金字塔结构和多anchor策略导致的时间消耗多的问题,提高了检测的速度。
Description
技术领域
本发明涉及计算机视觉领域,具体而言,涉及一种人脸检测方法、装置、电子设备和计算机可读存储介质。
背景技术
在应用人脸识别的员工考勤***中,人脸检测是人脸识别的基础,人脸检测的精度直接决定着人脸识别的精度。
目前,现有的员工考勤***首先利用抓拍机获取图像,然后基于FPN(FeaturePyramid Network,特征金字塔网络)的人脸检测算法来进行人脸检测进而完成打卡的。
但是,针对人脸考勤***中,抓拍机获取的图像中多为1张人脸,且人脸尺度变化较小的情况下,基于FPN的人脸检测算法的特征金字塔结构和多anchor策略导致了更多的时间消耗,检测速度较低。
发明内容
有鉴于此,本发明的目的在于提供一种人脸检测方法、装置、电子设备和计算机可读存储介质。
为了实现上述目的,本发明实施例采用的技术方案如下:
第一方面,本发明实施例提供一种人脸检测方法,包括:
获取抓拍机的图像,所述图像包含待检测人脸;
应用预先训练的全卷积网络检测模型,根据所述图像确定所述待检测人脸的人脸边界框。
在可选的实施方式中,所述应用预先训练的全卷积网络检测模型,根据所述图像确定所述待检测人脸的人脸边界框,包括:
应用预先训练的所述全卷积网络检测模型,根据所述图像输出偏置特征;其中所述偏置特征用于表征所述待检测人脸的人脸边界框的角点相对于图像的中心的偏置;
基于所述偏置特征确定所述人脸边界框。
在可选的实施方式中,所述偏置特征包括偏置坐标;所述偏置坐标用于表征所述待检测人脸的人脸边界框的角点坐标相对于图像的中心坐标的偏置;
或者,
所述偏置特征包括偏置距离;所述偏置距离用于表征所述待检测人脸的人脸边界框的边界线相对于图像的中心的距离。
在可选的实施方式中,所述应用预先训练的全卷积网络检测模型,根据所述图像确定所述待检测人脸的人脸边界框,包括:
所述应用预先训练的全卷积网络检测模型,对所述图像进行检测,得到待确认人脸边界框;
应用预先训练的关键点检测模型,根据所述图像确定所述待检测人脸的人脸关键点;
如果所述人脸关键点在所述待确认人脸边界框的内部,确定所述待确认人脸边界框为所述待检测人脸的人脸边界框。
在可选的实施方式中,所述方法还包括:
对所述待检测人脸的人脸边界框进行去重处理,得到目标人脸边界框。
第二方面,本发明实施例提供一种人脸检测方法,包括:
获取训练样本数据;所述训练样本数据包括多个抓拍机的图像样本,所述图像样本包括预先确定的人脸边界框以及人脸边界框的角点的像素级标注;
应用所述训练样本数据,对初始的全卷积网络检测模型进行训练,得到训练后的全卷积网络检测模型。
在可选的实施方式中,所述图像样本还包括预先确定的人脸关键点的像素级标注;所述方法还包括:
应用所述训练样本数据,对初始的关键点检测模型进行训练,得到训练后的关键点检测模型。
第三方面,本发明实施例提供一种人脸检测装置,包括:
获取模块,用于获取抓拍机的图像,所述图像包含待检测人脸;
输出模块,用于应用预先训练的全卷积网络检测模型,根据所述图像确定所述待检测人脸的人脸边界框。
第四方面,本发明实施例提供一种电子设备,包括:处理器和存储器;所述处理器和所述存储器连接;
所述存储器用于存储程序;
所述处理器用于运行存储在所述存储器中的程序,执行所述前述实施方式中任一项所述的方法。
第五方面,本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如前述实施方式中任一项所述的方法。
本发明实施例带来了以下有益效果:本发明实施例提供的人脸检测方法、装置、电子设备和计算机可读存储介质,其中,该人脸检测方法包括:获取抓拍机的图像,所述图像包含待检测人脸;应用预先训练的全卷积网络检测模型,根据所述图像确定所述待检测人脸的人脸边界框。因此,本实施例提供的技术方案,针对抓拍机拍摄的图像,直接采用基于FCN的网络结构的全卷积网络检测模型进行人脸检测,避免了现有技术中基于FPN网络的人脸检测方式依赖特征金字塔结构和多anchor策略导致的时间消耗多的问题,提高了检测的速度。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本发明实施例提供的一种人脸检测方法的流程图;
图2示出了本发明实施例提供的另一种人脸检测方法的流程图;
图3示出了本发明实施例提供的人脸检测方法的原理图;
图4示出了本发明实施例提供的一种人脸检测装置的示意图;
图5示出了本发明实施例提供的一种人脸检测装置的实际流程图;
图6示出了本发明实施例提供的另一种人脸检测装置的示意图;
图7示出了本发明实施例提供的一种电子设备的示意图。
具体实施方式
下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,术语“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
人脸检测是人脸识别的基础,人脸检测的精度直接决定着人脸识别的精度。目前,现有的员工人脸打卡考勤***首先利用抓拍机获取图像,然后基于FPN网络的人脸检测算法获取人脸图像以及人脸关键点,最后利用关键点对人脸图像进行对齐,并输入识别网络提取人脸特征,检索与底库人脸特征的相似度,完成人脸识别打卡。
但是,针对人脸考勤***中,抓拍机图像是通过人脸区域向外扩大一定倍数获取的,每张图片上仅在单张人脸,因此抓拍机获取的图像尺寸变化不大,且与人脸尺寸成一定比例,针对这种情况,基于FPN的网络结构虽然取得很好的精度,但特征金字塔结构和多anchor策略也导致了更多的时间消耗,检测速度较低。
基于此,本发明实施例提供的一种人脸检测方法、装置、电子设备和计算机可读存储介质,结合抓拍机图像人脸尺寸较为固定的特点,通过采用基于FCN的网络结构的全卷积网络检测模型进行人脸检测,避免了现有技术中基于FPN网络的人脸检测方式依赖特征金字塔结构和多anchor策略导致的时间消耗多的问题,提高了检测的速度。
上述提及的术语anchor表示根据要检测的目标类别和大小,预先获取的可以更好拟合检测目标的多种边界框。
请参阅图1,本申请实施例提供一种人脸检测方法,属于计算机视觉领域,由该领域的电子设备执行,该方法可以主要应用于人脸抓拍机获取的图像上,例如人脸打卡考勤***中。
具体的,该方法应用于人脸检测阶段,包括以下步骤:
步骤S102,获取抓拍机的图像,所述图像包含待检测人脸;
步骤S104,应用预先训练的全卷积网络检测模型,根据所述图像确定所述待检测人脸的人脸边界框。
在步骤S102中,这里的图像指的是待检测的图像或者是目标图像,上述抓拍机拍摄的图像是作为网络输入。
对于步骤S104,在获取到抓拍机拍摄的图像后,将抓拍机拍摄的图像输入到预先训练的已经训练好的全卷积网络检测模型中,该全卷积网络检测模型即可根据该图像,对其中的待检测人脸进行检测,输出待检测人脸的人脸边界框,其中所述人脸边界框标示出了检测的人脸区域,限定了所述人脸检测的范围。
本发明实施例提供的人脸检测方法,包括获取抓拍机的图像,所述图像包含待检测人脸;应用预先训练的全卷积网络检测模型,根据所述图像确定所述待检测人脸的人脸边界框。该方法通过获取抓拍机的图像,并结合抓拍机人脸尺寸固定的特点,直接采用训练好的基于FCN网络结构的全卷积网络检测模型对输入的抓拍机图像进行检测,避免了特征金字塔结构和多anchor策略造成的时间消耗,提高了检测的速度。
可选的,该步骤S104可以通过以下步骤执行:
A应用预先训练的所述全卷积网络检测模型,根据所述图像输出偏置特征;其中所述偏置特征用于表征所述待检测人脸的人脸边界框的角点相对于图像的中心的偏置;
B基于所述偏置特征确定所述人脸边界框。
其中,所述偏置特征包括偏置坐标;所述偏置坐标用于表征所述待检测人脸的人脸边界框的角点坐标相对于图像的中心坐标的偏置;
或者,
所述偏置特征包括偏置距离;所述偏置距离用于表征所述待检测人脸的人脸边界框的边界线相对于图像的中心的距离。
相应的,步骤A可以通过以下方式之一执行:
方式一:
1、应用预先训练的所述全卷积网络检测模型,根据所述图像输出偏置坐标,其中所述偏置坐标用于表征所述待检测人脸的人脸边界框的角点坐标相对于图像的中心坐标的偏置;
2、基于所述偏置坐标以及所述图像的中心坐标确定所述人脸边界框的角点坐标以及所述人脸边界框,需要说明的是,所述人脸边界框的角点坐标和人脸边界框可以双向确定。
方式二:
1)应用预先训练的所述全卷积网络检测模型,根据所述图像输出偏置距离,其中所述偏置距离用于表征所述待检测人脸的人脸边界框的边界线相对于图像的中心的距离。
2)基于所述偏置距离以及所述图像的中心确定所述人脸边界框的边界线以及所述人脸边界框,需要说明的是,所述人脸边界框的边界线和人脸边界框也可以双向确定。
考虑到抓拍机图像中,由于人脸中心位于图像的中心,且图像尺寸与人脸尺寸成一定比例,本实施例的人脸边界框为矩形,具有四个角点和四条边界线;所以每张图片中人脸边界框的四个角点相对于图像中心的偏置变化较小,因此直接以人脸边界框的四个角点相对于图像中心的偏置作为网络的输出,进一步避免了anchor的选取,从而进一步提高了检测的速度。
可选的,该步骤S104,包括:
(1)所述应用预先训练的全卷积网络检测模型,对所述图像进行检测,得到待确认人脸边界框;
(2)应用预先训练的关键点检测模型,根据所述图像确定所述待检测人脸的人脸关键点;
(3)如果所述人脸关键点在所述待确认人脸边界框的内部,确定所述待确认人脸边界框为所述待检测人脸的人脸边界框。
上述的人脸关键点包括左眼、右眼、鼻尖、左嘴角和右嘴角。
通过人脸关键点和待确认人脸边界框可以确定待检测人脸的人脸边界框,其中人脸关键点应该落入人脸边界框的范围内,通过两者的相互对照,可以确保人脸图像的检测精度。
本方案通过上述步骤(1)-(3),能够在确保抓拍机人脸图像检测精度的前提下,提高检测的效率。
可选的,该方法还包括:
去重步骤,对所述待检测人脸的人脸边界框进行去重处理,得到目标人脸边界框。
例如可以通过图像去重算法对人脸边界框进行去重处理,得到目标人脸边界框。
具体的,该去重步骤可以通过以下步骤执行:
A利用NMS(Non-Maximum Suppression,非极大值抑制)算法对人脸边界框进行去重处理,排除重复的、重叠的边界框,得到目标人脸边界框。
B根据图像尺寸(图像中心点坐标)以及预设的计算公式获取目标人脸边界框的角点坐标,从而确定得到人脸边界框角点的精确位置。以偏置特征为偏置坐标为例,计算公式如下:
式中,(tx,ty)表示偏置坐标,(x,y)表示人脸边界框的角点坐标,(cx,cy)表示图像的中心坐标。
这里的去重步骤在得到目标人脸边界框后,再利用公式(1)进行运算即可确定出人脸边界框的角点坐标,减少了计算量,避免因占用计算资源导致的资源浪费以及硬件成本要求高的问题,有利于提高检测效率。
以上介绍的是训练好的全卷积网络检测模型在实际使用过程中的应用,即应用于获取人脸边界框。可以理解的,在将抓拍机的待检测的图像(也称为目标图像)输入到训练好的全卷积网络检测模型中之前,首先要获得训练好的全卷积网络检测模型,也即首先要对全卷积网络检测模型进行训练,即应用于网络训练阶段来训练得到全卷积网络检测模型。
请参阅图2,本发明实施例还提供了一种人脸检测方法,应用于网络训练阶段,该方法包括:
步骤S202,获取训练样本数据;所述训练样本数据包括多个抓拍机的图像样本,所述图像样本包括预先确定的人脸边界框以及人脸边界框的角点的像素级标注;
步骤S204,应用所述训练样本数据,对初始的全卷积网络检测模型进行训练,得到训练后的全卷积网络检测模型。
对于步骤S202,所述训练样本数据包括但不限于在预先标记好人脸边界框以及人脸边界框的角点坐标的抓拍机的图像;在训练阶段的图像样本也可以称为样本图像。
需要解释的是,在训练全卷积网络检测模型时,对于模型的输入的数据是已经由训练人员预先标记出人脸边界框(例如图3中的实线部分)以及人脸边界框的角点坐标(图3中示意性的标识出人脸边界框的左上角的角点坐标)的抓拍机的图像,而输出的数据是图像上的人脸边界框。而训练的目的是为了在输入与输出之间获取一个合适的权值,以使全卷积网络检测模型能够准确地输出人脸边界框。
可选的,步骤S204应用所述训练样本数据,对初始的全卷积网络检测模型进行训练,得到训练后的全卷积网络检测模型,可以通过以下步骤实现:
a基于所述人脸边界框的角点坐标以及所述图像的中心坐标,得到偏置坐标,其中,所述偏置坐标用于表征所述人脸边界框的角点坐标相对于所述图像的中心坐标的偏置;
b将所述偏置坐标作为图像标签输入至FCN网络进行训练,得到训练后的全卷积网络检测模型。
在步骤a中,偏置坐标用于表征所述人脸边界框的角点坐标相对于所述图像的中心坐标的偏置。
可选的,该步骤a通过以下步骤执行:
将所述人脸边界框的角点坐标以及所述图像的中心坐标代下列公式(1)计算得到偏置坐标:
式中,(tx,ty)表示偏置坐标,(x,y)表示人脸边界框的角点坐标,(cx,cy)表示图像的中心坐标。
可选的,
所述图像样本还包括预先确定的人脸关键点的像素级标注;所述方法还包括:
应用所述训练样本数据,对初始的关键点检测模型进行训练,得到训练后的关键点检测模型。
需要说明的是,上述的关键点检测模型也可以是基于FCN网络结构的目标检测模型。
换言之,所述训练样本数据还包括在所述抓拍机的图像上预先标记好的人脸关键点坐标;所述方法还包括:将所述人脸关键点坐标作为所述图像标签输入至所述FCN网络进行训练,得到关键点检测模型。
当然,应当理解的是,人脸关键点的获取也可以采用现有的人脸关键点检测算法或人脸关键点识别算法。
可选地,为了消除异样样本数据导致的不良误差,在获取到训练样本数据之后,该方法还包括:对训练样本数据进行归一化,使得训练样本数据中图像的像素处于[0,1]中。
本实施例提供的人脸检测方法,通过上述步骤训练得到全卷积网络检测模型,可以直接对抓拍机的待检测的图像进行人脸检测,即输入待检测图像,即可输出人脸边界框,该方法的全卷机卷积网络检测模型利用FCN网络结构对人脸边界框的四个角点相对于抓拍图像中心的偏置进行预测,避免了现有技术中基于FPN网络的人脸检测方式依赖特征金字塔结构和多anchor策略导致的时间消耗多的问题,提高了检测的速度。
为了便于理解,下面结合图3对全卷积网络检测模型的完整训练过程进行说明:
请参阅图3,对于网络训练阶段,利用预先标记好的人脸边界框四个角点的每一个角点的坐标(x,y)分别与从抓拍图像直接读取得到的图像的中心坐标(cx,cy)相除,计算得到四个角点的偏置坐标(tx,ty),角点偏置计算公式如公式(1)所示,并将其与预先标记好的5个人脸关键点作为图像标签输入FCN网络结构进行训练,训练得到全卷积网络检测模型。
需要指出的是,在图3中,人脸边界框示意性的以矩形表示,在其他实施例中,当然还可以根据需要用圆形、椭圆形等表示人脸边界框,本申请不作具体限定。
请参阅图4,基于同一发明构思,本申请实施例还提供了一种人脸检测装置400,应用于人脸考勤***,包括获取模块401和输出模块402;
其中,获取模块401用于获取抓拍机的图像,所述图像包含待检测人脸;这里的图像指的是待检测的图像。
输出模块402用于应用预先训练的全卷积网络检测模型,根据所述图像确定所述待检测人脸的人脸边界框。
可选的,该输出模块402,用于应用预先训练的所述全卷积网络检测模型,根据所述图像输出偏置特征;其中所述偏置特征用于表征所述待检测人脸的人脸边界框的角点相对于图像的中心的偏置;基于所述偏置特征确定所述人脸边界框。
可选的,所述偏置特征包括偏置坐标;所述偏置坐标用于表征所述待检测人脸的人脸边界框的角点坐标相对于图像的中心坐标的偏置;或者,所述偏置特征包括偏置距离;所述偏置距离用于表征所述待检测人脸的人脸边界框的边界线相对于图像的中心的距离。
可选的,该输出模块402,用于所述应用预先训练的全卷积网络检测模型,对所述图像进行检测,得到待确认人脸边界框;
应用预先训练的关键点检测模型,根据所述图像确定所述待检测人脸的人脸关键点;
如果所述人脸关键点在所述待确认人脸边界框的内部,确定所述待确认人脸边界框为所述待检测人脸的人脸边界框。
可选的,该装置还包括去重模块403,用于对所述待检测人脸的人脸边界框进行去重处理,得到目标人脸边界框。
下面结合图5对本发明实施例提供的人脸检测装置的实际检测流程进行说明:
请参阅图5,对于训练好的全卷积网络检测模型的网络结构,利用抓拍机获取的抓拍图像作为模型的输入,输出表征人脸边界框角点相对于图像中心的偏置的角点偏置,以及输出5个人脸关键点坐标,最后利用NMS算法排除重复的重叠的边界框,得到目标人脸边界框,并根据图像尺寸和计算公式(1)得到目标人脸边界框角点的精确位置的结果。
请参阅图6,本实施例还提供了另一种人脸检测装置600,包括:
数样本块601,用于获取训练样本数据;所述训练样本数据包括多个抓拍机的图像样本,所述图像样本包括预先确定的人脸边界框以及人脸边界框的角点的像素级标注;
训练模块602,用于应用所述训练样本数据,对初始的全卷积网络检测模型进行训练,得到训练后的全卷积网络检测模型。
可选的,所述图像样本还包括预先确定的人脸关键点的像素级标注;训练模块602,用于应用所述训练样本数据,对初始的关键点检测模型进行训练,得到训练后的关键点检测模型。
需要指出的是,本实施例提及的坐标均为像素坐标。
请参阅图7,基于同一发明构思,本发明实施例还提供一种电子设备100,包括:处理器40,存储器41,总线42和通信接口43,所述处理器40、通信接口43和存储器41通过总线42连接;处理器40用于执行存储器41中存储的可执行模块,例如计算机程序。
其中,存储器41可能包含高速随机存取存储器(RAM,Random Access Memory),也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口43(可以是有线或者无线)实现该***网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。
总线42可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
其中,存储器41用于存储程序,所述处理器40在接收到执行指令后,执行所述程序,前述本发明实施例任一实施例揭示的流过程定义的装置所执行的方法可以应用于处理器40中,或者由处理器40实现。
处理器40可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器40中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器40可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital SignalProcessing,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现成可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器41,处理器40读取存储器41中的信息,结合其硬件完成上述方法的步骤。
本申请实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器运行时执行上述实施例提供的人脸检测方法的步骤。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和结构图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,结构图和/或流程图中的每个方框、以及结构图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块或单元可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或更多个模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是智能手机、个人计算机、服务器、或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。
Claims (10)
1.一种人脸检测方法,其特征在于,包括:
获取抓拍机的图像,所述图像包含待检测人脸;
应用预先训练的全卷积网络检测模型,根据所述图像确定所述待检测人脸的人脸边界框。
2.根据权利要求1所述的方法,其特征在于,所述应用预先训练的全卷积网络检测模型,根据所述图像确定所述待检测人脸的人脸边界框,包括:
应用预先训练的所述全卷积网络检测模型,根据所述图像输出偏置特征;其中所述偏置特征用于表征所述待检测人脸的人脸边界框的角点相对于图像的中心的偏置;
基于所述偏置特征确定所述人脸边界框。
3.根据权利要求2所述的方法,其特征在于,所述偏置特征包括偏置坐标;所述偏置坐标用于表征所述待检测人脸的人脸边界框的角点坐标相对于图像的中心坐标的偏置;
或者,
所述偏置特征包括偏置距离;所述偏置距离用于表征所述待检测人脸的人脸边界框的边界线相对于图像的中心的距离。
4.根据权利要求1所述的方法,其特征在于,所述应用预先训练的全卷积网络检测模型,根据所述图像确定所述待检测人脸的人脸边界框,包括:
所述应用预先训练的全卷积网络检测模型,对所述图像进行检测,得到待确认人脸边界框;
应用预先训练的关键点检测模型,根据所述图像确定所述待检测人脸的人脸关键点;
如果所述人脸关键点在所述待确认人脸边界框的内部,确定所述待确认人脸边界框为所述待检测人脸的人脸边界框。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对所述待检测人脸的人脸边界框进行去重处理,得到目标人脸边界框。
6.一种人脸检测方法,其特征在于,包括:
获取训练样本数据;所述训练样本数据包括多个抓拍机的图像样本,所述图像样本包括预先确定的人脸边界框以及人脸边界框的角点的像素级标注;
应用所述训练样本数据,对初始的全卷积网络检测模型进行训练,得到训练后的全卷积网络检测模型。
7.根据权利要求6所述的方法,其特征在于,所述图像样本还包括预先确定的人脸关键点的像素级标注;所述方法还包括:
应用所述训练样本数据,对初始的关键点检测模型进行训练,得到训练后的关键点检测模型。
8.一种人脸检测装置,其特征在于,包括:
获取模块,用于获取抓拍机的图像,所述图像包含待检测人脸;
输出模块,用于应用预先训练的全卷积网络检测模型,根据所述图像确定所述待检测人脸的人脸边界框。
9.一种电子设备,其特征在于,包括:处理器和存储器;所述处理器和所述存储器连接;
所述存储器用于存储程序;
所述处理器用于运行存储在所述存储器中的程序,执行所述权利要求1-7中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911268526.7A CN111046792A (zh) | 2019-12-11 | 2019-12-11 | 人脸检测方法、装置、电子设备和计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911268526.7A CN111046792A (zh) | 2019-12-11 | 2019-12-11 | 人脸检测方法、装置、电子设备和计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111046792A true CN111046792A (zh) | 2020-04-21 |
Family
ID=70235766
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911268526.7A Pending CN111046792A (zh) | 2019-12-11 | 2019-12-11 | 人脸检测方法、装置、电子设备和计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111046792A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104598936B (zh) * | 2015-02-28 | 2018-07-27 | 北京畅景立达软件技术有限公司 | 人脸图像面部关键点的定位方法 |
CN109558864A (zh) * | 2019-01-16 | 2019-04-02 | 苏州科达科技股份有限公司 | 人脸关键点检测方法、装置及存储介质 |
CN110276308A (zh) * | 2019-06-25 | 2019-09-24 | 上海商汤智能科技有限公司 | 图像处理方法及装置 |
CN110309706A (zh) * | 2019-05-06 | 2019-10-08 | 深圳市华付信息技术有限公司 | 人脸关键点检测方法、装置、计算机设备及存储介质 |
CN110490170A (zh) * | 2019-08-27 | 2019-11-22 | 浙江中正智能科技有限公司 | 一种人脸候选框提取方法 |
-
2019
- 2019-12-11 CN CN201911268526.7A patent/CN111046792A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104598936B (zh) * | 2015-02-28 | 2018-07-27 | 北京畅景立达软件技术有限公司 | 人脸图像面部关键点的定位方法 |
CN109558864A (zh) * | 2019-01-16 | 2019-04-02 | 苏州科达科技股份有限公司 | 人脸关键点检测方法、装置及存储介质 |
CN110309706A (zh) * | 2019-05-06 | 2019-10-08 | 深圳市华付信息技术有限公司 | 人脸关键点检测方法、装置、计算机设备及存储介质 |
CN110276308A (zh) * | 2019-06-25 | 2019-09-24 | 上海商汤智能科技有限公司 | 图像处理方法及装置 |
CN110490170A (zh) * | 2019-08-27 | 2019-11-22 | 浙江中正智能科技有限公司 | 一种人脸候选框提取方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110827247B (zh) | 一种识别标签的方法及设备 | |
CN110705405B (zh) | 目标标注的方法及装置 | |
CN108985199B (zh) | 商品取放操作的检测方法、装置及存储介质 | |
CN108875731B (zh) | 目标识别方法、装置、***及存储介质 | |
CN109002820B (zh) | 一种车牌识别方法、装置及相关设备 | |
CN111382704B (zh) | 基于深度学习的车辆压线违章判断方法、装置及存储介质 | |
CN109086734B (zh) | 一种对人眼图像中瞳孔图像进行定位的方法及装置 | |
US9916513B2 (en) | Method for processing image and computer-readable non-transitory recording medium storing program | |
CN111476234B (zh) | 一种遮挡车牌字符识别方法、装置、存储介质和智能设备 | |
US9600736B2 (en) | Pose detection using depth camera | |
CN112434715B (zh) | 基于人工智能的目标识别方法、装置及存储介质 | |
CN108875506B (zh) | 人脸形状点跟踪方法、装置和***及存储介质 | |
CN103488966A (zh) | 一种能够识别实名制车票信息的智能手机 | |
CN108875500B (zh) | 行人再识别方法、装置、***及存储介质 | |
CN112308046A (zh) | 图像的文本区域定位方法、装置、服务器及可读存储介质 | |
CN113903014B (zh) | 车道线预测方法、装置及电子设备、计算机可读存储介质 | |
CN111680680A (zh) | 一种目标码定位方法、装置、电子设备及存储介质 | |
CN111199198A (zh) | 一种图像目标定位方法、图像目标定位装置及移动机器人 | |
CN111046831B (zh) | 家禽识别方法、装置及服务器 | |
CN112287905A (zh) | 车辆损伤识别方法、装置、设备及存储介质 | |
CN109858363B (zh) | 一种狗鼻纹特征点的检测方法、装置、***及存储介质 | |
CN111985438A (zh) | 一种静态人脸处理方法、装置及设备 | |
CN109816709B (zh) | 基于单目摄像头的深度估计方法、装置及设备 | |
CN111046792A (zh) | 人脸检测方法、装置、电子设备和计算机可读存储介质 | |
CN110610178A (zh) | 图像识别方法、装置、终端及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20230612 Address after: 314506 room 116, building 4, No. 288, development avenue, Tongxiang Economic Development Zone, Tongxiang City, Jiaxing City, Zhejiang Province Applicant after: Shengjing Intelligent Technology (Jiaxing) Co.,Ltd. Address before: 102200 5th floor, building 6, No.8 Beiqing Road, Changping District, Beijing Applicant before: SANY HEAVY INDUSTRY Co.,Ltd. |
|
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200421 |