CN110674688A - 用于视频监控场景的人脸识别模型获取方法、***和介质 - Google Patents

用于视频监控场景的人脸识别模型获取方法、***和介质 Download PDF

Info

Publication number
CN110674688A
CN110674688A CN201910765212.1A CN201910765212A CN110674688A CN 110674688 A CN110674688 A CN 110674688A CN 201910765212 A CN201910765212 A CN 201910765212A CN 110674688 A CN110674688 A CN 110674688A
Authority
CN
China
Prior art keywords
face recognition
network model
model
face
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910765212.1A
Other languages
English (en)
Other versions
CN110674688B (zh
Inventor
邵新庆
李一力
宋咏君
刘强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Liwei Zhilian Technology Co Ltd
Nanjing ZNV Software Co Ltd
Original Assignee
Shenzhen Liwei Zhilian Technology Co Ltd
Nanjing ZNV Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Liwei Zhilian Technology Co Ltd, Nanjing ZNV Software Co Ltd filed Critical Shenzhen Liwei Zhilian Technology Co Ltd
Priority to CN201910765212.1A priority Critical patent/CN110674688B/zh
Publication of CN110674688A publication Critical patent/CN110674688A/zh
Application granted granted Critical
Publication of CN110674688B publication Critical patent/CN110674688B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明涉及人脸识别技术领域,具体涉及一种用于视频监控场景的人脸识别模型获取方法和***,其中方法包括采用带有人脸标签的高分辨率图像集先训练好教师神经网络模型,再获取与教师神经网络模型结构相同的学生网络模型,对该学生网络模型依次进行初始训练和微调训练得到高级人脸识别模型,采用获取的高级人脸识别模型对输入的视频数据进行人脸识别。这样训练得到的高级人脸识别模型是基于高精度的教师网络模型得来的,对于视频监控场景下的小人脸、模糊人脸以及侧脸等视频信息的识别精度更好,可以精确地识别出人脸信息。同时由于该高级人脸识别模型网络结构小,因此在人脸识别过程对硬件设备的存储能力和计算能力要求不高,节约了硬件成本。

Description

用于视频监控场景的人脸识别模型获取方法、***和介质
技术领域
本发明涉及人脸识别技术领域,具体涉及一种用于视频监控场景的人脸识别模型获取方法、***和介质。
背景技术
人脸识别是人工智能领域应用成熟度最高的技术。得益于深度学习技术的发展和大量人脸数据集的出现,人脸识别技术在机场安检、银行身份认证等领域应用逐渐普及。但在安防领域,视频监控的摄像头安装高度一般在3.5m到10m。一方面通常根据实际的场地情况,安装的摄像头很难捕获到清晰的正脸。另一方面不同于人脸的身份认证,可以在人脸采集时对行为人进行指导,获取清晰的正脸照片。视频监控一般以一个观察者的身份对行为人进行信息的无感知采集,这就造成采集的人脸质量差,包括侧脸、小尺度人脸、运动模糊人脸等。
当前对于这类问题的解决主要是通过训练一个人脸质量判别器,将那些质量低的人脸图像过滤来消除对人脸识别的影响。但是,由于特定的场景问题,大部分的视频监控采集到的人脸图像很少有满足要求的正脸图像,大部分都是分辨率很低、尺度小人脸,而现有的针对该视频监控场景下采集到的图像数据,进行人脸识别时,识别精度较差,因此监控效果不理想。
发明内容
为了解决现有技术中针对视频监控场景下进行人脸识别时识别精度较差的技术问题,本申请提供以下技术方案予以解决:
一种用于视频监控场景的人脸识别模型获取方法,包括:
利用带有人脸标签的高分辨率图像集训练一深度神经网络模型作为教师网络模型;
根据所述教师网络模型生成与所述教师网络模型结构相同的学生网络模型;
对所述高分辨率图像集进行降采样获取低分辨率图像集,采用该低分辨率图像集作为所述学生网络模型的输入对其进行初始训练,获取一个初级人脸识别模型,用于初步识别低分辨率的人脸图像;
对所述初级人脸识别模型进行微调训练得到高级人脸识别模型,用于精确识别低分辨率的人脸图像;
采用所述高级人脸识别模型对输入的视频数据进行人脸识别。
其中,所述学生网络模型的特征维度小于或等于所述教师网络模型的特征维度。
其中,所述利用带有人脸标签的高分辨率图像集训练一深度神经网络模型时采用的损失函数包括分类损失函数和相似性损失函数,所述分类损失函数为交叉熵损失函数或Additive Angular Margin Loss损失函数,所述相似性损失函数为三元组损失函数。
其中,对所述初级人脸识别模型进行微调训练得到高级人脸识别模型,用于精确识别低分辨率的人脸图像包括:
以所述初级人脸识别模型的相关参数为初始参数,采用均方误差损失函数对所述初级人脸识别模型进行训练,提高人脸识别的精度,得到高级人脸识别模型。
其中,所述采用该低分辨率图像集作为所述学生网络模型的输入对其进行初始训练,获取一个初级人脸识别模型时,设置所述学生网络模型的深度不大于所述教师网络模型深度的三分之一,并设置所述学生网络模型的卷积核为3,步长为1;
所述学生网络模型包括一个1*1的卷积层,其输入维度为2048,输出维度为256。
一种用于视频监控场景的人脸识别模型获取***,包括:
教师网络训练模块,用于利用带有人脸标签的高分辨率图像集训练一深度神经网络模型作为教师网络模型;
学生网络获取模块,用于根据所述教师网络模型生成与所述教师网络模型结构相同的学生网络模型;
学生网络训练模块,用于对所述高分辨率图像集进行降采样获取低分辨率图像集,采用该低分辨率图像集作为所述学生网络模型的输入对其进行初始训练,获取一个初级人脸识别模型,用于初步识别低分辨率的人脸图像;
微调训练模块,用于对所述初级人脸识别模型进行微调训练得到高级人脸识别模型,用于精确识别低分辨率的人脸图像。
其中,所述学生网络模型的特征维度小于等于所述教师神经网络模型的特征维度。
其中,所述利用带有人脸标签的高分辨率图像集训练一深度神经网络模型时采用的损失函数包括分类损失函数和相似性损失函数,所述分类损失函数为交叉熵损失函数或Additive Angular Margin Loss损失函数,所述相似性损失函数为三元组损失函数。
其中,所述采用该低分辨率图像集作为所述学生网络模型的输入对其进行初始训练,获取一个初级人脸识别模型时,设置所述学生网络模型的深度不大于所述教师网络模型深度的三分之一,并设置所述学生网络模型的卷积核为3,步长为1;
所述学生网络模型包括一个1*1的卷积层,其输入维度为2048,输出维度为256。
一种用于视频监控场景的人脸识别装置,该人脸识别装置包括人脸识别模块,用于根据所述高级人脸识别模型对输入的视频数据进行人脸识别。
一种计算机可读存储介质,包括程序,所述程序能够被处理器执行以实现如上所述的方法。
依据上述实施例的人脸识别方法和***,采用带有人脸标签的高分辨率图像集先训练好教师神经网络模型,再获取与教师神经网络模型结构相同的学生网络模型,对该学生网络模型依次进行初始训练和微调训练得到高级人脸识别模型,采用获取的高级人脸识别模型对输入的视频数据进行人脸识别,这样训练得到的高级人脸识别模型是基于高精度的教师网络模型得来的,因此对于视频监控场景下的小人脸、模糊人脸以及侧脸等视频信息的识别精度更好,可以精确地识别出人脸信息。
附图说明
图1为本申请实施例的人脸识别方法流程图;
图2为本申请实施例的人脸识别***结构框图。
具体实施方式
下面通过具体实施方式结合附图对本发明作进一步详细说明。其中不同实施方式中类似元件采用了相关联的类似的元件标号。在以下的实施方式中,很多细节描述是为了使得本申请能被更好的理解。然而,本领域技术人员可以毫不费力的认识到,其中部分特征在不同情况下是可以省略的,或者可以由其他元件、材料、方法所替代。在某些情况下,本申请相关的一些操作并没有在说明书中显示或者描述,这是为了避免本申请的核心部分被过多的描述所淹没,而对于本领域技术人员而言,详细描述这些相关操作并不是必要的,他们根据说明书中的描述以及本领域的一般技术知识即可完整了解相关操作。
另外,说明书中所描述的特点、操作或者特征可以以任意适当的方式结合形成各种实施方式。同时,方法描述中的各步骤或者动作也可以按照本领域技术人员所能显而易见的方式进行顺序调换或调整。因此,说明书和附图中的各种顺序只是为了清楚描述某一个实施例,并不意味着是必须的顺序,除非另有说明其中某个顺序是必须遵循的。
本文中为部件所编序号本身,例如“第一”、“第二”等,仅用于区分所描述的对象,不具有任何顺序或技术含义。
本申请的人脸识别方法和***,采用带有人脸标签的高分辨率图像集先训练好教师神经网络模型,再获取与教师神经网络模型结构相同的学生网络模型,对该学生网络模型依次进行初始训练和微调训练得到高级人脸识别模型,这样训练得到的高级人脸识别模型是基于高精度的教师网络模型得来的,因此对于视频监控场景下的小人脸、模糊人脸以及侧脸等视频信息的识别精度更好,可以精确地识别出人脸信息。
其中,本实施例中的高分辨率和低分辨率是相对概念,例如高于预设分辨率则认为是高分辨率,低于或等于则认为是低分辨率等。具体的,本实施例中图像的分辨率大于224*224为高分辨率,低于64*64为低分辨率。
实施例一:
请参考图1,本实施例提供一种用于视频监控场景的人脸识别模型获取方法,该方法包括:
步骤101:利用带有人脸标签的高分辨率图像集训练一深度神经网络模型作为教师网络模型;本实施例中教师网络模型选择卷积网络深的、表征能力强的网络,输出的特征也是维度比较高的,保证人脸识别的精度。
步骤102:根据教师网络模型生成与该教师网络模型结构相同的学生网络模型;根据教师网络模型得到的学生网络模型的特征维度小于或等于教师网络模型的特征维度,学生网络模型的特征维度设置为和教师网络模型相同,学生网络模型相比教师网路模型更小,处理周期更短。
步骤103:对高分辨率图像集进行降采样获取低分辨率图像集,采用该低分辨率图像集作为学生网络模型的输入对其进行初始训练,获取一个初级人脸识别模型,用于初步识别低分辨率的人脸图像。由于用于训练的学生网络模型的分辨率较低,因此训练获取的初级人脸识别模型对人脸图像的识别精度要远弱于教师网络模型,因此还需要进一步的对该学生网络模型进行微调训练。
步骤104:对初级人脸识别模型进行微调训练得到高级人脸识别模型,用于精确识别低分辨率的人脸图像。通过对初级人脸识别模型进行微调训练使得该初级人脸识别模型获得教师模型的识别能力,以提高其识别的精度。
步骤105:采用高级人脸识别模型对输入的视频数据进行人脸识别。
采用本实施例方法训练好的高级人脸识别模型对输入的视频数据进行人脸识别时,即使对低分辨率的人脸图像也具有较高的识别精度。因此对于视频监控场景下的小人脸、模糊人脸以及侧脸等视频信息的识别精度更好,可以精确地识别出人脸信息。且采用该基于学生模型训练得到的高级人脸识别模型对计算机内存和处理能力的要求不高,一般的计算机均可实现,便于在实际应用中推广。
实施例二:
请参考图1,本实施例提供一种用于视频监控场景的人脸识别模型获取方法,该方法包括:
步骤101:利用带有人脸标签的高分辨率图像集训练一深度神经网络模型作为教师网络模型;教师网络模型选择卷积网络深的、表征能力强的网络,输出的特征也是维度比较高的,保证人脸识别的精度。
步骤102:根据教师网络模型生成与该教师网络模型结构相同的学生网络模型;学生网络模型选择与教师网络模型相同结构,学生网络模型的网络长度设置为50层,即ResNet50,学生网络模型的特征维度小于或等于教师网络模型的特征维度,本实施例中,学生网络模型的特征维度设定为256维,也可以设定为与教师网络模型一致。
步骤103:对高分辨率图像集进行降采样获取低分辨率图像集,采用该低分辨率图像集作为学生网络模型的输入对其进行初始训练,获取一个初级人脸识别模型,用于初步识别低分辨率的人脸图像。由于用于训练的学生网络模型的分辨率较低,因此训练获取的初级人脸识别模型对人脸图像的识别精度要远弱于教师网络模型。
步骤104:对初级人脸识别模型进行微调训练得到高级人脸识别模型,用于精确识别低分辨率的人脸图像。本步骤中建立一个蒸馏网络对初级人脸识别模型进行微调训练使得该初级人脸识别模型获得教师模型的识别能力,以提高其识别的精度。
步骤105:采用所述高级人脸识别模型对输入的视频数据进行人脸识别。
其中,步骤101具体包括:
1011:设计深度卷积神经网络的长度,本实施例选取残差网络结构,网络长度为152层,即ResNet152。
1012:设计深度卷积神经网络的输入尺度,选取输入到网络的人脸图像尺度为224*224*3,其中224为长和宽,3表示输入的人脸图像是RGB三通道。
1013:设计网络最后的输出维度,删除ResNet152最后用作分类的全连接层。特征维度选择2048维,即深度卷积神经网络对一张人脸图像的编码表示为一个2048维的特征向量。对于224*224*3尺度的输入,ResNet结构最后的输出数据格式为7*7*2048。最后可以采用全局平均池化将最后的格式转换成1*1*2048,即得到最后的2048维的人脸表征向量。
1014:设计训练的损失函数。损失是训练的模型关于训练样本的预测值与真实值的差。损失函数则是对这些损失值在某种约束下得最小化。即使得训练得模型对样本的预测值与真是值一致。本实施例从人脸分类的角度中选择分类损失函数,如交叉熵损失函数(Cross Entropy Loss)或Additive Angular Margin Loss损失函数;从相似性方面,选择三元组损失(triplet loss)。
1015:搭建深度学习框架(如pytorch1.0),将人脸训练数据和验证数据分别按照类别存放在不同的路径下。设置分类损失函数的类别数为人脸训练集不同人脸数。选择softmax loss和triplet loss两个损失函数作为整个训练的损失函数,其中两个损失函数的权重分别为1和2。
1016:启动对设计的深度神经网络模型的训练,直到最后的损失值收敛为止,取出训练完的人脸模型即为教师网络的模型。
步骤103具体包括:
1031:设计学生网络模型的网络长度为50层,即ResNet50,学生网络的深度要比教师网络小,但是基本的结构都是残差结构。
1032:修改在学生网络模型的最开始处的一个卷积的卷积核由7为3,步长由2修改为1,并删除最大池化部分。
1033:设置学生网络模型的输入为64*64*3。本实施例设定低分辨率的人脸尺度为长64个像素,宽64个像素。若改为其他尺度则需要对应的修改最终的输出的图像大小。
1034:最后在全连接层前为4*4*2048,增加一个1*1的卷积层,输入维度为2048,输出维度为256。这样就达到了降低维度为256维的目的。此外还连接一个全局池化层将4*4的尺度转层1*1,最终输出的特征维度维256维的向量。
通过以上步骤得到一个初级人脸识别模型,用于初步识别低分辨率的人脸图像,为了提高该初级人脸识别模型的识别精度,对该初级人脸识别模型进行微调训练,具体步骤104包括:
1041:将步骤101中训练好的清晰度高的高精度识别的深度神经网络模型作为用于人脸识别的教师网络模型,教师网络模型输入是高清晰度的人脸图像:224*224。
1042:将步骤103中设计的初级人脸识别网络作为本次训练的高级人脸识别网络模型,并使用步骤103中训练的初级人脸识别模型作为本次训练的初始参数,本次输入初始的人脸图像是输入到教师网络中的图像经过降采用后的:64*64。
1043:对于每个人脸图像,教师网络模型的输出(Embedding)是一个2048维的特征向量。此外将对应的人脸图像输入到学生网络模型输出(Embedding)的是一个256维特征向量。
1044:将高清晰的人脸图像送入到教师网络模型中获取高清人脸图像的特征(Embedding),然后根据图像的人脸ID选择相似性样本。Anchor表示当前选择的样本(锚示例),Positive表示与Anchor相同人脸ID的样本(正示例),Negative表示与Anchor不相同人脸ID的样本(负示例)。
对于有标签的样本,因为在输入给网络时候就知道了图像ID,这里可以采用在线选择难样本方式选择{Anchor、Positive、Negative}三元组。即每个样本选择与自己人脸ID相同的但是Embedding欧式距离最大的作为Positive,而选择与自己人脸ID不同的但是Embedding欧式里最小的作为Negative。
对于没有标签的样本,这里的Anchor、和Positive和Negative通过教师网络计算的Embedding之间的欧式距离选择。即Positive表示与Anchor距离最小的,Negative表示与Anchor距离最大的样本。
1045:确定了训练的三元组{Anchor、Positive、Negative},目标就是通过将降采样后的人脸图像输入到学生网络模型获取的人脸特征(Embedding1、Embedding2、Embedding3)计算欧式距离,使他们的相似关系与{Anchor、Positive、Negative}的相似关系一致。即使得学生网络模型的{Anchor_s、Positive_s、Negative_s}与教师网络模型的{Anchor、Positive、Negative}的相似关系一致。
1046:微调小人脸识别网络;以103中训练的初级人脸识别模型的参数为初始参数,该参数主要包括卷积核和归一化参数等,通过对学生网络模型建立损失函数进行训练。记教师网络模型计算的三元组的欧式距离dap,dan为点p0=(dap,dan),学生网络模型计算的三元组欧式距离daps,dans为点p1=(daps,dans)。最后的损失函数为一个MSE(均方误差)损失函数。此外对应由标签的数据集还可以增加分类损失函数,同3中的交叉熵损失函数(Cross Entropy Loss)。
本实施例的人脸识别方法,采用带有人脸标签的高分辨率图像集先训练好教师神经网络模型,再获取与教师神经网络模型结构相同的学生网络模型,对该学生网络模型依次进行初始训练和微调训练得到高级人脸识别模型,这样训练得到的高级人脸识别模型是基于高精度的教师网络模型得来的,因此对于视频监控场景下的小人脸、模糊人脸以及侧脸等视频信息的识别精度更好,可以精确地识别出人脸信息,并且该方法对计算机内存和处理能力的要求不高,一般的计算机均可实现,便于在实际应用中推广。
实施例三
本实施例提供一种用于视频监控场景的人脸识别模型获取***,请参考图2,该***包括:
教师网络训练模块201,用于利用带有人脸标签的高分辨率图像集训练一深度神经网络模型作为教师网络模型;
学生网络获取模块202,用于根据教师网络模型生成与该教师网络模型结构相同的学生网络模型;其中,学生网络模型的特征维度小于等于教师神经网络模型。本实施例学生网络模型的网络长度设置为50层,即ResNet50,学生网络模型的特征维度小于或等于教师网络模型的特征维度,本实施例中,学生网络模型的特征维度设定为256维,也可以设定为与教师网络模型一致。
学生网络训练模块203,用于对高分辨率图像集进行降采样获取低分辨率图像集,采用该低分辨率图像集作为学生网络模型的输入对其进行初始训练,获取一个初级人脸识别模型,用于初步识别低分辨率的人脸图像。由于用于训练的学生网络模型的分辨率较低,因此训练获取的初级人脸识别模型对人脸图像的识别精度要远弱于教师网络模型。训练时设置学生网络模型最开始的卷积核为3,步长为1;学生网络模型包括一个1*1的卷积层,其输入维度为2048,输出维度为256。
微调训练模块204,用于对初级人脸识别模型进行微调训练得到高级人脸识别模型,用于精确识别低分辨率的人脸图像。微调训练模块204建立一个蒸馏网络对初级人脸识别模型进行微调训练使得该初级人脸识别模型获得教师模型的识别能力,以提高其识别的精度。
人脸识别模块205,用于根据高级人脸识别模型对输入的视频数据进行人脸识别。通过该高级人脸识别模型可以精确的从人脸图像中识别出人脸信息,且该***对内存和处理器的要求不高,成本较低。
以上***各模块中预设的具体训练方法和实施例1中相同,此处不再赘述,本实施例的人脸识别***,采用带有人脸标签的高分辨率图像集先训练好教师神经网络模型,再获取与教师神经网络模型结构相同的学生网络模型,对该学生网络模型依次进行初始训练和微调训练得到高级人脸识别模型,这样训练得到的高级人脸识别模型是基于高精度的教师网络模型得来的,因此对于视频监控场景下的小人脸、模糊人脸以及侧脸等视频信息的识别精度更好,可以精确地识别出人脸信息。
实施例四
本实施例提供一种用于视频监控场景的人脸识别装置,该人脸识别装置包括人脸识别模块,该人脸识别模块中预设有训练好的高级人脸识别模型,用于根据高级人脸识别模型对输入的视频数据进行人脸识别。
实施例五
一种计算机可读存储介质,包括程序,所述程序能够被处理器执行以实现如实施例1的人脸识别模型获取方法。
以上应用了具体个例对本发明进行阐述,只是用于帮助理解本发明,并不用以限制本发明。对于本发明所属技术领域的技术人员,依据本发明的思想,还可以做出若干简单推演、变形或替换。

Claims (10)

1.一种用于视频监控场景的人脸识别模型获取方法,其特征在于,包括:
利用带有人脸标签的高分辨率图像集训练一深度神经网络模型作为教师网络模型;
根据所述教师网络模型生成与所述教师网络模型结构相同的学生网络模型;
对所述高分辨率图像集进行降采样获取低分辨率图像集,采用所述低分辨率图像集作为所述学生网络模型的输入对其进行初始训练,获取一个初级人脸识别模型,用于初步识别低分辨率的人脸图像;
对所述初级人脸识别模型进行微调训练得到高级人脸识别模型,用于精确识别低分辨率的人脸图像。
2.如权利要求1所述的人脸识别模型获取方法,其特征在于,所述学生网络模型的特征维度小于或等于所述教师网络模型的特征维度。
3.如权利要求1所述的人脸识别模型获取方法,其特征在于,利用带有人脸标签的高分辨率图像集训练一深度神经网络模型时采用的损失函数包括分类损失函数和相似性损失函数,所述分类损失函数为交叉熵损失函数或Additive Angular Margin Loss损失函数,所述相似性损失函数为三元组损失函数。
4.如权利要求1所述的人脸识别模型获取方法,其特征在于,对所述初级人脸识别模型进行微调训练得到高级人脸识别模型,用于精确识别低分辨率的人脸图像包括:
以所述初级人脸识别模型的参数为初始参数,采用均方误差损失函数对所述初级人脸识别模型进行训练,提高人脸识别的精度,得到高级人脸识别模型。
5.如权利要求1所述的人脸识别模型获取方法,其特征在于,所述采用该低分辨率图像集作为所述学生网络模型的输入对其进行初始训练,获取一个初级人脸识别模型时,设置所述学生网络模型的深度不大于所述教师网络模型深度的三分之一,并设置所述学生网络模型的卷积核为3,步长为1;
所述学生网络模型包括一个1*1的卷积层,其输入维度为2048,输出维度为256。
6.一种用于视频监控场景的人脸识别模型获取***,其特征在于,包括:
教师网络训练模块,用于利用带有人脸标签的高分辨率图像集训练一深度神经网络模型作为教师网络模型;
学生网络获取模块,用于根据所述教师网络模型生成与所述教师网络模型结构相同的学生网络模型;
学生网络训练模块,用于对所述高分辨率图像集进行降采样获取低分辨率图像集,采用该低分辨率图像集作为所述学生网络模型的输入对其进行初始训练,获取一个初级人脸识别模型,用于初步识别低分辨率的人脸图像;
微调训练模块,用于对所述初级人脸识别模型进行微调训练得到高级人脸识别模型,用于精确识别低分辨率的人脸图像。
7.如权利要求6所述的人脸识别模型获取***,其特征在于,所述学生网络模型的特征维度小于等于所述教师神经网络模型的特征维度。
8.如权利要求6所述的人脸识别模型获取***,其特征在于,所述利用带有人脸标签的高分辨率图像集训练一深度神经网络模型时采用的损失函数包括分类损失函数和相似性损失函数,所述分类损失函数为交叉熵损失函数或Additive Angular Margin Loss损失函数,所述相似性损失函数为三元组损失函数。
9.一种用于视频监控场景的人脸识别装置,其特征在于,该人脸识别装置包括人脸识别模块,用于根据所述高级人脸识别模型对输入的视频数据进行人脸识别。
10.一种计算机可读存储介质,其特征在于,包括程序,所述程序能够被处理器执行以实现如权利要求1-5中任一项所述的方法。
CN201910765212.1A 2019-08-19 2019-08-19 用于视频监控场景的人脸识别模型获取方法、***和介质 Active CN110674688B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910765212.1A CN110674688B (zh) 2019-08-19 2019-08-19 用于视频监控场景的人脸识别模型获取方法、***和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910765212.1A CN110674688B (zh) 2019-08-19 2019-08-19 用于视频监控场景的人脸识别模型获取方法、***和介质

Publications (2)

Publication Number Publication Date
CN110674688A true CN110674688A (zh) 2020-01-10
CN110674688B CN110674688B (zh) 2023-10-31

Family

ID=69075486

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910765212.1A Active CN110674688B (zh) 2019-08-19 2019-08-19 用于视频监控场景的人脸识别模型获取方法、***和介质

Country Status (1)

Country Link
CN (1) CN110674688B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111695415A (zh) * 2020-04-28 2020-09-22 平安科技(深圳)有限公司 图像识别模型的构建方法、识别方法及相关设备
CN111832440A (zh) * 2020-06-28 2020-10-27 高新兴科技集团股份有限公司 人脸特征提取模型的构建方法、计算机存储介质及设备
CN111881920A (zh) * 2020-07-16 2020-11-03 深圳力维智联技术有限公司 一种大分辨率图像的网络适配方法及神经网络训练装置
CN112131938A (zh) * 2020-08-14 2020-12-25 天津大学 基于TensorFlow框架下的课堂考勤督导方法、***与存储介质
CN112200722A (zh) * 2020-10-16 2021-01-08 鹏城实验室 图像超分辨重构模型的生成方法、重构方法及电子设备
CN113205002A (zh) * 2021-04-08 2021-08-03 南京邮电大学 非受限视频监控的低清人脸识别方法、装置、设备及介质
CN113326832A (zh) * 2021-08-04 2021-08-31 北京的卢深视科技有限公司 模型训练、图像处理方法、电子设备及存储介质
CN113610069A (zh) * 2021-10-11 2021-11-05 北京文安智能技术股份有限公司 基于知识蒸馏的目标检测模型训练方法
CN113642353A (zh) * 2020-04-27 2021-11-12 Tcl科技集团股份有限公司 一种人脸检测模型的训练方法、存储介质及终端设备
CN113723238A (zh) * 2021-08-18 2021-11-30 北京深感科技有限公司 一种人脸轻量网络模型构建方法和人脸识别方法
CN113807214A (zh) * 2021-08-31 2021-12-17 中国科学院上海微***与信息技术研究所 基于deit附属网络知识蒸馏的小目标人脸识别方法
CN113947801A (zh) * 2021-12-21 2022-01-18 中科视语(北京)科技有限公司 人脸识别方法、装置和电子设备
CN117313818A (zh) * 2023-09-28 2023-12-29 四川大学 对轻量级卷积神经网络训练的方法及终端设备

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106096538A (zh) * 2016-06-08 2016-11-09 中国科学院自动化研究所 基于定序神经网络模型的人脸识别方法及装置
CN106780906A (zh) * 2016-12-28 2017-05-31 北京品恩科技股份有限公司 一种基于深度卷积神经网络的人证合一识别方法及***
CN106845330A (zh) * 2016-11-17 2017-06-13 北京品恩科技股份有限公司 一种基于深度卷积神经网络的二维人脸识别模型的训练方法
CN107506793A (zh) * 2017-08-21 2017-12-22 中国科学院重庆绿色智能技术研究院 基于弱标注图像的服装识别方法及***
CN108009528A (zh) * 2017-12-26 2018-05-08 广州广电运通金融电子股份有限公司 基于Triplet Loss的人脸认证方法、装置、计算机设备和存储介质
CN108319686A (zh) * 2018-02-01 2018-07-24 北京大学深圳研究生院 基于受限文本空间的对抗性跨媒体检索方法
CN108765279A (zh) * 2018-03-19 2018-11-06 北京工业大学 一种面向监控场景的行人人脸超分辨率重建方法
CN108875910A (zh) * 2018-05-23 2018-11-23 山东大学 基于注意力知识提取的服装搭配方法、***及存储介质
CN109063565A (zh) * 2018-06-29 2018-12-21 中国科学院信息工程研究所 一种低分辨率人脸识别方法及装置
CN109190446A (zh) * 2018-07-06 2019-01-11 西北工业大学 基于三元组聚焦损失函数的行人再识别方法
CN109637546A (zh) * 2018-12-29 2019-04-16 苏州思必驰信息科技有限公司 知识蒸馏方法和装置
CN109902665A (zh) * 2019-03-28 2019-06-18 北京达佳互联信息技术有限公司 相似人脸检索方法、装置及存储介质
CN110008842A (zh) * 2019-03-09 2019-07-12 同济大学 一种基于深度多损失融合模型的行人重识别方法
CN110059157A (zh) * 2019-03-18 2019-07-26 华南师范大学 一种图文跨模态检索方法、***、装置和存储介质
CN110084119A (zh) * 2019-03-26 2019-08-02 安徽艾睿思智能科技有限公司 基于深度学习的低分辨率人脸图像识别方法

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106096538A (zh) * 2016-06-08 2016-11-09 中国科学院自动化研究所 基于定序神经网络模型的人脸识别方法及装置
CN106845330A (zh) * 2016-11-17 2017-06-13 北京品恩科技股份有限公司 一种基于深度卷积神经网络的二维人脸识别模型的训练方法
CN106780906A (zh) * 2016-12-28 2017-05-31 北京品恩科技股份有限公司 一种基于深度卷积神经网络的人证合一识别方法及***
CN107506793A (zh) * 2017-08-21 2017-12-22 中国科学院重庆绿色智能技术研究院 基于弱标注图像的服装识别方法及***
CN108009528A (zh) * 2017-12-26 2018-05-08 广州广电运通金融电子股份有限公司 基于Triplet Loss的人脸认证方法、装置、计算机设备和存储介质
CN108319686A (zh) * 2018-02-01 2018-07-24 北京大学深圳研究生院 基于受限文本空间的对抗性跨媒体检索方法
CN108765279A (zh) * 2018-03-19 2018-11-06 北京工业大学 一种面向监控场景的行人人脸超分辨率重建方法
CN108875910A (zh) * 2018-05-23 2018-11-23 山东大学 基于注意力知识提取的服装搭配方法、***及存储介质
CN109063565A (zh) * 2018-06-29 2018-12-21 中国科学院信息工程研究所 一种低分辨率人脸识别方法及装置
CN109190446A (zh) * 2018-07-06 2019-01-11 西北工业大学 基于三元组聚焦损失函数的行人再识别方法
CN109637546A (zh) * 2018-12-29 2019-04-16 苏州思必驰信息科技有限公司 知识蒸馏方法和装置
CN110008842A (zh) * 2019-03-09 2019-07-12 同济大学 一种基于深度多损失融合模型的行人重识别方法
CN110059157A (zh) * 2019-03-18 2019-07-26 华南师范大学 一种图文跨模态检索方法、***、装置和存储介质
CN110084119A (zh) * 2019-03-26 2019-08-02 安徽艾睿思智能科技有限公司 基于深度学习的低分辨率人脸图像识别方法
CN109902665A (zh) * 2019-03-28 2019-06-18 北京达佳互联信息技术有限公司 相似人脸检索方法、装置及存储介质

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113642353A (zh) * 2020-04-27 2021-11-12 Tcl科技集团股份有限公司 一种人脸检测模型的训练方法、存储介质及终端设备
CN111695415B (zh) * 2020-04-28 2024-04-12 平安科技(深圳)有限公司 图像识别方法及相关设备
CN111695415A (zh) * 2020-04-28 2020-09-22 平安科技(深圳)有限公司 图像识别模型的构建方法、识别方法及相关设备
CN111832440A (zh) * 2020-06-28 2020-10-27 高新兴科技集团股份有限公司 人脸特征提取模型的构建方法、计算机存储介质及设备
CN111832440B (zh) * 2020-06-28 2024-04-02 高新兴科技集团股份有限公司 人脸特征提取模型的构建方法、计算机存储介质及设备
CN111881920B (zh) * 2020-07-16 2024-04-09 深圳力维智联技术有限公司 一种大分辨率图像的网络适配方法及神经网络训练装置
CN111881920A (zh) * 2020-07-16 2020-11-03 深圳力维智联技术有限公司 一种大分辨率图像的网络适配方法及神经网络训练装置
CN112131938A (zh) * 2020-08-14 2020-12-25 天津大学 基于TensorFlow框架下的课堂考勤督导方法、***与存储介质
CN112200722A (zh) * 2020-10-16 2021-01-08 鹏城实验室 图像超分辨重构模型的生成方法、重构方法及电子设备
CN113205002A (zh) * 2021-04-08 2021-08-03 南京邮电大学 非受限视频监控的低清人脸识别方法、装置、设备及介质
CN113205002B (zh) * 2021-04-08 2022-07-29 南京邮电大学 非受限视频监控的低清人脸识别方法、装置、设备及介质
CN113326832A (zh) * 2021-08-04 2021-08-31 北京的卢深视科技有限公司 模型训练、图像处理方法、电子设备及存储介质
CN113326832B (zh) * 2021-08-04 2021-12-17 北京的卢深视科技有限公司 模型训练、图像处理方法、电子设备及存储介质
CN113723238A (zh) * 2021-08-18 2021-11-30 北京深感科技有限公司 一种人脸轻量网络模型构建方法和人脸识别方法
CN113723238B (zh) * 2021-08-18 2024-02-09 厦门瑞为信息技术有限公司 一种人脸轻量网络模型构建方法和人脸识别方法
CN113807214A (zh) * 2021-08-31 2021-12-17 中国科学院上海微***与信息技术研究所 基于deit附属网络知识蒸馏的小目标人脸识别方法
CN113807214B (zh) * 2021-08-31 2024-01-05 中国科学院上海微***与信息技术研究所 基于deit附属网络知识蒸馏的小目标人脸识别方法
CN113610069A (zh) * 2021-10-11 2021-11-05 北京文安智能技术股份有限公司 基于知识蒸馏的目标检测模型训练方法
CN113947801B (zh) * 2021-12-21 2022-07-26 中科视语(北京)科技有限公司 人脸识别方法、装置和电子设备
CN113947801A (zh) * 2021-12-21 2022-01-18 中科视语(北京)科技有限公司 人脸识别方法、装置和电子设备
CN117313818A (zh) * 2023-09-28 2023-12-29 四川大学 对轻量级卷积神经网络训练的方法及终端设备

Also Published As

Publication number Publication date
CN110674688B (zh) 2023-10-31

Similar Documents

Publication Publication Date Title
CN110674688A (zh) 用于视频监控场景的人脸识别模型获取方法、***和介质
EP3979200A1 (en) Video target tracking method and apparatus, computer device and storage medium
CN108256562B (zh) 基于弱监督时空级联神经网络的显著目标检测方法及***
CN111191663B (zh) 车牌号码识别方法、装置、电子设备及存储介质
Romero et al. Unsupervised deep feature extraction for remote sensing image classification
US11222211B2 (en) Method and apparatus for segmenting video object, electronic device, and storage medium
CN110570433B (zh) 基于生成对抗网络的图像语义分割模型构建方法和装置
CN111191654B (zh) 道路数据生成方法、装置、电子设备及存储介质
CN114565655B (zh) 一种基于金字塔分割注意力的深度估计方法及装置
CN110059728B (zh) 基于注意力模型的rgb-d图像视觉显著性检测方法
CN115496928B (zh) 基于多重特征匹配的多模态图像特征匹配方法
CN106960176B (zh) 一种基于超限学习机和颜色特征融合的行人性别识别方法
CN111784624B (zh) 目标检测方法、装置、设备及计算机可读存储介质
CN109614933B (zh) 一种基于确定性拟合的运动分割方法
CN111696038A (zh) 图像超分辨率方法、装置、设备及计算机可读存储介质
CN113807214B (zh) 基于deit附属网络知识蒸馏的小目标人脸识别方法
CN115393396B (zh) 一种基于掩码预训练的无人机目标跟踪方法
Kwan et al. Compressive vehicle tracking using deep learning
CN110827265A (zh) 基于深度学习的图片异常检测方法
CN114781499B (zh) 一种构建基于ViT模型的密集预测任务适配器的方法
CN115409789A (zh) 基于图像语义分割的输电线路工程缺陷检测方法
CN112149526A (zh) 一种基于长距离信息融合的车道线检测方法及***
CN113393385B (zh) 基于多尺度融合的无监督去雨方法、***、装置及介质
CN116152747A (zh) 一种基于外观辨识和动作建模的人类行为意图识别方法
CN110555406A (zh) 一种基于Haar-like特征及CNN匹配的视频运动目标识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant