CN111832498A - 基于卷积神经网络的漫画人脸识别方法 - Google Patents

基于卷积神经网络的漫画人脸识别方法 Download PDF

Info

Publication number
CN111832498A
CN111832498A CN202010692679.0A CN202010692679A CN111832498A CN 111832498 A CN111832498 A CN 111832498A CN 202010692679 A CN202010692679 A CN 202010692679A CN 111832498 A CN111832498 A CN 111832498A
Authority
CN
China
Prior art keywords
picture
neural network
convolutional neural
pictures
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010692679.0A
Other languages
English (en)
Other versions
CN111832498B (zh
Inventor
王笛
田玉敏
黄珍
刘瑗
万波
杨鹏飞
赵辉
罗楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN202010692679.0A priority Critical patent/CN111832498B/zh
Publication of CN111832498A publication Critical patent/CN111832498A/zh
Application granted granted Critical
Publication of CN111832498B publication Critical patent/CN111832498B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于卷积神经网络的漫画人脸识别方法,其步骤为:(1)生成训练集;(2)生成C‑F Loss损失函数;(3)训练Xception卷积神经网络;(4)生成识别图片集;(5)对漫画人脸图片进行识别。本发明采用Xception卷积神经网络提取特征,可以提取到更完整的漫画人脸特征获得更高的识别率,同时,本发明在交叉熵损失函数的基础上增加了Focal Loss损失函数生成一个C‑F Loss损失函数,解决了不同类中的图片数量的不平衡和图片在训练后输出对应类别名的难易程度的不平衡的问题。

Description

基于卷积神经网络的漫画人脸识别方法
技术领域
本发明属于图像处理技术领域,更进一步涉及图像识别技术领域中一种基于卷积神经网络的漫画人脸识别方法。本发明可应用于从漫画人脸的图像中识别与该人脸对应的身份信息。
背景技术
漫画是一种艺术形式,是用简单而夸张的手法来描述人脸图像。同一个人也会有不同风格的人脸漫画图,不同风格的人脸漫画突出不同的人脸部分特征。对于这种漫画人脸肖像图,人能够较容易的辨别出该漫画人脸属于哪个人,但是对于机器而言,则具有一定挑战性。研究漫画人脸识别可以帮助我们更好地理解人类对人脸的感知。在单纯的面孔识别的基础上,对漫画的研究揭示了人类面孔感知的内在本质。计算机科学家从心理学研究中获得的见解可能会促进机器学习方法的发展,从而进一步提高漫画和人脸识别的性能。
Pushkar Shukla等人在其发表的论文“CARTOONNET:Caricature Recognition ofPublic Figures”(Proceedings of 3rd International Conference on ComputerVision and Image Processing,pp 1-10,2019)中提出了一种基于深度卷积神经网络的漫画人脸识别方法。论文中组成训练集的数据使用的是公开的IIIT-CFW数据集(Mishra etal.,European conference on computer vision,2016),其中包括公众人物的漫画人脸图像。在该论文的实验过程中,从数据集中选取的类别需满足在所选的同一类的图片数量必须大于35张,将这些满足条件的类加入到训练过程中。该方法可以较好的应用到漫画人脸识别的实际情况中,但是,该方法仍然存在不足之处,由于该方法从数据集中只选择同一类的大于35张图片,而忽略了同一类中图像数量少的类别,导致在漫画人脸的识别过程中识别的人物数量减少,影响人脸对应的身份信息的识别数量。
杭州电子科技大学在其申请的专利文献“一种利用门控融合判别特征进行漫画人脸识别的方法”(申请号:201911157921.8,申请公布号:CN 111079549 A)中公开了一种利用门控融合判别特征进行漫画人脸识别的方法。该方法首先进行数据预处理,其次进行特征提取及融合,将17个局部特征与全局特征进行融合。全局特征通过缩放图片大小到112×96并输入到轻量级网络提取,最后通过融合后的漫画及人脸照片的特征计算余弦距离。该方法可以达到较好的识别结果,但是,该方法仍然存在不足之处是,由于该方法在提取全局特征时输入的图片为缩放后的图片,减少了每张图片的像素大小,而且特征提取采用的是轻量级网络,导致每张图片提取的特征不完整,影响人脸对应的身份信息识别率。
发明内容
本发明的目的在于针对上述已有技术的不足,提供一种基于卷积神经网络的漫画人脸识别方法。用于解决由于忽略了同一类中图像数量少的类别,导致在漫画人脸的识别过程中识别的人物数量减少以及由于图片特征提取不完整,导致影响影响人脸对应的身份信息识别率。
实现本发明目的的思路是,构建C-F Loss损失函数,用来解决图像数量少的类别不能加入训练中从而导致漫画人脸的识别过程中识别的人物数量减少的问题。训练中使用Xception卷积神经网络进行图片特征提取,用来解决图片特征提取不完整从而导致影响人脸对应的身份信息的识别率。
本发明实现的具体步骤如下:
(1)生成训练集:
(1a)采集每个待识别者的漫画人脸图片和人脸图片,每个待识别者至少采集15张图片;
(1b)对每张图片中的每只眼睛的每个眼角标注为关键点,采用基于眼睛的人脸对齐方法得到人脸对齐后的图片,将每张人脸对齐后的图片裁剪为250×350的大小,得到裁剪后的图片;
(1c)将每个待识别者的所有裁剪后的图片组成一类,以待识别者的姓名作为该类的类别名,将每一类中的待识别者的所有裁剪后的图片作为训练图片,将所有类的训练图片组成训练集;
(2)生成C-F Loss损失函数如下:
F=-[y log y′+(1-y)log(1-y′)]+[-α(1-y′)γlog(y′)]×e
其中,y表示输入Xception卷积神经网络的图片对应的类别名,y′表示用于训练的Xception卷积神经网络的输出的预测的类别名,α表示一个用来解决不同类中的图片数量的不平衡的参数,其取值范围为[0,1],γ表示一个用来解决图片在Xception卷积神经网络中训练后输出对应类别名的难易程度的不平衡的参数,其取值范围为[0,+∞),e表示一个调整识别率大小的识别率因子,其取值范围为[0,1]。
(3)训练Xception卷积神经网络:
将训练集输入到Xception卷积神经网络中,利用Adam优化器对训练集中训练图片进行迭代训练直至C-F Loss损失函数的值不断收敛至最小,得到训练好的Xception卷积神经网络,保存训练好的Xception卷积神经网络中的权重;
(4)生成识别图片集:
采集每一位待识别者的与训练集中每一张图片不重复的漫画人脸图片,每个待识别者至少采集1张图片,将所有漫画人脸图片组成识别图片集;
(5)对漫画人脸图片进行识别:
将识别图片集中的每张图片依次输入到训练好的Xception卷积神经网络中,依次输出每张图片与其对应的类别名。
与现有技术相比,本发明具有以下优点:
第一,本发明生成了一个C-F Loss损失函数,用于训练Xception卷积神经网络过程中,克服了现有技术中两个问题,其一是不同类中的图片数量的不平衡和图片在Xception卷积神经网络中训练后输出对应类别名的难易程度的不平衡的问题,其二是由于图像数量少而不能加入训练的类别从而导致漫画人脸的识别过程中识别的人物数量减少的问题,使得本发明在训练Xception卷积神经网络前不必删除图片,减少类别数量,从而增加了漫画人脸在识别过程中的可识别的类别数量。
第二,本发明使用训练集中的图片训练Xception卷积神经网络,由于该网络采用多个不同尺寸的卷积核提取特征,提高了对待识别图片中不同尺度特征的适应能力,用于更完整的提取图片中的特征。克服了现有技术中由于减少了每张图片的像素大小且采用轻量级网络提取特征,导致每张图片提取的特征不完整,从而影响人脸对应的身份信息识别率的问题,使得本发明提取了待识别图片中更完整的特征,从而提高了人脸对应的身份信息的识别率。
附图说明
图1是本发明的流程图;
图2是仿真实验中采用的WebCaricature数据集的漫画人脸样本示意图;
图3是仿真实验中对图2中每张图片采用基于眼睛的人脸对齐方法后的漫画人脸样本示意图。
具体实施方式
下面结合附图对本发明做进一步的详细描述。
参照图1,对本发明的具体步骤做进一步的详细描述。
步骤1,生成训练集。
第一步,采集每个待识别者的漫画人脸图片和人脸图片,每个待识别者至少采集15张图片;
第二步,对每张图片中的每只眼睛的每个眼角标注为关键点,采用基于眼睛的人脸对齐方法得到人脸对齐后的图片,将每张人脸对齐后的图片裁剪为250×350的大小,得到裁剪后的图片;
第三步,将每个待识别者的所有裁剪后的图片组成一类,以待识别者的姓名作为该类的类别名,将每一类中的待识别者的所有裁剪后的图片作为训练图片,将所有类的训练图片组成训练集;
步骤2,生成C-F Loss损失函数如下。
F=-[y log y′+(1-y)log(1-y′)]+[-α(1-y′)γlog(y′)]×e
其中,y表示输入Xception卷积神经网络的图片对应的类别名,y′表示用于训练的Xception卷积神经网络的输出的预测的类别名,α表示一个用来解决不同类中的图片数量的不平衡的参数,其取值范围为[0,1],γ表示一个用来解决图片在Xception卷积神经网络中训练后输出对应类别名的难易程度的不平衡的参数,其取值范围为[0,+∞),e表示一个调整识别率大小的识别率因子,其取值范围为[0,1]。
步骤3,训练Xception卷积神经网络。
将训练集输入到Xception卷积神经网络中,利用Adam优化器对训练集中训练图片进行迭代训练直至C-F Loss损失函数的值不断收敛至最小,得到训练好的Xception卷积神经网络,保存训练好的Xception卷积神经网络中的权重;
步骤4,生成识别图片集。
采集每一位待识别者的与训练集中每一张图片不重复的漫画人脸图片,每个待识别者至少采集1张图片,将所有漫画人脸图片组成识别图片集;
步骤5,对漫画人脸图片进行识别。
将识别图片集中的每张图片依次输入到训练好的Xception卷积神经网络中,依次输出每张图片与其对应的类别名。
本发明的效果可以通过以下仿真实验进一步说明。
1.仿真条件:
本发明的仿真实验采用软件Pycharm作为仿真工具,计算机配置为IntelCore i7/3.6GHz/16G,64位Windows7操作***。
本发明的仿真实验使用的数据来自WebCaricature漫画人脸数据集中的所有数据,该数据集是由南京大学创建,包含252位人物身份的6042个漫画和5974张照片组成。每张图像的大小均为250×350。图2是WebCaricature漫画人脸数据集中分别选取的两位人物身份的3张漫画人脸样本示意图。
2.仿真实验内容:
本发明的仿真实验在WebCaricature漫画人脸数据集上进行,采用本发明的方法对人脸漫画图像进行识别,获得识别率。将WebCaricature漫画人脸数据集中的每张图片采用基于眼睛的人脸对齐方法,得到人脸对齐后的图片。图3是对图2中每张图片进行人脸对齐后的漫画人脸样本示意图。将人脸对齐后的数据集按照6:2:2的比例随机划分为训练集,验证集和测试集。将训练集数据输入到Xception卷积神经网络中进行训练,训练过程中采用数据增强技术,提高模型的泛化能力。验证集用来训练过程中验证在训练一个epoch后的模型,得到识别率和损失值。通过训练中计算模型在验证集上的识别率和损失值,使用early-stopping避免过度训练而导致的过拟合。测试集数据测试训练效果最好的模型,得出识别率。

Claims (1)

1.一种基于卷积神经网络的漫画人脸识别方法,其特征在于,利用C-F Loss损失函数,训练Xception卷积神经网络;该方法步骤包括如下:
(1)生成训练集:
(1a)采集每个待识别者的漫画人脸图片和人脸图片,每个待识别者至少采集15张图片;
(1b)对每张图片中的每只眼睛的每个眼角标注为关键点,采用基于眼睛的人脸对齐方法得到人脸对齐后的图片,将每张人脸对齐后的图片裁剪为250×350的大小,得到裁剪后的图片;
(1c)将每个待识别者的所有裁剪后的图片组成一类,以待识别者的姓名作为该类的类别名,将每一类中的待识别者的所有裁剪后的图片作为训练图片,将所有类的训练图片组成训练集;
(2)生成C-F Loss损失函数如下:
F=-[y log y′+(1-y)log(1-y′)]+[-α(1-y′)γlog(y′)]×e
其中,y表示输入Xception卷积神经网络的图片对应的类别名,y′表示用于训练的Xception卷积神经网络的输出的预测的类别名,α表示一个用来解决不同类中的图片数量的不平衡的参数,其取值范围为[0,1],γ表示一个用来解决图片在Xception卷积神经网络中训练后输出对应类别名的难易程度的不平衡的参数,其取值范围为[0,+∞),e表示一个调整识别率大小的识别率因子,其取值范围为[0,1]。
(3)训练Xception卷积神经网络:
将训练集输入到Xception卷积神经网络中,利用Adam优化器对训练集中训练图片进行迭代训练直至C-F Loss损失函数的值不断收敛至最小,得到训练好的Xception卷积神经网络,保存训练好的Xception卷积神经网络中的权重;
(4)生成识别图片集:
采集每一位待识别者的与训练集中每一张图片不重复的漫画人脸图片,每个待识别者至少采集1张图片,将所有漫画人脸图片组成识别图片集;
(5)对漫画人脸图片进行识别:
将识别图片集中的每张图片依次输入到训练好的Xception卷积神经网络中,依次输出每张图片与其对应的类别名。
CN202010692679.0A 2020-07-17 2020-07-17 基于卷积神经网络的漫画人脸识别方法 Active CN111832498B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010692679.0A CN111832498B (zh) 2020-07-17 2020-07-17 基于卷积神经网络的漫画人脸识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010692679.0A CN111832498B (zh) 2020-07-17 2020-07-17 基于卷积神经网络的漫画人脸识别方法

Publications (2)

Publication Number Publication Date
CN111832498A true CN111832498A (zh) 2020-10-27
CN111832498B CN111832498B (zh) 2023-07-28

Family

ID=72923534

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010692679.0A Active CN111832498B (zh) 2020-07-17 2020-07-17 基于卷积神经网络的漫画人脸识别方法

Country Status (1)

Country Link
CN (1) CN111832498B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113112015A (zh) * 2021-04-06 2021-07-13 咪咕动漫有限公司 模型训练方法、装置、电子设备及计算机可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109214360A (zh) * 2018-10-15 2019-01-15 北京亮亮视野科技有限公司 一种基于ParaSoftMax损失函数的人脸识别模型的构建方法及应用
CN109214308A (zh) * 2018-08-15 2019-01-15 武汉唯理科技有限公司 一种基于焦点损失函数的交通异常图片识别方法
GB201910720D0 (en) * 2019-07-26 2019-09-11 Tomtom Global Content Bv Generative adversarial Networks for image segmentation
CN110516576A (zh) * 2019-08-20 2019-11-29 西安电子科技大学 基于深度神经网络的近红外活体人脸识别方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109214308A (zh) * 2018-08-15 2019-01-15 武汉唯理科技有限公司 一种基于焦点损失函数的交通异常图片识别方法
CN109214360A (zh) * 2018-10-15 2019-01-15 北京亮亮视野科技有限公司 一种基于ParaSoftMax损失函数的人脸识别模型的构建方法及应用
GB201910720D0 (en) * 2019-07-26 2019-09-11 Tomtom Global Content Bv Generative adversarial Networks for image segmentation
CN110516576A (zh) * 2019-08-20 2019-11-29 西安电子科技大学 基于深度神经网络的近红外活体人脸识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
刘媛媛;张硕;于海业;王跃勇;王佳木;: "基于语义分割的复杂场景下的秸秆检测", 光学精密工程, no. 01 *
史冰莹;李佳琦;张磊;李健;: "基于CNN的农作物病虫害图像识别模型", 计算机***应用, no. 06 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113112015A (zh) * 2021-04-06 2021-07-13 咪咕动漫有限公司 模型训练方法、装置、电子设备及计算机可读存储介质
CN113112015B (zh) * 2021-04-06 2023-10-20 咪咕动漫有限公司 模型训练方法、装置、电子设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN111832498B (zh) 2023-07-28

Similar Documents

Publication Publication Date Title
CN110569721B (zh) 识别模型训练方法、图像识别方法、装置、设备及介质
CN109410184B (zh) 基于稠密对抗网络半监督学习的直播色情图像检测方法
CN111695430B (zh) 一种基于特征融合和视觉感受野网络的多尺度人脸检测方法
CN109359550B (zh) 基于深度学习技术的满文文档***提取与去除方法
JP2017531262A (ja) 記述式問題のための知的採点方法およびシステム
CN111881707B (zh) 图像翻拍检测方法、身份验证方法、模型训练方法及装置
CN109559362B (zh) 一种图像主体脸部替换方法及装置
CN106548169A (zh) 基于深度神经网络的模糊文字增强方法及装置
CN114429636B (zh) 图像扫描识别方法、装置及电子设备
CN111680577A (zh) 人脸检测方法和装置
CN112749696A (zh) 一种文本检测方法及装置
CN113240050B (zh) 一种特征融合权重可调的金属打印熔池检测方法
CN111832498B (zh) 基于卷积神经网络的漫画人脸识别方法
CN112801923A (zh) 文字处理方法、***、可读存储介质及计算机设备
CN115600040B (zh) 一种钓鱼网站识别方法及装置
CN113553947B (zh) 生成描述多模态行人重识别方法、装置及电子设备
CN112733670B (zh) 指纹特征提取方法、装置、电子设备及存储介质
CN111310528B (zh) 一种图像检测方法、身份验证方法、支付方法及装置
CN112434547B (zh) 一种用户身份稽核方法和设备
CN112861836A (zh) 文本图像处理方法、文本及卡证图像质量评价方法和装置
CN113724271A (zh) 一种用于复杂环境移动机器人场景理解的语义分割模型训练方法
CN111832622A (zh) 特定人物丑化图片识别方法及***
CN111354096A (zh) 一种智能考勤方法及装置、电子设备
CN112396058B (zh) 一种文档图像的检测方法、装置、设备及存储介质
CN112861589A (zh) 人像提取、质量评价、身份验证及模型训练方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant