CN109241995A - 一种基于改进型ArcFace损失函数的图像识别方法 - Google Patents

一种基于改进型ArcFace损失函数的图像识别方法 Download PDF

Info

Publication number
CN109241995A
CN109241995A CN201810866142.4A CN201810866142A CN109241995A CN 109241995 A CN109241995 A CN 109241995A CN 201810866142 A CN201810866142 A CN 201810866142A CN 109241995 A CN109241995 A CN 109241995A
Authority
CN
China
Prior art keywords
image
loss function
image recognition
modified
indicate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810866142.4A
Other languages
English (en)
Other versions
CN109241995B (zh
Inventor
章东平
陈思瑶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Jiliang University
Original Assignee
China Jiliang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Jiliang University filed Critical China Jiliang University
Priority to CN201810866142.4A priority Critical patent/CN109241995B/zh
Publication of CN109241995A publication Critical patent/CN109241995A/zh
Application granted granted Critical
Publication of CN109241995B publication Critical patent/CN109241995B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于改进型ArcFace损失函数的图像识别方法,采用基于深度学习的图像识别网络对图像的特征进行提取,将提取的特征用来描述图像的主要信息,采用改进型ArcFace损失函数对基于深度学习的图像识别网络进行训练,改进型ArcFace损失函数在角度空间通过既减小类内距离又增大类间距离来最大化分类边界,从而提高图像识别模型识别的准确性。本发明用于模式识别领域。

Description

一种基于改进型ArcFace损失函数的图像识别方法
技术领域
本发明属于深度神经网络提取图像特征的深度学习领域,涉及到神经网络、模式识别等技术,尤其涉及到一种基于改进型ArcFace损失函数的图像识别方法。
背景技术
随着大数据时代的来临和计算能力的大幅提高,图像识别技术正向着高级语义理解方向发展,而基于深度学习的图像识别技术已经成为当今人工智能领域的研究热点。
图像识别技术是通过计算机对图像自动进行处理、分析和理解,以识别各种不同模式的目标和对象的技术。图像识别技术具有广泛的应用,例如,在农业中,可以通过植物的长势、叶子和花的颜色进行判断,给植物进行浇水、施肥、杀虫;在工业中,可以通过图像识别对整个车间的产品进行把控;在医学中,可以通过细胞、骨头的形状进行分析病人的健康状况;在航天中,可以根据卫星图片的实时反馈,进行航天研究;在日常生活中,图像识别技术也非常普及,如车牌识别、指纹识别等;然而,图像识别技术还存在一些困难,由于视点变化、背景复杂、光影变化、遮挡、变形等增加图像识别的难度,造成在基于深度学习的图像识别网络训练过程中图像分类不准确问题,为解决这一问题,ArcFace损失函数被提出,但ArcFace仅从减小类内距离来最大化分类边界。
解决上述问题的关键就是设计一个改进型ArcFace损失函数,在基于深度学习的图像识别网络训练过程中,既减小类内距离又增大类间距离来最大化分类边界,从而提高图像识别模型识别的准确性。
发明内容
本发明克服了现有技术的不足之处,提出了一种基于改进型ArcFace损失函数的图像识别方法,意在利用改进型ArcFace损失函数进行图像识别模型训练,提高现实场景中图像识别的准确性。
本发明为达上述发明目的,采用如下技术方案:
一种基于改进型ArcFace损失函数的图像识别方法,其步骤包括:
步骤(1):准备图像识别训练数据集、测试数据集;
步骤(2):构建基于卷积神经网络的图像识别网络结构,所述基于卷积神经网络的图像识别网络包含卷积层,池化层,全连接层,改进型ArcFace损失函数层,其中,两个卷积层与一个池化层构成一个图像识别子结构,图像识别网络由N个串联的子结构,两个全连接层F1、F2,一个改进型ArcFace损失函数层构成;
步骤(3):将图像识别训练数据集输入到步骤(2)构建的基于卷积神经网络的图像识别网络中训练,训练过程中的损失函数采用改进型ArcFace损失函数,通过不断的对网络进行循环迭代训练使损失函数不断减小,直到完成设定的迭代次数Q,并将图像识别模型进行保存;
进一步地,所述改进型ArcFace损失函数计算公式为:
其中,n表示训练过程中每次迭代输入的训练样本总数,L表示n个样本的损失平均值,yi表示第i个样本的图像类别标签,表示全连接层F2的权重矩阵的第yi列和全连接层F1的输出的夹角,θj表示全连接层F2的权重矩阵的第j列和全连接层F1的输出的夹角,s表示自适应余弦系数(可取s=64),C表示总训练样本的类别数,λ表示自适应权重系数(可取λ=0.5),m表示决策边缘,由网络训练得到;
步骤(4):将图像识别测试数据集利用步骤(3)中得到的图像识别模型进行图像特征提取,计算每两个图像特征向量之间的余弦相似度P,设置图像相似度阈值为T,如果相似度P大于阈值T,则判断两张图像是同一类图像,否则判断两张图像不是同一类图像,得到图像识别模型的测试结果。
与现有技术相比,本发明的有益效果体现在:
本发明采取一种基于改进型ArcFace损失函数进行图像识别,采用基于深度学习的图像识别网络对图像的特征进行提取,将提取的特征用来描述图像的主要信息,采用改进型ArcFace损失函数对基于深度学习的图像识别网络进行训练,ArcFace损失函数只是在角度空间通过减小类内距离来最大化分类边界,不能够使不同类别的图像尽可能的划分,而改进型ArcFace损失函数在角度空间通过既减小类内距离又增大类间距离来最大化分类边界,不仅能够使同一类别的图像更加紧凑,还会使不同类别的图像尽可能的划分,从而提高图像识别模型识别的准确性,本发明适用于图像识别,能够克服采用ArcFace损失函数对基于卷积神经网络进行训练得到的图像识别模型识别不准确问题,提高图像识别的准确性。
附图说明
图1是一种基于改进型ArcFace损失函数的图像识别卷积神经网络结构示意图。
具体实施方式
下面结合附图对本发明作进一步说明。
本实施例中,如图1所示,一种基于改进型ArcFace损失函数的图像识别方法包括如下步骤:
步骤(1):准备图像识别训练数据集、测试数据集;
步骤(2):构建基于卷积神经网络的图像识别网络结构,所述基于卷积神经网络的图像识别网络包含卷积层,池化层,全连接层,改进型ArcFace损失函数层,其中,两个卷积层与一个池化层构成一个图像识别子结构,图像识别网络由32个串联的子结构,两个全连接层F1、F2,一个改进型ArcFace损失函数层构成;
步骤(3):将图像识别训练数据集输入到步骤(2)构建的基于卷积神经网络的图像识别网络中训练,训练过程中的损失函数采用改进型ArcFace损失函数,通过不断的对网络进行循环迭代训练使损失函数不断减小,直到完成设定的迭代次数100,000,并将图像识别模型进行保存;
进一步地,改进型ArcFace损失函数计算公式为:
其中,n表示训练过程中每次迭代输入的训练样本总数,L表示n个样本的损失平均值,yi表示第i个样本的图像类别标签,表示全连接层F2的权重矩阵的第yi列和全连接层F1的输出的夹角,θj表示全连接层F2的权重矩阵的第j列和全连接层F1的输出的夹角,s表示自适应余弦系数(可取s=64),C表示总训练样本的类别数,λ表示自适应权重系数(可取λ=0.5),m表示决策边缘,由网络训练得到;
在训练过程中,设置自适应余弦系数s=64,自适应权重系数λ=0.5;
步骤(4):将图像识别测试数据集利用步骤(3)中得到的图像识别模型进行图像特征提取,计算每两个图像特征向量之间的余弦相似度P,设置图像相似度阈值为T,如果相似度P大于阈值T,设置T=0.8,则判断两张图像是同一类图像,否则判断两张图像不是同一类图像,得到图像识别模型的测试结果。

Claims (2)

1.一种基于改进型ArcFace损失函数的图像识别方法,其特征在于包括如下步骤:
步骤(1):准备图像识别训练数据集、测试数据集;
步骤(2):构建基于卷积神经网络的图像识别网络结构,所述基于卷积神经网络的图像识别网络包含卷积层,池化层,全连接层,改进型ArcFace损失函数层,其中,两个卷积层与一个池化层构成一个图像识别子结构,图像识别网络由N个串联的子结构,两个全连接层F1、F2,一个改进型ArcFace损失函数层构成;
步骤(3):将图像识别训练数据集输入到步骤(2)构建的基于卷积神经网络的图像识别网络中训练,训练过程中的损失函数采用改进型ArcFace损失函数,通过不断的对网络进行循环迭代训练使损失函数不断减小,直到完成设定的迭代次数Q,并将图像识别模型进行保存;
步骤(4):将图像识别测试数据集利用步骤(3)中得到的图像识别模型进行图像特征提取,计算每两个图像特征向量之间的余弦相似度P,设置图像相似度阈值为T,如果相似度P大于阈值T,则判断两张图像是同一类图像,否则判断两张图像不是同一类图像,得到图像识别模型的测试结果。
2.如权利要求1所述的一种基于改进型ArcFace损失函数的图像识别方法,其特征在于,所述步骤(3)中改进型ArcFace损失函数计算公式为:
其中,n表示训练过程中每次迭代输入的训练样本总数,L表示n个样本的损失平均值,yi表示第i个样本的图像类别标签,表示全连接层F2的权重矩阵的第yi列和全连接层F1的输出的夹角,θj表示全连接层F2的权重矩阵的第j列和全连接层F1的输出的夹角,s表示自适应余弦系数(可取s=64),C表示总训练样本的类别数,λ表示自适应权重系数(可取λ=0.5),m表示决策边缘,由网络训练得到。
CN201810866142.4A 2018-08-01 2018-08-01 一种基于改进型ArcFace损失函数的图像识别方法 Active CN109241995B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810866142.4A CN109241995B (zh) 2018-08-01 2018-08-01 一种基于改进型ArcFace损失函数的图像识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810866142.4A CN109241995B (zh) 2018-08-01 2018-08-01 一种基于改进型ArcFace损失函数的图像识别方法

Publications (2)

Publication Number Publication Date
CN109241995A true CN109241995A (zh) 2019-01-18
CN109241995B CN109241995B (zh) 2021-05-14

Family

ID=65072644

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810866142.4A Active CN109241995B (zh) 2018-08-01 2018-08-01 一种基于改进型ArcFace损失函数的图像识别方法

Country Status (1)

Country Link
CN (1) CN109241995B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110659573A (zh) * 2019-08-22 2020-01-07 北京捷通华声科技股份有限公司 一种人脸识别方法、装置、电子设备及存储介质
CN110880018A (zh) * 2019-10-29 2020-03-13 北京邮电大学 一种基于新型损失函数的卷积神经网络目标分类方法
CN111582354A (zh) * 2020-04-30 2020-08-25 中国平安财产保险股份有限公司 图片识别方法、装置、设备及存储介质
CN111639558A (zh) * 2020-05-15 2020-09-08 圣点世纪科技股份有限公司 一种基于ArcFace Loss和改进残差网络的指静脉身份验证方法
CN112200159A (zh) * 2020-12-01 2021-01-08 四川圣点世纪科技有限公司 一种基于改进残差网络的非接触式掌静脉识别方法
CN112418321A (zh) * 2020-11-24 2021-02-26 北京沃东天骏信息技术有限公司 标志图像的识别方法和装置
CN112766399A (zh) * 2021-01-28 2021-05-07 电子科技大学 一种面向图像识别的自适应神经网络训练方法
CN113255694A (zh) * 2021-05-21 2021-08-13 北京百度网讯科技有限公司 训练图像特征提取模型和提取图像特征的方法、装置
CN113378833A (zh) * 2021-06-25 2021-09-10 北京百度网讯科技有限公司 图像识别模型训练方法、图像识别方法、装置及电子设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100082639A1 (en) * 2008-09-30 2010-04-01 Microsoft Corporation Processing maximum likelihood for listwise rankings
CN107145852A (zh) * 2017-04-28 2017-09-08 深圳市唯特视科技有限公司 一种基于同源余弦损失函数的人物识别方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100082639A1 (en) * 2008-09-30 2010-04-01 Microsoft Corporation Processing maximum likelihood for listwise rankings
CN107145852A (zh) * 2017-04-28 2017-09-08 深圳市唯特视科技有限公司 一种基于同源余弦损失函数的人物识别方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JIANKANG DENG等: "《ArcFace:Additive Angular Margin Loss for Deep Face Recognition》", 《ARXIV》 *
LEI LI等: "《TypicFace:Dynamic Margin Cosine Loss for Deep Face Recognition》", 《PRICAI2018》 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110659573B (zh) * 2019-08-22 2021-03-09 北京捷通华声科技股份有限公司 一种人脸识别方法、装置、电子设备及存储介质
CN110659573A (zh) * 2019-08-22 2020-01-07 北京捷通华声科技股份有限公司 一种人脸识别方法、装置、电子设备及存储介质
CN110880018A (zh) * 2019-10-29 2020-03-13 北京邮电大学 一种基于新型损失函数的卷积神经网络目标分类方法
CN110880018B (zh) * 2019-10-29 2023-03-14 北京邮电大学 一种卷积神经网络目标分类方法
CN111582354A (zh) * 2020-04-30 2020-08-25 中国平安财产保险股份有限公司 图片识别方法、装置、设备及存储介质
CN111582354B (zh) * 2020-04-30 2024-07-02 中国平安财产保险股份有限公司 图片识别方法、装置、设备及存储介质
CN111639558A (zh) * 2020-05-15 2020-09-08 圣点世纪科技股份有限公司 一种基于ArcFace Loss和改进残差网络的指静脉身份验证方法
CN111639558B (zh) * 2020-05-15 2023-06-20 圣点世纪科技股份有限公司 一种基于ArcFace Loss和改进残差网络的指静脉身份验证方法
CN112418321A (zh) * 2020-11-24 2021-02-26 北京沃东天骏信息技术有限公司 标志图像的识别方法和装置
CN112200159A (zh) * 2020-12-01 2021-01-08 四川圣点世纪科技有限公司 一种基于改进残差网络的非接触式掌静脉识别方法
CN112766399A (zh) * 2021-01-28 2021-05-07 电子科技大学 一种面向图像识别的自适应神经网络训练方法
CN113255694A (zh) * 2021-05-21 2021-08-13 北京百度网讯科技有限公司 训练图像特征提取模型和提取图像特征的方法、装置
CN113378833A (zh) * 2021-06-25 2021-09-10 北京百度网讯科技有限公司 图像识别模型训练方法、图像识别方法、装置及电子设备
CN113378833B (zh) * 2021-06-25 2023-09-01 北京百度网讯科技有限公司 图像识别模型训练方法、图像识别方法、装置及电子设备

Also Published As

Publication number Publication date
CN109241995B (zh) 2021-05-14

Similar Documents

Publication Publication Date Title
CN109241995A (zh) 一种基于改进型ArcFace损失函数的图像识别方法
Jiao et al. AF-RCNN: An anchor-free convolutional neural network for multi-categories agricultural pest detection
WO2022160771A1 (zh) 基于自适应多尺度特征提取模型的高光谱图像分类方法
CN110363122B (zh) 一种基于多层特征对齐的跨域目标检测方法
Sun et al. Research on the hand gesture recognition based on deep learning
Zhu et al. High performance vegetable classification from images based on alexnet deep learning model
Zhou et al. BOMSC-Net: Boundary optimization and multi-scale context awareness based building extraction from high-resolution remote sensing imagery
CN105069434B (zh) 一种视频中人体动作行为识别方法
CN105825502B (zh) 一种基于显著性指导的词典学习的弱监督图像解析方法
Wang et al. SSRNet: In-field counting wheat ears using multi-stage convolutional neural network
Pan et al. Intelligent diagnosis of northern corn leaf blight with deep learning model
CN110175615B (zh) 模型训练方法、域自适应的视觉位置识别方法及装置
Li et al. Pedestrian detection based on deep learning model
CN111079847A (zh) 一种基于深度学习的遥感影像自动标注方法
CN105975932A (zh) 基于时间序列shapelet的步态识别分类方法
CN108230330B (zh) 一种快速的高速公路路面分割和摄像机定位的方法
CN109034213B (zh) 基于相关熵原则的高光谱图像分类方法和***
CN108960342A (zh) 基于改进SoftMax损失函数的图像相似度计算方法
CN110072183A (zh) 基于群智感知的被动式定位指纹库构建方法
CN110348492A (zh) 一种基于上下文信息及多特征融合的相关滤波目标跟踪方法
CN104966052A (zh) 基于属性特征表示的群体行为识别方法
CN111695460A (zh) 一种基于局部图卷积网络的行人再识别方法
CN104268553A (zh) 基于核模糊Foley-Sammon转换的SAR图像目标识别方法
Shen et al. An improved UAV target detection algorithm based on ASFF-YOLOv5s
CN113158754B (zh) 一种番茄病害图像识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant