CN113343787B

CN113343787B - 一种基于深度学习的适用于图谱对比场景中等级评定方法

Info

Publication number: CN113343787B
Application number: CN202110550431.5A
Authority: CN
Inventors: 李巨文; 于涵; 李兴捷; 尚尔峰
Original assignee: Shenyang Foundry Research Institute Co Ltd Of China National Machinery Research Institute Group
Current assignee: Shenyang Foundry Research Institute Co Ltd Of China National Machinery Research Institute Group
Priority date: 2021-05-20
Filing date: 2021-05-20
Publication date: 2023-09-01
Anticipated expiration: 2041-05-20
Also published as: CN113343787A

Abstract

本发明提供了一种基于深度学习的适用于图谱对比场景中等级评定方法，该等级评定方法采用One‑hot标签软化机制，将原始的等级标签转化为离散概率分布，以建模等级标签的不确定性、歧义性、及其跨等级相关性。结合多任务学习的卷积神经网络框架，最终实现高精度的等级评估。本发明与传统one‑hot标签相比，该机制模拟了人工标注等级时的不确定性，避免失去内在的等级之间的相关性，实现了更好的等级评定准确率。本方法提出了一种基于多任务学习的卷积神经网络框架，通过联合最小化多个损失函数，相比于使用单个任务，收敛更快且取得更优的效果。

Description

一种基于深度学习的适用于图谱对比场景中等级评定方法

技术领域

本发明具体涉及一种基于深度学习的适用于图谱对比场景中等级评定方法。

背景技术

目前，在一些工业检测场景中，如铸件缺陷、晶粒度等，需要根据国家标准或自行定义的标准中的各等级参考图谱对采集到的图像明确其相应的等级。准确地等级评定对保证产品质量，提高利润率具有重要意义。

现有技术中一些基于计算机视觉及深度学习技术的适用于图谱对比场景的等级评估方法：参见公布号：CN111161224A的一篇专利申请，在此方法中，首先基于国家标准铸件缺陷等级参考图谱对采集的铸造缺陷的图片进行人工的等级评定，缺陷图像作为网络输入，等级评定结果作为网络的标签。其次构造带有残差模块及双流通道注意力模块的卷积神经网络模型并进行网络的训练，实现缺陷的等级评价。

相似地，参见公布号：CN109034217A的一篇专利申请，其收集了不同材料及不同金相状态的晶粒度数据库，并根据参考图谱由人工对每张晶粒度金相图片进行等级评定，最后基于深度学习进行训练，从而实现晶粒度等级评定。

上述方法的本质与共同点是将等级评估问题视为图像分类问题，因而存在三个明显的缺点。其一，由于人在图谱对比过程中的主观性，不同的检测专家对同一图像的等级判断往往具有差异，即等级标注具有一定的不确定性；其二，不同等级图像之间的相似程度不同，相邻等级间的图像相似程度更高，图像分类方法会丧失等级间的相关性。其三，在类别数较大时，基于图像分类的算法会间接降低每一类的训练数据量，增大了过拟合的风险。

鉴于上述方法存在的一些弊端，本发明提出了一种适用于图谱对比场景中等级评定的深度学习方法，以实现更高准确率的等级评价。

发明内容

针对现有技术中存在的缺陷，本发明提供了一种基于深度学习的适用于图谱对比场景中等级评定方法，该等级评定方法采用One-hot标签软化机制，将原始的等级标签转化为离散概率分布，以建模等级标签的不确定性、歧义性、及其跨等级相关性。结合多任务学习的卷积神经网络框架，最终实现高精度的等级评估。

基于深度学习的适用于图谱对比场景中等级评定方法具体步骤如下：

(1)构建等级评估数据集：采集需要进行等级评估的待测图像，对每张待测图像I_k进行等级的评定，标注等级值g_k；将所有的图像数据及其对应的标注等级值随机划分为训练集、验证集和测试集，其比例分别为70％，10％和20％；

(2)one-hot标签软化

(3)构造基于多任务学习的卷积神经网络，由特征提取网络，分布投影模块，等级投影模块及多任务损失函数四部分组成；

(4)训练网络：搭建好模型后，使用步骤(1)中的训练集进行训练，每次输入固定数量的图像后，经前向传播获得损失函数值，利用反向传播算法优化模型各个卷积层中参数；重复上述步骤，直至损失函数值不再下降，模型收敛，卷积层中参数值固定；

(5)等级推断：训练完成后，将任意的待测图像输入网络模型中，得到分布投影模块的输出值p_k与等级投影模块的输出值m_k，计算最终的等级值，计算公式如下：

进一步，所述步骤(2)中one-hot标签软化具体为：将标注的等级值g_k转化为离散概率分布D_k，D_k中的第i个元素由下式计算获得：

其中，i＝[0,1,2,…,λ]，λ是标准规定的最大等级值，σ控制标签的软化程度，τ是归一化系数。

进一步，所述特征提取网络为ImageNet预训练的VGG16、AlexNet、ResNet、DenseNet或Xception，不使用特征提取网络中全局池化层之后的部分。

进一步，所述分布投影模块由全连接层1与soft-max层顺接组成，具体如下：

特征向量f_k经过全连接层1变为s_k，s_k经过soft-max层变为p_k，其中，W₁ ^T,b₁是全连接层1的参数；

s_k＝W₁ ^Tf_k+b₁

进一步，等级值投影模块直接获得图像的归一化等级值m_k，由全连接层2和sigmoid激活函数来实现，具体如下：

其中b₂指的是全连接层2的参数。

进一步，多任务损失函数具体为：使用KL散度损失函数度量D_k与p_k的分布距离L_d，使用L1损失函数分别度量D_k的期望与g_k的距离L_e，等级投影模块中m_k与g_k的距离L_r，具体公式如下：

L＝L_d+L_e+L_r。

相对于现有技术，本发明的优点如下：

1.该方法提出了one-hot标签软化机制。与传统one-hot标签相比，该机制模拟了人工标注等级时的不确定性，避免失去内在的等级之间的相关性，实现了更好的等级评定准确率。

2.该方法提出了一种基于多任务学习的卷积神经网络框架，通过联合最小化多个损失函数，相比于使用单个任务，收敛更快且取得更优的效果。

附图说明

图1是one-hot软化标签的概率分布示意图。

图2是多任务学习网络模型框架示意图。

具体实施方式

现结合附图和实施例对本发明作出进一步详细的说明。

实施例1

本实施例提供了一种基于深度学习的适用于图谱对比场景中等级评定方法，所述的基于深度学习的适用于图谱对比场景中等级评定方法包括以下步骤：

(1)构建等级评估数据集：采集需要进行等级评估的待测图像若干张，根据其相应的国家标准或自行定义的标准中的等级评定参考图谱，由专业的检测人员对每张待测图像I_k进行等级的评定，如1级、5级、8级。对于某些图像的等级g_k可能介于两个等级之间，标注的等级值可以不为整数，如4.5级，5.2级。将所有的图像数据及其对应的标注值随机划分为训练集、验证集和测试集，其比例分别为70％，10％和20％。

(2)one-hot标签软化：基于本发明提出的one-hot标签软化机制，将标注的等级值g_k转化为离散概率分布D_k，D_k中的第i个元素由下式计算获得：

在公式(1)中，i＝[0,1,2,…,λ]，λ是标准规定的最大等级值，σ控制标签的软化程度，σ越大，概率分布越离散，等级间相关性越大，对标注正确性的信心就越小。反之，概率分布越集中，等级间相关性越小，对标注正确性的信心就越大。σ可根据具体任务自行确定。τ是归一化系数，确保中各元素之和为1。图1是当最大等级为8，标注等级为6时的软化标签的概率分布示意图。

(3)构造基于多任务学习的卷积神经网络：网络模型结构如图2所示，由特征提取网络，分布投影模块，等级投影模块及多任务损失函数四部分组成。其中，使用在ImageNet预训练的VGG16作为特征提取网络，除VGG16以外，还可以选择AlexNet，ResNet，DenseNet，Xception等网络。本发明不使用特征提取网络中全局池化层之后的部分。分布投影模块由全连接层1与soft-max层顺接组成，其目的是是将特征提取网络提取的特征向量转化为概率分布向量。特征向量f_k经过全连接层1变为s_k，s_k经过soft-max层变为p_k。公式(2)中的W₁ ^T,b₁是全连接层1的参数。

s_k＝W₁ ^Tf_k+b₁ (2)

等级值投影模块旨在直接获得图像的归一化等级值m_k，其功能是由全连接层2和sigmoid激活函数来实现的。

其中b₂指的是全连接层2的参数。本发明中使用多个损失函数来联合学习等级评估过程，具体而言，使用KL散度损失函数度量D_k与p_k的分布距离L_d，使用L1损失函数分别度量D_k的期望与g_k的距离L_e，等级投影模块中m_k与g_k的距离L_r。

L＝L_d+L_e+L_r (8)

(4)训练网络：搭建好模型后，使用步骤(1)中的训练数据集进行训练，每次输入固定数量的图像后，经前向传播获得损失函数值，利用反向传播算法优化模型各个卷积层中参数。重复上述步骤，直至损失函数值不再下降，模型收敛，卷积层中参数值固定。

(5)等级推断：训练完成后，将任意的待测图像输入网络模型中，得到分布投影模块的输出值p_k与等级投影模块的输出值m_k。通过公式(9)即可计算最终的等级值。

Claims

1.一种基于深度学习的适用于图谱对比场景中等级评定方法，其特征在于，该等级评定方法采用One-hot标签软化机制，结合多任务学习的卷积神经网络框架，最终实现高精度的等级评估；

具体步骤如下：

(2)one-hot标签软化，所述One-hot标签软化机制为：将原始的等级标签转化为离散概率分布，建模等级标签的不确定性、歧义性及其跨等级相关性；所述one-hot标签软化具体为：将标注的等级值g_k转化为离散概率分布D_k，D_k中的第i个元素由下式计算获得：

其中，i＝[0,1,2,…,λ]，λ是标准规定的最大等级值，σ控制标签的软化程度，τ是归一化系数；

(3)构造基于多任务学习的卷积神经网络，由特征提取网络，分布投影模块，等级值投影模块及多任务损失函数四部分组成；

分布投影模块由全连接层1与soft-max层顺接组成，具体如下：

s_k＝W₁ ^Tf_k+b₁

等级值投影模块直接获得图像的归一化等级值m_k，由全连接层2和sigmoid激活函数来实现，具体如下：

其中W₂ ^T,b₂指的是全连接层2的参数；

多任务损失函数具体为：使用KL散度损失函数度量D_k与p_k的分布距离L_d，使用L1损失函数分别度量D_k的期望与g_k的距离L_e，等级投影模块中m_k与g_k的距离L_r，具体公式如下：

L＝L_d+L_e+L_r

(5)等级推断：训练完成后，将任意的待测图像输入网络模型中，得到分布投影模块的输出值p_k与等级投影模块的输出值m_k，计算最终的等级值；

计算最终的等级值公式如下：

2.根据权利要求1所述的基于深度学习的适用于图谱对比场景中等级评定方法，其特征在于，所述特征提取网络为ImageNet预训练的VGG16、AlexNet、ResNet、DenseNet或Xception，不使用特征提取网络中全局池化层之后的部分。