WO2022160170A1

WO2022160170A1 - 一种金属表面缺陷检测方法及装置

Info

Publication number: WO2022160170A1
Application number: PCT/CN2021/074114
Authority: WO
Inventors: 熊长炜; 舒雨锋; 曹会元; 虞晓琼; 刘沅; 吕伟涵; 莫天旭
Original assignee: 东莞职业技术学院
Priority date: 2021-01-28
Filing date: 2021-01-28
Publication date: 2022-08-04
Also published as: CN115362471A

Abstract

本申请涉及一种金属表面缺陷检测方法，包括：采集金属的表面缺陷图像得到金属表面缺陷数据集；利用所述金属表面缺陷数据集构建第一检测模型；利用ImageNet数据集训练Resnet网络；将训练后的Resnet网络迁移至所述第一检测模型中，得到第二检测模型，其中，所述第二检测模型为基于深度迁移学习的金属表面缺陷的检测模型；利用所述第二检测模型对金属表面进行检测。本申请还涉及一种金属表面缺陷检测装置。本申请将基于ImageNet下训练的ResNet网络迁移至本发明所构建的金属表面缺陷检测模型，通过迁移学习，该金属表面缺陷检测模型获得了更强大的特征表达能力。

Description

一种金属表面缺陷检测方法及装置

技术领域

本申请涉及表面缺陷检测技术领域，尤其涉及一种金属表面缺陷检测方法及装置。

背景技术

随着社会的不断发展，越来越多的高新产业逐步进入人们的视野，其中众多行业对原材料的数量与质量要求越来越高，例如换向器作为电机重要的部件，在制造业尤其是车辆制造、船舶制造、航空航天器材制造等行业的产品品质要求逐年攀升。换向器表面质量的好坏直接决定着其产品品质，而由于换向器由金属制成，在生产加工的过程当中非常容易受到外界的影响而导致产生各式各样的问题，例如，原材料不同、加工方式不同、制作设备不一等都会导致换向器产生一系列表面缺陷，主要是划伤、擦伤、裂纹、油污、黑点等。这些缺陷在一定程度上影响了美观，而且质量上还可能存在着巨大的安全隐患，例如缺陷会降低机械零件的一系列物理性能，像抗腐蚀性、耐磨性还有疲劳强度等，这些性能降低后会让最终产品质量产生严重问题。

如何在生产过程当中及时发现并确定缺陷出现的位置成为了生产产业(例如换向器产业)一个亟待解决的问题。

随着计算机视觉技术发展迅速，基于计算机视觉技术的成熟应用***例如，人脸检测、车辆检测、语音识别、文字识别已广泛应用于各行各业。而基于计算机视觉的换向器表面缺陷检测技术也得到了迅猛的发展，计算机视觉通过非接触式的检测和光学的自动采集获得产品的表面图像，然后使用不同的算法提取表面图像的具体特征，进一步实现检测。

现有技术中利用深度学习的方法对产品缺陷进行缺陷检测的方法，但是深度学习的前提条件是需要海量的数据支撑以及充分的模型训练；但是多数产品表面缺陷的数据基本上是由生产车间的人工拍摄所采集的，样本之间差异较小、重复数据较多，并且实际采集到的数据量通常是达不到深度学习目标检测模型所要求的庞大数据量。

发明内容

为了克服背景技术所提出的问题，本申请提供了一种金属表面缺陷检测方法及装置。

第一方面，本申请提供了一种金属表面缺陷检测方法，该方法包括：

采集金属的表面缺陷图像得到金属表面缺陷数据集；

利用所述金属表面缺陷数据集构建第一检测模型；

利用ImageNet数据集训练Resnet网络；

将训练后的Resnet网络迁移至所述第一检测模型中，得到第二检测模型，其中，所述第二检测模型为基于深度迁移学习的金属表面缺陷的检测模型；

利用所述第二检测模型对金属表面进行检测。

可选地，所述第一检测模型包括迁移网络模块、区域推荐模块和初始检测模块；所述将训练后的Resnet网络迁移至所述第一检测模型中，得到第二检测模型，包括：

所述迁移网络模块提取所述训练后的Resnet网络的特征，得到多个特征图；

将所述多个特征图进行组合得到特征金字塔；

将所述特征金字塔输入所述区域推荐模块中，得到卷积特征图；

所述区域推荐模块将所述卷积特征图输入所述初始检测模块，得到所述第二检测模型。

可选地，所述第一检测模型的网络损失函数为：

L(M,M′)＝L(M)+L(M′)

其中，L(M)为区域推荐模块的损失函数，L(M')为初始检测模块的损失函数；

其中，

表示区域推荐模块的每条支路的损失函数；n表示第n条支路,n∈[1,4]；η _n表示第n条支路的损失权重；S ⁿ表示第n条支路的训练样本集，

表示第n条支路的第i个anchor是前景的概率；

表示第n条支路的第i个anchor的坐标向量；

其中，

表示初始检测模块的每条支路的损失函数；

表示第k条支路的第i个真实候选框为缺陷的概率，

为0或1；t _i是一个向量，表示预测的第i个候选框坐标；

表示第k条支路的第i个真实候选框边界的坐标向量；k表示初始检测模块的第k条支路，k∈[1,4]；γ _k表示第k条支路的损失权重；S ^k表示第k条支路的训练样本集。

可选地，所述区域推荐模块的每条支路的损失函数为：

其中，L _cls表示分类损失函数；L _reg表示边界框回归损失函数；i表示小批次处理中的第i个候选框索引；

表示第n条支路的第i个anchor是前景的概率；

表示Anchor[i]是正样本时,

Anchor[i]是负样本时，

t _i是一个向量，表示预测的候选框坐标；t _i＝{t _x,t _y,t _w,t _h}是一个向量，表示预测的参数化的候选框坐标；

表示第i个真实候选框边界的坐标向量；λ表示权重平衡参数；

其中，p _i表示第i个候选框为缺陷的概率；

表示第i个候选框对应的二值真实标签；

表示两个类别(目标p _i和非目标

)的对数损失，若i为候选缺陷，则

为1，否则为0；R表示smooth _L1函数。

可选地，所述初始检测模块的每条支路的损失函数为：

其中，

表示第k条支路的第i个真实候选框的缺陷的概率，

为0或1；

表示第k条支路的第i个的表示真实候选框边界的坐标向量；L _cls表示分类损失函数；L _reg表示边界框回归损失函数；i表示小批次处理中的第i个候选框索引；t _i表示是一个向量，表示预测的第i个候选框坐标；

表示第i个真实候选框边界的坐标向量；k表示初始检测模块的第k条支路，k∈[1,4]；λ表示权重平衡参数；p _i表示第i个候选框为缺陷的概率；

表示第i个候选框对应的二值真实标签。

第二方面，本申请提供了一种金属表面缺陷检测装置，包括：

采集模块，用于采集金属的表面缺陷图像得到金属表面缺陷数据集；

构建模块，用于利用所述金属表面缺陷数据集构建第一检测模型；

训练模块，用于利用ImageNet数据集训练Resnet网络；

迁移模块，用于将训练后的Resnet网络迁移至所述第一检测模型中，得到第二检测模型，其中，所述第二检测模型为基于深度迁移学习的金属表面缺陷的检测模型；

金属表面检测模块，用于利用所述第二检测模型对金属表

进行检测。

可选地，所述第一检测模型包括迁移网络模块、区域推荐模块和初始检测模块；

所述迁移网络模块用于执行以下操作：

提取所述训练后的Resnet网络的特征，得到多个特征图；将所述多个特征图进行组合得到特征金字塔；将所述特征金字塔输入所述区域推荐模块中，得到卷积特征图；

可选地，所述第一检测模型的网络损失函数为：

L(M,M′)＝L(M)+L(M′)

其中，

表示第n条支路的第i个anchor是前景的概率；

表示第n条支路的第i个anchor的坐标向量；

其中，

表示初始检测模块的每条支路的损失函数；

表示第k条支路的第i个真实候选框是缺陷的概率，

为0或1；t _i是一个向量，表示预测的第i个候选框坐标；

可选地，所述区域推荐模块的每条支路的损失函数为：

表示第n条支路的第i个anchor是前景的概率；

表示Anchor[i]是正样本时,

Anchor[i]是负样本时，

其中，p _i表示第i个候选框为缺陷的概率；

表示第i个候选框对应的二值真实标签；

表示两个类别(目标p _i和非目标

)的对数损失，若i为候选缺陷，则

为1，否则为0；R表示smooth _L1函数。

可选地，所述初始检测模块的每条支路的损失函数为：

其中，

表示第k条支路的第i个真实候选框的缺陷概率，

为0或1；

表示第k条支路的第i个的真实候选框边界的坐标向量；L _cls表示分类损失函数；L _reg表示边界框回归损失函数；i表示小批次处理中的第i个候选框索引；t _i表示一个向量，表示预测的第i个候选框坐标；

表示第i个候选框对应的二值真实标签。

本申请提供的上述技术方案与现有技术相比具有如下优点：

本发明将基于深度学习的目标检测算法Faster R-CNN应用至换向器金属表面缺陷检测识别方法当中，克服了现有技术的检测方法无法适应多变的实际应用环境的问题；

并且依据迁移学习理论，将基于ImageNet下训练的ResNet网络迁移至本发明所提出的金属表面缺陷检测模型，通过迁移学习，该金属表面缺陷检测模型获得了更强大的特征表达能力；

并且为了应对检测中出现的尺度不一的缺陷，本发明提出了一种更适合于Resnet网络的多尺度候选区域推荐网络MS-RPN；

本发明通过对换向器表面缺陷数据集中的图像进行测试，本发明的基于深度学习的目标检测算法相较于Faster R-CNN算法的检测结果提升显著，因此本发明提出的基于深度学习的目标检测算法相比现有技术的Faster R-CNN算法更适合用于换向器金属表面缺陷的检测识别领域。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种金属表面缺陷检测方法的流程示意图；

图2为本申请实施例提供的第一检测模型的网络结构示意图；

图3为现有技术的RPN网络的结构示意图；

图4为本申请实施例提供的区域推荐网络的结构示意图；

图5为本申请实施例提供的利用图像标注工具对数据集对换向器表面进行标注的界面示意图；

图6为本申请实施例提供的已经标注好的数据集的界面示意图；

图7为本申请实施例提供的基于ResNet网络构建换向器表面缺陷检测模型进行迁移学习和不进行迁移学习的性能对比示意图；

图8为本申请实施例提供的利用MS-RPN网络与现有技术中利用RPN的召回率曲线对比示意图；

图9为本申请实施例提供的一种金属表面缺陷检测装置的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请的一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

金属表面检测对于保证机器性能等具有重要的意义，现有技术中的机器学习、深度学习方法对数据量要求较高，直接应用于金属表面缺陷检测方法容易导致金属表面缺陷检测模型训练不充分。

由于在特征层面上存在一些不变的普适性特征，这些特征无论是对于ImageNet数据集，还是金属表面缺陷数据集均是存在的共性特征，因此可以进行基于同构空间下的特征迁移，本实施例的核心思想是模型特征迁移以减少模型训练的复杂度。

实施例一

图1为本申请实施例一提供的一种金属表面缺陷检测方法的流程示意图，参见图1，该方法包括以下步骤：

S100：采集金属的表面缺陷图像得到金属表面缺陷数据集；

S200：利用所述金属表面缺陷数据集构建第一检测模型；

S300：利用ImageNet数据集训练Resnet网络；

S400：将训练后的Resnet网络迁移至所述第一检测模型中，得到第二检测模型，其中，所述第二检测模型为基于深度迁移学习的金属表面缺陷的检测模型；

S500：利用所述第二检测模型对金属表面进行检测。

本实施例利用ImageNet数据集训练Resnet网络降低了模型训练的复杂度；并且使用基于同构空间下的特征迁移，将在同为图像数据的ImageNet数据集上预训练好的Resnet模型中的特征提取层(包括卷积和池化层)迁移到金属表面缺陷数据集中，其中迁移的是第一检测模型的特征提取能力(例如边缘特征提取能力、纹理特征提取能力、形状等高层抽象特征提取能力)，该第二检测模型获得了更强大的特征表达能力，提高了第二检测模型的泛化能力。

迁移学习只是将ImageNet数据集训练后的部分Resnet网络应用至换向器表面检测的特征提取层进行迁移，不能网络整体迁移过来，因此本实施例需要利用所述金属表面缺陷数据集构建第一检测模型，构建出的第一检测模型可包括迁移网络模块21、区域推荐模块22和初始检测模块23(包括A、B、C和D这4个初始检测模块)，参见图2，11为步数为1的卷积层，12为步数为2的卷积层；Res1、Res2、Res3、Res4、Res5为残差块，13为候选区域，14为卷积特征图(包括F1、F2、F3和F4四个卷积特征图)；

所述将训练后的Resnet网络迁移至所述第一检测模型中，得到第二检测模型包括：

所述迁移网络模块21提取所述训练后的Resnet网络的特征，得到多个特征图；将所述多个特征图进行组合得到特征金字塔；将所述特征金字塔输入所述区域推荐模块22中，得到卷积特征图14；

所述区域推荐模块22将所述卷积特征图14输入所述初始检测模块23，得到所述第二检测模型。

在现有技术的Faster RCNN网络中，只是将卷积特征图的最后一层传入检测模块，这样造成大量细节特征丢失；而本实施例中，引入特征金字塔可以将Faster RCNN网络获得不同尺度的卷积特征图14，并将所述卷积特征图14传入之后的初始检测模块23，以更好地适应大小、尺度差异较大的金属表面缺陷。

参见下表1，表1示出了迁移网络模块21的具体结构。

表1

可选地，所述迁移网络模块21的结构依次包括第一分支、第二分支、第三分支、第四分支、第五分支和第六分支；

所述第一分支包括第一卷积层，所述第一卷积层的尺寸为7*7，通道数64，步数为2，经所述第一分支输出的特征图的尺寸为112*112；

所述第二分支为最大池化层，所述最大池化层的尺寸为3*3，通道数64，步数为2，经所述最大池化层输出的特征图的尺寸为56*56；

所述第三分支包括3层卷积层，分别为第二卷积层、第三卷积层和第四卷积层；

其中，所述第二卷积层的尺寸为1*1，步长为3，通道数64，步数为1，经所述第二卷积层输出的特征图的尺寸为56*56；

所述第三卷积层的尺寸为3*3，步长为3，通道数64，步数为1，经所述第三卷积层输出的特征图的尺寸为56*56；

所述第四卷积层的尺寸为1*1，步长为3，通道数256，步数为1，经所述第四卷积输出的特征图的尺寸为56*56；

所述第四分支包括3层卷积层，分别为第五卷积层、第六卷积层和第七卷积层；

其中，所述第五卷积层的尺寸为1*1，步长为4，通道数128，步数为1，经所述第五卷积层输出的特征图的尺寸为28*28；

所述第六卷积层的尺寸为3*3，步长为4，通道数128，步数为1，经所述第六卷积层输出的特征图的尺寸为28*28；

所述第七卷积层的尺寸为1*1，步长为4，通道数256，步数为1，经所述第七卷积输出的特征图的尺寸为28*28；

所述第五分支包括3层卷积层，分别为第八卷积层、第九卷积层和第十卷积层；

其中，所述第八卷积层的尺寸为1*1，步长为23，通道数256，步数为1，经所述第八卷积层输出的特征图的尺寸为14*14；

所述第九卷积层的尺寸为3*3，步长为23，通道数256，步数为1，经所述第九卷积层输出的特征图的尺寸为14*14；

所述第十卷积层的尺寸为1*1，步长为23，通道数1024，步数为1，经所述第十卷积输出的特征图的尺寸为14*14；

所述第六分支包括3层卷积层，分别为第十一卷积层、第十二卷积层和第十三卷积层；

其中，所述第十一卷积层的尺寸为1*1，步长为3，通道数512，步数为1，经所述第十一卷积层输出的特征图的尺寸为7*7；

所述第十二卷积层的尺寸为3*3，步长为3，通道数512，步数为1，经所述第十二卷积层输出的特征图的尺寸为7*7；

所述第十三卷积层的尺寸为1*1，步长为3，通道数2048，步数为1，经所述第十三卷积输出的特征图的尺寸为7*7。

参见图3，区域推荐网络(RPN)22是在Faster R-CNN网络中提出的，它以图像(任意大小)作为输入，并输出一组矩形的推荐区域，每个推荐区域都有一个分值。

参见图4，所述区域推荐模块22是基于RPN网络得到的，每一个子RPN网络的比例尺和纵横比为M：N,其中，M<N；例如每个子RPN网络可包括1个比例尺和3纵横比；

每个子RPN网络在每个滑动窗口的位置产生K个锚，因此大小为W×H的卷积特征图，总共有W×H×K个Anchor。

所述区域推荐模块22连接所述特征金字塔的各个特征图的滑动窗口，其中，所述滑动窗口映射到预设向量，所述预设向量被馈入框回归层和框分类层；

在每个所述滑动窗口上，预测K个推荐区域，则所述框回归层具有4K个输出；

所述框分类层输出2K个分值，以估计每个推荐区域或非推荐区域的概率；

本实施例中的区域推荐网络22为MS-RPN(Multiscale-RegionProposal Network)网络，可以将现有的RPN网络分解成4份，在每一个子RPN网络当中，并没有改变生成区域网络的方法过程，继续在不同尺度的特征图上滑动形成一个小型网络。该MS-RPN网络完全连接至输入转换特征图的n×n滑动窗口，每个滑动窗口都映射到一个低维向量，该低维向量被馈入两个同级的全连接层中，即框回归层(reg)和框分类层(cls)。

可选地，所述第一检测模型的网络损失函数为：

L(M,M′)＝L(M)+L(M′)

其中，L(M)为区域推荐模块22的损失函数，L(M')为初始检测模块23的损失函数；

其中，

表示区域推荐模块22的每条支路的损失函数；n表示第n条支路,n∈[1,4]；η _n表示第n条支路的损失权重；S ⁿ表示第n条支路的训练样本集，

表示第n条支路的第i个anchor是前景的概率；

表示第n条支路的第i个anchor的坐标向量；

其中，

表示初始检测模块23的每条支路的损失函数；

表示第k条支路的第i个真实候选框为缺陷的概率，

为0或1；t _i是一个向量，表示预测的第i个候选框坐标；

表示第k条支路的第i个真实候选框边界的坐标向量；k表示初始检测模块23的第k条支路，k∈[1,4]；γ _k表示第k条支路的损失权重；S ^k表示第k条支路的训练样本集。

可选地，所述区域推荐模块22的每条支路的损失函数为：

表示第n条支路的第i个anchor是前景的概率；

表示Anchor[i]是正样本时,

Anchor[i]是负样本时，

表示第i个真实候选框边界的坐标向量；λ表示权重平衡参数；在本实施例中，可以设置λ＝10，但在实际实验显示，最终的缺陷检测结果对λ变化不敏感，λ取值可以为1～100，对最终的缺陷检测结果的影响在1％以内；

其中，p _i表示第i个候选框为缺陷的概率；

表示第i个候选框对应的二值真实标签；

表示两个类别(目标p _i和非目标

)的对数损失，若i为候选缺陷，则

为1，否则为0；R表示smooth _L1函数。

上述的smooth _L1函数是Faster RCNN提出来的计算距离的损失函数，其中，L1为范数损失函数，也被称为最小绝对值偏差(LAD)，最小绝对值误差(LAE)。

可选地，所述初始检测模块23的每条支路的损失函数为：

其中，

表示第k条支路的第i个真实候选框的缺陷的概率，

为0或1；

表示第i个真实候选框边界的坐标向量；k表示初始检测模块23的第k条支路，k∈[1,4]；λ表示权重平衡参数；p _i表示第i个候选框为缺陷的概率；

表示第i个候选框对应的二值真实标签。

参见图5，图5为本申请实施例提供的利用图像标注工具对数据集对换向器表面进行标注的界面示意图，首先采集多张换向器表面缺陷图像得到换向器表面缺陷数据集；其中，包括换向器生产车间所拍摄的含有划伤、擦伤、裂纹、油污、黑点缺陷等换向器表面的部分照片，分别得到含有划伤缺陷换向器图片6600张、擦伤缺陷换向器图片6800张、裂纹缺陷换向器图片6900张、油污缺陷换向器图片9500张、黑点缺陷换向器图片8400张；

然后，采用数据扩充方法对所述换向器表面缺陷数据集进行扩充，得到扩充后的数据集；例如，可以采用水平翻转、旋转照片集等数据集扩充方法对所述换向器表面缺陷数据集进行数据扩充；

接着，采用数据集标注工具对扩充后的数据集中的图像进行标注；例如，可以采用数据集标注工具(Labelimg)对扩充后的数据集中的图像进行ground truth标注；

再次，将标注后的图像转换为XML格式的文件，该XML格式的文件包含图像的编号以及换向器表面缺陷的中心坐标、图像的宽和图像的高，其中图5中的方框1或2内部标注的是ground Truth；图5的界面最右侧是将标注后的图像转换为XML格式的文件。

参见图6，图6为本申请实施例提供的已经标注好的数据集的界面示意图。

本实施例对第二检测模型检测换向器表面的准确率、召回率、F1值和平均推测时间进行评估。

其中，准确率的表示公示为：

召回率的表示公示为：

F1值的表示公示为：

其中，TP为检测正确的部分；TP+FP为总检测识别结果；TP+FN为总检测样本。

本实施例的检测方法与Faster R-CNN算法在换向器表面缺陷数据集上进行对比实验。在实验中，设定只有检测缺陷区域与真实标注缺陷区域的IOU大于70％时才认为检测成功。进而计算召回率和准确率得到F1值。每个实验重复3次对比试验，取3个F1值的均值作为评价结果，对实验数据进行统计得到表2，表2为本实施例的Proposed Method算法与Faster R-CNN在换向器表面缺陷数据集上的检测结果对比表格。

表2

由表2可知，本实施例中的Proposed Method方法在划伤、擦伤、裂纹、油污、黑点五种缺陷下的精度分别达到84.14％、88.81％、88.35％、92.86％、与92.53％，而从综合结果来看，相较于原Faster R-CNN提高了近14个百分比。由于在本实施例中，首先使用迁移学习将ResNet网络迁移到换向器表面缺陷检测模型中，得到换向器表面缺陷检测网络，该换向器表面缺陷检测相比现有技术的Faster R-CNN的骨干网络ZF或VGG-16都具有更强大的特征表达能力，可以更充分地提取有益信息以检测出缺陷；并且ResNet中可以输出多尺度的特征图，本实施例在此基础上改进的MS-RPN(MultiSale-Region Proposal Network)网络大大地增强了网络整体的尺度变化适应能力，尤其应对一些小尺度缺陷例如小型目标黑点、擦伤等具有更高的检测精度。

由于本实施例中的换向器表面缺陷检测模型中的特征提取网络是由ImageNet大数据集中训练的Resnet迁移而来，在此，为了验证加入迁移学习是否有助于换向器表面缺陷检测识别，本实施例设置了一组对比实际实验，对加入迁移学习的换向器表面缺陷目标检测模型与不加入迁移学习的目标检测模型分别训练，图7为本申请实施例提供的基于ResNet网络构建换向器表面缺陷检测模型进行迁移学习和不进行迁移学习的性能对比示意图，如图7显示，在加入迁移学习方式的换向器表面缺陷检测模型中，在ECOCH相同的情况下，损失函数更小，因此加入迁移学习方式的换向器表面缺陷检测模型网络性能更加优秀。

本实施例选取RPN网络作为比较本实施例中的MS-RPN网络性能的参考。在本实施例中，认定预测区域和GroundTruth的IOU大于0.7时为检测成功，只改变区域提议的数量，其他设置均保持设置不变。区域提议的数量与MS-RPN和RPN的召回率曲线关系如图8所示，两种区域推荐网络的Recall都随着推荐区域的增加而增加，由图8可以发现，在MS-RPN中，本实施例仅适用200的推荐区域就可以达到RPN中使用500推荐区域的召回率，因此本实施例的区域提议数量的减少有助于提高算法检测的效率。

实施例二

如图9所示，本实施例的金属表面缺陷检测装置，包括：

采集模块10，用于采集金属的表面缺陷图像得到金属表面缺陷数据集；

构建模块20，用于利用所述金属表面缺陷数据集构建第一检测模型；

训练模块30，用于利用ImageNet数据集训练Resnet网络；

迁移模块40，用于将训练后的Resnet网络迁移至所述第一检测模型中，得到第二检测模型，其中，所述第二检测模型为基于深度迁移学习的金属表面缺陷的检测模型；

金属表面检测模块50，用于利用所述第二检测模型对金属表面进行检测。

可选地，所述第一检测模型包括迁移网络模块21、区域推荐模块22和初始检测模块23；

所述迁移网络模块21用于执行以下操作：

提取所述训练后的Resnet网络的特征，得到多个特征图；将所述多个特征图进行组合得到特征金字塔；将所述特征金字塔输入所述区域推荐模块22中，得到卷积特征图；

所述区域推荐模块22将所述卷积特征图输入所述初始检测模块23，得到所述第二检测模型。

可选地，所述第一检测模型的网络损失函数为：

L(M,M′)＝L(M)+L(M′)

其中，

表示第n条支路的第i个anchor是前景的概率；

表示第n条支路的第i个anchor的坐标向量；

其中，

表示初始检测模块23的每条支路的损失函数；

表示第k条支路的第i个真实候选框是缺陷的概率，

为0或1；t _i是一个向量，表示预测的第i个候选框坐标；

可选地，所述区域推荐模块22的每条支路的损失函数为：

表示第n条支路的第i个anchor是前景的概率；

表示Anchor[i]是正样本时,

Anchor[i]是负样本时，

其中，p _i表示第i个候选框为缺陷的概率；

表示第i个候选框对应的二值真实标签；

表示两个类别(目标p _i和非目标

)的对数损失，若i为候选缺陷，则

为1，否则为0；R表示smooth _L1函数。

可选地，所述初始检测模块23的每条支路的损失函数为：

其中，

表示第k条支路的第i个真实候选框的缺陷概率，

为0或1；

表示第i个候选框对应的二值真实标签。

本实施例的检测装置和实施例一的检测方法的过程基本一致，在此，不再具体赘述。

本发明的有益效果：

本发明将基于深度学习的目标检测算法Faster R-CNN应用至金属表面缺陷检测识别方法当中，克服了现有技术的检测方法无法适应多变的实际应用环境的问题；

本发明通过对换向器表面缺陷数据集中的图像进行测试，本发明的基于深度学习的目标检测算法相较于Faster R-CNN算法的检测结果提升显著，因此本发明提出的基于深度学习的目标检测算法相比现有技术的Faster R-CNN算法更适合用于金属表面缺陷的检测识别领域。

需要说明的是，在本文中，诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本领域普通技术人员可以意识到，结合本发明实施例中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

在本申请所提供的实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个***，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

一种金属表面缺陷检测方法，其特征在于，该方法包括：

采集金属的表面缺陷图像得到金属表面缺陷数据集；

利用所述金属表面缺陷数据集构建第一检测模型；

利用ImageNet数据集训练Resnet网络；

将训练后的Resnet网络迁移至所述第一检测模型中，得到第二检测模型，其中，所述第二检测模型为基于深度迁移学习的金属表面缺陷的检测模型；

利用所述第二检测模型对金属表面进行检测。
根据权利要求1所述的方法，其特征在于，所述第一检测模型包括迁移网络模块、区域推荐模块和初始检测模块；所述将训练后的Resnet网络迁移至所述第一检测模型中，得到第二检测模型，包括：

所述迁移网络模块提取所述训练后的Resnet网络的特征，得到多个特征图；将所述多个特征图进行组合得到特征金字塔；将所述特征金字塔输入所述区域推荐模块中，得到卷积特征图；

所述区域推荐模块将所述卷积特征图输入所述初始检测模块，得到所述第二检测模型。
根据权利要求1所述的方法，其特征在于，所述第一检测模型的网络损失函数为：

L(M,M′)＝L(M)+L(M′)

其中，L(M)为区域推荐模块的损失函数，L(M')为初始检测模块的损失函数；

其中，
表示区域推荐模块的每条支路的损失函数；n表示第n条支路,n∈[1,4]；η _n表示第n条支路的损失权重；S ⁿ表示第n条支路的训练样本集，
表示第n条支路的第i个anchor是前景的概率；
表示第n条支路的第i个anchor的坐标向量；

其中，
表示初始检测模块的每条支路的损失函数；
表示第k条支路的第i个真实候选框为缺陷的概率，
为0或1；t _i是一个向量，表示预测的第i个候选框坐标；
表示第k条支路的第i个真实候选框边界的坐标向量；k表示初始检测模块的第k条支路，k∈[1,4]；γ _k表示第k条支路的损失权重；S ^k表示第k条支路的训练样本集。
根据权利要求3所述的方法，其特征在于，所述区域推荐模块的每条支路的损失函数为：

其中，L _cls表示分类损失函数；L _reg表示边界框回归损失函数；i表示小批次处理中的第i个候选框索引；
表示第n条支路的第i个anchor是前景的概率；
表示Anchor[i]是正样本时,
Anchor[i]是负样本时，
t _i是一个向量，表示预测的候选框坐标；t _i＝{t _x,t _y,t _w,t _h}是一个向量，表示预测的参数化的候选框坐标；
表示第i个真实候选框边界的坐标向量；λ表示权重平衡参数；

其中，p _i表示第i个候选框为缺陷的概率；
表示第i个候选框对应的二值真实标签；
表示两个类别(目标p _i和非目标
)的对数损失，若i为候选缺陷，则
为1，否则为0；R表示smooth _L1函数。
根据权利要求3所述的方法，其特征在于，所述初始检测模块的每条支路的损失函数为：

其中，
表示第k条支路的第i个真实候选框的缺陷的概率，
为 0或1；
表示第k条支路的第i个的表示真实候选框边界的坐标向量；L _cls表示分类损失函数；L _reg表示边界框回归损失函数；i表示小批次处理中的第i个候选框索引；t _i是一个向量，表示预测的第i个候选框坐标；
表示第i个真实候选框边界的坐标向量；k表示初始检测模块的第k条支路，k∈[1,4]；λ表示权重平衡参数；p _i表示第i个候选框为缺陷的概率；
表示第i个候选框对应的二值真实标签。
一种金属表面缺陷检测装置，其特征在于，包括：

采集模块，用于采集金属的表面缺陷图像得到金属表面缺陷数据集；

构建模块，用于利用所述金属表面缺陷数据集构建第一检测模型；

训练模块，用于利用ImageNet数据集训练Resnet网络；

迁移模块，用于将训练后的Resnet网络迁移至所述第一检测模型中，得到第二检测模型，其中，所述第二检测模型为基于深度迁移学习的金属表面缺陷的检测模型；

金属表面检测模块，用于利用所述第二检测模型对金属表面进行检测。
根据权利要求6所述的装置，其特征在于，所述第一检测模型包括迁移网络模块、区域推荐模块和初始检测模块；

所述迁移网络模块用于执行以下操作：

提取所述训练后的Resnet网络的特征，得到多个特征图；将所述多个特征图进行组合得到特征金字塔；将所述特征金字塔输入所述区域推荐模块中，得到卷积特征图；

所述区域推荐模块将所述卷积特征图输入所述初始检测模块，得到所述第二检测模型。
根据权利要求6所述的装置，其特征在于，所述第一检测模型的网络损失函数为：

L(M,M′)＝L(M)+L(M′)

其中，L(M)为区域推荐模块的损失函数，L(M')为初始检测模块的损失函数；

其中，
表示区域推荐模块的每条支路的损失函数；n表示第n条支路,n∈[1,4]；η _n表示第n条支路的损失权重；S ⁿ表示第n条支路的训练样本集，
表示第n条支路的第i个anchor是前景的概率；
表示第n条支路的第i个anchor的坐标向量；

其中，
表示初始检测模块的每条支路的损失函数；
表示第k条支路的第i个真实候选框是缺陷的概率，
为0或1；t _i是一个向量，表示预测的第i个候选框坐标；
表示第k条支路的第i个真实候选框边界的坐标向量；k表示初始检测模块的第k条支路，k∈[1,4]；γ _k表示第k条支路的损失权重；S ^k表示第k条支路的训练样本集。
根据权利要求7所述的装置，其特征在于，所述区域推荐模块的每条支路的损失函数为：

其中，L _cls表示分类损失函数；L _reg表示边界框回归损失函数；i表示小批次处理中的第i个候选框索引；
表示第n条支路的第i个anchor是前景的概率；
表示Anchor[i]是正样本时,
Anchor[i]是负样本时，
t _i是一个向量，表示预测的候选框坐标；t _i＝{t _x,t _y,t _w,t _h}是一个向量，表示预测的参数化的候选框坐标；
表示第i个真实候选框边界的坐标向量；λ表示权重平衡参数；

其中，p _i表示第i个候选框为缺陷的概率；
表示第i个候选框对应的二值真实标签；
表示两个类别(目标p _i和非目标
)的对数损失，若i为候选缺陷，则
为1，否则为0；R表示smooth _L1函数。
根据权利要求7所述的装置，其特征在于，所述初始检测模块的每条支路的损失函数为：

其中，
表示第k条支路的第i个真实候选框的缺陷概率，
为0或1；
表示第k条支路的第i个的真实候选框边界的坐标向量；L _cls表示分类损失函数；L _reg表示边界框回归损失函数；i表示小批次处理中的第i个候选框索引；t _i是一个向量，表示预测的第i个候选框坐标；
表示第i个真实候选框边界的坐标向量；k表示初始检测模块的第k条支路，k∈[1,4]；λ表示权重平衡参数；p _i表示第i个候选框为缺陷的概率；
表示第i个候选框对应的二值真实标签。