CN113569737A

CN113569737A - 基于自主学习网络模型笔记本屏幕缺陷检测方法及介质

Info

Publication number: CN113569737A
Application number: CN202110859010.0A
Authority: CN
Inventors: 许镇义; 康宇; 曹洋; 王伟
Original assignee: Institute of Artificial Intelligence of Hefei Comprehensive National Science Center
Current assignee: Institute of Artificial Intelligence of Hefei Comprehensive National Science Center
Priority date: 2021-07-28
Filing date: 2021-07-28
Publication date: 2021-10-29

Abstract

本发明的一种基于自主学习网络模型笔记本屏幕缺陷检测方法及介质，包括构建笔记本屏幕检测模型，获取笔记本生产线下的高清摄像头视频进行预处理后输入笔记本屏幕检测模型，对笔记本屏幕生产线高清摄像头的待检测视频进行检测，并得出检测结果；本发明的基于自主学习网络模型笔记本屏幕缺陷检测方法，即基于自主学习的笔记本屏幕的缺陷检测和分类方法，可降低传统的笔记本生产线时间、资金成本，同时引入智能化检测和分类，对产业转型升级，提升产品质量，增强竞争力具有重大意义。

Description

基于自主学习网络模型笔记本屏幕缺陷检测方法及介质

技术领域

本发明涉及智能制造缺陷检测技术领域，具体涉及一种基于自主学习网络模型笔记本屏幕缺陷检测方法。

背景技术

传统外观缺陷检测方法采用人工检测，具有耗时、人力成本高、误检率高等缺陷，之后工业引入ASI(自动化表面缺陷检测)***，但大多基于传统的机器视觉技术包括：

1)基于传统数字图像处理加机器学习的方法。此类方法首先基于人类经验，人工制造特征(特征工程)，之后利用机器学习方法(如支持向量机、模板匹配)训练样本，进而判断笔记本外观是否存在缺陷。

2)基于深度学习的笔外观缺陷检测方法。相较于传统机器学习方法，深度学习一般不需要各种人工设计图像预处理技术，适应和推广性更强，而且在大样本训练下可以得到更准确的外观缺陷检测结果，近些年得到了广泛的应用。

在上述两种方法中，前者算法复杂度低，可轻松移植在普通嵌入式设备中，但精度不高，存在误检、漏检等情况，且适应场景较为单一，迁移性差；后者适应性广，精度高，虽避免了复杂的传统特征工程，但算法复杂度高，需要大量的训练样本，实际应用中很可能没有或较少可用于训练的样本，同时若选择人工标注数据也需要大量时间和资金成本,实现难度大。

发明内容

本发明提出的一种基于自主学习网络模型笔记本屏幕缺陷检测方法及介质，用于克服传统机器学习在检测精度不高，场景适应性单一、迁移性差以及近年基于深度学习缺陷检测需要大量样本数据等情况，即本发明是一种适用于复杂场景、少样本情形下具有自主学习策略的笔记本表面缺陷检测和分类算法。

为实现上述目的，本发明采用了以下技术方案：

一种基于自主学习网络模型笔记本屏幕缺陷检测方法，包括以下步骤：获取笔记本生产线下的高清摄像头视频进行预处理后输入笔记本屏幕检测模型，对笔记本屏幕生产线高清摄像头的待检测视频进行检测，并得出检测结果；

其中，笔记本屏幕检测模型的构建步骤如下：

步骤1：针对事先获取的笔记本生产线下的高清摄像头视频，对包含检测目标的视频进行关键帧提取，获取原始样本图片并进行预处理获得一定数量的原始数据集图片；再对原始数据集图片中包含指定生产缺陷的像素区域进行人工标定，获取生产缺陷的坐标信息作为后续训练模型的输入；

步骤2：建立缺陷检测网络模型，使用k-means聚类方法，获取数据集中包含缺陷图片的先验框位置，采用交叉熵损失函数，对构建的深度网络模型训练，调整网络模型参数，得到目标检测模型；

步骤3：获取生产线高清摄像头的待检测视频，送入预训练好的目标检测模型，直接输出检测结果，对网络模型难以分辨的视频帧，按预测缺陷目标概率大小排序，之后由人对其校验，作为训练样本集，之后模型再反向调整模型参数，如此达到设定次数后，得到稳定的网络模型。

进一步的，所述步骤1包括以下步骤：

S11：采集笔记本外观生产线高清摄像头下的检测视频，然后提取包含外观缺陷的视频关键帧原始样本，对原始样本使用“中心式归一化”(mean normalization)图像预处理，构建训练样本集；

S12：对数据集图片中包含外观缺陷的像素区域用矩形框进行标注，其中，一张数据集图片中包含多个矩形框，即多处外观缺陷，但每个矩形框仅包含一个待检测的目标，标注后的标签结果按照VOC数据集格式保存在xml文件中；其中，每张图片对应一个同名的xml文件，包含该数据集图片中每个矩形框的中心点坐标信息(x,y)，矩形框的宽w和矩形框的高h；此处对每个batch图片中的标签，即(x,y,w,h)进行了尺寸的归一化，即在原图坐标系下根据原图纵横比不变映射为256*256坐标下的一个子区域，并将变换后的坐标信息存储在xml文件中，作为后续训练模型的输入。

进一步的，所述步骤2中的缺陷检测网络模型包括输入层，GoogLeNet主体骨干网络，AL决策层和输出层，此外由于外观缺陷多为点状或线性结构，因此移除了GoogLeNet中的两个softmax层，加速网络训练；

GoogLeNet主体骨干网络是一个22层的深度网络，网络具有三组Inception模块，三组Inception模块被池化层分隔；

其中Inception模块为用密集成分来近似最优的局部稀疏结构，该结构将常用的卷积核(1*1，3*3，5*5)、池化操作堆叠在一起，不仅增加了网络深度，而且增加了网络对尺度的适应性；

输入图像进尺寸归一化后为224*224*3输入第一层，之后经64个步长2的7*7*3的卷积核输出112*112*64数据，再输入ReLU激活，然后通过最大池化操作降低网络参数，作为Inception模块的输入。

进一步的，所述步骤2的训练步骤如下：

S21:对骨干网络GoogLeNet使用公开数据集预训练，得到原始参数；

S22：对于数据及图片中标注的矩形框，聚类获得anchorbox，此处，先将所有训练图片的矩形框的坐标信息提取出来，而后由两个坐标信息得到矩形框的宽高信息，采用k-means聚类的方法，处理所有训练数据bounding boxes的宽高数据，处理过程如下：

先初始化k个anchor box，通过在所有的矩形框bounding boxes中随机选取k个值作为k个anchor boxes的初始值；

而后，计算每个bounding box与每个anchor box的IoU值，产生k个宽、高组合的anchor boxes，这里IoU为“预测的边框”和“真实的边框”的交集和并集的比值；

然后，计算每个标注框和每个聚类中心点的距离d＝1-IoU(标注框,聚类中心)，计算时每个标注框的中心点都与聚类中心重合，这样才能计算IOU值，即

d＝1-IoU[(x_j,y_j,w_j,h_j),(x_j,y_j,W_j,H_j)]

j∈{1,2,…,N},i∈{1,2,…,k}

将标注框分配给“距离”最近的聚类中心；

所有标注框分配完毕以后，对每个簇重新计算聚类中心点，更新anchorbox的宽高值；

计算方式为

N_i是第i个簇的标注框个数，求得该簇中所有标注框的宽和高的平均值；

重复以上的步骤，到聚类中心改变量达设定值，得到由外观缺陷数据集的boundingbox聚类获得的anchorbox；

S23、将训练集输入得到初始参数的骨干网络GoogLeNet中，提取相应的特征图；

S24、利用S22中聚类得到的anchorbox，对外观缺陷特征图进行预测，得到图中预测的外观缺陷区域预测框的中心坐标((b_x,b_y)、预测框的宽高、含有外观缺陷的概率和对象条件类别概率；

S25、经过规定的次数和调整学习率参数，训练后，得到满足要求的分类结果的笔记本外观缺陷检测模型。

进一步的，对于步骤S3：将框定的疑似包含外观缺陷输入到已经训练好的目标检测模型中，进行检测，判断疑似区域中是否存在，对可以预测的检测结果直接输出，对网络模型难以分辨的视频帧，按预测缺陷目标概率大小排序，之后由人对其校验，作为训练样本集，之后输入模型再反向调整模型参数。

另一方面，本发明还公开一种基于自主学习网络模型笔记本屏幕缺陷检测装置，包括以下单元，

数据获取单元，用于获取笔记本生产线下的高清摄像头视频；

数据处理单元，用于对于获取到的高清摄像头视频进行预处理；

检测单元，用于把处理后的视频数据输入笔记本屏幕检测模型，对笔记本屏幕生产线高清摄像头的待检测视频进行检测，并得出检测结果；

屏幕检测模型的构建单元，其中构建步骤如下：

第三方面，本发明还公开一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行如上述方法的步骤。

由上述技术方案可知，本发明的基于自主学习网络模型笔记本屏幕缺陷检测方法，即基于自主学习的笔记本屏幕的缺陷检测和分类方法，可降低传统的笔记本生产线时间、资金成本，同时引入智能化检测和分类，对产业转型升级，提升产品质量，增强竞争力具有重大意义。

需要说明的是：本发明中所需的人工标注训练样本集是少量的，第一次训练的网络模型仅是能较好检测输入视频帧的目标网络模型，其目的是减少人工标注样本花费的时间与精力，之后在实际生产实践中二次会加入人工因素，半自动化的产生新训练样本，用于重新调整网络模型参数，优化模型参数。

具体的说，本发明的优点如下：

(1)减少人工标注笔记本屏幕缺陷样本花费的时间与精力；

(2)在少样本网络模型训练具有良好的表现，较高成功率检测出笔记本屏幕生产过程中产生的缺陷，降低传统人工检测的误检率、人力成本以及提高笔记本屏幕生产线效率。

附图说明

图1是本发明的方法原理图；

图2是本发明的网络结构框图；

图3是本发明的inception模块的基本结构；

图4是本发明实施例的测试结果参考图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。

如图1所示，本实施例所述的基于自主学习网络模型笔记本屏幕缺陷检测方法，包括：

步骤1：获取笔记本生产线下的高清摄像头视频，对包含检测目标的视频进行关键帧提取，获取原始样本图片；而后，对原始样本图片使用图片增强等预处理手段，获得合适数量的原始数据集图片；最后，对原始数据集图片中包含生产缺陷(划痕、凹陷等)的像素区域进行人工标定，获取生产缺陷的坐标信息作为后续训练模型的输入。

步骤2：建立缺陷检测网络模型，使用k-means聚类方法，获取数据集中包含缺陷图片的先验框位置，采用交叉熵损失函数，对构建的深度网络模型训练，调整网络模型参数，得到一个可以较好预测结果的模型。

步骤3：对生产线高清摄像头的待检测视频，送入预训练好的目标检测模型，对可以预测的检测结果直接输出，对网络模型难以分辨的视频帧，按预测缺陷目标概率大小排序，之后由人对其校验，作为训练样本集，之后模型再反向调整模型参数，如此多次后，得到稳定的网络模型。

进一步地，在步骤1中具体步骤细分为：

S11：采集笔记本外观生产线高清摄像头下的检测视频，然后提取提取包含外观缺陷的视频关键帧原始样本，对原始样本使用“中心式归一化”(mean normalization)图像预处理，构建训练样本集。

S12：对数据集图片中包含外观缺陷的像素区域用矩形框进行标注，其中，一张数据集图片中可以包含多个矩形框，即多处外观缺陷，但每个矩形框仅包含一个待检测的目标，标注后的标签结果按照VOC数据集格式保存在xml文件中；其中，每张图片对应一个同名的xml文件，包含该数据集图片中每个矩形框的中心点坐标信息(x,y)，矩形框的宽w和矩形框的高h。需要注意的是，此处对每个batch图片中的标签，即(x,y,w,h)进行了尺寸的归一化，即在原图坐标系下根据原图纵横比不变映射为256*256坐标下的一个子区域，并将变换后的坐标信息存储在xml文件中，作为后续训练模型的输入。

对上述步骤S2中构建的目标监测模型结构，参照图2，包括输入层，GoogLeNet主体骨干网络，AL决策层和输出层，此外由于外观缺陷多为点状或线性结构，因此移除了GoogLeNet中的两个softmax层，加速网络训练。

如图2和图3所示，本发明实施例的GoogLeNet主体骨干网络是一个22层的深度网络，网络具有3组Inception模块分别为：

inception(3a)/inception(3b),inception(4a)/inception(4b)/inception(4c)/inception(4d)/inception(4e),inception(5a)/inception(5b)。三组Inception模块被池化层分隔。其中Inception结构的主要思路就是用密集成分来近似最优的局部稀疏结构，该结构将常用的卷积核(1*1，3*3，5*5)、池化操作堆叠在一起，不仅增加了网络深度，而且增加了网络对尺度的适应性。输入图像进尺寸归一化后为224*224*3输入第一层，之后经64个步长2的7*7*3的卷积核输出112*112*64数据，再输入ReLU激活，然后通过最大池化操作降低网络参数，作为Inception模块的输入。其中以Inception3a为例，输入数据经过①64个1*1的卷积核卷积操作，之后由ReLU激活，输出28*28*64；②96个1*1的卷积核卷积，然后3*3的卷积核降维，再进行128个3*3的卷积核卷积操作，输出28*28*128；③16个1*1的卷积核卷积操作，再由5*5的卷积核降维，输出28*28*16，然后经过ReLU激活，再进行32个5*5的卷积，输出28*28*32；④池化层池化操作，通过3*3的卷积核，输出28*28*192，然后使用32个1*1的卷积核，输出28*28*32，最后将四个结果连接，并且对这四部分的输出结果第三维并联，即：64+128+32+32＝256，确定最终输出28*28*256。

经过S1图像预处理的图片作为原始数据输入到GoogLeNet网络模型，用于提取图片特征，并做检测分类。值得提出的是由于GoogLeNet引入Inception层，用容易获得的密集组件进行覆盖近似卷积视觉网络的最优稀疏结构，从而以卷积快为基础，找到最优的局部构造。目前Inception层多为卷积核尺寸1*1，3*3，5*5的组合，其滤波器的组连接成单个输出向量作为下一阶段的输入。同时在计算增加太多的地方，使用1*1卷积核，可以有效达到降维效果。此外由于外观缺陷多为点状或线性结构，因此移除了GoogLeNet中的两个softmax层，用以加速网络训练，并且在最后输出引入了一个AL决策层(将分类器检测结果按概率大小分类输出，用于人工决策)，将分类器无法检测的图像，人工决策后作为训练样本。

在步骤S2中，我们构建目标网络模型并进行训练主要包括以下步骤：

S21:对骨干网络GoogLeNet使用公开数据集预训练，得到原始参数。

S22：对于数据及图片中标注的矩形框，聚类获得anchorbox.此处，我们先将所有训练图片的矩形框的坐标信息提取出来，，而后由两个坐标信息得到矩形框的宽高信息，采用k-means聚类的方法，处理所有训练数据bounding boxes的宽高数据。处理过程如下：

然后，计算每个标注框和每个聚类中心点的距离d＝1-IoU(标注框,聚类中心)，其中，标注框为人工标注数据集时圈出的包含检测结果的框；聚类中心为使用聚类算法计算机产生的随机框的中心点；

计算时每个标注框的中心点都与聚类中心重合，这样才能计算IOU值，即

d＝1-IoU[(x_j,y_j,w_j,h_j),(x_j,y_j,W_j,Hj)]

j∈{1,2,…,N},i∈{1,2,…,k}

将标注框分配给“距离”最近的聚类中心；

所有标注框分配完毕以后，对每个簇重新计算聚类中心点，更新anchorbox的宽高值。计算方式为

重复以上的步骤，到聚类中心改变量很小，得到由外观缺陷数据集的boundingbox聚类获得的anchorbox。

S23、将训练集输入得到初始参数的骨干网络GoogLeNet中，提取相应的特征图。

S24、利用S22中聚类得到的anchorbox，对外观缺陷特征图进行预测，得到图中预测的外观缺陷区域预测框的中心坐标((b_x,b_y)、预测框的宽高、含有外观缺陷的概率和对象条件类别概率。

S25、经过多次调整学习率等参数，训练后，得到较好分类结果的笔记本外观缺陷检测模型。此外为防止过拟合，提出通过预估计训练过程标签丢弃的边缘化效应对分类器进行正则化的机制。对每个训练样本x,模型预测标签k∈{1…K}的可能性：

其中Zi是未归一化的逻辑上的概率值，考虑到实际采用q(k|x)，而非p(k|x),其交叉熵损失函数定义为：

最小化损失函数等价于最大似然函数，其中Z_k可微：

但是上述方法用预测概率来拟合真是概率，可能会出现两个问题：(1)：模型过拟合(2)：会鼓励预测值远大于其标签值，且结合梯度有界性，会削弱模型泛型，因此提出一种机制鼓励模型减少预测，称为标签平滑。我们假设一个标签分布u(k)，对于一个训练样本x引入平滑参数，计算q(k|x)代替实际样本x,公式如下：

q′(k|x)＝(1-θ)δ_k,y+θu(k)

对于步骤S3：将框定的疑似包含外观缺陷输入到已经训练好的目标检测模型中，进行检测，判断疑似区域中是否存在，对可以预测的检测结果直接输出，对网络模型难以分辨的视频帧，按预测缺陷目标概率大小排序，之后由人对其校验，作为训练样本集，之后输入模型再反向调整模型参数。

图4是本发明实施例的检测结果参考图，可知本发明的基于自主学习网络模型笔记本屏幕缺陷检测方法可减少人工标注笔记本屏幕缺陷样本花费的时间与精力，在少样本网络模型训练具有良好的表现，较高成功率检测出笔记本屏幕生产过程中产生的缺陷，降低传统人工检测的误检率、人力成本以及提高笔记本屏幕生产线效率。

屏幕检测模型的构建单元，其中构建步骤如下：

可理解的是，本发明实施例提供的***与本发明实施例提供的方法相对应，相关内容的解释、举例和有益效果可以参考上述方法中的相应部分。

本领域内的技术人员应明白，本申请的实施例可提供为方法、***、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种基于自主学习网络模型笔记本屏幕缺陷检测方法，其特征在于：包括构建笔记本屏幕检测模型，获取笔记本生产线下的高清摄像头视频进行预处理后输入笔记本屏幕检测模型，对笔记本屏幕生产线高清摄像头的待检测视频进行检测，并得出检测结果；

其中，笔记本屏幕检测模型的构建步骤如下：

2.根据权利要求1所述的基于自主学习网络模型笔记本屏幕缺陷检测方法，其特征在于：所述步骤1包括以下步骤：

3.根据权利要求2所述的基于自主学习网络模型笔记本屏幕缺陷检测方法，其特征在于：所述步骤2中的缺陷检测网络模型包括输入层，GoogLeNet主体骨干网络，AL决策层和输出层，此外由于外观缺陷多为点状或线性结构，因此移除了GoogLeNet中的两个softmax层，加速网络训练；

4.根据权利要求3所述的基于自主学习网络模型笔记本屏幕缺陷检测方法，其特征在于：

Inception模块的卷积算法如下：

输入数据经过①64个1*1的卷积核卷积操作，之后由ReLU激活，输出28*28*64；②96个1*1的卷积核卷积，然后3*3的卷积核降维，再进行128个3*3的卷积核卷积操作，输出28*28*128；③16个1*1的卷积核卷积操作，再由5*5的卷积核降维，输出28*28*16，然后经过ReLU激活，再进行32个5*5的卷积，输出28*28*32；④池化层池化操作，通过3*3的卷积核，输出28*28*192，然后使用32个1*1的卷积核，输出28*28*32，最后将四个结果连接，并且对这四部分的输出结果第三维并联，即：64+128+32+32＝256，确定最终输出28*28*256。

5.根据权利要求4所述的基于自主学习网络模型笔记本屏幕缺陷检测方法，其特征在于：所述步骤2的训练步骤如下：

而后，计算每个bounding box与每个anchor box的IoU值，产生k个宽、高组合的anchorboxes，这里IoU为“预测的边框”和“真实的边框”的交集和并集的比值；

d＝1-IoU[(x_j，y_j，w_j，h_j)，(x_j，y_j，W_j，H_j)]

j∈{1,2,...,N},i∈{1,2,...,k}

将标注框分配给“距离”最近的聚类中心；

计算方式为

6.根据权利要求5所述的基于自主学习网络模型笔记本屏幕缺陷检测方法，其特征在于：所述步骤2还包括通过预估计训练过程标签丢弃的边缘化效应对分类器进行正则化，具体包括：

设每个训练样本x,模型预测标签k∈{1…K}的可能性：

最小化损失函数等价于最大似然函数，其中Z_k可微：

7.根据权利要求6所述的基于自主学***滑参数θ，计算q(k|x)代替实际样本x,公式如下：

q′(k|x)＝(1-θ)δ_k，y+θu(k)。

8.根据权利要求7所述的基于自主学习网络模型笔记本屏幕缺陷检测方法，其特征在于：对于步骤S3：将框定的疑似包含外观缺陷输入到已经训练好的目标检测模型中，进行检测，判断疑似区域中是否存在，对可以预测的检测结果直接输出，对网络模型难以分辨的视频帧，按预测缺陷目标概率大小排序，之后由人对其校验，作为训练样本集，之后输入模型再反向调整模型参数。

9.一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行如权利要求1至8中任一项所述方法的步骤。