CN113610787A - 图像缺陷检测模型的训练方法、装置、计算机设备 - Google Patents

图像缺陷检测模型的训练方法、装置、计算机设备 Download PDF

Info

Publication number
CN113610787A
CN113610787A CN202110852005.7A CN202110852005A CN113610787A CN 113610787 A CN113610787 A CN 113610787A CN 202110852005 A CN202110852005 A CN 202110852005A CN 113610787 A CN113610787 A CN 113610787A
Authority
CN
China
Prior art keywords
training
image
class
current
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110852005.7A
Other languages
English (en)
Inventor
林珠
赵晓萌
方少亮
周俊杰
陈树敏
杜宝林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Science & Technology Infrastructure Center
Original Assignee
Guangdong Science & Technology Infrastructure Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Science & Technology Infrastructure Center filed Critical Guangdong Science & Technology Infrastructure Center
Priority to CN202110852005.7A priority Critical patent/CN113610787A/zh
Publication of CN113610787A publication Critical patent/CN113610787A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0004Industrial image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30108Industrial image inspection
    • G06T2207/30148Semiconductor; IC; Wafer

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Quality & Reliability (AREA)
  • Image Analysis (AREA)

Abstract

本申请涉及一种图像缺陷检测模型的训练方法、装置、计算机设备和存储介质。该方法包括:通过训练好的特征增强模型中的第一生成器可以生成属于目标域的多个无标签的生成图像。这样,能够获得特征大大增强的生成图像,再对该生成图像进行聚类处理,得到各生成图像分别对应的类别;构建各个类别对抗模型,并基于同一类别的生成图像得到训练完成的各个类别对抗模型;将获取随机变量数据、该噪声数据,叠加输入至各个类别对抗模型中的第二生成器,大大生成了各类别的类别特征图像,极大的缓解了样本量不足的情况,能够避免过拟合的情况,再基于各类别特征图像得到泛化能力提高的训练好的缺陷检测模型,进而大大提高微米级缺陷检测的准确率和召回率。

Description

图像缺陷检测模型的训练方法、装置、计算机设备
技术领域
本申请涉及图像检测技术领域,特别是涉及一种图像缺陷检测模型的训练方法、装置、计算机设备和存储介质。
背景技术
随着图像检测技术的发展,在对新能源、半导体、面板显示以及电路板等领域的产品表面进行缺陷检测时,可以通过图像处理算法提取产品图像的特征,并根据特征信息识别图像缺陷。
然而,在对图像进行微米级的图像检测时,存在微米级缺陷的样本数量少且不均衡,使得训练形成的缺陷检测模型出现过拟合情况,从而大大降低了微米级缺陷检测的准确率。
发明内容
基于此,有必要针对上述技术问题,提供一种图像缺陷检测模型的训练方法、装置、计算机设备和存储介质。
一种图像缺陷检测模型的训练方法,所述方法包括:
获取训练好的特征增强模型中的第一生成器;其中,该特征增强模型基于源域样本图像和噪声数据进行预训练后,再基于目标域样本图像和噪声数据进行再训练得到;将该噪声数据输入至该第一生成器,得到多个无标签的生成图像;对该生成图像进行聚类处理,得到各生成图像分别对应的类别;分别构建与每个类别分别对应的类别对抗模型,并基于同一类别的生成图像对与相应类别的类别对抗模型进行训练,得到训练完成的与各个类别分别对应的类别对抗模型;获取随机变量数据,并将该噪声数据与该随机变量数据,叠加输入至训练完成的每个类别对抗模型中的第二生成器,得到与各个类别分别对应的类别特征图像;构建缺陷检测模型,并基于多个类别特征图像对该缺陷检测模型进行训练,得到训练好的缺陷检测模型,该训练好的缺陷检测模型用于对目标域的待检测图像进行缺陷检测。
在其中一个实施例中,该特征增强模型包括第一生成器和第一判别器,该特征增强模型的预训练步骤包括:
获取源域样本图像和噪声数据;对当次的源域样本图像进行特征提取,得到当次的源域特征图;基于该噪声数据和前次训练迭代得到的源域样本隐特征,并通过该第一生成器生成当次的源域训练生成图像;将当次的源域特征图和当次的源域训练生成图像输入至第一判别器中,得到第一判别结果和当次的源域样本隐特征;基于该第一判别结果对该特征增强模型的模型参数进行调整,进入下一次的循环迭代,并将当次的源域样本隐特征作为下一次训练迭代所对应的前次训练迭代得到的源域样本隐特征,返回该对当次的源域样本图像进行特征提取,得到当次的源域特征图的步骤继续执行,直至达到第一训练停止条件时停止,得到预训练好的特征增强模型。
在其中一个实施例中,该特征增强模型的再训练步骤包括:
获取目标域样本图像和噪声数据;对当次的目标域样本图像进行特征提取,得到当次的目标域特征图;基于该噪声数据和前次训练迭代得到的目标域样本隐特征,并通过预训练得到的第一生成器生成当次的目标域训练生成图像;将当次的目标域特征图和当次的目标域训练生成图像输入至预训练得到的第一判别器中,得到第二判别结果和当次的目标域样本隐特征;基于该第二判别结果对预训练得到的特征增强模型的模型参数进行调整,进入下一次的循环迭代,并将当次的目标域样本隐特征作为下一次训练迭代所对应的前次训练迭代得到的目标域样本隐特征,返回该对当次的目标域样本图像进行特征提取,得到当次的目标域特征图的步骤继续执行,直至达到第二训练停止条件时停止,得到训练好的特征增强模型。
在其中一个实施例中,该对当次的目标域样本图像进行特征提取,得到当次的目标域特征图,包括:
对当次的目标域样本图像中的目标区域进行提取,得到目标区域图像;对该目标区域图像进行特征提取,获得当次的目标域特征图。
在其中一个实施例中,该类别对抗模型包括第二生成器和第二判别器,该基于同一类别的生成图像对与相应类别的类别对抗模型进行训练,得到训练完成的与各个类别分别对应的类别对抗模型,包括:
获取同一类别的生成图像,并对当次的生成图像进行特征提取,得到当次的特征提取图;获取场景样本噪声数据和随机变量数据,基于该场景噪声数据、随机变量数据和前次训练迭代得到的半监督样本,通过该第二生成器生成当次的训练类别特征图像;将该当次的特征提取图和该当次的训练类别特征图像输入至第二判别器中,得到第三判别结果和当次的半监督样本;基于该第三判别结果对该类别对抗模型的模型参数进行调整,进入下一循环迭代,并将当次的半监督样本作为下一次训练迭代所对应的前次训练迭代得到的半监督样本,返回该对当次的生成图像进行特征提取,得到当次的特征提取图的步骤继续执行,直至达到第三训练停止条件时停止,得到训练完成的与相应类别对应的类别对抗模型。
在其中一个实施例中,该获取场景样本噪声数据,包括:
对多个特征生成图像进行场景预判,确定与每个该特征生成图像分别对应的目标场景;获取与该目标场景对应的场景样本噪声数据。
在其中一个实施例中,该将该当次的特征提取图和该当次的训练类别特征图像输入至第二判别器中,得到第三判别结果和当次的半监督样本,包括:
将该当次的特征提取图和该当次的训练类别特征图像输入至第二判别器中,获得第三判别结果和中间半监督样本;当该中间半监督样本满足预设阈值范围时,将该中间半监督样本作为当次的半监督样本。
一种图像缺陷检测模型的训练装置,所述装置包括:
获取模块,用于获取训练好的特征增强模型中的第一生成器;其中,该特征增强模型基于源域样本图像和噪声数据进行预训练后,再基于目标域样本图像和噪声数据进行再训练得到;
第一生成模块,用于将该噪声数据输入至该第一生成器,得到多个无标签的生成图像;
聚类模块,用于对该生成图像进行聚类处理,得到各生成图像分别对应的类别;
第一训练模块,用于分别构建与每个类别分别对应的类别对抗模型,并基于同一类别的生成图像对与相应类别的类别对抗模型进行训练,得到训练完成的与各个类别分别对应的类别对抗模型;
第二生成模块,用于获取随机变量数据,并将该噪声数据与该随机变量数据,叠加输入至训练完成的每个类别对抗模型中的第二生成器,得到与各个类别分别对应的类别特征图像;
第二训练模块,用于构建缺陷检测模型,并基于多个类别特征图像对该缺陷检测模型进行训练,得到训练好的缺陷检测模型,该训练好的缺陷检测模型用于对目标域的待检测图像进行缺陷检测。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如上述任一该的图像缺陷检测模型的训练方法。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一该的图像缺陷检测模型的训练方法。
上述图像缺陷检测模型的训练方法、装置、计算机设备和存储介质,通过训练好的特征增强模型中的第一生成器可以生成属于目标域的多个无标签的生成图像,其中,该特征增强模型基于源域样本图像和噪声数据进行预训练后,再基于目标域样本图像和噪声数据进行再训练得到。这样,能够获得特征大大增强的生成图像,再对该生成图像进行聚类处理,得到各生成图像分别对应的类别;分别构建与每个类别分别对应的类别对抗模型,并基于同一类别的生成图像对与相应类别的类别对抗模型进行训练,得到训练完成的与各个类别分别对应的类别对抗模型;获取随机变量数据,并将该噪声数据与该随机变量数据,叠加输入至训练完成的每个类别对抗模型中的第二生成器,得到与各个类别分别对应的类别特征图像,这样,能够进一步增加用于缺陷检测的不同类别的图像,极大的缓解了样本量不足的情况,从而能够避免过拟合的情况,再构建缺陷检测模型,并基于多个类别特征图像对该缺陷检测模型进行训练,得到训练好的缺陷检测模型,这样能够提高缺陷检测模型的泛化能力,因此,基于该训练好的缺陷检测模型对目标域的待检测图像进行缺陷检测,能够大大提高微米级缺陷检测的准确率和召回率。
附图说明
图1为一个实施例中图像缺陷检测模型的训练方法的应用环境图;
图2为一个实施例中图像缺陷检测模型的训练方法的流程示意图;
图3为一个实施例中特征增强模型的预训练步骤的流程示意图;
图4为一个实施例中特征增强模型的再训练步骤的流程示意图;
图5为一个实施例中特征增强模型的生成步骤的流程示意图;
图6为一个实施例中得到训练完成的各类别对抗模型步骤的流程示意图;
图7为一个实施例中每个类别对应类别对抗模型的生成过程步骤的流程示意图;
图8为另一个实施例中图像缺陷检测模型的训练方法的流程示意图;
图9为一个实施例中图像缺陷检测模型的训练装置的结构框图;
图10为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的图像缺陷检测模型的训练方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。终端102和服务器104可单独用于执行该图像缺陷检测模型的训练方法,也可协同用于执行图像缺陷检测模型的训练方法。以服务器单独执行该图像缺陷检测模型的训练方法为例,服务器104获取训练好的特征增强模型中的第一生成器;其中,该特征增强模型基于源域样本图像和噪声数据进行预训练后,服务器104再基于目标域样本图像和噪声数据进行再训练得到;服务器104将该噪声数据输入至该第一生成器,得到多个无标签的生成图像;服务器104对该生成图像进行聚类处理,得到各生成图像分别对应的类别;服务器104分别构建与每个类别分别对应的类别对抗模型,并基于同一类别的生成图像对与相应类别的类别对抗模型进行训练,得到训练完成的与各个类别分别对应的类别对抗模型;服务器104获取随机变量数据,并将该噪声数据与该随机变量数据,叠加输入至训练完成的每个类别对抗模型中的第二生成器,得到与各个类别分别对应的类别特征图像;服务器104构建缺陷检测模型,并基于多个类别特征图像对该缺陷检测模型进行训练,得到训练好的缺陷检测模型,该训练好的缺陷检测模型用于对目标域的待检测图像进行缺陷检测。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种图像缺陷检测模型的训练方法,以该方法应用于计算机设备为例进行说明,该计算机设备具体可以是图1中的终端或服务器,其中,该图像缺陷检测模型的训练包括以下步骤:
步骤S202,获取训练好的特征增强模型中的第一生成器;其中,该特征增强模型基于源域样本图像和噪声数据进行预训练后,再基于目标域样本图像和噪声数据进行再训练得到。
其中,源域中为已经学习到的知识,目标域为要学习的新知识。该噪声数据为携带有多个任务标签的噪声数据,例如该噪声数据携带有蚀刻不尽、残铜、针扎、线上小毛刺、线幼、线上小缺口等任务标签的数据。
具体地,计算机设备基于生成对抗网络构建特征增强模型,并对该特征增强模型进行预训练和再训练,获取训练好的特征增强模型,并基于该训练好的特征增强模型,获取训练好的特征增强模型中的第一生成器。其中,该特征增强模型包括有第一生成器和第一判别器,该第一生成器是基于源域样本图像和噪声数据进行预训练后,再基于目标域样本图像和噪声图像进行再训练得到,其中,该第一生成器可以为深度卷积网络,能够提升对抗网络生成高分辨率图片的细节。
例如,计算机设备基于对抗式训练模型构建第一生成器和第一判别器,基于该第一生成器和该第一判别器构建特征增强模型,并基于显示面板的源域数据、电路板的目标域数据,对特征增强模型进行训练,获得训练好的特征增强模型,并基于该训练好的特征增强模型,获取训练好的特征增强模型中的第一生成器,其中,该特征增强模型包括有第一生成器和第一判别器,该第一生成器是基于源域样本图像和噪声数据进行预训练后,再基于目标域样本图像和噪声图像进行再训练得到。
步骤S204,将该噪声数据输入至该第一生成器,得到多个无标签的生成图像。
具体地,计算机设备获取该训练好的特征增强模型中的第一生成器,并将该噪声数据输入至该第一生成器中,进行特征生成,得到多个无标签的生成图像。例如,计算机设备获取该训练好的特征增强模型中的第一生成器,该第一生成器可以是基于深度卷积网络构成,携带有针扎、线上小毛刺、线幼、等任务标签的噪声数据通过该深度卷积网络,进行特征生成,得到多个无标签的生成图像。
步骤S206,对该生成图像进行聚类处理,得到各生成图像分别对应的类别。
其中,聚类处理为学习数据的特征表示,并基于特征表示进行数据的聚类的过程,即依照某种评价准则根据数据中各个对象的相似程度分成多个类,属于同个聚类中的对象相关性高,彼此相似,不同聚类之间的对象相关性低,彼此相异。可以采用SOM(SelfOrganizing Maps,自组织映射神经网络)算法、K-means聚类算法、ROCK算法等等实现聚类。
具体地,计算机设备获取多个无标签的生成图像,并对该多个无标签的生成图像进行聚类处理,将具有相同特征的图像作为一个类别,得到各个生成图像分别对应的类别。例如,计算机设备获取多个无标签的生成图像,采用SOM(Self Organizing Maps,自组织映射神经网络)的聚类算法进行聚类处理,将多个无标签的生成图像输入至SOM的输入层,每个生成图像在SOM的隐藏层中找到一个和生成图像最匹配的节点,以此进行聚类,得到输入的各生成图像中的类别。
步骤S208,分别构建与每个类别分别对应的类别对抗模型,并基于同一类别的生成图像对与相应类别的类别对抗模型进行训练,得到训练完成的与各个类别分别对应的类别对抗模型。
其中,类型对抗模型为生成对抗网络(GAN,Generative Adversarial Networks)是一种深度学习模型,用于图像的生成。
具体地,计算机设备基于各生成图像对应的类别,确定类别的数量,基于该类别的数量分别构建与每个类别分别对应的类别对抗模型,并基于同一类别的生成图像对于相应类别的类别对抗模型进行训练,得到训练完成的与各个类别分别对应的类别对抗模型。该训练完成的类别对抗模型,可以基于输入的噪声数据生成真实性高的图像。
例如,计算机设备根据聚类处理得到的各生成图像的类别,比如,该类别数量为3个,分别为残铜、毛刺、缺口,基于该类别,分别构建与残铜类别对应的残铜类别对抗模型、与毛刺类别对应的毛刺类别对抗模型、与缺口类别对应的缺口类别对抗模型,针对于与残铜类别对应的残铜类别对抗模型,输入与残铜对应的生成图像进行训练,得到训练完成的与残铜类别对应的残铜类别对抗模型,该训练完成的残铜类别对抗模型可以基于输入的噪声生成带有残铜的图像。
步骤S210,获取随机变量数据,并将该噪声数据与该随机变量数据,叠加输入至训练完成的每个类别对抗模型中的第二生成器,得到与各个类别分别对应的类别特征图像。
其中,随机变量数据是与噪声有关的数据,该随机变量数据可以为随机任一噪声;噪声数据为携带有多个任务标签的噪声数据,例如该噪声数据携带有蚀刻不尽、残铜、针扎、线上小毛刺、线幼、线上小缺口等任务标签的数据。该每个类别对抗模型中的第二生成器采用多层卷积网络。
具体地,计算机设备获取随机变量数据,并将噪声数据与随机变量数据叠加共同输入至训练完成的每个类别对抗模型中第二生成器,该第二生成器中采用利用多尺度卷积核对图像进行卷积操作,生成与各个类别分别对应的类别特征图像。
例如,计算机设备获取随机变量数据,并获取训练完成的残铜类别对抗模型、训练完成的毛刺类别对抗模型、训练完成的缺口类别对抗模型,对于每个类别对抗模型,均将随机变量数据、携带有针扎、线上小毛刺、线幼、等任务标签的噪声数据叠加共同输入至训练完成的与类别对应的类别对抗模型中第二生成器,如,将随机变量数据、携带有针扎、线上小毛刺、线幼、等任务标签的噪声数据叠加共同输入至训练完成的残铜类别对抗模型中第二生成器,得到残铜特征图像。
步骤S212,构建缺陷检测模型,并基于多个类别特征图像对该缺陷检测模型进行训练,得到训练好的缺陷检测模型,该训练好的缺陷检测模型用于对目标域的待检测图像进行缺陷检测。
具体地,计算机设备基于卷积神经网络构建缺陷检测模型,并获取多个与各个类别分别对应的类别特征图像,计算机设备基于该多个类别特征图像对该缺陷检测模型进训练,得到训练好的缺陷检测模型,该训练好的缺陷检测模型用于对目标域的待检测图像进行缺陷检测。
上述图像缺陷检测模型的训练方法,通过训练好的特征增强模型中的第一生成器可以生成属于目标域的多个无标签的生成图像,其中,该特征增强模型基于源域样本图像和噪声数据进行预训练后,再基于目标域样本图像和噪声数据进行再训练得到。这样,能够获得特征大大增强的生成图像,再对该生成图像进行聚类处理,得到各生成图像分别对应的类别;分别构建与每个类别分别对应的类别对抗模型,并基于同一类别的生成图像对与相应类别的类别对抗模型进行训练,得到训练完成的与各个类别分别对应的类别对抗模型;获取随机变量数据,并将该噪声数据与该随机变量数据,叠加输入至训练完成的每个类别对抗模型中的第二生成器,得到与各个类别分别对应的类别特征图像,这样,能够进一步增加用于缺陷检测的不同类别的图像,极大的缓解了样本量不足的情况,从而能够避免过拟合的情况,再构建缺陷检测模型,并基于多个类别特征图像对该缺陷检测模型进行训练,得到训练好的缺陷检测模型,这样能够提高缺陷检测模型的泛化能力,因此,基于该训练好的缺陷检测模型对目标域的待检测图像进行缺陷检测,能够大大提高微米级缺陷检测的准确率和召回率。
在一个实施例中,如图3所示,该特征增强模型包括第一生成器和第一判别器,该特征增强模型的预训练步骤,包括:
步骤S302,获取源域样本图像和噪声数据。
其中,噪声数据为携带有多个任务标签的噪声数据,例如该噪声数据携带有蚀刻不尽、残铜、针扎、线上小毛刺、线幼、线上小缺口等任务标签的数据。
具体地,计算机设备获取源域样本图像和携带有多任务标签的噪声数据。其中,源域样本图像可以是基于半导体、面板显示、电路板等领域的知识域样本图像。
步骤S304,对当次的源域样本图像进行特征提取,得到当次的源域特征图。
具体地,计算机设备基于获取的源域样本图像,进行特征提取,得到当次的源域特征图。例如,计算机设备对当次的与面板显示对应的源域样本图像中的待提取区域进行切割,得到待提取区域图像,计算机设备对该待提取区域图像进行特征提取,获得当次的源域特征图。
步骤S306,基于该噪声数据和前次训练迭代得到的源域样本隐特征,并通过该第一生成器生成当次的源域训练生成图像。
其中,隐特征可以理解为隐变量,是不可观测的变量,会对***的状态和能观察到的输出产生影响。
具体地,计算机设备获取携带有多个任务标签的噪声数据,以及前次训练迭代得到的源域样本隐特征,将噪声数据和前次训练迭代得到的隐特征输入至该第一生成器,通过该第一生成器生成当次的源域训练生成图像。例如,计算机设备获取携带有蚀刻不尽、残铜、针扎、线上小毛刺等任务标签的噪声数据,该噪声数据可以为矩阵数据,并获取前次训练迭代得到的与面板显示对应的源域样本隐特征,并将噪声数据、源域样本隐特征叠加输入至该第一生成器,通过该第一生成器生成当次的与面板显示对应的源域训练生成图像,其中,该第一生成器可以基于深度卷积网络构建。
步骤S308,将当次的源域特征图和当次的源域训练生成图像输入至第一判别器中,得到第一判别结果和当次的源域样本隐特征。
其中,第一判别器的激活函数可以为LReLU(G)、Sigmoid(D),采用分数步进卷积,并且该第一判别器通过对每一批数据归一化实现批归一化,能够避免梯度消失或梯度***问题。
具体地,计算机设备获取当次的源域特征图、当次的源域训练生成图,并将该当次的源域特征图与该当次的源域训练生成图共同输入至第一判别器中,得到第一判别结果和当次的源域样本隐特征,其中该第一判别结果表征第一生成器生成图像的能力,即判断生成图像是否真实的概率。例如,计算机设备将当次的源域特征图与该当次的源域训练生成图共同输入至第一判别器中分数步进卷积运算,得到第一判别结果和当次的源域样本隐特征,若第一判别结果为1,则表征第一生成器生成图像与真实图像相同,若第一判别器为0,则表征第一生成器生成图像与真实图像不相同,需要对第一生成器进行训练。
步骤S310,基于该第一判别结果对该特征增强模型的模型参数进行调整,进入下一次的循环迭代,并将当次的源域样本隐特征作为下一次训练迭代所对应的前次训练迭代得到的源域样本隐特征,返回该对当次的源域样本图像进行特征提取,得到当次的源域特征图的步骤继续执行,直至达到第一训练停止条件时停止,得到预训练好的特征增强模型。
具体地,计算机设备获取该第一判别结果,当该第一判别结果不为0时,计算机设备基于该第一判别结果对该特征增强模型的模型参数进行调整,进入下一次的循环迭代,并将当次的源域样本隐特征作为下一次训练迭代所对应的前次训练迭代得到的源域样本隐特征,返回该对当次的源域样本图像进行特征提取,得到当次的源域特征图像的步骤继续执行,直至达到第一训练停止条件时停止,得到预训练好的特征增强模型,该第一训练停止条件可以为迭代次数达到第一预定迭代次数,也可以为迭代时间达到第一预定迭代时间。
例如,计算机设备获取该第一判别结果,当第一判别结果不为0,时,计算机设备基于该第一判别结果对第一生成器和第一判别器的参数进行调整,并设置第一预定迭代次数,进行下一次的循环迭代,并将当次的源域样本隐特征作为下一次训练迭代所对应的前次训练迭代得到的源域样本特征,返回该对当次的源域样本图像进行特征提取,得到当次的源域特征图像的步骤继续执行,直至迭代次数达到第一预定迭代次数时,得到预训练好的特征增强模型。
在本实施例中,获取源域样本图像和噪声数据;对当次的源域样本图像进行特征提取,得到当次的源域特征图;基于该噪声数据和前次训练迭代得到的源域样本隐特征,并通过该第一生成器生成当次的源域训练生成图像;将当次的源域特征图和当次的源域训练生成图像输入至第一判别器中,得到第一判别结果和当次的源域样本隐特征;基于该第一判别结果对该特征增强模型的模型参数进行调整,进入下一次的循环迭代,并将当次的源域样本隐特征作为下一次训练迭代所对应的前次训练迭代得到的源域样本隐特征,返回该对当次的源域样本图像进行特征提取,得到当次的源域特征图的步骤继续执行,直至达到第一训练停止条件时停止,得到预训练好的特征增强模型,这样,能够将预训练好的特征增强模型中的第一生成器用于目标域进行知识迁移,从而能够生成对微米级缺陷特征进行增强的特征增强模型。
在一个实施例中,如图4所示,所述特征增强模型的再训练步骤包括:
步骤S402,获取目标域样本图像和噪声数据。
其中,噪声数据为携带有多个任务标签的噪声数据,例如该噪声数据携带有蚀刻不尽、残铜、针扎、线上小毛刺、线幼、线上小缺口等任务标签的数据。
具体地,计算机设备获取目标域样本图像和携带有多任务标签的噪声数据。其中,目标域样本图像可以是基于半导体、面板显示、电路板等领域的要学习的知识域样本图像。
步骤S404,对当次的目标域样本图像进行特征提取,得到当次的目标域特征图。
具体地,计算机设备基于获取的目标域样本图像,进行特征提取,得到当次的目标域特征图。例如,计算机设备对当次的与电路板对应的目标域样本图像中的待提取区域进行切割,得到待提取区域图像,计算机设备对该待提取区域图像进行特征提取,获得当次的目标域特征图。
步骤S406,基于该噪声数据和前次训练迭代得到的目标域样本隐特征,并通过预训练得到的第一生成器生成当次的目标域训练生成图像。
其中,隐特征可以理解为隐变量,是不可观测的变量,会对***的状态和能观察到的输出产生影响。
具体地,计算机设备获取携带有多个任务标签的噪声数据,以及前次训练迭代得到的目标域样本隐特征,该目标域样本隐特征为前次迭代训练中第一判别器学习区分源域与目标域中合适特征块和不合适的合成特征块,并确定前次训练迭代的域不变特征,该域不变特征即为前次训练迭代得到的目标域样本隐特征,计算机设将噪声数据和前次训练迭代得到的隐特征输入至该第一生成器,通过该第一生成器生成当次的目标域训练生成图像,进而能够对微小特征进一步增强。
例如,计算机设备获取携带有蚀刻不尽、残铜、针扎、线上小毛刺等任务标签的噪声数据,该噪声数据可以为矩阵数据,并获取前次训练迭代得到的与电路板对应的目标域样本隐特征,该目标域样本隐特征为前次迭代训练中第一判别器学习区分源域与目标域中合适特征块和不合适的合成特征块,并确定前次训练迭代的域不变特征,并且计算机设备通过数据映射寻找跨域的隐特征空间并基于迁移学习迁移域不变特征,该域不变特征即为前次训练迭代得到的目标域样本隐特征,计算机设将噪声数据和前次训练迭代得到的隐特征输入至该第一生成器,并将噪声数据、目标域样本隐特征叠加输入至该第一生成器,通过该第一生成器生成当次的与电路板对应的目标域训练生成图像。
步骤S408,将当次的目标域特征图和当次的目标域训练生成图像输入至预训练得到的第一判别器中,得到第二判别结果和当次的目标域样本隐特征。
其中,第一判别器的激活函数可以为LReLU、Sigmoid,采用分数步进卷积,并且该第一判别器通过对每一批数据归一化实现批归一化,能够避免梯度消失或梯度***问题。
计算机设备获取当次的目标域特征图、当次的目标域训练生成图,并将该当次的目标域特征图与该当次的目标域训练生成图共同输入至第一判别器中,得到第一判别结果和当次的目标域样本隐特征,该当次的目标域样本特征为更新后的域不变特征,即通过对前次的目标域样本特征进行更新得到当次的目标域样本隐特征,其中该第一判别结果表征第一生成器生成图像的能力,即判断生成图像是否真实的概率。例如,计算机设备将当次的目标域特征图与该当次的目标域训练生成图共同输入至第一判别器中分数步进卷积运算,得到第一判别结果和当次的目标域样本隐特征,若第一判别结果为1,则表征第一生成器生成图像与真实图像相同,若第一判别器为0,则表征第一生成器生成图像与真实图像不相同,需要对第一生成器进行训练。
步骤S410,基于该第二判别结果对预训练得到的特征增强模型的模型参数进行调整,进入下一次的循环迭代,并将当次的目标域样本隐特征作为下一次训练迭代所对应的前次训练迭代得到的目标域样本隐特征,返回该对当次的目标域样本图像进行特征提取,得到当次的目标域特征图的步骤继续执行,直至达到第二训练停止条件时停止,得到训练好的特征增强模型。
具体地,计算机设备获取该第一判别结果,当该第一判别结果不为0时,计算机设备基于该第一判别结果对该预训练得到的特征增强模型的模型参数进行调整,进入下一次的循环迭代,并将当次的目标域样本隐特征作为下一次训练迭代所对应的前次训练迭代得到的目标域样本隐特征,返回该对当次的目标域样本图像进行特征提取,得到当次的目标域特征图像的步骤继续执行,直至达到第二训练停止条件时停止,得到训练好的特征增强模型,该第二训练停止条件可以为迭代次数达到第二预定迭代次数,也可以为迭代时间达到第二预定迭代时间。
例如,计算机设备获取该第一判别结果,当第一判别结果不为0,时,计算机设备基于该第一判别结果对第一生成器和第一判别器的参数进行调整,并设置第二预定迭代次数,进行下一次的循环迭代,并将当次的目标域样本隐特征作为下一次训练迭代所对应的前次训练迭代得到的目标域样本特征,返回该对当次的目标域样本图像进行特征提取,得到当次的目标域特征图像的步骤继续执行,直至迭代次数达到第二预定迭代次数时,得到训练好的特征增强模型。
在本实施例中,获取目标域样本图像和噪声数据,这样通过加入的噪声数据能够使得生成的特征更具有抗噪性,对当次的目标域样本图像进行特征提取,得到当次的目标域特征图;基于该噪声数据和前次训练迭代得到的目标域样本隐特征,并通过预训练得到的第一生成器生成当次的目标域训练生成图像;将当次的目标域特征图和当次的目标域训练生成图像输入至预训练得到的第一判别器中,得到第二判别结果和当次的目标域样本隐特征;基于该第二判别结果对预训练得到的特征增强模型的模型参数进行调整,进入下一次的循环迭代,并将当次的目标域样本隐特征作为下一次训练迭代所对应的前次训练迭代得到的目标域样本隐特征,返回该对当次的目标域样本图像进行特征提取,得到当次的目标域特征图的步骤继续执行,直至达到第二训练停止条件时停止,得到训练好的特征增强模型,因此,通过将经过第一判别器得到第一判别结果反馈至第一生成器中,能够对特征进一步增强,进而生成更精细的图像特征,并且有利于克服传统生成对抗网络中寻找纳什均衡时难以收敛的问题,使训练朝收敛方向进行。
为了便于更加清楚的了解特征增强模型的生成,如图5所示,提供了一个更为详细实施例进行描述。计算机设备获取目标域样本图像、以及携带有多个任务标签的噪声数据,将该噪声数据输入至由深度卷积网络构建的特征增强模型的第一生成器,得到目标域训练生成图像,计算机设备将目标域样本图像进行特征提取获得目标特征图,并将目标特征图和目标域训练生成图像输入至特征增强模型中的第一判别器中,第一判别器学习区分源域与目标域中合适特征块和不合适的合成特征块,确定域不变特征,将该域不变特征作为目标域样本隐特征,并得到第二判别结果,计算机设备将该目标域样本隐特征和噪声数据输入至第一生成器中开始下一次的迭代,通过迭代不断更新该目标域样本隐特征,直至达到第二训练停止条件时停止,得到训练好的特征增强模型。
在本实施例中,将携带有多个任务标签的噪声数据经过深度卷积网络的第一生成器生成更精细特征的目标域训练生成图像,基于该目标域训练生成图像和对目标域样本图像进行特征提取得到的目标特征图,通过第一判别器确定域不变特征,并通过迁移学习将域不变特征作为目标域样本隐特征反馈至第一生成器中,并通过迭代训练最终得到训练好的特征增强模型,从而能够生成更精细的特征,以此能够实现对微米级图像进行缺陷检测。
在一个实施例中,该对当次的目标域样本图像进行特征提取,得到当次的目标域特征图,包括:
对当次的目标域样本图像中的目标区域进行提取,得到目标区域图像;对该目标区域图像进行特征提取,获得当次的目标域特征图。
具体地,计算机设备获取当次的目标域图像,并确定目标区域,计算机设备对当次的目标域样本图像中的目标区域进行切割提取,得到目标域区域图像,计算机设备对该目标域区域图像进行特征提取,将高维像素特征转为低维特征,获得当次的目标域特征图。
在本实施例中,对当次的目标域样本图像中的目标区域进行提取,得到目标区域图像;对该目标区域图像进行特征提取,获得当次的目标域特征图,这样,将该当次的目标域特征图输入至第一判别器中,能够得到更具有代表性的特征。
在一个实施例中,如图6所示,该类别对抗模型包括第二生成器和第二判别器,该基于同一类别的生成图像对与相应类别的类别对抗模型进行训练,得到训练完成的与各个类别分别对应的类别对抗模型,包括:
步骤S602,获取同一类别的生成图像,并对当次的生成图像进行特征提取,得到当次的特征提取图。
具体地,计算机设备获取经过聚类处理得到的各生成图像的类别,并从多个生成图像中获取同一类别的生成图像,并对当次的生成图像进行特征提取,得到当次的特征提取图。例如,计算机设备从多个生成图像中获取类别为毛刺的生成图像,对类别为毛刺的各个生成图像分别进行特征提取,得到当次的特征提取图。
步骤S604,获取场景样本噪声数据和随机变量数据,基于该场景噪声数据、随机变量数据和前次训练迭代得到的半监督样本,通过该第二生成器生成当次的训练类别特征图像。
其中,场景样本噪声数据为与场景相关的携带有多个任务标签的噪声数据,随机变量数据是与噪声有关的数据,该随机变量数据可以为随机任一噪声,半监督样本为一种隐编码c。参考Info GAN结构框架,并考虑到Info GAN模型的隐编码c和图像特征具有相关性,可以通过控制隐编码c的不同来控制模型生成不同类型的图片,该第二生成器为多层卷积网络,每层卷积网络中采用了转置卷积运算(G)和卷积运算(D),激活函数采用ReLU(G)、LeakyReLU(D),该生成器中输出层通过卷积运算且激活函数采用Tan(G)、Softmax(D)。
具体地,计算机设备获取与场景相关的携带有多个任务标签的场景样本噪声数据、以及随机变量数据,并获取前次训练迭代得到的半监督样本,计算机设备基于该场景噪声数据、随机变量数据以及该前次训练迭代得到的半监督样本,通过第二生成器的多层卷积网络进行卷积操作,生成当次的训练类别特征图像。
例如,计算机设备获取场景为电路板的场景样本噪声数据、以及随机变量数据,并获取前次训练迭代得到的半监督样本,该半监督样本为前次迭代训练中第二判别器进行对抗式域适配学习,通过领域判别器判断目标样本跟源域样本的区别,并且该计算机设备根据跨域任务之间的相关性和任务协方差进行迁移学习,得到半监督样本,计算机设备基于该场景噪声数据、随机变量数据以及该前次训练迭代得到的半监督样本,通过第二生成器的多层卷积网络进行卷积操作,生成当次的训练类别特征图像。其中,第二判别器采用多层卷积和多层全连接构成,激活函数采用LReLU,而第二生成器激活函数为ReLU,可有效避免过拟合现象。
步骤S606,将该当次的特征提取图和该当次的训练类别特征图像输入至第二判别器中,得到第三判别结果和当次的半监督样本。
其中,第二判别器采用多层卷积和多层全连接构成,激活函数采用LReLU、Sigmoid,采用分数步进卷积,并且该第二判别器通过对每一批数据归一化实现批归一化,能够避免梯度消失或梯度***问题。
具体地,计算机设备获取当次的特征提取图、当次的训练类别特征图像,并将该当次的特征提取图和该当次的训练类别特征图像共同输入至第二判别器中,得到第三判别结果和当次的半监督样本,该当次的半监督样本为更新后的前次训练迭代得到的半监督样本,其中该第三判别结果表征第二生成器生成图像的能力,即判断生成图像接近真实图像的概率。例如,计算机设备将当次的特征提取图、当次的训练类别特征图像共同输入至第二判别器中,基于激活函数为LReLU、Sigmoid,通过分数步进卷积运算,得到第二次判别结果和当次的半监督样本。
步骤S608,基于该第三判别结果对该类别对抗模型的模型参数进行调整,进入下一循环迭代,并将当次的半监督样本作为下一次训练迭代所对应的前次训练迭代得到的半监督样本,返回该对当次的生成图像进行特征提取,得到当次的特征提取图的步骤继续执行,直至达到第三训练停止条件时停止,得到训练完成的与相应类别对应的类别对抗模型。
具体地,计算机设备基于该第三判别结果对该类别对抗模型的模型参数进行调整,进行下一次循环迭代,并将当次的半监督样本作为下一次训练迭代所对应的当次训练迭代得到的半监督样本,返回该对当次的生成图像进行特征提取,得到当次的特征提取图的步骤继续执行,直至达到第三训练停止条件时停止,得到训练完成的与相应类别对应的类别对抗模型,将各个类别对抗模型进行集成,得到与多个类别的分类决策模型,该第三训练停止条件可以为迭代次数达到第三预定迭代次数,也可以为迭代时间达到第三预定迭代时间。
例如,计算机设备获取第三判别结果,并基于该第三判别结果对该类别对抗模型的模型参数进行调整,进行下一次的循环迭代,并将当次的半监督样本作为下一次训练迭代所对应的当次训练迭代得到的半监督样本,返回该对当次的生成图像进行特征提取,得到当次的特征提取图的步骤继续执行,直至迭代次数达到第三预定迭代次数时,得到训练完成的与相应类别对应的类别对抗模型,若经过聚类处理确定各生成图像的类别为残铜、毛刺、缺口,计算机设备获取训练好的残铜类别对抗模型、训练好的毛刺类别对抗模型、训练好的缺口类别对抗模型,并对三个类别对抗模型进行集成,得到与3个类别的分类决策模型。
在本实施例中,获取同一类别的生成图像,并对当次的生成图像进行特征提取,得到当次的特征提取图;获取场景样本噪声数据和随机变量数据,基于该场景噪声数据、随机变量数据和前次训练迭代得到的半监督样本,通过该第二生成器生成当次的训练类别特征图像;将该当次的特征提取图和该当次的训练类别特征图像输入至第二判别器中,得到第三判别结果和当次的半监督样本;基于该第三判别结果对该类别对抗模型的模型参数进行调整,进入下一循环迭代,并将当次的半监督样本作为下一次训练迭代所对应的前次训练迭代得到的半监督样本,返回该对当次的生成图像进行特征提取,得到当次的特征提取图的步骤继续执行,直至达到第三训练停止条件时停止,得到训练完成的与相应类别对应的类别对抗模型,这样,能够进一步增加用于缺陷检测的不同类别的图像,进而可以提升缺陷检测模型的泛化能力。
为了便于更加清楚的了解每个类别对应类别对抗模型的生成过程,以A类别的类别对抗模型的生成过程为例,如图7所示,提供了一个更为详细实施例进行描述。计算机设备获取A类别生成图像、以及携带有多个任务标签的场景样本噪声数据、随机变量数据,将该场景样本噪声数据、随机变量数据输入至A类别的类别对抗模型的第二生成器,得到A类别的训练类别特征图像,计算机设备将A类别生成图像进行特征提取获得A类别的特征提取图,并将A类别的特征提取图、A类别的训练类别特征图像输入至A类别的类别对抗模型的的第二判别器,得到第三判别结果,并且第二判别器进行对抗式域适配学习,通过领域判别器判断目标样本跟源域样本的区别,并且该计算机设备根据跨域任务之间的相关性和任务协方差进行迁移学习,得到半监督样本,计算机设备将半监督样本、该场景样本噪声数据、随机变量数据输入至A类别的类别对抗模型的第二生成器中开始下一次的迭代,通过迭代不断更新半监督样本,直至达到第三训练停止条件时停止,得到训练好的A类别的类别对抗模型。
在本实施例中,将携带有多个任务标签的场景样本噪声数据、随机变量数据、以及半监督样本输入至类别对抗模型中第二生成器,得到与类别对应的训练类别特征图像,并基于与类别对抗模型对应的生成图像,获得特征提取图,基于特征提取图和训练类别特征图像确定半监督样本,并将该半监督样本反馈至第二生成器中,并通过迭代训练得到训练好的与类别对应的类别对抗模型,从而能够获得多个类别的类别对抗模型,进而能够进一步增加用于缺陷检测的不同类别的图像,提升了缺陷检测模型的泛化能力。
在一个实施例中,该获取场景样本噪声数据,包括:
对多个特征生成图像进行场景预判,确定与每个该特征生成图像分别对应的目标场景;获取与该目标场景对应的场景样本噪声数据。
具体地,计算机设备获取多个特征生成图像,并对多个特征生成图像进行场景预判,确定与每个该特征生成图像分别对应的目标场景,计算机设备基于该目标场景,获取与该目标场景对应的携带有多个任务标签的场景样本噪声数据。例如,计算机设备获取多个特征生成图像,并基于场景预判模型对多个特征生成图像进行场景预判,确定与每个该特征生成图像分布对应的目标场景,比如,该目标场景为电路板场景时,计算机设备获取电路板场景下的携带有多个任务噪声的电路板样本噪声。
在本实施中,通过对多个特征生成图像进行场景预判,确定与每个该特征生成图像分别对应的目标场景;获取与该目标场景对应的场景样本噪声数据,从而能够快速确定与目标场景对应的噪声数据,能够提高类别对抗模型的精度,进而提高缺陷检测模型的检测效率和精准度。
在一个实施例中,该将该当次的特征提取图和该当次的训练类别特征图像输入至第二判别器中,得到第三判别结果和当次的半监督样本,包括:
将该当次的特征提取图和该当次的训练类别特征图像输入至第二判别器中,获得第三判别结果和中间半监督样本;当该中间半监督样本满足预设阈值范围时,将该中间半监督样本作为当次的半监督样本。
具体地,计算机设备获取当次的特征提取图像和当次的训练类别特征图像,并将当次的特征提取图和该当次的训练类别特征图像输入至第二判别器中,获得第三判别结果和中间半监督样本,计算机设备确定预设阈值,例如选择预设阈值为0.75-0.85,根据该预设阈值抽取半监督样本,当该中间半监督样本满足预设阈值范围时,将该中间半监督样本作为当次的半监督样本。其中,该预设阈值过高容易造成生成器生成的样本进行训练后造成过拟合,泛化能力较弱,过低则对准确率影响不大,反而造成计算速度下降。
在本实施例中,将该当次的特征提取图和该当次的训练类别特征图像输入至第二判别器中,获得第三判别结果和中间半监督样本;当该中间半监督样本满足预设阈值范围时,将该中间半监督样本作为当次的半监督样本,这样,能够基于更加合适的半监督样本对类别对抗模型进行训练,因此,基于训练好的类别对抗模型能够有助于提高缺陷检测模型的泛化能力。
为了便于更加清楚的了解图像缺陷检测模型的训练,如图8所示,提供了一个更为详细实施例进行描述。首先基于源域样本图像和噪声数据进行预训练,得到训练好的预训练特征增强模型,再基于目标域样本图像和噪声数据进行再训练,并通过迁移学习(即知识迁移)得到训练好的特征增强模型,再将携带有多个任务标签的噪声数据输入至特征增强模型中的第一生成器中,得到特征增强的多个无标签的生成图像,在对该生成图像进行聚类处理,得到各生成图像分别对应的类别,分别构建与每个类别分别对应的类别对抗模型,得到多类别的类别对抗模型,对于每个类别的类别对抗模型,获取同一类别的生成图像,并对该生成图像进行场景预判,确定目标场景,基于该目标场景确定场景样本噪声数据,计算机设备将携带有多个任务标签的场景样本噪声数据(即多任务源)、随机变量数据,输入至类别对抗模型中第二生成器进行训练,并且通过各个类别的迁移学习(多任务识别迁移),得到训练完成的与各个类别分别对应的类别对抗模型,并将各个类别对抗模型进行集成,得到多类别的分类决策模型,即多类别的类别对抗模型。其中,在各个类别对抗模型训练的过程中均将生成的半监督样本反馈至第二生成器中,以调整生成的图像特征。计算机设备获取随机变量数据,并将该噪声数据与该随机变量数据,输入至训练完成的每个类别对抗模型中的第二生成器,得到与各个类别分别对应的类别特征图像;并构建缺陷检测模型,计算机设备基于多个类别特征图像对所述缺陷检测模型进行训练,得到训练好的缺陷检测模型。此外,基于损失函数指导检测过程,使得缺陷检测模型的结果更加准确。
在本实施例中,通过特征增强模型能够大大增强生成图像的特征,从而有助于实现对微米级缺陷可分性、迁移适应性强的特征进行提取,并且基于特征增强的生成图像对各个类别对应的类别对抗模型进行训练,得到训练完成的各个类别对抗模型,基于该各个类别对抗模型能够进一步增加用于缺陷检测的不同类别的图像,从而能够避免过拟合的情况,其中,将携带有多个任务标签的场景样本噪声数据作为第二生成器的输入变量,能够减少对整体信息造成损伤,即在通过用于特征提取的特征增强模型和用于各个类别的多类别的类别对抗模型两个层次的生成对抗式网络和迁移学习之后再构建缺陷检测模型,其中,通过用于特征提取的特征增强模型和用于各个类别的多类别的类别对抗模型两个层次进行衔接,同时通过场景样本噪声数据(即多任务源)和各个类别的迁移学习(多任务识别迁移),构成多层次多任务的缺陷检测模型。再基于多个类别特征图像对该缺陷检测模型进行训练,得到训练好的缺陷检测模型,这样能够形成多类别(多任务)共享的低秩空间,从而提高缺陷检测模型的泛化能力,因此,基于该训练好的缺陷检测模型对目标域的待检测图像进行缺陷检测,能够大大提高微米级缺陷检测的准确率和召回率。
应该理解的是,虽然图2至4、图6的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2至4、图6中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图9所示,提供了一种图像缺陷检测模型的训练装置,包括:获取模块902、第一生成模块904、聚类模块906、第一训练模块908、第二生成模块910、第二训练模块912,其中:
获取模块902,用于获取训练好的特征增强模型中的第一生成器;其中,该特征增强模型基于源域样本图像和噪声数据进行预训练后,再基于目标域样本图像和噪声数据进行再训练得到。
第一生成模块904,用于将该噪声数据输入至该第一生成器,得到多个无标签的生成图像。
聚类模块906,用于对该生成图像进行聚类处理,得到各生成图像分别对应的类别。
第一训练模块908,用于分别构建与每个类别分别对应的类别对抗模型,并基于同一类别的生成图像对与相应类别的类别对抗模型进行训练,得到训练完成的与各个类别分别对应的类别对抗模型。
第二生成模块910,用于获取随机变量数据,并将该噪声数据与该随机变量数据,叠加输入至训练完成的每个类别对抗模型中的第二生成器,得到与各个类别分别对应的类别特征图像。
第二训练912,用于构建缺陷检测模型,并基于多个类别特征图像对该缺陷检测模型进行训练,得到训练好的缺陷检测模型,该训练好的缺陷检测模型用于对目标域的待检测图像进行缺陷检测。
在一个实施例中,获取模块902,用于获取源域样本图像和噪声数据;对当次的源域样本图像进行特征提取,得到当次的源域特征图;基于该噪声数据和前次训练迭代得到的源域样本隐特征,并通过该第一生成器生成当次的源域训练生成图像;将当次的源域特征图和当次的源域训练生成图像输入至第一判别器中,得到第一判别结果和当次的源域样本隐特征;基于该第一判别结果对该特征增强模型的模型参数进行调整,进入下一次的循环迭代,并将当次的源域样本隐特征作为下一次训练迭代所对应的前次训练迭代得到的源域样本隐特征,返回该对当次的源域样本图像进行特征提取,得到当次的源域特征图的步骤继续执行,直至达到第一训练停止条件时停止,得到预训练好的特征增强模型。
在一个实施例中,获取模块902,用于获取目标域样本图像和噪声数据;对当次的目标域样本图像进行特征提取,得到当次的目标域特征图;基于该噪声数据和前次训练迭代得到的目标域样本隐特征,并通过预训练得到的第一生成器生成当次的目标域训练生成图像;将当次的目标域特征图和当次的目标域训练生成图像输入至预训练得到的第一判别器中,得到第二判别结果和当次的目标域样本隐特征;基于该第二判别结果对预训练得到的特征增强模型的模型参数进行调整,进入下一次的循环迭代,并将当次的目标域样本隐特征作为下一次训练迭代所对应的前次训练迭代得到的目标域样本隐特征,返回该对当次的目标域样本图像进行特征提取,得到当次的目标域特征图的步骤继续执行,直至达到第二训练停止条件时停止,得到训练好的特征增强模型。
在一个实施例中,获取模块902,用于对当次的目标域样本图像中的目标区域进行提取,得到目标区域图像;对该目标区域图像进行特征提取,获得当次的目标域特征图。
在一个实施例中,第一训练模块908,用于获取同一类别的生成图像,并对当次的生成图像进行特征提取,得到当次的特征提取图;获取场景样本噪声数据和随机变量数据,基于该场景噪声数据、随机变量数据和前次训练迭代得到的半监督样本,通过该第二生成器生成当次的训练类别特征图像;将该当次的特征提取图和该当次的训练类别特征图像输入至第二判别器中,得到第三判别结果和当次的半监督样本;基于该第三判别结果对该类别对抗模型的模型参数进行调整,进入下一循环迭代,并将当次的半监督样本作为下一次训练迭代所对应的前次训练迭代得到的半监督样本,返回该对当次的生成图像进行特征提取,得到当次的特征提取图的步骤继续执行,直至达到第三训练停止条件时停止,得到训练完成的与相应类别对应的类别对抗模型。
在一个实施例中,第一训练模块908,用于对多个特征生成图像进行场景预判,确定与每个该特征生成图像分别对应的目标场景;获取与该目标场景对应的场景样本噪声数据。
在一个实施例中,第二训练模块908,用于将该当次的特征提取图和该当次的训练类别特征图像输入至第二判别器中,获得第三判别结果和中间半监督样本;当该中间半监督样本满足预设阈值范围时,将该中间半监督样本作为当次的半监督样本。
关于图像缺陷检测模型的训练装置的具体限定可以参见上文中对于图像缺陷检测模型的训练方法的限定,在此不再赘述。上述图像缺陷检测模型的训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图10所示。该计算机设备包括通过***总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于存储图像缺陷检测模型的训练数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种图像缺陷检测模型的训练方法。
本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种图像缺陷检测模型的训练方法,其特征在于,所述方法包括:
获取训练好的特征增强模型中的第一生成器;其中,所述特征增强模型基于源域样本图像和噪声数据进行预训练后,再基于目标域样本图像和噪声数据进行再训练得到;
将所述噪声数据输入至所述第一生成器,得到多个无标签的生成图像;
对所述生成图像进行聚类处理,得到各生成图像分别对应的类别;
分别构建与每个类别分别对应的类别对抗模型,并基于同一类别的生成图像对与相应类别的类别对抗模型进行训练,得到训练完成的与各个类别分别对应的类别对抗模型;
获取随机变量数据,并将所述噪声数据与所述随机变量数据,叠加输入至训练完成的每个类别对抗模型中的第二生成器,得到与各个类别分别对应的类别特征图像;
构建缺陷检测模型,并基于多个类别特征图像对所述缺陷检测模型进行训练,得到训练好的缺陷检测模型,所述训练好的缺陷检测模型用于对目标域的待检测图像进行缺陷检测。
2.根据权利要求1所述的方法,其特征在于,所述特征增强模型包括第一生成器和第一判别器,所述特征增强模型的预训练步骤包括:
获取源域样本图像和噪声数据;
对当次的源域样本图像进行特征提取,得到当次的源域特征图;
基于所述噪声数据和前次训练迭代得到的源域样本隐特征,并通过所述第一生成器生成当次的源域训练生成图像;
将当次的源域特征图和当次的源域训练生成图像输入至第一判别器中,得到第一判别结果和当次的源域样本隐特征;
基于所述第一判别结果对所述特征增强模型的模型参数进行调整,进入下一次的循环迭代,并将当次的源域样本隐特征作为下一次训练迭代所对应的前次训练迭代得到的源域样本隐特征,返回所述对当次的源域样本图像进行特征提取,得到当次的源域特征图的步骤继续执行,直至达到第一训练停止条件时停止,得到预训练好的特征增强模型。
3.根据权利要求2所述的方法,其特征在于,所述特征增强模型的再训练步骤包括:
获取目标域样本图像和噪声数据;
对当次的目标域样本图像进行特征提取,得到当次的目标域特征图;
基于所述噪声数据和前次训练迭代得到的目标域样本隐特征,并通过预训练得到的第一生成器生成当次的目标域训练生成图像;
将当次的目标域特征图和当次的目标域训练生成图像输入至预训练得到的第一判别器中,得到第二判别结果和当次的目标域样本隐特征;
基于所述第二判别结果对预训练得到的特征增强模型的模型参数进行调整,进入下一次的循环迭代,并将当次的目标域样本隐特征作为下一次训练迭代所对应的前次训练迭代得到的目标域样本隐特征,返回所述对当次的目标域样本图像进行特征提取,得到当次的目标域特征图的步骤继续执行,直至达到第二训练停止条件时停止,得到训练好的特征增强模型。
4.根据权利要求3所述的方法,其特征在于,所述对当次的目标域样本图像进行特征提取,得到当次的目标域特征图,包括:
对当次的目标域样本图像中的目标区域进行提取,得到目标区域图像;
对所述目标区域图像进行特征提取,获得当次的目标域特征图。
5.根据权利要求1所述的方法,其特征在于,所述类别对抗模型包括第二生成器和第二判别器,所述基于同一类别的生成图像对与相应类别的类别对抗模型进行训练,得到训练完成的与各个类别分别对应的类别对抗模型,包括:
获取同一类别的生成图像,并对当次的生成图像进行特征提取,得到当次的特征提取图;
获取场景样本噪声数据和随机变量数据,基于所述场景噪声数据、随机变量数据和前次训练迭代得到的半监督样本,通过所述第二生成器生成当次的训练类别特征图像;
将所述当次的特征提取图和所述当次的训练类别特征图像输入至第二判别器中,得到第三判别结果和当次的半监督样本;
基于所述第三判别结果对所述类别对抗模型的模型参数进行调整,进入下一循环迭代,并将当次的半监督样本作为下一次训练迭代所对应的前次训练迭代得到的半监督样本,返回所述对当次的生成图像进行特征提取,得到当次的特征提取图的步骤继续执行,直至达到第三训练停止条件时停止,得到训练完成的与相应类别对应的类别对抗模型。
6.根据权利要求5所述的方法,其特征在于,所述获取场景样本噪声数据,包括:
对多个特征生成图像进行场景预判,确定与每个所述特征生成图像分别对应的目标场景;
获取与所述目标场景对应的场景样本噪声数据。
7.根据权利要求5所述的方法,其特征在于,所述将所述当次的特征提取图和所述当次的训练类别特征图像输入至第二判别器中,得到第三判别结果和当次的半监督样本,包括:
将所述当次的特征提取图和所述当次的训练类别特征图像输入至第二判别器中,获得第三判别结果和中间半监督样本;
当所述中间半监督样本满足预设阈值范围时,将所述中间半监督样本作为当次的半监督样本。
8.一种图像缺陷检测模型的训练装置,其特征在于,所述装置包括:
获取模块,用于获取训练好的特征增强模型中的第一生成器;其中,所述特征增强模型基于源域样本图像和噪声数据进行预训练后,再基于目标域样本图像和噪声数据进行再训练得到;
第一生成模块,用于将所述噪声数据输入至所述第一生成器,得到多个无标签的生成图像;
聚类模块,用于对所述生成图像进行聚类处理,得到各生成图像分别对应的类别;
第一训练模块,用于分别构建与每个类别分别对应的类别对抗模型,并基于同一类别的生成图像对与相应类别的类别对抗模型进行训练,得到训练完成的与各个类别分别对应的类别对抗模型;
第二生成模块,用于获取随机变量数据,并将所述噪声数据与所述随机变量数据,叠加输入至训练完成的每个类别对抗模型中的第二生成器,得到与各个类别分别对应的类别特征图像;
第二训练模块,用于构建缺陷检测模型,并基于多个类别特征图像对所述缺陷检测模型进行训练,得到训练好的缺陷检测模型,所述训练好的缺陷检测模型用于对目标域的待检测图像进行缺陷检测。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202110852005.7A 2021-07-27 2021-07-27 图像缺陷检测模型的训练方法、装置、计算机设备 Pending CN113610787A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110852005.7A CN113610787A (zh) 2021-07-27 2021-07-27 图像缺陷检测模型的训练方法、装置、计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110852005.7A CN113610787A (zh) 2021-07-27 2021-07-27 图像缺陷检测模型的训练方法、装置、计算机设备

Publications (1)

Publication Number Publication Date
CN113610787A true CN113610787A (zh) 2021-11-05

Family

ID=78305605

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110852005.7A Pending CN113610787A (zh) 2021-07-27 2021-07-27 图像缺陷检测模型的训练方法、装置、计算机设备

Country Status (1)

Country Link
CN (1) CN113610787A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114397306A (zh) * 2022-03-25 2022-04-26 南方电网数字电网研究院有限公司 一种电网均压环超复杂类别缺陷多阶段模型联合检测方法
CN114677541A (zh) * 2022-03-23 2022-06-28 成都智元汇信息技术股份有限公司 一种基于目标提取黏合样本集的方法及***
CN115311262A (zh) * 2022-10-09 2022-11-08 南通如东依航电子研发有限公司 一种印刷电路板缺陷识别方法
CN116091873A (zh) * 2023-04-10 2023-05-09 宁德时代新能源科技股份有限公司 图像生成方法、装置、电子设备及存储介质
CN117372791A (zh) * 2023-12-08 2024-01-09 齐鲁空天信息研究院 细粒度定向能毁伤区域检测方法、装置及存储介质
CN117437425A (zh) * 2023-12-21 2024-01-23 深圳思谋信息科技有限公司 语义分割方法、装置、计算机设备及计算机可读存储介质
CN117649406A (zh) * 2024-01-29 2024-03-05 宁德时代新能源科技股份有限公司 密封钉焊接缺陷检测方法、装置、设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109509156A (zh) * 2018-10-31 2019-03-22 聚时科技(上海)有限公司 一种基于生成对抗模型的图像去雾处理方法
WO2020143592A1 (zh) * 2019-01-07 2020-07-16 鲁班嫡系机器人(深圳)有限公司 缺陷识别模型训练方法、装置、计算机设备和存储介质
CN111444952A (zh) * 2020-03-24 2020-07-24 腾讯科技(深圳)有限公司 样本识别模型的生成方法、装置、计算机设备和存储介质
CN111832605A (zh) * 2020-05-22 2020-10-27 北京嘀嘀无限科技发展有限公司 无监督图像分类模型的训练方法、装置和电子设备
CN112215255A (zh) * 2020-09-08 2021-01-12 深圳大学 一种目标检测模型的训练方法、目标检测方法及终端设备
CN112733864A (zh) * 2019-09-16 2021-04-30 北京迈格威科技有限公司 模型训练方法、目标检测方法、装置、设备及存储介质
WO2021114832A1 (zh) * 2020-05-28 2021-06-17 平安科技(深圳)有限公司 样本图像数据增强方法、装置、电子设备及存储介质
CN113139906A (zh) * 2021-05-13 2021-07-20 平安国际智慧城市科技股份有限公司 一种生成器的训练方法、装置与存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109509156A (zh) * 2018-10-31 2019-03-22 聚时科技(上海)有限公司 一种基于生成对抗模型的图像去雾处理方法
WO2020143592A1 (zh) * 2019-01-07 2020-07-16 鲁班嫡系机器人(深圳)有限公司 缺陷识别模型训练方法、装置、计算机设备和存储介质
CN112733864A (zh) * 2019-09-16 2021-04-30 北京迈格威科技有限公司 模型训练方法、目标检测方法、装置、设备及存储介质
CN111444952A (zh) * 2020-03-24 2020-07-24 腾讯科技(深圳)有限公司 样本识别模型的生成方法、装置、计算机设备和存储介质
CN111832605A (zh) * 2020-05-22 2020-10-27 北京嘀嘀无限科技发展有限公司 无监督图像分类模型的训练方法、装置和电子设备
WO2021114832A1 (zh) * 2020-05-28 2021-06-17 平安科技(深圳)有限公司 样本图像数据增强方法、装置、电子设备及存储介质
CN112215255A (zh) * 2020-09-08 2021-01-12 深圳大学 一种目标检测模型的训练方法、目标检测方法及终端设备
CN113139906A (zh) * 2021-05-13 2021-07-20 平安国际智慧城市科技股份有限公司 一种生成器的训练方法、装置与存储介质

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114677541A (zh) * 2022-03-23 2022-06-28 成都智元汇信息技术股份有限公司 一种基于目标提取黏合样本集的方法及***
CN114677541B (zh) * 2022-03-23 2023-04-28 成都智元汇信息技术股份有限公司 一种基于目标提取黏合样本集的方法及***
CN114397306A (zh) * 2022-03-25 2022-04-26 南方电网数字电网研究院有限公司 一种电网均压环超复杂类别缺陷多阶段模型联合检测方法
CN115311262A (zh) * 2022-10-09 2022-11-08 南通如东依航电子研发有限公司 一种印刷电路板缺陷识别方法
CN116091873A (zh) * 2023-04-10 2023-05-09 宁德时代新能源科技股份有限公司 图像生成方法、装置、电子设备及存储介质
CN116091873B (zh) * 2023-04-10 2023-11-28 宁德时代新能源科技股份有限公司 图像生成方法、装置、电子设备及存储介质
CN117372791A (zh) * 2023-12-08 2024-01-09 齐鲁空天信息研究院 细粒度定向能毁伤区域检测方法、装置及存储介质
CN117372791B (zh) * 2023-12-08 2024-03-22 齐鲁空天信息研究院 细粒度定向能毁伤区域检测方法、装置及存储介质
CN117437425A (zh) * 2023-12-21 2024-01-23 深圳思谋信息科技有限公司 语义分割方法、装置、计算机设备及计算机可读存储介质
CN117437425B (zh) * 2023-12-21 2024-03-22 深圳思谋信息科技有限公司 语义分割方法、装置、计算机设备及计算机可读存储介质
CN117649406A (zh) * 2024-01-29 2024-03-05 宁德时代新能源科技股份有限公司 密封钉焊接缺陷检测方法、装置、设备及存储介质
CN117649406B (zh) * 2024-01-29 2024-06-07 宁德时代新能源科技股份有限公司 密封钉焊接缺陷检测方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN113610787A (zh) 图像缺陷检测模型的训练方法、装置、计算机设备
CN110136103B (zh) 医学影像解释方法、装置、计算机设备及存储介质
Cheng et al. High-quality proposals for weakly supervised object detection
Agbo-Ajala et al. Deeply learned classifiers for age and gender predictions of unfiltered faces
US8379994B2 (en) Digital image analysis utilizing multiple human labels
Makkar et al. Analogizing time complexity of KNN and CNN in recognizing handwritten digits
Bose et al. Efficient inception V2 based deep convolutional neural network for real‐time hand action recognition
CN111027576B (zh) 基于协同显著性生成式对抗网络的协同显著性检测方法
Dong et al. Automatic aerospace weld inspection using unsupervised local deep feature learning
CN112001488A (zh) 训练生成型对抗性网络
CN112966088B (zh) 未知意图的识别方法、装置、设备及存储介质
Shon et al. Unsupervised pre-training of imbalanced data for identification of wafer map defect patterns
CN106599864A (zh) 一种基于极值理论的深度人脸识别方法
Wang et al. Hand-drawn electronic component recognition using deep learning algorithm
CN112100377A (zh) 文本分类方法、装置、计算机设备和存储介质
Lv et al. Chinese character CAPTCHA recognition based on convolution neural network
CN117274768A (zh) 目标检测网络的训练方法、目标检测方法及相关装置
CN109101984B (zh) 一种基于卷积神经网络的图像识别方法及装置
CN113222002B (zh) 一种基于生成式鉴别性对比优化的零样本分类方法
Wang et al. Prototype-based intent perception
CN111401440B (zh) 目标分类识别方法、装置、计算机设备及存储介质
Mount et al. Unsupervised selection of optimal operating parameters for visual place recognition algorithms using Gaussian mixture models
CN116188445A (zh) 一种产品表面缺陷的检测定位方法、装置及终端设备
CN112380369B (zh) 图像检索模型的训练方法、装置、设备和存储介质
Gulshad et al. Hierarchical explanations for video action recognition

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination