CN112967251A - 图片检测方法、图片检测模型的训练方法及装置 - Google Patents
图片检测方法、图片检测模型的训练方法及装置 Download PDFInfo
- Publication number
- CN112967251A CN112967251A CN202110239211.0A CN202110239211A CN112967251A CN 112967251 A CN112967251 A CN 112967251A CN 202110239211 A CN202110239211 A CN 202110239211A CN 112967251 A CN112967251 A CN 112967251A
- Authority
- CN
- China
- Prior art keywords
- picture
- detected
- feature
- level
- detection model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 144
- 238000000034 method Methods 0.000 title claims abstract description 61
- 238000012549 training Methods 0.000 title claims abstract description 30
- 230000002159 abnormal effect Effects 0.000 claims abstract description 45
- 230000006870 function Effects 0.000 claims description 17
- 238000005457 optimization Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 14
- 238000013527 convolutional neural network Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 7
- 230000004913 activation Effects 0.000 claims description 3
- 238000005215 recombination Methods 0.000 claims description 3
- 230000006798 recombination Effects 0.000 claims description 3
- 238000013507 mapping Methods 0.000 abstract description 10
- 239000010410 layer Substances 0.000 description 42
- 238000010586 diagram Methods 0.000 description 15
- 230000008569 process Effects 0.000 description 13
- 230000000295 complement effect Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000005070 sampling Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 239000002356 single layer Substances 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Radiology & Medical Imaging (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Medical Informatics (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Quality & Reliability (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种图片检测方法、图片检测模型的训练方法及装置,涉及图片检测的技术领域,该图片检测方法包括:获取待测图片;将待测图片输入至预先建立的图片检测模型,以通过图片检测模型输出待测图片对应的重建图片;计算待测图片与重建图片的重建误差;基于重建误差对图片进行检测。本发明提供的图片检测方法、图片检测模型的训练方法及装置,由于图片检测模型配置有多层次特征空间及分布约束的自编码器网络结构,从而提高了从输入图片到特征空间的映射复杂性,使得异常样本更易落在正常样本的特征空间之外,减少正常样本跟异常样本之间的混淆,提高了异常检测的准确率。
Description
技术领域
本发明涉及图片检测的技术领域,尤其是涉及一种图片检测方法、图片检测模型的训练方法及装置。
背景技术
异常图片检测旨在识别、检测出给定图片集合中不符合预期模式或不同于数据集中其他正常图片的异常图片样本。在实际应用中,图片异常存在着无数种不同的情况,无法提前准确、全面地预测每一种可能出现的情况。
此外,数据集合中绝大多数都是正常样本,异常样本的数量相比之下十分稀少,正负样本的比例严重失衡且获得异常样本的成本非常高昂。因此,不同于一般的可以依靠大量标记训练数据以监督方式解决的计算机视觉任务,异常图片检测任务通常采用无监督的方式解决。
近年来,在无监督异常图片检测领域,主要使用的是基于图片重建的方法,但是这种方式通常仅考虑给定的图片样本在单一层次下的特征表示,难以对同一图片所具有的不同层次的信息进行充分考虑,因而也难以在单一层次特征空间中有效地区分正常样本和异常样本,易造成混淆,引发误判,降低异常检测的准确率。
发明内容
有鉴于此,本发明的目的在于提供一种图片检测方法、图片检测模型的训练方法及装置,以缓解上述技术问题。
第一方面,本发明实施例提供了一种图片检测方法,包括:获取待测图片;将所述待测图片输入至预先建立的图片检测模型,以通过所述图片检测模型输出所述待测图片对应的重建图片;其中,所述图片检测模型配置有多层次特征空间及分布约束的自编码器网络结构;计算所述待测图片与所述重建图片的重建误差;基于所述重建误差对所述图片进行检测。
优选地,在一种可能的实施方式中,上述多层次特征空间及分布约束的自编码器网络结构包括多层次自编码器结构以及多层次解码器结构,其中,所述多层次自编码器结构包括多层次特征空间;将所述待测图片输入至预先建立的图片检测模型,以通过所述图片检测模型输出所述待测图片对应的重建图片的步骤包括:将所述待测图片输入至所述多层次自编码器结构,通过所述多层次自编码器结构将所述待测图片嵌入到所述多层次特征空间,得到所述待测图片的特征分布;将所述待测图片的特征分布与所述多层次特征空间中预先配置的先验分布进行特征拟合;将特征拟合的结果输入至所述多层次解码器结构进行图片重组,以生成所述待测图片对应的重建图片。
优选地,在一种可能的实施方式中,上述多层次自编码器结构为基于卷积神经网络的编码器结构,且,所述多层次自编码器结构包括至少一个卷积结构,所述卷积结构包括预设卷积层和激活层,且,所述卷积层设置有预设的卷积核和步长;将所述待测图片输入至所述多层次自编码器结构,通过所述多层次自编码器结构将所述待测图片嵌入到所述多层次特征空间,得到所述待测图片的特征分布的步骤包括:将所述待测图片输入至所述多层次自编码器结构,通过至少一个所述卷积结构得到所述待测图片的层次特征信息;将所述层次特征信息嵌入至所述多层次特征空间,以得到所述待测图片的特征分布,其中,所述特征分布包括所述待测图片的低阶表示和所述待测图片的高阶表示。
优选地,在一种可能的实施方式中,上述多层次特征空间还包括高阶特征判别器和低阶特征判别器;将所述待测图片的特征分布与所述多层次特征空间中预先配置的先验分布进行特征拟合的步骤包括:将所述待测图片的特征分布中所包括的低阶表示输入至所述低阶特征判别器,以及,将所述待测图片的特征分布中所包括的高阶表示输入至所述高阶特征判别器;通过所述高阶特征判别器、所述低阶特征判别器和所述多层次特征空间中预先配置的先验分布对所述待测图片的特征分布进行拟合。
优选地,在一种可能的实施方式中,上述计算所述待测图片与所述重建图片的重建误差的步骤包括:分别计算所述待测图片和所述重建图片的第一范数距离,以及,所述待测图片和所述重建图片在所述多层次特征空间的第二范数距离;基于所述第一范数距离和所述第二范数距离计算所述待测图片与所述重建图片的重建误差。
优选地,在一种可能的实施方式中,上述第一范数距离和所述第二范数距离均为L2范数举例;所述重建误差表示为:
其中,Ei(·)表示由所述自编码器网络结构中的多层次自编码器结构的第i层的特征图所求得的特征表示,α和β表示权重超参数。
优选地,在一种可能的实施方式中,上述基于所述重建误差对所述图片进行检测的步骤包括:判断所述重建误差是否小于预先设置的误差阈值;如果是,确定所述待测图片为正常图片;如果否,确定所述待测图片为异常图片。
第二方面,本发明实施例还提供一种图片检测模型的训练方法,该图片检测模型配置有多层次特征空间及分布约束的自编码器网络结构;其中,所述多层次特征空间及分布约束的自编码器网络结构包括多层次自编码器结构以及多层次解码器结构,且,所述多层次自编码器结构包括多层次特征空间;该方法包括:获取预先建立的图片集,其中,所述图片集包括预设数量的正常图像样本;将所述正常图像样本输入至待训练的图片检测模型,对所述正常图像样本进行图片重建,得到所述正常图像样本对应的重建图像样本;计算所述正常图像样本和所述重建图像样本的损失函数;基于所述损失函数对所述待训练的图片检测模型的模型参数进行迭代优化,以对所述待训练的图片检测模型进行训练。
优选地,在一种可能的实施方式中,上述方法还包括:记录所述迭代优化的迭代次数;如果所述迭代次数达到预设的迭代阈值,则结束所述迭代优化;保存当前待训练的图片检测模型的模型参数。
第三方面,本发明实施例还提供了一种图片检测装置,包括:第一获取模块,用于获取待测图片;重建模块,用于将所述待测图片输入至预先建立的图片检测模型,以通过所述图片检测模型输出所述待测图片对应的重建图片;其中,所述图片检测模型配置有多层次特征空间及分布约束的自编码器网络结构;第一计算模块,用于计算所述待测图片与所述重建图片的重建误差;检测模块,用于基于所述重建误差对所述图片进行检测。
第四方面,本发明实施例还提供了一种图片检测模型的训练装置,所述图片检测模型配置有多层次特征空间及分布约束的自编码器网络结构;其中,所述多层次特征空间及分布约束的自编码器网络结构包括多层次自编码器结构以及多层次解码器结构,且,所述多层次自编码器结构包括多层次特征空间;该装置包括:第二获取模块,用于获取预先建立的图片集,其中,所述图片集包括预设数量的正常图像样本;输入模块,用于将所述正常图像样本输入至待训练的图片检测模型,对所述正常图像样本进行图片重建,得到所述正常图像样本对应的重建图像样本;第二计算模块,用于计算所述正常图像样本和所述重建图像样本的损失函数;优化模块,用于基于所述损失函数对所述待训练的图片检测模型的模型参数进行迭代优化,以对所述待训练的图片检测模型进行训练。
第五方面,本发明实施例还提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面和第二方面所述方法的步骤。
第六方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述第一方面和第二方面所述方法的步骤。
本发明实施例带来了以下有益效果:
本发明实施例提供的图片检测方法、图片检测模型的训练方法及装置,在进行图片检测时可以获取待测图片,将待测图片输入至预先建立的图片检测模型,以通过图片检测模型输出待测图片对应的重建图片,并计算待测图片与重建图片的重建误差;以便于基于重建误差对图片进行检测,而由于图片检测模型配置有多层次特征空间及分布约束的自编码器网络结构,使得在图片检测过程中可以利用多层次特征空间及分布约束的自编码器网络结构将输入的图片样本嵌入到多层次特征空间中以更准确地编码、区分不同的图片样本,从而提高了从输入图片到特征空间的映射复杂性,使得异常样本更易落在正常样本的特征空间之外,减少正常样本跟异常样本之间的混淆,提高了异常检测的准确率。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为一种所示无监督异常图片检测的示意图;
图2为本发明实施例提供的一种图片检测方法的流程图;
图3为本发明实施例提供的一种图片检测的过程示意图;
图4为本发明实施例提供的一种自编码器网络结构的示意图;
图5为本发明实施例提供的一种判别器结构示意图;
图6为本发明实施例提供的一种图片检测模型的训练方法的流程图;
图7为本发明实施例提供的一种图片检测装置的结构示意图;
图8为本发明实施例提供的一种图片检测模型的训练装置的结构示意图;
图9为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
目前,近年来,在无监督异常图片检测领域,主要使用基于图片重建的方法。该类方法多利用编码器-解码器的整体架构(如:自编码器,GAN(Generative AdversarialNetworks,生成式对抗网络))来学习正常图片样本的参数化地特征嵌入和图片重建,并通过计算和比较输入图片跟重建图片之间的重建误差来对异常样本进行检测。
为例便于理解,图1示出了一种所示无监督异常图片检测的示意图,该类方法主要包含编码器网络和解码器网络两个部分,即图1中简单示出的编码器和解码器。
具体地,编码器网络主要接受给定的待测图片样本(即图1中的输入图片)作为输入,通过一个卷积神经网络计算得到该样本的特征表示;解码器网络则以编码器输出的图片样本的特征表示作为输入,利用一个卷积神经网络以重建、生成输入的待测样本。在训练过程中,图1所示的模型仅能观察到正常样本,通过梯度下降算法来迭代地更新、优化模型的权重参数以最小化输入的正常样本跟重建的正常样本之间的损失函数,不断提高正常样本的重建质量,降低正常样本的重建误差,从而最终得到期望的重建模型。
具体而言,模型的损失函数定义了重建的正常图片跟输入的正常图片之间的相似程度,损失函数越小则表示两张图像越相似。给定训练好的模型,在测试过程中,由于该模型仅以正常样本作为输入进行训练,其参数无法准确地重建异常样本,使得异常样本将产生较高的重建误差,而正常样本将具有较低的重建误差。这样,利用上述差别,便可将计算得到的重建误差跟预设的阈值相比较以检测、区分出图片集合中的异常样本。
但是,上述方法通常仅考虑了给定的图片样本在单一层次下的特征表示,没有充分考虑同一图片所具有的不同层次的信息,如,底层的结构信息、高层的类别语义信息等等,因此,无法在单一层次特征空间中有效地区分正常样本和异常样本,易造成混淆,引发误判,降低异常检测的准确率。同时,上述方法对正常样本的特征表示的分布没有任何显式地先验约束,使得其自由度过大,难以编码得到紧实的特征空间,也难以有效地限制解码器的泛化能力。
基于此,本发明实施例提供的一种图片检测方法、图片检测模型的训练方法及装置,可以有效缓解上述问题。
为便于对本实施例进行理解,首先对本发明实施例所公开的一种图片检测方法进行详细介绍。
在一种可能的实施方式中,本发明实施例提供了一种图片检测方法,图2示出了一种图片检测方法的流程图,具体地,如图2所示,该方法包括以下步骤:
步骤S202,获取待测图片;
步骤S204,将待测图片输入至预先建立的图片检测模型,以通过图片检测模型输出待测图片对应的重建图片;
其中,上述图片检测模型配置有多层次特征空间及分布约束的自编码器网络结构;
具体地,上述图片检测模型通常是基于神经网络模型实现的检测模型,且由于本发明实施例中使用的图片检测模型配置有多层次特征空间及分布约束的自编码器网络结构,使得本发明实施例在构建上述图片检测模型时,需同时构建自编码器网络结构所需的编码器网络和解码器网络,以及,自编码器网络结构对应的多层次特征空间,以便于在图片检测时,可以将输入的待测图片嵌入到一个具有互补的多层次结构的特征空间中,进而得到上述待测图片对应的重建图片。
步骤S206,计算上述待测图片与重建图片的重建误差;
步骤S208,基于重建误差对图片进行检测。
在实际使用时,上述重建误差也可以称为待测图片与重建图片的异常分数,通常,计算得到的重建误差主要表征待测图片与重建图片在原始像素空间和多层次特征空间下的相似性,有利于更好地区分正常样本和异常样本,进而提高异常检测性能,因此,利用上述重建误差可以实现对图片进行检测。具体地,上述步骤S208中,对图片进行检测时,可以判断重建误差是否小于预先设置的误差阈值;如果是,确定待测图片为正常图片;如果否,则确定待测图片为异常图片。
因此,本发明实施例提供的图片检测方法,在进行图片检测时可以获取待测图片,将待测图片输入至预先建立的图片检测模型,以通过图片检测模型输出待测图片对应的重建图片,并计算待测图片与重建图片的重建误差;以便于基于重建误差对图片进行检测,而由于图片检测模型配置有多层次特征空间及分布约束的自编码器网络结构,使得在图片检测过程中可以利用多层次特征空间及分布约束的自编码器网络结构将输入的图片样本嵌入到多层次特征空间中以更准确地编码、区分不同的图片样本,从而提高了从输入图片到特征空间的映射复杂性,使得异常样本更易落在正常样本的特征空间之外,减少正常样本跟异常样本之间的混淆,提高了异常检测的准确率。
在实际使用时,本发明实施例中的多层次特征空间及分布约束的自编码器网络结构包括多层次自编码器结构以及多层次解码器结构,其中,多层次自编码器结构还包括多层次特征空间;
具体地,考虑到卷积神经网络(CNN,Convolutional Neural Networks,卷积神经网络)所具有的金字塔形的特征层次结构,使得网络中不同层的特征图(feature map)可以包含输入图片的不同层次的信息。而通常,较浅层的特征图通常包含更多的低级结构信息,例如边缘,直线和拐角。同时,更深层的特征图通常捕获了更多的有关类别标签的高级语义信息。因此,网络不同层的特征实际上编码了输入图片不同层次的信息表示,并且低层和高层特征的互补性能够有效提高识别、区分不同图片样本的性能。因此,本发明实施例中自编码器网络结构所包括的多层次自编码器结构,可以将输入的图片样本嵌入到一个具有互补的层次结构的特征空间中以更准确地编码、区分不同的图片样本。换言之,多层次的特征空间提高了从输入图片到特征空间的映射复杂性,可以使得异常样本更易落在正常样本的特征空间之外。
基于上述理论,上述步骤S204中,通过图片检测模型输出重建图片的步骤可以包括以下过程:将待测图片输入至多层次自编码器结构,通过该多层次自编码器结构将待测图片嵌入到多层次特征空间,得到待测图片的特征分布;将待测图片的特征分布与多层次特征空间中预先配置的先验分布进行特征拟合;以将特征拟合的结果输入至多层次解码器结构进行图片重组,进而生成待测图片对应的重建图片。
为了便于理解,图3示出了本发明实施例提供的一种图片检测的过程示意图,具体地,图3中,自编码器网络结构为多层次自编码器结构,且,该多层次自编码器结构为基于卷积神经网络的编码器结构,且,多层次自编码器结构包括至少一个卷积结构,卷积结构包括预设卷积层和激活层,且,卷积层设置有预设的卷积核和步长;
具体地,由于自编码器网络结构包括多层次自编码器结构以及多层次解码器结构,因此,图3中示出了多层次自编码器结构和多层次解码器结构,其中,为了便于说明,图3中多层次自编码器结构简单表示为编码器,且,图3中仅简单示出了有限个卷积结构,包括预设的卷积层和激活层。
进一步,图3中的多层次解码器结构通常也简单表示为解码器,且,为了便于说明,图3中也简单示出了有限个解码器所包括的卷积结构,即有限数量个卷积层和激活层。图3中的中间部分则是多层次特征空间部分。
具体地,图4示出了一种可能的自编码器网络结构的示意图,包括多层次自编码器结构和多层次解码器结构,其中,图4中,示出了包含四个卷积层的编码器,且,图4中,以ConvDown模块表示其中一个卷积层,也即,图4中的编码器包括四个ConvDown模块,分别是ConvDown64、ConvDown128、ConvDown256和ConvDown512,其中,上述各个ConvDown模块后的数字则表示该ConvDown模块的卷积核的个数,通常,上述ConvDown模块可以对特征图进行空间下采样,同时还可以逐渐增加特征图的个数,减小空间分辨率,增加深度。并且,在实际使用时,每个ConvDown模块可以包含一个3x3(卷积核大小)且步长为2的卷积层,其后跟一个ReLU激活层,具体的ConvDown模块的设置方式和结构可以根据实际使用情况进行设置,本发明实施例对此不进行限制。
进一步,图4中,也示出了包括多个卷积结构的解码器,其中,图4中的解码器的卷积结构则包括多个ConvUp模块,多个ConvUp模块可以在空间上采样,同时逐渐减少特征图的个数,最终输出重建图片。其中,图4中解码器所包括的每个ConvUp模块也可以包含一个3x3(卷积核大小)且步长为2的反卷积层,其后跟一个ReLU激活层,具体的ConvUp模块的设置方式和结构也可以根据实际使用情况进行设置,本发明实施例对此不进行限制。
图4中中间部分则为全连接层通常用FC表示,即图4中的FC128、FC1024、FC256和FC2048,这部分的全连接层也称为特征嵌入部分,该特征嵌入部分通常以编码器网络较浅层和较深层的特征图分别作为输入,利用全连接层(FC)来分别地生成输入图片样本的低阶(low-level)和高阶(high-level)特征表示,其中,FC128、FC1024对应低阶的特征表示,FC256和FC2048则对应高阶的特征表示,后面数字表示全连接层的参数,具体可以根据实际使用情况进行设置,本发明实施例对此不进行限制。
因此,基于图4所示的网络结构,利用该自编码器网络结构得到待测图片的特征分布的步骤则包括一下过程:
将待测图片输入至多层次自编码器结构,即输入至图3和图4中左侧的多层次自编码器结构(编码器),通过至少一个卷积结构得到待测图片的层次特征信息;将层次特征信息嵌入至多层次特征空间,以得到待测图片的特征分布,其中,特征分布包括待测图片的低阶表示和待测图片的高阶表示。
通常,低阶表示包括待测图片的低级结构信息,例如边缘,直线和拐角等等,高阶表示则包括待测图片的高级结构信息,如更多有关类别标签的高级语义信息等等。当编码器将上述待测图片嵌入到多层次特征空间,得到待测图片的特征分布后,则可以将待测图片的特征分布与多层次特征空间中预先配置的先验分布进行特征拟合。
具体地,为了便于对待测图片的特征分布与多层次特征空间中预先配置的先验分布进行特征拟合,本发明实施例中的多层次特征空间还包括高阶特征判别器和低阶特征判别器;即,图3中所示的高阶特征判别器和低阶特征判别器,在进行特征拟合时,需要将待测图片的特征分布中所包括的低阶表示输入至低阶特征判别器,以及,将待测图片的特征分布中所包括的高阶表示输入至高阶特征判别器;然后通过高阶特征判别器、低阶特征判别器和多层次特征空间中预先配置的先验分布对待测图片的特征分布进行拟合。
在实际使用时,上述预先配置的先验分布可以是正态分布,例如,可以是标准正态分布N(0,1),以显式地约束、控制正常样本的特征分布。在其他实施方式中,上述预先配置的先验分布还可以是其他的形式,具体以实际使用为准,本发明实施例对此不进行限制。
上述通过在嵌入的多层次特征空间中引入一系列特征判别器,如上述高阶特征判别器和低阶特征判别器,来实现上述特征拟合的过程,旨在正确区分从输入的正常样本由编码器网络编码得到的特征表示以及从先验的正态分布中随机采样得到的特征表示;同时,编码器网络则要尽可能地使其编码结果模仿、接近从先验的正态分布中采样得到的结果,以欺骗特征判别器。基于上述过程,两个网络相互对抗、不断迭代优化、调整各自参数,最终使得特征判别器网络无法准确判断编码器网络的输出结果的真实来源。
综上,基于上述图3所示自编码器网络结构的示意图,在进行图片检测时,可以使用自编码器网络结构来分别地学习正常图片样本的参数化地特征嵌入和特征重建,并通过计算、比较输入图片跟重建图片之间的重建误差来对异常样本进行检测、区分。具体而言,自编码器网络结构包含多层次自编码器结构和多层次解码器结构两个部分。其中,多层次自编码器结构负责将输入的待测图片嵌入到一个具有互补的层次结构的特征空间中,得到待测图片的特征分布,同时将待测图片的特征分布与多层次特征空间中预先配置的先验分布进行特征拟合;多层次解码器结构,即上述解码器,则旨在相应地学习从该先验特征空间到正常图片空间的特定映射,生成重建图片,进而计算得到重建误差以实现基于阈值比较的异常检测。
并且,本发明实施例中,考虑到自编码器网络结构的卷积神经网络不同层的特征实际上编码了输入图片(如上述待测图片)的不同层次的身份信息,并且低层和高层特征的互补能够有效地提高识别、区分不同图片样本的性能。因此,上述图3中所示的自编码器网络结构,可以将输入的图片样本嵌入到一个具有互补的多层次结构的特征空间中,该多层次的特征空间提高了从输入图片到特征空间的映射复杂性,使得异常样本更易落在正常图片样本的特征空间之外。
此外,上述多层次特征空间中预先配置的先验分布,一方面可以有效提高编码得到的正常样本特征空间的紧凑度,降低将异常样本映射到正常样本特征空间而引发混淆的可能性和偶然性;另一方面,一旦定义了这样一个参数化的先验特征空间,上述多层次解码器结构(即,解码器网络)将相应地随之学习从该参数化的先验特征空间到正常图片空间的特定映射,而不是从其他所有可能的未指定的混合特征空间学习,从而将解码器的泛化能力限制在有界的流形范围内,有效抑制网络对异常样本的泛化性能,使异常样本更易产生较高的重建误差。
为了便于理解,图5示出了一种判别器结构示意图,如图5所示,分别包括高阶特征判别器和低阶特征判别器,两者的结构类似,仅在全连接层FC的参数有所不同,在实际使用时,上述高阶特征判别器和低阶特征判别器的作用主要是判断给定的特征表示是否是“真实的”,即区分由编码器网络编码得到的特征表示(fake)和从先验的正态分布中随机采样得到的特征表示(real)。通常编码器由多个全连接层,即,FC层构成,其输入是特定的特征表示,其输出为一个标量,代表了该特征表示是“真实”(即,不是由编码器编码得到)的概率。将上述判别器嵌入到图3所示的多层次特征空间中,以正确区分从输入的正常样本由编码器网络编码得到的特征表示以及从先验的正态分布中随机采样得到的特征表示,进而输出对应的重建图片,进行后续的重建误差的计算。
进一步,本发明实施例中,在进行重建误差的计算时,通常是分别计算待测图片和重建图片的第一范数距离,以及,待测图片和重建图片在多层次特征空间的第二范数距离;然后基于该第一范数距离和第二范数距离计算待测图片与重建图片的重建误差。
具体地,第一范数距离和第二范数距离均为L2范数举例;上述重建误差表示为:
基于上述自编码器网络结构,本发明实施例提供的图片检测方法,可以利用多层次的自编码器结构将输入的图片样本嵌入到一个具有互补的层次结构的特征空间中以更准确地编码、区分不同的图片样本,从而提高了从输入图片到特征空间的映射复杂性,使得异常样本更易落在正常样本的特征空间之外,减少正常样本跟异常样本之间的混淆,提高了异常检测的准确率。
并且,在图片检测过程中,可以显式地约束正常样本的特征分布,有效提高了编码得到的正常样本特征空间的紧凑度,减少了将异常样本映射到正常样本特征空间的可能性同时限制了解码器的泛化能力,进一步提升了异常检测的性能。
在实际使用时,上述图片检测模型可以通过对抗训练的方法得到,因此,本发明实施例中还提供了一种图片检测模型的训练方法,且该图片检测模型配置有多层次特征空间及分布约束的自编码器网络结构。
其中,上述多层次特征空间及分布约束的自编码器网络结构包括多层次自编码器结构以及多层次解码器结构,且,多层次自编码器结构包括多层次特征空间。
具体地,如图6所示的一种图片检测模型的训练方法的流程图,该方法包括以下步骤:
步骤S602,获取预先建立的图片集,其中,图片集包括预设数量的正常图像样本;
步骤S604,将正常图像样本输入至待训练的图片检测模型,对正常图像样本进行图片重建,得到正常图像样本对应的重建图像样本;
步骤S606,计算正常图像样本和重建图像样本的损失函数;
步骤S608,基于损失函数对待训练的图片检测模型的模型参数进行迭代优化,以对待训练的图片检测模型进行训练。
进一步,在迭代优化过程中还需记录迭代优化的迭代次数;如果迭代次数达到预设的迭代阈值,则结束迭代优化;保存当前待训练的图片检测模型的模型参数。
在实际使用时,通过上述方法训练得到的图片检测模型可以在图片检测中进行调用,具体地,可以记载上述图片检测模型的模型参数进行图片检测,然后输入待测的正常或异常图片,此时,图片检测模型可以根据输入的待测图片生成相应的重建图片,进而计算重建误差,跟预先设置的误差阈值相比较以检测出异常图片。
在上述实施方式的基础上,本发明实施例还提供了一种图片检测装置,如图7所示的一种图片检测装置的结构示意图,该装置包括:
第一获取模块70,用于获取待测图片;
重建模块72,用于将所述待测图片输入至预先建立的图片检测模型,以通过所述图片检测模型输出所述待测图片对应的重建图片;其中,所述图片检测模型配置有多层次特征空间及分布约束的自编码器网络结构;
第一计算模块74,用于计算所述待测图片与所述重建图片的重建误差;
检测模块76,用于基于所述重建误差对所述图片进行检测。
进一步,本发明实施例还提供了一种图片检测模型的训练装置,该图片检测模型配置有多层次特征空间及分布约束的自编码器网络结构;且,所述多层次特征空间及分布约束的自编码器网络结构包括多层次自编码器结构以及多层次解码器结构,且,所述多层次自编码器结构包括多层次特征空间;具体地,如图8所示的一种图片检测模型的训练装置的结构示意图,该装置包括:
第二获取模块80,用于获取预先建立的图片集,其中,所述图片集包括预设数量的正常图像样本;
输入模块82,用于将所述正常图像样本输入至待训练的图片检测模型,对所述正常图像样本进行图片重建,得到所述正常图像样本对应的重建图像样本;
第二计算模块84,用于计算所述正常图像样本和所述重建图像样本的损失函数;
优化模块86,用于基于所述损失函数对所述待训练的图片检测模型的模型参数进行迭代优化,以对所述待训练的图片检测模型进行训练。
本发明实施例提供的种图片检测装置和图片检测模型的训练装置,与上述实施例提供的图片检测方法和图片检测模型的训练方法具有相同的技术特征,所以也能解决相同的技术问题,达到相同的技术效果。
本发明实施例还提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述方法的步骤。
进一步,本发明实施例还提供了一种电子设备的结构示意图,如图9所示,为该电子设备的结构示意图,其中,该电子设备包括处理器91和存储器90,该存储器90存储有能够被该处理器91执行的计算机可执行指令,该处理器91执行该计算机可执行指令以实现上述图片检测方法或者图片检测模型的训练方法。
在图9示出的实施方式中,该电子设备还包括总线92和通信接口93,其中,处理器91、通信接口93和存储器90通过总线92连接。
其中,存储器90可能包含高速随机存取存储器(RAM,Random Access Memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口93(可以是有线或者无线)实现该***网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。总线92可以是ISA(IndustryStandard Architecture,工业标准体系结构)总线、PCI(Peripheral ComponentInterconnect,外设部件互连标准)总线或EISA(Extended Industry StandardArchitecture,扩展工业标准结构)总线等。所述总线92可以分为地址总线、数据总线、控制总线等。为便于表示,图9中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
处理器91可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器91中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器91可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital SignalProcessor,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器91读取存储器中的信息,结合其硬件完成前述实施例的图片检测方法或者图片检测模型的训练方法。
本发明实施例所提供的图片检测方法、图片检测模型的训练方法及装置的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
另外,在本发明实施例的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (13)
1.一种图片检测方法,其特征在于,包括:
获取待测图片;
将所述待测图片输入至预先建立的图片检测模型,以通过所述图片检测模型输出所述待测图片对应的重建图片;其中,所述图片检测模型配置有多层次特征空间及分布约束的自编码器网络结构;
计算所述待测图片与所述重建图片的重建误差;
基于所述重建误差对所述图片进行检测。
2.根据权利要求1所述的方法,其特征在于,所述多层次特征空间及分布约束的自编码器网络结构包括多层次自编码器结构以及多层次解码器结构,其中,所述多层次自编码器结构包括多层次特征空间;
将所述待测图片输入至预先建立的图片检测模型,以通过所述图片检测模型输出所述待测图片对应的重建图片的步骤包括:
将所述待测图片输入至所述多层次自编码器结构,通过所述多层次自编码器结构将所述待测图片嵌入到所述多层次特征空间,得到所述待测图片的特征分布;
将所述待测图片的特征分布与所述多层次特征空间中预先配置的先验分布进行特征拟合;
将特征拟合的结果输入至所述多层次解码器结构进行图片重组,以生成所述待测图片对应的重建图片。
3.根据权利要求2所述的方法,其特征在于,所述多层次自编码器结构为基于卷积神经网络的编码器结构,且,所述多层次自编码器结构包括至少一个卷积结构,所述卷积结构包括预设卷积层和激活层,且,所述卷积层设置有预设的卷积核和步长;
将所述待测图片输入至所述多层次自编码器结构,通过所述多层次自编码器结构将所述待测图片嵌入到所述多层次特征空间,得到所述待测图片的特征分布的步骤包括:
将所述待测图片输入至所述多层次自编码器结构,通过至少一个所述卷积结构得到所述待测图片的层次特征信息;
将所述层次特征信息嵌入至所述多层次特征空间,以得到所述待测图片的特征分布,其中,所述特征分布包括所述待测图片的低阶表示和所述待测图片的高阶表示。
4.根据权利要求3所述的方法,其特征在于,所述多层次特征空间还包括高阶特征判别器和低阶特征判别器;
将所述待测图片的特征分布与所述多层次特征空间中预先配置的先验分布进行特征拟合的步骤包括:
将所述待测图片的特征分布中所包括的低阶表示输入至所述低阶特征判别器,以及,将所述待测图片的特征分布中所包括的高阶表示输入至所述高阶特征判别器;
通过所述高阶特征判别器、所述低阶特征判别器和所述多层次特征空间中预先配置的先验分布对所述待测图片的特征分布进行拟合。
5.根据权利要求1所述的方法,其特征在于,计算所述待测图片与所述重建图片的重建误差的步骤包括:
分别计算所述待测图片和所述重建图片的第一范数距离,以及,所述待测图片和所述重建图片在所述多层次特征空间的第二范数距离;
基于所述第一范数距离和所述第二范数距离计算所述待测图片与所述重建图片的重建误差。
7.根据权利要求1所述的方法,其特征在于,基于所述重建误差对所述图片进行检测的步骤包括:
判断所述重建误差是否小于预先设置的误差阈值;
如果是,确定所述待测图片为正常图片;
如果否,确定所述待测图片为异常图片。
8.一种图片检测模型的训练方法,其特征在于,所述图片检测模型配置有多层次特征空间及分布约束的自编码器网络结构;
其中,所述多层次特征空间及分布约束的自编码器网络结构包括多层次自编码器结构以及多层次解码器结构,且,所述多层次自编码器结构包括多层次特征空间;
所述方法包括:
获取预先建立的图片集,其中,所述图片集包括预设数量的正常图像样本;
将所述正常图像样本输入至待训练的图片检测模型,对所述正常图像样本进行图片重建,得到所述正常图像样本对应的重建图像样本;
计算所述正常图像样本和所述重建图像样本的损失函数;
基于所述损失函数对所述待训练的图片检测模型的模型参数进行迭代优化,以对所述待训练的图片检测模型进行训练。
9.根据权利要求8所述的方法,其特征在于,所述方法还包括:
记录所述迭代优化的迭代次数;
如果所述迭代次数达到预设的迭代阈值,则结束所述迭代优化;
保存当前待训练的图片检测模型的模型参数。
10.一种图片检测装置,其特征在于,包括:
第一获取模块,用于获取待测图片;
重建模块,用于将所述待测图片输入至预先建立的图片检测模型,以通过所述图片检测模型输出所述待测图片对应的重建图片;其中,所述图片检测模型配置有多层次特征空间及分布约束的自编码器网络结构;
第一计算模块,用于计算所述待测图片与所述重建图片的重建误差;
检测模块,用于基于所述重建误差对所述图片进行检测。
11.一种图片检测模型的训练装置,其特征在于,所述图片检测模型配置有多层次特征空间及分布约束的自编码器网络结构;
其中,所述多层次特征空间及分布约束的自编码器网络结构包括多层次自编码器结构以及多层次解码器结构,且,所述多层次自编码器结构包括多层次特征空间;
所述装置包括:
第二获取模块,用于获取预先建立的图片集,其中,所述图片集包括预设数量的正常图像样本;
输入模块,用于将所述正常图像样本输入至待训练的图片检测模型,对所述正常图像样本进行图片重建,得到所述正常图像样本对应的重建图像样本;
第二计算模块,用于计算所述正常图像样本和所述重建图像样本的损失函数;
优化模块,用于基于所述损失函数对所述待训练的图片检测模型的模型参数进行迭代优化,以对所述待训练的图片检测模型进行训练。
12.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1-9任一项所述方法的步骤。
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述权利要求1-9任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110239211.0A CN112967251B (zh) | 2021-03-03 | 2021-03-03 | 图片检测方法、图片检测模型的训练方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110239211.0A CN112967251B (zh) | 2021-03-03 | 2021-03-03 | 图片检测方法、图片检测模型的训练方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112967251A true CN112967251A (zh) | 2021-06-15 |
CN112967251B CN112967251B (zh) | 2024-06-04 |
Family
ID=76276550
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110239211.0A Active CN112967251B (zh) | 2021-03-03 | 2021-03-03 | 图片检测方法、图片检测模型的训练方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112967251B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113379729A (zh) * | 2021-07-02 | 2021-09-10 | 四川启睿克科技有限公司 | 一种图像微小异常检测方法、装置及计算机可读存储介质 |
CN113592769A (zh) * | 2021-06-23 | 2021-11-02 | 腾讯医疗健康(深圳)有限公司 | 异常图像的检测、模型的训练方法、装置、设备及介质 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106126581A (zh) * | 2016-06-20 | 2016-11-16 | 复旦大学 | 基于深度学习的手绘草图图像检索方法 |
CN106408017A (zh) * | 2016-09-13 | 2017-02-15 | 天津大学 | 基于深度学习的超生颈动脉内中膜厚度测量装置和方法 |
CN109146988A (zh) * | 2018-06-27 | 2019-01-04 | 南京邮电大学 | 基于vaegan的非完全投影ct图像重建方法 |
US20190130212A1 (en) * | 2017-10-30 | 2019-05-02 | Nec Laboratories America, Inc. | Deep Network Embedding with Adversarial Regularization |
CN110555474A (zh) * | 2019-08-28 | 2019-12-10 | 上海电力大学 | 一种基于半监督学习的光伏面板故障检测方法 |
CN110751630A (zh) * | 2019-09-30 | 2020-02-04 | 山东信通电子股份有限公司 | 基于深度学习的输电线路异物检测方法、装置及介质 |
CN111080511A (zh) * | 2019-11-18 | 2020-04-28 | 杭州时光坐标影视传媒股份有限公司 | 一种端到端的高分辨率多特征提取的人脸交换方法 |
CN111242906A (zh) * | 2020-01-06 | 2020-06-05 | 杭州电子科技大学 | 一种支持向量数据描述的胸部影像异常检测方法 |
US20200193604A1 (en) * | 2018-12-17 | 2020-06-18 | Nvidia Corporation | Encoder Regularization of a Segmentation Model |
CN111402179A (zh) * | 2020-03-12 | 2020-07-10 | 南昌航空大学 | 结合对抗自编码器和生成对抗网络的图像合成方法及*** |
CN112036513A (zh) * | 2020-11-04 | 2020-12-04 | 成都考拉悠然科技有限公司 | 基于内存增强潜在空间自回归的图像异常检测方法 |
CN112101426A (zh) * | 2020-08-26 | 2020-12-18 | 东南大学 | 基于自编码器的无监督学习图像异常检测方法 |
CN112165464A (zh) * | 2020-09-15 | 2021-01-01 | 江南大学 | 一种基于深度学习的工控混合入侵检测方法 |
CN112435258A (zh) * | 2020-12-17 | 2021-03-02 | 深圳市华汉伟业科技有限公司 | 一种图像检测模型的构建方法、图像检测方法及装置 |
-
2021
- 2021-03-03 CN CN202110239211.0A patent/CN112967251B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106126581A (zh) * | 2016-06-20 | 2016-11-16 | 复旦大学 | 基于深度学习的手绘草图图像检索方法 |
CN106408017A (zh) * | 2016-09-13 | 2017-02-15 | 天津大学 | 基于深度学习的超生颈动脉内中膜厚度测量装置和方法 |
US20190130212A1 (en) * | 2017-10-30 | 2019-05-02 | Nec Laboratories America, Inc. | Deep Network Embedding with Adversarial Regularization |
CN109146988A (zh) * | 2018-06-27 | 2019-01-04 | 南京邮电大学 | 基于vaegan的非完全投影ct图像重建方法 |
US20200193604A1 (en) * | 2018-12-17 | 2020-06-18 | Nvidia Corporation | Encoder Regularization of a Segmentation Model |
CN110555474A (zh) * | 2019-08-28 | 2019-12-10 | 上海电力大学 | 一种基于半监督学习的光伏面板故障检测方法 |
CN110751630A (zh) * | 2019-09-30 | 2020-02-04 | 山东信通电子股份有限公司 | 基于深度学习的输电线路异物检测方法、装置及介质 |
CN111080511A (zh) * | 2019-11-18 | 2020-04-28 | 杭州时光坐标影视传媒股份有限公司 | 一种端到端的高分辨率多特征提取的人脸交换方法 |
CN111242906A (zh) * | 2020-01-06 | 2020-06-05 | 杭州电子科技大学 | 一种支持向量数据描述的胸部影像异常检测方法 |
CN111402179A (zh) * | 2020-03-12 | 2020-07-10 | 南昌航空大学 | 结合对抗自编码器和生成对抗网络的图像合成方法及*** |
CN112101426A (zh) * | 2020-08-26 | 2020-12-18 | 东南大学 | 基于自编码器的无监督学习图像异常检测方法 |
CN112165464A (zh) * | 2020-09-15 | 2021-01-01 | 江南大学 | 一种基于深度学习的工控混合入侵检测方法 |
CN112036513A (zh) * | 2020-11-04 | 2020-12-04 | 成都考拉悠然科技有限公司 | 基于内存增强潜在空间自回归的图像异常检测方法 |
CN112435258A (zh) * | 2020-12-17 | 2021-03-02 | 深圳市华汉伟业科技有限公司 | 一种图像检测模型的构建方法、图像检测方法及装置 |
Non-Patent Citations (3)
Title |
---|
JILIN TANG, ET AL.: "Pose Guided Global and Local GAN for Appearance Preserving Human Video Prediction", 2019 IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING, pages 614 - 618 * |
赵永健等: "基于深度架构网络的矮新星自动分类研究", 光谱学与光谱分析, vol. 40, no. 2, pages 656 - 660 * |
黄成兵;: "一种多层次分布式数据挖掘方法的改进研究", 现代电子技术, no. 09 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113592769A (zh) * | 2021-06-23 | 2021-11-02 | 腾讯医疗健康(深圳)有限公司 | 异常图像的检测、模型的训练方法、装置、设备及介质 |
CN113592769B (zh) * | 2021-06-23 | 2024-04-12 | 腾讯医疗健康(深圳)有限公司 | 异常图像的检测、模型的训练方法、装置、设备及介质 |
CN113379729A (zh) * | 2021-07-02 | 2021-09-10 | 四川启睿克科技有限公司 | 一种图像微小异常检测方法、装置及计算机可读存储介质 |
CN113379729B (zh) * | 2021-07-02 | 2023-07-25 | 四川启睿克科技有限公司 | 一种图像微小异常检测方法、装置及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112967251B (zh) | 2024-06-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107111782B (zh) | 神经网络结构及其方法 | |
WO2022095645A1 (zh) | 基于内存增强潜在空间自回归的图像异常检测方法 | |
CN111027576B (zh) | 基于协同显著性生成式对抗网络的协同显著性检测方法 | |
CN112967251B (zh) | 图片检测方法、图片检测模型的训练方法及装置 | |
CN114667522A (zh) | 将数据样本转换为正常数据 | |
CN112446869A (zh) | 基于深度学习的无监督工业品缺陷检测方法及装置 | |
CN114170184A (zh) | 一种基于嵌入特征向量的产品图像异常检测方法及装置 | |
CN115184054B (zh) | 机械设备半监督故障检测分析方法、装置、终端及介质 | |
CN112802076A (zh) | 反射图像生成模型及反射去除模型的训练方法 | |
CN113554630A (zh) | 芯片表面缺陷检测方法、***、计算机设备和存储介质 | |
CN117036271A (zh) | 生产线质量监测方法及其*** | |
CN113487223B (zh) | 一种基于信息融合的风险评估方法和评估*** | |
CN113723294B (zh) | 数据处理方法、装置及对象识别方法、装置 | |
CN114821299A (zh) | 一种遥感图像变化检测方法 | |
CN101923632B (zh) | Maxi Code条码解码芯片及其解码方法 | |
CN113592842A (zh) | 一种基于深度学习的样本血清质量识别方法及识别设备 | |
CN113469167A (zh) | 仪表读数识别方法、装置、设备及存储介质 | |
CN117191816A (zh) | 基于多光谱融合的电子元器件表面缺陷检测方法和装置 | |
CN116563243A (zh) | 输电线路的异物检测方法、装置、计算机设备和存储介质 | |
CN116503376A (zh) | 生态挡土墙砌块及其智能化制备方法 | |
CN114186583B (zh) | 一种储油罐罐壁腐蚀检测异常信号恢复方法及*** | |
CN113033817B (zh) | 基于隐空间的ood检测方法、装置、服务器及存储介质 | |
CN115512203A (zh) | 信息检测方法、装置、设备及存储介质 | |
CN115878391A (zh) | 磁盘异常的检测方法及装置 | |
CN114596245A (zh) | 一种图像重构模型的生成方法和计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |