CN117523323B - 一种生成图像的检测方法及装置 - Google Patents
一种生成图像的检测方法及装置 Download PDFInfo
- Publication number
- CN117523323B CN117523323B CN202410010345.9A CN202410010345A CN117523323B CN 117523323 B CN117523323 B CN 117523323B CN 202410010345 A CN202410010345 A CN 202410010345A CN 117523323 B CN117523323 B CN 117523323B
- Authority
- CN
- China
- Prior art keywords
- image
- reconstructed
- generated
- real
- partial
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims description 26
- 238000012545 processing Methods 0.000 claims abstract description 87
- 230000000694 effects Effects 0.000 claims abstract description 71
- 238000013145 classification model Methods 0.000 claims abstract description 59
- 238000000034 method Methods 0.000 claims abstract description 50
- 230000006870 function Effects 0.000 claims description 16
- 238000012549 training Methods 0.000 claims description 11
- 230000008447 perception Effects 0.000 claims description 3
- 230000000875 corresponding effect Effects 0.000 description 79
- 238000010586 diagram Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 9
- 238000004590 computer program Methods 0.000 description 8
- 238000009792 diffusion process Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 8
- 230000006872 improvement Effects 0.000 description 8
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 230000000442 meristematic effect Effects 0.000 description 1
- 238000010422 painting Methods 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 229920001296 polysiloxane Polymers 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 239000010979 ruby Substances 0.000 description 1
- 229910001750 ruby Inorganic materials 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/761—Proximity, similarity or dissimilarity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本说明书一个或多个实施例公开了一种生成图像的检测方法及装置,该方法首先获取目标图像,其次从目标图像中选取部分图像,并基于目标图像中除部分图像之外的剩余图像对部分图像进行重构处理,获取剩余图像和重构的部分图像所组成的重构图像,然后将重构图像输入预先训练的分类模型,得到重构图像的重构效果类别,最后根据重构图像的重构效果类别,确定目标图像是真实图像或生成图像。
Description
技术领域
本文件涉及图像识别技术领域,尤其涉及一种生成图像的检测方法及装置。
背景技术
随着人工智能技术的发展,各种生成模型的应用越来越广泛,例如:利用文生图大模型,能够基于一段文本生成对应图像。基于扩散模型的生成模型能够使所生成的图像质量得到质的提升。因此,各种开源社区支持用户基于不同的开源生成模型进行相关创作。
然而,生成模型的广泛应用也带来相应的影响,一方面基于文生图技术生成的图像会造成一些侵权风险,如:基于文生图大模型生成的名人照片、名家画作,会涉及艺术创作者的著作权或版权问题;另一方面基于图生图技术生成的图像可能会造成数据安全性问题,影响真实有效信息的传播,如:图生图技术可能会被用于对真实图像进行风格化、编辑等操作,所生成的图像可能会被用于图片认证相关的非法操作。随着人们对自己的隐私数据越来越重视,以及对生成图像的合规性要求,亟需提供一种生成图像的检测方法,从而及时识别出生成图像。
发明内容
一方面,本说明书一个或多个实施例提供一种生成图像的检测方法,包括:获取目标图像,所述目标图像包括真实图像和/或生成图像,所述真实图像是基于图像采集设备拍摄的图像,所述生成图像是基于预设的条件生成的图像;从所述目标图像中选取部分图像,并基于所述目标图像中除所述部分图像之外的剩余图像对所述部分图像进行重构处理,获取所述剩余图像和重构的部分图像所组成的重构图像;将所述重构图像输入预先训练的分类模型,得到所述重构图像的重构效果类别,所述分类模型用于根据真实图像及其对应的重构图像之间的第一重构误差以及生成图像及其对应的重构图像之间的第二重构误差,对所述真实图像对应的重构图像和生成图像对应的重构图像进行分类;根据所述重构图像的重构效果类别,确定所述目标图像是真实图像或生成图像。
另一方面,本说明书一个或多个实施例提供一种生成图像的检测装置,包括:图像获取模块,获取目标图像,所述目标图像包括真实图像和/或生成图像,所述真实图像是基于图像采集设备拍摄的图像,所述生成图像是基于预设的条件生成的图像;图像填充处理模块,从所述目标图像中选取部分图像,并基于所述目标图像中除所述部分图像之外的剩余图像对所述部分图像进行重构处理,获取所述剩余图像和重构的部分图像所组成的重构图像;分类模块,将所述重构图像输入预先训练的分类模型,得到所述重构图像的重构效果类别,所述分类模型用于根据真实图像及其对应的重构图像之间的第一重构误差以及生成图像及其对应的重构图像之间的第二重构误差,对所述真实图像对应的重构图像和生成图像对应的重构图像进行分类;生成图像确定模块,根据所述重构图像的重构效果类别,确定所述目标图像是真实图像或生成图像。
再一方面,本说明书一个或多个实施例提供一种电子设备,包括:处理器;以及被安排成存储计算机可执行指令的存储器,在所述可执行指令被执行时,能够使得所述处理器:获取目标图像,所述目标图像包括真实图像和/或生成图像,所述真实图像是基于图像采集设备拍摄的图像,所述生成图像是基于预设的条件生成的图像;从所述目标图像中选取部分图像,并基于所述目标图像中除所述部分图像之外的剩余图像对所述部分图像进行重构处理,获取所述剩余图像和重构的部分图像所组成的重构图像;将所述重构图像输入预先训练的分类模型,得到所述重构图像的重构效果类别,所述分类模型用于根据真实图像及其对应的重构图像之间的第一重构误差以及生成图像及其对应的重构图像之间的第二重构误差,对所述真实图像对应的重构图像和生成图像对应的重构图像进行分类;根据所述重构图像的重构效果类别,确定所述目标图像是真实图像或生成图像。
再一方面,本说明书一个或多个实施例提供存储介质,用于存储计算机程序,所属计算机程序能够被处理器执行以实现以下流程:获取目标图像,所述目标图像包括真实图像和/或生成图像,所述真实图像是基于图像采集设备拍摄的图像,所述生成图像是基于预设的条件生成的图像;从所述目标图像中选取部分图像,并基于所述目标图像中除所述部分图像之外的剩余图像对所述部分图像进行重构处理,获取所述剩余图像和重构的部分图像所组成的重构图像;将所述重构图像输入预先训练的分类模型,得到所述重构图像的重构效果类别,所述分类模型用于根据真实图像及其对应的重构图像之间的第一重构误差以及生成图像及其对应的重构图像之间的第二重构误差,对所述真实图像对应的重构图像和生成图像对应的重构图像进行分类;根据所述重构图像的重构效果类别,确定所述目标图像是真实图像或生成图像。
附图说明
为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书一个或多个实施例中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本说明书一实施例的一种生成图像的检测方法的示意性流程图;
图2是根据本说明书一实施例的生成图像的检测方法的实现原理示意图;
图3是根据本说明书一实施例的一种生成图像的检测装置的示意性框图;
图4是根据本说明书一实施例的一种电子设备的示意性框图。
具体实施方式
本说明书一个或多个实施例提供一种生成图像的检测方法及装置。
为了使本技术领域的人员更好地理解本说明书一个或多个实施例中的技术方案,下面将结合本说明书一个或多个实施例中的附图,对本说明书一个或多个实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书一个或多个实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本文件保护的范围。
如图1所示,本说明书实施例提供一种生成图像的检测方法,该方法的执行主体可以为终端设备或服务器,其中,该终端设备可以如手机、平板电脑等一定终端设备,还可以如笔记本电脑或台式电脑等计算机设备,或者,也可以为IoT设备(具体如智能手表、车载设备等)等。该服务器可以是独立的一个服务器,还可以是由多个服务器构成的服务器集群等,该服务器可以是如金融业务或网络购物业务等的后台服务器,也可以是某应用程序的后台服务器等。本实施例中以服务器为例进行详细说明,对于终端设备的执行过程可以参见下述相关内容,在此不再赘述。该方法具体可以包括以下步骤:
在步骤S102中,获取目标图像,目标图像包括真实图像和/或生成图像。
本说明书实施例中的目标图像即当前的待检测图像,该目标图像可以是单个图像,具体可能是真实图像,也可能是生成图像。目标图像也可以是多个待检测图像的集合,该集合可以是真实图像组成的集合,也可以是生成图像组成的集合,还可以是由真实图像和生成图像混合组成的集合,通过本说明书实施例中的检测方法,能够从该集合中识别出所有的生成图像。
需要说明的是,真实图像和生成图像可以是相同内容的图像,也可以是不同内容的图像,以多个待检测图像集合形式的目标图像为例,该目标图像中可以包括:小鸭子的真实图像、奔跑的小狗的生成图像、小猫的生成图像、证件的真实图像,通过本说明书实施例中的检测方法,能够将奔跑的小狗的生成图像和小猫的生成图像识别出来。
此外,本说明书实施例中的真实图像是基于图像采集设备拍摄的图像,是未经处理的图像,例如:摄像机所拍摄的图像。生成图像是基于预设的条件生成或合成的图像,通常是经过图像处理算法或图像处理工具处理后的图像,例如:基于AIGG(AI GeneratedContent,人工智能生产的内容)生成的图像,文生图大模型生成的图像、生成模型生成的图像等。
在步骤S104中,从目标图像中选取部分图像,并基于目标图像中除部分图像之外的剩余图像对部分图像进行重构处理,获取剩余图像和重构的部分图像所组成的重构图像。
重构图像由剩余图像和重构的部分图像所组成,也即:目标图像所对应的重构图像,为获取目标图像所对应的重构图像,本说明书实施例首先从目标图像中选取部分图像,然后基于目标图像中除部分图像之外的剩余图像对部分图像进行重构处理。
在实施中,对部分图像进行重构处理的方式,可以是利用其他图像对部分图像进行覆盖,例如:利用掩码进行掩膜处理后覆盖部分图像,然后对覆盖区域进行图像填充处理;还可以从目标图像中抠除所选取部分图像然后对抠除处理后的区域进行图像填充处理;还可以对图片内容进行识别并选择指定语义的内容,然后利用其他图像对所选择的指定语义的内容进行覆盖或者对所选择的指定语义的内容进行抠除处理,然后对覆盖或抠除处理后的区域进行图像填充处理。
在步骤S106中,将重构图像输入预先训练的分类模型,得到重构图像的重构效果类别,分类模型用于根据真实图像及其对应的重构图像之间的第一重构误差以及生成图像及其对应的重构图像之间的第二重构误差,对真实图像对应的重构图像和生成图像对应的重构图像进行分类。
在实施中,分类模型可以基于多张真实图像样本和生成图像样本以及预设的损失函数,进行模型训练得到。分类模型可以采用基于深度神经网络构建的二分类模型,分类模型的输入数据是目标对象对应的重构图像,输出结果是该重构图像的重构效果类别,重构效果类别包括好和差两个类别,重构误差越大重构效果越差,重构误差越小重构效果越好,可以根据预设的重构误差阈值,超过重构误差阈值判定为重构效果差,低于预设的重构误差阈值,判定为重构效果好。由于生成图像和真实图像的重构效果差距较大,生成图像重构效果类别为好,真实图像的重构效果类别为差,从而能够区别生成图像和真实图像。
在步骤S108中,根据重构图像的重构效果类别,确定目标图像是真实图像或生成图像。
由于真实图像和生成图像的平滑度差异较大,且较大的平滑度差异会导致真实图像和生成图像分别对应的重构图像的重构效果也会有较大的差异。具体地,生成图像内部像素平滑度较高,对部分图像所在的区域进行图像填充处理时,通过依据部分图像周围的图像信息(即目标图像中除部分图像之外的剩余图像的图像信息)进行填充处理,会得到更加平滑的重构图像,使得生成图像对应的重构图像与生成图像之间的重构误差较小,重构效果较好;而真实图像周围像素平滑度较低,对部分图像所在的区域进行图像填充处理时,通过依据部分图像周围的图像信息进行填充处理,也会得到比较平滑的重构图像,使得真实图像对应的重构图像与真实图像之间的重构误差较大,重构效果较差。因此,本说明实施例通过比对真实图像和生成图像的重构图像的重构效果,能够有效地识别生成图像,从而提高生成图像检测结果的准确性和检测效率。
在实施中,如果目标图像对应的重构图像的重构效果类别为好,判定当前的目标图像为生成图像,如果目标图像对应的重构图像的重构效果类别为差,判定当前的目标图像为真实图像。
本说明书实施例提供一种生成图像的检测方法,首先获取目标图像,其次从目标图像中选取部分图像,并基于目标图像中除部分图像之外的剩余图像对部分图像进行重构处理,获取剩余图像和重构的部分图像所组成的重构图像,然后将重构图像输入预先训练的分类模型,得到重构图像的重构效果类别,最后根据重构图像的重构效果类别,确定目标图像是真实图像或生成图像。本说明书实施例充分利用真实图像和生成图像的平滑度差异较大,且较大的平滑度差异会导致真实图像和生成图像分别对应的重构图像的重构效果差异较大的原理,通过对目标图像的部分区域进行重构处理获取到目标图像对应的重构图像,并通过对重构图像的重构效果进行分类,能够快速而有效地确定当前的目标图像是真实图像还是生成图像,从而有效提高生成图像的检测效率和检测结果的准确性。此外,本说明书实施例中分类模型的输入数据是重构图像,分类模型是基于真实图像及其对应的重构图像,以及基于生成图像及其对应的重构图像进行重构效果类别的划分,因此用于进行重构效果分类的图像具有相同的内容,这种方式有利于减少干扰因素,使分类模型能够基于图像的实际内容差距进行类别判断,从而提高分类结果的准确性,进而提高生成图像检测结果的准确性。
本说明书实施例中,上述步骤S104的处理可以多种多样,以下提供一种可选的处理方式,具体可以参见以下步骤S1042-S1044的处理。
在步骤S1042中,根据预设的掩码,对所选取的部分图像进行掩膜处理,获取剩余图像和掩膜处理后的部分图像组成的待填充的目标图像。
此处待填充的目标图像由剩余图像和掩膜处理后的部分图像组成,待填充的目标图像的待填充区域即:掩膜所在的区域。
利用预设的掩码对部分图像所在的区域进行掩膜处理,能够覆盖目标图像中所选取部分图像,从而获取由剩余图像和掩膜处理后的部分图像组成的待填充的目标图像。
在一种实现方式中,预设的掩码与目标图像的尺寸比例小于或等于1/4。在实施中,可以选择预设的掩码与目标图像的尺寸比例为1/4,或者1/8等,且预设的掩码可以设定任意形状。如果目标图像是多个待检测图像的集合,则预设的掩码与多个待检测图像的集合中面积排序末位的图像的尺寸比例小于或等于1/4。该预设的掩码大小既能提高图像填充处理的效率,又符合图像填充处理的准确性,有利于提高图像填充处理的可操作性。
在步骤S1044中,基于图像填充模型对待填充的目标图像进行图像填充处理,以基于剩余图像在掩码所在的区域中对部分图像进行重构处理,获取目标图像对应的重构图像。
在实施中,图像填充模型可以采用现有的图像填充模型,例如:基于扩散模型构建的图像填充模型。
本说明书实施例中,上述步骤S104的处理可以多种多样,以下提供另一种可选的处理方式,具体可以参见以下步骤S1046-S1048的处理。
在步骤S1046中,从目标图像中抠除部分图像,基于剩余图像和部分图像所在的区域得到待填充的目标图像。
此处待填充的目标图像由剩余图像和部分图像所在的区域(即空白图像)组成,待填充的目标图像的待填充区域即被抠除的部分图像所在的目标图像中对应的区域(或空白图像所在的区域)。
在实施中,可以采用现有的抠图工具,直接从目标图像中抠除待所选取的部分图像,目标图像中保留该部分图像所在的区域,从而基于剩余图像和部分图像所在的区域得到待填充的目标图像,这种方式能够快速得到待填充的目标图像,有利于提高图像填充处理的效率。
在步骤S1048中,基于预设的图像填充算法对待填充的目标图像进行图像填充处理,以基于剩余图像在部分图像所在的区域中对部分图像进行重构处理,获取目标图像对应的重构图像。
在实施中,预设的图像填充算法可以采用注入填充区域算法、种子填充算法、扫描线填充算法、边填充算法等,本说明书实施例对此不做限定。也可以采用图像填充模型对待填充的目标图像进行图像填充处理,获取目标图像对应的重构图像。
本说明书实施例中,上述步骤S106中分类模型的训练方法可以多种多样,以下提供一种可选的处理方式,具体可以参见以下步骤A1-A3的处理。
步骤A1,获取带有标签信息的多张图像样本,图像样本包括真实图像样本以及生成图像样本,标签信息用于标记图像样本为真实图像样本或生成图像样本。
其中,所获取的多张图像样本可以是相同内容的图像样本,也可以是不同内容的图像样本。图像样本带有标签信息,用于进行有监督训练,有利于提高分类模型分类结果的准确性。获取多张图像样本的方式,可以直接从开源数据集中获取多张真实图像样本和多张生成图像样本。也可以只从开源数据集中获取多张真实图像样本,并基于所获取的真实图像样本生成对应的多张生成图像样本。
步骤A2,从每张图像样本中选取部分图像,并基于每张图像样本中除部分图像之外的剩余图像对部分图像进行重构处理,获取每张图像样本对应的剩余图像和重构的部分图像所组成的重构图像。
步骤A3,以多张图像样本为输入数据,以多张图像样本对应的重构图像的重构效果类别为输出结果,基于预设的损失函数对分类模型进行训练,得到训练后的分类模型。
在实施中,预设的损失函数为分类模型损失函数,可以采用交叉熵损失函数。
本说明书实施例中,上述步骤A1的处理方式可以多种多样,以下提供一种可选的处理方式,具体可以参见以下步骤A11-A12的处理。
步骤A11,基于开源数据集获取多张真实图像样本。
步骤A12,利用生成模型,基于多张真实图像样本生成多张生成图像样本。
在实施中,生成模型可以采用扩散模型、VAE(Variational Autoencoder,变分自动编码器)生成模型、基于流的生成模型等。
基于开源数据集只获取多张真实图像样本,并基于所获取的真实图像样本生成对应的生成图像样本,该方式能够实现少量样本情况下进行模型训练,且该方式中生成图像和真实图像在内容上一致,有利于模型定向学习真实图片和生成图片之间的实际内容上的差异,更具有针对性,有利于进一步提高模型训练的效率以及提高分类模型分类结果的准确性。
本说明书实施例中,上述步骤S106中分类模型用于根据第一重构误差和第二重构误差对真实图像对应的重构图像和生成图像对应的重构图像进行分类。第一重构误差和第二重构误差的实现方式可以多种多样,在一种实现方式中,第一重构误差根据真实图像及其对应的重构图像之间预设的相似度指标确定,第二重构误差根据生成图像及其对应的重构图像之间预设的相似度指标确定,且第一重构误差和第二重构误差均与目标图像的平滑度成反比关系。第一重构误差(第二重构误差)越大,目标图像的平滑度越小,第一重构误差(第二重构误差)越小,目标图像的平滑度越大。
在一种实现方式中,预设的相似度指标包括:结构相似性参数、峰值信噪比参数以及学习感知图像块相似度参数中的一种或多种。即:可以仅采用一种相似度指标,也可以同时选择以上两种或三种相似度指标确定第一重构误差或者第二重构误差。其中,结构相似性参数与第一重构误差、第二重构误差成反比关系,且与重构效果成正比关系;峰值信噪比参数与第一重构误差、第二重构误差成反比关系,且与重构效果成正比关系;学习感知图像块相似度参数与第一重构误差、第二重构误差成正比关系,且与重构效果成反比关系。即:结构相似性参数越大,第一重构误差(第二重构误差)越小,重构效果越好,峰值信噪比参数越大,第一重构误差(第二重构误差)越小,重构效果越好,学习感知图像块相似度参数越大,第一重构误差(第二重构误差)越大,重构效果越差。
本说明书实施例中生成图像的检测方法的实现原理可以参见图2。以基于扩散模型的生成模型输出的生成图像为例,由于扩散模型是通过多步迭代去噪的方式进行图像生成处理,在层次化的去噪过程中,通过输入条件的引导逐步去除与设定的条件文本无关的噪声,从而生成符合设定的条件文本的生成图像,因此,通过上述方式得到的生成图像,其像素在全局上过于平滑(平滑度较高)。而基于图像采集设备拍摄的真实图像,由于拍摄时自然场景的不同、相机参数的不同,会导致真实图像的像素比较锐化(平滑度较低),因此,生成图像和真实图像的平滑度具有较大差异。本说明书实施例通过比对真实图像对应的重构图像与生成图像对应的重构图像的重构效果,来区分生成图像和真实图像的平滑度,从而能够快速而有效地区别生成图像和真实图像。
以基于Stable diffusion(智能AI绘图生成工具,一种基于扩散模型的生成模型)生成的2500张生成图像与相机拍摄的2500张真实图像为例,通过随机生成比例小于真实图像1/8面积大小的掩码以及小于真实图像1/4面积大小的掩码,分别对生成图像和真实图像进行掩膜处理获取待填充的区域(即:掩码区域),再利用基于Stable diffusion的图像填充模型对待填充的区域进行图像填充处理,获取生成图像对应的重构图像和真实图像对应的重构图像,分别计算图像填充处理之后生成图像和真实图像之间的各项相似度指标,得到如下表1和表2所示的内容。
表1 掩码区域为原图面积的1/8时各项相似度指标
表2掩码区域为原图面积的1/4时各项相似度指标
由以上表1和表2可知,真实图像的SSIM(structural similarity indexmeasurement,结构相似性参数)和PSNR(Peak Signal to Noise Ratio,峰值信噪比参数)相比于生成图像的SSIM和PSNR偏低,且真实图像的LPIPS(Learned Perceptual ImagePatch Similarity,学***滑度较高,对部分图像所在的区域进行图像填充处理时,通过依据部分图像周围的图像信息进行填充处理会得到更加平滑的重构图像,因此,生成图像与其对应的重构图像之间的重构误差较小,重构效果较好,而真实图像周围像素平滑度较低,对部分图像所在的区域进行图像填充处理时,通过依据部分图像周围的图像信息进行填充处理也会得到比较平滑的重构图像,因此,真实图像与其对应的重构图像之间的重构误差较大,重构效果较差,结合表1和表2可知,真实图像的重构效果远低于生成图像的重构效果。基于此,图2中通过多张图像样本训练分类模型后,通过分类模型将目标图像所对应的重构图像分为重构效果好和重构效果差两类图像,最后根据重构效果确定当前的目标图像是生成图像还是真实图像。
本说明书实施例提供一种生成图像的检测方法,首先获取目标图像,其次从目标图像中选取部分图像,并基于目标图像中除部分图像之外的剩余图像对部分图像进行重构处理,获取剩余图像和重构的部分图像所组成的重构图像,然后将重构图像输入预先训练的分类模型,得到重构图像的重构效果类别,最后根据重构图像的重构效果类别,确定目标图像是真实图像或生成图像。本说明书实施例充分利用真实图像和生成图像的平滑度差异较大,且较大的平滑度差异会导致真实图像和生成图像分别对应的重构图像的重构效果差异较大的原理,通过对目标图像的部分区域进行重构处理获取到目标图像对应的重构图像,并通过对重构图像的重构效果进行分类,能够快速而有效地确定当前的目标图像是真实图像还是生成图像,从而有效提高生成图像的检测效率和检测结果的准确性。此外,本说明书实施例中分类模型的输入数据是重构图像,分类模型是基于真实图像及其对应的重构图像,以及基于生成图像及其对应的重构图像进行重构效果类别的划分,因此用于进行重构效果分类的图像具有相同的内容,这种方式有利于减少干扰因素,使分类模型能够基于图像的实际内容差距进行类别判断,从而提高分类结果的准确性,进而提高生成图像检测结果的准确性。
综上,已经对本主题的特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作可以按照不同的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序,以实现期望的结果。在某些实施方式中,多任务处理和并行处理可以是有利的。
以上为本说明书一个或多个实施例提供的生成图像的检测方法,基于同样的思路,本说明书一个或多个实施例还提供一种生成图像的检测装置,如图3所示。
该生成图像的检测装置包括:图像获取模块210、图像填充处理模块220、分类模块230以及生成图像确定模块240,其中:
图像获取模块210,获取目标图像,目标图像包括真实图像和/或生成图像,真实图像是基于图像采集设备拍摄的图像,生成图像是基于预设的条件生成的图像;
图像填充处理模块220,从目标图像中选取部分图像,并基于目标图像中除部分图像之外的剩余图像对部分图像进行重构处理,获取剩余图像和重构的部分图像所组成的重构图像;
分类模块230,将重构图像输入预先训练的分类模型,得到重构图像的重构效果类别,分类模型用于根据真实图像及其对应的重构图像之间的第一重构误差以及生成图像及其对应的重构图像之间的第二重构误差,对真实图像对应的重构图像和生成图像对应的重构图像进行分类;
生成图像确定模块240,根据重构图像的重构效果类别,确定目标图像是真实图像或生成图像。
本说明书实施例中,图像填充处理模块220可以包括:
掩膜处理单元,根据预设的掩码,对所选取的部分图像进行掩膜处理,获取剩余图像和掩膜处理后的部分图像组成的待填充的目标图像;
第一图像填充处理单元,基于图像填充模型对待填充的目标图像进行图像填充处理,以基于剩余图像在掩码所在的区域中对部分图像进行重构处理,获取目标图像对应的重构图像。
在一种实施方式中,掩膜处理单元中预设的掩码与目标图像的尺寸比例小于或等于1/4。
本说明书实施例中,图像填充处理模块220还可以包括:
抠除单元,从目标图像中抠除部分图像,基于剩余图像和部分图像所在的区域得到待填充的目标图像;
第二图像填充处理单元,基于预设的图像填充算法对待填充的目标图像进行图像填充处理,以基于剩余图像在部分图像所在的区域中对部分图像进行重构处理,获取目标图像对应的重构图像。
本说明书实施例中,分类模块230的分类模型中,第一重构误差根据真实图像及其对应的重构图像之间预设的相似度指标确定,第二重构误差根据生成图像及其对应的重构图像之间预设的相似度指标确定,且第一重构误差和第二重构误差均与目标图像的平滑度成反比关系。
在一种实施方式中,分类模块230的分类模型中预设的相似度指标包括:结构相似性参数、峰值信噪比参数以及学习感知图像块相似度参数中的一种或多种,且结构相似性参数与第一重构误差、第二重构误差成反比关系,峰值信噪比参数与第一重构误差、第二重构误差成反比关系,学习感知图像块相似度参数与第一重构误差、第二重构误差成正比关系。
本说明书实施例中,该生成图像的检测装置还包括分类模型训练模块,基于带有标签信息的多张图像样本和预设的损失函数对分类模型进行训练,得到训练后的分类模型,该分类模型训练模块包括:
图像样本获取单元,获取带有标签信息的多张图像样本,图像样本包括真实图像样本以及生成图像样本,标签信息用于标记图像样本为真实图像样本或生成图像样本;
重构图像获取单元,从每张图像样本中选取部分图像,并基于每张图像样本中除部分图像之外的剩余图像对部分图像进行重构处理,获取每张图像样本对应的剩余图像和重构的部分图像所组成的重构图像;
模型训练单元,以多张图像样本为输入数据,以多张图像样本对应的重构图像的重构效果类别为输出结果,基于预设的损失函数对分类模型进行训练,得到训练后的分类模型。
本说明书实施例中,图像样本获取单元包括:
真实图像样本获取子单元,基于开源数据集获取多张真实图像样本;
生成图像样本生成子单元,利用生成模型,基于多张真实图像样本生成多张生成图像样本。
本领域的技术人员应可理解,上述生成图像的检测装置能够用来实现前文所述的生成图像的检测方法,其中的细节描述应与前文方法部分描述类似,为避免繁琐,此处不另赘述。
本说明书实施例提供一种生成图像的检测装置,首先通过图像获取模块获取目标图像,其次利用图像填充处理模块从目标图像中选取部分图像,并基于目标图像中除部分图像之外的剩余图像对部分图像进行重构处理,获取剩余图像和重构的部分图像所组成的重构图像,然后基于分类模块将重构图像输入预先训练的分类模型,得到重构图像的重构效果类别,最后通过生成图像确定模块根据重构图像的重构效果类别,确定目标图像是真实图像或生成图像。本说明书实施例充分利用真实图像和生成图像的平滑度差异较大,且较大的平滑度差异会导致真实图像和生成图像分别对应的重构图像的重构效果差异较大的原理,通过对目标图像的部分区域进行重构处理获取到目标图像对应的重构图像,并通过对重构图像的重构效果进行分类,能够快速而有效地确定当前的目标图像是真实图像还是生成图像,从而有效提高生成图像的检测效率和检测结果的准确性。此外,本说明书实施例中分类模型的输入数据是重构图像,分类模型是基于真实图像及其对应的重构图像,以及基于生成图像及其对应的重构图像进行重构效果类别的划分,因此用于进行重构效果分类的图像具有相同的内容,这种方式有利于减少干扰因素,使分类模型能够基于图像的实际内容差距进行类别判断,从而提高分类结果的准确性,进而提高生成图像检测结果的准确性。
基于同样的思路,本说明书一个或多个实施例还提供一种电子设备,如图4所示。电子设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上的处理器301和存储器302,存储器302中可以存储有一个或一个以上存储应用程序或数据。其中,存储器302可以是短暂存储或持久存储。存储在存储器302的应用程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括对电子设备中的一系列计算机可执行指令。更进一步地,处理器301可以设置为与存储器302通信,在电子设备上执行存储器302中的一系列计算机可执行指令。电子设备还可以包括一个或一个以上电源303,一个或一个以上有线或无线网络接口304,一个或一个以上输入输出接口305,一个或一个以上键盘306。
具体在本实施例中,电子设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对电子设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
获取目标图像,目标图像包括真实图像和/或生成图像,真实图像是基于图像采集设备拍摄的图像,生成图像是基于预设的条件生成的图像;
从目标图像中选取部分图像,并基于目标图像中除部分图像之外的剩余图像对部分图像进行重构处理,获取剩余图像和重构的部分图像所组成的重构图像;
将重构图像输入预先训练的分类模型,得到重构图像的重构效果类别,分类模型用于根据真实图像及其对应的重构图像之间的第一重构误差以及生成图像及其对应的重构图像之间的第二重构误差,对真实图像对应的重构图像和生成图像对应的重构图像进行分类;
根据重构图像的重构效果类别,确定目标图像是真实图像或生成图像。
本说明书一个或多个实施例提供一种存储介质,存储介质用于存储计算机可执行指令,可执行指令在被处理器执行时实现以下流程:
获取目标图像,目标图像包括真实图像和/或生成图像,真实图像是基于图像采集设备拍摄的图像,生成图像是基于预设的条件生成的图像;
从目标图像中选取部分图像,并基于目标图像中除部分图像之外的剩余图像对部分图像进行重构处理,获取剩余图像和重构的部分图像所组成的重构图像;
将重构图像输入预先训练的分类模型,得到重构图像的重构效果类别,分类模型用于根据真实图像及其对应的重构图像之间的第一重构误差以及生成图像及其对应的重构图像之间的第二重构误差,对真实图像对应的重构图像和生成图像对应的重构图像进行分类;
根据重构图像的重构效果类别,确定目标图像是真实图像或生成图像。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字***“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20 以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的***、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书一个或多个实施例时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书一个或多个实施例可提供为方法、***、或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书一个或多个实施例是参照根据本说明书实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于***实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书一个或多个实施例而已,并不用于限制本申请。对于本领域技术人员来说,本说明书一个或多个实施例可以有各种更改和变化。凡在本说明书一个或多个实施例的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书一个或多个实施例的权利要求范围之内。
Claims (9)
1.一种生成图像的检测方法,包括:
获取目标图像,所述目标图像包括真实图像和/或生成图像,所述真实图像是基于图像采集设备拍摄的图像,所述生成图像是基于预设的条件生成的图像;
从所述目标图像中选取部分图像,并基于所述目标图像中除所述部分图像之外的剩余图像对所述部分图像进行重构处理,获取所述剩余图像和重构的部分图像所组成的重构图像;
将所述重构图像输入预先训练的分类模型,得到所述重构图像的重构效果类别,所述分类模型用于根据真实图像及其对应的重构图像之间的第一重构误差以及生成图像及其对应的重构图像之间的第二重构误差,对所述真实图像对应的重构图像和生成图像对应的重构图像进行分类,所述第一重构误差根据真实图像及其对应的重构图像之间预设的相似度指标确定,所述第二重构误差根据生成图像及其对应的重构图像之间预设的相似度指标确定,且所述第一重构误差和第二重构误差均与所述目标图像的平滑度成反比关系;
根据所述重构图像的重构效果类别,确定所述目标图像是真实图像或生成图像。
2.根据权利要求1所述的方法,所述基于所述目标图像中除所述部分图像之外的剩余图像对所述部分图像进行重构处理,获取所述剩余图像和重构的部分图像所组成的重构图像,包括:
根据预设的掩码,对所选取的部分图像进行掩膜处理,获取所述剩余图像和掩膜处理后的部分图像组成的待填充的目标图像;
基于图像填充模型对所述待填充的目标图像进行图像填充处理,以基于所述剩余图像在所述掩码所在的区域中对所述部分图像进行重构处理,获取所述目标图像对应的重构图像。
3.根据权利要求2所述的方法,所述预设的掩码与所述目标图像的尺寸比例小于或等于1/4。
4.根据权利要求1所述的方法,所述基于所述目标图像中除所述部分图像之外的剩余图像对所述部分图像进行重构处理,获取所述剩余图像和重构的部分图像所组成的重构图像,包括:
从所述目标图像中抠除所述部分图像,基于所述剩余图像和所述部分图像所在的区域得到待填充的目标图像;
基于预设的图像填充算法对所述待填充的目标图像进行图像填充处理,以基于所述剩余图像在所述部分图像所在的区域中对所述部分图像进行重构处理,获取所述目标图像对应的重构图像。
5.根据权利要求1所述的方法,所述相似度指标包括:结构相似性参数、峰值信噪比参数以及学习感知图像块相似度参数中的一种或多种,且所述结构相似性参数与所述第一重构误差、第二重构误差成反比关系,所述峰值信噪比参数与所述第一重构误差、第二重构误差成反比关系,所述学习感知图像块相似度参数与所述第一重构误差、第二重构误差成正比关系。
6.根据权利要求1所述的方法,所述分类模型的训练方法包括:
获取带有标签信息的多张图像样本,所述图像样本包括真实图像样本以及生成图像样本,所述标签信息用于标记所述图像样本为真实图像样本或生成图像样本;
从每张图像样本中选取部分图像,并基于每张所述图像样本中除所述部分图像之外的剩余图像对所述部分图像进行重构处理,获取每张所述图像样本对应的所述剩余图像和重构的部分图像所组成的重构图像;
以所述多张图像样本为输入数据,以所述多张图像样本对应的重构图像的重构效果类别为输出结果,基于预设的损失函数对所述分类模型进行训练,得到训练后的分类模型。
7.根据权利要求6所述的方法,所述获取多张图像样本,包括:
基于开源数据集获取多张真实图像样本;
利用生成模型,基于所述多张真实图像样本生成多张生成图像样本。
8.一种生成图像的检测装置,包括:
图像获取模块,获取目标图像,所述目标图像包括真实图像和/或生成图像,所述真实图像是基于图像采集设备拍摄的图像,所述生成图像是基于预设的条件生成的图像;
图像填充处理模块,从所述目标图像中选取部分图像,并基于所述目标图像中除所述部分图像之外的剩余图像对所述部分图像进行重构处理,获取所述剩余图像和重构的部分图像所组成的重构图像;
分类模块,将所述重构图像输入预先训练的分类模型,得到所述重构图像的重构效果类别,所述分类模型用于根据真实图像及其对应的重构图像之间的第一重构误差以及生成图像及其对应的重构图像之间的第二重构误差,对所述真实图像对应的重构图像和生成图像对应的重构图像进行分类,所述第一重构误差根据真实图像及其对应的重构图像之间预设的相似度指标确定,所述第二重构误差根据生成图像及其对应的重构图像之间预设的相似度指标确定,且所述第一重构误差和第二重构误差均与所述目标图像的平滑度成反比关系;
生成图像确定模块,根据所述重构图像的重构效果类别,确定所述目标图像是真实图像或生成图像。
9.一种电子设备,包括:
处理器;以及
被安排成存储计算机可执行指令的存储器,在所述可执行指令被执行时,能够使得所述处理器:
获取目标图像,所述目标图像包括真实图像和/或生成图像,所述真实图像是基于图像采集设备拍摄的图像,所述生成图像是基于预设的条件生成的图像;
从所述目标图像中选取部分图像,并基于所述目标图像中除所述部分图像之外的剩余图像对所述部分图像进行重构处理,获取所述剩余图像和重构的部分图像所组成的重构图像;
将所述重构图像输入预先训练的分类模型,得到所述重构图像的重构效果类别,所述分类模型用于根据真实图像及其对应的重构图像之间的第一重构误差以及生成图像及其对应的重构图像之间的第二重构误差,对所述真实图像对应的重构图像和生成图像对应的重构图像进行分类,所述第一重构误差根据真实图像及其对应的重构图像之间预设的相似度指标确定,所述第二重构误差根据生成图像及其对应的重构图像之间预设的相似度指标确定,且所述第一重构误差和第二重构误差均与所述目标图像的平滑度成反比关系;
根据所述重构图像的重构效果类别,确定所述目标图像是真实图像或生成图像。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410010345.9A CN117523323B (zh) | 2024-01-03 | 2024-01-03 | 一种生成图像的检测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410010345.9A CN117523323B (zh) | 2024-01-03 | 2024-01-03 | 一种生成图像的检测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117523323A CN117523323A (zh) | 2024-02-06 |
CN117523323B true CN117523323B (zh) | 2024-05-14 |
Family
ID=89749795
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410010345.9A Active CN117523323B (zh) | 2024-01-03 | 2024-01-03 | 一种生成图像的检测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117523323B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112949642A (zh) * | 2021-02-23 | 2021-06-11 | 北京三快在线科技有限公司 | 一种文字生成方法、装置、存储介质及电子设备 |
CN116543264A (zh) * | 2023-06-02 | 2023-08-04 | 支付宝(杭州)信息技术有限公司 | 图像分类模型的训练方法、图像分类方法及装置 |
CN117173075A (zh) * | 2022-05-24 | 2023-12-05 | 鸿海精密工业股份有限公司 | 医学图像检测方法及相关设备 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111753595A (zh) * | 2019-03-29 | 2020-10-09 | 北京市商汤科技开发有限公司 | 活体检测方法和装置、设备和存储介质 |
CN114663335A (zh) * | 2020-12-22 | 2022-06-24 | 富泰华工业(深圳)有限公司 | 图像瑕疵检测方法、装置、电子设备及介质 |
-
2024
- 2024-01-03 CN CN202410010345.9A patent/CN117523323B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112949642A (zh) * | 2021-02-23 | 2021-06-11 | 北京三快在线科技有限公司 | 一种文字生成方法、装置、存储介质及电子设备 |
CN117173075A (zh) * | 2022-05-24 | 2023-12-05 | 鸿海精密工业股份有限公司 | 医学图像检测方法及相关设备 |
CN116543264A (zh) * | 2023-06-02 | 2023-08-04 | 支付宝(杭州)信息技术有限公司 | 图像分类模型的训练方法、图像分类方法及装置 |
Non-Patent Citations (2)
Title |
---|
Method for text detection in image and video based on wavelet reconstruction;Huang Jian-Hua等;《Journal of the Harbin Institute of Technology》;20060930;全文 * |
重构迁移学习的红外目标分类;毛远宏;贺占庄;马钟;;电子科技大学学报;20200730(04);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN117523323A (zh) | 2024-02-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109034183B (zh) | 一种目标检测方法、装置及设备 | |
CN112784857B (zh) | 一种模型训练以及图像处理方法及装置 | |
CN112347512A (zh) | 图像处理方法、装置、设备及存储介质 | |
CN115828162B (zh) | 一种分类模型训练的方法、装置、存储介质及电子设备 | |
CN111932438B (zh) | 图像风格迁移方法、设备及存储装置 | |
CN116152933A (zh) | 一种异常检测模型的训练方法、装置、设备及存储介质 | |
CN111368902A (zh) | 一种数据标注的方法及装置 | |
CN116630480B (zh) | 一种交互式文本驱动图像编辑的方法、装置和电子设备 | |
CN116402165B (zh) | 一种算子检测的方法、装置、存储介质以及电子设备 | |
CN108804563A (zh) | 一种数据标注方法、装置以及设备 | |
CN116342888B (zh) | 一种基于稀疏标注训练分割模型的方法及装置 | |
CN117523323B (zh) | 一种生成图像的检测方法及装置 | |
CN117113174A (zh) | 一种模型训练的方法、装置、存储介质及电子设备 | |
CN116246276A (zh) | 一种信息识别方法、装置、设备及可读存储介质 | |
CN115578796A (zh) | 一种活体检测模型的训练方法、装置、设备及介质 | |
CN112560530B (zh) | 一种二维码处理方法、设备、介质及电子设备 | |
CN111260757A (zh) | 一种图像处理方法、装置及终端设备 | |
CN115204318A (zh) | 事件自动层级分类方法及电子设备 | |
CN113781491A (zh) | 图像分割模型的训练、图像分割方法及装置 | |
CN113191401A (zh) | 基于视觉显著性共享的用于三维模型识别的方法及装置 | |
CN114693996B (zh) | 证件真实性不确定度度量方法及装置、设备、存储介质 | |
CN117972436B (zh) | 大语言模型的训练方法、训练装置、存储介质及电子设备 | |
CN118279693A (zh) | 一种视觉基础模型训练方法、装置、存储介质及电子设备 | |
CN118429985A (zh) | 聊天消息检测方法、装置、存储介质及电子设备 | |
CN116486199A (zh) | 图像检测模型的训练方法、图像检测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |