CN116052043A - 基于短程稠密连接和注意力机制的双流图像篡改定位方法 - Google Patents

基于短程稠密连接和注意力机制的双流图像篡改定位方法 Download PDF

Info

Publication number
CN116052043A
CN116052043A CN202211656271.3A CN202211656271A CN116052043A CN 116052043 A CN116052043 A CN 116052043A CN 202211656271 A CN202211656271 A CN 202211656271A CN 116052043 A CN116052043 A CN 116052043A
Authority
CN
China
Prior art keywords
stage
output
short
tampering
positioning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211656271.3A
Other languages
English (en)
Inventor
林茂森
李昊东
黄继武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen University
Original Assignee
Shenzhen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen University filed Critical Shenzhen University
Priority to CN202211656271.3A priority Critical patent/CN116052043A/zh
Publication of CN116052043A publication Critical patent/CN116052043A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于短程稠密连接和注意力机制的双流图像篡改定位方法,包括:构建基于短程稠密连接模块和注意力机制的双流图像篡改定位网络;对篡改定位网络进行训练,得到基于短程稠密连接和注意力机制的双流图像篡改定位模型;使用训练好的网络模型,对输入的待测图像进行篡改定位,输出定位结果。本发明基于短程稠密连接和注意力机制构建网络,得到一种基于短程稠密连接和注意力机制的双流图像篡改定位网络,从而实现在进行图像篡改定位时同时兼顾篡改定位性能与检测效率的效果。

Description

基于短程稠密连接和注意力机制的双流图像篡改定位方法
技术领域
本发明涉及多媒体信息安全与取证领域,尤其涉及一种基于短程稠密连接和注意力机制的双流图像篡改定位方法、装置、设备及存储介质。
背景技术
近年来,由于信息技术的发展,互联网逐渐成为人们现实生活中的另一个生活圈,人们在互联网上通过图像、视频交流各种各样的信息,但与此同时,由于图像编辑软件逐渐智能化,人们可以轻易地通过这些图像编辑软件改变原有的图像信息,而在视觉上却不会留下明显的篡改痕迹,因而互联网出现大量的篡改图像。这些篡改图像对网络信息安全、新闻传播、司法取证造成严重的威胁,倘若这些篡改图像被用于证据使用,将会对社会造成严重的影响。因此,对图像篡改进行定位检测意义重大。
目前,已有相当一部分篡改定位方法研究取得一定的进展,但这些方法只考虑性能,而不考虑运算速度,在面对互联网上成千上万的图像时,显得效率十分低下;而目前Short-Term Dense Concatenate(短程稠密连接,简写为STDC,下文中所有的STDC均表示Short-Term Dense Concaten ate)所构建的网络在进行图像处理时具有较好的速度、准确性的平衡,而在用于图像篡改定位时Short-Term Dense Concatenate在边缘分支上会过度捕捉边缘特征而忽略的全局性的篡改特征,导致最终定位结果不完整。
因此,现有技术还有待于改进和发展。
发明内容
本申请要解决的技术问题在于,针对目前在多媒体信息安全与取证领域采用Short-Term Dense Concatenate进行图像篡改定位时虽然运算速度较快但存在定位不完整的问题,本发明提供一种基于短程稠密连接和注意力机制的双流图像篡改定位方法、装置、设备及存储介质,本发明能够通过对STDC进行改进,得到一种基于短程稠密连接和注意力机制的双流图像篡改定位网络,从而实现在进行图像篡改定位时同时兼顾篡改定位性能与检测效率的效果。
为了解决上述现有技术问题的不足,本申请实施例第一方面提供了一种基于短程稠密连接和注意力机制的双流图像篡改定位方法,所述方法包括:
构建基于短程稠密连接模块和注意力机制的双流图像篡改定位网络;
对篡改定位网络进行训练,得到基于短程稠密连接和注意力机制的双流图像篡改定位模型;
使用训练好的网络模型,对输入的待测图像进行篡改定位,输出定位结果。
所述设计基于短程稠密连接模块和注意力机制的双流图像篡改定位网络,具体包括:
所述双流图像篡改定位网络由边缘引导分支和篡改定位分支构成;
所述篡改定位分支包括5个阶段,其中阶段1和阶段2使用步长为2的卷积层进行下采样提取图像浅层特征,阶段3、阶段4、阶段5采用短程稠密连接模块提取图像篡改特征,5个阶段依次连接;
所述篡改定位分支还包括对阶段3、阶段4和阶段5的输出进行进一步处理的定位头、注意力精修模块、全局平均池化模块、位置注意力模块、特征融合模块;
所述边缘引导分支包括:用于通道压缩的边缘头、用于生成边缘掩码标签的拉普拉斯卷积和用于线性组合的卷积;
其中通过边缘头进行通道压缩,并进行上采样输出边缘输出掩膜,通过拉普拉斯卷积和用于线性组合图像的卷积对掩膜标签进行处理输出边缘掩膜标签,采用边缘掩膜标签对边缘输出掩膜进行监督。
所述阶段3、阶段4、阶段5采用短程稠密连接模块提取图像篡改特征,具体包括:
阶段3提取图像篡改特征后,采用第一定位头对阶段3输出的图像进行通道压缩,进行上采样,输出第一掩膜,采用掩膜标签对第一掩膜进行监督。
所述阶段1和阶段2使用步长为2的卷积层进行下采样提取图像浅层特征,阶段3、阶段4、阶段5采用短程稠密连接模块提取图像篡改特征,5个阶段依次连接,所述篡改定位分支还包括对阶段3、阶段4和阶段5的输出进行进一步处理的定位头、注意力精修模块、全局平均池化模块、位置注意力模块、特征融合模块,具体包括:
所述阶段3的输出作为阶段4的输入,所述阶段4的输出作为阶段5的输入;
通过阶段4得到对应的第四阶段输出,对第四阶段输出采用注意力精修模块进行精修得到第四阶段精修输出;
通过阶段5得到对应的第五阶段输出,将阶段5的全局平均池化信息加入到第五阶段输出中,得到第五阶段全局输出;
通过阶段5得到对应的第五阶段输出,对第五阶段输出采用注意力精修模块进行精修并采用位置注意力模块聚集篡改语义信息,得到第五阶段聚集输出;
对第五阶段全局输出和第五阶段聚集输出进行对应元素相加操作,并进行上采样,得到第五阶段连接输出;
对第五阶段连接输出、第五阶段全局输出和第四阶段精修输出进行对应元素相加操作,并进行上采样操作得到跨层连接输出;
通过阶段3得到对应的第三阶段输出,对第三阶段输出和跨层连接输出采用特征融合模块融合特征,得到融合特征输出。
所述得到融合特征输出后,采用第二定位头进行通道压缩,并进行上采样,输出第二掩膜,采用掩膜标签对第二掩膜进行监督。
所述对篡改定位网络进行训练,得到基于短程稠密连接和注意力机制的双流图像篡改定位模型,具体包括:
采用脚本生成篡改图像以及对应的掩膜标签作为数据集1,对数据集1进行划分得到训练集和验证集,对训练集和验证集固定图像大小进行裁剪,其中裁剪区域包含篡改区域,得到数据集2,采用数据集2对篡改定位网络进行训练;
训练过程中,通过边缘掩膜标签对边缘输出掩膜进行监督得到边缘损失,掩膜标签对第一掩膜进行监督得到第一篡改损失,掩膜标签对第二掩膜进行监督得到第二篡改损失;对边缘损失、第一篡改损失、第二篡改损失进行加和操作得到最终损失;
基于得到的最终损失对基于短程稠密连接和注意力机制的双流图像篡改定位网络进行优化,当最终损失达到预定要求,同时掩膜标签与第二掩膜的相似度达到预定要求时,输出基于短程稠密连接和注意力机制的双流图像篡改定位模型。
所述对训练集和验证集固定图像大小进行裁剪时采用滑动窗口算法进行裁剪,得到数据集2;
所述基于得到的最终损失对基于短程稠密连接和注意力机制的双流图像篡改定位网络进行优化具体采用梯度下降算法优化整个网络的参数。
本申请实施例第二方面提供了一种基于短程稠密连接和注意力机制的双流图像篡改定位装置,所述装置包括:
网络构建模块,构建基于短程稠密连接模块和注意力机制的双流图像篡改定位网络;
模型训练模块,对篡改定位网络进行训练,得到基于短程稠密连接和注意力机制的双流图像篡改定位模型;
处理模块,使用训练好的网络模型,对输入的待测图像进行篡改定位,输出定位结果。
本申请实施例第三方面提供了一种计算机可读存储介质,其特征在于,其上存储有基于短程稠密连接和注意力机制的双流图像篡改定位方法,所述基于短程稠密连接和注意力机制的双流图像篡改定位方法被处理器执行时,实现如上述任一项所述的基于短程稠密连接和注意力机制的双流图像篡改定位方法的步骤。
本申请实施例第四方面提供了一种终端设备,其特征在于,所述终端设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于短程稠密连接和注意力机制的双流图像篡改定位方法,所述处理器执行所述基于短程稠密连接和注意力机制的双流图像篡改定位方法时,实现如上述任一所述的基于短程稠密连接和注意力机制的双流图像篡改定位方法的步骤。
有益效果:与现有技术相比,本申请提供了一种基于短程稠密连接和注意力机制的双流图像篡改定位方法、装置、设备及存储介质,所述方法包括构建基于短程稠密连接模块和注意力机制的双流图像篡改定位网络;对篡改定位网络进行训练,得到基于短程稠密连接和注意力机制的双流图像篡改定位模型;使用训练好的网络模型,对输入的待测图像进行篡改定位,输出定位结果。这样在多媒体信息安全与取证领域上,本发明基于短程稠密连接模块和注意力机制构建一个网络,在该网络中引入注意力机制,同时改变全局平均池化信息的连接方式,使得构建的网络能够应用于图像篡改方面时能够在捕捉边缘分支特征的同时可以捕捉到全局性的篡改特征,从而能够得到完整的篡改区域,此外构建的网络是基于短程稠密连接模块构建的,使得所构建的网络拥有原本短程稠密连接模块处理速度快的特点,从而让本发明构建的网络具有处理速度快、处理准确性高的效果;再对该网络进行训练后得到能够达到用户使用目标的网络模型,从而使用该模型处理图像,可以高效准确的得到图像篡改定位结果。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为提供的基于短程稠密连接模块和注意力机制的双流图像篡改定位方法的流程图;
图2为本发明提供的基于短程稠密连接模块和注意力机制的双流图像篡改定位网络的网络结构图;
图3为本发明实施例提供的注意力精修模块结构图;
图4为本发明实施例提供的特征融合模块结构图;
图5为本发明实施例提供的位置注意力模块结构图;
图6为本发明实施例提供的定位头和边缘头的结构图;
图7为本发明实施例提供的网络特征可视化特征图;
图8为本发明实施例提供的基于短程稠密连接和注意力机制的双流图像篡改定位装置的原理框图。
具体实施方式
本申请提供一种基于短程稠密连接和注意力机制的双流图像篡改定位方法、装置、设备及存储介质,为使本申请的目的、技术方案及效果更加清楚、明确,以下参照附图并举实施例对本申请进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本申请所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
另外,若本发明实施例中有涉及“第一”、“第二”等的描述,则该“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
近年来,由于信息技术的发展,互联网逐渐成为人们现实生活中的另一个生活圈,人们在互联网上通过图像、视频交流各种各样的信息,但与此同时,由于图像编辑软件逐渐智能化,人们可以轻易地通过这些图像编辑软件改变原有的图像信息,而在视觉上却不会留下明显的篡改痕迹,因而互联网出现大量的篡改图像。这些篡改图像对网络信息安全、新闻传播、司法取证造成严重的威胁,倘若这些篡改图像被用于证据使用,将会对社会造成严重的影响。因此,对图像篡改进行定位检测意义重大。
目前,已有相当一部分篡改定位方法研究取得一定的进展,但这些方法只考虑性能,而不考虑运算速度,在面对互联网上成千上万的图像时,显得效率十分低下;而目前Short-Term Dense Concatenate(短程稠密连接,简写为STDC,下文中所有的STDC均表示Short-Term Dense Concaten ate)能够拥有不同大小的感受野以及提供图像多尺度信息,并且由于在网络层的精妙设计,即采用快速下采样、多个3×3卷积核叠加、1×1卷积、池化以及通道数逐层减少的策略,这使得在计算速度上仅消耗少量时间,同时又能够提取丰富的篡改特征,因此通过基于STDC构建的网络在进行图像处理时,具体用于语义分割时具有较好的速度、准确性的平衡,而在用于图像篡改定位时Short-Term Dense Concatenate在边缘分支上会过度捕捉边缘特征而忽略的全局性的篡改特征,导致最终定位结果不完整。
为解决目前在多媒体信息安全与取证领域采用Short-Term Dense Con catenate进行图像篡改定位时虽然运算速度较快但存在定位不完整的问题,本发明提供一种基于短程稠密连接和注意力机制的双流图像篡改定位方法、装置、设备及存储介质,本发明能够通过对STDC进行改进,得到一种基于短程稠密连接和注意力机制的双流图像篡改定位网络,从而实现在进行图像篡改定位时同时兼顾篡改定位性能与检测效率的效果。
实例性方法
如图1中所示,本发明实施例提供基于短程稠密连接模块和注意力机制的双流图像篡改定位方法的流程图,所述基于短程稠密连接模块和注意力机制的双流图像篡改定位方法可以应用于智能终端设备。本发明实施例中,所述方法包括如下步骤:
步骤S10、构建基于短程稠密连接模块和注意力机制的双流图像篡改定位网络;
由于STDC所构建的网络在进行图像处理时具有较好的速度、准确性的平衡,再通过结合注意力机制可以实现在保证高效处理图像的同时能够不仅仅保留篡改边缘特征,还可以保留篡改区域的特征,因此基于短程稠密连接模块和注意力机制来构建基于短程稠密连接模块和注意力机制的双流图像篡改定位网络;
进一步的,所述设计基于短程稠密连接模块和注意力机制的双流图像篡改定位网络,具体包括:
所述双流图像篡改定位网络由边缘引导分支和篡改定位分支构成;
所述篡改定位分支包括5个阶段,其中阶段1和阶段2使用步长为2的卷积层进行下采样提取图像浅层特征,阶段3、阶段4、阶段5采用短程稠密连接模块提取图像篡改特征,5个阶段依次连接;
所述篡改定位分支还包括对阶段3、阶段4和阶段5的输出进行进一步处理的定位头、注意力精修模块、全局平均池化模块、位置注意力模块、特征融合模块;
所述边缘引导分支包括:用于通道压缩的边缘头、用于生成边缘掩码标签的拉普拉斯卷积和用于线性组合的卷积;
其中通过边缘头进行通道压缩,并进行上采样输出边缘输出掩膜,通过拉普拉斯卷积和用于线性组合图像的卷积对掩膜标签进行处理输出边缘掩膜标签,采用边缘掩膜标签对边缘输出掩膜进行监督。
具体的,如图2所示,为本发明提供的基于短程稠密连接模块和注意力机制的双流图像篡改定位网络的网络结构图,所构建的网络包含两部分:边缘引导分支和篡改定位分支。
所述篡改定位分支包含有5个阶段,其中阶段1和阶段2进行下采样提取图像浅层特征,即在阶段1和阶段2中采用快速下采样的策略,每个阶段进行一次步长为2的3×3卷积,从而对图像进行下采样,减少冗余的图像特征,同时提取并保留重要的浅层特征;阶段3、阶段4和阶段5采用短程稠密连接模块即STDC模块作为网络的骨架,其中阶段2的输出作为阶段3的输入、阶段3的输出作为阶段4的输入、阶段4的输出作为阶段5的输入;阶段3、阶段4、阶段5中通过采用STDC模块作为网络骨架,由于STDC能够拥有大小不同的感受野以及提供多尺度的信息,并且在速度上具有极大的优势,因此能够提取足够丰富和更高级的篡改特征,也能够维持快速的计算速度。
所述篡改定位分支还包括对阶段3、阶段4和阶段5的输出进行进一步处理的定位头、注意力精修模块、全局平均池化模块、位置注意力模块、特征融合模块;
所述边缘头(Edge Head)和定位头(Location Head,Loc Head)的结构如图6所示,由一个3×3的卷积,一个BatchNorm层(简称BN),一个ReLU激活函数和一个1×1的卷积依次连接构成,输入图像通过边缘头或定位头进行处理,对通道进行压缩,得到掩膜图。
所述边缘引导分支包括:用于通道压缩的边缘头、用于生成边缘掩码标签的拉普拉斯卷积和用于线性组合的卷积;其中边缘引导分支中的边缘载对阶段3的输出进行通道压缩,将阶段3中含有长、宽、通道的三维数据进行通道压缩得到一个二维图像,而由于在阶段1、阶段2、阶段3中均各进行了一次步长为2的下采样,因此为了保持输入输出图像分辨率的一致性,在通过边缘头进行通道压缩后进行8倍上采样,输出还原至原始分辨率的边缘输出掩膜;边缘引导分支中的拉普拉斯卷积(Laplacian Conv)对输入图像的掩膜标签进行处理,通过3个步长为1、2、4的拉普拉斯卷积分别对输入图像的掩膜标签进行处理,分别输出对应的掩膜,并对由步长为4的拉普拉斯卷积输出的掩膜进行4倍上采样,对由步长为2的拉普拉斯卷积输出的掩膜进行2倍上采样,对经过拉普拉斯卷积和上采样得到的掩膜通过一个1×1的卷积进行线性组合,自适应的融合来自拉普拉斯卷积后的不同尺寸特征,从而输出含有篡改边缘信息边缘掩膜标签,并通过输出的边缘掩膜标签对边缘输出掩膜进行监督;该监督引导网络从运算开始就注意到篡改边缘的浅层特征,如篡改的边缘或角点等,又由于视觉上的篡改痕迹常常暴露在篡改的边缘附近,因此这些篡改边缘的浅层特征对于网络的篡改定位是有利的,通过边缘引导分支进行监督从而训练优化阶段3,使得其能够提取得到浅层篡改特征。
进一步的,所述阶段3、阶段4、阶段5采用短程稠密连接模块提取图像篡改特征,具体包括:
阶段3提取图像篡改特征后,采用第一定位头对阶段3输出的图像进行通道压缩,进行上采样,输出第一掩膜,采用掩膜标签对第一掩膜进行监督。
具体的,对阶段3的输出采用第一定位头(Location Head,Loc Head)进行通道压缩,将阶段3中含有长、宽、通道的三维数据进行通道压缩得到一个二维图像,而由于在阶段1、阶段2、阶段3中均各进行了一次步长为2的下采样,因此为了保持输入输出图像分辨率的一致性,在通过定位头进行通道压缩后进行8倍上采样,输出还原至原始分辨率的第一掩膜,通过掩膜标签对第一掩膜进行监督,从而训练优化网络,让网络保留更多的非边缘的篡改特征,进而让网络在训练优化后不会趋向于检测篡改图像的边缘,同时通过浅层的篡改特征能够定位出篡改的轮廓。
进一步的,所述阶段1和阶段2使用步长为2的卷积层进行下采样提取图像浅层特征,阶段3、阶段4、阶段5采用短程稠密连接模块提取图像篡改特征,5个阶段依次连接,所述篡改定位分支还包括对阶段3、阶段4和阶段5的输出进行进一步处理的定位头、注意力精修模块、全局平均池化模块、位置注意力模块、特征融合模块,具体包括:
所述阶段3的输出作为阶段4的输入,所述阶段4的输出作为阶段5的输入;
通过阶段4得到对应的第四阶段输出,对第四阶段输出采用注意力精修模块进行精修得到第四阶段精修输出;
通过阶段5得到对应的第五阶段输出,将阶段5的全局平均池化信息加入到第五阶段输出中,得到第五阶段全局输出;
通过阶段5得到对应的第五阶段输出,对第五阶段输出采用注意力精修模块进行精修并采用位置注意力模块聚集篡改语义信息,得到第五阶段聚集输出;
对第五阶段全局输出和第五阶段聚集输出做对应元素相加操作,并进行上采样,得到第五阶段连接输出;
对第五阶段连接输出、第五阶段全局输出和第四阶段精修输出进行对应元素相加操作,并进行上采样操作得到跨层连接输出;
通过阶段3得到对应的第三阶段输出,对第三阶段输出和跨层连接输出采用特征融合模块融合特征,得到融合特征输出。
具体的,所述注意力精修模块(Attention Refine module,ARM)具体结构如图3所示,所述注意力精修模块包含有一个全局平均池化层、一个1×1的卷积,1个BatchNorm层(简称BN)和一个Sigmoid激活函数,从而对输入通过全局平均池化(Global pool)计算通道注意向量,模拟通道注意力机制,来赋予不同通道内的提取到的篡改特征的权重,实现对通道中不同篡改区域赋予不同权重的效果;所述全局平均池化模块(Global averagepooling,GAP)包含有全局平均池化信息,具体的在图一中的全局平局池化模块中包含的是阶段5中的全局平均池化信息;所述位置注意力模块(Position Attention Module,PAM)的结构如图5所示,其中重塑为Reshape、转置为Transpose、位置注意力图为PositionAttention Map,位置注意力模块对输入分别进行卷积后得到Q、K、V三个变量,并对Q、K进行矩阵相乘,求得输入特征的各个部分之间的相关性,在通过Softmax进行归一化得到位置注意力图,使用位置注意力图和V进行矩阵相乘后再与最初的输入进行矩阵相乘操作得到位置注意力输出;所述特征融合模块(Feature Fusion Module,FFM)的结构如图4所示,其包含有一个Concet函数、一个1×1的卷积、一个BN层和一个ReLU激活函数对输入的数据进行处理得到第一数据,再对第一数据进行全局池化处理,通过Gl obal Pool、1×1的卷积、ReLU激活函数、1×1的卷积和一个Sigmoid对第一数据进行处理得到第二数据,对第一数据和第二数据做矩阵相乘操作,得到第三数据,对第三数据和第一数据做对应元素相加操作,得到最终特征融合后的输出。
通过阶段4得到对应的第四阶段输出,对第四阶段输出采用注意力精修模块进行精修通过全局平均池化来计算通道注意向量,模拟通道注意力机制,来赋予不同通道内的提取到的篡改特征的权重,得到第四阶段精修输出;
通过阶段5得到对应的第五阶段输出,将阶段5的全局平均池化信息加入到第五阶段输出中,得到第五阶段全局输出;
通过阶段5得到对应的第五阶段输出,对第五阶段输出采用注意力精修模块进行精修并采用位置注意力模块增强篡改区域内部的特征之间的联系,聚集更强烈的篡改语义信息,得到第五阶段聚集输出;
对第五阶段全局输出和第五阶段聚集输出做对应元素相加操作,使得每个精修后的输出特征含有最强且一致的语义约束,这种语义约束能够使得网络关注整个篡改区域本身,而不是非篡改区域或篡改区域的某部分,如噪声和篡改边缘,再进行上采样恢复图像分辨率,得到第五阶段连接输出;对第五阶段连接输出、第五阶段全局输出和第四阶段精修输出进行对应元素相加操作,并进行上采样恢复图像分辨率得到跨层连接输出;通过阶段3得到对应的第三阶段输出,对第三阶段输出和跨层连接输出采用特征融合模块融合浅层的边缘特征,加强篡改区域的边缘并恢复图像分辨率,得到融合特征输出。
如图二所示,所述对阶段4、阶段5的输出进行处理得到跨层连接输出,其对应的输入输出关系式具体为:
Figure BDA0004012908520000131
其中,X表示跨层连接输出,X5表示第五阶段输出,X4表示第四阶段输出,
Figure BDA0004012908520000141
表示对应元素相加操作,
Figure BDA0004012908520000142
表示2倍上采样操作,PAM()表示位置注意力模块处理,ARM()注意力精修模块处理,GAP()表示全局平均池化模块处理。
再进一步的,所述得到融合特征输出后,采用第二定位头进行通道压缩,并进行上采样,输出第二掩膜,采用掩膜标签对第二掩膜进行监督。
具体的,由于在网络的阶段1、阶段2采用快速下采样的策略,丢弃冗余特征,因此在采用第二定位头进行通道压缩,并采用八倍上采样将输出特征图还原至原始分辨率,进而输出第二掩膜,采用掩膜标签对第二掩膜进行监督,从而优化网络,从而让网络输出的第二掩膜于掩膜标签的相似度更加接近。
因此,通过在网络上设置引入监督,用于抑制网络对图像边缘信息深度学***均池化信息的连接方式,设置注意力机制和特征融合模块,使得构建的网络在图像篡改定位性能上得到很大提高。
步骤S20、对篡改定位网络进行训练,得到基于短程稠密连接和注意力机制的双流图像篡改定位模型;
具体的,对构建好的篡改定位网络进行训练,从而通过训练的结果不断地优化参数,使得最终得到可以很好对图像篡改定位的基于短程稠密连接和注意力机制的双流图像篡改定位模型。
进一步的,所述对篡改定位网络进行训练,得到基于短程稠密连接和注意力机制的双流图像篡改定位模型,具体包括:
采用脚本生成篡改图像以及对应的掩膜标签作为数据集1,对数据集1进行划分得到训练集和验证集,对训练集和验证集固定图像大小进行裁剪,其中裁剪区域包含篡改区域,得到数据集2,采用数据集2对篡改定位网络进行训练;
训练过程中,通过边缘掩膜标签对边缘输出掩膜进行监督得到边缘损失,掩膜标签对第一掩膜进行监督得到第一篡改损失,掩膜标签对第二掩膜进行监督得到第二篡改损失;对边缘损失、第一篡改损失、第二篡改损失进行加和操作得到最终损失;
基于得到的最终损失对基于短程稠密连接和注意力机制的双流图像篡改定位网络进行优化,当最终损失达到预定要求,同时掩膜标签与第二掩膜的相似度达到预定要求时,输出基于短程稠密连接和注意力机制的双流图像篡改定位模型。
进一步的,所述对训练集和验证集固定图像大小进行裁剪时采用滑动窗口算法进行裁剪,得到数据集2;
所述基于得到的最终损失对基于短程稠密连接和注意力机制的双流图像篡改定位网络进行优化具体采用梯度下降算法优化整个网络的参数。
具体的,在构建好网络后,对网络进行相应的训练,采用脚本生成篡改图像以及对应的掩膜标签作为数据集1,对数据集1进行划分得到训练集和验证集,对训练集和验证集中图像的大小进行固定,得到数据集2,采用数据集2对篡改定位网络进行训练;其中通过对数据集1中图片进行大小固定以便网络批归一化数据,加快训练速度,
在一种实施方式中,其中所述训练集采用脚本生成,优选的,可以采用Photoshop脚本自动生成多张高分辨率的篡改图像以及对应的篡改标签;即使用Photoshop脚本自动生成2万张高分辨率的篡改图像以及对应的篡改标记作为数据集1,将其按照9:1的比例随机划分训练集和验证集,然后固定512×512的窗口,对数据集1中的训练集进行滑窗算法,即将含有篡改区域的15%-30%区域裁剪,得到含有篡改区域的512×512的训练集,同样的做法得到含有篡改区域的512×512的验证集,将512×512的训练集和验证集标记为数据集2,在网络训练和验证过程中只使用到数据集2,数据集1只是为了生成数据集2,最终得到24万张训练集,2万张验证集。
在得到用于训练的数据集2后,对构建的基于短程稠密连接和注意力机制的双流图像篡改定位网络进行训练,具体的训练过程中,通过边缘掩膜标签对边缘输出掩膜进行监督得到边缘损失,掩膜标签对第一掩膜进行监督得到第一篡改损失,掩膜标签对第二掩膜进行监督得到第二篡改损失;对边缘损失、第一篡改损失、第二篡改损失进行加和操作得到最终损失;基于得到的最终损失对基于短程稠密连接和注意力机制的双流图像篡改定位网络进行优化,当最终损失达到预定要求,同时掩膜标签与第二掩膜的相似度达到预定要求时,输出基于短程稠密连接和注意力机制的双流图像篡改定位模型;
其中,所述掩膜标签是输入图像携带的信息;所述通过监督得到对应损失具体为计算输出掩膜和掩膜标签或边缘掩膜标签之间的损失即相似度,得到对应的损失,通过训练优化网络参数来使网络损失最小化;所述使用Dice系数作为篡改损失(Tamper Loss),采用二分类交叉损失熵(Binary Cross Entropy Loss,BCE)和Dice系数作为边缘损失(EdgeLoss),即
Ledge=Ldice+Lbce
Figure BDA0004012908520000161
其中Ledge表示边缘损失,Ldice表示采用Dice系数得到的损失,Lbce表示采用二分类交叉损失熵得到的损失,Loss为整个网络最终的损失,
Figure BDA0004012908520000162
表示第一篡改损失,
Figure BDA0004012908520000163
表示第二篡改损失,所有损失函数的权重可以调节,且在本发明中均默认设置为1。
所述优化网络采用的方式是随机梯度下降和反向传播的方式来优化整个网络模型的参数,从后往前调整每个参数,最终当最终损失达到预定要求,同时掩膜标签与第二掩膜的相似度达到预定要求时,认为训练的模型达到用户要求,输出基于短程稠密连接和注意力机制的双流图像篡改定位模型。
所述预定要求是用户根据个人要求设置的Loss最小值。
在一种实施方式中,通过在Photoshop脚本数据集上来训练基于短程稠密连接和注意力机制的双流图像篡改定位网络,其中采用使用Adam优化器,初始学习率设置为1×10-4,采用指数衰减学习率策略,衰减系数0.8,每一次训练32个样本,一共训练20代,对网络进行训练,当Loss达到要求后,输出基于短程稠密连接和注意力机制的双流图像篡改定位模型。
在第二种实施方式中对DenseFCN(Dense Fully Convolutional Netw ork,稠密全卷积神经网络)和STDCNet(采用STDC模块对应构建的网络)以及本发明所训练得到的网络模型(表示为Ours)在Photoshop脚本数据集上训练,并在1000张PS_arbitrary(PS任意数据集)和1000张PS_bo undary(PS边界数据集)数据集上测试,主要测试指标为F1指数(越大表明模型质量越高)和AUC(是ROC曲线下的面积,衡量学习器优劣的一种性能指标,越大表明模型整体性能越好)。结果如表1所示,由结果可知,本发明方法相比于目前主流的篡改定位方式DFCN和STDCNet,在测试性能上均有所很大提高。
表1不同方法使用Photoshop脚本训练后的篡改定位性能(AUC/F1)
Figure BDA0004012908520000171
在第三种实施方式中,在1000张原始图像上通过PS进行1000次伪造得到的PS任意数据集上进行微调对网络模型性能进行测试,测试结果如表2所示,由表中可知,本发明方法在微调之后的性能,与目前主流的篡改定位方式DFCN、STDCNet相比性能更优。
表2不同方法使用10%的Photoshop篡改图像微调后的的篡改定位性能(AUC/F1)
Figure BDA0004012908520000172
Figure BDA0004012908520000181
在第四种实施方式中,对DenseFCN和STDCNet以及本发明所训练得到的网络模型,在同一张V100的显卡上同时对一张1024×1024的图像进行篡改定位,结果如下表3。由表3可知,本发明所提供的网络推理速度达到40FPS,相比于DenseFCN在速度上更快,并且相比于STDCNet,所消耗几乎忽略不计的时间成本,在精度与效率上实现了更优的权衡。
表3网络速度比较(由一张V100显卡处理一张1024×1024图像)
Figure BDA0004012908520000182
由以上的几种实施方式可以得到,所述训练完成的网络推理速度达到40FPS,超过主流的目前篡改定位网络的推理速度,同时在PS数据集的篡改定位性能优于其他篡改定位网络,体现了网络在速度与精度的更优匹配。
步骤S30、使用训练好的网络模型,对输入的待测图像进行篡改定位,输出定位结果。
具体的,在训练得到基于短程稠密连接和注意力机制的双流图像篡改定位模型后,输入图像后,输出对应的第二掩膜即为最终输出,该输出中对篡改区域进行了定位。
如图7所示,为本发明实施例提供的网络特征可视化特征图,其中第一列为5个输入图像,第二列为对应的标签,第三列至第五列分别为STDC Net的在Stage3、FFM以及预测图,第六列至第八列分别为本发明提供网络在Stage3、FFM以及预测图;由图可得通过本发明最终输出的预测图更加接近对应的标签。
示例性设备
如图8中所示,基于上述基于短程稠密连接和注意力机制的双流图像篡改定位方法,本发明实施例提供了一种基于短程稠密连接和注意力机制的双流图像篡改定位装置,该装置包括:
网络构建模块81,构建基于短程稠密连接模块和注意力机制的双流图像篡改定位网络;
模型训练模块82,对篡改定位网络进行训练,得到基于短程稠密连接和注意力机制的双流图像篡改定位模型;
处理模块83,使用训练好的网络模型,对输入的待测图像进行篡改定位,输出定位结果。
基于上述实施例,本发明还提供了一种计算机可读存储介质,其特征在于,其上存储有基于短程稠密连接和注意力机制的双流图像篡改定位方法,所述基于短程稠密连接和注意力机制的双流图像篡改定位方法被处理器执行时,实现如上述任一项所述的基于短程稠密连接和注意力机制的双流图像篡改定位方法的步骤。
基于上述实施例,本发明还提供了一种终端设备。所述终端设备包括处理器、存储器及通信总线;所述存储器上存储有可被所述处理器执行的计算机可读程序;
所述通信总线实现处理器和存储器之间的连接通信;
所述处理器执行所述计算机可读程序时实现如如上所述的基于短程稠密连接和注意力机制的双流图像篡改定位方法中的步骤。
综上所述,本发明提供了一种基于短程稠密连接和注意力机制的双流图像篡改定位方法、装置、设备及存储介质,所述方法包括构建基于短程稠密连接模块和注意力机制的双流图像篡改定位网络;对篡改定位网络进行训练,得到基于短程稠密连接和注意力机制的双流图像篡改定位模型;使用训练好的网络模型,对输入的待测图像进行篡改定位,输出定位结果。这样在多媒体信息安全与取证领域上,本发明基于短程稠密连接模块和注意力机制构建一个网络,在该网络中引入注意力机制,同时改变全局平均池化信息的连接方式,使得构建的网络能够应用于图像篡改方面时能够在捕捉边缘分支特征的同时可以捕捉到全局性的篡改特征,从而能够得到完整的篡改区域,此外构建的网络是基于短程稠密连接模块构建的,使得所构建的网络拥有原本短程稠密连接模块处理速度快的特点,从而让本发明构建的网络具有处理速度快、处理准确性高的效果;再对该网络进行训练后得到能够达到用户使用目标的网络模型,从而使用该模型处理图像,可以高效准确的得到图像篡改定位结果;此外,本发明综合考虑篡改定位性能和检测效率,提出了一种新的网络结构,基于短程稠密连接和注意力机制的图像篡改定位网络,实现篡改定位性能与检测效率的权衡。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本发明所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRA M)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRA M)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRA M)等。
应当理解的是,本发明的应用不限于上述的举例,对本领域的技术人员来说,可以根据上述说明加以改进或变换,所有这些改进和变化都属于本发明所附权利要求的保护范围。

Claims (10)

1.一种基于短程稠密连接和注意力机制的双流图像篡改定位方法,其特征在于,所述方法包括:
构建基于短程稠密连接模块和注意力机制的双流图像篡改定位网络;
对篡改定位网络进行训练,得到基于短程稠密连接和注意力机制的双流图像篡改定位模型;
使用训练好的网络模型,对输入的待测图像进行篡改定位,输出定位结果。
2.根据权利要求1所述一种基于短程稠密连接和注意力机制的双流图像篡改定位方法,其特征在于,所述设计基于短程稠密连接模块和注意力机制的双流图像篡改定位网络,具体包括:
所述双流图像篡改定位网络由边缘引导分支和篡改定位分支构成;
所述篡改定位分支包括5个阶段,其中阶段1和阶段2使用步长为2的卷积层进行下采样提取图像浅层特征,阶段3、阶段4、阶段5采用短程稠密连接模块提取图像篡改特征,5个阶段依次连接;
所述篡改定位分支还包括对阶段3、阶段4和阶段5的输出进行进一步处理的定位头、注意力精修模块、全局平均池化模块、位置注意力模块、特征融合模块;
所述边缘引导分支包括:用于通道压缩的边缘头、用于生成边缘掩码标签的拉普拉斯卷积和用于线性组合的卷积;
其中通过边缘头进行通道压缩,并进行上采样输出边缘输出掩膜,通过拉普拉斯卷积和用于线性组合图像的卷积对掩膜标签进行处理输出边缘掩膜标签,采用边缘掩膜标签对边缘输出掩膜进行监督。
3.根据权利要求2所述一种基于短程稠密连接和注意力机制的双流图像篡改定位方法,其特征在于,所述阶段3、阶段4、阶段5采用短程稠密连接模块提取图像篡改特征,具体包括:
阶段3提取图像篡改特征后,采用第一定位头对阶段3输出的图像进行通道压缩,进行上采样,输出第一掩膜,采用掩膜标签对第一掩膜进行监督。
4.根据权利要求2所述一种基于短程稠密连接和注意力机制的双流图像篡改定位方法,其特征在于,所述阶段1和阶段2使用步长为2的卷积层进行下采样提取图像浅层特征,阶段3、阶段4、阶段5采用短程稠密连接模块提取图像篡改特征,5个阶段依次连接,所述篡改定位分支还包括对阶段3、阶段4和阶段5的输出进行进一步处理的定位头、注意力精修模块、全局平均池化模块、位置注意力模块、特征融合模块,具体包括:
所述阶段3的输出作为阶段4的输入,所述阶段4的输出作为阶段5的输入;
通过阶段4得到对应的第四阶段输出,对第四阶段输出采用注意力精修模块进行精修得到第四阶段精修输出;
通过阶段5得到对应的第五阶段输出,将阶段5的全局平均池化信息加入到第五阶段输出中,得到第五阶段全局输出;
通过阶段5得到对应的第五阶段输出,对第五阶段输出采用注意力精修模块进行精修并采用位置注意力模块聚集篡改语义信息,得到第五阶段聚集输出;
对第五阶段全局输出和第五阶段聚集输出进行对应元素相加操作,并进行上采样,得到第五阶段连接输出;
对第五阶段连接输出、第五阶段全局输出和第四阶段精修输出进行对应元素相加操作,并进行上采样操作得到跨层连接输出;
通过阶段3得到对应的第三阶段输出,对第三阶段输出和跨层连接输出采用特征融合模块融合特征,得到融合特征输出。
5.根据权利要求4所述一种基于短程稠密连接和注意力机制的双流图像篡改定位方法,其特征在于,所述得到融合特征输出后,采用第二定位头进行通道压缩,并进行上采样,输出第二掩膜,采用掩膜标签对第二掩膜进行监督。
6.根据权利要求1-5所述一种基于短程稠密连接和注意力机制的双流图像篡改定位方法,其特征在于,所述对篡改定位网络进行训练,得到基于短程稠密连接和注意力机制的双流图像篡改定位模型,具体包括:
采用脚本生成篡改图像以及对应的掩膜标签作为数据集1,对数据集1进行划分得到训练集和验证集,对训练集和验证集固定图像大小进行裁剪,其中裁剪区域包含篡改区域,得到数据集2,采用数据集2对篡改定位网络进行训练;
训练过程中,通过边缘掩膜标签对边缘输出掩膜进行监督得到边缘损失,掩膜标签对第一掩膜进行监督得到第一篡改损失,掩膜标签对第二掩膜进行监督得到第二篡改损失;对边缘损失、第一篡改损失、第二篡改损失进行加和操作得到最终损失;
基于得到的最终损失对基于短程稠密连接和注意力机制的双流图像篡改定位网络进行优化,当最终损失达到预定要求,同时掩膜标签与第二掩膜的相似度达到预定要求时,输出基于短程稠密连接和注意力机制的双流图像篡改定位模型。
7.根据权利要求6所述一种基于短程稠密连接和注意力机制的双流图像篡改定位方法,其特征在于:
所述对训练集和验证集固定图像大小进行裁剪时采用滑动窗口算法进行裁剪,得到数据集2;
所述基于得到的最终损失对基于短程稠密连接和注意力机制的双流图像篡改定位网络进行优化具体采用梯度下降算法优化整个网络的参数。
8.一种基于短程稠密连接和注意力机制的双流图像篡改定位装置,其特征在于,所述装置包括:
网络构建模块,构建基于短程稠密连接模块和注意力机制的双流图像篡改定位网络;
模型训练模块,对篡改定位网络进行训练,得到基于短程稠密连接和注意力机制的双流图像篡改定位模型;
处理模块,使用训练好的网络模型,对输入的待测图像进行篡改定位,输出定位结果。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如权利要求1-7任意一项所述的基于短程稠密连接和注意力机制的双流图像篡改定位方法中的步骤。
10.一种终端设备,其特征在于,包括:处理器、存储器及通信总线;所述存储器上存储有可被所述处理器执行的计算机可读程序;
所述通信总线实现处理器和存储器之间的连接通信;
所述处理器执行所述计算机可读程序时实现如权利要求1-7任意一项所述的基于短程稠密连接和注意力机制的双流图像篡改定位方法中的步骤。
CN202211656271.3A 2022-12-22 2022-12-22 基于短程稠密连接和注意力机制的双流图像篡改定位方法 Pending CN116052043A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211656271.3A CN116052043A (zh) 2022-12-22 2022-12-22 基于短程稠密连接和注意力机制的双流图像篡改定位方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211656271.3A CN116052043A (zh) 2022-12-22 2022-12-22 基于短程稠密连接和注意力机制的双流图像篡改定位方法

Publications (1)

Publication Number Publication Date
CN116052043A true CN116052043A (zh) 2023-05-02

Family

ID=86124918

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211656271.3A Pending CN116052043A (zh) 2022-12-22 2022-12-22 基于短程稠密连接和注意力机制的双流图像篡改定位方法

Country Status (1)

Country Link
CN (1) CN116052043A (zh)

Similar Documents

Publication Publication Date Title
CN111738244B (zh) 图像检测方法、装置、计算机设备和存储介质
CN111274995B (zh) 视频分类方法、装置、设备和计算机可读存储介质
CN111126258B (zh) 图像识别方法及相关装置
JP7490141B2 (ja) 画像検出方法、モデルトレーニング方法、画像検出装置、トレーニング装置、機器及びプログラム
CN111814794B (zh) 文本检测方法、装置、电子设备及存储介质
CN114092833B (zh) 遥感图像分类方法、装置、计算机设备和存储介质
Xianbao et al. An improved small object detection method based on Yolo V3
CN111738270B (zh) 模型生成方法、装置、设备和可读存储介质
CN111985374A (zh) 人脸定位方法、装置、电子设备及存储介质
CN115861462B (zh) 图像生成模型的训练方法、装置、电子设备及存储介质
CN116071650A (zh) 一种融合卷积神经网络与Transformer的遥感影像建筑物提取方法
CN112560733A (zh) 面向两期遥感影像的多任务处理***及方法
Jain et al. An efficient image forgery detection using biorthogonal wavelet transform and improved relevance vector machine
CN116310850A (zh) 基于改进型RetinaNet的遥感图像目标检测方法
CN111709415A (zh) 目标检测方法、装置、计算机设备和存储介质
Sabeena et al. Convolutional block attention based network for copy-move image forgery detection
CN111401335B (zh) 一种关键点检测方法及装置、存储介质
CN112183303A (zh) 变电设备图像分类方法、装置、计算机设备和介质
CN116052043A (zh) 基于短程稠密连接和注意力机制的双流图像篡改定位方法
CN114241411B (zh) 基于目标检测的计数模型处理方法、装置及计算机设备
CN115661472A (zh) 图像查重方法、装置、计算机设备及存储介质
CN113496228B (zh) 一种基于Res2Net、TransUNet和协同注意力的人体语义分割方法
CN116778214A (zh) 一种行为检测方法、装置、设备及其存储介质
CN114677504A (zh) 目标检测方法、装置、设备终端和可读存储介质
CN116563898A (zh) 基于GhostNet网络的掌静脉图像识别方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination