CN111445418A - 图像去雾处理方法、装置及计算机设备 - Google Patents

图像去雾处理方法、装置及计算机设备 Download PDF

Info

Publication number
CN111445418A
CN111445418A CN202010243548.4A CN202010243548A CN111445418A CN 111445418 A CN111445418 A CN 111445418A CN 202010243548 A CN202010243548 A CN 202010243548A CN 111445418 A CN111445418 A CN 111445418A
Authority
CN
China
Prior art keywords
image
defogged
defogging
network
channels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010243548.4A
Other languages
English (en)
Other versions
CN111445418B (zh
Inventor
王钰桥
韩岩
谭松波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN202010243548.4A priority Critical patent/CN111445418B/zh
Publication of CN111445418A publication Critical patent/CN111445418A/zh
Application granted granted Critical
Publication of CN111445418B publication Critical patent/CN111445418B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/73Deblurring; Sharpening
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20172Image enhancement details
    • G06T2207/20192Edge enhancement; Edge preservation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

本申请提供了一种图像去雾处理方法、装置及计算机设备,在获取待处理有雾图像后,本申请将获取待处理有雾图像的对象边缘特征,将其与待处理有雾图像原有的通道结合,得到待去雾图像后,才将该待去雾图像输入去雾模型进行处理,以使得去雾模型在图像去雾处理过程中,还能够考虑到待去雾图像中的对象边缘特征,以保证输出去雾图像的清晰度;且由于模型中的SE网络结构中原有的全连接层替换成卷积层,压缩了网络参数,提高了图像去雾处理效率,且通过计算待去雾图像的多个维度的注意力权重,据此提升对图像去雾处理更多有用特征并抑制更多用处不大的特征,从而提升模型处理的准确率,进一步提高图像去雾效果及去雾处理效率。

Description

图像去雾处理方法、装置及计算机设备
技术领域
本申请主要涉及图像处理技术领域,更具体地说是涉及一种图像去雾处理方法、装置及计算机设备。
背景技术
雾霾是由空气中的灰尘和烟雾等小的漂浮颗粒产生的常见大气现象。在视频监控,远程感应,自动驾驶等应用场景下,若处于雾霾环境下进行图像采集,通常会因这些漂浮的颗粒对光的吸收和散射,使得采集到的图像为可见度底、色彩暗淡且对比度低的有雾图像,严重影响图像处理效果,甚至会导致无法满足应用场景的需求。
对此,现有技术通常是采用一种端到端网络DehazeNeT,或者是一种端到端门控上下文聚合网络GCANeT,实现有雾图像的处理;前者网络可以估计有雾图像的介质透射率,再通过大气散射模型恢复清晰图像。后者网络通过聚合上下文信息并融合不同级别的特征,预测目标干净图像(即去雾图像)和有雾图像之间的残留,具体实现对有雾图像的去雾处理,满足应用场景对图像的去雾要求。
然而,现有的图像去雾处理方式所达到的去雾效果有限,且由于训练网络的参数量较大,导致图像处理速度慢,降低了图像去雾处理效率。
发明内容
有鉴于此,为了提高图像去雾处理效率及效果,本申请提供了一种图像去雾处理方法,所述方法包括:
获取待处理有雾图像;
获取所述待处理有雾图像的对象边缘特征;
将所述对象边缘特征作为所述待处理有雾图像的新通道,得到具有特定数量通道的待去雾图像;
将所述待去雾图像输入去雾模型进行处理,输出所述待处理有雾图像对应的无雾图像;
其中,所述去雾模型是基于机器学习网络模型,对具有特定数量通道的样本有雾图像进行训练得到的,所述机器学习网络模型具有SE层网络结构,且所述SE层网络结构是利用卷积层,实现对所输入的待去雾图像的多个维度各自的注意力权重的计算。
在一些实施例中,所述去雾模型对所述待去雾图像的处理包括:
利用所述SE层网络结构中的卷积层,获取输入所述SE层网络结构的待去雾图像对应的各通道的图像特征的通道权重,以及各像素的像素权重。
在一些实施例中,所述利用所述SE层网络结构中的卷积层,获取输入所述SE网络的待去雾图像对应的各通道的图像特征的通道权重,以及各像素的像素权重,包括:
通过注意力机制,对获取的待去雾图像对应的各通道的图像特征进行卷积运算,得到各通道的图像特征对应的通道权重,以利用所述通道权重对所述各通道的图像特征进行加权运算;
通过注意力机制,对获取的待去雾图像的像素信息进行卷积运算,得到所述待去雾图像包含的不同像素的像素权重,以利用所述像素权重对获取的待去雾图像的像素进行加权运算。
在一些实施例中,所述机器学习网络模型至少还具有深度可分离卷积层、下采样网络、残差网络之中的多个组合,所述去雾模型对所述待去雾图像的处理还包括以下多种组合:
通过所述深度可分离卷积层,对输入的所述待去雾图像对应的各通道的图像特征进行扩展处理,输出扩展通道后对应的图像特征;
利用所述下采样网络包含的不同尺寸的卷积核,对输入的所述待去雾图像对应的各通道的图像特征进行处理,输出相同数量通道分别对应的图像特征;
利用所述残差网络包含的多个平滑残差块,对输入的图像特征进行平滑处理,所述平滑残差块包含的两个空洞卷积层的扩张值不同。
在一些实施例中,所述利用所述下采样网络包含的不同尺寸的卷积核,对输入的所述待去雾图像对应的各通道的图像特征进行处理,输出相同数量通道分别对应的图像特征,包括:
将第一数量通道各自的图像特征输入第一尺寸的第一卷积核进行运算,输出第二数量通道分别对应的图像特征,所述第二数量大于所述第一数量,所述第一数量大于所述特定数量;
将所述第二数量通道各自的图像特征输入第二尺寸的第二卷积核进行运算,输出第三数量通道分别对应的图像特征,所述第三数量等于所述第二数量;
将所述第三数量通道各自的图像特征输入第二尺寸的第三卷积核进行运算,输出第四数量通道分别对应的图像特征,所述第四数量等于所述第一数量。
在一些实施例中,所述去雾模型对所述待去雾图像的处理还包括:
将所述下采样网络输出的图像特征与输入所述下采样网络前的图像特征进行级联融合处理,以增加输入至与所述下采样网络连接的网络的图像特征数量。
在一些实施例中,所述获取所述待处理有雾图像的对象边缘特征,包括:
获取所述待处理有雾图像具有的每一个通道的图像梯度变化;
获取所述待处理有雾图像具有的多个通道的图像梯度变化的平均图像梯度变化,由所述平均图像梯度变化确定所述待处理有雾图像的对象边缘特征。
本申请还提出了一种图像去雾处理装置,所述装置包括:
待处理有雾图像获取模块,用于获取待处理有雾图像;
对象边缘特征获取模块,用于获取所述待处理有雾图像的对象边缘特征;
待去雾图像得到模块,用于将所述对象边缘特征作为所述待处理有雾图像的新通道,得到具有特定数量通道的待去雾图像;
去雾处理模块,用于将所述待去雾图像输入去雾模型进行处理,输出所述待处理有雾图像对应的无雾图像;
其中,所述去雾模型是基于机器学习网络模型,对具有特定数量通道的样本有雾图像进行训练得到的,所述机器学习网络模型具有SE层网络结构,且所述SE层网络结构是利用卷积层,实现对所输入的待去雾图像的多个维度各自的注意力权重的计算。
在一些实施例中,所述去雾处理模块包括:
注意力权重获取单元,用于利用所述SE层网络结构中的卷积层,获取输入所述SE网络的待去雾图像对应的各通道的图像特征的通道权重,以及各像素的像素权重。
本申请还提出了一种计算机设备,所述计算机设备包括:
存储器,用于存储实现如上述的图像去雾处理方法的程序;
处理器,用于加载并执行所述存储器存储的所述程序,以实现如上所述的图像去雾处理方法的各个步骤。
由此可见,与现有技术相比,本申请提供了一种图像去雾处理方法、装置及计算机设备,在获取待处理有雾图像后,本申请将获取待处理有雾图像的对象边缘特征,将其与待处理有雾图像原有的通道结合,得到待去雾图像后,才将该待去雾图像输入去雾模型进行处理,以使得去雾模型在图像去雾处理过程中,还能够考虑到待去雾图像中的对象边缘特征,以保证输出去雾图像的清晰度;且由于模型中的SE网络结构中原有的全连接层替换成卷积层,压缩了网络参数,提高了图像去雾处理效率,且通过计算待去雾图像的多个维度的注意力权重,据此提升对图像去雾处理更多有用特征并抑制更多用处不大的特征,从而提升模型处理的准确率,进一步提高图像去雾效果及去雾处理效率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1示出了本申请提出的图像去雾方法的一应用场景示意图;
图2示出了本申请实施例提出的一种计算机设备的硬件结构示意图
图3示出了本申请提出的图像去雾处理方法的一可选示例的流程示意图;
图4示出了本申请提出的图像去雾处理方法的又一可选示例的流程示意图;
图5示出了适用于本申请提出的图像去雾处理方法的去雾模型中,SE层网络结构的一可选结构示意图;
图6示出了本申请提出的图像去雾处理方法的又一可选示例的流程示意图;
图7示出了适用于本申请提出的图像去雾处理方法的去雾模型中,深度可分离卷积层的一可选结构示意图;
图8a示出了现有的下采样网络的结构示意图;
图8b示出了适用于本申请提出的图像去雾处理方法的去雾模型中,下采样网络的一可选结构示意图;
图9示出了适用于本申请提出的图像去雾处理方法的去雾模型中,残差网络中平滑残差块的一可选结构示意图;
图10示出了适用于本申请提出的图像去雾处理方法的去雾模型中,SE融合层的一可选网络结构示意图;
图11示出了适用于本申请提出的图像去雾处理方法的去雾模型的一可选网络结构示意图;
图12示出了本申请提出的图像去雾处理装置的一可选示例的结构示意图;
图13示出了本申请提出的图像去雾处理装置的又一可选示例的结构示意图;
图14示出了本申请提出的图像去雾处理装置的又一可选示例的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
应当理解,本申请中使用的“***”、“装置”、“单元”和/或“模块”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而,如果其他词语可实现相同的目的,则可通过其他表达来替换该词语。
如本申请和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其它的步骤或元素。由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
其中,在本申请实施例的描述中,除非另有说明,“/”表示或的意思,例如,A/B可以表示A或B;本文中的“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,在本申请实施例的描述中,“多个”是指两个或多于两个。以下术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。
另外,本申请中使用了流程图用来说明根据本申请的实施例的***所执行的操作。应当理解的是,前面或后面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各个步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。
针对背景技术部分提出的问题,本申请希望改进去雾处理的网络结构,来提高对有雾图像的去雾处理效果及处理效率,这样,如图1所示的场景示意图,将有雾图像输入预先训练得到的去雾模型后,可以直接输出所需的无雾图像。
具体的,本申请提出将SE(Squeeze-and-Excitation)层网络结构中的全连接层替换为卷积层,构成用于模型训练的初始网络结构即机器学习网络模型,以压缩整个模型的网络参数,从而提高模型训练效率。
而且,针对现有SE层网络结构,利用全连接层对有雾图像的通道特征(单一维度)的注意力权重进行计算的技术特征,本申请将利用SE层网络结构中的卷积层,实现对有雾图像的多个维度的注意力权重的计算,之后,利用有雾图像的多个维度特征进行去雾处理,能够更加准确地得到无雾图像,提高了去雾效果。
其中,SE层网络结构是一种全新的图像识别结构,它通过对特征通道(一种维度特征)间的相关性进行建模,把重要的特征进行强化来提升准确率,解决了卷积池化过程中,特征图像的不同通道所占用的重要性不同带来的损失问题。结合上述分析,本申请具体是对多个维度特定之间的相关性进行建模,进一步提高了模型处理的准确性,关于SE层网络结构的运算原理及具体网络结构,本申请不做详述。
为了进一步提高模型训练效率及处理准确性,本申请可以依据多个网络结构形成的融合网络实现建模,具体实现过程可以参照下文实施例相应部分的描述,本申请在此不做详述。
参照图2,为本申请实施例提出的一种计算机设备的硬件结构示意图,在实际应用中,该计算机设备可以包括但并不局限于服务器,或者多个服务器构成的服务器集,或者是具有一定数据处理能力,尤其是图像处理能力的终端设备等,该终端设备可以包括但并不限于:智能手机、平板电脑、可穿戴设备、超级移动个人计算机(ultra-mobile personalcomputer,UMPC)、上网本、台式计算机等,本申请对计算机设备的产品类型不做限定。且图2示出的计算机设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图2所示,本实施例提出的计算机设备可以包括存储器11和处理器12,其中:
存储器11和处理器12各自的数量可以是至少一个,两者均可以与通信总线相连,以实现相互之间的数据交互,具体实现过程本申请不做详述。
存储器11可以用于存储实现本申请提出的图像去雾处理方法的程序,处理器12可以加载并执行存储器11中存储的程序,以实现本申请任一可选实施例提出的图像去雾处理方法的各个步骤,具体实现过程可以参照下文相应实施例相应部分的描述。
本申请实施例中,上述存储器11可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件或其他易失性固态存储器件。处理器12,可以为中央处理器(Central Processing Unit,CPU)、特定应用集成电路(application-specificintegrated circuit,ASIC)、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件等。
在一种可能的实现方式中,存储器11可以包括程序存储区和数据存储区,该程序存储区可以存储操作***、以及至少一个功能(如图像显示功能,图像去雾处理功能)所需的应用程序、实现本申请提出的图像去雾处理方法的程序等;数据存储区可以存储电子设备使用过程中所产生的数据,如获取的待处理有雾图像、处理得到的对象边缘特征、去雾处理后的无雾图像等。
应该理解,图2所示的计算机设备的结构并不构成对本申请实施例中计算机设备的限定,在实际应用中,计算机设备可以包括比图2所示的更多或更少的部件,或者组合某些部件,如计算机设备是终端设备,其还可以包括:键盘、鼠标、摄像头、拾音器等至少一个输入设备;显示器、扬声器振动机构、灯等至少一个输出设备,以及各种通信接口等等,本申请在此不做一一列举。
参照图3,示出了本申请提出的图像去雾处理方法的一可选示例的流程示意图,该方法可以适用于计算机设备,本申请对该计算机设备的产品类型及组成结构不做限定,可以参照但并不局限于上文实施例描述的计算机设备,如图3所示,本实施例提出的图像去雾处理方法可以包括:
步骤S11,获取待处理有雾图像;
在实际应用中,当需要对有雾图像进行去雾处理时,本实施例可以对其进行预处理,如可以对有雾图像进行格式转换、大小裁剪等操作,以得到满足模型输入要求的待处理有雾图像。
在一些实施例中,计算机设备获取有雾图像后,可以将其转换为RGB格式的图像,之后,可以随机裁剪其中的特定尺寸的待处理有雾图像,如240*240(其单位可以是像素)的RGB格式的待处理有雾图像,此时,该待处理有雾图像具有三个通道,即R、G、和B三个特征通道。
需要说明,本申请对如何将获取的有雾图像经过预处理后,得到待处理有雾图像的实现过程不做限定,并不局限于上文描述的预处理方式。另外,关于对有雾图像进行上述预处理,得到待处理有雾图像的处理过程,可以由计算机设备实现,也可以由其他设备执行,再将得到的待处理有雾图像发送至计算机设备,本申请对有雾图像的预处理过程的执行主体不做限定。
步骤S12,获取待处理有雾图像的对象边缘特征;
本实施例中,对象边缘特征可以表明待处理有雾图像所包含各对象的轮廓,以便据此改善图像去雾处理后,导致图像模糊的技术问题,即保证去雾处理后的图像的清晰度,本申请对步骤S12的具体实现方式不做限定。
在一些实施例中,由于图像模糊是因图像中对象(如物体、人等)的轮廓不明显,轮廓边缘灰度变化不强烈,层次感不强造成的,因此,本申请可以使用图像梯度来衡量图像灰度的变化率,从而确定各对象之间的轮廓特征。具体可以采用图像梯度算法,来获取待处理有雾图像中每一个通道(如R通道、G通道、B通道)各自的图像梯度变化,再据此确定出待处理有雾图像的对象边缘特征,具体计算过程本申请不做详述,
步骤S13,将对象边缘特征作为待处理有雾图像的新通道,得到具有特定数量通道的待去雾图像;
结合上述分析,待处理有雾图像所具有的特征通道数量,可以依据其图像格式确定,如对于RGB格式的待处理有雾图像,其可以具有三个通道,即R通道、G通道、B通道,该待处理图像中的各像素点的像素值可以依据这三个通道的数值综合确定,具体获取过程不做详述。
为了提高图像去雾处理的可靠性及准确性,从而提高所得无雾图像的清晰度,本实施例可以将待处理有雾图像的对象边缘特征作为一个维度特征,结合上述三个通道(即三个维度特征),确定为待去雾图像的多维度图像特征,因此,该特定数量通道可以是4个通道。
当然,根据需要可以结合待处理图像的其他维度特征,实现图像去雾处理,此时特定数量的具体数值也会相应增加,本申请对该特定数量的具体数值不做限定,可以根据图像处理的实际要求确定,本申请实施例仅以4个维度特征即4通道为例进行说明。
由此可见,本实施例得到的待去雾图像可以是240*240*4的图像,即尺寸为240*240,具有4个通道即4个维度特征的待去雾图像,但并不局限于该图像尺寸及特征维度个数。
步骤S14,将待去雾图像输入去雾模型进行处理,输出待处理有雾图像对应的无雾图像。
需要说明,结合上文分析,该去雾模型可以是基于机器学习网络模型,对具有特定数量通道(如4通道等)的样本有雾图像进行训练得到的,该样本有雾图像的获取过程可以参照上文待去雾图像的获取过程,本实施例不再赘述。且对于去雾模型的具体训练过程本实施例不做详述,可以参照但并不局限于下文相应实施例的描述。
其中,本申请的机器学习网络模型具有SE层网络结构,且该SE层网络结构是利用卷积层,实现对所输入的待去雾图像的多个维度各自的注意力权重的计算,如通道、像素等维度,本申请对SE层网络结构的运算原理及具体结构不做详述。
基于此,将得到的待去雾图像输入去雾模型后,在去雾模型对待去雾图像的处理过程可以包括:利用SE层网络结构中的卷积层,获取输入SE层网络结构的待去雾图像对应的各通道的图像特征的通道权重,以及各像素的像素权重,具体计算过程本申请不做详述。这样,在去雾模型对通道维度特征及像素维度特征进行处理时,将与各自对应的权重加权运算,以体现各图像特征与去雾处理的相关性,进而据此实现去雾处理,保证所得去雾图像的清晰度及可靠性。
综上所述,本实施例获取待处理有雾图像后,并未将其直接输入去雾模型进行去雾处理,而是提取了待处理有雾图像的对象边缘特征,将其作为一个新的特征通道,结合待处理有雾图像原有的特征通道,生成待去雾图像后,再将该待去雾图像输入去雾模型进行处理,以使得去雾模型在图像去雾处理过程中,还能够考虑到待去雾图像中的对象边缘特征,以保证输出去雾图像的清晰度;与此同时,模型中的SE网络结构中原有的全连接层替换成卷积层,压缩了网络参数,提高了图像去雾处理效率,且通过计算待去雾图像的多个维度的注意力权重,不再局限于通道维度,从而使得去雾模型能够依据待去雾图像多个维度的重要特征各自的注意力权重,提升对图像去雾有用特征并抑制用处不大的特征,从而提升模型处理的准确率,提高了对有雾图像的去雾效果及去雾处理效率。
参照图4,示出了本申请提出的图像去雾处理方法的又一可选示例的流程示意图,本实施例可以是上述实施例提出的图像去雾处理方法的一可选细化实现方式,如图4所示,该方法可以包括:
步骤S21,获取待处理有雾图像;
关于步骤S21的实现过程可以参照上述实施例步骤S11相应部分的描述,本实施例不再赘述。
步骤S22,获取待处理有雾图像具有的每一个通道的图像梯度变化;
本申请对图像梯度变化的获取方法不做限定,可以依据图像梯度算法对待处理有雾图像进行处理,来得到其每一个通道的图像梯度变化。这种情况下,在计算图像梯度值时,是对待处理图像相应通道的颜色值进行计算,而不是灰度值,以保证获取待处理图像R、G、B三通道各自对应的图像梯度变化,具体计算过程本申请不做详述。
步骤S23,获取待处理有雾图像具有的多个通道的图像梯度变化的平均图像梯度变化,并由该平均图像梯度变化确定待处理有雾图像的对象边缘特征;
由于待处理图像中各像素点的像素点是由RGB三个通道的颜色值确定,在确定这三个通道的图像梯度变化后,可以对其取平均值来表示整个待处理有雾图像的各像素点的像素值的梯度变化,进而据此确定待处理有雾图像的对象边缘特征,具体确定方法不做详述。
需要说明,步骤S22和步骤S23仅是实现上述S12的一种实现方式,但并不局限于本实施例描述的这种实现方式,
步骤S24,将对象边缘特征作为待处理有雾图像的新通道,得到具有特定数量通道的待去雾图像;
本实施例是在待处理有雾图像原有的颜色特征基础上,增加了对象边缘特征,以使后续图像去雾处理过程中,能够综合考虑图像的颜色特征和对象边缘特征,保证所得去雾图像的清晰度。
步骤S25,将待去雾图像输入去雾模型,通过注意力机制,对获取的待去雾图像对应的各通道的图像特征进行卷积运算,得到各通道的图像特征对应的通道权重;
步骤S26,通过注意力机制,对获取的待去雾图像的像素信息进行卷积运算,得到待去雾图像包含的不同像素的像素权重;
结合上述实施例对去雾模型的描述,步骤S25和步骤S26中注意力权重的计算是由SE层网络结构运算得到的,应该理解,该SE层网络结构可能不是去雾模型的仅有结构,也就是说,该去雾模型的网络结构除了SE层网络结构外,还可能包括其他网络层或网络结构,如卷积层、池化层等等,所以说,上述注意力权重的计算仅是去雾模型对输入的待去雾图像进行去雾处理过程中的一步骤,且不限定该步骤的执行顺序,可以根据去雾处理的实际需求以及该SE层网络结构的运算原理确定,本实施例在此仅对去雾模型采用的改善后的SE层网络结构的运算过程进行说明,并未对该去雾模型的其他去雾处理步骤进行一一详述。
基于上文分析可知,上述步骤描述的通道权重和像素权重的计算过程,仅是去雾模型执行的图像去雾处理过程中的一处理步骤,该处理步骤可能位于整个图像去雾处理过程的开始处理位置或中间处理位置或最后处理位置等,所以说,上述进行卷积运算的待去雾图像可以是输入SE层网络结构的待去雾图像,其具体可能是输入去雾模型的待去雾图像,也可能是由去雾模型的其他网络层或网络结构对输入去雾模型的待去雾图像进行处理后,所输出的待去雾图像,这可以依据该去雾模型的具体网络结构确定,本申请对步骤S25和步骤S26中获取的待去雾图像的直接来源不做限定。
结合上文对SE层网络结构的运算原理,参照图5所示的SE层网络结构示意图,本实施例提出的SE层网络结构需要从不同维度实现注意力权重计算,在此以通道和像素两个维度的注意力权重计算为例进行说明,对于其他维度的注意力权重计算过程类似,本申请不做一一详述。
如图5所示,该SE层网络结构中,表示各网络层的序号所表示的含义具体可以为:序号①上对应的网络层可以表示平均池化层;序号②上对应的网络层可以表示卷积层;序号③上对应的网络层可以表示relu(Rectified Linear Unit,线性整流函数)层,即线性激活层;序号④上对应的网络层可以表示tanh层,即非线性激活层。由此可见,本申请提出的SE层网络结构中,无论是用于计算通道权重的网络结构,还是用于计算像素权重的网络结构中,均采用两个卷积层替换传统SE层网络结构中的两个全连接层进行运算,结合注意力机制的运算原理,经过卷积层的计算,得到输入SE层网络结构的图像具有的各通道的通道权重,以及各像素点的像素权重,具体计算过程本申请不做详述。
另外,上述SE层网络结构中,池化层可以缩减模型的大小,提高计算速度,同时提高所提取特征的鲁棒性,本实施例采用平均池化方式,实现对特征提取处理,但并不局限于这种池化方式,关于该SE层网络结构中激活层的运算,可以依据选用的激活函数确定,并不局限于图5所示的激活函数。本申请对构成SE层网络结构的各网络层的运算过程不做一一详述。
结合图5所示的SE层网络结构,输入该SE层网络结构的待去雾图像经过去雾模型其他网络层的处理后,可能会得到比特定数量更多的通道,如由初始输入去雾模型的4个通道,经过处理后得到64通道的待去雾图像输入该SE层网络结构,之后,可以先由如图5所示左侧网络结构来来计算这64个通道各自的通道权重,即确定这64个通道的图像特征与图像去雾处理任务的相关性高低,以达到提升相关性高的图像特征,并抑制相关性低的图像特征的目的。
举例说明,若输入SE层网络结构左侧网络的是240*240*64的待去雾图像,步骤S25可以对64个通道的图像特征进行卷积运算,如采用1*1的卷积核实现,将得到每个通道的通道权重,即在左侧网络将输出64个通道权重数值,且该权重大小可以表示相应通道的图像特征,对图像去雾处理的相关性大小。
同理,在利用如图5所示右侧网络结构实现像素权重的计算过程中,同样利用注意力机制,来获取输入该右侧网络的待去雾图像的各个像素对去雾处理的相关性大小,即获得各像素的像素权重,由像素权重大小来表明相应像素与去雾处理的相关性大小,本申请对如何利用右侧网络的两个卷积层,计算待去雾图像的各像素的像素权重的实现方法不做详述。
步骤S27,利用通道权重对各通道的图像特征进行加权运算,利用像素权重对获取的待去雾图像的像素进行加权运算,依据得到的加权运算结果进行去雾处理,得到无雾图像。
继上文分析,参照图5所示的SE层网络结构,左侧网络输出的各通道的通道权重后,可以将其与输入该左侧网络的待去雾图像的各通道相乘后再求和,即进行加权运算,以强化所得待去雾图像中,对去雾处理有用的至少一个通道的图像特征,进而提高图像去雾处理效果。
经过上述如图5左侧网络对待去雾图像中有用通道的图像特征的强化处理后,将所得待去雾图像输入图5所示的右侧网络,继续对该待去雾图像中,对图像去雾处理有用的像素特征,抑制对图像去雾处理无用的像素特征,进一步提高图像去雾处理效果,提高处理后所得图像的清晰度,进而提高无雾图像的清晰度。
需要说明,如上述分析,本申请提出的SE层网络结构是去雾模型的一部分,所以说,步骤S27中的加权运算也是去雾模型进行去雾处理过程中的一个处理步骤,且使得该处理后输出的图像中对去雾处理有用的图像特征得到强化,对去雾处理无用的图像特征得到抑制,之后,去雾模型中的其他网络层会继续该图像进行去雾处理,以得到所需的无雾图像。本申请对SE层网络结构输出的图像的后续去雾处理过程不做详述,可以依据去雾模型的具体网络结构确定。
综上,本实施例中,对于输入去雾模型的待去雾图像,除了包含初始具有的RGB三通道的图像特征外,本申请还提取了其中的对象边缘特征作为第四通道的图像特征,以使输入去雾模型的图像特征至少包含这四个通道的图像特征,相对于传统仅输入RGB三通道的图像特征,本申请这种处理方式能够有效改善图像处理导致图像模糊的问题,提高模型输出图像的清晰度。
而且,在将待去雾图像输入去雾模型进行去雾处理过程中,将会通过注意力机制,采用卷积运算方式,分别获取各通道的通道权重,以及图像具有的各像素的像素权重,相对于现有技术中采用全连接层的运算方式,仅获取各通道的通道权重,不仅压缩了网络参数,提高了处理效率,且本申请将利用这两个维度各自的注意力权重,实现对待去雾图像中对去雾处理有用的图像特征的强化,以及对去雾处理无用的图像特征的抑制,进一步提高了图像去雾效果及处理效率。
在一些实施例中,对于本申请上述去雾模型,可能至少还具有深度可分离卷积层、下采样网络、残差网络之中的多个组合,因此,如图6所示,去雾模型对待去雾图像的处理还可能包括以下步骤的多种组合:
步骤S31,通过深度可分离卷积层,对输入的待去雾图像对应的各通道的图像特征进行扩展处理,输出扩展通道后对应的图像特征;
对于本申请的去雾模型中的卷积层,可以包含部分普通卷积层以及部分深度分离卷积(Depthwise separable convolution)层,该深度可分离卷积是可分离卷积的一种,区别于空间可分离卷积,在深度学习中,深度可分离卷积可以执行一个空间卷积,同时保持通道独立,然后进行深度卷积操作。
参照图7所示的不同卷积层结构对比图,深度可分离卷积(如图7第二行图所示的卷积结构)可以将传统的卷积(如图7第一行图所示的卷积结构)分解为一个深度卷积(depthwise convolution)+卷积核为1*1的卷积(pointwise convolution,如图7第三行图所示的卷积结构)。基于此,输入去雾模型的待去雾图像,可以输入该深度可分离卷积层进行处理,基于卷积运算原理可知,该卷积运算可以增大待去雾图像的通道数量,如输入240*240*4的待去雾图像,经过深度可分离卷积层的处理,可以得到240*240*64的待去雾图像,即输入通道4经扩展,输出通道为64,但并不局限于此。关于步骤S31的具体实现过程可以依据深度可分离卷积的具体运算原理确定,本申请实施例不做详述。
如上文对去雾模型中的卷积层的描述,在对输入的待去雾图像的卷积运算过程中,除了利用深度可分离卷积层对输入的待去雾图像进行卷积运算外,还可能包含其他类型的卷积层对输入该卷积层的待去雾图像的卷积运算,如上述列举的普通卷积层的运算,空洞卷积层的运算等等,本申请在此不做一一详述,可以依据该去雾模型所具有的卷积层的数量及类型,以及各类卷积层的卷积运算原理确定。
其中,空洞卷积(Dilated Convolution)是在标准的convolution map里注入空洞,以此来增加reception field,相对于普通卷积,空洞卷积向卷积层引入了一个称为“扩张率(dilation rate)”的新参数,该参数定义了卷积核处理数据时各值的间距。本申请对空洞卷积对图像的卷积运算过程不做详述。
结合上述分析,相对于传统的去雾模型均采用普通卷积层,本申请实施例加入了深度可分离卷积层,从而在训练等效的前提下,能够压缩网络参数,提高了模型训练效率,同时,也提高了图像去雾处理效率。
步骤S32,利用下采样网络包含的不同尺寸的卷积核,对输入的待去雾图像对应的各通道的图像特征进行处理,输出相同数量通道分别对应的图像特征;
在深度学***移、伸缩不变形等目的。常用的采样方式有最大值采样、平均值采样、求和区域采样和随机区域采样等;常用的池化方式类似,如最大值池化、平均池化、随机池化等等。
本实施例中,下采样网络可以是对输入的待去雾图像的像素特征进行降维处理,如对240*240(其单位可以是像素)的待去雾图像下采样处理后,得到120*120(其单位可以是像素)的待去雾图像,关于下采样网络采用的具体采样方式本申请不做限定。
需要说明的是,相对于传统的下采样网络结构,即利用相同尺寸的卷积核对输入图像进行降维处理,本申请将采用多个不同尺寸的卷积核构成下采样网络,实现对输入的待去雾图像的各通道的像素维度的降维处理,得到与输入通道数量相同的输出通道的图像,但本申请对构成该下采样网络结构的各卷积核的尺寸大小不做限定,可以根据实际需求确定。
在一种可能的实现方式中,针对如图8a所示的传统下采样网络结构,即传统去雾模型中下采样网络结构通常采用3*3的卷积核,步长为2的普通卷积层构成,输入通道数量为64,输出通道数量为64或128,图8a仅以输入通道和输出通道的数量均为64的结构为例进行说明,该输入通道的数量可以是通过卷积层的扩展后得到的,具体实现过程不做详述。
经过研究发现,传统的下采样结构所输出的图像存在一定程度的失真,降低了输出图像的准确性及保真度,为了改善这些问题,本申请提出采用不同尺寸的卷积核,不断改变图像的通道数量的方式,以保留图像中更多的特征,提高图像的保真度。参照图8b所示的适用于本申请图像去雾处理的下采样网络结构示意图,通道为64(即输入的特征图数)的待去雾图像输入下采样网络后,通过卷积核为3*3的卷积层的运算,输出通道仍为64,之后,输入卷积核为1*1的卷积层进行处理,将输入通道64扩增至192,再通过卷积核为3*3的卷积层的运算,输出通道仍为192,最后经过卷积核为3*3的卷积层,将通道数量从192降为64,与输入该下采样网络的通道数量相同。
由此可见,在本实施例采用多种不同尺寸的卷积核构建下采样网络,且这多个卷积核对图像的特征通道处理不同,即便同一尺寸卷积核的卷积层,对图像的输入通道的处理也会不同,即输出通道的数量不同,通过这种可变通道的处理方式,能够更加全面提取待去雾图像中的特征,降低所得图像的失真度,提高模型输出图像的清晰度。
基于上述分析,上述步骤S32的具体实现过程可以包括:
将第一数量通道各自的图像特征输入第一尺寸的第一卷积核进行运算,输出第二数量通道分别对应的图像特征,第二数量大于第一数量,第一数量大于特定数量,如上述举例,第一数量可以是64,第一尺寸的第一卷积核可以是图8b中左侧第二个卷积核,即1*1卷积核,此时,第二数量可以是192,特定数量可以是4等。
将第二数量通道各自的图像特征输入第二尺寸的第二卷积核进行运算,输出第三数量通道分别对应的图像特征,第三数量等于第二数量。如上述举例,第二尺寸的第二卷积核可以是图8b左侧第三个卷积核,第二数量和第三数量均可以为192,但并不局限于此。
将第三数量通道各自的图像特征输入第二尺寸的第三卷积核进行运算,输出第四数量通道分别对应的图像特征,第四数量等于第一数量。如上述举例,该步骤的第二尺寸的第三卷积核可以是图8b左侧第四个卷积核,第三数量可以为192、第四数量可以为64,但并不局限于此。
且如图8b所示,在将图像特征输入上述第一尺寸的第一卷积核之前,会将第五数量通道各自的图像特征输入第二尺寸的第四卷积核进行运算,输出第六数量通道分别对应的图像特征,此时,该第五数量、第六数量与上述第一数量相同,如图8所示的均可以为64,该实例中,第二尺寸的第四卷积核可以为图8b左侧第一个卷积核,即3*3卷积核。
需要说明,对于本申请提出的下采样网络的结构,并不局限于图8b所示的网络结构,且对其包含的各种卷积核的尺寸大小,以及各卷积层的输入通道和输出通道的数值均不作限定,可以根据实际需求进行灵活调整。
步骤S33,利用残差网络包含的多个平滑残差块,对输入的图像特征进行平滑处理,该平滑残差块包含的两个空洞卷积层的扩张值不同。
在卷积神经网络中,残差网络具有容易优化的特点,并且能够通过增加相当的深度来提高准确率。其可由多个残差块构成,且这些残差块使用跳跃连接,缓解在深度神经网络中增加深度带来的梯度消失问题,本申请对残差网络的具体运算原理不做详述。
本实施例中,本申请去雾模型中的残差网络可以选用6个平滑残差块构成,每个平滑残差块的结构可以参照图9所示的结构,序号对应上方网络层的含义可以为:序号⑤上方对应的网络层可以表示分组卷积层,序号⑥上方对应的网络层可以表示空洞卷积层,序号⑦上方对应的网络层可以表示实例正则化层,序号⑧上方对应的网络层可以表示SE层(即上述SE层网络结构,具体组成结构可以参照上述实施例相应部分的描述)。本申请对每个平滑残差块对图像特征的运算过程不做详述,可以结合上文各序号所表示的含义,按照图9所示的平滑残差块中各网络层的处理顺序对输入的图像特征进行依次处理,本申请对各网络层的具体运算过程不做详述,可以依据相应网络层的运算原理确定。
基于图9所示的平滑残差块的结构,本申请残差网络中的每一个平滑残差块内可以经过两个空洞卷积层的处理,使其在图像特征采集中增加感知野,补偿去除下采样而引起的感知野减少的问题,且各平滑残差块的两个空洞卷积层的扩张值不同,可以采用参差的扩张值设计,如6个平滑残差块的两个空洞卷积层的扩张值依次可以为(2,3)、(2,3)、(3,4)、(3,4)、(4,5)、(4,5)等,但并不局限于该数值。
可见,相对于传统残差网络中,由多个扩张值逐渐递增的平滑残差块构成的网络结构,如(2,2)、(2,2)、(2,2)、(4,4)、(4,4)、(4,4)等,本实施例采用如上所述的扩张设计每个平滑残差块中的两个空洞卷积层,从而使得输出的图像特征更加平滑,减少网格效应,从而提高所得无雾图像的清晰度,关于残差运算的具体实现过程本申请不做详述。
在一些实施例中,对于本申请的去雾模型,除了上文描述的几种网络层或网络结构外,根据实际需要,还可以包括其他网络层或网络结果,如SE融合层,反卷积层等等。应该理解的是,对于由如上列举的多个网络层或网络结构构成的去雾模型的网络结构,并不是由这多个网络层或网络结构依次串联拼接而成,而是由这多个网络层和/或网络结构融合而形成去雾模型的网络结构,本申请对该融合处理的具体实现以及融合后的去雾模型的具体结构不做限定。
其中,SE融合层的网络结构可以参照图10所示,图10中各序号分别可以是下方对应网络层,各序号具体表示内容可以参照上文对相应序号内容描述,且如图10所示,右侧并列的三个网络结构相同,且与SE层网络结构相同,均由两个卷积层替换传统的两个全连接层,压缩了网络参数,提高了处理效率。
上述反卷积(Deconvolution)层可以称为Transposed Convolution(转置卷积),其运算原理与卷积层运算原理类似,但执行方向相反,即卷积层的前向传播过程就是反卷积层的反向传播过程,卷积层的反向传播过程就是反卷积层的前向传播过程,本申请对该反卷积层对图像特征的具体运算过程不做详述。
综合上述各实施例对去雾模型的网络结构的描述,本申请可以得到如图11所述的去雾模型的网络结构,但并不局限于图11所示的网络结构,如图11所示,序号⑨下方所对应的网络层可以表示深度可分离卷积层,其具体网络结构及图像处理过程可以参照上述实施例相应部分的描述,如上举例,该网络层输出图像具有的通道数量可以为64;序号⑩下方所对应的网络层可以表示残差网络中的任一平滑残差块,如图11所示,该残差网络可以包含6个平滑残差块,且每一个平滑残差块的输入和输出通道均可以为64,即输入和输出图像特征的维度均可以为64,序号
Figure BDA0002433345230000191
下方所对应的网络层可以表示SE融合层,其网络结构可以参照上述实施例相应部分的描述,序号
Figure BDA0002433345230000192
下方对应的网络层可以表示反卷积层,关于图11所示的去雾模型的网络结构中其他序号下方对应的网络层所表示的内容,可以参照上文对其他序号的描述,本申请不再一一赘述。
如图11所示,仍以输入特征尺寸为240*240的待去雾图像为例进行说明,经过下采样处理后,将得到特征尺寸为120*120的待去雾图像,之后,经过上采样处理,恢复成特征尺寸为240*240的待去雾图像,以使得最终输出特征尺寸为240*240的无雾图像。对于该去雾模型对输入的待去雾图像的具体处理过程,可以由图11中从左到右的各网络层依次进行处理,具体处理过程可以集合相应网络层的运算原理确定,本申请不做一一详述。
其中,参照图11所示的网络结构,去雾模型对待去雾图像进行去雾处理过程中,可以将下采样网络输出的图像特征与输入该下采样网络前的图像特征进行级联融合处理,以增加输入至与下采样网络连接的网络的图像特征数量,也就是说,本申请可以采用跳接的方式,将输入的待去雾图像原尺寸特征,加入到下采样后的图像特征,再通过后续的其他网络层继续处理,丰富了在原尺寸图像维度上提取的特征数量,从而提高了所得无雾图像的清晰度。关于跳接位置可以参照图11网络跳接线路确定,本申请不做一一详述。
需要说明的是,对于本申请提出的去雾模型中的网络结构,并不局限于图11所示的网络结构,可以根据实际需要进行适当调整,本申请不再一一详述。
基于上文对去雾模型的网络结构的描述,本申请可以预先构建相应网络结构的机器学习网络模型,通过对样本有雾图像进行不断训练,来得到上述去雾模型,关于训练过程中相应网络层的运算可以参照上文实施例相应部分的描述。通常情况下,本申请在每次对8幅样本有雾图像进行训练,如每次向构建的机器学习网络模型输入8*240*240*4的样本有雾图像,即输入8幅样本有雾图像,每一幅样本有雾图像的特征尺寸可以为240*240,所具有的通道数量为4,但并不局限于该参数,可以根据实际情况选择每次训练的样本有雾图像的数量及其训练参数。本申请对该去雾模型的具体训练过程不做详述。
参照图12,为本申请提出的图像去雾处理装置的一可选示例的结构示意图,该装置可以适用于计算机设备,如图12所示,该装置可以包括:
待处理有雾图像获取模块21,用于获取待处理有雾图像;
对象边缘特征获取模块22,用于获取所述待处理有雾图像的对象边缘特征;
在一些实施例中,该对象边缘特征获取模块22可以包括:
图像梯度变化单元,用于获取所述待处理有雾图像具有的每一个通道的图像梯度变化;
对象边缘特征获取单元,用于获取所述待处理有雾图像具有的多个通道的图像梯度变化的平均图像梯度变化,由所述平均图像梯度变化确定所述待处理有雾图像的对象边缘特征。
待去雾图像得到模块23,用于将所述对象边缘特征作为所述待处理有雾图像的新通道,得到具有特定数量通道的待去雾图像;
去雾处理模块24,用于将所述待去雾图像输入去雾模型进行处理,输出所述待处理有雾图像对应的无雾图像;
其中,所述去雾模型是基于机器学习网络模型,对具有特定数量通道的样本有雾图像进行训练得到的,所述机器学习网络模型具有SE层网络结构,且所述SE层网络结构是利用卷积层,实现对所输入的待去雾图像的多个维度各自的注意力权重的计算。
在一些实施例中,上述去雾处理模块24可以包括:
注意力权重获取单元,用于利用所述SE层网络结构中的卷积层,获取输入所述SE层网络结构的待去雾图像对应的各通道的图像特征的通道权重,以及各像素的像素权重。
在一种可能的实现方式中,如图13所示,上述注意力权重获取单元可以包括:
通道权重获取单元241,用于通过注意力机制,对获取的待去雾图像对应的各通道的图像特征进行卷积运算,得到各通道的图像特征对应的通道权重,以利用所述通道权重对所述各通道的图像特征进行加权运算;
像素权重获取单元242,用于通过注意力机制,对获取的待去雾图像的像素信息进行卷积运算,得到所述待去雾图像包含的不同像素的像素权重,以利用所述像素权重对获取的待去雾图像的像素进行加权运算。
在一些实施例中,若上述机器学习网络模型至少还具有深度可分离卷积层、下采样网络、残差网络之中的多个组合,如图14所示,上述去雾处理模块24还可以包括:
特征扩展单元243,用于通过所述深度可分离卷积层,对输入的所述待去雾图像对应的各通道的图像特征进行扩展处理,输出扩展通道后对应的图像特征;
下采样处理单元244,用于利用所述下采样网络包含的不同尺寸的卷积核,对输入的所述待去雾图像对应的各通道的图像特征进行处理,输出相同数量通道分别对应的图像特征;
在一种可能的实现方式中,该下采样处理单元244可以包括:
第一处理单元,用于将第一数量通道各自的图像特征输入第一尺寸的第一卷积核进行运算,输出第二数量通道分别对应的图像特征,所述第二数量大于所述第一数量,所述第一数量大于所述特定数量;
第二处理单元,用于将所述第二数量通道各自的图像特征输入第二尺寸的第二卷积核进行运算,输出第三数量通道分别对应的图像特征,所述第三数量等于所述第二数量;
第三处理单元,用于将所述第三数量通道各自的图像特征输入第二尺寸的第三卷积核进行运算,输出第四数量通道分别对应的图像特征,所述第四数量等于所述第一数量。
平滑处理单元245,用于利用所述残差网络包含的多个平滑残差块,对输入的图像特征进行平滑处理,所述平滑残差块包含的两个空洞卷积层的扩张值不同。
在又一些实施例中,如图14所示,上述去雾处理模块24还可以包括:
级联融合处理单元246,用于将所述下采样网络输出的图像特征与输入所述下采样网络前的图像特征进行级联融合处理,以增加输入至与所述下采样网络连接的网络的图像特征数量
需要说明的是,关于上述各装置实施例中的各种模块、单元等,均可以作为程序模块存储在存储器中,由处理器执行存储在存储器中的上述程序模块,以实现相应的功能,关于各程序模块及其组合所实现的功能,以及达到的技术效果,可以参照上述方法实施例相应部分的描述,本实施例不再赘述。
本申请实施例还提出了一种存储介质,其上存储有计算机程序,该计算机程序可以被处理器调用并执行,实现上述任一方法实施例描述的图像去雾处理方法的各步骤,具体实现过程可以参照上文相应方法实施例的描述,不再赘述。
参照上图2,本申请实施例还提出了一种计算机设备,关于该计算机设备的组成结构及功能实现,可以参照上述计算机设备实施例的描述,本申请不再赘述。
综上,计算机设备获取有雾图像后,可以将其处理成RGB格式特定尺寸的待处理有雾图像,获取其中的对象边缘特征,并将其作为新通道,得到具有4通道的待去雾图像,之后,可以将其输入具有上述网络结构的去雾模型进行去雾处理,得到相同尺寸的无雾图像。结合上文对本申请去雾模型的网络结构的描述,本申请采用卷积层替换SE层网络结构中的两个全连接层,压缩了网络参数,提高了处理效率,且通过计算待去雾图像的多个维度的注意力权重,据此提升对图像去雾处理更多有用特征并抑制更多用处不大的特征,从而提升模型处理的准确率,进一步提高图像去雾效果及去雾处理效率。
另外,根据实际需要,本申请还可以利用深度可分离卷积替换去雾模型中的至少部分空洞卷积,以压缩网络参数,进一步提高去雾处理效率;且在下采样过程中,使用不同尺寸的卷积核,采用改变特征通道方式对图像特征进行处理,保留图像中更多特征,提高所得图像的保真度;使用参差扩张值设计的平滑残差块对输入的图像特征进行平滑处理,减少网络效应,提高图像清晰度等等,具体实现过程可以参照上述实施例相应部分的描述。
最后,需要说明,本说明书中各个实施例采用递进或并列的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置、计算机设备而言,由于其与实施例公开的方法对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种图像去雾处理方法,所述方法包括:
获取待处理有雾图像;
获取所述待处理有雾图像的对象边缘特征;
将所述对象边缘特征作为所述待处理有雾图像的新通道,得到具有特定数量通道的待去雾图像;
将所述待去雾图像输入去雾模型进行处理,输出所述待处理有雾图像对应的无雾图像;
其中,所述去雾模型是基于机器学习网络模型,对具有特定数量通道的样本有雾图像进行训练得到的,所述机器学习网络模型具有SE层网络结构,且所述SE层网络结构是利用卷积层,实现对所输入的待去雾图像的多个维度各自的注意力权重的计算。
2.根据权利要求1所述的方法,所述去雾模型对所述待去雾图像的处理包括:
利用所述SE层网络结构中的卷积层,获取输入所述SE层网络结构的待去雾图像对应的各通道的图像特征的通道权重,以及各像素的像素权重。
3.根据权利要求2所述的方法,所述利用所述SE层网络结构中的卷积层,获取输入所述SE网络的待去雾图像对应的各通道的图像特征的通道权重,以及各像素的像素权重,包括:
通过注意力机制,对获取的待去雾图像对应的各通道的图像特征进行卷积运算,得到各通道的图像特征对应的通道权重,以利用所述通道权重对所述各通道的图像特征进行加权运算;
通过注意力机制,对获取的待去雾图像的像素信息进行卷积运算,得到所述待去雾图像包含的不同像素的像素权重,以利用所述像素权重对获取的待去雾图像的像素进行加权运算。
4.根据权利要求1~3任一项所述的方法,所述机器学习网络模型至少还具有深度可分离卷积层、下采样网络、残差网络之中的多个组合,所述去雾模型对所述待去雾图像的处理还包括以下多种组合:
通过所述深度可分离卷积层,对输入的所述待去雾图像对应的各通道的图像特征进行扩展处理,输出扩展通道后对应的图像特征;
利用所述下采样网络包含的不同尺寸的卷积核,对输入的所述待去雾图像对应的各通道的图像特征进行处理,输出相同数量通道分别对应的图像特征;
利用所述残差网络包含的多个平滑残差块,对输入的图像特征进行平滑处理,所述平滑残差块包含的两个空洞卷积层的扩张值不同。
5.根据权利要求4所述的方法,所述利用所述下采样网络包含的不同尺寸的卷积核,对输入的所述待去雾图像对应的各通道的图像特征进行处理,输出相同数量通道分别对应的图像特征,包括:
将第一数量通道各自的图像特征输入第一尺寸的第一卷积核进行运算,输出第二数量通道分别对应的图像特征,所述第二数量大于所述第一数量,所述第一数量大于所述特定数量;
将所述第二数量通道各自的图像特征输入第二尺寸的第二卷积核进行运算,输出第三数量通道分别对应的图像特征,所述第三数量等于所述第二数量;
将所述第三数量通道各自的图像特征输入第二尺寸的第三卷积核进行运算,输出第四数量通道分别对应的图像特征,所述第四数量等于所述第一数量。
6.根据权利要求4所述的方法,所述去雾模型对所述待去雾图像的处理还包括:
将所述下采样网络输出的图像特征与输入所述下采样网络前的图像特征进行级联融合处理,以增加输入至与所述下采样网络连接的网络的图像特征数量。
7.根据权利要求1所述的方法,所述获取所述待处理有雾图像的对象边缘特征,包括:
获取所述待处理有雾图像具有的每一个通道的图像梯度变化;
获取所述待处理有雾图像具有的多个通道的图像梯度变化的平均图像梯度变化,由所述平均图像梯度变化确定所述待处理有雾图像的对象边缘特征。
8.一种图像去雾处理装置,所述装置包括:
待处理有雾图像获取模块,用于获取待处理有雾图像;
对象边缘特征获取模块,用于获取所述待处理有雾图像的对象边缘特征;
待去雾图像得到模块,用于将所述对象边缘特征作为所述待处理有雾图像的新通道,得到具有特定数量通道的待去雾图像;
去雾处理模块,用于将所述待去雾图像输入去雾模型进行处理,输出所述待处理有雾图像对应的无雾图像;
其中,所述去雾模型是基于机器学习网络模型,对具有特定数量通道的样本有雾图像进行训练得到的,所述机器学习网络模型具有SE层网络结构,且所述SE层网络结构是利用卷积层,实现对所输入的待去雾图像的多个维度各自的注意力权重的计算。
9.根据权利要求8所述的装置,所述去雾处理模块包括:
注意力权重获取单元,用于利用所述SE层网络结构中的卷积层,获取输入所述SE网络的待去雾图像对应的各通道的图像特征的通道权重,以及各像素的像素权重。
10.一种计算机设备,所述计算机设备包括:
存储器,用于存储实现如权利要求1~7任一项所述的图像去雾处理方法的程序;
处理器,用于加载并执行所述存储器存储的所述程序,以实现如权利要求1~7任一项所述的图像去雾处理方法的各个步骤。
CN202010243548.4A 2020-03-31 2020-03-31 图像去雾处理方法、装置及计算机设备 Active CN111445418B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010243548.4A CN111445418B (zh) 2020-03-31 2020-03-31 图像去雾处理方法、装置及计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010243548.4A CN111445418B (zh) 2020-03-31 2020-03-31 图像去雾处理方法、装置及计算机设备

Publications (2)

Publication Number Publication Date
CN111445418A true CN111445418A (zh) 2020-07-24
CN111445418B CN111445418B (zh) 2024-05-28

Family

ID=71650971

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010243548.4A Active CN111445418B (zh) 2020-03-31 2020-03-31 图像去雾处理方法、装置及计算机设备

Country Status (1)

Country Link
CN (1) CN111445418B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111932365A (zh) * 2020-08-11 2020-11-13 武汉谦屹达管理咨询有限公司 一种基于区块链的金融征信***及方法
CN112132761A (zh) * 2020-09-16 2020-12-25 厦门大学 一种基于循环上下文聚合网络的单图像去雾方法
CN112183360A (zh) * 2020-09-29 2021-01-05 上海交通大学 高分辨率遥感影像的轻量化语义分割方法
CN112561819A (zh) * 2020-12-17 2021-03-26 温州大学 一种基于自支持模型的自滤波图像去雾算法
CN112614072A (zh) * 2020-12-29 2021-04-06 北京航空航天大学合肥创新研究院 一种图像复原方法、装置、图像复原设备及存储介质
CN112651891A (zh) * 2020-12-18 2021-04-13 贵州宇鹏科技有限责任公司 一种基于深度学习的图像去雾方法
CN113139922A (zh) * 2021-05-31 2021-07-20 中国科学院长春光学精密机械与物理研究所 图像去雾方法及去雾装置
CN113344806A (zh) * 2021-07-23 2021-09-03 中山大学 一种基于全局特征融合注意力网络的图像去雾方法与***
WO2022095253A1 (zh) * 2020-11-04 2022-05-12 常州工学院 一种基于深度通道感知的去除云雾方法
CN115668272A (zh) * 2020-12-24 2023-01-31 京东方科技集团股份有限公司 图像处理方法及设备、计算机可读存储介质
CN116129379A (zh) * 2022-12-28 2023-05-16 国网安徽省电力有限公司芜湖供电公司 一种雾天环境下的车道线检测方法
CN117151990A (zh) * 2023-06-28 2023-12-01 西南石油大学 一种基于自注意力编码解码的图像去雾方法
CN117690128A (zh) * 2024-02-04 2024-03-12 武汉互创联合科技有限公司 胚胎细胞多核目标检测***、方法和计算机可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130071043A1 (en) * 2011-09-08 2013-03-21 Fujitsu Limited Image defogging method and system
CN109447962A (zh) * 2018-10-22 2019-03-08 天津工业大学 一种基于卷积神经网络的眼底图像硬性渗出物病变检测方法
CN110097519A (zh) * 2019-04-28 2019-08-06 暨南大学 基于深度学习的双监督图像去雾方法、***、介质和设备
CN110880165A (zh) * 2019-10-15 2020-03-13 杭州电子科技大学 一种基于轮廓和颜色特征融合编码的图像去雾方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130071043A1 (en) * 2011-09-08 2013-03-21 Fujitsu Limited Image defogging method and system
CN109447962A (zh) * 2018-10-22 2019-03-08 天津工业大学 一种基于卷积神经网络的眼底图像硬性渗出物病变检测方法
CN110097519A (zh) * 2019-04-28 2019-08-06 暨南大学 基于深度学习的双监督图像去雾方法、***、介质和设备
CN110880165A (zh) * 2019-10-15 2020-03-13 杭州电子科技大学 一种基于轮廓和颜色特征融合编码的图像去雾方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
解怀奇等: "基于通道注意力机制的视频人体行为识别", 《电子技术与软件工程》 *

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111932365A (zh) * 2020-08-11 2020-11-13 武汉谦屹达管理咨询有限公司 一种基于区块链的金融征信***及方法
CN112132761A (zh) * 2020-09-16 2020-12-25 厦门大学 一种基于循环上下文聚合网络的单图像去雾方法
CN112132761B (zh) * 2020-09-16 2023-07-14 厦门大学 一种基于循环上下文聚合网络的单图像去雾方法
CN112183360B (zh) * 2020-09-29 2022-11-08 上海交通大学 高分辨率遥感影像的轻量化语义分割方法
CN112183360A (zh) * 2020-09-29 2021-01-05 上海交通大学 高分辨率遥感影像的轻量化语义分割方法
WO2022095253A1 (zh) * 2020-11-04 2022-05-12 常州工学院 一种基于深度通道感知的去除云雾方法
CN112561819A (zh) * 2020-12-17 2021-03-26 温州大学 一种基于自支持模型的自滤波图像去雾算法
CN112651891A (zh) * 2020-12-18 2021-04-13 贵州宇鹏科技有限责任公司 一种基于深度学习的图像去雾方法
CN115668272A (zh) * 2020-12-24 2023-01-31 京东方科技集团股份有限公司 图像处理方法及设备、计算机可读存储介质
CN112614072A (zh) * 2020-12-29 2021-04-06 北京航空航天大学合肥创新研究院 一种图像复原方法、装置、图像复原设备及存储介质
CN113139922B (zh) * 2021-05-31 2022-08-02 中国科学院长春光学精密机械与物理研究所 图像去雾方法及去雾装置
CN113139922A (zh) * 2021-05-31 2021-07-20 中国科学院长春光学精密机械与物理研究所 图像去雾方法及去雾装置
CN113344806A (zh) * 2021-07-23 2021-09-03 中山大学 一种基于全局特征融合注意力网络的图像去雾方法与***
CN116129379A (zh) * 2022-12-28 2023-05-16 国网安徽省电力有限公司芜湖供电公司 一种雾天环境下的车道线检测方法
CN116129379B (zh) * 2022-12-28 2023-11-07 国网安徽省电力有限公司芜湖供电公司 一种雾天环境下的车道线检测方法
CN117151990A (zh) * 2023-06-28 2023-12-01 西南石油大学 一种基于自注意力编码解码的图像去雾方法
CN117151990B (zh) * 2023-06-28 2024-03-22 西南石油大学 一种基于自注意力编码解码的图像去雾方法
CN117690128A (zh) * 2024-02-04 2024-03-12 武汉互创联合科技有限公司 胚胎细胞多核目标检测***、方法和计算机可读存储介质
CN117690128B (zh) * 2024-02-04 2024-05-03 武汉互创联合科技有限公司 胚胎细胞多核目标检测***、方法和计算机可读存储介质

Also Published As

Publication number Publication date
CN111445418B (zh) 2024-05-28

Similar Documents

Publication Publication Date Title
CN111445418A (zh) 图像去雾处理方法、装置及计算机设备
CN109858461B (zh) 一种密集人群计数的方法、装置、设备以及存储介质
KR102302725B1 (ko) 룸 레이아웃 추정 방법들 및 기술들
CN109271933B (zh) 基于视频流进行三维人体姿态估计的方法
CN112308200B (zh) 神经网络的搜索方法及装置
US20150030237A1 (en) Image restoration cascade
CN111340077B (zh) 基于注意力机制的视差图获取方法和装置
CN110809126A (zh) 一种基于自适应可变形卷积的视频帧插值方法及***
CN113066034A (zh) 人脸图像的修复方法与装置、修复模型、介质和设备
CN112036381B (zh) 视觉跟踪方法、视频监控方法及终端设备
JP2017068608A (ja) 演算装置、方法及びプログラム
CN110634103A (zh) 基于生成对抗网络的图像去马赛克方法
CN114140346A (zh) 一种图像处理方法及装置
Conde et al. Lens-to-lens bokeh effect transformation. NTIRE 2023 challenge report
CN110532959B (zh) 基于双通道三维卷积神经网络的实时暴力行为检测***
CN113538402B (zh) 一种基于密度估计的人群计数方法及***
CN115082306A (zh) 一种基于蓝图可分离残差网络的图像超分辨率方法
CN112633260B (zh) 视频动作分类方法、装置、可读存储介质及设备
JP2019197445A (ja) 画像認識装置、画像認識方法、およびプログラム
Zhang et al. Iterative multi‐scale residual network for deblurring
CN112115786A (zh) 基于注意力U-net的单目视觉里程计方法
Zhang et al. A cross-scale framework for low-light image enhancement using spatial–spectral information
CN112686828B (zh) 视频去噪方法、装置、设备及存储介质
CN112734655B (zh) 一种基于卷积神经网络图像对crm增强的低光图像增强方法
CN114612305A (zh) 一种基于立体图建模的事件驱动视频超分辨率方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant