CN112365429B

CN112365429B - 一种知识驱动的图像模糊区域清晰度增强方法

Info

Publication number: CN112365429B
Application number: CN202011517771.XA
Authority: CN
Inventors: 朱锦雷; 井焜; 张子良; 李明
Original assignee: Synthesis Electronic Technology Co Ltd
Current assignee: Synthesis Electronic Technology Co Ltd
Priority date: 2020-12-21
Filing date: 2020-12-21
Publication date: 2022-07-22
Anticipated expiration: 2040-12-21
Also published as: CN112365429A

Abstract

本发明公开一种知识驱动的图像模糊区域清晰度增强方法，本方法首先利用输入图像对应的GAN网络模型进行多次探测目标位置及类型及目标区域纹理细节增强，直至多次识别目标保持一致，本步骤识别的目标记为A。然后基于知识图谱联想关联实体，联想得到目标A的关联实体B_i，并记录目标A与关联实体B_i的关联值W_i。最后调取关联实体的独立GAN网络模型，N个独立GAN网络模型生成N个特征向量，将N个特征向量合并后，再次输入共存GAN网络模型，共存GAN网络模型输出增强的目标区域。本发明根据已知背景参考对象的纹理特征，从而增加图像模糊区域的清晰度。

Description

一种知识驱动的图像模糊区域清晰度增强方法

技术领域

本发明涉及一种知识驱动的图像模糊区域清晰度增强方法，属于机器学习与图像处理领域。

背景技术

基于深度学习的视频图像目标识别技术已得到了广泛应用，它们经常是基于视频图像这类稀疏数据源进行目标识别。我们也经常遇到另一类问题，即某一目标在环境干扰等原因在图像中成像模糊，在自动识别目标后，无法人工确认目标的真实性。这时需要增强目标区域的清晰度，以用于二次识别或者人工辨认。

发明内容

本发明要解决的技术问题是提供一种知识驱动的图像模糊区域清晰度增强方法，根据知识图谱将将经验知识融入视频图像模糊区域纹理增强过程，可根据已知背景参考对象的纹理特征，对目标的纹理进行增强显示或风格迁移，从而增加图像模糊区域的清晰度。

为了解决所述技术问题，本发明采用的技术方案是：一种知识驱动的图像模糊区域清晰度增强方法，包括以下步骤：

S01）、初步确定目标类别，获取输入图像，根据输入图像类型，获取该输入图像对应的GAN网络模型，GAN网络模型探测输入图像中目标位置及类型，然后进行第一次的目标区域纹理细节增强，第一次目标区域细节增强后再次进行探测目标位置及类型，并且再次利用GAN网络模型增强目标区域纹理细节，直至与上次识别保持一致，本步骤识别的目标记为A；

S02）、基于知识图谱联想关联实体，基于步骤S01）识别的目标A，调取与目标A相关的知识图谱，通过知识图谱上的知识关联关系联想到目标A的关联实体B_i，1≤i≤N，N为联想到的关联实体的总数，并记录目标A与关联实体B_i的关联值W_i；

S03）、调取N个关联实体的独立GAN网络模型，N个独立GAN 网络模型生成N个特征向量，将N个特征向量合并后，再次输入共存GAN网络模型，共存GAN网络模型输出增强的目标区域。

进一步的，N个特征向量的合并方式为：特征向量乘以转移概率权重，然后再拼接或叠加成统一的向量，转移概率权重为目标A与关联实体的关联值。

进一步的，N个特征向量的合并方式为：

，Y为合并后的向量，Y_i为第i个关联实体Bi对应的独立GAN网络模型生成的特征向量，W_i为目标A与关联实体B_i的关联值。

进一步的，N个独立GAN网络模型的输入为掩膜图像，掩膜图像是指步骤S01识别的目标区域的注意力激活图缩放至与原始输入图像相同尺寸后，对原始输入图像以增加数据通道方式扩展集成而形成的图像，增加的数据通道为目标区域注意力激活图的通道。由于激活图代表在目标识别时的注意力关注区域，利用包括该信息的掩膜图像有助于独立GAN网络生成与目标区域关联度高的特征向量。

进一步的，独立GAN网络模型的训练方法为：对同一目标取不同清晰度图片，以人工判断最为清晰的照片为判别模型基准训练。

进一步的，共存GAN网络模型的训练方法为：取在知识图谱上有关联的、不同目标的、非清晰图片的特征为输入值，将不同目标的非清晰图片的特征合并成中间特征向量后输入共存GAN网络，以目标的清晰图片为判别模型基准训练。

进一步的，不同目标的非清晰图片的特征合并成中间特征向量的方式：不同目标的非清晰图片的特征乘以对应的转移概率权重，然后再拼接或叠加成中间特征向量，转移概率权重为不同目标在知识图谱上与上一级目标的关联值。

本发明的有益效果：本发明根据知识图谱将将经验知识融入视频图像模糊区域纹理增强过程，可根据已知背景参考对象的纹理特征，对目标的纹理进行增强显示或风格迁移，从而增加图像模糊区域的清晰度。

附图说明

图1为实施例1的流程图。

具体实施方式

下面结合附图和具体实施例对本发明作进一步的说明。

实施例1

本实施例公开一种知识驱动的图像模糊区域清晰度增强方法，如图1所示，包括以下步骤：

S01）、初步确定目标类别，获取输入图像，根据输入图像类型，获取该输入图像对应的GAN网络模型，GAN网络模型探测输入图像中目标位置及类型，然后进行第一次的目标区域纹理细节增强，第一次目标区域细节增强后再次进行探测目标位置及类型，并且再次利用GAN网络模型增强目标区域纹理细节，直至与上次识别保持一致，本步骤识别的目标记为A。

S02）、基于知识图谱联想关联实体，基于步骤S01）识别的目标A，调取与目标A相关的知识图谱，通过知识图谱上的知识关联关系联想到目标A的关联实体B_i，1≤i≤N，N为联想到的关联实体的总数，并记录目标A与关联实体B_i的关联值W_i。

本实施例中，通过知识图谱上的知识关联关系联想到目标A的关联实体B_i的过程为：确定目标A的父节点，直接取得父节点下的N个子节点，N个子节点就是目标A的关联实体B_i，并且记录父节点下N个子节点与目标A的关联值，即B_i出现时A出现的概率。

本实施例中，N个特征向量的合并方式为：特征向量乘以转移概率权重，然后再拼接或叠加成统一的向量，转移概率权重为目标A与关联实体的关联值。

N个特征向量加权叠加的合并方式用数学式为：

本实施例中，N个独立GAN网络模型的输入为掩膜图像，掩膜图像是指步骤S01识别的目标区域的注意力激活图缩放至与原始输入图像相同尺寸后，对原始输入图像以增加数据通道方式扩展集成而形成的图像，增加的数据通道为目标区域注意力激活图的通道。如原RGB图像的通道数为红绿蓝3个通道，激活图为透明度即1个通道，则合并通道后掩膜图像具有 “红绿蓝+透明度”4个通道。由于激活图代表在目标识别时的注意力关注区域，利用包括该信息的掩膜图像有助于独立GAN网络生成与目标区域关联度高的特征向量。

本实施例中，独立GAN网络模型的训练方法为：对同一目标取不同清晰度图片，以人工判断最为清晰的照片为判别模型基准训练。

共存GAN网络模型的训练方法为：取在知识图谱上有关联的、不同目标的、非清晰图片的特征为输入值，将不同目标的非清晰图片的特征合并成中间特征向量后输入共存GAN网络，以目标的清晰图片为判别模型基准训练。

其中不同目标的非清晰图片的特征合并成中间特征向量的方式为：不同目标的非清晰图片的特征乘以对应的转移概率权重，然后再拼接或叠加成中间特征向量，转移概率权重为不同目标在知识图谱上与上一级目标的关联值。

本发明根据知识图谱将将经验知识融入视频图像模糊区域纹理增强过程，比如茶杯与杯盖在图像纹理上一般存在近似关系，如果茶杯的纹理清楚，我们可以根据预训练模型将茶杯纹理特征或风格迁移至成像不清晰的杯盖上。可根据已知背景参考对象的纹理特征，对目标的纹理进行增强显示或风格迁移，从而增加图像模糊区域的清晰度。

以上描述的仅是本发明的基本原理和优选实施例，本领域技术人员根据本发明做出的改进和替换，属于本发明的保护范围。

Claims

1.一种知识驱动的图像模糊区域清晰度增强方法，其特征在于：包括以下步骤：

S03）、调取N个关联实体的独立GAN网络模型，N个独立GAN 网络模型生成N个特征向量，将N个特征向量合并后，输入共存GAN网络模型，共存GAN网络模型输出增强的目标区域。

2.根据权利要求1所述的知识驱动的图像模糊区域清晰度增强方法，其特征在于：N个特征向量的合并方式为：特征向量乘以转移概率权重，然后再拼接或叠加成统一的向量，转移概率权重为目标A与关联实体的关联值。

3.根据权利要求2所述的知识驱动的图像模糊区域清晰度增强方法，其特征在于：N个特征向量加权叠加的合并方式为：

，Y为合并后的向量，Y_i为第i个关联实体B_i对应的独立GAN网络模型生成的特征向量，W_i为目标A与关联实体B_i的关联值。

4.根据权利要求1所述的知识驱动的图像模糊区域清晰度增强方法，其特征在于：N个独立GAN网络模型的输入为掩膜图像，掩膜图像是指步骤S01识别的目标区域的注意力激活图缩放至与原始输入图像相同尺寸后，对原始输入图像以增加数据通道方式扩展集成而形成的图像，增加的数据通道为目标区域注意力激活图的通道。

5.根据权利要求1所述的知识驱动的图像模糊区域清晰度增强方法，其特征在于：独立GAN网络模型的训练方法为：对同一目标取不同清晰度图片，以人工判断最为清晰的照片为判别模型基准训练。

6.根据权利要求1所述的知识驱动的图像模糊区域清晰度增强方法，其特征在于：共存GAN网络模型的训练方法为：取在知识图谱上有关联的、不同目标的、非清晰图片的特征为输入值，将不同目标的非清晰图片的特征合并成中间特征向量后输入共存GAN网络，以目标的清晰图片为判别模型基准训练。

7.根据权利要求6所述的知识驱动的图像模糊区域清晰度增强方法，其特征在于：不同目标的非清晰图片的特征合并成中间特征向量的方式：不同目标的非清晰图片的特征乘以对应的转移概率权重，然后再拼接或叠加成中间特征向量，转移概率权重为不同目标在知识图谱上与上一级目标的关联值。