CN110769258A

CN110769258A - 一种用于特定场景多语义区域的图像压缩方法及***

Info

Publication number: CN110769258A
Application number: CN201911070955.3A
Authority: CN
Inventors: 郝虹; 高岩; 金长新
Original assignee: Shandong Inspur Artificial Intelligence Research Institute Co Ltd
Current assignee: Shandong Inspur Artificial Intelligence Research Institute Co Ltd
Priority date: 2019-11-05
Filing date: 2019-11-05
Publication date: 2020-02-07

Abstract

本发明公开一种用于特定场景多语义区域的图像压缩方法及***，涉及图像处理技术领域，采用技术方案通过使用卷积神经网络分类模型中的靠前隐藏层feature map同时检测出特定场景图像中的多目标语义区域，并通过计算原始图像各区域块的兴趣度，进而将计算结果映射到原始图像中的对应区域像素，对该区域使用高比特率进行编码，其他区域使用低比特率编码，完成区别化图像压缩。本发明从多语义区域检测和区别化图像压缩两个方面改进了现有图像的压缩过程，可以避免将人感兴趣区域的物体压缩失真。

Description

一种用于特定场景多语义区域的图像压缩方法及***

技术领域

本发明涉及图像处理技术领域，具体的说是一种用于特定场景多语义区域的图像压缩方法及***。

背景技术

视频图像充斥在生活中的各个方面，海量的视频图像数据占据很大的存储空间，所以视频图像压缩技术能够高效率低占用的将原始视频图像处理成压缩的数据流，但是，压缩率越高，解码后的视频图像质量越低，所以高压缩率会以损失原始视频图像质量为代价。在人的视觉感知中，相对于背景的失真，对感兴趣区域物体的失真敏感度更高。

类激活图(CAM,class activation map),通过将分类卷积神经网络后段进行改造，对输入图像生成类激活的热力图,表示每个位置对该类别的重要程度，还可以用来定位图像中特定的目标。但是CAM是为了使类的后验概率最大化而训练的，它更倾向于只突出一个最突出的物体。然而现实世界的图像通常包含多个感兴趣的对象，所以CAM不适用于这种情况。

鉴于上述两个问题，提出一种用于特定场景多语义区域的图像压缩方法及***，从多语义区域检测和区别化图像压缩两个方面改进现有图像的压缩过程。

发明内容

本发明针对目前技术发展的需求和不足之处，提供一种用于特定场景多语义区域的图像压缩方法及***。

首先，本发明提供一种用于特定场景多语义区域的图像压缩方法，解决上述技术问题采用的技术方案如下：

一种用于特定场景多语义区域的图像压缩方法，该方法的实现过程包括：

S10、为特定场景关注的若干类分别训练卷积神经网络分类模型；

S20、使用训练好的卷积神经网络分类模型检测原始图像中的多目标语义区域；

S30、针对检测结果，对原始图像进行区别化图像压缩。

在步骤S10中，对卷积神经网络分类模型进行离线训练，训练得到的所有卷积神经网络分类模型的结构一致。

在步骤S20中，使用训练好的卷积神经网络分类模型检测原始图像中的多目标语义区域，这一过程包括：

S21、将图像分别输入各个卷积神经网络分类模型，取各卷积神经网络分类模型指定卷积层激活后的feature map，即每个卷积神经网络分类模型都是取第L个卷积层；

S22、分别计算步骤S21中所述各个卷积神经网络分类模型上feature map激活值的总和sum(σ₁),sum(σ₂)...sum(σ_c)，其中，sum(σ_i)表示图像在第i个卷积神经网络分类模型上feature map激活值的总和；

S23、联合所有卷积神经网络分类模型上的feature map，统一计算该层featuremap上每个点的兴趣度；

S24、将步骤S23所述的feature map映射到原始图像，得到原始图像各区域块的兴趣度。

在步骤S23中，计算兴趣度的具体操作为：

设(x,y)为feature map上一个点的位置坐标，该点的兴趣度计算公式为：

其中s为一个超参数，sum(σ_c)＞s，说明属于卷积神经网络分类模型c的概率大。

在步骤S30中，对原始图像进行区别化图像压缩，就是基于步骤S24得到的原始图像各区域块的兴趣度，对兴趣度高于设定阈值的区域使用高比特率编码，对兴趣度低于设定阈值的区域使用低比特率编码。

其次，本发明提供一种用于特定场景多语义区域的图像压缩***，解决上述技术问题采用的技术方案如下：

一种用于特定场景多语义区域的图像压缩***，其包括：

训练模块，使用特定场景关注的若干类分别训练卷积神经网络分类模型；

卷积神经网络分类模型，用于检测原始图像中的多目标语义区域；

区别化处理模块，用于根据检测结果对原始图像进行区别化图像压缩。

具体的，所涉及训练模块使用特定场景关注的若干类离线训练卷积神经网络分类模型，且训练得到的所有卷积神经网络分类模型的结构一致。

具体的，所涉及卷积神经网络分类模型检测原始图像中的多目标语义区域，具体检测过程为：

更具体的，所涉及步骤S23中，计算兴趣度的具体操作为：

具体的，基于得到的原始图像各区域块的兴趣度，所涉及区别化处理模块对兴趣度高于设定阈值的区域使用高比特率编码，对兴趣度低于设定阈值的区域使用低比特率编码。

本发明的一种用于特定场景多语义区域的图像压缩方法及***，与现有技术相比具有的有益效果是：

本发明通过使用卷积神经网络分类模型中的靠前隐藏层feature map同时检测出特定场景图像中的多目标语义区域，并通过计算原始图像各区域块的兴趣度，进而将计算结果映射到原始图像中的对应区域像素，对该区域使用高比特率进行编码，其他区域使用低比特率编码，完成区别化图像压缩，避免将人感兴趣区域的物体压缩失真。

附图说明

附图1是本发明实施例一的方法流程图；

附图2是本发明实施例一中步骤S20的流程图；

附图3是本发明实施例二的连接框图。

附图中各标号信息表示：

1、训练模块，2、卷积神经网络分类模型，3、区别化处理模块。

具体实施方式

为使本发明的技术方案、解决的技术问题和技术效果更加清楚明白，以下结合具体实施例，对本发明的技术方案进行清楚、完整的描述。

实施例一：

结合附图1、2，本实施例提出一种用于特定场景多语义区域的图像压缩方法，该方法的实现过程包括：

S10、为特定场景关注的若干类分别训练卷积神经网络分类模型。

S20、使用训练好的卷积神经网络分类模型检测原始图像中的多目标语义区域。

这一过程具体包括：

在步骤S23中，计算兴趣度的具体操作为：

S30、针对检测结果，对原始图像进行区别化图像压缩。

实施例二：

结合附图3，本实施例提出一种用于特定场景多语义区域的图像压缩***，其包括：

在本实施例中，所涉及训练模块使用特定场景关注的若干类离线训练卷积神经网络分类模型，且训练得到的所有卷积神经网络分类模型的结构一致。

结合附图2，在本实施例中，所涉及卷积神经网络分类模型检测原始图像中的多目标语义区域，具体检测过程为：

所涉及步骤S23中，计算兴趣度的具体操作为：

在本实施例中，基于得到的原始图像各区域块的兴趣度，所涉及区别化处理模块对兴趣度高于设定阈值的区域使用高比特率编码，对兴趣度低于设定阈值的区域使用低比特率编码。

综上可知，采用本发明的一种用于特定场景多语义区域的图像压缩方法及***，从多语义区域检测和区别化图像压缩两个方面改进现有图像的压缩过程，避免将人感兴趣区域的物体压缩失真。

以上应用具体个例对本发明的原理及实施方式进行了详细阐述，这些实施例只是用于帮助理解本发明的核心技术内容。基于本发明的上述具体实施例，本技术领域的技术人员在不脱离本发明原理的前提下，对本发明所作出的任何改进和修饰，皆应落入本发明的专利保护范围。

Claims

1.一种用于特定场景多语义区域的图像压缩方法，其特征在于,该方法的实现过程包括：

S30、针对检测结果，对原始图像进行区别化图像压缩。

2.根据权利要求1所述的一种用于特定场景多语义区域的图像压缩方法，其特征在于，在步骤S10中，对卷积神经网络分类模型进行离线训练，训练得到的所有卷积神经网络分类模型的结构一致。

3.根据权利要求1所述的一种用于特定场景多语义区域的图像压缩方法，其特征在于，在步骤S20中，使用训练好的卷积神经网络分类模型检测原始图像中的多目标语义区域，这一过程包括：

S23、联合所有卷积神经网络分类模型上的feature map，统一计算该层feature map上每个点的兴趣度；

4.根据权利要求3所述的一种用于特定场景多语义区域的图像压缩方法，其特征在于，在步骤S23中，计算兴趣度的具体操作为：

5.根据权利要求3所述的一种用于特定场景多语义区域的图像压缩方法，其特征在于，在步骤S30中，对原始图像进行区别化图像压缩，就是基于步骤S24得到的原始图像各区域块的兴趣度，对兴趣度高于设定阈值的区域使用高比特率编码，对兴趣度低于设定阈值的区域使用低比特率编码。

6.一种用于特定场景多语义区域的图像压缩***，其特征在于，其包括：

7.根据权利要求6所述的一种用于特定场景多语义区域的图像压缩***，其特征在于，所述训练模块使用特定场景关注的若干类离线训练卷积神经网络分类模型，且训练得到的所有卷积神经网络分类模型的结构一致。

8.根据权利要求6所述的一种用于特定场景多语义区域的图像压缩***，其特征在于，所述卷积神经网络分类模型检测原始图像中的多目标语义区域，具体检测过程为：

9.根据权利要求8所述的一种用于特定场景多语义区域的图像压缩***，其特征在于，在步骤S23中，计算兴趣度的具体操作为：

10.根据权利要求6所述的一种用于特定场景多语义区域的图像压缩***，其特征在于，基于得到的原始图像各区域块的兴趣度，区别化处理模块对兴趣度高于设定阈值的区域使用高比特率编码，对兴趣度低于设定阈值的区域使用低比特率编码。