CN109544452A

CN109544452A - 视觉感知饱和策略的图像自适应缩小方法

Info

Publication number: CN109544452A
Application number: CN201811358212.1A
Authority: CN
Inventors: 张纠; 叶家建; 郭娅茜; 徐靓云; 潘晨
Original assignee: China Jiliang University
Current assignee: China Jiliang University
Priority date: 2018-04-18
Filing date: 2018-11-15
Publication date: 2019-03-29
Anticipated expiration: 2038-11-15
Also published as: CN108573472A; CN108573472B; CN109544452B

Abstract

本发明公开了一种视觉感知饱和策略的图像自适应缩小方法，包括以下步骤：1)利用不同缩小倍数Ki，通过原图像下采样，构造出多个缩小图Ii；2)分别对Ii用显著点预测算法计算显著图Si，其中显著度值大于平均值的像素点作为注视点；3)对Ii中注视点做Mean‑聚类，生成多个聚类Class_j；4)每类注视点形成自身注视区域和类中心，则该类点到类中心的归一化类内距离可作为微跳视幅度参数看待；5)对Ii中各类的归一化类内距离做累计平均，作为该图的微跳视幅度A_i；6)比较微跳视幅度A_i，其最小值对应的Ki是最佳图像尺度。

Description

视觉感知饱和策略的图像自适应缩小方法

技术领域

本发明涉及计算机视觉技术领域，具体地讲是一种视觉感知饱和策略的图像自适应缩小方法。

背景技术

图像分辨率的提高，使得像素数量几何倍数增加。面对海量视频图像数据，传统基于像素的图像处理算法面临严重的挑战。一方面人们致力于不断提高计算机***硬件速度来减缓这种压力；另一方面，对传统图像处理算法做合理改进，使之更适应处理海量像素数据，是一种有效的解决问题思路。

从人类视觉的角度而言，由于视网膜面积和光感受器数量有限，人眼通常通过晶状体调整和瞳孔缩放实现外界场景在视网膜上投影的尺度变化和目标聚焦。原始图像在视网膜上的投影是适当缩小的图像。缩小图像——利用下采样方式，缩小图像到一个合适尺度，能大大降低数据量。缺点是下采样过程中，过分的下采样往往会丢失小目标、模糊目标边缘。因此应用中的关键问题是图像缩小到多大尺度最合适？如何选择合理的图像缩小尺度是个亟待解决的问题。

现有技术通常是由人累试不同的图像缩小尺度，经验性地选择一个对大多数任务都合适的固定参数。对于变化的实际场景图像，这种做法有严重局限性。为了克服图像算法对于尺度的敏感性，通常还采用多尺度图像同时并行处理方式，即同时生成多个不同尺度的缩小图，通过各个尺度图像处理结果做后处理(集成)，来获得最终图像处理结果，但此类方法的缺点是有很高的时间复杂度。

发明内容

有鉴于此，本发明要解决的技术问题是，提供一种有效的图像自适应缩小方法，借鉴人类视觉的注视眼动行为和视觉感知饱和现象，通过微跳视幅度来预测不同尺度缩小图像的视觉感知饱和状况，选择可最早引起感知饱和的图像尺度作为图像缩小的最佳依据。

本发明的技术解决方案是，提供以下步骤的基于视觉感知饱和策略的图像自适应缩小方法，包括以下各步骤：

1)利用不同缩小倍数Ki，通过下采样原图像I，构造出多个缩小尺度图Ii。

2)分别对缩小尺度图Ii用显著点预测算法计算得到显著图Si，所述显著图Si中显著度值大于平均值的像素点作为注视点；

3)利用注视点做Mean-shift(均值位移法)聚类，生成多个聚类Class_j；

4)每个聚类的注视点形成自身注视区域和类中心，则该聚类的注视点到类中心的类内距离可作为微跳视幅度参数；

5)对基于整个原图像I所得到的各聚类的类内距离做累计并利用图像对角线长度为分母，做归一化处理，作为该尺度图像的微跳视幅度A_i；

6)比较微跳视幅度A_i，其最小值对应的Ki是最佳图像尺度。

作为改进，对注视点先进行Mean-shift聚类，Mean-shift法是一种密度估计方法，通过设置搜索窗口的宽度参数，依据点的密度，划分注视点为不同的聚类；多个聚类意味着场景中有多个注视区域，通过注视点之间的离散程度，判断图中是否存在多个注视目标，以避免多个注视区域被作为单个注视区域时导致判断错误。

作为改进，通过相位谱法对目标图像作注视点预测，可采用以下步骤：

对图像I(x,y)进行二维离散傅里叶变换，将图像由空间域转换到频域，得到相位P(u,v)信息：

将相位信息经傅里叶逆变换后，可以在空间域得到显著度图像Sa_Map。

Sa_Map(x,y)＝|F^-1[exp{jP(u,v)}]|² (2)

式中F和F^-1表示二维离散傅里叶正、逆变换，表示相位运算。根据显著度图，注视点的位置可用下列公式求出：

作为改进，第Ki个尺度下的微跳视幅度A_i计算如公式(4)。

其中:表示第j类中的第i个点坐标(x,y)；cent^j(x,y)表示第j类中心坐标。L表示图像对角线长度，n_j为每类点数量，k为类别数量；

采用本发明方法，与现有技术相比，本发明具有以下优点：可以自动将原图像缩小到合适尺度；算法结果匹配人类视觉感知；避免了并行处理多尺度图像的耗时；算法只注重少数高显著度像素数据，极大降低了计算量，具有低时间复杂度；由于显著点预测算法对光照变化和大范围纹理噪声等干扰不敏感，借助该方法能容忍一定程度(如设备不同、光照条件不同导致)的图像变化。本发明利用人类视觉机制自动选择合适的图像缩小尺度，从而降低数据量、提高算法性能。

附图说明

图1为本发明视觉感知饱和策略的图像自适应缩小方法流程框图。

具体实施方式

下面就具体实施例对本发明作进一步说明，但本发明并不仅仅限于这些实施例。

本发明涵盖任何在本发明的精髓和范围上做的替代、修改、等效方法以及方案。为了使公众对本发明有彻底的了解，在以下本发明优选实施例中详细说明了具体的细节，而对本领域技术人员来说没有这些细节的描述也可以完全理解本发明。此外，本发明之附图中为了示意的需要，并没有完全精确地按照实际比例绘制，在此予以说明。

已知人眼在观察场景时存在频繁眼动(跳视和微跳视)。跳视幅度大，使得视网膜中央凹朝向需要注意的场景；微跳视幅度小，维持目标区域相对稳定于中央凹。精确注视时，微跳视的幅度会下降，而当微跳视幅度微小时将导致视知觉饱和；一方面神经***输出当前视觉目标，另一方面导致感知衰退，引发新跳视和返回抑制(注视不返回先前点)。因此，微跳视幅度可以作为一种视觉感知产生的指标。

如图1所示，本发明的视觉感知饱和策略的图像自适应缩小方法，包括以下各步骤：

2)分别对缩小尺度图Ii用显著点预测算法计算得到显著图Si；所述显著图Si中显著度值大于平均值的像素点作为注视点；

3)利用注视点做Mean-shift法聚类，生成多个聚类Class_j；

4)每类注视点形成自身注视区域和类中心，则该聚类的注视点到类中心的类内距离可作为微跳视幅度参数；

5)对基于整个原图像I中各聚类的类内距离做累计并利用图像对角线长度为分母，做归一化处理，作为该尺度图像的微跳视幅度A_i；

6)比较A_i，其最小值对应的Ki是最佳图像尺度。

本发明利用注视预测模型产生注视点，模拟人类注视。注视预测模型中的许多算法，如谱残差法(SR)，相位谱法(PFT)，布尔图法(BMS)等，都可以用来产生合适的注视预测结果。例如，通过相位谱法对目标图像作注视点预测，可采用以下步骤：

Sa_Map(x,y)＝|F^-1[exp{jP(u,v)}]|² (2)

可对注视点先进行Mean-shift聚类，依据注视点的密度分布，粗略划分注视点为不同的聚类；多个聚类意味着场景中有多个注视区域。目的是通过注视点之间的离散程度，大致判断图中是否存在多个注视目标，以避免多个注视区域被作为单个注视区域时导致判断错误。Mean-shift聚类与kmeans聚类相比，kmeans聚类需要人工设置k个类别；mean-shift聚类无需人工设置类别数量，只需设置一个搜索窗宽度即可。

接着，针对各注视区域，计算该类中心到各注视点的类内距离，并利用图像对角线长度为分母，对其归一化。各类注视点到类中心的归一化距离累计，作为微跳视幅度度量值。

第Ki个尺度下的微跳视幅度A_i计算如公式(4)。

其中:表示第j类中的第i个点坐标(x,y)。cent^j(x,y)表示第j类中心坐标。L表示图像对角线长度，n_j为每类点数量，k为类别数量。

虽然以上将实施例分开说明和阐述，例如，方法和***的两套发明，但涉及部分共通之技术，在本领域普通技术人员看来，可以在实施例之间进行替换和整合，涉及其中一个实施例未明确记载的内容，则可参考有记载的另一个实施例。

以上仅就本发明较佳的实施例作了说明，但不能理解为是对权利要求的限制。本发明不仅局限于以上实施例，其具体结构允许有变化。总之，凡在本发明独立权利要求的保护范围内所作的各种变化均在本发明的保护范围内。

Claims

1.视觉感知饱和策略的图像自适应缩小方法，其特征在于：包括以下步骤：

3)利用注视点做Mean-shift聚类，生成多个聚类Class_j；

6)比较微跳视幅度A_i，其最小值对应的Ki是最佳图像尺度。

2.根据权利要求1所述的视觉感知饱和策略的图像自适应缩小方法，其特征在于：

对注视点先进行Mean-shift聚类，依据点的分布密度划分注视点为不同的聚类；多个聚类意味着场景中有多个注视区域，通过注视点之间的离散程度，判断图中是否存在多个注视目标，以避免多个注视区域被作为单个注视区域时导致判断错误。

3.根据权利要求1所述的视觉感知饱和策略的图像自适应缩小方法，其特征在于：通过相位谱法对目标图像作注视点预测，可采用以下步骤：

Sa_Map(x,y)＝|F^-1[exp{jP(u,v)}]|² (2)

式中F和F^-1表示二维离散傅里叶正、逆变换，表示相位运算；根据显著度图，注视点的位置可用下列公式求出：

4.根据权利要求3所述的视觉感知饱和策略的图像自适应缩小方法，其特征在于：第Ki个尺度下的微跳视幅度A_i计算如公式(4)；

其中:表示第j类中的第i个点坐标(x,y)；cent^j(x,y)表示第j类中心坐标；L表示图像对角线长度，n_j为每类点数量，k为类别数量；