CN103745465A

CN103745465A - 一种稀疏编码背景建模方法

Info

Publication number: CN103745465A
Application number: CN201410001821.7A
Authority: CN
Inventors: 戚金清; 胡阳
Original assignee: Dalian University of Technology
Current assignee: Dalian University of Technology
Priority date: 2014-01-02
Filing date: 2014-01-02
Publication date: 2014-04-23

Abstract

本发明公开了一种稀疏编码背景建模方法，该方法采用判别性原子模型方法对图像进行背景建模，具有如下步骤：步骤1：将采集到的图像分割成多个图像块，将图像块进行稀疏编码，步骤2：在图像的稀疏编码模型基础上，对稀疏编码字典中的原子利用频-逆向文件频率（tf-idf）统计分析方法查找出判别性原子，步骤3：利用上述选择出的判别性原子完成图像的背景重建。由于采用了上述技术方案，本发明提供的图像背景建模方法，该方法是在图像稀疏编码模型基础上，利用平均信息量和词频-逆向文件频率（tf-idf）技术，对稀疏编码字典中原子进行统计分析，寻找出携带判别性信息的原子即判别性原子，并利用判别性原子重建图像背景信息。

Description

一种稀疏编码背景建模方法

技术领域

本发明涉及图像处理技术领域，尤其涉及一种稀疏编码背景建模方法。

背景技术

在图像处理技术领域中背景提取和背景去除是图像处理中一项关键的步骤，现有技术中的背景建模方法主要分为像素级的方法和帧级的方法。典型的像素级方法包括：帧差法[1]，核密度法[3]和混合高斯法[2]。帧差法使用相邻帧的差值进行运动目标检测，这种方法算法简单，计算速度快，但是对于前景的检测不够精确。尤其是当前景面积较大，像素的亮度分布较为均匀，运动速度较慢时，帧差法对前景的检测将出现大的空洞。混合高斯法认为背景像素可以使用多个高斯分布进行表征，并因此使用多个不同的高斯分布实现对背景的建模。混合高斯法可以根据当前的图像对背景模型的参数进行更新，能够较好的实现对动态背景的建模，是一种非常常用且有效的背景建模方法。而且在原算法的基础上，也有很多的改进方法提出[4,5]。但是，并不是在所有的情况下混合高斯模型都能够准确的对背景进行建模，比如，当前景与背景的像素比较相似时，混合高斯模型常常误将部分前景像素检测为背景。不同于混合高斯法中使用高斯分布对背景进行建模，核密度法使用核密度估计估算背景像素的概率分布并以之对背景建模。具体而言，对于一个像素点，核密度估计采样过去几帧中这个像素点处的像素值，并使用这些像素值的核函数的均值对此像素点像素值的概率分布进行估计。核密度法是一种非参数的估计方法，其对概率密度的估计并不局限于特定的概率密度分布，因此可以对任意形式的背景分布做出估计，灵活性更高。但是核密度法的运算量较大，估计的时间复杂度较高。

不同于像素级的模型对各帧内的背景像素的分布进行建模，帧级的模型通过分析帧间的图像结构对背景进行建模。目前比较常见的帧级模型有PCA模型[6]，稀疏编码模型[9]和低秩[7,8]模型。PCA模型假设各帧的背景图像分布于一个低维的子空间中，并通过PCA学习得到的基函数对背景图像进行重建。与PCA模型相似，稀疏编码模型使用字典中的原子对视频图像的背景进行表征，并根据背景建模的特点，将普通稀疏编码中的2范数误差项替换为1范数误差项，加强了算法的鲁棒性。同样是基于子空间的假设，Candes等人假设潜在的背景图片都列于一个低秩子空间中，因此通过寻找图像序列的低秩表征来进行背景建模。在Candes等人工作的基础上，Zhou等人利用马尔可夫随机场对前景所在区域加入了连续性约束，实现了更好的背景建模效果。

目前的帧级模型都是基于潜在背景图像位于一个线性子空间中的假设，直接对全局背景进行建模。这种对直接对全局背景进行建模的方法对于较强烈的局部背景变动比较敏感，然而帧级的全局模型不能区分背景中运动目标和前景中运动目标。

发明内容

根据现有技术存在的问题，本发明公开的一种稀疏编码背景建模方法，对采集到的图像进行背景建模，具体采用如下方式：该方法采用判别性原子模型方法对图像进行背景建模，所述判别性原子模型方法采用如下方式：

步骤1：将采集到图像分割成多个图像块，对图像块按照下述公式进行稀疏编码；

\underset{D, X}{\arg \min} {| | Y - DX | |}_{2}^{2} + λ \underset{i}{Σ} {| | x_{i}^{c} | |}_{0}

式中：Y＝[y₁,y₂,...,y_n]∈

为图像块组成的集合，D＝[d₁,d₂,...,d_k]∈

为k个原子组成的字典，通过KSVD算法求解，X∈

为稀疏编码的系数，通过正交匹配追踪算法求解，

为X的第i列，λ是用于平衡重建误差和稀疏度的参数；

步骤2：在稀疏编码模型基础上，利用词频-逆向文件频率（tf-idf）统计分析方法选择判别性原子，根据下面公式进行判别性原子的选择：

tf - idf (d_{i}, y_{j}) = | x_{ij} | \times \frac{1}{f_{SR} (d_{i})}

其中：y_j为图像的第j个图像块，d_i为稀疏编码中的原子，x_ij是在对y_j的稀疏编码中原子d_i对应的系数，f_SR(d_i)表示在对全部样本的稀疏编码中原子d_i被使用到的频率；

设定tf-idf的临界值，将求解的tf-idf值中大于该临界值对应的原子d_i定义为判别性原子，对于原子d_i和图像块y_j，将原子d_i用于区分图像块y_j和其它图像块；

步骤3：利用步骤2中选择的判别性原子模型重建图像背景：

首先将步骤2中判别性原子组成集合DA，如果x_ij为判别性原子对应的稀疏编码则保留，否则记作0，判别性原子稀疏编码系数X^d∈

计算公式如下：

X_{ij}^{d} = \{\begin{matrix} X_{ij}, if d_{i} &Element; DA \\ 0, if d_{i} &NotElement; DA \end{matrix}

其中为Xd中第i行第j列对应系数；

然后利用判别性原子稀疏编码系数Xd和步骤1中字典D，重建图像背景，计算公式如下：

Y^B=Y一Y^d

=Y-DX^d

式中，Y＝[y₁,y₂,...,y_n]∈

为采集到的图像，D为步骤1中字典，X^d为判别性原子稀疏编码系数，Y^B为所求图像背景。

对判别性原子的选择采用如下方式：

对所有图像块，根据上述tf-idf计算公式，计算得到所有原子的tf-idf值的集合J＝{tf-idf(d_i,y_j)|d_i∈D,y_j∈Y}；

根据设定的tf-idf的临界值，选择出J中大于该临界值的子集J_σ；

则确定判别性原子的集合为：

DA = {d_{i} | &ForAll; d_{i} &Element; D, &Exists; y_{j} &Element; Y, tf - idf (d_{i}, y_{j}) &Element; J_{σ}}

。

由于采用了上述技术方案，本发明提供的图像背景建模方法，该方法是在图像稀疏编码模型基础上，利用平均信息量和词频-逆向文件频率（tf-idf）技术，对稀疏编码字典中原子进行统计分析，寻找出携带判别性信息的原子即判别性原子，并利用判别性原子重建图像背景信息。该方法不同于全局运动目标检测模型技术，本发明提出了一种由局部到全局的模型-判别性原子模型，实现了更为准确的背景建模及前景运动目标的检测。采用本方法可以快速的将图像的背景像素和前景像素进行区别并完成背景重建。

有益效果：

1、本发明提出的判别性原子模型，受背景扰动影响小，提高了前景检测精度。

2、本发明提出的判别性原子模型克服了传统方法对前景和背景在颜色、形状等比较相似情况下容易发生误检问题，提高了前景检测精度。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为稀疏编码背景建模方法的流程图。

具体实施方式

为使本发明的技术方案和优点更加清楚，下面结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚完整的描述：

如图1所示，本发明公开的背景建模方法，采用判别性原子模型方法对图像的背景像素和前景像素进行区分，所述判别性原子模型方法采用如下方式：首先将图像分割成多个图像块，在图像的稀疏编码模型基础上，利用平均信息量和词频-逆向文件频率（tf-idf）技术，对稀疏编码字典中的原子进行统计分析，寻找出携带判别性信息的原子，并利用判别性原子重建图像背景信息。

具体采用如下方式：

\underset{D, X}{\arg \min} {| | Y - DX | |}_{2}^{2} + λ \underset{i}{Σ} {| | x_{i}^{c} | |}_{0}

式中：Y＝[y₁,y₂,...,y_n]∈

为图像块组成的集合，D＝[d₁,d₂,...,d_k]∈

为k个原子组成的字典，通过KSVD算法求解，X∈

为稀疏编码的系数，通过正交匹配追踪算法求解，

为X的第i列，λ是用于平衡重建误差和稀疏度的参数。

tf - idf (d_{i}, y_{j}) = | x_{ij} | \times \frac{1}{f_{SR} (d_{i})}

步骤3：利用步骤2中选择的判别性原子模型重建图像背景：

计算公式如下：

X_{ij}^{d} = \{\begin{matrix} X_{ij}, if d_{i} &Element; DA \\ 0, if d_{i} &NotElement; DA \end{matrix}

其中

为X^d中第i行第j列对应系数；

然后利用判别性原子稀疏编码系数X^d和步骤1中字典D，重建图像背景，计算公式如下：

Y^B=Y-Y^d

=Y-DX^d

式中，Y＝[y₁,y₂,...,y_n]∈

进一步的，对于上述步骤2中所述的判别性原子的选择采用如下方式：对所有图像块，根据上述tf-idf计算公式，计算得到所有原子的tf-idf值的集合J＝{tf-idf(d_i,y_j)|d_i∈D,y_j∈Y}；

根据设定的tf-idf的临界值，在实际应用中，我们可以将该值设定为0.6，选择出J中大于该临界值的子集J_σ；

则确定判别性原子的集合为：

DA = {d_{i} | &ForAll; d_{i} &Element; D, &Exists; y_{j} &Element; Y, tf - idf (d_{i}, y_{j}) &Element; J_{σ}}

最后，我们将选择出的判别性原子进行图像重建，根据实际图像的规格和标准将该图像的背景像素和前景像素区分。

本发明公开的一种稀疏编码背景建模方法，首先通过词频-逆向文件频率（tf-idf）技术对图像的成千上万个图像块进行稀疏编码，然后采用本发明公开的算法查找出判别性原子，最后根据查找出的判别性原子以及判别性原子对应的稀疏编码系数完成图像背景的重建。

以上所述，仅为本发明较佳的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，根据本发明的技术方案及其发明构思加以等同替换或改变，都应涵盖在本发明的保护范围之内。