CN104574366B - 一种基于单目深度图的视觉显著性区域的提取方法 - Google Patents

一种基于单目深度图的视觉显著性区域的提取方法 Download PDF

Info

Publication number
CN104574366B
CN104574366B CN201410799464.3A CN201410799464A CN104574366B CN 104574366 B CN104574366 B CN 104574366B CN 201410799464 A CN201410799464 A CN 201410799464A CN 104574366 B CN104574366 B CN 104574366B
Authority
CN
China
Prior art keywords
depth
pixel
super
value
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201410799464.3A
Other languages
English (en)
Other versions
CN104574366A (zh
Inventor
余卫宇
孙宇飞
钱少惠
汤瑞东
于传若
石育金
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN201410799464.3A priority Critical patent/CN104574366B/zh
Publication of CN104574366A publication Critical patent/CN104574366A/zh
Application granted granted Critical
Publication of CN104574366B publication Critical patent/CN104574366B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/143Segmentation; Edge detection involving probabilistic approaches, e.g. Markov random field [MRF] modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/50Depth or shape recovery
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于单目深度图的视觉显著性区域的提取方法,包含以下顺序的步骤:对原图像进行分割得到各个超像素;建立每个超像素的特征向量,即估算图像中场景的绝对深度的绝对深度特征;利用高斯‑马尔可夫随机场模型建立概率模型,通过概率模型计算超像素特征向量与相邻超像素特征向量之间的距离关系,在所述的绝对深度特征的基础上得到了相对深度特征,同时得到超像素的深度值及深度图;计算超像素的显著值;由所述深度值计算出增益系数,利用增益系数修正所述显著值。本发明的提取方法,在无任何先验知识的前提下,能快速准确地自动识别图像中的显著性物体,且普适性好,显著性区域检测准确。

Description

一种基于单目深度图的视觉显著性区域的提取方法
技术领域
本发明涉及图像处理领域,特别涉及一种基于单目深度图的视觉显著性区域的提取方法。
背景技术
随着科技的发展与计算机计算性能的提高,人类越来越期望计算机能够更为智能更为自主地完成计算工作。欲达到这一期望,需要计算机获得理解周围环境的能力。视觉是人类感知外界信息的最主要方式。显著性区域检测在计算机视觉、图像处理等领域起着关键的作用,一直是人们研究的热门课题。
人类的视觉感知能力经过长期的自然选择进化到了较高的水平。人类的视觉***能够快速有效地从复杂的外界环境中提取出其感兴趣的物体,并对该物体做出相应的反应。关于人类的视觉感知能力的研究早已开展,但是到目前为止,仍然没有获得突破性的成果。
通常认为,人类的视觉感知***对外界环境的反应分为两个阶段:一个快速的、自下而上的、显著性主导的、目标无关的阶段和一个慢速的、自上而下的、意识主导的、目标有关的阶段。人类的视觉显著性检测行为就是前者,其在保障人类的基本生存能力方面有重要的作用。
与人类的视觉显著性检测相对应的,在计算机领域实现图像的显著性信息提取可以通过图像的显著性区域检测。通过图像的显著性区域检测可以获得显著图,较优的显著图可以清晰地显示显著性区域与非显著性区域,从而为计算机的相应的下一步工作提供了便利。
目前显著性区域识别技术目前有着广泛的应用,在动态图像融合、图像增强、图像检索、图像分割、图像压缩、图像自动化修剪等领域都起着重要的作用。然而常规的显著性算法仅能识别出简单图像的显著性区域,这些常规算法对复杂图像的计算难以达到令人满意的质量,因为缺乏对物体距离信息的考虑,会引起计算量大以及边缘模糊等问题。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提供一种基于单目深度图的视觉显著性区域的提取方法。
本发明的目的通过以下的技术方案实现:
一种基于单目深度图的视觉显著性区域的提取方法,包含以下顺序的步骤:
S1.对原图像进行分割,把图像中空间上距离近的且颜色、亮度、纹理特征相似的归为一个像素块,即为一个超像素;
S2.建立每个超像素的特征向量,即估算图像中场景的绝对深度的绝对深度特征;
S3.利用高斯-马尔可夫随机场模型建立概率模型,通过概率模型计算超像素特征向量与相邻超像素特征向量之间的距离关系,在所述的绝对深度特征的基础上得到了相对深度特征,同时得到超像素的深度值及深度图;
S4.计算超像素的显著值:首先计算超像素同其他所有超像素的对比度,若超像素与其他超像素的对比度越大,则其显著性程度越高;其次考虑空间距离,距该超像素较远的像素块会对其产生更大的影响;
S5.由所述深度值计算出增益系数,利用增益系数修正所述显著值:若一个超像素的深度值较低,即其深度较浅,距离观测者更近,那么在初步显著值上对该像素的抑制越弱,反之越强;
S6.在原图像中标示出最终显示值最大的区域,该区域即是该图像的显著性区域。
步骤S1中,所述的超像素,不同的超像素所包含的像素数相同,且不同超像素之间的邻接区域在较大的概率下会有显著的差异。
步骤S2、S3中所述的绝对深度特征、步骤S3所述的相对深度特征在计算时选取了色彩、亮度、纹理三种视觉特征。
所述的色彩特征通过把图像分为R、G、B三个通道进行一定的计算得到;所述的亮度特征通过其灰度值计算得到;所述的图像的纹理特征在亮度通道中计算获取,把图像的亮度通道与罗斯掩膜做卷积,卷积的结果用于检测纹理变化和纹理梯度,从而计算出纹理特征。
步骤S3中,所述的深度值及深度图具体通过下面的方式得到:考虑不同尺度空间下的深度,使得较高尺度的空间中的超像素的深度为较低尺度的空间中该超像素与其相邻超像素深度值的平均;而最低尺度空间的深度值是通过将原图的颜色和亮度空间分别与罗斯掩膜卷积,将得到的卷积值相加而得到的;深度值相近的化为一个深度区域,得到深度图。
所述的考虑不同尺度空间下的深度具体为:计算每一尺度空间下的深度,最后得到的深度值是每一尺度空间下的深度值的和,并作归一化处理。
步骤S5中,所述的深度值记为α,所述的增益系数记为K,则所述的增益系数K=eα
步骤S5中,所述的修正所述显著值具体是指将显著值乘以增益系数得到修正后的显著值。
本发明与现有技术相比,具有如下优点和有益效果:
1、本发明所提出的方法在A阶段利用了深度图信息,符合人眼视觉以距离自身近的物体为显著物体的规律,减小了噪声干扰,使得测试结果明显优于没有融合深度图信息的方法。此外,将本方法提取出的与目标物体相关的显著图用于物体检测,在能够有效地检测到目标物体的同时,降低了时间复杂度。
2、现有的大部分方法是自底向上的,只与图像的底层特征有关。本发明提出的方法考虑深度特征,并可以应用于物体检测等领域。
3、该方法对图像进行基于深度信息的计算后执行视觉显著性提取,特别的,有别于常规的基于双目图像提取深度特征,本方法仅通过单目图像快速有效地计算深度信息,同时避免了大量重复性的扫描,从而减小了时间复杂度。
4、本发明的提取方法,在无任何先验知识的前提下,能快速准确地自动识别图像中的显著性物体,且普适性好,显著性区域检测准确。
5、因为绝对深度特征并不能准确的被描述出来,所以本方法联合考虑了相对深度特征,结果更准确。
附图说明
图1为本发明所述的一种基于单目深度图的视觉显著性区域的提取方法的流程图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
如图1,一种基于单目深度图的视觉显著性区域的提取方法,包含以下顺序的步骤:
A.深度图计算阶段
1.对图像进行分割,把图像中空间上距离近的且颜色、亮度、纹理特征相似的归为一个像素块,并且这些像素块中所包含的像素数相同。称这些像素块为超像素。不同超像素之间的邻接区域在较大的概率下会有显著的差异。
2.为每一个超像素建立特征向量,并计算其与相邻超像素特征向量之间的关系。本方法考虑了两类特征向量,一类为估算相邻超像素的相对深度的相对深度特征;另一类为估算图像中场景的绝对深度的绝对深度特征。
3.本方法计算深度特征向量时选取了三种视觉特征,分别为色彩、亮度、纹理。图像的色彩特征可以通过把图像分为R、G、B三个通道进行一定的计算得到。图像的亮度特征可以通过其灰度值计算得到。图像的纹理特征可以在亮度通道中计算获取,把图像的亮度通道与罗斯掩膜做卷积,卷积的结果可以用于检测纹理变化和纹理梯度,以达到计算纹理特征的目的。
4.利用高斯-马尔可夫随机场模型建立概率模型。绝对深度特征并不能准确的被描述出来,本方法联合考虑了相对深度特征。然而相距较远的像素块在很大的概率下相关度较低,所以本方法选用马尔可夫模型。计算A深度图计算阶段第2步中的到的超像素的特征向量和与其相邻的超像素的特征向量的关系。并考虑不同尺度空间下的深度,使得较高尺度的空间中的超像素的深度为较低尺度的空间中该超像素与其相邻超像素深度的平均。
B.显著值初步计算阶段
1.对图像进行分割,把图像中空间上距离近的且颜色、亮度、纹理特征相似的归为一个像素块,并且这些像素块中所包含的像素数相同。称这些像素块为超像素。不同超像素之间的邻接区域在较大的概率下会有显著的差异。与A深度图计算阶段的第1步方法相同,得到的结果也必然相同,可以直接用A深度图计算阶段的第1步后得到的结果图。
2.计算超像素的显著性。首先,计算超像素同其他所有超像素的对比度,若超像素与其他超像素的对比度越大,则其显著性程度越高。其次,考虑空间距离,距该超像素较远的像素块会对其产生更大的影响。
C.显著值确定阶段
1.联系A深度图初步计算阶段得到的深度值,得到增益系数。利用增益系数对B显著值初步计算阶段得到的显著值进行修正。若一个超像素的深度值较低,即其深度较浅,距离观测者更近,那么在初步显著值上对该像素的抑制越弱,反之越强。
2.在原图中标示出最终显著值最大的区域,该区域即是该图像的显著性区域。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (8)

1.一种基于单目深度图的视觉显著性区域的提取方法,其特征在于,包含以下顺序的步骤:
S1.对原图像进行分割,把图像中空间上距离近的且颜色、亮度、纹理特征相似的归为一个像素块,即为一个超像素;
S2.建立每个超像素的特征向量,即估算图像中场景的绝对深度的绝对深度特征;
S3.利用高斯-马尔可夫随机场模型建立概率模型,通过概率模型计算超像素特征向量与相邻超像素特征向量之间的距离关系,在所述的绝对深度特征的基础上得到了相对深度特征,同时得到超像素的深度值及深度图;
S4.计算超像素的显著值:首先计算超像素同其他所有超像素的对比度,若超像素与其他超像素的对比度越大,则其显著性程度越高;其次考虑空间距离,距该超像素较远的像素块会对其产生更大的影响;
S5.由所述深度值计算出增益系数,利用增益系数修正所述显著值:若一个超像素的深度值较低,即其深度较浅,距离观测者更近,那么在初步显著值上对该像素的抑制越弱,反之越强;
S6.在原图像中标示出最终显示值最大的区域,该区域即是该图像的显著性区域。
2.根据权利要求1所述的基于单目深度图的视觉显著性区域的提取方法,其特征在于,步骤S1中,所述的超像素,不同的超像素所包含的像素数相同,且不同超像素之间的邻接区域在较大的概率下会有显著的差异。
3.根据权利要求1所述的基于单目深度图的视觉显著性区域的提取方法,其特征在于,步骤S2、S3中所述的绝对深度特征、步骤S3所述的相对深度特征在计算时选取了色彩、亮度、纹理三种视觉特征。
4.根据权利要求3所述的基于单目深度图的视觉显著性区域的提取方法,其特征在于,所述的色彩特征通过把图像分为R、G、B三个通道进行一定的计算得到;所述的亮度特征通过其灰度值计算得到;所述的图像的纹理特征在亮度通道中计算获取,把图像的亮度通道与罗斯掩膜做卷积,卷积的结果用于检测纹理变化和纹理梯度,从而计算出纹理特征。
5.根据权利要求1所述的基于单目深度图的视觉显著性区域的提取方法,其特征在于,步骤S3中,所述的深度值及深度图具体通过下面的方式得到:考虑不同尺度空间下的深度,使得较高尺度的空间中的超像素的深度为较低尺度的空间中该超像素与其相邻超像素深度值的平均;而最低尺度空间的深度值是通过将原图的颜色和亮度空间分别与罗斯掩膜卷积,将得到的卷积值相加而得到的;深度值相近的化为一个深度区域,得到深度图。
6.根据权利要求5所述的基于单目深度图的视觉显著性区域的提取方法,其特征在于,所述的考虑不同尺度空间下的深度具体为:计算每一尺度空间下的深度,最后得到的深度值是每一尺度空间下的深度值的和,并作归一化处理。
7.根据权利要求1所述的基于单目深度图的视觉显著性区域的提取方法,其特征在于,步骤S5中,所述的深度值记为α,所述的增益系数记为K,则所述的增益系数K=eα
8.根据权利要求1所述的基于单目深度图的视觉显著性区域的提取方法,其特征在于,步骤S5中,所述的修正所述显著值具体是指将显著值乘以增益系数得到修正后的显著值。
CN201410799464.3A 2014-12-18 2014-12-18 一种基于单目深度图的视觉显著性区域的提取方法 Expired - Fee Related CN104574366B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410799464.3A CN104574366B (zh) 2014-12-18 2014-12-18 一种基于单目深度图的视觉显著性区域的提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410799464.3A CN104574366B (zh) 2014-12-18 2014-12-18 一种基于单目深度图的视觉显著性区域的提取方法

Publications (2)

Publication Number Publication Date
CN104574366A CN104574366A (zh) 2015-04-29
CN104574366B true CN104574366B (zh) 2017-08-25

Family

ID=53090338

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410799464.3A Expired - Fee Related CN104574366B (zh) 2014-12-18 2014-12-18 一种基于单目深度图的视觉显著性区域的提取方法

Country Status (1)

Country Link
CN (1) CN104574366B (zh)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104966286B (zh) * 2015-06-04 2018-01-09 电子科技大学 一种3d视频显著性检测方法
CN105338335B (zh) * 2015-10-15 2017-03-29 宁波大学 一种立体图像显著图提取方法
CN105404888B (zh) * 2015-11-16 2019-02-05 浙江大学 结合颜色和深度信息的显著性目标检测方法
CN106611178A (zh) * 2016-03-10 2017-05-03 四川用联信息技术有限公司 一种显著目标识别方法
WO2017173578A1 (zh) * 2016-04-05 2017-10-12 华为技术有限公司 一种图像增强方法及装置
CN106023184A (zh) * 2016-05-16 2016-10-12 南京大学 一种基于各向异性中心环绕差异的深度显著性检测方法
CN106204551A (zh) * 2016-06-30 2016-12-07 北京奇艺世纪科技有限公司 一种图像显著性检测方法及装置
CN106203399B (zh) * 2016-07-27 2019-06-04 厦门美图之家科技有限公司 一种图像处理方法、装置和计算设备
CN109844806A (zh) * 2016-11-02 2019-06-04 华为技术有限公司 一种显著图生成方法及用户终端
CN108629805B (zh) * 2017-03-15 2021-12-14 纵目科技(上海)股份有限公司 一种基于图像分层技术的显著性物体检测方法及***
CN109960979A (zh) * 2017-12-25 2019-07-02 大连楼兰科技股份有限公司 基于图像分层技术的车辆检测方法
CN108961268B (zh) * 2018-06-19 2022-03-25 广东工业大学 一种显著图计算方法及相关装置
CN108921829A (zh) * 2018-06-20 2018-11-30 广州晖恒广告策划有限公司 一种基于视觉注意机制的广告设计客观评价方法
CN109493405B (zh) * 2018-10-31 2022-12-16 江苏和瑞智能科技股份有限公司 适用于大场景仓储的机器视觉点云图生成方法
CN111914850B (zh) * 2019-05-07 2023-09-19 百度在线网络技术(北京)有限公司 图片特征提取方法、装置、服务器和介质
WO2023039753A1 (zh) * 2021-09-15 2023-03-23 华为技术有限公司 一种背光显示的控制方法及装置
CN114998310B (zh) * 2022-07-11 2022-10-25 道格特半导体科技(江苏)有限公司 基于图像处理的显著性检测方法及***

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101944178A (zh) * 2010-09-27 2011-01-12 山东大学 用于智能监控的显著区域提取方法
CN102779338A (zh) * 2011-05-13 2012-11-14 欧姆龙株式会社 图像处理方法和图像处理装置
CN102968782A (zh) * 2012-09-12 2013-03-13 苏州大学 一种彩色图像中显著对象的自动抠取方法
CN103177440A (zh) * 2012-12-20 2013-06-26 香港应用科技研究院有限公司 生成图像深度图的***和方法
CN103208115A (zh) * 2013-03-01 2013-07-17 上海交通大学 基于测地线距离的图像显著性区域检测方法
CN103679173A (zh) * 2013-12-04 2014-03-26 清华大学深圳研究生院 图像显著区域检测方法
CN104103082A (zh) * 2014-06-06 2014-10-15 华南理工大学 一种基于区域描述和先验知识的图像显著性检测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8005264B2 (en) * 2008-06-09 2011-08-23 Arcsoft, Inc. Method of automatically detecting and tracking successive frames in a region of interesting by an electronic imaging device

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101944178A (zh) * 2010-09-27 2011-01-12 山东大学 用于智能监控的显著区域提取方法
CN102779338A (zh) * 2011-05-13 2012-11-14 欧姆龙株式会社 图像处理方法和图像处理装置
CN102968782A (zh) * 2012-09-12 2013-03-13 苏州大学 一种彩色图像中显著对象的自动抠取方法
CN103177440A (zh) * 2012-12-20 2013-06-26 香港应用科技研究院有限公司 生成图像深度图的***和方法
CN103208115A (zh) * 2013-03-01 2013-07-17 上海交通大学 基于测地线距离的图像显著性区域检测方法
CN103679173A (zh) * 2013-12-04 2014-03-26 清华大学深圳研究生院 图像显著区域检测方法
CN104103082A (zh) * 2014-06-06 2014-10-15 华南理工大学 一种基于区域描述和先验知识的图像显著性检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于双目视觉的显著性区域检测;刘中,陈伟海,吴星明,邹宇华,王建华;《浙江大学学报(工学版)》;20140228;第48卷(第2期);第354-359页 *
融合运动和空间关系特性的显著性区域检测;刘晓辉,金志刚,赵安安,卫津津;《华中科技大学学报(自然科学版)》;20130630;第41卷(第6期);第45-49页 *

Also Published As

Publication number Publication date
CN104574366A (zh) 2015-04-29

Similar Documents

Publication Publication Date Title
CN104574366B (zh) 一种基于单目深度图的视觉显著性区域的提取方法
CN103606132B (zh) 基于空域和时域联合滤波的多帧数字图像去噪方法
US10008004B1 (en) Establishment method of 3D saliency model based on prior knowledge and depth weight
CN105404888B (zh) 结合颜色和深度信息的显著性目标检测方法
CN102665086B (zh) 利用基于区域的局部立体匹配获取视差的方法
US8831337B2 (en) Method, system and computer program product for identifying locations of detected objects
CN104103082A (zh) 一种基于区域描述和先验知识的图像显著性检测方法
CN105243371A (zh) 一种人脸美颜程度的检测方法、***及拍摄终端
KR101820673B1 (ko) 멀티 스레드 방식을 기반으로 하는 3d 디스플레이를 위한 비디오 처리 방법
US9600888B2 (en) Image processing device, image processing method, and program
CN107392950A (zh) 一种基于弱纹理检测的跨尺度代价聚合立体匹配方法
WO2018082388A1 (zh) 一种肤色检测方法、装置及终端
Hua et al. Extended guided filtering for depth map upsampling
TWI457853B (zh) 提供深度資訊之影像處理方法及其影像處理系統
CN107622480A (zh) 一种Kinect深度图像增强方法
US20130083993A1 (en) Image processing device, image processing method, and program
CN106408596A (zh) 基于边缘的局部立体匹配方法
Wang et al. Stereoscopic image retargeting based on 3D saliency detection
JP4631973B2 (ja) 画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラム
US8908994B2 (en) 2D to 3d image conversion
CN108470340A (zh) 一种改进的Sobel边缘检测算法
CN109175718B (zh) 一种基于半色调技术的图片激光雕刻方法
CN107274456A (zh) 一种图像格式的识别方法及装置
JP2013172214A (ja) 画像処理装置、および画像処理方法、並びにプログラム
CN112114659B (zh) 用于确定用户的精细的注视点的方法和***

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170825

Termination date: 20211218