CN102609936A - 基于置信度传播的图像立体匹配方法 - Google Patents
基于置信度传播的图像立体匹配方法 Download PDFInfo
- Publication number
- CN102609936A CN102609936A CN2012100056101A CN201210005610A CN102609936A CN 102609936 A CN102609936 A CN 102609936A CN 2012100056101 A CN2012100056101 A CN 2012100056101A CN 201210005610 A CN201210005610 A CN 201210005610A CN 102609936 A CN102609936 A CN 102609936A
- Authority
- CN
- China
- Prior art keywords
- image
- value
- pixel
- confidence
- gray
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Image Processing (AREA)
Abstract
本发明涉及基于置信度传播的图像立体匹配方法。包括:a.将输入的图像进行Rank变换后转换为Rank图像;b.通过全局能量函数对图像的平滑项进行优化;c.根据置信度传播算法计算全局能量函数的最小值;d.根据置信度的最小值获得像素点的视差值;e.将所述的视差值作为对应像素点的灰度值,输出视差图像。本发明的方法是通过求取全局能量函数的最小值来达到求得视差的目的。计算过程中,加入了图像的Rank变换,由此增强了邻域像素点间的约束条件,改善了平滑项,从而提高置信度传播过程的抗噪性和图像平滑性,提高了计算的精确度。
Description
技术领域
本发明涉及基于置信度传播的图像立体匹配方法。
背景技术
人类通过视觉感知外界世界,人类的视觉***是一个非常完善、复杂的感知***,视觉感知环境的效率很高,80%以上的外界信息是通过视觉得到的。随着信息技术的发展,让机器模拟人类的视觉功能成为可能。信号处理技术与计算机出现以后,人们试图用摄像机获取环境图像并将其转换成数字信号,用计算机实现对视觉信息处理的全过程,这样,就形成了一门新的学科:计算机视觉。计算机视觉的研究目标是使计算机具有通过二维图像认知三维环境信息的能力,以使计算机能够感受视野内的环境,理解感知的内容,包括形状、位置、姿态运动等,而且能对它们进行描述、存储、识别与理解,并在此基础上做出行为或者决策。
立体匹配是计算机视觉研究领域的重要内容,也是立体视觉中最为关键和困难的一步。它的最终目标是得到匹配图像的视差图。视差图是以图像对中任一幅图像为基准,其大小为该基准图像的大小,元素值为视差值的图像。视差就是从有一定距离的两个点上观察同一个目标所产生的方向差异。立体匹配问题通常可表达为求全局能量的最小化问题,首先定义能量函数,之后通过各种优化方法,来求其最小值。
立体匹配中的置信度传播算法是基于马尔科夫随机场(MRF)的立体匹配算法。马尔科夫随机场包含着两层意思,一个是马尔科夫性质,一个是随机场。马尔科夫性质是指一个随机变量序列按时间的顺序依次排开的时候,它在第N+1时刻的分布特性与第N时刻以前的随机变量没有任何关系。具备这种性质的问题就符合马尔科夫性质。随机场是指当给每一个位置中按照某种分布随机赋予相空间的一个值后,其全体就称之为随机场。
目前在置信度传播算法中采用像素的实际灰度值进行立体匹配,实际效果经常不准确,因此也影响了最终判断的正确性。
发明内容
针对以上出现的问题,本发明提供了一种基于置信度传播的图像立体匹配方法,增强邻域像素间的约束,提高置信度传播过程的抗噪性和图像平滑性,以提高立体匹配算法的精准度。
本发明基于置信度传播的图像立体匹配方法,包括:
a.将输入的图像进行Rank变换后转换为Rank图像;
b.通过全局能量函数对图像的平滑项进行优化;
c.根据置信度传播算法计算全局能量函数的最小值;
d.根据置信度的最小值获得像素点的视差值;
e.将所述的视差值作为对应像素点的灰度值,输出视差图像。
Rank变换是图像处理中一种常用方法,是以一个矩形窗口内的中心像素为基准,与窗口内其它像素的灰度值做比较,统计小于基准像素(即窗口内的中心像素)灰度值的个数,将基准像素的灰度值用这个个数来表示。本发明的方法不是用像素的实际灰度值进行图像立体匹配,而是采用基准像素在邻域窗口内的灰度值排序的序号进行计算(中心像素灰度的排序序号=窗口内小于基准像素灰度值的个数+1),这样就增强了邻域像素间的约束,提高立体匹配的抗噪性;建立全局能量函数时,对平滑项进行优化,提高对图像边缘的处理效果,经过这两项的改进,提高了立体匹配算法的精准度。
具体的,步骤a所述的Rank变换包括:
a1.在预定大小的窗口中,按从左到右和从上倒下的方向统计窗口内像素的灰度值;
a2.根据窗口内中心像素灰度的排序序号替换中心像素的灰度值;
a3.将整幅图像的每个像素的灰度值均用与中心像素的相对灰度值来表示。
优选的,通过大量的试验得知,通过3×3像素大小的窗口进行计算能够取得更准确的结果。
进一步的,步骤c中通过对视差匹配相似性、图像的平滑项和相邻迭代次数时不同像素点的视差信息求和计算所述全局能量函数的最小值。
具体的,步骤c中对所述置信度传播算法的迭代步骤包括:
c1.信息初始化,将不同像素点间传递的节点信息统一赋值为平均概率分布;
c2.从1到设定阈值循环更新所述不同像素点间的节点信息;
c3.计算像素点的置信度;
c4.计算获得的置信度的最大值为像素点的最大后验概率。所述的后验概率指的是在贝叶斯统计中,一个随机事件是在考虑相关证据或者数据后所得到的条件概率。
具体的,步骤c2所述的阈值为50~100。
测试得知,本发明的方法是通过求取全局能量函数的最小值来达到求得视差的目的。计算过程中,加入了图像的Rank变换,由此增强了邻域像素点间的约束条件,改善了平滑项,从而提高置信度传播过程的抗噪性和图像平滑性,提高了计算的精确度。
以下结合实施例的具体实施方式,对本发明的上述内容再作进一步的详细说明。但不应将此理解为本发明上述主题的范围仅限于以下的实例。在不脱离本发明上述技术思想情况下,根据本领域普通技术知识和惯用手段做出的各种替换或变更,均应包括在本发明的范围内。
具体实施方式
本发明基于置信度传播的图像立体匹配方法,包括:
a.将输入的图像进行Rank变换后转换为Rank图像,包括步骤:
a1.在3×3像素的窗口中,按从左到右和从上倒下的方向统计窗口内像素的灰度值;
a2.根据窗口内中心像素灰度的排序序号替换中心像素的灰度值;
a3.将整幅图像的每个像素的灰度值均用与中心像素的相对灰度值来表示;
b.计算全局能量函数:
变量说明:
E(d):全局能量函数。
Dp(dp):dp表示此p位置上的视差,Dp(dp)是匹配相似性测度函数。
p∈P:P表示全体像素点的集合,p表示像素属于P集合内的像素点。
V(dp,dq):平滑项函数,通常是两个相邻像素视差的差值函数。
N:相邻像素的集合。
V(di,dj):平滑项函数,通常是两个相邻像素视差的差值函数。
dj:j点像素视差值。
di:i点像素视差值。
ρI(ΔI):邻域像素间的梯度ΔI函数。
P′:设定的参数。
T:设定的阈值。
通过全局能量函数E(d)对图像的平滑项进行优化;
c.通过对视差匹配相似性、图像的平滑项和相邻迭代次数时不同像素点的视差信息求和计算所述全局能量函数的最小值:
其中:
dq:dp表示此p位置上的视差。
Ω:表示像素点的视差搜索范围。
s:第s次迭代。
N(p)\q:除掉q点之外的p点的邻域像素点。
在其中的迭代计算中,节点xi传递给xj的消息记为mij(xj),i为节点xj的邻域像素个数,取值为8,已观测节点yi传给待观测节点xi的消息记为mi(xi),xj的置信度用bj(xj)表示。mij(xj)、mj(xj)和bj(xj)这三者均为L维向量,L表示xi可能取值的个数。因此迭代的步骤包括:
c1.信息初始化,将节点信息mij(xj)统一赋值为平均概率分布,即mij(xj)=1/L,且mj(xj,yj)=φ(xj,yj),φ(xj,yj)为局部证据;
c2.从1到设定阈值T循环更新所述不同像素点间的节点信息,其中阈值T的取值为50~100:
其中:
←:标识将“←”右边的值传递给“←”左边的变量。
Ψij(xi,xj):节点xi和xj之间的兼容依赖性。
c3.计算像素点的置信度:
c4.计算获得的置信度的最大值为像素点xi的最大后验概率:
d.根据置信度的最小值获得像素点的视差值:
其中:
bp(dp):像素点p的置信度;
e.将所述的视差值作为对应像素点的灰度值,输出视差图像。
Claims (6)
1.基于置信度传播的图像立体匹配方法,其特征包括:
a.将输入的图像进行Rank变换后转换为Rank图像;
b.通过全局能量函数对图像的平滑项进行优化;
c.根据置信度传播算法计算全局能量函数的最小值;
d.根据置信度的最小值获得像素点的视差值;
e.将所述的视差值作为对应像素点的灰度值,输出视差图像。
2.如权利要求1所述的基于置信度传播的图像立体匹配方法,其特征为:步骤a所述的Rank变换包括:
a1.在预定大小的窗口中,按从左到右和从上倒下的方向统计窗口内像素的灰度值;
a2.根据窗口内中心像素灰度的排序序号替换中心像素的灰度值;
a3.将整幅图像的每个像素的灰度值均用与中心像素的相对灰度值来表示。
3.如权利要求2所述的基于置信度传播的图像立体匹配方法,其特征为:所述的窗口为3×3像素的窗口。
4.如权利要求1所述的基于置信度传播的图像立体匹配方法,其特征为:步骤c中通过对视差匹配相似性、图像的平滑项和相邻迭代次数时不同像素点的视差信息求和计算所述全局能量函数的最小值。
5.如权利要求1至4之一所述的基于置信度传播的图像立体匹配方法,其特征为:步骤c中对所述置信度传播算法的迭代步骤包括:
c1.信息初始化,将不同像素点间传递的节点信息统一赋值为平均概率分布;
c2.从1到设定阈值循环更新所述不同像素点间的节点信息;
c3.计算像素点的置信度;
c4.计算获得的置信度的最大值为像素点的最大后验概率。
6.如权利要求5所述的基于置信度传播的图像立体匹配方法,其特征为:步骤c2所述的阈值为50~100。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012100056101A CN102609936A (zh) | 2012-01-10 | 2012-01-10 | 基于置信度传播的图像立体匹配方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012100056101A CN102609936A (zh) | 2012-01-10 | 2012-01-10 | 基于置信度传播的图像立体匹配方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102609936A true CN102609936A (zh) | 2012-07-25 |
Family
ID=46527282
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2012100056101A Pending CN102609936A (zh) | 2012-01-10 | 2012-01-10 | 基于置信度传播的图像立体匹配方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102609936A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104166987A (zh) * | 2014-07-08 | 2014-11-26 | 哈尔滨师范大学 | 一种基于改进的自适应加权和置信度传播的视差估计方法 |
CN104902260A (zh) * | 2015-06-30 | 2015-09-09 | Tcl集团股份有限公司 | 一种图像视差的获取方法及*** |
CN105681776A (zh) * | 2016-01-13 | 2016-06-15 | 深圳市奥拓电子股份有限公司 | 一种视差图提取的方法和装置 |
CN106780442A (zh) * | 2016-11-30 | 2017-05-31 | 成都通甲优博科技有限责任公司 | 一种立体匹配方法及*** |
CN107133946A (zh) * | 2017-04-28 | 2017-09-05 | 上海联影医疗科技有限公司 | 医学图像处理方法、装置及设备 |
CN107409205A (zh) * | 2015-03-16 | 2017-11-28 | 深圳市大疆创新科技有限公司 | 用于焦距调节和深度图确定的装置和方法 |
CN109146768A (zh) * | 2017-01-03 | 2019-01-04 | 成都科创知识产权研究所 | 图像变换方法、***及应用 |
CN109191512A (zh) * | 2018-07-27 | 2019-01-11 | 深圳市商汤科技有限公司 | 双目图像的深度估计方法及装置、设备、程序及介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101853508A (zh) * | 2010-06-08 | 2010-10-06 | 浙江工业大学 | 基于方向集的泛化置信度传播的双目立体视觉匹配方法 |
CN101877129A (zh) * | 2010-06-08 | 2010-11-03 | 浙江工业大学 | 基于最小和缓存加速策略的泛化置信度传播的双目立体视觉匹配方法 |
CN101901483A (zh) * | 2010-06-08 | 2010-12-01 | 浙江工业大学 | 泛化置信度传播的双目立体视觉匹配方法 |
-
2012
- 2012-01-10 CN CN2012100056101A patent/CN102609936A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101853508A (zh) * | 2010-06-08 | 2010-10-06 | 浙江工业大学 | 基于方向集的泛化置信度传播的双目立体视觉匹配方法 |
CN101877129A (zh) * | 2010-06-08 | 2010-11-03 | 浙江工业大学 | 基于最小和缓存加速策略的泛化置信度传播的双目立体视觉匹配方法 |
CN101901483A (zh) * | 2010-06-08 | 2010-12-01 | 浙江工业大学 | 泛化置信度传播的双目立体视觉匹配方法 |
Non-Patent Citations (6)
Title |
---|
张程凤: "立体视频中视差估计研究", 《中国优秀硕士学位论文全文数据库》 * |
王中杰: "双目视觉匹配算法研究", 《中国优秀硕士学位论文全文数据库》 * |
王忠波: "立体视觉中匹配技术的研究", 《中国优秀硕士学位论文全文数据库》 * |
赵笑可: "基于全局能量最小化的立体匹配算法研究", 《中国优秀硕士学位论文全文数据库》 * |
郭龙源 等: "RANK变换在立体匹配中的应用研究", 《***仿真学报》 * |
马璇 等: "一种基于改进RANK变换的图像匹配算法", 《传感器与微***》 * |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104166987B (zh) * | 2014-07-08 | 2017-01-25 | 哈尔滨师范大学 | 一种基于改进的自适应加权和置信度传播的视差估计方法 |
CN104166987A (zh) * | 2014-07-08 | 2014-11-26 | 哈尔滨师范大学 | 一种基于改进的自适应加权和置信度传播的视差估计方法 |
US10574970B2 (en) | 2015-03-16 | 2020-02-25 | SZ DJI Technology Co., Ltd. | Apparatus and method for focal length adjustment and depth map determination |
CN107409205A (zh) * | 2015-03-16 | 2017-11-28 | 深圳市大疆创新科技有限公司 | 用于焦距调节和深度图确定的装置和方法 |
CN104902260A (zh) * | 2015-06-30 | 2015-09-09 | Tcl集团股份有限公司 | 一种图像视差的获取方法及*** |
CN105681776B (zh) * | 2016-01-13 | 2017-12-08 | 深圳市奥拓电子股份有限公司 | 一种视差图提取的方法和装置 |
CN105681776A (zh) * | 2016-01-13 | 2016-06-15 | 深圳市奥拓电子股份有限公司 | 一种视差图提取的方法和装置 |
CN106780442A (zh) * | 2016-11-30 | 2017-05-31 | 成都通甲优博科技有限责任公司 | 一种立体匹配方法及*** |
WO2018098891A1 (zh) * | 2016-11-30 | 2018-06-07 | 成都通甲优博科技有限责任公司 | 一种立体匹配方法及*** |
CN106780442B (zh) * | 2016-11-30 | 2019-12-24 | 成都通甲优博科技有限责任公司 | 一种立体匹配方法及*** |
CN109146768A (zh) * | 2017-01-03 | 2019-01-04 | 成都科创知识产权研究所 | 图像变换方法、***及应用 |
CN107133946A (zh) * | 2017-04-28 | 2017-09-05 | 上海联影医疗科技有限公司 | 医学图像处理方法、装置及设备 |
CN107133946B (zh) * | 2017-04-28 | 2020-05-22 | 上海联影医疗科技有限公司 | 医学图像处理方法、装置及设备 |
CN109191512A (zh) * | 2018-07-27 | 2019-01-11 | 深圳市商汤科技有限公司 | 双目图像的深度估计方法及装置、设备、程序及介质 |
CN109191512B (zh) * | 2018-07-27 | 2020-10-30 | 深圳市商汤科技有限公司 | 双目图像的深度估计方法及装置、设备、程序及介质 |
US11295466B2 (en) | 2018-07-27 | 2022-04-05 | Shenzhen Sensetime Technology Co., Ltd. | Method and apparatus for estimating depth of binocular image, device, program, and medium |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102609936A (zh) | 基于置信度传播的图像立体匹配方法 | |
CN103702098B (zh) | 一种时空域联合约束的三视点立体视频深度提取方法 | |
CN110705448B (zh) | 一种人体检测方法及装置 | |
CN107358626B (zh) | 一种利用条件生成对抗网络计算视差的方法 | |
Zhang et al. | Dispsegnet: Leveraging semantics for end-to-end learning of disparity estimation from stereo imagery | |
CN104966286B (zh) | 一种3d视频显著性检测方法 | |
US20190301861A1 (en) | Method and apparatus for binocular ranging | |
AU2017324923A1 (en) | Predicting depth from image data using a statistical model | |
EP3465611B1 (en) | Apparatus and method for performing 3d estimation based on locally determined 3d information hypotheses | |
EP3182369B1 (en) | Stereo matching method, controller and system | |
CN103003846B (zh) | 关节区域显示装置、关节区域检测装置、关节区域归属度计算装置、关节状区域归属度计算装置以及关节区域显示方法 | |
CN111931787A (zh) | 一种基于特征聚合的rgbd显著性检测方法 | |
CN102074014A (zh) | 一种利用基于图论的图像分割算法的立体匹配方法 | |
CN103295229B (zh) | 视频深度信息恢复的全局立体匹配方法 | |
Hung et al. | Consistent binocular depth and scene flow with chained temporal profiles | |
CN109005398B (zh) | 一种基于卷积神经网络的立体图像视差匹配方法 | |
CN103458261A (zh) | 一种基于立体视觉的视频场景变化检测方法 | |
CN109887008B (zh) | 基于前后向平滑和o(1)复杂度视差立体匹配方法、装置和设备 | |
CN109345525B (zh) | 一种去鬼影高动态范围图像质量评价方法 | |
CN103581650A (zh) | 双目3d视频转多目3d视频的方法 | |
CN103778598A (zh) | 视差图改善方法和装置 | |
CN102957936B (zh) | 从视频单视点到多视点的虚拟视点生成方法 | |
CN111553296B (zh) | 一种基于fpga实现的二值神经网络立体视觉匹配方法 | |
CN105025201B (zh) | 一种时空连续的视频背景修复方法 | |
Huang et al. | ES-Net: An efficient stereo matching network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20120725 |