CN112991421A - 一种机器人视觉立体匹配方法 - Google Patents

一种机器人视觉立体匹配方法 Download PDF

Info

Publication number
CN112991421A
CN112991421A CN202110304658.1A CN202110304658A CN112991421A CN 112991421 A CN112991421 A CN 112991421A CN 202110304658 A CN202110304658 A CN 202110304658A CN 112991421 A CN112991421 A CN 112991421A
Authority
CN
China
Prior art keywords
pixel
window
gradient
representing
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110304658.1A
Other languages
English (en)
Other versions
CN112991421B (zh
Inventor
王耀南
安果维
毛建旭
朱青
张辉
曾凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan University
Original Assignee
Hunan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan University filed Critical Hunan University
Priority to CN202110304658.1A priority Critical patent/CN112991421B/zh
Publication of CN112991421A publication Critical patent/CN112991421A/zh
Application granted granted Critical
Publication of CN112991421B publication Critical patent/CN112991421B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/50Depth or shape recovery
    • G06T7/55Depth or shape recovery from multiple images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种机器人视觉立体匹配方法,首先在代价计算部分,通过SAD和MCT匹配代价计算方式,可以在保证图像在弱纹理与重复纹理效果的同时,兼顾窗口像素点相关性与的全局性,避免引入噪声;其次在代价聚合阶段,引入基于图像梯度而改变尺寸大小与方向的自适应窗口,利用基于梯度变化的自适应窗口,充分的考虑到图像的梯度信息,即在梯度平缓区域窗口尺寸增大,梯度变化剧烈区域窗口尺寸减小,使图像的边缘部分得到最大程度的保持,同时,在自适应窗口内进行引导滤波以代价聚合,在此基础之上进一步使用多尺度聚合的方法,得到更优的代价聚合结果;最终在进行视差计算与视差优化,得到最优视差结果,具有机器人视觉立体匹配度高的优点。

Description

一种机器人视觉立体匹配方法
技术领域
本发明属于工业机器人及移动机器人视觉感知技术领域,具体涉及一种机器人视觉立体匹配方法,尤其设计一种基于改进代价计算与梯度自适应窗口多尺度聚合的机器人视觉立体匹配方法。
背景技术
立体匹配技术是立体视觉极其关键的一步,匹配的精度与速度是立体视觉应用与发展的关键制约因素,立体匹配技术在摄影测量,三维重建,虚拟现实,无人驾驶,移动机器人,移动小车,火星车,月球车等多个领域有着广泛的应用。立体匹配的精度直接影响移动机器人深度估计与地形三维重构的精度,对移动机器人基于立体视觉的视觉导航的精度提升起着非常关键作用,直接影响移动机器人视觉感知任务是否能够完成。
立体匹配根据最优化方法的不同,可分为全局算法与局部算法两类。全局算法是在全局范围内建立一个能量函数,在对能量函数进行最优化,得到每个像素的代价值,再进行代价计算与视差优化,得到最终的视差图。全局算法精度较高,但是计算复杂度高,实时性差,在实际应用场景中会有很大的限制。局部算法则包括代价计算,代价聚合,视差计算,视差优化四个步骤,代价计算的目的是计算待匹配像素对的相关性,Xing Mei在《OnBuilding an Accurate Stereo Matching System on Graphics Hardware》中提出了像素绝对值AD与census-transform相结合的代价计算方式,对图像的弱纹理与重复纹理区域的匹配效果有所提高,但是像素绝对值AD为单像素的相关性,容易引入噪声,传统的census-transform只是以窗口中每个像素与中心像素做对比,忽略了整个窗口的全局性。代价聚合是在局部立体匹配算法中最重要的一步,本质上可以看作对初始匹配代价滤波的过程,传统的利用盒子滤波器与高斯滤波器在代价聚合阶段进行滤波,不能很好的保护图像中的边缘信息,Pauline Tan在《Stereo Disparity through Cost Aggregation with GuidedFilter》一文中提出了用引导滤波器进行代价聚合,边缘保护性能有所提升,但是其是在图象全局范围内进行引导滤波,在深度不连续,图像梯度变化较大区域仍不能得到更好的结果。Kang Zhang在《Cross-Scale Cost Aggregation for Stereo Matching》一文中首先提出跨尺度融合进行代价聚合的思想,但是其在单尺度的代价聚合效果比较一般。
发明内容
本发明的目的在于避免现有技术中的不足而提供一种机器人视觉立体匹配方法,首先在代价计算部分,可以在兼顾像素点相关性与全局性,在充分考虑到像素点相关性的同时不会过多的引入噪声。其次在代价聚合阶段,利用基于梯度变化的自适应窗口,充分的考虑到图像的梯度信息,使图像的边缘部分得到最大程度的保持,在此基础之上进一步使用多尺度聚合的方法,得到更优的代价聚合结果。最终在进行视差计算与视差优化,得到最优视差结果,具有机器人视觉立体匹配度高的优点。
本发明的目的通过以下技术方案实现:提供一种机器人视觉立体匹配方法,包括以下步骤:
步骤1、获取畸变校正与立体校正后的待匹配双目图像;
步骤2、改进传统的基于梯度的匹配代价计算方式,将x,y方向的梯度进行融合;
步骤3、将SAD和MCT匹配代价计算方式进行融合,其中,SAD表示待匹配像素邻域内所有像素的灰度差绝对值之和,MCT表示待匹配双目图像中支持窗口中心像素为像素均值的改进的census变换;
步骤4、将改进的基于梯度的匹配代价计算方式与SAD和MCT匹配代价计算方式进行再一次融合,得到最终的匹配代价计算方式;
步骤5、将待匹配双目图像进行下采样,生成图像金字塔;
步骤6、在生成的图像金字塔的每个尺度的图像上,生成基于梯度而尺寸大小变化的自适应窗口;
步骤7、通过步骤4的匹配代价计算方式,得到每个尺度的图像对应的视差空间图,对每个视差空间图利用步骤6得到的自适应窗口进行滑动,并在自适应窗口内进行引导滤波,即为每个尺度的代价聚合过程;
步骤8、将步骤7得到的每个尺度的代价聚合结果进行多尺度聚合,得到最终的代价聚合结果;
步骤9、利用胜者为王WTA的方法计算步骤8中代价聚合结果,得到像素的视差值;
步骤10、利用自适应权重中值滤波,左右一致性检测方法对得到的视差值进行优化,得到最终的视差结果,该视差结果即为最终的立体匹配结果。
作为进一步的改进,所述步骤2具体表现如下:
设定已知x,y方向的梯度为
Figure BDA0002987603710000031
其中,
Figure BDA0002987603710000032
为在x方向的计算梯度操作,
Figure BDA0002987603710000033
为在y方向的计算梯度操作,GR为在三通道图像中像素在R通道的值,GG为在三通道图像中像素在G通道的值,GB为在三通道图像中像素在B通道的值,进而得到改进的基于梯度的匹配代价计算公式:
Figure BDA0002987603710000034
式中,p表示像素,d表示视差值,α表示在梯度代价中y方向的梯度所占的比重,为设定值,
Figure BDA0002987603710000035
表示像素p在左图中在x方向的梯度值,
Figure BDA0002987603710000036
表示像素p-d在右图中在x方向的梯度值,
Figure BDA0002987603710000037
表示像素p在左图中在y方向的梯度值,
Figure BDA0002987603710000038
表示像素p-d在右图中在y方向的梯度值,τ1、τ2均表示设置的截断值。
作为进一步的改进,所述步骤3中SAD匹配代价计算为
Figure BDA0002987603710000041
其中,Il(p)表示像素p在左图中三个通道数值之和,Ir(p-d)表示像素p-d在右图中三个通道数值之和,NP表示以像素p为中心的邻域,MCT的匹配代价计算为Cmcent(p,d)=Hamming(Ccl(p),Ccr(p-d)),其中,Hamming表示汉明距离,具体操作为对Ccl(p)与Ccr(p-d)进行异或运算,统计结果为1的个数,Ccl(p)表示像素p在左图进行变换后得到的字符串,Ccr(p-d)表示像素p-d在右图进行变换后得到的字符串。
作为进一步的改进,所述MCT匹配代价计算方法过程如下:
首先,将邻域像素与中心像素比较得到布尔值,并将布尔值映射到一个比特串中,中心像素值为邻域窗口内所有像素的均值,得到
Figure BDA0002987603710000042
Cc(p)表示对像素p进行变换操作之后得到的字符串,
Figure BDA0002987603710000043
表示按位连接,NP表示p的邻域,
Figure BDA0002987603710000044
Figure BDA0002987603710000045
表示邻域所有像素的均值,I(p)表示像素p的值,为三个通道数值之和;
然后,取两个比特串的汉明距离得到MCT匹配代价计算,其中汉明距离即两个比特串的对应位不相同的数量,具体为将两个比特串进行异或运算,在统计异或运算结果的比特位中不为1的个数,得到的MCT匹配代价计算方式为
Cmcent(p,d)=Hamming(Ccl(p),Ccr(p-d))。
作为进一步的改进,所述步骤4中得到的最终的匹配代价计算方式为:
Figure BDA0002987603710000046
式中,λSAD表示SAD匹配代价计算方式的调控参数,λmcent表示MCT匹配代价计算方式的调控参数,λg表示改进的基于梯度的匹配代价计算方式的调控参数,λSAD、λmcent和λg均为设定值。
作为进一步的改进,所述步骤6具体表现为:
步骤a:对待匹配双目图像分别计算出水平方向与竖直方向的梯度gx与gy,计算方式为
Figure BDA0002987603710000051
以像素p为中心的初始平滑窗口的方向为θ0(i,j),其计算方式为θ0(i,j)=arctan(g(y)(i,j)/g(x)(i,j)),i表示像素p的横坐标值,j表示像素p的纵坐标值,g(x)(i,j)表示像素p在x方向的梯度,g(y)(i,j)表示像素p在y方向的梯度,设初始窗口的尺寸为w0(i,j)与H0(i,j),w0(i,j)表示初始窗口的宽,H0(i,j)表示初始窗口的高,其计算方式为
Figure BDA0002987603710000052
a表示平滑窗口中最大的方形窗口尺寸;
步骤b:计算窗口内水平方向与竖直方向的梯度代数和
Figure BDA0002987603710000053
Figure BDA0002987603710000054
计算方式为
Figure BDA0002987603710000055
其中,k表示水平方向单位数值,l表示竖直方向单位数值,gx(i+k,j+l)表示坐标为(i+k,j+l)的像素在水平方向的梯度,gy(i+k,j+l)表示坐标为(i+k,j+l)的像素在竖直方向的梯度,L为该自适应窗口,窗口方向依据梯度代数和更新,计算方式为,
Figure BDA0002987603710000056
步骤c:计算窗口内水平方向与竖直方向的梯度绝对值和
Figure BDA0002987603710000057
Figure BDA0002987603710000058
窗口尺寸依据梯度绝对值和更新,梯度绝对值和计算方式为
Figure BDA0002987603710000059
窗口尺寸计算方式为
Figure BDA00029876037100000510
其中,wm(i,j)表示自适应窗口在水平方向的尺寸,Hm(i,j)表示自适应窗口在竖直方向的尺寸,θm(i,j)表示自适应窗口的方向;
步骤d:当自适应窗口尺寸满足条件
Figure BDA0002987603710000061
时,停止更新窗口的尺寸与方向,其中,wm+1(i,j)表示自适应窗口邻域水平方向的尺寸,Hm+1(i,j)表示自适应窗口邻域竖直方向的尺寸。
作为进一步的改进,所述步骤7在自适应窗口内进行引导滤波,具体通过如下步骤实现:
首先,建立引导滤波算法的能量函数优化模型
Figure BDA0002987603710000062
式中,ak和bk表示引导滤波的线性系数,Ii表示输入图像,Pi表示待滤波图像,i与k表示图像索引,
Figure BDA0002987603710000063
为正则项,放在能量函数方程中防止ak过大,Nk表示像素k的自适应支持窗口;
其次,通过对能量函数优化模型最小化计算得到基于自适应窗口的引导滤波的线性系数ak与bk分别为
Figure BDA0002987603710000064
式中,μk表示Ii的均值,
Figure BDA0002987603710000065
表示待滤波图像在自适应窗口中的均值,σk表示Ii的标准差;
最后,滤波后得到的代价函数为
Figure BDA0002987603710000066
其中akIi+bk表示输出图像,在以像素k为中心的窗口中,输出图像与Ii存在局部线性关系。
作为进一步的改进,所述步骤8中得到最终的代价聚合结果为
Figure BDA0002987603710000067
Figure BDA0002987603710000068
表示最终的聚合代价,S表示向下采样层数,A表示求解过程中的系数矩阵,s表示具体的每一层,
Figure BDA0002987603710000069
表示第0层的匹配代价矩阵。
本发明提供的机器人视觉立体匹配方法,首先在代价计算部分,通过SAD和MCT匹配代价计算方式,可以在保证图像在弱纹理与重复纹理效果的同时,兼顾窗口像素点相关性与的全局性,避免引入噪声;其次在代价聚合阶段,引入基于图像梯度而改变尺寸大小与方向的自适应窗口,利用基于梯度变化的自适应窗口,充分的考虑到图像的梯度信息,即在梯度平缓区域窗口尺寸增大,梯度变化剧烈区域窗口尺寸减小,使图像的边缘部分得到最大程度的保持,同时,在自适应窗口内进行引导滤波以代价聚合,在此基础之上进一步使用多尺度聚合的方法,得到更优的代价聚合结果;最终在进行视差计算与视差优化,得到最优视差结果,具有机器人视觉立体匹配度高的优点。
附图说明
利用附图对本发明作进一步说明,但附图中的实施例不构成对本发明的任何限制,对于本领域的普通技术人员,在不付出创造性劳动的前提下,还可以根据以下附图获得其它的附图。
图1是机器人视觉立体匹配方法的流程图。
具体实施方式
为了使本领域的技术人员更好地理解本发明的技术方案,下面结合附图和具体实施例对本发明作进一步详细的描述,需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
图1为本发明一实施例提供的机器人视觉立体匹配方法。参见图1,该机器人视觉立体匹配方法包括以下步骤:
步骤1、获取畸变校正与立体校正后的待匹配双目图像;
步骤2、改进传统的基于梯度的匹配代价计算方式,将x,y方向的梯度进行融合;该步骤具体表现为:设定已知x,y方向的梯度为
Figure BDA0002987603710000081
其中
Figure BDA0002987603710000082
为在x方向的计算梯度操作,
Figure BDA0002987603710000083
为在y方向的计算梯度操作,GR为在三通道图像中像素在R通道的值,GG为在三通道图像中像素在G通道的值,GB为在三通道图像中像素在B通道的值,,进而得到改进的基于梯度的匹配代价计算公式:
Figure BDA0002987603710000084
式中,p表示像素,d表示视差值,α表示在梯度代价中y方向的梯度所占的比重,为设定值,
Figure BDA0002987603710000085
表示像素p在左图中在x方向的梯度值,
Figure BDA0002987603710000086
表示像素p-d在右图中在x方向的梯度值,
Figure BDA0002987603710000087
表示像素p在左图中在y方向的梯度值,
Figure BDA0002987603710000088
表示像素p-d在右图中在y方向的梯度值,τ1、τ2表示设置的截断值。
步骤3、将SAD(sum of absolute diffenence绝对差值的和)和MCT(mean censustransform均值变换)匹配代价计算方式进行融合,其中,SAD表示待匹配像素邻域内所有像素的灰度差绝对值之和,MCT表示待匹配双目图像中支持窗口中心像素为像素均值的改进的census(统计)变换;
具体地,该步骤中SAD匹配代价计算为
Figure BDA0002987603710000089
其中,Il(p)表示像素p在左图中三个通道数值之和,Ir(p-d)表示像素p-d在右图中三个通道数值之和,NP表示以像素p为中心的邻域;MCT的匹配代价计算方法为,首先,将邻域像素与中心像素比较得到布尔值,并将布尔值映射到一个比特串中,中心像素值为邻域窗口内所有像素的均值,得到
Figure BDA00029876037100000810
其中Cc(p)表示对像素p进行变换操作之后得到的字符串,
Figure BDA00029876037100000811
表示按位连接,NP表示p的邻域,
Figure BDA00029876037100000812
Figure BDA00029876037100000813
表示邻域所有像素的均值,I(p)表示像素p的值,为三个通道数值之和;然后,取两个比特串的汉明距离得到MCT匹配代价计算,其中汉明距离即两个比特串的对应位不相同的数量,具体为将两个比特串进行异或运算,在统计异或运算结果的比特位中不为1的个数,得到的MCT匹配代价计算方式为Cmcent(p,d)=Hamming(Ccl(p),Ccr(p-d)),其中,其中,Hamming表示汉明距离,具体操作为对Ccl(p)与Ccr(p-d)进行异或运算,统计结果为1的个数,Ccl(p)表示像素p在左图进行变换后得到的字符串,Ccr(p-d)表示像素p-d在右图进行变换后得到的字符串。
步骤4、将改进的基于梯度的匹配代价计算方式与SAD和MCT匹配代价计算方式进行再一次融合,得到最终的匹配代价计算方式
Figure BDA0002987603710000091
式中,λSAD表示SAD计算方法的调控参数,λmcent表示MCT计算方法的调控参数,λg表示改进梯度方法的调控参数,均为设定值;
步骤5、将待匹配双目图像进行下采样,生成图像金字塔;
步骤6、在生成的图像金字塔的每个尺度的图像上,生成基于梯度而尺寸大小变化的自适应窗口;需要说明的是,该窗口的尺寸,形状与方向会随图像结构信息的变化而变化。其中生成自适应窗口的具体步骤为:
步骤a:对待匹配双目图像分别计算出水平方向与竖直方向的梯度gx与gy,计算方式为
Figure BDA0002987603710000092
以像素p为中心的初始平滑窗口的方向为θ0(i,j),其计算方式为θ0(i,j)=arctan(g(y)(i,j)/g(x)(i,j)),i表示像素p的横坐标值,j表示像素p的纵坐标值,g(x)(i,j)表示像素p在x方向的梯度,g(y)(i,j)表示像素p在y方向的梯度,设初始窗口的尺寸为w0(i,j)与H0(i,j),w0(i,j)表示初始窗口的宽,H0(i,j)表示初始窗口的高,其计算方式为
Figure BDA0002987603710000101
a表示平滑窗口中最大的方形窗口尺寸;
步骤b:计算窗口内水平方向与竖直方向的梯度代数和
Figure BDA0002987603710000102
Figure BDA0002987603710000103
计算方式为
Figure BDA0002987603710000104
其中,k表示水平方向单位数值,l表示竖直方向单位数值,gx(i+k,j+l)表示坐标为(i+k,j+l)的像素在水平方向的梯度,gy(i+k,j+l)表示坐标为(i+k,j+l)的像素在竖直方向的梯度,L为该自适应窗口,窗口方向依据梯度代数和更新,计算方式为,
Figure BDA0002987603710000105
步骤c:计算窗口内水平方向与竖直方向的梯度绝对值和
Figure BDA0002987603710000106
Figure BDA0002987603710000107
窗口尺寸依据梯度绝对值和更新,梯度绝对值和计算方式为
Figure BDA0002987603710000108
窗口尺寸计算方式为
Figure BDA0002987603710000109
其中,wm(i,j)表示自适应窗口在水平方向的尺寸,Hm(i,j)表示自适应窗口在竖直方向的尺寸,θm(i,j)表示自适应窗口的方向;
步骤d:当自适应窗口尺寸满足条件
Figure BDA00029876037100001010
时,停止更新窗口的尺寸与方向,其中,wm+1(i,j)表示自适应窗口邻域水平方向的尺寸,Hm+1(i,j)表示自适应窗口邻域竖直方向的尺寸。
步骤7、通过步骤4的匹配代价计算方式,得到每个尺度的图像对应的视差空间图,对每个视差空间图利用步骤6得到的自适应窗口进行滑动,并在自适应窗口内进行引导滤波,即为每个尺度的代价聚合过程;即本步骤中自适应窗口只是一个窗口,进行引导滤波是在自适应窗口之内的,对象为之前匹配代价计算得到的结果(为视差空间图),不同尺度的图像会得到自己的视差空间图,分别进行自适应窗口引导滤波后,再进行汇总,在每个视差空间图上进行自适应窗口引导滤波的过程为代价聚合。
具体地,该步骤中,首先,建立引导滤波算法的能量函数优化模型
Figure BDA0002987603710000111
式中,ak和bk表示引导滤波的线性系数,Ii表示输入图像,Pi表示待滤波图像,i与k表示图像索引,
Figure BDA0002987603710000112
为正则项,放在能量函数方程中防止ak过大,Nk表示像素k的自适应支持窗口;
其次,通过对能量函数优化模型最小化计算得到基于自适应窗口的引导滤波的线性系数ak与bk分别为
Figure BDA0002987603710000113
μk表示Ii的均值,
Figure BDA0002987603710000114
表示待滤波图像在自适应窗口中的均值,σk表示Ii的标准差;
最后,滤波后得到的代价函数为
Figure BDA0002987603710000115
其中akIi+bk表示输出图像,在以像素k为中心的窗口中,输出图像与Ii存在局部线性关系。
步骤8、将步骤7得到的每个尺度的代价聚合结果进行多尺度聚合,得到最终的代价聚合结果
Figure BDA0002987603710000116
Figure BDA0002987603710000117
表示最终的聚合代价,S表示向下采样层数,A表示求解过程中的系数矩阵,s表示具体的每一层,
Figure BDA0002987603710000118
表示第0层的匹配代价矩阵。需要说明的是,由于之前在每个尺度的图像上进行了代价聚合,本步骤是把每个尺度得到的结果进行汇总,故叫多尺度聚合。
步骤9、利用胜者为王WTA(winner take all在某个像素的所有视差下的代价值中,选择最小代价对应的视差作为最优视差)的方法计算步骤8中代价聚合结果,得到像素的视差值;
步骤10、利用自适应权重中值滤波,左右一致性检测方法对得到的视差值进行优化,得到最终的视差结果,该视差结果即为最终的立体匹配结果。
综上所述,本发明机器人视觉立体匹配方法的具体过程为(1)获取畸变校正与立体校正后的待匹配双目图像;(2)改进传统的基于梯度的匹配代价计算方式,将x,y方向的梯度进行合理有效的归一化融合;(3)将待匹配像素邻域内所有像素的灰度差绝对值之和SAD与支持窗口中心像素为像素均值的改进的census变换MCT的匹配代价计算方式进行融合;(4)将改进的基于梯度的匹配代价计算方式与SAD和MCT匹配代价计算方式进行再一次融合,得到最终的匹配代价计算方式;(5)将待匹配双目图像进行下采样,生成图像金字塔;(6)在每个尺度的图像上,生成基于梯度自动控制尺寸大小的自适应窗口;(7)在每个窗口内进行引导滤波;(8)再将图像金字塔的不同尺度的结果进行聚合得到最终的代价聚合结果;(9)利用胜者为王WTA的方法计算步骤8中代价聚合结果,得到像素的视差值;(10)利用自适应权重中值滤波,左右一致性检测方法对视差计算得到的结果进行视差优化,得到最终的立体匹配结果。通过上述过程,本发明在立体匹配的代价聚合过程中,引入了基于梯度变化的自适应窗口,可以随梯度的变化改变窗口尺寸的大小,梯度变化平缓则窗口较大,梯度变化剧烈则窗口较小,并在自适应窗口内进行引导滤波代价聚合。相比在整张图片全局范围内进行引导滤波代价聚合,本发明的方法可以更着重计算局部,在深度不连续的区域等立体匹配容易出错的区域,可以削弱其影响,在深度变化平缓等立体匹配效果比较好的区域,可以增大其影响,同时在此基础之上,本发明引入了多尺度聚合的方法,会在深度不连续区域得到更优的立体匹配效果。
故此,与现有技术相比,本发明的优点在于:
(1)有效的减弱计算过程中噪声的引入,提高立体匹配的精度
本发明在代价计算过程改进传统的AD-Census(absolute diffenence census绝对差值与census变换相结合)代价计算方式,提出了SAD和MCT的匹配代价计算方式,利用邻域支持窗口的像素和的代价与中心像素为邻域支持窗口均值的Census变换代价相融合,在兼顾像素相关性的同时,考虑到了邻域窗口内其它像素的作用,更具有全局性,所以在计算过程中会削弱噪声的影响,减少噪声的引入。
(2)在深度不连续及纹理变化比较丰富区域得到更优的效果,提高立体匹配的精度。
上面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,不能理解为对本发明保护范围的限制。
总之,本发明虽然列举了上述优选实施方式,但是应该说明,虽然本领域的技术人员可以进行各种变化和改型,除非这样的变化和改型偏离了本发明的范围,否则都应该包括在本发明的保护范围内。

Claims (8)

1.一种机器人视觉立体匹配方法,其特征在于,包括以下步骤:
步骤1、获取畸变校正与立体校正后的待匹配双目图像;
步骤2、改进传统的基于梯度的匹配代价计算方式,将x,y方向的梯度进行融合;
步骤3、将SAD和MCT匹配代价计算方式进行融合,其中,SAD表示待匹配双目图像中待匹配像素邻域内所有像素的灰度差绝对值之和,MCT表示待匹配双目图像中支持窗口中心像素为像素均值的改进的census变换;
步骤4、将改进的基于梯度的匹配代价计算方式与SAD和MCT匹配代价计算方式进行再一次融合,得到最终的匹配代价计算方式;
步骤5、将待匹配双目图像进行下采样,生成图像金字塔;
步骤6、在生成的图像金字塔的每个尺度的图像上,生成基于梯度而尺寸大小变化的自适应窗口;
步骤7、通过步骤4的匹配代价计算方式,得到每个尺度的图像对应的视差空间图,对每个视差空间图利用步骤6得到的自适应窗口进行滑动,并在自适应窗口内进行引导滤波,即为每个尺度的代价聚合过程;
步骤8、将步骤7得到的每个尺度的代价聚合结果进行多尺度聚合,得到最终的代价聚合结果;
步骤9、利用胜者为王WTA的方法计算步骤8中代价聚合结果,得到像素的视差值;
步骤10、利用自适应权重中值滤波,左右一致性检测方法对得到的视差值进行优化,得到最终的视差结果,该视差结果即为最终的立体匹配结果。
2.根据权利要求1所述的机器人视觉立体匹配方法,其特征在于,所述步骤2具体表现如下:
设定已知x,y方向的梯度为
Figure FDA0002987603700000021
其中,
Figure FDA0002987603700000022
为在x方向的计算梯度操作,
Figure FDA0002987603700000023
为在y方向的计算梯度操作,GR为在三通道图像中像素在R通道的值,GG为在三通道图像中像素在G通道的值,GB为在三通道图像中像素在B通道的值,进而得到改进的基于梯度的匹配代价计算公式:
Figure FDA0002987603700000024
式中,p表示像素,d表示视差值,α表示在梯度代价中y方向的梯度所占的比重,为设定值,
Figure FDA0002987603700000025
表示像素p在左图中在x方向的梯度值,
Figure FDA0002987603700000026
表示像素p-d在右图中在x方向的梯度值,
Figure FDA0002987603700000027
表示像素p在左图中在y方向的梯度值,
Figure FDA0002987603700000028
表示像素p-d在右图中在y方向的梯度值,τ1、τ2均表示设置的截断值。
3.根据权利要求2所述的机器人视觉立体匹配方法,其特征在于,所述步骤3中SAD匹配代价计算为
Figure FDA0002987603700000029
其中,Il(p)表示像素p在左图中三个通道数值之和,Ir(p-d)表示像素p-d在右图中三个通道数值之和,NP表示以像素p为中心的邻域,MCT的匹配代价计算为Cmcent(p,d)=Hamming(Ccl(p),Ccr(p-d)),其中,Hamming表示汉明距离,具体操作为对Ccl(p)与Ccr(p-d)进行异或运算,统计结果为1的个数,Ccl(p)表示像素p在左图进行变换后得到的字符串,Ccr(p-d)表示像素p-d在右图进行变换后得到的字符串。
4.根据权利要求3所述的机器人视觉立体匹配方法,其特征在于,所述MCT匹配代价计算方法过程如下:
首先,将邻域像素与中心像素比较得到布尔值,并将布尔值映射到一个比特串中,中心像素值为邻域窗口内所有像素的均值,得到
Figure FDA0002987603700000031
其中Cc(p)表示对像素p进行变换操作之后得到的字符串,
Figure FDA0002987603700000032
表示按位连接,NP表示p的邻域,
Figure FDA0002987603700000033
Figure FDA0002987603700000034
表示邻域所有像素的均值,I(p)表示像素p的值,为三个通道数值之和;
然后,取两个比特串的汉明距离得到MCT匹配代价计算,其中汉明距离即两个比特串的对应位不相同的数量,具体为将两个比特串进行异或运算,在统计异或运算结果的比特位中不为1的个数,得到的MCT匹配代价计算方式为
Cmcent(p,d)=Hamming(Ccl(p),Ccr(p-d))。
5.根据权利要求4所述的机器人视觉立体匹配方法,其特征在于,所述步骤4中得到的最终的匹配代价计算方式为:
Figure FDA0002987603700000035
式中,λSAD表示SAD匹配代价计算方式的调控参数,λmcent表示MCT匹配代价计算方式的调控参数,λg表示改进的基于梯度的匹配代价计算方式的调控参数,λSAD、λmcent和λg均为设定值。
6.根据权利要求5所述的机器人视觉立体匹配方法,其特征在于,所述步骤6具体表现为:
步骤a:对待匹配双目图像分别计算出水平方向与竖直方向的梯度gx与gy,计算方式为
Figure FDA0002987603700000036
以像素p为中心的初始平滑窗口的方向为θ0(i,j),其计算方式为θ0(i,j)=arctan(g(y)(i,j)/g(x)(i,j)),i表示像素p的横坐标值,j表示像素p的纵坐标值,g(x)(i,j)表示像素p在x方向的梯度,g(y)(i,j)表示像素p在y方向的梯度,设初始窗口的尺寸为w0(i,j)与H0(i,j),w0(i,j)表示初始窗口的宽,H0(i,j)表示初始窗口的高,其计算方式为
Figure FDA0002987603700000041
a表示平滑窗口中最大的方形窗口尺寸;
步骤b:计算窗口内水平方向与竖直方向的梯度代数和
Figure FDA0002987603700000042
Figure FDA0002987603700000043
计算方式为
Figure FDA0002987603700000044
其中,k表示水平方向单位数值,l表示竖直方向单位数值,gx(i+k,j+l)表示坐标为(i+k,j+l)的像素在水平方向的梯度,gy(i+k,j+l)表示坐标为(i+k,j+l)的像素在竖直方向的梯度,L为该自适应窗口,窗口方向依据梯度代数和更新,计算方式为,
Figure FDA0002987603700000045
步骤c:计算窗口内水平方向与竖直方向的梯度绝对值和
Figure FDA0002987603700000046
Figure FDA0002987603700000047
窗口尺寸依据梯度绝对值和更新,梯度绝对值和计算方式为
Figure FDA0002987603700000048
窗口尺寸计算方式为
Figure FDA0002987603700000049
其中,wm(i,j)表示自适应窗口在水平方向的尺寸,Hm(i,j)表示自适应窗口在竖直方向的尺寸,θm(i,j)表示自适应窗口的方向;
步骤d:当自适应窗口尺寸满足条件
Figure FDA00029876037000000410
时,停止更新窗口的尺寸与方向,其中,wm+1(i,j)表示自适应窗口邻域水平方向的尺寸,Hm+1(i,j)表示自适应窗口邻域竖直方向的尺寸。
7.根据权利要求6所述的机器人视觉立体匹配方法,其特征在于,所述步骤7在自适应窗口内进行引导滤波,具体通过如下步骤实现:
首先,建立引导滤波算法的能量函数优化模型
Figure FDA0002987603700000051
式中,ak和bk表示引导滤波的线性系数,Ii表示输入图像,Pi表示待滤波图像,i与k表示图像索引,
Figure FDA0002987603700000052
为正则项,放在能量函数方程中防止ak过大,Nk表示像素k的自适应支持窗口;
其次,通过对能量函数优化模型最小化计算得到基于自适应窗口的引导滤波的线性系数ak与bk分别为
Figure FDA0002987603700000053
式中,μk表示Ii的均值,
Figure FDA0002987603700000054
表示待滤波图像在自适应窗口中的均值,σk表示Ii的标准差;
最后,滤波后得到的代价函数为
Figure FDA0002987603700000055
其中akIi+bk表示输出图像,在以像素k为中心的窗口中,输出图像与Ii存在局部线性关系。
8.根据权利要求7所述的机器人视觉立体匹配方法,其特征在于,所述步骤8中得到最终的代价聚合结果为
Figure FDA0002987603700000056
Figure FDA0002987603700000057
表示最终的聚合代价,S表示向下采样层数,A表示求解过程中的系数矩阵,s表示具体的每一层,
Figure FDA0002987603700000058
表示第0层的匹配代价矩阵。
CN202110304658.1A 2021-03-23 2021-03-23 一种机器人视觉立体匹配方法 Active CN112991421B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110304658.1A CN112991421B (zh) 2021-03-23 2021-03-23 一种机器人视觉立体匹配方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110304658.1A CN112991421B (zh) 2021-03-23 2021-03-23 一种机器人视觉立体匹配方法

Publications (2)

Publication Number Publication Date
CN112991421A true CN112991421A (zh) 2021-06-18
CN112991421B CN112991421B (zh) 2023-08-08

Family

ID=76334333

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110304658.1A Active CN112991421B (zh) 2021-03-23 2021-03-23 一种机器人视觉立体匹配方法

Country Status (1)

Country Link
CN (1) CN112991421B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113822915A (zh) * 2021-07-30 2021-12-21 济宁安泰矿山设备制造有限公司 用于智能泵腔体内窥镜故障诊断的图像立体匹配方法
CN116071415A (zh) * 2023-02-08 2023-05-05 淮阴工学院 一种基于改进Census算法的立体匹配方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013126114A (ja) * 2011-12-14 2013-06-24 Samsung Yokohama Research Institute Co Ltd ステレオ画像処理方法及びステレオ画像処理装置
US20130259360A1 (en) * 2012-03-27 2013-10-03 Fujitsu Limited Method and system for stereo correspondence
CN103440653A (zh) * 2013-08-27 2013-12-11 北京航空航天大学 双目视觉立体匹配方法
CN110473217A (zh) * 2019-07-25 2019-11-19 沈阳工业大学 一种基于Census变换的双目立体匹配方法
CN112102382A (zh) * 2020-09-16 2020-12-18 北京邮电大学 一种基于多尺度变换与ADCensus-JWGF的机电设备视觉信息立体匹配算法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013126114A (ja) * 2011-12-14 2013-06-24 Samsung Yokohama Research Institute Co Ltd ステレオ画像処理方法及びステレオ画像処理装置
US20130259360A1 (en) * 2012-03-27 2013-10-03 Fujitsu Limited Method and system for stereo correspondence
CN103440653A (zh) * 2013-08-27 2013-12-11 北京航空航天大学 双目视觉立体匹配方法
CN110473217A (zh) * 2019-07-25 2019-11-19 沈阳工业大学 一种基于Census变换的双目立体匹配方法
CN112102382A (zh) * 2020-09-16 2020-12-18 北京邮电大学 一种基于多尺度变换与ADCensus-JWGF的机电设备视觉信息立体匹配算法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王云峰;吴炜;余小亮;王安然;: "基于自适应权重AD-Census变换的双目立体匹配", 工程科学与技术, no. 04 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113822915A (zh) * 2021-07-30 2021-12-21 济宁安泰矿山设备制造有限公司 用于智能泵腔体内窥镜故障诊断的图像立体匹配方法
CN116071415A (zh) * 2023-02-08 2023-05-05 淮阴工学院 一种基于改进Census算法的立体匹配方法
CN116071415B (zh) * 2023-02-08 2023-12-01 淮阴工学院 一种基于改进Census算法的立体匹配方法

Also Published As

Publication number Publication date
CN112991421B (zh) 2023-08-08

Similar Documents

Publication Publication Date Title
CN106780590A (zh) 一种深度图的获取方法及***
CN107578430B (zh) 一种基于自适应权值和局部熵的立体匹配方法
CN106408513B (zh) 深度图超分辨率重建方法
CN104616286B (zh) 快速的半自动多视图深度修复方法
CN102184540B (zh) 基于尺度空间的亚像素级立体匹配方法
CN109887021B (zh) 基于跨尺度的随机游走立体匹配方法
CN103106651B (zh) 一种基于三维hough变换的获取视差平面的方法
CN104318576B (zh) 一种超像素级别的图像全局匹配方法
CN112991421A (zh) 一种机器人视觉立体匹配方法
CN111105452B (zh) 基于双目视觉的高低分辨率融合立体匹配方法
CN106408596A (zh) 基于边缘的局部立体匹配方法
CN102903111B (zh) 基于图像分割的大面积低纹理区立体匹配算法
CN112435267B (zh) 一种高分辨率城市卫星立体图像的视差图计算方法
CN107945222A (zh) 一种新型的立体匹配代价计算以及视差后处理方法
CN104331890B (zh) 一种全局视差估计方法和***
CN102740096A (zh) 一种基于时空结合的动态场景立体视频匹配方法
CN112287824A (zh) 基于双目视觉的三维目标检测方法、装置及***
CN115601406A (zh) 基于融合代价计算和加权引导滤波的局部立体匹配方法
CN104980726B (zh) 一种联合运动向量的双目视频立体匹配方法
CN114187208B (zh) 基于融合代价和自适应惩罚项系数的半全局立体匹配方法
CN113034681B (zh) 空间平面关系约束的三维重建方法及装置
CN107274448B (zh) 一种基于水平树结构的可变权重代价聚合立体匹配算法
CN106097336B (zh) 基于置信传播和自相似差异测度的前后景立体匹配方法
CN112270701A (zh) 基于分组距离网络的视差预测方法、***及存储介质
CN113344989B (zh) 一种NCC和Census的最小生成树航拍图像双目立体匹配方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant