CN115690175A - 图像处理方法、装置、设备及介质 - Google Patents

图像处理方法、装置、设备及介质 Download PDF

Info

Publication number
CN115690175A
CN115690175A CN202110872598.3A CN202110872598A CN115690175A CN 115690175 A CN115690175 A CN 115690175A CN 202110872598 A CN202110872598 A CN 202110872598A CN 115690175 A CN115690175 A CN 115690175A
Authority
CN
China
Prior art keywords
image
determining
mesh
grid
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110872598.3A
Other languages
English (en)
Inventor
冷晓旭
王光伟
张永杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Zitiao Network Technology Co Ltd
Original Assignee
Beijing Zitiao Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Zitiao Network Technology Co Ltd filed Critical Beijing Zitiao Network Technology Co Ltd
Priority to CN202110872598.3A priority Critical patent/CN115690175A/zh
Publication of CN115690175A publication Critical patent/CN115690175A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本公开实施例涉及一种图像处理方法、装置、设备及介质,其中该方法包括:计算第一图像与待对齐的原始参考图像的光流;确定第一图像相对图像背景的位置变化状态;确定与位置变化状态对应的候选流场;根据光流和候选流场对齐第一图像和原始参考图像。由此,结合候选流场和光流各自的特点进行图像对齐,无论第一图像中的相关物体相对原始参考图像是相对静态变化还是动态变化,均可以保证图像对齐的效果。

Description

图像处理方法、装置、设备及介质
技术领域
本公开涉及图像处理技术领域,尤其涉及一种图像处理方法、装置、设备及介质。
背景技术
光流是一种图像对齐技术,一般而言,光流是由于场景中前景物体本身的移动、相机的运动,或者两者的共同运动所产生的。当人的眼睛观察运动物体时,物体的景象在人眼的视网膜上形成一系列连续变化的图像,这一系列连续变化的信息不断“流过”视网膜(即图像平面),好像一种光的“流”,故称之为光流。光流表达了图像的变化,由于它包含了物体运动的信息,因此在图像处理时常被用来确定目标的运动情况。
相关技术中,在进行光流计算时,是利用图像序列中像素在时间域上的变化以及待对齐的目标图像和参考图像之间的相关性,来找到两张图像之间物体的运动矢量场得到光流。在计算图像之间对齐的光流时,计算参考图像中的每个像素点移动到目标图像中对应像素点的运二维速度矢量,根据所有像素点的二维速度矢量获取光流,进而基于光流实现图像之间的对齐。
然而,上述基于光流实现图像之间的对齐时,依赖于对每个像素点移动的二维速度矢量的获取,当图像中存在纹理不明显区域或者物体不运动时,则无法获知对应像素点的二维速度矢量,从而影响光流的获取精度,进而,影响图像的对齐效果。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种图像处理方法,所述方法包括:计算第一图像与待对齐的原始参考图像的光流;确定所述第一图像相对图像背景的位置变化状态;确定与所述位置变化状态对应的候选流场;根据所述光流和所述候选流场对齐所述第一图像和所述原始参考图像。
本公开实施例还提供了一种图像处理装置,所述装置包括:计算模块,用于计算第一图像与待对齐的原始参考图像的光流;第一确定模块,用于确定所述第一图像相对图像背景的位置变化状态;第二确定模块,用于确定与所述位置变化状态对应的候选流场;图像对齐模块,用于根据所述光流和所述候选流场对齐所述第一图像和所述原始参考图像。
本公开实施例还提供了一种电子设备,所述电子设备包括:处理器;用于存储所述处理器可执行指令的存储器;所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现如本公开实施例提供的图像处理方法。
本公开实施例还提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行如本公开实施例提供的图像处理方法。
本公开实施例提供的技术方案与现有技术相比具有如下优点:本公开实施例提供的图像处理方案,计算第一图像与待对齐的原始参考图像的光流,进而,确定第一图像相对图像背景的位置变化状态,确定与位置变化状态对应的候选流场,最后,根据光流和候选流场对齐第一图像和原始参考图像。由此,结合候选流场和光流各自的特点进行图像对齐,无论第一图像中的相关物体相对原始参考图像是相对静态变化还是动态变化,均可以保证图像对齐的效果。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
图1为本公开实施例提供的一种图像处理方法的流程示意图;
图2为本公开实施例提供的一种光流在色彩模型中显示的示意图;
图3为本公开实施例提供的另一种图像处理方法的流程示意图;
图4为本公开实施例提供的另一种图像处理方法的流程示意图;
图5为本公开实施例提供的另一种图像处理方法的流程示意图;
图6(a)为本公开实施例提供的一种图像对的场景示意图;
图6(b)为本公开实施例提供的另一种图像对的场景示意图;
图7(a)为本公开实施例提供的另一种图像对的场景示意图;
图7(b)为本公开实施例提供的另一种图像对的生成场景示意图;
图8为本公开实施例所提供的一种图像对齐场景示意图;
图9为本公开实施例提供的另一种图像处理方法的流程示意图;
图10为本公开实施例提供的另一种图像处理方法的流程示意图;
图11为本公开实施例提供的另一种图像处理方法的流程示意图;
图12为本公开实施例提供的另一种图像处理方法的流程示意图;
图13为本公开实施例提供的一种网格变形场景示意图;
图14为本公开实施例提供的一种网格相似变换场景示意图;
图15为本公开实施例提供的另一种图像对齐场景示意图;
图16为本公开实施例提供的另一种图像处理方法的流程示意图;
图17为本公开实施例提供的另一种图像处理方法的流程示意图;
图18为本公开实施例提供的一种图像处理装置的结构示意图;
图19为本公开实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
为了解决上述问题,本公开实施例提供了一种图像处理方法,在该方法中,结合网格流和光流各自的特点进行图像对齐,其中,网格流是一种对齐图像的技术,指的是在待对齐的图像上划分棋盘格,然后通过移动网格顶点位置实现图像变形,最终将变形的目标图像对齐到参考图像,由于网格流通过网格顶点的移动带动网格内像素点的移动,通过网格变形实现图像对齐,像素点的位置是根据其所在网格顶点的坐标获知的,不需要识别每个像素点在图像中的具***置对齐,因此,对于纹理不丰富的区域或者是静态的物体的跟踪效果较好,弥补了光流的跟踪的缺陷,从而,无论第一图像中的相关物体相对原始参考图像是相对静态变化还是动态变化,均可以保证图像对齐的效果。
下面结合具体的实施例对该方法进行介绍。
图1为本公开实施例提供的一种图像处理方法的流程示意图,该方法可以由图像处理装置执行,其中该装置可以采用软件和/或硬件实现,一般可集成在电子设备中。如图1所示,该方法包括:
步骤101,计算第一图像与待对齐的原始参考图像的光流。
在本实施例中,图像处理目的是将第一图像和原始参考图像进行对齐,原始参考图像和第一图像可以是视频流中的相邻视频帧,也可以是同一个视频流中不相邻的视频帧等,可以为相同相机拍摄的,也可以为不同相机拍摄的等,在此不作限制。
正如以上所说的,第一图像和待对齐的原始参考图像的光流,实际上是第一图像中的像素点对齐到原始参考图像中像素点的移动速度矢量形成的运动场组成的,因此,在本公开的一个实施例中,确定第一图像中每个像素点的第一像素位置,确定每个像素点在原始参考图像的第二像素位置,进而,计算第二像素位置移动到第一像素位置的瞬时速度矢量,根据第一图像中所有像素点的瞬时速度矢量获取光流。
在实际执行过程中,计算上述瞬时速度矢量形成光流的算法,可以为DenseInverse Search-basedmethod光流法,可以为Lucas-Kanade光流法等,在此不作限制。
步骤102,确定第一图像相对图像背景的位置变化状态。
应当理解的是,光流应当是反应第一图像中的物体相对于原始参考图像的运动场,这种运动场是由于第一物体中的物体移动本身导致的,比如,如图2所示(其中,为了便于理解,图2中显示了叠加显示了像素维度的第一图像),在HSV(Hue,Saturation,Value)颜色下观看光流时,以色斑颜色深浅代表运动速率(图中以灰度值区分颜色深浅),白色代表对应的区域的物体几乎无运动,则基于光流会可以获知第一图像中人物移动的瞬时速度矢量形成的运动场。
然而,当拍摄第一图像与待对齐的原始参考图像时,相机的拍摄位置相对于图像背景的位置变化状态可能时运动状态,这种运动状态也会反应在第一图像与原始参考图像之间的光流中,而这种光流显然不是单纯的第一图像中的物体运动带来的,因此,为了避免这种情况,在本实施例中,确定第一图像相对图像背景的位置变化状态,这种位置变化状态用于指示相机在拍摄第一图像时,相对第一图像的图像背景是否有移动,当有移动时,认为第一图像相对图像背景的位置变化状态为运动状态,当没有移动时,认为第一图像相对图像背景的位置变化状态为静止状态。
步骤103,确定与位置变化状态对应的候选流场。
在本实施例中,确定与位置变化状态对应的候选流场,该候选流场用于补偿位置变化运动状态带来的光流误差,若位置变化状态为运动状态,则表明第一图像与待对齐的原始参考图像对齐计算获取的光流中,瞬时速度矢量可能受到了相机运动的影响,从而,候选光流场可以为网格流等擅长跟踪静态背景的流场,若是位置变化状态为静止状态,则表明第一图像与待对齐的原始参考图像对齐计算获取的光流中,瞬时速度矢量反映的是目标物体本身的运动,因此,候选光流场可以为零光流场(零光流场限定了本实施例中可以仅仅基于善于跟踪动态运动的光流进行图像对齐等),或者,可以为其他善于跟踪物体运动的其他任意流场。
需要说明的是,为了说明的方便,后续实施例中,以位置变化状态为运动状态,候选光流场为网格流,位置变化状态为静止状态,候选光流场为零光流场进行描述。
在一些可能的实施例中,若位置变化状态为运动状态,则表明第一图像与待对齐的原始参考图像对齐计算获取的光流中,瞬时速度矢量可能受到了相机运动的影响,从而,计算第一图像与所述原始参考图像的网格流,并确定网格流为候选流场,正如以上所说的,网格流擅长跟踪静态背景等,因此,若是第一图像中的物体本身可能没有运动,则可以基于网格流进行对齐计算等。
当然,在本公开的一个实施例中,若是位置变化状态为静止状态,则表明第一图像与待对齐的原始参考图像对齐计算获取的光流中,瞬时速度矢量反映的是第一目标物体本身的运动,因此,此时直接根据上述计算的光流进行图像对齐处理,在实际应用中,确定零光流场为候选流场。
步骤104,根据光流和候选流场对齐第一图像和原始参考图像。
在本实施例中,根据光流和候选流场对齐第一图像和原始参考图像,比如,确定光流和候选流场中对齐误差较小的目标流,基于该目标流进行图像对齐,由此,结合候选流场和光流各自的特点进行图像对齐,无论第一图像中的相关物体相对原始参考图像是相对静态变化还是动态变化,均可以保证图像对齐的效果。这里的对齐原始参考图像和第一图像可以为:根据目标流对第一图像去噪等,当然,在一些场景中,也可根据去噪后的第一图像和原始参考图像合成实现更好的合成效果,避免合成“鬼影”。
综上,本公开实施例的图像处理方法,计算第一图像与待对齐的原始参考图像的光流,进而,确定第一图像相对图像背景的位置变化状态,确定与位置变化状态对应的候选流场,最后,根据光流和候选流场对齐第一图像和原始参考图像。由此,结合候选流场和光流各自的特点进行图像对齐,无论第一图像中的相关物体相对原始参考图像是相对静态变化还是动态变化,均可以保证图像对齐的效果。
需要说明的是,在不同的应用场景中,确定第一图像相对图像背景的位置变化状态的方式不同,示例说明如下:
在本公开的一个实施例中,如图3所示,确定第一图像相对图像背景的位置变化状态,包括:
步骤301,根据光流确定第一图像中每个样本像素点的瞬时速度矢量。
其中,样本像素可以根据梯度筛选,即将第一图像中的梯度值大于一定值的像素点确定为样本像素等,也可以根据灰度值等其他参数选择,在此不作限制。
若是光流是根据光流块粒度计算的,则每个样本像素点的瞬时速度矢量,可以为其所在光流块的瞬时速度矢量。
步骤302,确定瞬时速度矢量的模小于预设速度阈值的像素点的像素数量。
其中,预设速度阈值可以根据实验数据标定,在一些可能的实施例中,预设速度阈值可以为0.25-0.5中的一个数值。
步骤303,计算像素数量和所述第一图像中样本像素点的总数量的比值。
步骤304,若比值大于预设比值阈值,则确定位置变化状态为运动状态。
步骤305,若比值小于等于预设比值阈值,则确定位置变化状态为静止状态。
其中,预设比值阈值可以根据实验数据标定,在一些可能的实施例中,该预设比值阈值可以为0.15-0.3中的一个数值。
在本实施例中,由于光流算法通常会限制第一图像与待对齐的原始参考图像是拍摄时间较近物体移动较微小的图像帧,比如是相邻图像帧,若是比值大于预设比值阈值,则表示第一图像中的像素点相对于原始参考图像的移动位移相对较小,符合光流算法的约束,同时也显然几乎没有相机位姿移动带来的位移的影响,因此,确定满足确定位置变化状态为静止状态。
若是比值不大于预设比值阈值,则表示第一图像中的像素点相对于原始参考图像的移动位移相对较大,显然不符合光流算法的约束,可以认为这种较大的移动是拍摄时相机的移动带来的,因此,认为第一图像和原始参考图像确定位置变化状态为运动状态。
在本公开的一个实施例中,如图4所示,确定第一图像相对图像背景的位置变化状态,包括:
步骤401,获取第一图像的第一相机位姿和第二图像的第二相机位姿。
步骤402,若第一相机位姿和所述第二相机位姿不一致,则确定位置变化状态为运动状态。
步骤403,若第一相机位姿和第二相机位姿一致,则确定位置变化状态为静止状态。
其中,相机位姿可以理解为相机的拍摄姿态位置,包括相机的内参和相机的外参,相机的外参包括相机的拍摄世界坐标。
容易理解的是,由于光流算法通常会限制第一图像与待对齐的原始参考图像是拍摄时间较近物体移动较微小的图像帧,当第一图像与原始参考图像的拍摄的相机位姿一致,则拍摄的第一图像与原始参考图像的光流几乎没有受到相机的移动的影响。
因此,在本实施例中,判断第一相机位姿和第二相机位姿是否一致,其中,若和第二相机位姿一致,则认为位置变化状态为静止状态,否则,若和第二相机位姿不一致,则认为位置变化状态为运动状态。
综上,本公开实施例的图像处理方法,可以灵活确定第一图像相对图像背景的位置变化状态,为选择合适的流场进行图像对齐提供了参考。
在相关技术中,基于网格流技术进行特征点的匹配,即确定待对齐图像和参考图像之间匹配的特征点后,基于特征点的位移计算网格顶点的位移,进而,通过该位移移动带对齐图像的网格顶点位置实现图像对齐。
然而,上述基于特征点进行图像对齐的方式,需要检测和匹配特征点,导致处理时间较长从而影响图像对齐效率,并且,局部纹理弱的图像区域的特征点难以加测,会导致网格顶点位移计算误差较大,进而,影响图像对齐质量。
因此,在本公开的实施例中,为处理待对齐的图像和参考图像之间的大位移情况,构造多层金字塔结构的多个网格分辨率,并根据多个网格分辨率为每层图像设置不同数量的网格划分,由粗到细传递将其他网格分辨率对应的优化结果传递到最大网格分辨率对应的图像后,最终确定的网格流。保证了网格流确定的效率和鲁棒性,从而,提升了图像对齐的效果。
下面结合具体的实施例对计算第一图像与原始参考图像的网格流的过程进行说明。
如图5所示,计算第一图像与原始参考图像的网格流,包括:
步骤501,根据第一图像和原始参考图像获取具有不同网格分辨率的多组图像对。
其中,每组图像对中包括第二图像和关联参考图像,其中,第二图像是对第一图像在对应网格分辨率下网格划分后获取的,关联参考图像是根据第二图像的图像尺寸缩放原始参考图像获取的。
在本公开的一个实施例中,可根据预设的单元网格尺寸和多个网格分辨率,对第一图像进行网格划分生成对应的具有不同网格分辨率的多个第二图像。
在本实施例中,预设的单元网格尺寸通常相对于第一图像尺寸较小,相当于网格划分为后的棋盘格图像中的一个棋盘格的尺寸,该预设的单元网格尺寸可以根据实验数据标定。
为了处理原始参考图像和第一图像之间大位移等像素位移较大的情况,可以预先设置多个网格分辨率,对第一图像进行网格划分生成对应的具有不同网格分辨率的多个第二图像。
其中,如图6(a)所示,多个网格分辨率可以组成按照金字塔结构,即多个网格分辨率按照大小排列对应的第二图像后,相邻第二图像的网格分辨率的比值相同。在一些可能的实施例中,如图6(b)所示,多个网格分辨率按照由小到大的顺序排列对应的第二图像后,相邻的网格分辨率的第二图像之间的比值也可以不同。
在本实施例中,首先对第一图像进行网格划分,生成对应的具有不同网格分辨率的多个第二图像,每个第二图像包含的单元网格数量和对应的网格分辨率一致,比如,如图7(a)所示,当多个网格分辨率对应于3个网格分辨率,分别为“1*1”、“2*2”和“4*4”时,则对应的第二图像分别包含1个单元网格、4个单元网格和16个单元网格的棋盘结构。
进而,根据与每个网格分辨率对应的第二图像的图像尺寸对原始参考图像进行缩放处理,以生成尺寸匹配的关联参考图像。
在本实施例中,为了实现多种粗细粒度下的图像对齐,兼顾多种位移程度进行后续的对齐处理,根据与每个网格分辨率对应的第二图像的图像尺寸对原始参考图像进行缩放处理,以生成尺寸匹配的关联参考图像,也可以理解,每个网格分辨率对应的第二图像都具有相同尺寸的关联参考图像,其中,关联参考图像仅仅和对应的第二图像的尺寸一致,关联参考图像可不进行网格划分处理。
继续以图7(a)所示的场景为例,如图7(b)所示,3个第二图像对应了3个相同尺寸的3个关联参考图像。由此,针对每一个网格分辨率对应的第二图像都设置了待与其匹配的同样尺寸的关联参考图像,相同网格分辨率下的第二图像和关联参考图像为一组图像对,由此,提高了对齐图像的计算效率。
步骤502,根据网格分辨率由小到大的顺序,在当前图像对为最小网格分辨率时,根据对应的第二图像和关联参考图像更新对应的第二图像的网格顶点位置。
在本实施例中,应当理解的是,第二图像和关联参考图像的对齐,可以通过网格顶点的位移实现第二图像中的网格变形,网格变形带动第二图像中的像素点的位移,从而网格变形后的第二图像和关联参考图像实现了对应网格分辨率下的对齐。
以网格分辨率为1*1的第二图像为例,第二图像中包含一个网格A1,其对应的关联参考图像为B,则对于A1而言,其对应的四个网格顶点的坐标向量分别为
Figure BDA0003189668780000121
Figure BDA0003189668780000122
网格A1内的每个像素都可以通过其所在网格的顶点的坐标向量表示,以像素点q为例,该像素点位置的坐标向量可以表示为如下公式(1),其中,下述公式中的Ck为每个网格顶点的权重,权重可以预先设置:
Figure BDA0003189668780000123
进而,在将第二图像与对应的关联参考图像的对齐时,确定的网格顶点的坐标向量分别为:
Figure BDA0003189668780000124
Figure BDA0003189668780000125
以该网格顶点控制网格A1变形为A2后,继续以上述像素点q在A2中的像素点q'为例,该像素点q'位置的坐标向量可以表示为如下公式(2):
Figure BDA0003189668780000126
从而,可以获知,在本实施例中,通过对齐第二图像和对应的关联参考图像,更新第二图像的网格顶点的网格顶点位置,更新后的网格顶点位置是变形后的网格顶点,因此,根据该网格顶点的变形显然可以控制第二图像中的网格变形,变形后的网格带动网格内部像素点的移动,实际上实现了对网格内的像素点的移动对齐,从而,在本实施例中,无需检测和计算待对齐的第二图像和关联参考图像之间的特征点的位移,大大提高了对齐效率。
在本实施例中,由于是按照分辨率由小到大的顺序,按照由粗到细的位移粒度进行计算,因此,计算的目的是获取到最大网格分辨率的第二图像的网格变形的结果,从而,在本实施例中,若是当前图像对为最小网格分辨率时,则也可以仅仅根据对应的第二图像和关联参考图像更新对应的第二图像的网格顶点位置,而无需去控制第二图像真正变形等。
其中,该更新后的网格顶点位置,可以理解为在对应的网格分辨率下的位移粒度中,第二图像对齐对应的关联参考图像的网络顶点的移动后的位置,该网格顶点位置可以理解为网格顶点的坐标矢量等。
步骤503,在当前图像对不为最小网格分辨率时,根据上个图像对的网格顶点位置更新当前图像对的第二图像对应网格顶点位置,并根据对应的第二图像和关联参考图像更新对应的第二图像的网格顶点位置。
在本实施例中,按照网格分辨率由小到大的顺序,根据上个图像对的网格顶点位置更新当前图像对的第二图像对应网格顶点位置,即依次传递每一个网格分辨率下对齐后的网格顶点位置,该网格顶点位置对应于网格分辨率下网格形状的变形,因此,在本实施例中,按照网格分辨率由小到大的顺序,因此传递变形网格形状到最后一个第二图像。
在本实施例中,若当前图像对不为最小网格分辨率,则根据上个图像对的网格顶点位置更新当前图像对的第二图像对应网格顶点位置,其中,上个图像对的网格顶点位置是已经对齐的较粗粒度下的网格顶点形变后的位置,因此,结合上组图像对的网格顶点位置,实现了将之前已经对齐的较粗粒度下的网格形状的变形传递到当前网格分辨率的第二图像上,进一步提到了图像对齐效率。
在实际执行过程中,为了便于传递上组图像对的网格顶点位置,还需要确定当前图像对中网格顶点对应的上组图像对中的网格顶点位置。
在本实施例中,确定当前图像对的第二图像对应网格顶点位置,可以计算当前图像对和上个图像对的网格分辨率比值,根据该分辨率比值用于指示每个网格顶点在相邻图像对中的坐标比值,进而,确定当前图像对的第二图像中每个网格顶点在上个图像对中的对应网格顶点后,由于分辨率比值用于指示每个网格顶点在相邻图像对中的坐标比值,因此,根据对应网格顶点更新后的网格顶点位置和网格分辨率比值的乘积值,更新当前图像对的第二图像中每个网格顶点的网格顶点位置。
然而,在实际应用中,对应网格顶点更新后的每个网格顶点位置的确定,可能还需要获知其他属于同一个单元网格三个网格顶点的加权获取,其中,为了网格变形的稳定性,网格顶点的加权值和没有更新网格顶点位置后的加权值相同,因此,在本公开的一个实施例中,还可以根据网格分辨率比值,确定更新网格顶点位置之前当前图像对上一个图像对中第二图像的网格顶点的原始网格顶点位置,基于该顶点位置计算上述网格顶点之间的加权值,以便于后续确定更新后的每个网格顶点位置。
为了便于理解,下面以当前图像对和上个图像对的网格分辨率在横纵坐标的比值均为2示例说明根据上个图像对的网格顶点位置更新当前图像对的第二图像对应网格顶点位置的过程。
在本实施例中,当多组图像对的多个网格分辨率对应于L(本实施例中L为3)个网格分辨率,分别为“1*1”、“2*2”和“4*4”,其中,多组图像对之间的第二图像和关联参考图像,按照网格分辨率由小到大的顺序排列后,均可以构造L层的图像的金字塔结构。
若当前图像对对应于金字塔结构的L层,L大于1,则传播L-1层的网格形状到当前层。令MeshL表示L层的第二图像对应的网格,
Figure BDA0003189668780000141
表示第L-1层的第二图像对应的原始网格,
Figure BDA0003189668780000142
表示第L-1层的第二图像对应的变形网格(该变形网格可以指的是根据第L-1层的第二图像和关联参考图像更新网格顶点位置后的网格)。
遍历MeshL中的每个网格顶点VL,由于相邻网格分辨率中,在下的网格分辨率是在上的网格分辨率的2倍,因此,根据公式(3)得到网格顶点VL
Figure BDA0003189668780000143
中对应的网格顶点的坐标位置VL-1
VL-1=0.5VL 公式(3)
进而,可以基于双线性插值算法等,获取VL-1
Figure BDA0003189668780000144
中的插值信息,以获取VL-1对应单元格子的四个网格顶点
Figure BDA0003189668780000145
和每个网格顶点的权重wk(k=1,2,3,4),VL-1可表示为四个顶点的加权线性组合,见公式(4);
Figure BDA0003189668780000146
进一步的,在获取每个网格顶点的权重后,根据公式(5)计算得到
Figure BDA0003189668780000151
对应的网格顶点
Figure BDA0003189668780000152
其中,
Figure BDA0003189668780000153
Figure BDA0003189668780000154
Figure BDA0003189668780000155
中对应的网格顶点:
Figure BDA0003189668780000156
更进一步的,根据公式(6)确定当前图像对的第二图像对应原始网格顶点位置VL,根据上个图像对的网格顶点位置更新更新后的网格顶点位置
Figure BDA0003189668780000157
Figure BDA0003189668780000158
如此循环,实现了变形网格形状由粗到细的传递。
举例而言,如图8所示,当多个网格分辨率对应于L(本实施例中L为3)个网格分辨率,分别为“1*1”、“2*2”和“4*4”,按照由小到大的顺序可以构造L个网格分辨率对应的第二图像的金字塔结构的图层,则首先根据第一层第二图像和关联参考图像确定第一层的第二图像的网格顶点位置,进而,根据该二图像的网格顶点位置更新第二层的第二图像的初始的网格顶点的位置,对更新后的第二图像和第二层的关联参考图像确定第二层图像的网格顶点位置,此时,网格顶点位置是第一层网格顶点对齐和第二层网格顶点对齐综合作用的结果。
同样的,根据第二层的第二图像的网格顶点位置更新第三层的第二图像的初始的网格顶点的位置,对更新后的第二图像和第三层的关联参考图像确定第三层的第二图像的网格顶点位置,此时第三层中第二图像的网格顶点位置,是第二层网格顶点对齐和第三层的网格顶点对齐综合作用的结果。由此,实现了第一层到第二层到第三层的网格变形形状的传递。
步骤504,在当前图像对为最大网格分辨率时,根据当前图像对对应的第二图像的网格顶点位置获取目标网格变形图像,并根据目标网格变形图像和第一图像计算网格流,以便于根据网格流对齐原始参考图像和第一图像。
正如以上所说的,在本实施例中,不同的网格分辨率下确定的网格顶点位置,对位移程度的敏感程度不同,因此,为了综合多种粒度的位移进行图像对齐,在本实施例中,根据每个网格分辨率对应的网格顶点的对齐位移信息调整最大网格分辨率对应的第二图像获取目标网格变形图像,即所有位移程度下网格顶点的位移,在本实施例中,最终反应在最大网格分辨率下的网格形状中。即根据当前图像对对应的第二图像的网格顶点位置,可以获知网格内每个像素点的位移,进而,获取目标网格变形图像。
在本实施例中,由于网格流擅长跟踪静态背景,因此,网格流主要反映了原始参考图像与第一图像之间的背景的像素点的运动场,在本实施例中,可以根据目标网格变形图像和第一图像计算网格流,即第一图像变形到目标网格变形图像对应的运动场即为网格流,进而,根据网格流对齐原始参考图像和第一图像,这里的对齐原始参考图像和第一图像可以为:根据网格流控制第一图像变形,或者,根据网格流对第一图像去噪等,当然,在一些场景中,也可根据去噪后的第一图像和原始参考图像合成实现更好的合成效果,避免合成“鬼影”。
需要说明的是,在不同的应用场景中,根据目标网格变形图像和第一图像计算网格流的方式不同:
在一些可能的实施例中,预先根据深度学习技术学习得到深度学习模型,根据该深度学习模型对输入的目标网格变形图像和第一图像,输出得到对应的网格流。
在一些可能的实施例中,如图9所示,根据目标网格变形图像和第一图像计算网格流,包括:
步骤901,根据目标网格变形图像中的网格顶点位置,获取目标网格变形图像中每个像素点的第三像素位置。
正如以上所说的,每个像素点的像素位置都可以根据其所在网格的顶点坐标表示,因此,根据目标网格变形图像中的网格顶点位置的确定,即可获取目标网格变形图像中每个像素点的第三像素位置。
步骤902,根据最大网格分辨率对应的第二图像的初始网格顶点位置,获取每个像素点的第四像素位置。
这里原始的第二图像可以理解为在最初进行网格划分时,对应网格分辨率对应的第二图像。
在本实施例中,根据最大网格分辨率对应的第二图像的初始网格顶点位置,获取原始的第二图像中每个像素点的第四像素位置,即同样的,可以根据原始的第二图像中像素点所在网格顶点的顶点坐标,确定每个像素点的第四像素位置。
步骤903,计算每个像素点的第四像素位置和对应的第三像素位置的位移获取网格流。
实际上网格流可以看作是图像对齐过程中,像素点的位移运动场,因此,在本实施例中,计算每个像素点的第四像素位置和对应的第三像素位置的位移差值获取网格流。
综上,本公开实施例的图像处理方法,获取具有不同网格分辨率的多组图像对,根据网格分辨率由小到大的顺序,依次根据多组图像对中每组图像对对应的第二图像和关联参考图像计算对应的第二图像的网格顶点位置,并依次传递上一个网格分辨率的网格顶点位置到下一层,直至获取最大网格分辨率对应的图像对的目标网格变形图像,并根据目标网格变形图像和第一图像计算网格流,以便于根据网格流对齐原始参考图像和第一图像。由此,按照网格分辨率由小到大的顺序,由粗到细传递前一对图像对的网格顶点位置来控制时网格形状变形,并根据变形的网格确定网格流,提高了网格流的获取效率和鲁棒性,便于提升图像对齐效果。
在实际应用中,每组图像对中的第二图像和关联参考图像都要进行网格顶点位置的计算,从而,实现了在对应位移粒度下的图像对齐。在不同的应用场景中,根据对应的第二图像和关联参考图像确定对应的第二图像的网格顶点位置的方式不同,示例如下:
在本公开的一个实施例中,预先根据大量样本数据训练得到深度学习模型,该深度学习模型的输入为待对齐两张图像,输出为对齐的目标图像的网格顶点位置,因此,在本实施例中,将对应的第二图像和关联参考图像输入上述预先训练好的深度学习模型,进而,得到对应的第二图像的网格顶点位置。
在本公开的另一个实施例中,为了进一步提高图像对齐效果,对每组图像对迭代计算第二图像的网格顶点位置。
如图10所示,根据对应的第二图像和关联参考图像确定对应的第二图像的网格顶点位置,包括:
步骤1001,根据对应的第二图像的网格顶点位置,迭代计算对应的第二图像和关联参考图像的残差值。
这里的残差值可以理解为第二图像和关联参考图像的顶点对齐误差,根据该对齐误差来更新对应的第二图像的网格顶点位置,实现第二图像和关联参考图像的逐步对齐。
在不同的应用场景中,该残差值包括的内容不同,在一些可能的实施例中,该残差值包括光度误差值,即包括第二图像和关联参考图像像素点的亮度误差,从而,基于亮度维度上确定第二图像和关联参考图像的顶点对齐误差;
在另一些可能的实施例中,该残差值包括变形误差值,变形误差确保网格内的方格变形时尽可能符合相似变换,从而,基于形状维度确定第二图像和关联参考图像的顶点对齐误差。
在又一些可能的实施例中,可以结合上述光度误差值和变形误差值共同确定第二图像和关联参考图像的顶点对齐误差。
步骤1002,在每次迭代计算时,判断当前迭代计算的残差值是否满足预设的迭代停止条件。
在本实施例中,为了避免迭代次数太多导致图像对齐效率较慢,设置迭代停止条件,一旦满足迭代停止条件,则停止当前图像对的迭代计算,进入下一组图像对的对齐计算。
在不同的应用场景中,该预设的迭代停止条件不同:
在本公开的一个实施例中,针对每组图像对设置与其网格分辨率匹配的预设迭代次数,当迭代次数大于等于该预设迭代次数时,停止迭代。比如,当网格分辨率为1*1,则设置的预设迭代次数可以为5-10次中的值,当网格分辨率为2*2时,则设置的预设迭代次数可以为3-5次中的值,当网格分辨率为4*24,则设置的预设迭代次数可以为5-10次中的值。
在本公开的另一个实施例中,根据迭代性能确定是否满足迭代停止条件,即在本实施例中,判断迭代计算的残差值是否大于等于上次迭代计算的残差值,如大于等于上次迭代计算的残差值,则意味着迭代性能变差,从而,确定满足迭代停止条件,停止迭代计算。
在本公开的还一个实施例中,为了兼顾迭代效率和迭代性能,结合上述两种实施例中确定迭代停止条件。
在本实施例中,如图11所示,判断当前迭代计算的残差值是否满足预设的迭代停止条件,包括:
步骤1101,判断当前迭代计算的次数是否大于等于当前图像对的预设迭代次数,预设迭代次数大于1。
步骤1102,若大于等于预设迭代次数,则确定当前迭代计算的残差值满足预设的迭代停止条件。
在本实施例中,假设当前迭代计算的次数为iterl,预设迭代次数为
Figure BDA0003189668780000191
若是iterl大于等于
Figure BDA0003189668780000192
则认为满足预设的迭代停止条件。
步骤1103,若不大于等于预设迭代次数,则获取当前图像对对应的上一次迭代计算的历史残差值;
步骤1104,判断当前迭代计算的残差值是否大于等于历史残差值。
步骤1105,若大于等于历史残差值,则确定当前迭代计算的残差值满足预设的迭代停止条件。
在本实施例中,若不大于等于预设迭代次数,则获取当前图像对对应的上一次迭代计算的历史残差值,若是当前迭代计算的残差值是否大于等于历史残差值,则确定当前迭代计算的性能下降,从而,确定当前迭代计算的残差值满足预设的迭代停止条件。
举例而言,当历史残差值为riter-1,当前图像对的残差值为riter,则当riter大于等于riter-1时,确定当前迭代计算的残差值满足预设的迭代停止条件。
步骤1003,若不满足迭代停止条件,则根据残差值更新对应的第二图像的网格顶点位置,并继续迭代计算直至当前迭代计算的残差值满足预设的迭代停止条件。
在本实施例中,由于残差值是对齐误差,因此,根据残差值更新对应的第二图像的网格顶点位置,并继续迭代计算直至当前迭代计算的残差值满足预设的迭代停止条件。
当然,在本实施例中,也可以不迭代计算,仅仅计算一次对应的第二图像和关联参考图像的残差值,此时在第二图像原始图像的基础上,根据该残差值更新第二图像的网格顶点位置。
为了使得本领域的技术人员,更加清楚的理解,如何根据对应的第二图像的网格顶点位置,迭代计算对应的第二图像和关联参考图像的残差值,下面以残差值包括上述光度误差值和变形误差值进行说明。
在本公开的一个实施例中,如图12所示,根据对应的第二图像的网格顶点位置,迭代计算对应的第二图像和关联参考图像的残差值,包括:
步骤1201,根据对应的第二图像的网格顶点位置,计算对应的第二图像和关联参考图像的光度误差值。
在本实施例中,可以根据第二图像中所有像素点和其在关联参考图像中的对应像素点的亮度差,确定光度误差值,但是当像素点数量较多时,可能会导致计算量较大,影响图像对齐效率。
因此,在本公开的一个实施例中,确定第二图像中的多个样本像素,通过降低计算光度误差值的像素点的数量来提高图像对齐效率。
在本实施例中,首先确定对应的第二图像的多个样本像素,进而,确定每个样本像素所在网格,根据所在网格的网格顶点位置确定每个样本像素的像素位置(参照上述示例提到的,像素点的位置可以根据其所在单元格的网格顶点位置加权得到)。
其中,上述样本像素可以是随机确定的,也可以是根据亮度值筛选的,在本实施例中,为了在进一步降低计算光度误差值的像素点的数量的基础上,不影响图像对齐效果,引入均匀随机采样技术,进一步降低构造光度误差值的样本像素的数量。
在本实施例中,按照预设步长逐个遍历当前网格分辨率下的第二图像中每个像素的像素梯度值,确定像素梯度值大于等于预设梯度阈值的像素为候选样本像素,即若是将当前网格分辨率下的第二图像梯度划分为水平方向的梯度
Figure BDA0003189668780000211
和竖直方向上的梯度
Figure BDA0003189668780000212
后,若是像素点q在水平方向的梯度值abs(qx)和数值方向的梯度值abs(qy)之和,大于等于预设梯度阈值tg,则将对应的像素点确定为候选样本像素。其中,在一些可能的实施例中,预设梯度阈值可以在0.05-2之间。
在本公开的一个实施例中,为了进一步提高样本采集效率,每确定一个候选样本数量后,还可以确定候选样本像素的总数量,当大于等于该总数量后,停止确定候选样本像素,并将所有的候选样本像素作为样本像素。
或者,在另一些可能的实施例中,若所述候选样本像素的总数量大于预设数量阈值(比如,该总数量可以为800~1000之间),随机确定所述预设数量阈值所述候选样本像素为所述样本像素。比如,对所有的所述候选样本像素随机排列后,确定随机排列结果中属于前预设数量阈值的候选样本像素为多个样本像素。由此,该随机采样策略可显著降低样本像素规模,同时确保样本在图像上的均匀分布,在保证跟踪效果的同时,提升计算效率。
进而,在确定样本像素后,根据确定每个样本像素所在网格,根据所在网格的网格顶点位置确定每个样本像素的像素位置,根据预设的光度误差计算算法和像素位置确定光度误差值。
需要说明的是,本实施例中的预设的光度误差计算算法可以为现有技术中任意一种计算光度误差的方式,在此不作限制。
举例而言,预设的光度误差计算算法为公式(7),其中,公式(7)中,fq为光度误差值,Itar(q)和Itar(q)分别为样本像素q在第二图像和关联参考图像中的亮度值,
Figure BDA0003189668780000221
为样本像素q在第二图像上的梯度,q所在单元格的四个网格顶点为
Figure BDA0003189668780000222
(k=1,2,3,4),Ck为每个网格顶点的权重,权重可以预先设置,
Figure BDA0003189668780000223
在本实施例中,如图13所示,在网格顶点位置更新前和更新后的网格变形过程(其中实线四边形表示更新之前的单元网格,虚线四边形表示更新之后的单元网格),网格变形通过顶点位移实现,变形前后q的插值系数Ck保持不变,网格变形带着q的位置到更合适的位置q',从而导致光度误差降低。
步骤1202,根据对应的第二图像的网格顶点位置,计算对应的第二图像的正则表达值。
其中,正则表达值可以看作为确保网格内的方格变形时尽可能符合相似变换的变形误差值,基于正则表达值可以使得对齐的第二图像前景区域内填充的图像在视觉效果上看起来更自然,更符合透视变换。
在本实施例中,若对应的第二图像的网格顶点位置被更新过,即当前迭代计算不是第一次迭代计算,则将对应的第二图像中每个网格划分为两个三角形,以获取多个三角形,根据对应的第二图像的网格顶点位置,确定每个三角形的第一三角形顶点位置,根据对应的第二图像的网格顶点位置,确定每个三角形的第一三角形顶点位置,进而,根据第一三角形顶点位置和第二三角形顶点位置确定每个三角形的变形误差值,根据所有三角形的变形误差值确定对应的第二图像的正则表达值。
在本实施例中,可以根据如下公式(8)和(9)分别计算每个单元格两个三角形的变形误差值,其中,参照图14,在公式(8)和(9)中,fd为变形误差值,tri1和tri2分别为每个网格包括的2个三角形,{Vk,k=1,2,3}和{V'k,k=1,2,3}分别表示变形前后的三角形顶点,{lk1k2,k1k2=12,213,23}和{l'k1k2,k1k2=12,213,23}分别表示变形前后的三角形边长:
Figure BDA0003189668780000231
Figure BDA0003189668780000232
步骤1203,根据光度误差值和正则表达值确定残差值。
在本实施例中,根据光度误差值和正则表达值构建对应第二图像和关联参考图像的总体代价函数,残渣值为该总体代价函数的值。
在本公开的一个实施例中,参照公式(10),其中,公式(10)中,λ1和λ2可预先设置,根据公式(10)中计算的残差值f优化网格顶点位置,比如,每次优化一个像素的网格顶点位置,进而,根据更新后的网格顶点位置计算该残差值,直到该残差值满足预设迭代停止条件。
Figure BDA0003189668780000233
在上述计算过程中,经过实验,可以在第一次迭代计算时,将网格顶点的初始值设置为0向量,而不是原始网格顶点位置,可以提高对齐效率。
从而,参照图15,在每组图像对计算时,都采用迭代计算残差值的方式优化网格顶点位置,并向下一组图像对传递迭代计算好的网格顶点位置,下一组图像对在迭代计算好的网格顶点位置上,进一步进行迭代计算,从而,提升了图像对齐效果。
综上,本公开实施例的图像处理方法,可以灵活采用不同的方式根据对应的第二图像和关联参考图像确定对应的第二图像的网格顶点位置,提高了网格顶点位置确定的准确性,从而,提升了图像对齐效果。
基于上述实施例,为了进一步提升图像对齐效率,还可以针对分辨率较高的第一图像和原始参考图像降采样后,再进行上述图像对齐。
在本公开的一个实施例中,如图16所示,在对所述第一图像进行网格划分生成对应的具有不同网格分辨率的多个第二图像之前,还包括:
步骤1601,判断第一图像的分辨率是否大于预设分辨率阈值。
其中,预设分辨率阈值是根据实验数据标定的,这里的下采样并非是必要的处理步骤,当第一图像的分辨率小于该预设分辨率阈值,则认为原始的第一图像的分辨率已经很低了,误差进行下采样。
步骤1602,若大于预设分辨率阈值,则根据预设的下采样比值对第一图像下采样获取下采样后的第一图像。
在本实施例中,若大于预设分辨率阈值,则根据预设的下采样比值对第一图像下采样获取下采样后的第一图像。
举例而言,当第一图像的原始分辨率为Wori×Hori,下采样比值为(αxy),利用双线性插值降采样第一图像,下采样后的第一图像的分辨率为W×H,其中,αx=Wori/W,αy=Hori/H。
步骤1603,根据下采样比值对原始参考图像下采样获取下采样后的原始参考图像。
在本实施例中,同样的为了便于处理,根据下采样比值对原始参考图像下采样获取下采样后的原始参考图像。进而,根据下采样后的第一图像和原始参考图像进行图像对齐处理,提高了网格流的计算效率。
从而,在本实施例中,若是下采样比值不为1,则还需要对获取的网格流进行上采样,即确定与所述预设的下采样比值对应的上采样比值,比如,网格流每个点的适量值为flowp=(u,v)T,则可以将u和v分别和上述αx和αy相乘以实现对网格流的上采样。
综上,本公开实施例的图像处理方法,对于分辨率较高的第一图像,不是在原始分辨率图像中构造网格,而是在降采样的第一图像中构造网格,进一步提高了基于网格流的图像对齐效率。
基于上述实施例,为了保证对齐效果,在网格流和光流中选择对齐效果较好的目标流。
在本公开的一个实施例中,如图17所示,根据光流和网格流对齐第一图像和原始参考图像,包括:
步骤1701,根据光流确定第一图像对齐原始参考图像的第三图像。
在一些可能的实施例中,可以根据光流基于双线性插值计算第一图像对齐原始参考图像的第三图像,其中,第三图像是第一图像在光流维度与原始参考图像对齐的结果。
步骤1702,根据候选流场确定第一图像对齐原始参考图像的第四图像。
在一些可能的实施例中,可以根据候选光流场基于双线性插值计算第一图像对齐原始参考图像的第四图像,其中,第四图像是第一图像在网格流维度与原始参考图像对齐的结果。
步骤1703,计算第三图像和原始参考图像的第一光度误差图像,并计算第四图像和原始参考图像的第二光度误差图像。
在本实施例中,可以计算第三图像和原始参考图像的第一光度误差图像,即计算第三图像中每个样本像素点在第三图像中和在原始参考图像中的光度误差值,基于光度误差值的绝对值确定第一光度误差图像,其中,光度误差值的计算可以为现有技术中任意一种光度误差计算算法,在此不作限制。同样的,可以计算第四图像和原始参考图像的第二光度误差图像。
在一些可能的实施例中,根据如下公式(11)和公式(12)确定第一光度误差图像和第二光度误差图像,其中,在公式(11)和公式(12)中,
Figure BDA0003189668780000251
为第一光度误差图像,
Figure BDA0003189668780000252
为第二光度误差图像,Iref为原始参考图像,
Figure BDA0003189668780000253
为第三图像,
Figure BDA0003189668780000254
为第四图像,abs为取光度误差绝对值的意思,
Figure BDA0003189668780000255
表示计算第三图像和原始参考图像的第一光度误差图像,
Figure BDA0003189668780000256
表示计算第四图像和原始参考图像的第二光度误差图像:
Figure BDA0003189668780000261
Figure BDA0003189668780000262
步骤1704,根据第一光度误差图像和第二光度误差图像,在光流和候选流场中确定目标流,以便于根据目标流对齐第一图像和原始参考图像。
在本实施例中,第一光度误差图像反映了第三图像对齐原始参考图像的对齐效果,第二光度误差图像反映了第四图像对齐原始参考图像的对齐效果,由于第三图像是根据光流对齐的,第四图像是根据候选流场对齐的,因此,可以基于第一光度误差图像和第二光度误差图像在光流和候选流场中确定目标流,以便于根据目标流对齐第一图像和原始参考图像。
在本公开的一个实施例中,为了进一步提高确定目标流的可靠性,可以根据Superpixels Extracted via Energy-Driven Sampling等超像素分割算法,对原始参考图像超像素分割获取多个超像素块,根据第一光度误差图像确定多个超像素块的第一光度误差均值,同样的,根据第二光度误差图像确定多个超像素块的第二光度误差均值,判断第一光度误差均值
Figure BDA0003189668780000263
是否大于第二光度误差均值
Figure BDA0003189668780000264
若大于第二光度误差均值,则确定候选流场为目标流,反之,若不大于第二光度误差均值,则确定光流为目标流。
在实际判断过程中,基于光流算法计算的第一图像的光流可能会有引导偏向性,比如,上述提到的DIS算法,偏向于得到光度误差更低的结果,可能会影响判断第一光度误差均值是否大于第二光度误差均值的公平性,因此,为了平衡这种引导偏向性,在本公开的一个实施例中,确定与光流对应的预设松弛参数值σ,σ与光流的计算算法有关,当光流计算算法为DIS时,σ可以为0.5-1.0之间的数,进而,对预设松弛参数值和第一光度误差均值求和,根据求和结果更新第一光度误差均值,即确定
Figure BDA0003189668780000265
为比较时使用的第一光度误差均值,若是
Figure BDA0003189668780000266
则确定光流为目标流,若是
Figure BDA0003189668780000267
则确定候选流场为目标流等。
在本公开的另一个实施例中,也可以基于梯度值维度计算第一图像基于光流对齐原始参考图像的对齐误差,以及第一图像基于候选流场维度对齐原始参考图像的对齐误差,确定对齐误差较小的目标流。
综上,本公开的图像处理方法,根据光流和候选流场分别确定第一图像对齐原始参考图像的对齐效果,选择对齐效果较好的目标流对齐第一图像和原始参考图像,无论第一图像中的相关物体相对原始参考图像是相对静态变化还是动态变化,均可以保证图像对齐的效果。
图18是根据本公开一种实施例的图像处理装置的结构示意图,该装置可由软件和/或硬件实现,一般可集成在电子设备中。如图18所示,该装置包括:计算模块1810、第一确定模块1820、第二确定模块1830和图像对齐模块1840,其中,
计算模块1810,用于计算第一图像与待对齐的原始参考图像的光流;
第一确定模块1820,用于确定第一图像相对图像背景的位置变化状态;
第二确定模块1830,用于确定与位置变化状态对应的候选流场;
图像对齐模块1840,用于根据光流和候选流场对齐第一图像和原始参考图像。
本公开实施例所提供的图像处理装置可执行本公开任意实施例所提供的图像处理方法,具备执行方法相应的功能模块和有益效果。
为了实现上述实施例,本公开还提出一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现上述实施例中的图像处理方法。
图19为本公开实施例提供的一种电子设备的结构示意图。
下面具体参考图19,其示出了适于用来实现本公开实施例中的电子设备1900的结构示意图。本公开实施例中的电子设备1900可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图19示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图19所示,电子设备1900可以包括处理装置(例如中央处理器、图形处理器等)1901,其可以根据存储在只读存储器(ROM)1902中的程序或者从存储装置1908加载到随机访问存储器(RAM)1903中的程序而执行各种适当的动作和处理。在RAM 1903中,还存储有电子设备1900操作所需的各种程序和数据。处理装置1901、ROM 1902以及RAM 1903通过总线1904彼此相连。输入/输出(I/O)接口1905也连接至总线1904。
通常,以下装置可以连接至I/O接口1905:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置1906;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置1907;包括例如磁带、硬盘等的存储装置1908;以及通信装置1909。通信装置1909可以允许电子设备1900与其他设备进行无线或有线通信以交换数据。虽然图19示出了具有各种装置的电子设备1900,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置1909从网络上被下载和安装,或者从存储装置1908被安装,或者从ROM 1902被安装。在该计算机程序被处理装置1901执行时,执行本公开实施例的图像处理方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:计算第一图像与待对齐的原始参考图像的光流,进而,确定第一图像相对图像背景的位置变化状态,确定与位置变化状态对应的候选流场,最后,根据光流和候选流场对齐第一图像和原始参考图像。由此,结合候选流场和光流各自的特点进行图像对齐,无论第一图像中的相关物体相对原始参考图像是相对静态变化还是动态变化,均可以保证图像对齐的效果。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上***(SOC)、复杂可编程逻辑设备(CPLD)等等。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
根据本公开的一个或多个实施例,本公开提供了一种图像处理方法,包括以下步骤:
计算第一图像与待对齐的原始参考图像的光流;
确定所述第一图像相对图像背景的位置变化状态;
确定与所述位置变化状态对应的候选流场;
根据所述光流和所述候选流场对齐所述第一图像和所述原始参考图像。
根据本公开的一个或多个实施例,本公开提供的图像处理方法中,所述计算第一图像与待对齐的原始参考图像的光流,包括:
确定所述第一图像中每个像素点的第一像素位置,确定所述每个像素点在所述原始参考图像的第二像素位置;
计算所述第二像素位置移动到所述第一像素位置的瞬时速度矢量;
根据所述第一图像中所有像素点的瞬时速度矢量获取所述光流。
根据本公开的一个或多个实施例,本公开提供的图像处理方法中,所述确定所述第一图像相对图像背景的位置变化状态,,包括:
根据所述光流确定所述第一图像中每个样本像素点的瞬时速度矢量;
确定所述瞬时速度矢量的模小于预设速度阈值的像素点的像素数量;
若所述比值大于预设比值阈值,则确定所述位置变化状态为运动状态;
若所述比值小于等于所述预设比值阈值,则确定所述位置变化状态为静止状态。
根据本公开的一个或多个实施例,本公开提供的图像处理方法中,所述确定所述第一图像相对图像背景的位置变化状态,,包括:
获取所述第一图像的第一相机位姿和所述第二图像的第二相机位姿;
若所述第一相机位姿和所述第二相机位姿不一致,则确定所述位置变化状态为运动状态;
若所述第一相机位姿和所述第二相机位姿一致,则确定所述位置变化状态为静止状态。
根据本公开的一个或多个实施例,本公开提供的图像处理方法中,所述确定与所述位置变化状态对应的候选流场,包括:
若所述位置变化状态为运动状态,则计算所述第一图像与所述原始参考图像的网格流,并确定所述网格流为所述候选流场;
若所述位置变化状态为静止状态,则确定零光流场为所述候选流场。
根据本公开的一个或多个实施例,本公开提供的图像处理方法中,所述计算所述第一图像与所述原始参考图像的网格流,包括:
根据所述第一图像和所述原始参考图像获取具有不同网格分辨率的多组图像对,
其中,每组所述图像对中包括第二图像和关联参考图像,其中,所述第二图像是对所述第一图像在对应网格分辨率下网格划分后获取的,所述关联参考图像是根据所述第二图像的图像尺寸缩放所述原始参考图像获取的;
根据所述网格分辨率由小到大的顺序,在当前图像对为最小网格分辨率时,根据对应的第二图像和关联参考图像更新所述对应的第二图像的网格顶点位置;
在当前图像对不为所述最小网格分辨率时,根据上个图像对的网格顶点位置更新所述当前图像对的第二图像对应网格顶点位置,并根据对应的第二图像和关联参考图像更新所述对应的第二图像的网格顶点位置;
在当前图像对为最大网格分辨率时,根据当前图像对对应的第二图像的网格顶点位置获取目标网格变形图像,并根据所述目标网格变形图像和所述第一图像计算所述网格流。
根据本公开的一个或多个实施例,本公开提供的图像处理方法中,所述根据所述第一图像和所述原始参考图像获取具有不同网格分辨率的多组图像对,包括:
根据预设的单元网格尺寸和所述多组图像对对应的多个网格分辨率,对所述第一图像进行网格划分生成对应的具有不同网格分辨率的多个第二图像;
根据与每个所述网格分辨率对应的第二图像的图像尺寸对所述原始参考图像进行缩放处理,以生成尺寸匹配的关联参考图像;
根据所述多个第二图像和尺寸匹配的多个所述关联参考图像生成所述多组图像对。
根据本公开的一个或多个实施例,本公开提供的图像处理方法中,所述根据对应的第二图像和关联参考图像更新所述对应的第二图像的网格顶点位置,包括:
根据所述对应的第二图像的网格顶点位置,迭代计算所述对应的第二图像和关联参考图像的残差值;
在每次迭代计算时,判断当前迭代计算的残差值是否满足预设的迭代停止条件;
若不满足所述迭代停止条件,则根据所述残差值更新所述对应的第二图像的网格顶点位置,并继续迭代计算直至所述当前迭代计算的残差值满足所述预设的迭代停止条件。
根据本公开的一个或多个实施例,本公开提供的图像处理方法中,所述根据所述对应的第二图像的网格顶点位置,迭代计算所述对应的第二图像和关联参考图像的残差值,包括:
根据所述对应的第二图像的网格顶点位置,计算所述对应的第二图像和关联参考图像的光度误差值;
根据所述对应的第二图像的网格顶点位置,计算所述对应的第二图像的正则表达值;
根据所述光度误差值和所述正则表达值确定所述残差值。
根据本公开的一个或多个实施例,本公开提供的图像处理方法中,所述根据所述对应的第二图像的网格顶点位置,计算所述对应的第二图像和关联参考图像的光度误差值,包括:
确定所述对应的第二图像的多个样本像素;
确定每个所述样本像素所在网格,根据所述所在网格的网格顶点位置确定每个所述样本像素的像素位置;
根据预设的光度误差计算算法和所述样本像素的像素位置确定所述光度误差值。
根据本公开的一个或多个实施例,本公开提供的图像处理方法中,所述确定所述对应的第二图像的多个样本像素,包括:
按照预设步长逐个遍历当前网格分辨率下的第二图像中每个像素的像素梯度值;
确定所述像素梯度值大于等于所述预设梯度阈值的像素为候选样本像素;
若所述候选样本像素的总数量大于预设数量阈值,则随机确定所述预设数量阈值个所述候选样本像素为所述样本像素。
根据本公开的一个或多个实施例,本公开提供的图像处理方法中,若所述对应的第二图像的网格顶点位置被更新过,则所述根据所述对应的第二图像的网格顶点位置,计算所述对应的第二图像的正则表达值,包括:
将所述对应的第二图像中每个网格划分为两个三角形,以获取多个三角形;
根据所述对应的第二图像的网格顶点位置,确定每个所述三角形的第一三角形顶点位置;
获取所述对应的第二图像在最近一次更新之前每个所述三角形的第二三角形顶点位置;
根据所述第一三角形顶点位置和所述第二三角形顶点位置确定每个所述三角形的变形误差值;
根据所有所述三角形的变形误差值确定所述对应的第二图像的正则表达值。
根据本公开的一个或多个实施例,本公开提供的图像处理方法中,所述判断当前迭代计算的残差值是否满足预设的迭代停止条件,包括:
判断所述当前迭代计算的次数是否大于等于所述当前图像对的预设迭代次数,所述预设迭代次数大于1;
若大于等于所述预设迭代次数,则确定所述当前迭代计算的残差值满足所述预设的迭代停止条件。
根据本公开的一个或多个实施例,本公开提供的图像处理方法中,还包括:
若不大于等于所述预设迭代次数,则获取所述当前图像对对应的上一次迭代计算的历史残差值;
判断所述当前迭代计算的残差值是否大于等于所述历史残差值;
若大于等于所述历史残差值,则确定所述当前迭代计算的残差值满足所述预设的迭代停止条件。
根据本公开的一个或多个实施例,本公开提供的图像处理方法中,所述根据所述目标网格变形图像和所述第一图像计算所述网格流,包括:
根据所述目标网格变形图像中的网格顶点位置,获取所述目标网格变形图像中每个像素点的第三像素位置;
根据所述最大网格分辨率对应的第二图像的初始网格顶点位置,获取所述每个像素点的第四像素位置;
计算所述每个像素点的第三像素位置和第四像素位置的位移获取所述网格流。
根据本公开的一个或多个实施例,本公开提供的图像处理方法中,所述在所述对所述第一图像进行网格划分生成对应的具有不同网格分辨率的多个第二图像之前,还包括:
判断所述第一图像的分辨率是否大于预设分辨率阈值;
若大于所述预设分辨率阈值,则根据预设的下采样比值对所述第一图像下采样获取下采样后的所述第一图像;
根据所述下采样比值对所述原始参考图像下采样获取下采样后的所述原始参考图像。
根据本公开的一个或多个实施例,本公开提供的图像处理方法中,在所述根据所述光流和所述网格流对齐所述第一图像和所述原始参考图像之前,包括:
确定与所述预设的下采样比值对应的上采样比值;
根据所述上采样比值对所述网格流上采样获取上采样后的所述网格流。
根据本公开的一个或多个实施例,本公开提供的图像处理方法中,所述根据所述光流和所述候选流场对齐所述第一图像和所述原始参考图像,包括:
根据所述光流确定所述第一图像对齐所述原始参考图像的第三图像;
根据所述候选流场确定所述第一图像对齐所述原始参考图像的第四图像;
计算所述第三图像和所述原始参考图像的第一光度误差图像,并计算所述第四图像和所述原始参考图像的第二光度误差图像;
根据所述第一光度误差图像和所述第二光度误差图像,在所述光流和所述候选流场中确定目标流,以便于根据所述目标流对齐所述第一图像和所述原始参考图像。
根据本公开的一个或多个实施例,本公开提供的图像处理方法中,所述根据所述第一光度误差图像和所述第二光度误差图像,在所述光流和所述候选流场中确定目标流,包括:
对所述原始参考图像超像素分割获取多个超像素块;
根据所述第一光度误差图像确定所述多个超像素块的第一光度误差均值;
根据所述第二光度误差图像确定所述多个超像素块的第二光度误差均值;
判断所述第一光度误差均值是否大于所述第二光度误差均值;
若大于所述第二光度误差均值,则确定所述候选流场为所述目标流;
若不大于所述第二光度误差均值,则确定所述光流为所述目标流。
根据本公开的一个或多个实施例,本公开提供的图像处理方法中,在所述判断所述第一光度误差均值是否大于所述第二光度误差均值之前,还包括:
确定与所述光流对应的预设松弛参数值;
对所述预设松弛参数值和所述第一光度误差均值求和,根据求和结果更新所述第一光度误差均值。
根据本公开的一个或多个实施例,本公开提供了一种图像处理装置,包括:
计算模块,用于计算第一图像与待对齐的原始参考图像的光流;
第一确定模块,用于确定所述第一图像相对图像背景的位置变化状态;
第二确定模块,用于确定与所述位置变化状态对应的候选流场;
图像对齐模块,用于根据所述光流和所述候选流场对齐所述第一图像和所述原始参考图像。根据本公开的一个或多个实施例,本公开提供的图像处理装置中,所述计算模块,具体用于:
确定所述第一图像中每个像素点的第一像素位置,确定所述每个像素点在所述原始参考图像的第二像素位置;
计算所述第二像素位置移动到所述第一像素位置的瞬时速度矢量;
根据所述第一图像中所有像素点的瞬时速度矢量获取所述光流。
根据本公开的一个或多个实施例,本公开提供的图像处理装置中,所述第一确定模块,具体用于:
根据所述光流确定所述第一图像中每个样本像素点的瞬时速度矢量;
确定所述瞬时速度矢量的模小于预设速度阈值的像素点的像素数量;
若所述比值大于预设比值阈值,则确定所述位置变化状态为运动状态;
若所述比值小于等于所述预设比值阈值,则确定所述位置变化状态为静止状态。
根据本公开的一个或多个实施例,本公开提供的图像处理装置中,所述第一确定模块,具体用于:
获取所述第一图像的第一相机位姿和所述第二图像的第二相机位姿;
若所述第一相机位姿和所述第二相机位姿不一致,则确定所述位置变化状态为运动状态;
若所述第一相机位姿和所述第二相机位姿一致,则确定所述位置变化状态为静止状态。
根据本公开的一个或多个实施例,本公开提供的图像处理装置中,所述第二确定模块,具体用于:
若所述位置变化状态为运动状态,则计算所述第一图像与所述原始参考图像的网格流,并确定所述网格流为所述候选流场;
若所述位置变化状态为静止状态,则确定零光流场为所述候选流场。
根据本公开的一个或多个实施例,本公开提供的图像处理装置中,还包括:
获取模块,用于根据所述第一图像和所述原始参考图像获取具有不同网格分辨率的多组图像对,其中,每组所述图像对中包括第二图像和关联参考图像,其中,所述第二图像是对所述第一图像在对应网格分辨率下网格划分后获取的,所述关联参考图像是根据所述第二图像的图像尺寸缩放所述原始参考图像获取的;
更新模块,用于根据所述网格分辨率由小到大的顺序,在当前图像对为最小网格分辨率时,根据对应的第二图像和关联参考图像更新所述对应的第二图像的网格顶点位置;
所述更新模块,还用于在当前图像对不为所述最小网格分辨率时,根据上个图像对的网格顶点位置更新所述当前图像对的第二图像对应网格顶点位置,并根据对应的第二图像和关联参考图像更新所述对应的第二图像的网格顶点位置;
所述更新模块,还用于在当前图像对为最大网格分辨率时,根据当前图像对对应的第二图像的网格顶点位置获取目标网格变形图像;
所述计算模块,用于根据所述目标网格变形图像和所述第一图像计算所述网格流。
根据本公开的一个或多个实施例,本公开提供的图像处理装置中,所述获取模块,具体用于:
根据预设的单元网格尺寸和所述多组图像对对应的多个网格分辨率,对所述第一图像进行网格划分生成对应的具有不同网格分辨率的多个第二图像;
根据与每个所述网格分辨率对应的第二图像的图像尺寸对所述原始参考图像进行缩放处理,以生成尺寸匹配的关联参考图像;
根据所述多个第二图像和尺寸匹配的多个所述关联参考图像生成所述多组图像对。
根据本公开的一个或多个实施例,本公开提供的图像处理装置中,所述更新模块,包括:
计算单元,用于根据所述对应的第二图像的网格顶点位置,迭代计算所述对应的第二图像和关联参考图像的残差值;
判断单元,用于在每次迭代计算时,判断当前迭代计算的残差值是否满足预设的迭代停止条件;
更新单元,用于在不满足所述迭代停止条件时,根据所述残差值更新所述对应的第二图像的网格顶点位置,并继续迭代计算直至所述当前迭代计算的残差值满足所述预设的迭代停止条件。
根据本公开的一个或多个实施例,本公开提供的图像处理装置中,所述计算单元,具体用于:
根据所述对应的第二图像的网格顶点位置,计算所述对应的第二图像和关联参考图像的光度误差值;
根据所述对应的第二图像的网格顶点位置,计算所述对应的第二图像的正则表达值;
根据所述光度误差值和所述正则表达值确定所述残差值。
根据本公开的一个或多个实施例,本公开提供的图像处理装置中,所述计算单元,具体用于:
确定所述对应的第二图像的多个样本像素;
确定每个所述样本像素所在网格,根据所述所在网格的网格顶点位置确定每个所述样本像素的像素位置;
根据预设的光度误差计算算法和所述样本像素的像素位置确定所述光度误差值。
根据本公开的一个或多个实施例,本公开提供的图像处理装置中,所述计算单元,具体用于:
按照预设步长逐个遍历当前网格分辨率下的第二图像中每个像素的像素梯度值;
确定所述像素梯度值大于等于所述预设梯度阈值的像素为候选样本像素;
若所述候选样本像素的总数量大于预设数量阈值,则随机确定所述预设数量阈值个所述候选样本像素为所述样本像素。
根据本公开的一个或多个实施例,本公开提供的图像处理装置中,若所述对应的第二图像的网格顶点位置被更新过,则所述计算单元,具体用于:
将所述对应的第二图像中每个网格划分为两个三角形,以获取多个三角形;
根据所述对应的第二图像的网格顶点位置,确定每个所述三角形的第一三角形顶点位置;
获取所述对应的第二图像在最近一次更新之前每个所述三角形的第二三角形顶点位置;
根据所述第一三角形顶点位置和所述第二三角形顶点位置确定每个所述三角形的变形误差值;
根据所有所述三角形的变形误差值确定所述对应的第二图像的正则表达值。
根据本公开的一个或多个实施例,本公开提供的图像处理装置中,所述判断单元,具体用于:
判断所述当前迭代计算的次数是否大于等于所述当前图像对的预设迭代次数,所述预设迭代次数大于1;
若大于等于所述预设迭代次数,则确定所述当前迭代计算的残差值满足所述预设的迭代停止条件。
根据本公开的一个或多个实施例,本公开提供的图像处理装置中,所述判断单元,还用于:
若不大于等于所述预设迭代次数,则获取所述当前图像对对应的上一次迭代计算的历史残差值;
判断所述当前迭代计算的残差值是否大于等于所述历史残差值;
若大于等于所述历史残差值,则确定所述当前迭代计算的残差值满足所述预设的迭代停止条件。
根据本公开的一个或多个实施例,本公开提供的图像处理装置中,所述第三计算模块,具体用于:
根据所述目标网格变形图像中的网格顶点位置,获取所述目标网格变形图像中每个像素点的第三像素位置;
根据所述最大网格分辨率对应的第二图像的初始网格顶点位置,获取所述每个像素点的第四像素位置;
计算所述每个像素点的第三像素位置和第四像素位置的位移获取所述网格流。
根据本公开的一个或多个实施例,本公开提供的图像处理装置中,还包括:下采样模块,用于:
判断所述第一图像的分辨率是否大于预设分辨率阈值;
若大于所述预设分辨率阈值,则根据预设的下采样比值对所述第一图像下采样获取下采样后的所述第一图像;
根据所述下采样比值对所述原始参考图像下采样获取下采样后的所述原始参考图像。
根据本公开的一个或多个实施例,本公开提供的图像处理装置中,还包括:下采样模块,用于确定与所述预设的下采样比值对应的上采样比值;
根据所述上采样比值对所述网格流上采样获取上采样后的所述网格流。
根据本公开的一个或多个实施例,本公开提供的图像处理装置中,所述像对齐模块,具体用于:
根据所述光流确定所述第一图像对齐所述原始参考图像的第三图像;
根据所述候选流场确定所述第一图像对齐所述原始参考图像的第四图像;
计算所述第三图像和所述原始参考图像的第一光度误差图像,并计算所述第四图像和所述原始参考图像的第二光度误差图像;
根据所述第一光度误差图像和所述第二光度误差图像,在所述光流和所述候选流场中确定目标流,以便于根据所述目标流对齐所述第一图像和所述原始参考图像。
根据本公开的一个或多个实施例,本公开提供的图像处理装置中,所述像对齐模块,具体用于:
根据本公开的一个或多个实施例,本公开提供的图像处理装置中,所述像对齐模块,具体用于:
对所述原始参考图像超像素分割获取多个超像素块;
根据所述第一光度误差图像确定所述多个超像素块的第一光度误差均值;
根据所述第二光度误差图像确定所述多个超像素块的第二光度误差均值;
判断所述第一光度误差均值是否大于所述第二光度误差均值;
若大于所述第二光度误差均值,则确定所述候选流场为所述目标流;
若不大于所述第二光度误差均值,则确定所述光流为所述目标流。
根据本公开的一个或多个实施例,本公开提供的图像处理装置中,所述像对齐模块,具体用于:
确定与所述光流对应的预设松弛参数值;
对所述预设松弛参数值和所述第一光度误差均值求和,根据求和结果更新所述第一光度误差均值。
根据本公开的一个或多个实施例,本公开提供了一种电子设备,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现如本公开提供的任一所述的图像处理方法。
根据本公开的一个或多个实施例,本公开提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行如本公开提供的任一所述的图像处理方法。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。

Claims (23)

1.一种图像处理方法,其特征在于,包括以下步骤:
计算第一图像与待对齐的原始参考图像的光流;
确定所述第一图像相对图像背景的位置变化状态;
确定与所述位置变化状态对应的候选流场;
根据所述光流和所述候选流场对齐所述第一图像和所述原始参考图像。
2.如权利要求1所述的方法,其特征在于,所述计算第一图像与待对齐的原始参考图像的光流,包括:
确定所述第一图像中每个像素点的第一像素位置,确定所述每个像素点在所述原始参考图像的第二像素位置;
计算所述第二像素位置移动到所述第一像素位置的瞬时速度矢量;
根据所述第一图像中所有像素点的瞬时速度矢量获取所述光流。
3.如权利要求1所述的方法,其特征在于,所述确定所述第一图像相对图像背景的位置变化状态,包括:
根据所述光流确定所述第一图像中每个样本像素点的瞬时速度矢量;
确定所述瞬时速度矢量的模小于预设速度阈值的像素点的像素数量;
计算所述像素数量和所述第一图像中样本像素点的总数量的比值;
若所述比值大于预设比值阈值,则确定所述位置变化状态为运动状态;
若所述比值小于等于所述预设比值阈值,则确定所述位置变化状态为静止状态。
4.如权利要求1所述的方法,其特征在于,所述确定所述第一图像相对图像背景的位置变化状态,包括:
获取所述第一图像的第一相机位姿和所述第二图像的第二相机位姿;
若所述第一相机位姿和所述第二相机位姿不一致,则确定所述位置变化状态为运动状态;
若所述第一相机位姿和所述第二相机位姿一致,则确定所述位置变化状态为静止状态。
5.如权利要求1所述的方法,其特征在于,所述确定与所述位置变化状态对应的候选流场,包括:
若所述位置变化状态为运动状态,则计算所述第一图像与所述原始参考图像的网格流,并确定所述网格流为所述候选流场;
若所述位置变化状态为静止状态,则确定零光流场为所述候选流场。
6.如权利要求5所述的方法,其特征在于,所述计算所述第一图像与所述原始参考图像的网格流,包括:
根据所述第一图像和所述原始参考图像获取具有不同网格分辨率的多组图像对,
其中,每组所述图像对中包括第二图像和关联参考图像,其中,所述第二图像是对所述第一图像在对应网格分辨率下网格划分后获取的,所述关联参考图像是根据所述第二图像的图像尺寸缩放所述原始参考图像获取的;
根据所述网格分辨率由小到大的顺序,在当前图像对为最小网格分辨率时,根据对应的第二图像和关联参考图像更新所述对应的第二图像的网格顶点位置;
在当前图像对不为所述最小网格分辨率时,根据上个图像对的网格顶点位置更新所述当前图像对的第二图像对应网格顶点位置,并根据对应的第二图像和关联参考图像更新所述对应的第二图像的网格顶点位置;
在当前图像对为最大网格分辨率时,根据当前图像对对应的第二图像的网格顶点位置获取目标网格变形图像,并根据所述目标网格变形图像和所述第一图像计算所述网格流。
7.如权利要求6所述的方法,其特征在于,所述根据所述第一图像和所述原始参考图像获取具有不同网格分辨率的多组图像对,包括:
根据预设的单元网格尺寸和所述多组图像对对应的多个网格分辨率,对所述第一图像进行网格划分生成对应的具有不同网格分辨率的多个第二图像;
根据与每个所述网格分辨率对应的第二图像的图像尺寸对所述原始参考图像进行缩放处理,以生成尺寸匹配的关联参考图像;
根据所述多个第二图像和尺寸匹配的多个所述关联参考图像生成所述多组图像对。
8.如权利要求6所述的方法,其特征在于,所述根据对应的第二图像和关联参考图像更新所述对应的第二图像的网格顶点位置,包括:
根据所述对应的第二图像的网格顶点位置,迭代计算所述对应的第二图像和关联参考图像的残差值;
在每次迭代计算时,判断当前迭代计算的残差值是否满足预设的迭代停止条件;
若不满足所述迭代停止条件,则根据所述残差值更新所述对应的第二图像的网格顶点位置,并继续迭代计算直至所述当前迭代计算的残差值满足所述预设的迭代停止条件。
9.如权利要求8所述的方法,其特征在于,所述根据所述对应的第二图像的网格顶点位置,迭代计算所述对应的第二图像和关联参考图像的残差值,包括:
根据所述对应的第二图像的网格顶点位置,计算所述对应的第二图像和关联参考图像的光度误差值;
根据所述对应的第二图像的网格顶点位置,计算所述对应的第二图像的正则表达值;
根据所述光度误差值和所述正则表达值确定所述残差值。
10.如权利要求9所述的方法,其特征在于,所述根据所述对应的第二图像的网格顶点位置,计算所述对应的第二图像和关联参考图像的光度误差值,包括:
确定所述对应的第二图像的多个样本像素;
确定每个所述样本像素所在网格,根据所述所在网格的网格顶点位置确定每个所述样本像素的像素位置;
根据预设的光度误差计算算法和所述样本像素的像素位置确定所述光度误差值。
11.如权利要求10所述的方法,其特征在于,所述确定所述对应的第二图像的多个样本像素,包括:
按照预设步长逐个遍历当前网格分辨率下的第二图像中每个像素的像素梯度值;
确定所述像素梯度值大于等于所述预设梯度阈值的像素为候选样本像素;
若所述候选样本像素的总数量大于预设数量阈值,则随机确定所述预设数量阈值个所述候选样本像素为所述样本像素。
12.如权利要求9所述的方法,其特征在于,若所述对应的第二图像的网格顶点位置被更新过,则所述根据所述对应的第二图像的网格顶点位置,计算所述对应的第二图像的正则表达值,包括:
将所述对应的第二图像中每个网格划分为两个三角形,以获取多个三角形;
根据所述对应的第二图像的网格顶点位置,确定每个所述三角形的第一三角形顶点位置;
获取所述对应的第二图像在最近一次更新之前每个所述三角形的第二三角形顶点位置;
根据所述第一三角形顶点位置和所述第二三角形顶点位置确定每个所述三角形的变形误差值;
根据所有所述三角形的变形误差值确定所述对应的第二图像的正则表达值。
13.如权利要求8所述的方法,其特征在于,所述判断当前迭代计算的残差值是否满足预设的迭代停止条件,包括:
判断所述当前迭代计算的次数是否大于等于所述当前图像对的预设迭代次数,所述预设迭代次数大于1;
若大于等于所述预设迭代次数,则确定所述当前迭代计算的残差值满足所述预设的迭代停止条件。
14.如权利要求13所述的方法,其特征在于,还包括:
若不大于等于所述预设迭代次数,则获取所述当前图像对对应的上一次迭代计算的历史残差值;
判断所述当前迭代计算的残差值是否大于等于所述历史残差值;
若大于等于所述历史残差值,则确定所述当前迭代计算的残差值满足所述预设的迭代停止条件。
15.如权利要求6所述的方法,其特征在于,所述根据所述目标网格变形图像和所述第一图像计算所述网格流,包括:
根据所述目标网格变形图像中的网格顶点位置,获取所述目标网格变形图像中每个像素点的第三像素位置;
根据所述最大网格分辨率对应的第二图像的初始网格顶点位置,获取所述每个像素点的第四像素位置;
计算所述每个像素点的第三像素位置和第四像素位置的位移获取所述网格流。
16.如权利要求7所述的方法,其特征在于,所述在所述对所述第一图像进行网格划分生成对应的具有不同网格分辨率的多个第二图像之前,还包括:
判断所述第一图像的分辨率是否大于预设分辨率阈值;
若大于所述预设分辨率阈值,则根据预设的下采样比值对所述第一图像下采样获取下采样后的所述第一图像;
根据所述下采样比值对所述原始参考图像下采样获取下采样后的所述原始参考图像。
17.如权利要求16所述的方法,其特征在于,在所述根据所述光流和所述网格流对齐所述第一图像和所述原始参考图像之前,包括:
确定与所述预设的下采样比值对应的上采样比值;
根据所述上采样比值对所述网格流上采样获取上采样后的所述网格流。
18.如权利要求1-17任一所述的方法,其特征在于,所述根据所述光流和所述候选流场对齐所述第一图像和所述原始参考图像,包括:
根据所述光流确定所述第一图像对齐所述原始参考图像的第三图像;
根据所述候选流场确定所述第一图像对齐所述原始参考图像的第四图像;
计算所述第三图像和所述原始参考图像的第一光度误差图像,并计算所述第四图像和所述原始参考图像的第二光度误差图像;
根据所述第一光度误差图像和所述第二光度误差图像,在所述光流和所述候选流场中确定目标流,以便于根据所述目标流对齐所述第一图像和所述原始参考图像。
19.如权利要求18所述的方法,其特征在于,所述根据所述第一光度误差图像和所述第二光度误差图像,在所述光流和所述候选流场中确定目标流,包括:
对所述原始参考图像超像素分割获取多个超像素块;
根据所述第一光度误差图像确定所述多个超像素块的第一光度误差均值;
根据所述第二光度误差图像确定所述多个超像素块的第二光度误差均值;
判断所述第一光度误差均值是否大于所述第二光度误差均值;
若大于所述第二光度误差均值,则确定所述候选流场为所述目标流;
若不大于所述第二光度误差均值,则确定所述光流为所述目标流。
20.如权利要求19所述的方法,其特征在于,在所述判断所述第一光度误差均值是否大于所述第二光度误差均值之前,还包括:
确定与所述光流对应的预设松弛参数值;
对所述预设松弛参数值和所述第一光度误差均值求和,根据求和结果更新所述第一光度误差均值。
21.一种图像处理装置,其特征在于,包括:
计算模块,用于计算第一图像与待对齐的原始参考图像的光流;
第一确定模块,用于确定所述第一图像相对图像背景的位置变化状态;
第二确定模块,用于确定与所述位置变化状态对应的候选流场;
图像对齐模块,用于根据所述光流和所述候选流场对齐所述第一图像和所述原始参考图像。
22.一种电子设备,其特征在于,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述权利要求1-20中任一所述的图像处理方法。
23.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1-20中任一所述的图像处理方法。
CN202110872598.3A 2021-07-30 2021-07-30 图像处理方法、装置、设备及介质 Pending CN115690175A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110872598.3A CN115690175A (zh) 2021-07-30 2021-07-30 图像处理方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110872598.3A CN115690175A (zh) 2021-07-30 2021-07-30 图像处理方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN115690175A true CN115690175A (zh) 2023-02-03

Family

ID=85059475

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110872598.3A Pending CN115690175A (zh) 2021-07-30 2021-07-30 图像处理方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN115690175A (zh)

Similar Documents

Publication Publication Date Title
CN108833785B (zh) 多视角图像的融合方法、装置、计算机设备和存储介质
CN113160294B (zh) 图像场景深度的估计方法、装置、终端设备和存储介质
CN111612882B (zh) 图像处理方法、装置、计算机存储介质及电子设备
CN110910437B (zh) 一种复杂室内场景的深度预测方法
CN115578255B (zh) 一种基于帧间亚像素块匹配的超分辨率重建方法
CN115578515B (zh) 三维重建模型的训练方法、三维场景渲染方法及装置
CN112509106A (zh) 文档图片展平方法、装置以及设备
CN113643414A (zh) 一种三维图像生成方法、装置、电子设备及存储介质
CN106846250B (zh) 一种基于多尺度滤波的超分辨率重建方法
CN111861888A (zh) 图像处理方法、装置、电子设备及存储介质
CN117036581B (zh) 基于二维神经渲染的体渲染方法、***、设备及介质
WO2023160525A1 (zh) 视频处理方法、装置、设备及介质
CN115409696A (zh) 图像处理方法、装置、电子设备及存储介质
WO2024032331A9 (zh) 图像处理方法及装置、电子设备、存储介质
WO2023025085A1 (zh) 视频处理方法、装置、设备、介质及程序产品
CN116433822A (zh) 一种神经辐射场训练方法、装置、设备及介质
CN115690175A (zh) 图像处理方法、装置、设备及介质
CN115205112A (zh) 一种真实复杂场景图像超分辨率的模型训练方法及装置
Inzerillo Super-resolution images on mobile smartphone aimed at 3D modeling
CN114494574A (zh) 一种多损失函数约束的深度学习单目三维重建方法及***
CN114913196A (zh) 一种基于注意力机制稠密光流计算方法
CN113284081A (zh) 深度图超分辨率优化方法、装置、处理设备及存储介质
CN115690176A (zh) 图像处理方法、装置、设备及介质
CN114219900B (zh) 基于混合现实眼镜的三维场景重建方法、重建***和应用
CN115841151B (zh) 模型训练方法、装置、电子设备和计算机可读介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination