CN109658433A - 图像背景建模和前景提取方法、装置和电子设备 - Google Patents
图像背景建模和前景提取方法、装置和电子设备 Download PDFInfo
- Publication number
- CN109658433A CN109658433A CN201811479167.5A CN201811479167A CN109658433A CN 109658433 A CN109658433 A CN 109658433A CN 201811479167 A CN201811479167 A CN 201811479167A CN 109658433 A CN109658433 A CN 109658433A
- Authority
- CN
- China
- Prior art keywords
- pixel
- background
- depth
- foreground
- exposure mask
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/194—Segmentation; Edge detection involving foreground-background segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/136—Segmentation; Edge detection involving thresholding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/187—Segmentation; Edge detection involving region growing; involving region merging; involving connected component labelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/254—Analysis of motion involving subtraction of images
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种图像背景建模和前景提取方法、装置和电子设备,方法包括:初始化多层深度背景模型,对输入的一帧深度图进行背景减除和连通区域分析;判断是否为鬼影区域;对非鬼影区域提取出第一前景目标掩膜和第二前景目标掩膜;判断每一像素点属于背景像素点还是前景像素点,确定需要更新的背景像素点;对需要更新的背景像素点进行二次检验,如果需要更新的背景像素点在所述鬼影区域内且该需要更新的背景像素点与标定边界的距离小于第三阈值,则不更新该像素点,否则,更新该像素点。本发明实施例基于深度图与红外图的图像进行背景建模和前景提取,稳定性好并且复杂度小,鲁棒性高,可以实时滤除鬼影。
Description
技术领域
本发明涉及图像处理技术领域,具体涉及一种图像背景建模和前景提取方法、装置和电子设备。
背景技术
目前,背景建模及前景提取中一个重要步骤为鬼影消除。鬼影,即误检测处的前景块,当像素点被错误地识别为背景像素点,它可能会导致真正的背景像素点被认为是前景像素点,并且这些像素点不会用来更新背景模型,这是鬼影产生的原因。现有的鬼影消除技术一般是结合多帧图像的信息来消除鬼影。该技术存在的主要问题一是会将静止物体误判成鬼影;二是无法实时滤除鬼影区域,效果差。
发明内容
本发明提供了一种图像背景建模和前景提取方法、装置和电子设备,可以实时滤除鬼影并且复杂度小,鲁棒性高。
根据本申请的一个方面,提供了一种图像背景建模和前景提取方法,该方法包括:
初始化多层深度背景模型,对输入的一帧深度图进行背景减除和连通区域分析;
对各连通区域判断是否为鬼影区域,对不是鬼影区域的连通区域进行目标识别,并提取出第一前景目标掩膜和第二前景目标掩膜;
根据第一前景目标掩膜和第二前景目标掩膜,判断每一像素点属于背景像素点还是前景像素点,若该像素点与第一前景目标掩膜的最短距离大于第一阈值且与第二前景目标掩膜的距离大于第二阈值,则将该像素点确定为需要更新的背景像素点;
对需要更新的背景像素点进行二次检验,如果需要更新的背景像素点在所述鬼影区域内且该需要更新的背景像素点与标定边界的距离小于第三阈值,则不更新该像素点,否则,更新该像素点。
根据本申请的另一个方面,提供了一种图像背景建模和前景提取装置,其特征在于,包括:
前景确定模块,用于初始化多层深度背景模型,对输入的一帧深度图进行背景减除和连通区域分析;
鬼影判断模块,用于对各连通区域判断是否为鬼影区域;
目标识别模块,用于对不是鬼影区域的连通区域进行目标识别,并提取出第一前景目标掩膜和第二前景目标掩膜;
判断模块,用于根据第一前景目标掩膜和第二前景目标掩膜,判断每一像素点属于背景像素点还是前景像素点,若该像素点与第一前景目标掩膜的最短距离大于第一阈值且与第二前景目标掩膜的距离大于第二阈值,则将该像素点确定为需要更新的背景像素点;
检验模块,用于对需要更新的背景像素点进行二次检验,如果需要更新的背景像素点在所述鬼影区域内且该需要更新的背景像素点与标定边界的距离小于第三阈值,则不更新该像素点,否则,更新该像素点。
根据本申请的又一个方面,提供了一种电子设备,所述电子设备包括:存储器和处理器,所述存储器和所述处理器之间通过内部总线通讯连接,所述存储器存储有能够被所述处理器执行的程序指令,所述程序指令被所述处理器执行时能够实现本申请一个方面所述的方法。
应用本发明实施例的图像背景建模和前景提取方案,初始化多层深度背景模型,对输入的一帧深度图进行背景减除和连通区域分析,并对不属于鬼影区域的连通区域进行目标识别,提取第一前景目标掩膜和第二前景目标掩膜,判断每一像素点属于背景像素点还是前景像素点,对需要更新的背景像素点进行二次检验,如果需要更新的背景像素点在鬼影区域内且该需要更新的背景像素点与标定边界的距离小于第三阈值则不更新该像素点否则更新该像素点。如此,一方面,基于深度图而非彩色图进行背景建模和前景提取,从而具有更高的稳定性以及处理物***置关系时的优越性。另一方面,利用图像的深度信息和红外信息进行鬼影消除以及进行二次检验,复杂度小,鲁棒性高,可以实时滤除鬼影,解决了现有的鬼影消除技术将静止物体误判成鬼影以及无法实时滤除鬼影区域的技术问题。
附图说明
图1是本发明一个实施例的图像背景建模和前景提取方法的流程图;
图2是本发明另一个实施例的图像背景建模和前景提取方法的流程示意图;
图3是本发明一个实施例的图像背景建模和前景提取装置的框图;
图4是本发明一个实施例的电子设备的结构示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是本发明一个实施例的图像背景建模和前景提取方法的流程图,参见图1,本实施例的图像背景建模和前景提取方法包括下列步骤:
步骤S101,初始化多层深度背景模型,对输入的一帧深度图进行背景减除和连通区域分析;
步骤S102,对各连通区域判断是否为鬼影区域;
步骤S103,对不是鬼影区域的连通区域进行目标识别,并提取出第一前景目标掩膜和第二前景目标掩膜;
步骤S104,根据第一前景目标掩膜和第二前景目标掩膜,判断每一像素点属于背景像素点还是前景像素点,若该像素点与第一前景目标掩膜的最短距离大于第一阈值且与第二前景目标掩膜的距离大于第二阈值,则将该像素点确定为需要更新的背景像素点;
步骤S105,如果需要更新的背景像素点与标定边界的距离小于第三阈值,则不更新该像素点,否则,更新该像素点。
由图1所示可知,本实施例的图像背景建模和前景提取方法,如此,通过对深度图进行背景建模和前景提取而非彩色图,由于深度值是根据每个物体所在像素点离深度摄像头的距离得到的,深度值不会随着室内场景光影的突然变化、前景图像的颜色和背景图像的颜色相似、或者物体之间的相互遮挡时而受到影响,所以将深度值加入背景建模中,可以避免背景建模时出现的错误,提高了背景建模的准确度,进而从该图像中提取前景图像的效果较佳并且运算复杂性低。另外利用深度图的深度信息和红外信息进行鬼影消除以及更新前进行二次检验,可以实时滤除鬼影,鲁棒性高,解决了现有的鬼影消除技术将静止物体误判成鬼影以及无法实时滤除鬼影区域的技术问题。
下面结合一个具体的应用场景对本发明实施例的这种背景建模和前景提取的方法的实现步骤进行说明。
本实施例的方法应用于投影触控场景中,投影触控是利用投影触控装置将图像投射到触控区,通过在触控区的触控操作使触控信号转变为触控反馈信息使投影触控装置能够确定触控操作并据此执行相应的反馈。这里的投影触控装置比如是包括基于光的飞行时间的深度相机,即TOF(Time Of Flight)相机与投影仪。触控区可以是桌面,实际应用中,深度相机上的深度、红外传感器与投影仪一起固定在桌面上方预定高度比如1米处,能够使桌面具有相当于触摸屏的功能。这里桌面的材质不限,不需要是平面。这种投影触控技术方案不依赖外部补光也不受外部光线影响,具有广阔的应用前景。而本实施例的背景建模及前景提取在该应用场景中负责对桌面建模,以及对手和放在桌面上的其他物体的提取。
桌面上方预定高度固定的深度相机对投影仪投射到桌面的画面进行拍摄,得到的图像经过深度相机与投影仪的标定后,只有图像中的一个四边形内的区域需要进行背景建模和前景提取操作,下文中称该四边形的四条边为标定边界。
本发明实施例中背景模型采用多层高斯模型,将初始背景(比如桌面)作为底层,对于初始背景上堆叠的静止物体进行分析并建立对应层的模型。这种背景建模技术为每一层中的每个像素点建立高斯混合概率密度函数,然后用即时的近似值更新该模型。具体到本实施例中,每层的每个像素点均存储该点的深度值均值、方差以及红外值均值、方差。
用即时的近似值更新该模型中的像素点时,具体包括:对于每层的每个像素点,按照下列公式更新均值和方差:
均值更新公式:meani+1=(1-l)×meani+l×valuei+1;
方差更新公式:vari+1=(1-l)×vari+l×(valuei+1-meani)2
其中,i表示帧号,l表示学习率,0<=l<=1。
参见图2,本实施例中采用第一帧作为背景模型的初始化,在初始化之后对于接收到的视频帧进行下列步骤的处理。
步骤S201,获取到新一帧图像;
步骤S202,背景减除、连通区域分析;
本步骤中,对获取到的每一帧的深度和红外图进行背景减除、联通区域分析,得到疑似前景区块。
需要说明的是,本实施例中投影触控方案采用的相机并非普通相机而是深度相机,比如基于飞行时间技术的深度相机,这种相机使用红外光组件将红外光发射到场景比如本实施例的桌面上,使用脉冲红外光,可以测量出射光脉冲与相应的入射光脉冲之间的时间,并且将其用于确定从深度相机到场景中的目标或物体上的特定位置的物理距离。深度相机得到的深度图类似于灰度图,该深度图中的每个像素的深度值可用于表征场景中的某一点与红外相机之间的实际距离。
背景减除是指从静止的背景中提取移动的前景。连通区域(ConnectedComponent)一般是指图像中具有相同像素值,且位置相邻的前景像素点组成的图像区域。连通区域分析是指将图像中的各个连通区域找出并标记。在图像中,最小的单位是像素,每个像素周围有8个邻接像素,常见的邻接关系有两种,4邻接与8邻接。4邻接一共4个点,即,上下左右,8邻接的点一共有8个,除前述上下左右的点外还包括了对角线位置的点。在视觉上看来,彼此连通的点形成了一个区域,而不连通的点形成了不同的区域,这样的一个所有彼此连通点构成的集合,称为一个连通区域。
为避免或减少前景误判,本实施例中在进行背景减除时,比较深度图上的像素点的深度值与背景深度均值,如果像素点的深度值小于背景深度均值,则确定为疑似前景区域的像素点,然后找出并标记疑似前景区域中的各连通区域。
步骤S203,鬼影消除;
本步骤中,对疑似前景区域进行鬼影分析,以丢弃鬼影区块以及面积过小的区块。鬼影消除的前提是确定鬼影区域,本实施例中采用统计连通区域内深度差值的绝对值Delta_Depth_i_j小于T0的像素点P_i_j的个数S_Depth_i和红外能量差值的绝对值Delta_IR_i_j小于T2的像素点P_i_j的个数S_IR_i;对于每个连通区域,如果S_Depth_i大于或等于第一个数阈值T1*N_i且S_IR_i大于或等于第二个数阈值T3*N_i,则确定该连通区域为鬼影区域,其中,i为连通区域的标号,N_i为连通区域轮廓上像素点的个数。
需要说明的是,这里的连通区域内深度差值的绝对值Delta_Depth_i_j和红外能量差值的绝对值Delta_IR_i_j通过下列步骤计算得到:对各连通区域进行轮廓提取,获取边缘轮廓Countour_i以及轮廓上像素点个数N_i;对各轮廓像素点P_i_j计算该像素点处的梯度方向Direction_i_j,根据梯度方向Direction_i_j计算单位法线向量Norm_i_j,其中i为连通区域的标号,j为轮廓Countour_i上点的标号;根据梯度方向Direction_i_j和单位法线向量Norm_i_j计算像素点P_i_j左右两侧的像素点P_i_j_1和P_i_j_2,其中,P_i_j_1=P_i_j+Dist*Norm_i_j,P_i_j_2=P_i_j-Dist*Norm_i_j;得到像素点P_i_j_1和P_i_j_2后计算P_i_j_1和P_i_j_2的深度差值的绝对值Delta_Depth_i_j和红外能量差值的绝对值Delta_IR_i_j。
在确定出鬼影区域后,如果是鬼影区域则不参与后续的目标识别,如果不是鬼影区域则进行目标识别。
由此,本实施例的利用图像的深度信息和红外信息进行鬼影消除,复杂度小,鲁棒性高,可以实时滤除鬼影目标。
步骤S204,分类、追踪;
本实施例的一个应用场景中需要区分物体运动状态,而分析物体运动状态就需要对物体进行追踪。追踪对象为前景物体块,追踪的结果是不同帧的前景物体块间的对应关系。
具体的,
将不是鬼影区域的连通区域进行目标识别,将连通区域分类为人手掩膜与物体掩膜,分别进行追踪并分析物体的运动状态。这里的人手掩膜为第一前景掩膜,物体(比如书本)掩膜是第二前景掩膜,分类为人手区域与物体区域,分别进行追踪,并分析物体的运动状态。如何对连通区域分类为现有技术,可以参见现有技术的说明,本实施例中不再赘述。
步骤S205,背景更新;
这里的背景更新之前先确定背景像素点并对背景像素点进行更新。背景像素点的判断步骤,例如是判断像素点与第一前景目标掩膜(手掩膜)的最短欧式距离是否大于第一阈值且与像素点与第二前景目标掩膜(物体掩膜)的欧式距离是否大于第二阈值,如果两个距离均大于则将该像素点确定为需要更新的背景像素点。这里的距离为二维欧式距离,可以通过像素点的深度值和前景目标的深度值得到。最短欧式距离,是指像素点距目标掩膜中每一个像素点的二维欧式距离中最短的一个。
本实施例中,对前述确定的需要更新的背景像素点进一步判断,如果需要更新的背景像素点与标定边界的距离小于第三阈值,则不更新该像素点,否则,更新该像素点,更新像素点具体是更新像素点对应的背景模型。本实施例中的第一阈值,第二阈值以及第三阈值均与深度图像的质量有关,即是与深度相机硬件相关,实际应用中应根据需求进行设定。
步骤S206,静止物体更新;
对获取的运动物体静止的第一帧,利用第一帧初始化对应层的对应像素点的背景模型。将背景模型中像素点的深度以及红外均值分别设置为当前帧的像素点深度和红外瞬时值,将背景模型中像素点的深度、红外方差继承前一帧该像素点顶层背景的深度和红外方差,以及,记录新建层为对应像素点的新顶层。新建层,是指刚刚经过初始化的这一层,也就是前述的“对应层”。
对于静止物体开始运动的第一帧,利用该第一帧将对应层对应像素点的背景模型清除。然后自高层至低层搜索该像素点的背景模型,找到第一个有效的背景层,将该层记录为新的顶层,有效的背景层是初始化后尚未清除的背景层。
此外,物体持续静止过程中,若某像素点位置上的物***于顶层,且该像素点与手掩膜的距离大于某一阈值,则更新该像素点。
这里的对获取的运动物体静止的第一帧,利用第一帧初始化对应层的对应像素点的背景模型可以理解为:是指如果当前帧是某运动物体静止的第一帧,则当前帧对该物体的操作为利用第一帧初始化对应层的对应像素点的背景模型。此处的初始化指某层某像素点的模型初始化,而在算法运行过程中,背景模型或会因前景物体的变化而多次重置和重新初始化。
步骤S207,当前帧处理结束。
在步骤S206中的更新完毕后等待下一帧图像。
由图2所示可知,本实施例的背景建模和前景提取方法包括步骤201至步骤207,根据步骤206是否已满足最终结果的要求,如果未满足,则可以该结果为输入,继续重复步骤201至步骤206,以不断循环的方式来达到最终结果。
与前述背景建模和前景提取方法同属于一个发明构思,本发明实施例还提供了背景建模和前景提取装置,参见图3,背景建模和前景提取装置300包括:
前景确定模块301,用于初始化多层深度背景模型,对输入的一帧深度图进行背景减除和连通区域分析;
鬼影判断模块302,用于对各连通区域判断是否为鬼影区域;
目标识别模块303,用于对不是鬼影区域的连通区域进行目标识别,并提取出第一前景目标掩膜和第二前景目标掩膜;
判断模块304,用于根据第一前景目标掩膜和第二前景目标掩膜,判断每一像素点属于背景像素点还是前景像素点,若该像素点与第一前景目标掩膜的最短距离大于第一阈值且与第二前景目标掩膜的距离大于第二阈值,则将该像素点确定为需要更新的背景像素点;
检验模块305,用于对需要更新的背景像素点进行二次检验,如果需要更新的背景像素点在所述鬼影区域内且该需要更新的背景像素点与标定边界的距离小于第三阈值,则不更新该像素点,否则,更新该像素点。
在本发明的一个实施例中,前景确定模块301具体用于比较所述深度图上的像素点的深度值与背景深度均值,如果像素点的深度值小于背景深度均值,则确定为疑似前景区域的像素点;找出并标记疑似前景区域中的各连通区域。
在本发明的一个实施例中,鬼影判断模块302具体用于统计连通区域内深度差值的绝对值Delta_Depth_i_j小于T0的像素点P_i_j的个数S_Depth_i和红外能量差值的绝对值Delta_IR_i_j小于T2的像素点P_i_j的个数S_IR_i;对于每个连通区域,如果S_Depth_i大于或等于第一个数阈值T1*N_i且S_IR_i大于或等于第二个数阈值T3*N_i,则确定该连通区域为鬼影区域,其中,i为连通区域的标号,N_i为连通区域轮廓上像素点的个数。
在本发明的一个实施例中,鬼影判断模块302具体通过下列步骤计算得到连通区域内深度差值的绝对值Delta_Depth_i_j和红外能量差值的绝对值Delta_IR_i_j:
对各连通区域进行轮廓提取,获取边缘轮廓Countour_i以及轮廓上像素点个数N_i;对各轮廓像素点P_i_j计算该像素点处的梯度方向Direction_i_j,根据梯度方向Direction_i_j计算单位法线向量Norm_i_j,其中i为连通区域的标号,j为轮廓Countour_i上点的标号;根据梯度方向Direction_i_j和单位法线向量Norm_i_j计算像素点P_i_j左右两侧的像素点P_i_j_1和P_i_j_2,其中,P_i_j_1=P_i_j+Dist*Norm_i_j,P_i_j_2=P_i_j-Dist*Norm_i_j;得到像素点P_i_j_1和P_i_j_2后计算P_i_j_1和P_i_j_2的深度差值的绝对值Delta_Depth_i_j和红外能量差值的绝对值Delta_IR_i_j。
在本发明的一个实施例中,目标识别模块具体用于对不是鬼影区域的连通区域进行目标识别,将连通区域分类为人手掩膜与物体掩膜,分别进行追踪并分析物体的运动状态。
在本发明的一个实施例中,图3所示装置还包括静止物体更新模块,用于根据运动物体静止的第一帧,初始化对应层的对应像素点的背景模型;将背景模型中的像素点的深度以及红外均值分别设置为当前帧的像素点的深度以及红外瞬时值,将背景模型中像素点的深度以及红外方差分别设置为继承前一帧该像素点顶层背景的深度和红外方差,并记录新建层为对应像素点的新顶层;以及,根据静止物体开始运动的第一帧,将对应层的对应像素点的背景模型清除,并自高层至低层搜索该像素点的背景模型,找到第一个有效的背景层,将该层记录为该像素点的新的顶层。
所述静止物体更新模块,用于在物体持续静止的过程中,如果像素点对应的位置上的物***于背景模型的顶层且该像素点与手掩膜的距离大于第四阈值,则更新该像素点。
需要说明的是,这里的更新该像素点包括:对于每层的每个像素点,按照下列公式更新均值和方差:
均值更新公式:meani+1=(1-l)×meani+l×valuei+1,;
方差更新公式:vari+1=(1-l)×vari+l×(valuei+1-meani)2
其中,i表示帧号,l表示学习率,0<=l<=1。
关于图3所示装置中的各模块所执行的各功能的举例解释说明,与前述方法实施例中的举例解释说明一致,这里不再一一赘述。
图4是本发明一个实施例的电子设备的结构示意图。如图4所示,该电子设备包括存储器401和处理器402,存储器401和处理器402之间通过内部总线403通讯连接,存储器401存储有能够被处理器402执行的程序指令,程序指令被处理器402执行时能够实现上述的背景建模和前景提取方法。
此外,上述的存储器401中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本发明的另一个实施例提供一种计算机可读存储介质,计算机可读存储介质存储计算机指令,计算机指令使所述计算机执行上述的方法。
本领域内的技术人员应明白,本发明的实施例可提供为方法、***、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图的一个流程或多个流程和/或方框图的一个方框或多个方框中指定的功能的装置。
需要说明的是术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本发明的说明书中,说明了大量具体细节。然而能够理解的是,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。类似地,应当理解,为了精简本发明公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释呈反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
以上所述,仅为本发明的具体实施方式,在本发明的上述教导下,本领域技术人员可以在上述实施例的基础上进行其他的改进或变形。本领域技术人员应该明白,上述的具体描述只是更好的解释本发明的目的,本发明的保护范围以权利要求的保护范围为准。
Claims (10)
1.一种图像背景建模和前景提取方法,其特征在于,包括:
初始化多层深度背景模型,对输入的一帧深度图进行背景减除和连通区域分析;
对各连通区域判断是否为鬼影区域,对不是鬼影区域的连通区域进行目标识别,并提取出第一前景目标掩膜和第二前景目标掩膜;
根据第一前景目标掩膜和第二前景目标掩膜,判断每一像素点属于背景像素点还是前景像素点,若该像素点与第一前景目标掩膜的最短欧式距离大于第一阈值且与第二前景目标掩膜的欧式距离大于第二阈值,则将该像素点确定为需要更新的背景像素点;
如果需要更新的背景像素点与标定边界的距离小于第三阈值,则不更新该像素点,否则,更新该像素点。
2.根据权利要求1所述的方法,其特征在于,对输入的一帧深度图进行背景减除和连通区域分析包括:
比较所述深度图上的像素点的深度值与背景深度均值,如果像素点的深度值小于背景深度均值,则确定为疑似前景区域的像素点,其中所述背景深度均值为该像素点最底层背景高斯模型中的深度均值;
找出并标记疑似前景区域中的各连通区域。
3.根据权利要求2所述的方法,其特征在于,对各连通区域判断是否为鬼影区域包括:
统计连通区域内深度差值的绝对值小于T0的像素点的个数和红外能量差值的绝对值小于T2的像素点的个数;
对于每个连通区域,如果红外能量差值的绝对值小于T2的像素点的个数大于或等于第一个数阈值且深度差值的绝对值小于T0的像素点的个数大于或等于第二个数阈值,则确定该连通区域为鬼影区域。
4.根据权利要求3所述的方法,其特征在于,所述连通区域内深度差值的绝对值和红外能量差值的绝对值通过下列步骤计算得到:
对各连通区域进行轮廓提取,获取边缘轮廓以及轮廓上像素点个数;
对各轮廓像素点计算该像素点处的梯度方向,根据梯度方向计算单位法线向量;
根据单位法线向量计算像素点左右两侧的像素点;
得到像素点左右两侧的像素点后,分别计算左右两侧的像素点的深度差值的绝对值和红外能量差值的绝对值。
5.根据权利要求1所述的方法,其特征在于,该方法还包括:
对不是鬼影区域的的连通区域进行目标识别,将连通区域分类为人手掩膜与物体掩膜,分别进行追踪并分析物体的运动状态。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
根据运动物体静止的第一帧,初始化对应层的对应像素点的背景模型;
将背景模型中的像素点的深度以及红外均值分别设置为当前帧的像素点的深度以及红外瞬时值,将背景模型中像素点的深度以及红外方差分别设置为继承前一帧该像素点顶层背景的深度和红外方差,并记录初始化的对应层为对应像素点的新顶层;
以及,根据静止物体开始运动的第一帧,将对应层的对应像素点的背景模型清除,并自高层至低层搜索该像素点的背景模型,找到第一个有效的背景层,将该层记录为该像素点的新的顶层,其中,有效的背景层是初始化后尚未清除的背景层。
7.根据权利要求6所述的方法,其特征在于,该方法还包括:在物体持续静止的过程中,如果像素点对应的位置上的物***于背景模型的顶层且该像素点与手掩膜的距离大于第四阈值,则更新该像素点。
8.根据权利要求1所述的方法,其特征在于,更新该像素点包括:对于每层的每个像素点,按照下列公式更新均值和方差:
均值更新公式:meani+1=(1-l)×meani+l×valuei+1;
方差更新公式:vari+1=(1-l)×vari+l×(valuei+1-meani)2
其中,i表示帧号,l表示学习率,0<=l<=1。
9.一种图像背景建模和前景提取装置,其特征在于,包括:
前景确定模块,用于初始化多层深度背景模型,对输入的一帧深度图进行背景减除和连通区域分析;
鬼影判断模块,用于对各连通区域判断是否为鬼影区域;
目标识别模块,用于对不是鬼影区域的连通区域进行目标识别,并提取出第一前景目标掩膜和第二前景目标掩膜;
判断模块,用于根据第一前景目标掩膜和第二前景目标掩膜,判断每一像素点属于背景像素点还是前景像素点,若该像素点与第一前景目标掩膜的最短欧式距离大于第一阈值且与第二前景目标掩膜的欧式距离大于第二阈值,则将该像素点确定为需要更新的背景像素点;
检验模块,用于如果需要更新的背景像素点与标定边界的距离小于第三阈值,则不更新该像素点,否则,更新该像素点。
10.一种电子设备,其特征在于,所述电子设备包括:存储器和处理器,所述存储器和所述处理器之间通过内部总线通讯连接,所述存储器存储有能够被所述处理器执行的程序指令,所述程序指令被所述处理器执行时能够实现权利要求1-8任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811479167.5A CN109658433B (zh) | 2018-12-05 | 2018-12-05 | 图像背景建模和前景提取方法、装置和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811479167.5A CN109658433B (zh) | 2018-12-05 | 2018-12-05 | 图像背景建模和前景提取方法、装置和电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109658433A true CN109658433A (zh) | 2019-04-19 |
CN109658433B CN109658433B (zh) | 2020-08-28 |
Family
ID=66111857
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811479167.5A Active CN109658433B (zh) | 2018-12-05 | 2018-12-05 | 图像背景建模和前景提取方法、装置和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109658433B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110415351A (zh) * | 2019-06-21 | 2019-11-05 | 北京迈格威科技有限公司 | 基于单张图像构建三维网格的方法、装置和*** |
CN110889890A (zh) * | 2019-11-29 | 2020-03-17 | 深圳市商汤科技有限公司 | 图像处理方法及装置、处理器、电子设备及存储介质 |
CN110969642A (zh) * | 2019-12-19 | 2020-04-07 | 深圳云天励飞技术有限公司 | 视频过滤方法、装置、电子设备及存储介质 |
CN111932576A (zh) * | 2020-07-15 | 2020-11-13 | 中国科学院上海微***与信息技术研究所 | 一种基于深度相机的物体边界测量方法和装置 |
CN112084880A (zh) * | 2020-08-14 | 2020-12-15 | 江铃汽车股份有限公司 | 一种图像处理方法、装置、存储介质及设备 |
CN112446843A (zh) * | 2019-08-28 | 2021-03-05 | 深圳市光鉴科技有限公司 | 基于多深度图的图像重建方法、***、设备及介质 |
CN112819854A (zh) * | 2021-02-02 | 2021-05-18 | 歌尔光学科技有限公司 | 鬼影检测方法、鬼影检测装置和可读存储介质 |
CN117124587A (zh) * | 2023-01-12 | 2023-11-28 | 珠海视熙科技有限公司 | 基于深度图像的背景建模方法及装置、介质、计算设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102855459A (zh) * | 2011-06-30 | 2013-01-02 | 株式会社理光 | 用于特定前景物体的检测验证的方法和*** |
CN105005992A (zh) * | 2015-07-07 | 2015-10-28 | 南京华捷艾米软件科技有限公司 | 一种基于深度图的背景建模和前景提取的方法 |
CN107767404A (zh) * | 2017-06-23 | 2018-03-06 | 北京理工大学 | 一种基于改进ViBe背景模型的遥感图像序列动目标检测方法 |
-
2018
- 2018-12-05 CN CN201811479167.5A patent/CN109658433B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102855459A (zh) * | 2011-06-30 | 2013-01-02 | 株式会社理光 | 用于特定前景物体的检测验证的方法和*** |
CN105005992A (zh) * | 2015-07-07 | 2015-10-28 | 南京华捷艾米软件科技有限公司 | 一种基于深度图的背景建模和前景提取的方法 |
CN107767404A (zh) * | 2017-06-23 | 2018-03-06 | 北京理工大学 | 一种基于改进ViBe背景模型的遥感图像序列动目标检测方法 |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110415351A (zh) * | 2019-06-21 | 2019-11-05 | 北京迈格威科技有限公司 | 基于单张图像构建三维网格的方法、装置和*** |
CN110415351B (zh) * | 2019-06-21 | 2023-10-10 | 北京迈格威科技有限公司 | 基于单张图像构建三维网格的方法、装置和*** |
CN112446843A (zh) * | 2019-08-28 | 2021-03-05 | 深圳市光鉴科技有限公司 | 基于多深度图的图像重建方法、***、设备及介质 |
CN110889890A (zh) * | 2019-11-29 | 2020-03-17 | 深圳市商汤科技有限公司 | 图像处理方法及装置、处理器、电子设备及存储介质 |
CN110889890B (zh) * | 2019-11-29 | 2023-07-28 | 深圳市商汤科技有限公司 | 图像处理方法及装置、处理器、电子设备及存储介质 |
CN110969642A (zh) * | 2019-12-19 | 2020-04-07 | 深圳云天励飞技术有限公司 | 视频过滤方法、装置、电子设备及存储介质 |
CN110969642B (zh) * | 2019-12-19 | 2023-10-10 | 深圳云天励飞技术有限公司 | 视频过滤方法、装置、电子设备及存储介质 |
CN111932576A (zh) * | 2020-07-15 | 2020-11-13 | 中国科学院上海微***与信息技术研究所 | 一种基于深度相机的物体边界测量方法和装置 |
CN111932576B (zh) * | 2020-07-15 | 2023-10-31 | 中国科学院上海微***与信息技术研究所 | 一种基于深度相机的物体边界测量方法和装置 |
CN112084880A (zh) * | 2020-08-14 | 2020-12-15 | 江铃汽车股份有限公司 | 一种图像处理方法、装置、存储介质及设备 |
CN112819854A (zh) * | 2021-02-02 | 2021-05-18 | 歌尔光学科技有限公司 | 鬼影检测方法、鬼影检测装置和可读存储介质 |
CN117124587A (zh) * | 2023-01-12 | 2023-11-28 | 珠海视熙科技有限公司 | 基于深度图像的背景建模方法及装置、介质、计算设备 |
Also Published As
Publication number | Publication date |
---|---|
CN109658433B (zh) | 2020-08-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109658433A (zh) | 图像背景建模和前景提取方法、装置和电子设备 | |
CN105005992B (zh) | 一种基于深度图的背景建模和前景提取的方法 | |
Zhu et al. | RGB-D local implicit function for depth completion of transparent objects | |
CN108717531B (zh) | 基于Faster R-CNN的人体姿态估计方法 | |
KR101877711B1 (ko) | 얼굴 트랙킹 장치 및 방법 | |
CN102591459B (zh) | 姿势状态分类 | |
CN103716687B (zh) | 使用指纹以在视频中追踪移动对象的***和方法 | |
US11037325B2 (en) | Information processing apparatus and method of controlling the same | |
US20180322367A1 (en) | Image processing method, non-transitory computer readable storage medium and image processing system | |
WO2016153697A1 (en) | Multi-layer skin detection and fused hand pose matching | |
US20220222849A1 (en) | Pose Tracking Method, Pose Tracking Device and Electronic Device | |
CN113689503B (zh) | 目标对象的姿态检测方法、装置、设备及存储介质 | |
CN111886600A (zh) | 一种用于图像的实例级别分割的设备和方法 | |
US20220237908A1 (en) | Flight mission learning using synthetic three-dimensional (3d) modeling and simulation | |
JP2021060868A5 (zh) | ||
CN107886110A (zh) | 人脸检测方法、装置及电子设备 | |
CN113610966A (zh) | 三维姿态调整的方法、装置、电子设备及存储介质 | |
CN116643291A (zh) | 一种视觉与激光雷达联合剔除动态目标的slam方法 | |
Belghit et al. | Tracking color marker using projective transformation for augmented reality application | |
CN105590115A (zh) | 视角不变的人体特征表示方法 | |
Srikakulapu et al. | Depth estimation from single image using defocus and texture cues | |
CN104574435A (zh) | 基于块聚类的运动相机前景分割方法 | |
CN114022567A (zh) | 位姿跟踪方法、装置、电子设备及存储介质 | |
Wang et al. | An approach for construct semantic map with scene classification and object semantic segmentation | |
CN108876849B (zh) | 基于辅助标识的深度学习目标识别及定位方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |