CN113344997A

CN113344997A - 快速获取只含有目标对象的高清前景图的方法及***

Info

Publication number: CN113344997A
Application number: CN202110655267.4A
Authority: CN
Inventors: 陈冠宇; 王磊; 王飞
Original assignee: Shanxi Fangtian Shenghua Digital Technology Co ltd
Current assignee: Fangtian Shenghua Beijing Digital Technology Co ltd
Priority date: 2021-06-11
Filing date: 2021-06-11
Publication date: 2021-09-03
Anticipated expiration: 2041-06-11
Also published as: CN113344997B

Abstract

一种快速获取只含有目标对象的高清前景图的方法及***，通过优化深度神经网络模型获取损失率极小的深度图，并在深度图上进行层面深度截取、轮廓边缘计算和目标轮廓提取得到的只含有目标对象的高清前景图，所述目标对象不仅能够包括游客，还能将游客的随身携带的物品以及影子等信息得到完美保留，保证前景与背景合并等的后续处理不会出现失真。若将只含有目标对象的前景图与背景图合成，便能得到屏蔽非目标前景的高清图片。解决在景区或网红打卡地或任何拍照场所拍照时，会将其他路人、游客等非目标对象照进图像，不能在短时间内获得只含有指定目标对象的高清图片的问题。

Description

快速获取只含有目标对象的高清前景图的方法及***

技术领域

本发明涉及图像实时处理技术领域，特别是一种快速获取只含有目标对象的高清前景图的方法及***。

背景技术

在某些场所如景区或网红打卡地拍照时，往往会因为存在大量的游客而无法得到只包含指定对象全部信息的目标照片，进而无法独享美景。目前常用的解决办法是后期通过制图软件将路人等非目标对象去除，这样带来的时间和人力成本大大提升。

发明内容

本发明提供一种快速获取只含有目标对象的高清前景图的方法及***，通过优化神经网络模型获取损失率极小的深度图，并在深度图上进行层面深度截取、轮廓边缘计算和目标轮廓提取，得到只含有目标对象的高清前景图，目标对象不仅能够包括游客，还能将游客的随身携带的物品以及影子等信息得到完美保留，保证前景与背景合并等的后续处理不会出现失真。

本发明技术方案如下：

一种快速获取只含有目标对象的高清前景图的方法，其特征在于，包括如下步骤：

S1，获取在同一时刻拍摄并存在视差的目标处理图片和辅助处理图片；

S2，将所述目标处理图片和辅助处理图片直接输入优化深度神经网络模型，获取所述目标处理图片与所述辅助处理图片的视差信息，进而得到所述目标处理图片的深度图；

S3，根据所述目标对象所在的最大景深层面和最小景深层面，在所述深度图截取前景层面深度图；

S4，在所述前景层面深度图，进行轮廓边缘计算，获取其内的所有前景轮廓，得到前景轮廓深度图；

S5，对所述前景轮廓深度图进行目标轮廓提取，得到目标对象的目标前景轮廓，所述目标前景轮廓所包含的像素点集对应的所述目标处理图片的像素点集，即为只含有目标对象的高清前景图。

作为优选，所述目标对象包括目标物体以及与目标物体直接接触的所有物体。

作为优选，所述S3中，根据目标对象与摄像机镜头之间的最小距离和最大距离，截取目标对象在所述深度图所占据的层面深度，得到前景层面深度图；

作为优选，所述S4中，所述轮廓边缘计算包括识别所述前景深度层面图中的所有特征点集并将每个特征点集的边缘计算出来，得到前景深度图上的所有特征点集的轮廓，每个特征点集即为一个前景轮廓。

作为优选，所述S5中，所述目标轮廓提取包括根据目标对象占据面积和/或指目标对象所在的区域景深，在所述前景轮廓深度图的所有特征点集的轮廓中提取出目标对象的前景轮廓。

作为优选，所述S1中，所述目标处理图片和辅助处理图片包括双目摄像机拍摄的双目图片，或经过预处理的所述双目摄像机拍摄的双目图片，或多个存在视差的摄像机拍摄的图片，或对多个存在视差的摄像机拍摄的图像经过预处理后得到的图片。

作为优选，所述预处理包括图片矫正，所述图片矫正包括轮廓检测矫正和/或旋转角度矫正和/或图像匹配的对应相似处连线矫正和/或灰度矫正和/或二值化矫正和/或直方图均衡化矫正。

作为优选，所述优化深度神经网络模型经过多次训练并测试得到，包括如下步骤：

S2.1，将所述目标处理图片和辅助处理图片的数据拼合为同一图片的不同部分，得到特征提取原图；

S2.2，对所述特征提取原图进行若干次二维卷积和池化运算，得到第一特征数据集；所述第一特征数据集并未将目标处理图片和辅助处理图片的数据信息进行关联，仅仅是简单的拼合；

S2.3，将所述第一特征数据集经残差网络运算和空间金字塔池化运算，提取由高到低多个分辨率等级下的第二特征数据集；每个分辨率等级均对应一个所述第二特征数据集；

S2.4，将每个所述第二特征数据集中的分属于目标处理图片和辅助处理图片的数据信息进行对称融合和归一化处理，，得到一组第三特征数据集；

S2.5，将每个所述第三特征数据集进行三维卷积，得到一组初始深度图；

S2.6，将所述初始深度图分别与真实标定的深度图进行比对，计算所述初始深度图的损失函数；

S2.7，将大量的不同时刻拍摄的原始图像组的特征提取原图重复步骤S2.2-S2.6，通过反向传播不断优化网络权重值，得到尽可能小的损失函数值L；得到优化深度神经网络模型。

作为优选，所述S2.6中，所述损失函数值L＝ΣAkLk(k＝1,2,3,4……)，Lk代表每个分辨率下初始深度图的损失，其中，L1代表最高分辨率下初始深度图的损失，L2、L3……代表分辨率依次减小的初始深度图的损失，Ak代表损失系数,是固定常数，且Ak>Ak+1。

一种快速获取只含有目标对象的高清前景图的***，包括深度图获取模块、前景层面深度图获取模块、前景轮廓深度图获取模块和目标前景图获取模块；所述深度图获取模块内设有深度神经网络模型；所述深度图获取模块将输入的目标处理图片和辅助处理图片通过深度神经网络模型处理后得到深度图，所述深度图依次经过前景层面深度图获取模块、前景轮廓深度图获取模块和目标前景图获取模块处理后得到高清目标前景图。

作为优选，所述前景层面深度图获取模块，根据目标对象所占据的最大景深层面和最小景深层面，对输入的深度图进行处理，截取所述最大景深层面和最小景深层面之间的深度点集，得到前景层面深度图；所述前景轮廓深度图获取模块，对输入的前景层面深度图进行轮廓边缘计算，将其内的所有前景轮廓标定并划分，得到前景轮廓深度图；所述目标前景图获取模块，将输入的前景轮廓深度图进行目标轮廓提取，得到目标前景轮廓所述目标前景轮廓所包含的像素点集对应的所述目标处理图片的像素点集，即为高清目标前景图；

作为优选，所述深度图获取模块还包括神经网络模型训练分模块；所述神经网络模型训练分模块包括训练集输入子模块、特征提取子模块、特征融合子模块、深度计算子模块、深度信息比对子模块和损失函数调整子模块；所述训练集输入子模块将所述目标处理图片和辅助处理图片的数据拼合为同一图像的不同部分，得到特征提取原图；所述特征提取子模块将所述特征提取原图送入卷积层和池化层进行二维卷积和池化运算，得到第一特征数据集；并将所述第一特征数据集经残差网络运算和空间金字塔池化运算，提取由高到低多个分辨率等级下的第二特征数据集；每个分辨率等级均对应一个所述第二特征数据集；所述特征融合子模块将每个所述第二特征数据集中的分属于目标处理图片的数据信息与其内分属于辅助处理图片的数据信息进行特征融合和归一化处理，将每个所述第二特征数据集中分属于目标处理图片和辅助处理图片的数据信息进行关联，得到一组第三特征数据集；所述深度计算子模块将每个所述第三特征数据集进行三维卷积，得到一组初始深度图；所述深度信息比对子模块将每个初始深度图分别与真实标定的深度图进行比对，得到损失函数；所述损失函数调整子模块根据大量原始图像组最终计算得到的损失函数，通过反向传播不断优化网络权重值，得到尽可能小的损失函数值L；得到经过深度神经网络模型。

本发明相对于现有技术优势在于：本发明所述快速获取只含有目标对象的高清前景图的方法，通过优化深度神经网络模型获取损失率极小的深度图，并在深度图上进行层面深度截取、轮廓边缘计算和目标轮廓提取得到的只含有目标对象的高清前景图，所述目标对象不仅能够包括游客，还能将游客的随身携带的物品以及影子等信息得到完美保留，保证前景与背景合并等的后续处理不会出现失真。若将只含有目标对象的前景图与背景图合成，便能得到屏蔽非目标前景的高清图片。解决在景区或网红打卡地或任何拍照场所拍照时，会将其他路人、游客等非目标对象照进图像，不能在短时间内获得只含有指定目标对象的高清图片的问题。

附图说明

图1是本发明所述快速获取只含有目标对象的高清前景图的方法的流程图；

图2是本发明所述快速获取只含有目标对象的高清前景图的方法的优化深度神经网络模型的工作流程图；

图3是本发明所述快速获取只含有目标对象的高清前景图的方法的特征提取以及特征融合过程的举例示意图；

图4是本发明所述快速获取只含有目标对象的高清前景图的方法的深度深度计算过程的举例示意图；

图5是本发明所述快速获取只含有目标对象的高清前景图的***的模块化框图。

具体实施方式

为了便于理解本发明，下面结合附图1-4和具体实施例，对本发明进行更详细的说明。

实施例1

一种快速获取只含有目标对象的高清前景图的方法，其流程图如图1所示，包括如下步骤：

S1，获取在同一时刻拍摄并存在视差的目标处理图片和辅助处理图片，所述目标处理图片和辅助处理图片通过双目摄像机实时拍摄；也可通过多个存在视差的摄像机拍摄后任取同一时刻拍摄并存在视差的两张图片作为目标处理图片和辅助处理图片，也可通过双目摄像机或多个存在视差的摄像机拍摄的图片经过预处理后得到，其中，必然含有目标对象。所述预处理包括图片矫正，所述图片矫正包括轮廓检测矫正和/或旋转角度矫正和/或图像匹配的对应相似处连线矫正和/或灰度矫正和/或二值化矫正和/或直方图均衡化矫正。

所述目标对像包括目标物体以及与目标物体直接接触的所有物体。可以为在景区进行拍照的游客，也可为游客以及与游客相接触的所有物体，如其配饰、影子等。

S2，将所述目标处理图片与所述辅助处理图片输入优化深度神经网络模型，获取所述目标处理图片与所述辅助处理图片的视差信息，进而得到所述目标处理图片的深度图；所述深度图的每一个像素值均表示场景中某点与摄像机的距离。

S3，根据目标对象与摄像机镜头之间的最小距离和最大距离，确定所述目标对象所占据的最大景深和最小景深，进而得到最大景深层面和最小景深层面，在所述深度图截取并保留最大景深层面和最小景深层面之间的像素点集，得到前景层面深度图；此时，目标对象可以包括指定游客甲以及该指定游客甲的影子，甚至与该游客甲直接接触的友人乙等。所述最大景深层面是指距离摄像机最远的一个属于所述目标对象的像素点所在的距离层面，所述最小景深层面是指距离摄像机最近的一个属于所述目标对象的像素点所在的距离层面。所述前景层面深度图包含最大景深层面和最小景深层面之间的所有深度点集。

S4，在所述前景层面深度图，进行轮廓边缘计算，获取其内的所有前景轮廓，得到前景轮廓深度图；所述轮廓边缘计算包括识别所述前景层面深度图中的所有特征点集并将每个特征点集的边缘计算出来，得到前景深度图上的所有特征点集的轮廓。该特征点集即为在拍摄范围内的所有游客和/或路人和/或短时间内停留的非背景物体在前景深度图中留下的像素点集。

S5，在所述前景轮廓深度图，根据目标对象所占据面积和/或目标对象所在的区域景深，提取出出目标对象的目标前景轮廓，所述目标前景轮廓所包含的像素点集对应的所述目标处理图片的像素点集，即为只含有目标对象的高清前景图，所述高清目标前景图，将非目标对象的前景完全屏蔽；所述目标前景轮廓只含有目标对象轮廓；当游客甲没有其他人与其接触时，目标对象可以为游客甲以及与其相接触的配饰(如挎包、手机等)、影子等的轮廓。目标对象也可以同时包括友人乙，当然，如果友人乙接触到指定游客甲，则甲与乙均为同时作为目标对象，只需要进行一次目标轮廓提取，所述目标轮廓提取包括根据指定目标对象占据面积和/或指定目标对象所在的中心区域景深，在所述前景轮廓深度图的所有特征点集的轮廓中提取指定目标对象的轮廓。该提取过程中仅保留目标前景，如指定游客及与其相接触的影子、配饰等。如果友人乙没有接触到指定游客甲，可经过两次目标轮廓提取或改变目标轮廓提取方法，进行一次目标轮廓提取即可得到的只含有目标对象的高清目标前景图，解决在景区或网红打卡地或任何拍照场所拍照时，会将其他路人、游客等非目标对象照进图像，不能在短时间内获得只含有指定目标对象的高清图片的问题。且通过轮廓边缘计算和目标轮廓提取得到的目标前景轮廓，不仅包括指定目标对象的轮廓，还包括与指定目标对象相接触所有前景物体的轮廓，比如某位或某些目标拍摄者的影子和/或身上佩戴的各种物品，特别是目标拍摄者的影子，能够最大程度上保证只含有目标前景的前景图与背景图合成后，不会使屏蔽非目标前景的高清图片失真。

优选地，所述步骤S2中优化深度神经网络模型经过多次训练并测试得到，其流程图如图2所示，包括如下步骤：

S2.2，如图3所示，对所述特征提取原图送入卷积层和池化层进行进行二维卷积和池化运算，得到第一特征数据集；所述第一特征数据集并未将目标处理图片和辅助处理图片的数据信息进行关联，仅仅是简单的拼合；

S2.3，将所述第一特征数据集经残差网络层进行残差网络运算、经空间金字塔池化层进行空间金字塔池化运算，提取由高到低4个分辨率下的一组第二特征数据集；每个分辨率下均有一个第二特征数据集。

S2.4，将每个所述第二特征数据集中的分属于目标处理图片的数据信息分别与其他第二特征数据集中分属于目标处理图片和辅助处理图片的数据信息进行对称融合和归一化处理，得到一组第三特征数据集；

S2.5，如图4所示，将每个所述第三特征数据集进行三维卷积，也即为进行深度计算，得到一组初始深度图；

S2.6，将所述初始深度图分别与真实标定的深度图进行比对，计算所述初始深度图的损失函数；损失函数L＝A₁L₁+A₂L₂+A₃L₃+A₄L₄，，L₁代表最高分辨率下初始深度图的损失，L₂、L₃……代表分辨率依次减小的初始深度图的损失，A_k代表损失系数,是固定常数，且A₁>A₂>A₃>A₄；所述真实标定的深度图可以为通过摄像机的镜头与其所在位置等相关信息，计算出来的景深信息图；也可为人为在真实地点进行提前标定后输入的深度信息。

S2.7，将大量的不同时刻拍摄的原始图像组的特征提取原图重复步骤S2.2-S2.6，根据获得的各个损失函数，通过反向传播不断优化网络权重值，优化网络权重值包括调整S2.2中的二维卷积和S2.5中的三维卷积参数，优化损失函数L值，使其值最小；得到优化深度神经网络模型。

实施例2

一种快速获取只含有目标对象的高清前景图的***，其模块化框图如图5所示，包括深度图获取模块、前景层面深度图获取模块、前景轮廓深度图获取模块和目标前景图获取模块；所述深度图获取模块内设有深度神经网络模型；所述深度图获取模块将输入的目标处理图片和辅助处理图片通过深度神经网络模型进行处理，获取其视差信息，进而得到目标处理图片的深度图。

所述深度图依次经过前景层面深度图获取模块、前景轮廓深度图获取模块和目标前景图获取模块处理后得到高清目标前景图。

作为优选，所述前景层面深度图获取模块，根据目标对象与摄像机之间的最小距离和最大距离，截取目标对象所占据的最大景深层面和最小景深层面，在所述深度图截取前景层面深度图；所述前景层面深度图包含最大景深层面和最小景深层面之间的所有深度点集。所述最大景深层面是指距离摄像机最远的一个属于所述目标对象的像素点所在的距离层面，所述最小景深层面是指距离摄像机最近的一个属于所述目标对象的像素点所在的距离层面。

所述前景轮廓深度图获取模块，对输入的前景层面深度图进行轮廓边缘计算，将其内的所有前景轮廓标定并划分，得到前景轮廓深度图。所述目标前景图获取模块，将输入的前景轮廓深度图进行目标轮廓提取，得到目标前景轮廓所述目标前景轮廓所包含的像素点集对应的所述目标处理图片的像素点集，即为高清目标前景图；所述高清目标前景图，将非目标对象的前景完全屏蔽。

应当指出，以上所述具体实施方式可以使本领域的技术人员更全面地理解本发明，但不以任何方式限制本发明。因此，尽管本说明书参照附图和实施例对本发明已进行了详细的说明，但是，本领域技术人员应当理解，仍然可以对本发明进行修改或者等同替换，总之，一切不脱离本发明的精神和范围的技术方案及其改变，其均应涵盖在本发明专利的保护范围当中。

Claims

1.一种快速获取只含有目标对象的高清前景图的方法，其特征在于，包括如下步骤：

2.根据权利要求1所述快速获取只含有目标对象的高清前景图的方法，其特征在于，所述目标对象包括目标物体以及与目标物体直接接触的所有物体。

3.根据权利要求1所述快速获取只含有目标对象的高清前景图的方法，其特征在于，所述S3中，根据目标对象与摄像机镜头之间的最小距离和最大距离，截取目标对象在所述深度图所占据的层面深度，得到前景层面深度图。

4.根据权利要求1所述快速获取只含有目标对象的高清前景图的方法，其特征在于，所述S4中，所述轮廓边缘计算包括识别所述前景深度层面图中的所有特征点集并将每个特征点集的边缘计算出来，得到前景深度图上的所有特征点集的轮廓，每个特征点集即为一个前景轮廓；和/或

所述S5中，所述目标轮廓提取包括根据目标对象占据面积和/或指目标对象所在的区域景深，在所述前景轮廓深度图的所有特征点集的轮廓中提取出目标对象的前景轮廓。

5.根据权利要求1所述快速获取只含有目标对象的高清前景图的方法，其特征在于，所述S1中，所述目标处理图片和辅助处理图片包括双目摄像机拍摄的双目图片，或经过预处理的所述双目摄像机拍摄的双目图片，或多个存在视差的摄像机拍摄的图片，或对多个存在视差的摄像机拍摄的图像经过预处理后得到的图片。

6.根据权利要求1所述快速获取只含有目标对象的高清前景图的方法，其特征在于，所述优化深度神经网络模型经过多次训练并测试得到，包括如下步骤：

S2.7，将大量的不同特征提取原图重复步骤S2.2-S2.6，通过反向传播不断优化网络权重值，得到尽可能小的损失函数值L；得到优化深度神经网络模型。

7.根据权利要求6所述快速获取只含有目标对象的高清前景图的方法，其特征在于，所述S2.6中，所述损失函数L＝ΣA_kL_k(k＝1,2,3,4……)，L_k代表每个分辨率下初始深度图的损失，其中，L₁代表最高分辨率下初始深度图的损失，L₂、L₃……代表分辨率依次减小的初始深度图的损失，A_k代表损失系数,是固定常数，且A_k>A_k+1。

8.一种快速获取只含有目标对象的高清前景图的***，其特征在于，包括深度图获取模块、前景层面深度图获取模块、前景轮廓深度图获取模块和目标前景图获取模块；所述深度图获取模块内设有深度神经网络模型；所述深度图获取模块将输入的目标处理图片和辅助处理图片通过深度神经网络模型处理后得到深度图，所述深度图依次经过前景层面深度图获取模块、前景轮廓深度图获取模块和目标前景图获取模块处理后得到高清目标前景图。

9.根据权利要求8所述快速获取只含有目标对象的高清前景图的***，其特征在于，所述前景层面深度图获取模块，根据目标对象所占据的最大景深层面和最小景深层面，对输入的深度图进行处理，截取所述最大景深层面和最小景深层面之间的深度点集，得到前景层面深度图；所述前景轮廓深度图获取模块，对输入的前景层面深度图进行轮廓边缘计算，将其内的所有前景轮廓标定并划分，得到前景轮廓深度图；所述目标前景图获取模块，将输入的前景轮廓深度图进行目标轮廓提取，得到目标前景轮廓所述目标前景轮廓所包含的像素点集对应的所述目标处理图片的像素点集，即为高清目标前景图。

10.根据权利要求8所述快速获取只含有目标对象的高清前景图的***，其特征在于，所述深度图获取模块还包括神经网络模型训练分模块；所述神经网络模型训练分模块包括训练集输入子模块、特征提取子模块、特征融合子模块、深度计算子模块、深度信息比对子模块和损失函数调整子模块；所述训练集输入子模块将所述目标处理图片和辅助处理图片的数据拼合为同一图像的不同部分，得到特征提取原图；所述特征提取子模块将所述特征提取原图送入卷积层和池化层进行二维卷积和池化运算，得到第一特征数据集；并将所述第一特征数据集经残差网络运算和空间金字塔池化运算，提取由高到低多个分辨率等级下的第二特征数据集；每个分辨率等级均对应一个所述第二特征数据集；所述特征融合子模块将每个所述第二特征数据集中的分属于目标处理图片的数据信息与其内分属于辅助处理图片的数据信息进行特征融合和归一化处理，将每个所述第二特征数据集中分属于目标处理图片和辅助处理图片的数据信息进行关联，得到一组第三特征数据集；所述深度计算子模块将每个所述第三特征数据集进行三维卷积，得到一组初始深度图；所述深度信息比对子模块将每个初始深度图分别与真实标定的深度图进行比对，得到损失函数；所述损失函数调整子模块根据大量原始图像组最终计算得到的损失函数，通过反向传播不断优化网络权重值，得到尽可能小的损失函数值L；得到经过深度神经网络模型。