CN114266894A - 一种图像分割方法、装置、电子设备及存储介质 - Google Patents
一种图像分割方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN114266894A CN114266894A CN202111582828.9A CN202111582828A CN114266894A CN 114266894 A CN114266894 A CN 114266894A CN 202111582828 A CN202111582828 A CN 202111582828A CN 114266894 A CN114266894 A CN 114266894A
- Authority
- CN
- China
- Prior art keywords
- noise
- characteristic
- image
- training
- convolution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
本申请提供了一种图像分割方法、装置、电子设备及存储介质,包括:将待分割图像输入特征提取网络的前两个第一卷积层依次进行卷积处理,获得特征提取网络的第二个卷积层输出的原始特征图;对原始特征图进行噪声分离得到初始噪声图,并对初始噪声图进行重构得到噪声分布图;根据噪声分布图和原始特征图中各像素点的特征值,计算得到各优化像素点的特征值;基于各优化像素点的特征值,生成优化特征图像;对优化特征图像进行人像分割,分割得到人像区域和背景区域,目的在于提高通过深度卷积神经网络进行图像分割时的精确度。
Description
技术领域
本申请涉及图像分割技术领域,具体而言,涉及一种图像分割方法、装置、电子设备及存储介质。
背景技术
现有技术中,借助于深度卷积神经网络强大的特征表达能力,这类方法在行人分割的公共数据集上取得了较好的性能。然而,行人分割的实际应用场景通常较为复杂,所拍摄的图像中除了行人之外,还会存在着变化多样的非相关目标和背景等干扰因素。这些干扰因素对于深度卷积神经网络而言是一种明显的噪声,导致通过深度卷积神经网络对人像图像中的行人进行分割时,所得分割结果的精确度低。
发明内容
有鉴于此,本申请的目的在于提供一种图像分割方法、装置、电子设备及存储介质,其目的在于提高图像分割时的精确度。
第一方面,本申请实施例提供一种图像分割方法,包括:将待分割图像输入特征提取网络的前两个第一卷积层依次进行卷积处理,获得特征提取网络的第二个卷积层输出的原始特征图;对原始特征图进行噪声分离得到初始噪声图,并对初始噪声图进行重构得到噪声分布图;根据噪声分布图和原始特征图中各像素点的特征值,计算得到各优化像素点的特征值;基于各优化像素点的特征值,生成优化特征图像;对优化特征图像进行人像分割,分割得到人像区域和背景区域。
优选地,对原始特征图进行噪声分离,得到初始噪声图,并对初始噪声图进行重构,得到噪声分布图的步骤,包括:将原始特征图输入噪声分离模型的多个依次连接的第一卷积模块进行噪声分离,获得最后一个第一卷积模块输出的初始噪声图;其中,噪声分离模型包括多个依次连接的第一卷积模块和一个第二卷积层;对初始噪声图进行边界填充后输入第二卷积层进行卷积处理,获得第二卷积层输出的噪声分布图;其中,噪声分布图的宽、高、通道维度与原始特征图的宽、高、通道维度相同。
优选地,每个第一卷积模块由一个第二卷积层、一个批归一化层和一个激活层串联组成,针对每个第一卷积模块,通过以下方式对输入该第一卷积模块的原始特征图进行噪声分离:第二卷积层对原始特征图进行卷积处理,并将卷积结果输出至批归一化层;批归一化层对卷积结果进行归一化,并将归一化结果输出至激活层;激活层将归一化结果中小于零的值进行置零,获得激活层输出的初始噪声图。
优选地,根据噪声分布图和原始特征图中各像素点的特征值,计算得到各优化像素点的特征值的步骤包括:确定原始特征图上每个第一像素点的特征值,以及确定噪声分布图上每个第二像素点的特征值;针对每两个空间位置相同的第一像素点和第二像素点,将第一像素点的特征值和第二像素点的特征值之间的差值,作为空间位置上的特征差值;针对每个空间位置,将空间位置上第一像素点的特征值和空间位置上的特征差值进行比较;选择第一像素点的特征值和特征差值之间的最大值,作为优化特征图中该空间位置上优化像素点的特征值。
优选地,通过以下方式进行训练以获得噪声分离模型:获取训练数据集,数据集中包括多个数据对,每个数据对包括训练特征图和训练特征图的标准噪声分布图;针对每个数据对,将训练特征图输入噪声学习模型中,获得训练噪声分布图;根据训练噪声分布图和对应的标准噪声分布图,计算L1范数损失值;根据L1范数损失值作为噪声学习模型的损失,对噪声学习模型的参数进行调整,以完成依据单个数据对对噪声分离模型的训练。
优选地,通过以下方式生成训练数据集:通过人工标注的方式去除多个训练样本中的非相关对象及背景,以获得多个去噪样本;分别对训练样本和去噪样本进行特征提取,获得训练特征图和去噪特征图;根据训练特征图与去噪特征图的差值,确定出标准噪声分布图;将训练特征图和对应的标准噪声分布图组成数据对作为训练数据。
优选地,通过以下方式训练得到目标分割模型对优化特征图像进行人像分割:获得多个训练样本对应的目标特征图像;针对每个目标特征图像,将该目标特征图像输入到分割学***均值,确定为图像交叉熵损失值;将图像交叉熵损失值作为分割学习模型的损失,来对分割学习模型的参数进行调整,以完成依据单个训练样本对分割模型的训练过程。
第二方面,本申请实施例还提供一种图像分割装置,包括:
特征提取模块,用于将待分割图像输入特征提取网络的前两个第一卷积层依次进行卷积处理,获得特征提取网络的第二个卷积层输出的原始特征图;
噪声分离模块,用于对原始特征图进行噪声分离得到初始噪声图,并对初始噪声图进行重构得到噪声分布图;
计算模块,用于根据噪声分布图和原始特征图中各像素点的特征值,计算得到各优化像素点的特征值;
生成模块,用于基于各优化像素点的特征值,生成优化特征图像;
分割模块,用于对优化特征图像进行人像分割,分割得到人像区域和背景区域。
第三方面,本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,存储器存储有处理器可执行的机器可读指令,当电子设备运行时,处理器与存储器之间通过总线通信,处理器执行机器可读指令,以执行如上图像分割方法的步骤。
第四方面,本申请实施例还提供一种计算机可读存储介质,存储介质上存储有计算机程序,计算机程序被处理器运行时执行如上图像分割方法的步骤。
本申请实施例提供的一种图像分割方法、装置及存储介质,通过对待分割图像进行特征提取以获得原始特征图,对原始特征图进行噪声分离重构后获得对应的噪声分布图,根据原始特征图的噪声分布图和原始特征图得到优化特征图像,基于优化特征图像进行人像分割以输出人像分割图像,对去噪后的图像进行识别,能够有效的避免噪声对人像分割精确度的影响,提升图像分割的精确度。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例所提供的一种图像分割方法的流程图;
图2为本申请实施例所提供的一种噪声分离模型的训练步骤的流程图;
图3为本申请实施例所提供的一种目标分割模型的训练步骤的流程图;
图4为本申请实施例所提供的一种噪声分离模型的结构示意图;
图5为本申请实施例所提供的一种人像分割图像的示意图;
图6为本申请实施例所提供的一种图像分割装置的结构示意图;
图7为本申请实施例所提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,应当理解,本申请中的附图仅起到说明和描述的目的,并不用于限定本申请的保护范围。另外,应当理解,示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应当理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本申请内容的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。
另外,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的全部其他实施例,都属于本申请保护的范围。
现有技术中,借助于深度卷积神经网络强大的特征表达能力,这类方法在行人分割的公共数据集上取得了较好的性能。然而,行人分割的实际应用场景通常较为复杂,所拍摄的图像中除了行人之外,还会存在着变化多样的非相关目标和背景等干扰因素。这些干扰因素对于深度卷积神经网络而言是一种明显的噪声,使得网络难以学习到有效的特征,从而导致了现有方法中通过深度卷积神经网络进行行人分割任务的精确度下降。
针对上述问题,本申请实施例提供了一种图像分割方法、装置、电子设备及存储介质,下面通过实施例进行描述。
为便于对本申请进行理解,下面结合具体实施例对本申请提供的技术方案进行详细说明。
请参阅图1,为本申请实施例提供的一种图像分割方法,该方法包括:
S101、将待分割图像输入特征提取网络的前两个第一卷积层依次进行卷积处理,获得特征提取网络的第二个卷积层输出的原始特征图。
这里可以通过特征提取网络进行特征提取,这里的特征提取网络选择的是常用的残差网络,是深度卷积神经网络的一种。这里的特征提取网络由五个依次连接的第一卷积层组成,分别为Conv1、Conv2、Conv3、Conv4和Conv5。其中Conv1为首层第一卷积层,Conv5为末层第一卷积层。这里的原始特征图为特征提取网络中的第二个第一卷积层(Conv2)输出的原始特征图X。其中,X∈RW×H×C,W、H、C分别为原始特征图X的宽、高和通道维度。另外,考虑到Conv1是非常浅的网络层,其学习到的语义信息不够充分,而Conv3、Conv4和Conv5经过了多层的卷积之后,提取的特征偏向于高层的抽象语义,其中的噪声信息被弱化后难以建模,因此选择Conv2输出的原始特征图。在这一步骤中,与其他层的输出相比,选择Conv2输出的原始特征图最终得到的人像分割图像更准确。
S102、对原始特征图进行噪声分离得到初始噪声图,并对初始噪声图进行重构得到噪声分布图。
具体的,噪声分离模型包括多个依次连接的第一卷积模块和一个第二卷积层。将原始特征图输入噪声分离模型的多个依次连接的第一卷积模块进行噪声分离,获得最后一个第一卷积模块输出的初始噪声图。对初始噪声图进行边界填充后输入第二卷积层进行卷积处理,获得第二卷积层输出的噪声分布图,其中,噪声分布图的宽、高、通道维度与原始特征图的宽、高、通道维度相同。
其中,每个第一卷积模块由一个第二卷积层、一个批归一化层和一个激活层串联组成。针对每个第一卷积模块,通过以下方式对输入该第一卷积模块的原始特征图进行噪声分离:
第二卷积层对原始特征图进行卷积处理,并将卷积结果输出至批归一化层。批归一化层对卷积结果进行归一化,并将归一化结果输出至激活层。激活层将归一化结果中小于零的值进行置零,获得激活层输出的初始噪声图。
如图4所示,图4为本申请实施例所提供的一种噪声分离模型的结构示意图。具体的,将原始特征图输入到噪声分离模型中,以获得噪声分布图,这里获得噪声分布图的宽、高和通道维度与原始特征图X相同。
这里的噪声分离模型由依次连接的多个第一卷积模块形成。每个第一卷积模块包括顺次连接的卷积核大小为3×3的第二卷积层(Conv12)、批归一化层(BN)和激活层(ReLU)。噪声分离模型通过多层串联的第一卷积模块逐步将原始特征图X中的噪声分离出来,形成初始噪声分布图。优选的,第一卷积模块的数量为五个或六个时,噪声分离效果更好。
具体的,噪声分离模型中的首个第一卷积模块,先对原始特征图进行卷积处理,再对卷积处理后获得的卷积结果进行归一化处理,获得归一化结果。之后对归一化结果中进行激活,将归一化结果中小于零的值置零,从而获得最终的初始噪声图。再将初始噪声图输入下一第一卷积模块中,重复上述处理过程,最终获得最后一个第一卷积模块输出的初始噪声图。
接着对初始噪声图进行边界填充后,将该噪声分布图输入到一个卷积核大小为3×3的第二卷积层(Conv11)中,卷积处理后获得噪声分布图V。
S103、根据噪声分布图和原始特征图中各像素点的特征值,计算得到各优化像素点的特征值。
得到原始特征图X和噪声分布图V后,通过以下公式计算获得优化特征图像X′:
X′=max(X,X-V)
具体的,确定原始特征图上每个第一像素点的特征值,以及确定噪声分布图上每个第二像素点的特征值。针对每两个空间位置相同的第一像素点和第二像素点,将第一像素点的特征值和第二像素点的特征值之间的差值,作为空间位置上的特征差值。针对每个空间位置,将空间位置上第一像素点的特征值和空间位置上的特征差值进行比较。选择第一像素点的特征值和特征差值之间的最大值,作为优化特征图中该空间位置上优化像素点的特征值。
先对原始特征图中空间位置上的每个第一像素点,计算该第一像素点的特征值同噪声分布图中与该第一像素点所在位置处对应的第二像素点的特征值之间的特征差值,即X-V。再针对每个第一像素点,将第一像素点的特征值与对应的特征差值进行比较,并选取该第一像素点的特征值与相同位置上的特征差值的最大值,作为优化像素点的特征值。这里的优化像素点指代优化特征图像上的任一像素点。
S104、基于各优化像素点的特征值,生成优化特征图像。
根据优化像素点的特征值与对应的空间位置关系,获得与原始特征图大小相同的优化特征图像X′。
示例性的,如原始特征图X大小为2×2,其中包括(1,1)、(1,2)、(2,1)和(2,2)四个位置上的像素点,针对(1,1)处的第一像素点,原始特征图的特征为4,噪声分布图中(1,1)处的第二像素点为-4,则(1,1)处的特征差值为8,因此优化特征图像X′中(1,1)处的优化像素点的特征值则为8。依次获得每个位置上优化像素点的特征值,最终获得大小为2×2的完整的优化特征图像X′。
S105、对优化特征图像进行人像分割,分割得到人像区域和背景区域。
获得优化特征图像后,将优化特征图像继续输入到特征提取网络的第三个第一卷积层(Conv3)中,经过Conv4和Conv5,最终得到第五个第一卷积层(Conv5)输出的特征图,接着将该特征图输入行人分割网络中,得到人像分割图像。这里的行人分割网络可以为全卷积网络FCN。如图5所示,图5为本申请实施例所提供一种人像分割图像的示意图。每个人像分割图像的人像区域和背景区域都进行了区分。
本申请实施例提供的图像分割方法,通过对待分割图像进行特征提取以获得原始特征图,对原始特征图进行噪声分离重构后获得对应的噪声分布图,根据原始特征图的噪声分布图和原始特征图得到优化特征图像,基于优化特征图像进行人像分割以输出人像分割图像,对去噪后的图像进行识别,能够有效的避免噪声对人像分割精确度的影响,从而提升图像分割的精确度。
进一步的,本申请实施例提供一种人像分割模型,包括特征提取网络、噪声分离模块和目标分割模型。如图2所示,图2为本申请提供的一种噪声分离模型的训练步骤的流程图。在图2中,通过以下方式对噪声分离模型进行训练:
S201、获取训练数据集。
其中,数据集中包括多个数据对,每个数据对包括训练特征图和训练特征图的标准噪声分布图训练样本。
具体的,通过人工标注的方式去除多个训练样本中的非相关对象及背景,以获得多个去噪样本。分别对训练样本和去噪样本进行特征提取,获得训练特征图和去噪特征图。根据训练特征图与去噪特征图的差值,确定出标准噪声分布图。将训练特征图和对应的标准噪声分布图组成数据对作为训练数据。
这里通过人工标注的方式,对训练样本进行分割掩码处理,以去除非相关对象和背景,得到去噪样本。这里的训练样本可以为从网络收集的或监控图像中截取的等包括行人的图像。这里的非相关对象及背景指代的是除人像中以外的其他图像,如图像中的动物图像为非相关对象,地面、天空和建筑物等图像为背景图像。这里的去噪样本只包括人像部分的图像,其他部分为空白或黑色。
分别将训练样本和去噪样本输入待训练的特征提取网络中,以获得Conv2中输出的训练特征图Y和去噪特征图Y’。这里的训练特征图Y和去噪特征图Y’之间的差值(Y-Y’),即可看作训练特征图中的噪声,即标准噪声分布图所代表的噪声分布,这也是想要噪声分离模型实现的目标值。
S202、针对每个数据对,将训练特征图输入噪声学习模型中,获得训练噪声分布图。
通过初始噪声分离模型对训练特征图Y进行处理,从而输出训练噪声分布图W,这里的训练噪声分布图W表示的是噪声学习模型当前对训练特征图像的噪声分布的估计值。
S203、根据训练噪声分布图和对应的标准噪声分布图,计算L1范数损失值。
具体的,通过训练噪声分布图和标准噪声分布图之间的L1范数损失Lnl作为噪声学习损失,以指导噪声学习模型的学习,L1范数损失Lnl计算公式如下:
Lnl=||W-(Y-Y’)||1;
其中,||*||1表示L1范数损失。
S204、根据L1范数损失值作为噪声学习模型的损失,对噪声学习模型的参数进行调整,以完成依据单个数据对对噪声分离模型的训练。
重复执行上述S202至S204,采用训练数据集中的各数据对对噪声分离模型进行训练。通过大量的数据对对噪声分离模型进行训练,从而获得训练好的噪声分离模型。
如图3所示,图3为本申请所提供的一种目标分割模型的训练步骤的流程图。进一步的,在获得L1范数损失Lnl的基础上对噪声分离模型训练好后,可以通过以下方式对目标分割模型进行训练:
S301、获得多个训练样本对应的目标特征图像。
这里的目标特征图像可以通过以下方式获得:将训练样本输入特征提取网络的前两个第一卷积层,后续步骤与获得优化特征图像的步骤相同。其中,使用的噪声分离模型为训练好的噪声分离模型。
S302、针对每个目标特征图像,将该目标特征图像输入到分割学习模型中,以获得预测分割图像。
这里的分割学习模型,输入为待识别的目标特征图像,输出为目标特征图像的输出结果。
S303、根据预测分割图像,确定当前分割学习模型针对目标特征图像的每个像素点的像素交叉熵损失值。
具体的,首先通过以下公式计算预测分割图像上每个像素点的像素交叉熵损失值Lxy:
其中,Lxy表示预测分割图像上每个像素点的像素交叉熵损失值,pxy表示初始目标分割模型在预测分割图像中x,y坐标位置的像素点的预测结果,gxy表示x,y坐标位置的像素点对应的类别标签,j为像素点的个数。
再基于预测分割图像的所有像素点的像素交叉熵损失值Lxy计算出平均值,作为图像交叉熵损失值Lce。
S304、将所有像素点的像素交叉熵损失值的平均值,确定为图像交叉熵损失值。
S305、将图像交叉熵损失值作为分割学习模型的损失,来对分割学习模型的参数进行调整,以完成依据单个训练样本对分割学习模型的训练过程。
具体的,通过图像交叉熵损失值Lce对分割学习模型进行指导,从而获得训练好的目标分割模型。
其中,人像分割模型的总损失值L通过以下公式计算:
L=Lnl+Lce;
通过总损失值作为该人像分割学习损失,指导人像分割模型的学习,从而获得训练好的人像分割模型。
在本申请的实施例中,提供的人像分割模型,能够自适应学习和去除深度卷积神经网络提取的特征图中存在的噪声,进而增强特征提取时特征的表达能力,提高了通过深度卷积神经网络进行行人分割的精确度,可以适用于图像检索、目标检测和行人重识别等多个方面。
基于同一发明构思,本申请实施例中还提供了与图像分割方法对应的图像分割装置,由于本申请实施例中的图像分割装置解决问题的原理与本申请实施例上述图像分割方法相似,因此图像分割装置的实施可以参见方法的实施,重复之处不再赘述。
请参阅图6,图6为本申请实施例所提供的一种图像分割装置的结构示意图。如图6中所示,图像分割装置600包括:
特征提取模块610,用于将待分割图像输入特征提取网络的前两个第一卷积层依次进行卷积处理,获得特征提取网络的第二个卷积层输出的原始特征图;
噪声分离模块620,用于对原始特征图进行噪声分离得到初始噪声图,并对初始噪声图进行重构得到噪声分布图;
计算模块630,用于根据噪声分布图和原始特征图中各像素点的特征值,计算得到各优化像素点的特征值;
生成模块640,用于基于各优化像素点的特征值,生成优化特征图像;
分割模块650,用于对优化特征图像进行人像分割,分割得到人像区域和背景区域。
在一优选实施例中,噪声分离模块620,具体用于:将原始特征图输入噪声分离模型的多个依次连接的第一卷积模块进行噪声分离,获得最后一个第一卷积模块输出的初始噪声图;其中,噪声分离模型包括多个依次连接的第一卷积模块和一个第二卷积层;对初始噪声图进行边界填充后输入第二卷积层进行卷积处理,获得第二卷积层输出的噪声分布图;其中,噪声分布图的宽、高、通道维度与原始特征图的宽、高、通道维度相同。
在一优选实施例中,每个第一卷积模块由一个第二卷积层、一个批归一化层和一个激活层串联组成,针对每个第一卷积模块,噪声分离模块620还用于:
通过以下方式对输入该第一卷积模块的原始特征图进行噪声分离:第二卷积层对原始特征图进行卷积处理,并将卷积结果输出至批归一化层;批归一化层对卷积结果进行归一化,并将归一化结果输出至激活层;激活层将归一化结果中小于零的值进行置零,获得激活层输出的初始噪声图。
在一优选实施例中,计算模块630具体用于:确定原始特征图上每个第一像素点的特征值,以及确定噪声分布图上每个第二像素点的特征值;针对每两个空间位置相同的第一像素点和第二像素点,将第一像素点的特征值和第二像素点的特征值之间的差值,作为空间位置上的特征差值;针对每个空间位置,将空间位置上第一像素点的特征值和空间位置上的特征差值进行比较;选择第一像素点的特征值和特征差值之间的最大值,作为优化特征图中该空间位置上优化像素点的特征值。
在一优选实施例中,图像分割装置600还包括训练模块(图中未示出),训练模块用于:获取训练数据集,数据集中包括多个数据对,每个数据对包括训练特征图和训练特征图的标准噪声分布图;针对每个数据对,将训练特征图输入噪声学习模型中,获得训练噪声分布图;根据训练噪声分布图和对应的标准噪声分布图,计算L1范数损失值;根据L1范数损失值作为噪声学习模型的损失,对噪声学习模型的参数进行调整,以完成依据单个数据对对噪声分离模型的训练。
在一优选实施例中,训练模块还用于:通过人工标注的方式去除多个训练样本中的非相关对象及背景,以获得多个去噪样本;分别对训练样本和去噪样本进行特征提取,获得训练特征图和去噪特征图;根据训练特征图与去噪特征图的差值,确定出标准噪声分布图;将训练特征图和对应的标准噪声分布图组成数据对作为训练数据。
在一优选实施例中,训练模块还用于:获得多个训练样本对应的目标特征图像;针对每个目标特征图像,将该目标特征图像输入到分割学***均值,确定为图像交叉熵损失值;将图像交叉熵损失值作为分割学习模型的损失,来对分割学习模型的参数进行调整,以完成依据单个训练样本对分割模型的训练过程。
请参阅图7,图7为本申请实施例所提供的一种电子设备的结构示意图。如图7中所示,电子设备700包括处理器710、存储器720和总线730。
存储器720存储有处理器710可执行的机器可读指令,当电子设备700运行时,处理器710与存储器720之间通过总线730通信,机器可读指令被处理器710执行时,可以执行如上述图像分割方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
本申请实施例还提供一种计算机可读存储介质,该存储介质上存储有计算机程序,该计算机程序被处理器运行时可以执行如上述图1所示方法实施例中的图像分割方法的步骤,具体实现方式可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的***、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储器包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种图像分割方法,其特征在于,包括:
将待分割图像输入特征提取网络的前两个第一卷积层依次进行卷积处理,获得所述特征提取网络的第二个卷积层输出的原始特征图;
对所述原始特征图进行噪声分离得到初始噪声图,并对所述初始噪声图进行重构得到噪声分布图;
根据所述噪声分布图和所述原始特征图中各像素点的特征值,计算得到各优化像素点的特征值;
基于各所述优化像素点的特征值,生成优化特征图像;
对所述优化特征图像进行人像分割,分割得到人像区域和背景区域。
2.根据权利要求1所述的方法,其特征在于,所述对所述原始特征图进行噪声分离,得到初始噪声图,并对所述初始噪声图进行重构,得到噪声分布图的步骤,包括:
将所述原始特征图输入噪声分离模型的多个依次连接的第一卷积模块进行噪声分离,获得最后一个第一卷积模块输出的初始噪声图;其中,所述噪声分离模型包括多个依次连接的第一卷积模块和一个第二卷积层;
对所述初始噪声图进行边界填充后输入所述第二卷积层进行卷积处理,获得所述第二卷积层输出的噪声分布图;
其中,所述噪声分布图的宽、高、通道维度与所述原始特征图的宽、高、通道维度相同。
3.根据权利要求2所述的方法,其特征在于,每个所述第一卷积模块由一个第二卷积层、一个批归一化层和一个激活层串联组成,针对每个所述第一卷积模块,通过以下方式对输入该第一卷积模块的所述原始特征图进行噪声分离:
所述第二卷积层对所述原始特征图进行卷积处理,并将卷积结果输出至所述批归一化层;
所述批归一化层对所述卷积结果进行归一化,并将归一化结果输出至所述激活层;
所述激活层将所述归一化结果中小于零的值进行置零,获得所述激活层输出的初始噪声图。
4.根据权利要求1所述的方法,其特征在于,所述根据所述噪声分布图和所述原始特征图中各像素点的特征值,计算得到各优化像素点的特征值的步骤包括:
确定所述原始特征图上每个第一像素点的特征值,以及确定所述噪声分布图上每个第二像素点的特征值;
针对每两个空间位置相同的第一像素点和第二像素点,将第一像素点的特征值和第二像素点的特征值之间的差值,作为所述空间位置上的特征差值;
针对每个空间位置,将所述空间位置上所述第一像素点的特征值和所述空间位置上的所述特征差值进行比较;
选择所述第一像素点的特征值和所述特征差值之间的最大值,作为优化特征图中该空间位置上优化像素点的特征值。
5.根据权利要求2所述的方法,其特征在于,通过以下方式进行训练以获得噪声分离模型:
获取训练数据集,所述数据集中包括多个数据对,每个数据对包括训练特征图和所述训练特征图的标准噪声分布图;
针对每个数据对,将所述训练特征图输入噪声学习模型中,获得训练噪声分布图;
根据所述训练噪声分布图和对应的所述标准噪声分布图,计算L1范数损失值;
根据所述L1范数损失值作为所述噪声学习模型的损失,对所述噪声学习模型的参数进行调整,以完成依据单个数据对对噪声分离模型的训练。
6.根据权利要求5所述的方法,其特征在于,通过以下方式生成训练数据集:
通过人工标注的方式去除多个训练样本中的非相关对象及背景,以获得多个去噪样本;
分别对所述训练样本和所述去噪样本进行特征提取,获得训练特征图和去噪特征图;
根据所述训练特征图与所述去噪特征图的差值,确定出标准噪声分布图;
将所述训练特征图和对应的标准噪声分布图组成数据对作为训练数据。
7.根据权利要求6所述的方法,其特征在于,通过以下方式训练得到目标分割模型对所述优化特征图像进行人像分割:
获得所述多个所述训练样本对应的目标特征图像;
针对每个所述目标特征图像,将该目标特征图像输入到分割学习模型中,以获得预测分割图像;
根据所述预测分割图像,确定当前分割学习模型针对所述目标特征图像的每个像素点的像素交叉熵损失值;
将所有像素点的像素交叉熵损失值的平均值,确定为图像交叉熵损失值;
将所述图像交叉熵损失值作为所述分割学习模型的损失,来对所述分割学习模型的参数进行调整,以完成依据单个所述训练样本对所述目标分割模型的训练过程。
8.一种图像分割装置,其特征在于,包括:
特征提取模块,用于将待分割图像输入特征提取网络的前两个第一卷积层依次进行卷积处理,获得所述特征提取网络的第二个卷积层输出的原始特征图;
噪声分离模块,用于对所述原始特征图进行噪声分离得到初始噪声图,并对所述初始噪声图进行重构得到噪声分布图;
计算模块,用于根据所述噪声分布图和所述原始特征图中各像素点的特征值,计算得到各优化像素点的特征值;
生成模块,用于基于各所述优化像素点的特征值,生成优化特征图像;
分割模块,用于对所述优化特征图像进行人像分割,分割得到人像区域和背景区域。
9.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述处理器执行所述机器可读指令,以执行如权利要求1至7任一所述的图像分割方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至7任一所述的图像分割方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111582828.9A CN114266894A (zh) | 2021-12-22 | 2021-12-22 | 一种图像分割方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111582828.9A CN114266894A (zh) | 2021-12-22 | 2021-12-22 | 一种图像分割方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114266894A true CN114266894A (zh) | 2022-04-01 |
Family
ID=80829030
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111582828.9A Pending CN114266894A (zh) | 2021-12-22 | 2021-12-22 | 一种图像分割方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114266894A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114694186A (zh) * | 2022-06-01 | 2022-07-01 | 南京优牧大数据服务有限公司 | 牛脸识别数据处理方法及装置 |
CN114969340A (zh) * | 2022-05-30 | 2022-08-30 | 中电金信软件有限公司 | 一种对深度神经网络进行剪枝的方法及装置 |
CN116563556A (zh) * | 2023-07-05 | 2023-08-08 | 杭州海康威视数字技术股份有限公司 | 模型训练方法 |
-
2021
- 2021-12-22 CN CN202111582828.9A patent/CN114266894A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114969340A (zh) * | 2022-05-30 | 2022-08-30 | 中电金信软件有限公司 | 一种对深度神经网络进行剪枝的方法及装置 |
CN114969340B (zh) * | 2022-05-30 | 2023-09-22 | 中电金信软件有限公司 | 一种对深度神经网络进行剪枝的方法及装置 |
CN114694186A (zh) * | 2022-06-01 | 2022-07-01 | 南京优牧大数据服务有限公司 | 牛脸识别数据处理方法及装置 |
CN116563556A (zh) * | 2023-07-05 | 2023-08-08 | 杭州海康威视数字技术股份有限公司 | 模型训练方法 |
CN116563556B (zh) * | 2023-07-05 | 2023-11-10 | 杭州海康威视数字技术股份有限公司 | 模型训练方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110245659B (zh) | 基于前背景相互关系的图像显著对象分割方法及装置 | |
CN110738207B (zh) | 一种融合文字图像中文字区域边缘信息的文字检测方法 | |
Chen et al. | Semantic image segmentation with task-specific edge detection using cnns and a discriminatively trained domain transform | |
CN107529650B (zh) | 闭环检测方法、装置及计算机设备 | |
US11274922B2 (en) | Method and apparatus for binocular ranging | |
CN114266894A (zh) | 一种图像分割方法、装置、电子设备及存储介质 | |
CN112750140A (zh) | 基于信息挖掘的伪装目标图像分割方法 | |
CN110705558B (zh) | 图像实例分割方法和装置 | |
CN110245621B (zh) | 人脸识别装置及图像处理方法、特征提取模型、存储介质 | |
CN107784288A (zh) | 一种基于深度神经网络的迭代定位式人脸检测方法 | |
Chen et al. | Dr-tanet: Dynamic receptive temporal attention network for street scene change detection | |
CN113822209A (zh) | 高光谱图像识别方法、装置、电子设备及可读存储介质 | |
CN111723687A (zh) | 基于神经网路的人体动作识别方法和装置 | |
CN110766708B (zh) | 基于轮廓相似度的图像比较方法 | |
CN109685805B (zh) | 一种图像分割方法及装置 | |
CN110852327A (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN116740384B (zh) | 洗地机的智能控制方法及*** | |
CN111951283A (zh) | 一种基于深度学习的医学图像识别方法及*** | |
CN111179270A (zh) | 基于注意力机制的图像共分割方法和装置 | |
CN115829942A (zh) | 基于非负性约束稀疏自编码器的电子电路缺陷检测方法 | |
CN115239672A (zh) | 缺陷检测方法及装置、设备、存储介质 | |
CN115222750A (zh) | 基于多尺度融合注意力的遥感图像分割方法及*** | |
CN112348762A (zh) | 一种基于多尺度融合生成对抗网络的单幅图像去雨方法 | |
CN114820755B (zh) | 一种深度图估计方法及*** | |
CN111027670A (zh) | 特征图处理方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |