CN110599514A - 图像分割的方法、装置、电子设备及存储介质 - Google Patents
图像分割的方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN110599514A CN110599514A CN201910901524.0A CN201910901524A CN110599514A CN 110599514 A CN110599514 A CN 110599514A CN 201910901524 A CN201910901524 A CN 201910901524A CN 110599514 A CN110599514 A CN 110599514A
- Authority
- CN
- China
- Prior art keywords
- image
- information
- image segmentation
- edge
- segmentation network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本公开关于一种图像分割的方法、装置、电子设备及存储介质,属于图像处理领域。所述方法包括:获取样本图像、所述样本图像中检测对象的基准位置信息和基准边缘信息;将所述样本图像输入所述特征提取模块,得到所述样本图像的特征信息;基于所述特征信息和所述对象位置检测模块,确定所述样本图像包括的检测对象的位置信息,并基于所述特征信息和所述对象边缘检测模块,确定所述样本图像包括的检测对象的边缘信息;基于所述位置信息、所述边缘信息、所述基准位置信息和所述基准边缘信息,对所述待训练的图像分割网络进行训练,得到训练后的图像分割网络。采用本公开能够提高图像分割网络对对象的位置识别的准确度。
Description
技术领域
本公开涉及图像处理领域,尤其涉及一种进行图像分割的方法、装置、电子设备及存储介质。
背景技术
随着人工智能的发展,图像分割的技术已经是人们经常用到的一种技术,其目的是检测出图像中属于目标对象的区域,将图像中的属于目标对象的部分与不属于目标对象的部分区分出来,目标对象可以是人、车、动物等。
目前进行图像分割的技术是:通过建立图像分割网络对大量的样本图像进行学习训练,进而实现对目标对象的检测。在图像分割网络中包括特征提取模块和位置检测模块,特征提取模块将图片的特征信息提取出来传送给位置检测模块,位置检测模块再提取目标对象的位置信息与目标对象的基准位置信息对比得到损失值,基于损失值确定特征提取模块和位置检测模块中各参数的调整值,进而对特征提取模块和位置检测模块中的参数进行调整。通过反复不断的学习训练,训练后的特征提取模块和位置检测模块可以针对任意图像输出一个二值图像,其中,属于目标对象的部分的像素值与不属于目标对象的部分像素值不同,从而,将图像中属于目标对象的部分与不属于目标对象的部分区分出来。
在实现本公开的过程中,发明人发现现有技术至少存在以下问题:当遇到图像内容复杂、噪声多等情况,会出现检测到的位置信息存在较大的噪声的问题,例如,位置信息中将对象之外的区域认定为对象所在的区域,位置信息准确度较低。
发明内容
本公开提供一种进行图像分割的方法、装置、电子设设及存储介质,以至少解决相关技术中检测位置信息准确度较低的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种图像分割网络的训练方法,包括:
获取样本图像、所述样本图像中检测对象的基准位置信息和基准边缘信息;
将所述样本图像输入所述特征提取模块,得到所述样本图像的特征信息;
基于所述特征信息和所述对象位置检测模块,确定所述样本图像包括的检测对象的位置信息,并基于所述特征信息和所述对象边缘检测模块,确定所述样本图像包括的检测对象的边缘信息;
基于所述位置信息、所述边缘信息、所述基准位置信息和所述基准边缘信息,对所述待训练的图像分割网络进行训练,得到训练后的图像分割网络。
可选的,所述基于所述位置信息、所述边缘信息、所述基准位置信息和所述基准边缘信息,对待训练的图像分割网络进行训练的步骤,包括:
基于所述位置信息与所述基准位置信息的差异确定第一损失值,并基于所述边缘信息与所述基准边缘信息的差异确定第二损失值;
基于所述第一损失值和所述第二损失值,对所述待训练的图像分割网络进行训练。
可选的,所述基于所述第一损失值和所述第二损失值,对待训练的图像分割网络进行训练的步骤,包括:
对所述第一损失值和所述第二损失值求和,得到第三损失值;
基于所述第三损失值,对所述特征提取模块、所述对象位置检测模块和所述对象边缘检测模块的模型参数进行调整。
可选的,所述图像分割网络还包括Softmax处理模块,所述基于所述特征信息和所述对象位置检测模块,确定所述样本图像包括的检测对象的位置信息,并基于所述特征信息和所述对象边缘检测模块,确定所述样本图像的检测对象的边缘信息的步骤,包括:
将所述特征信息输入对象位置检测模块中,得到所述样本图像包括的检测对象的初始位置信息,基于Softmax处理模块,对所述样本图像包括的检测对象的初始位置信息进行处理,得到所述样本图像包括的检测对象的位置信息;
将所述特征信息输入对象边缘检测模块中,得到所述样本图像包括的检测对象的初始边缘信息,基于Softmax处理模块,对所述样本图像包括的检测对象的初始边缘信息进行处理,得到所述样本图像包括的检测对象的边缘信息。
可选的,所述基于所述位置信息、所述边缘信息、所述基准位置信息和所述基准边缘信息,对所述待训练的图像分割网络进行训练,得到训练后的图像分割网络之后,所述方法还包括:
在所述训练后的图像分割网络中删除所述对象边缘检测模块。
根据本公开实施例的第二方面,提供一种图像分割的方法,包括:
获取待分割的目标图像;
基于所述目标图像和如上所述的训练后的图像分割网络,确定所述目标图像中的检测对象的目标位置信息。
可选的,所述基于所述目标图像和如上所述的训练后的图像分割网络,确定所述目标图像中的检测对象的目标位置信息,包括:
基于所述目标图像和训练后的特征提取模块,确定目标特征信息,基于所述目标特征信息和训练后的对象位置检测模块,确定所述目标图像中的检测对象的目标位置信息。
可选的,所述图像分割网络还包括Softmax处理模块,所述基于所述目标特征信息和训练后的对象位置检测模块,确定所述目标图像中的检测对象的目标位置信息的步骤,包括:
将所述目标特征信息输入训练后的对象位置检测模块中,得到所述目标图像包括的检测对象的初始位置信息;
基于Softmax处理模块,对所述目标图像包括的检测对象的初始位置信息进行处理,得到所述目标图像包括的检测对象的位置信息。
根据本公开实施例的第三方面,提供一种图像分割网络的训练装置,包括
获取单元,被配置为获取样本图像、所述样本图像中检测对象的基准位置信息和基准边缘信息;
输入单元,被配置为将所述样本图像输入所述特征提取模块,得到所述样本图像的特征信息;
确定单元,被配置为基于所述特征信息和所述对象位置检测模块,确定所述样本图像包括的检测对象的位置信息,并基于所述特征信息和所述对象边缘检测模块,确定所述样本图像包括的检测对象的边缘信息;
训练单元,被配置为基于所述位置信息、所述边缘信息、所述基准位置信息和所述基准边缘信息,对所述待训练的图像分割网络进行训练,得到训练后的图像分割网络。
可选的,训练单元,被配置为:
基于所述位置信息与所述基准位置信息的差异确定第一损失值,并基于所述边缘信息与所述基准边缘信息的差异确定第二损失值;
基于所述第一损失值和所述第二损失值,对所述待训练的图像分割网络进行训练。
可选的,所述训练单元,被配置为:
对所述第一损失值和所述第二损失值求和,得到第三损失值;
基于所述第三损失值,对所述特征提取模块、所述对象位置检测模块和所述对象边缘检测模块的模型参数进行调整。
可选的,所述图像分割网络还包括Softmax处理模块,所述确定单元,被配置为:
将所述特征信息输入对象位置检测模块中,得到所述样本图像包括的检测对象的初始位置信息,基于Softmax处理模块,对所述样本图像包括的检测对象的初始位置信息进行处理,得到所述样本图像包括的检测对象的位置信息;
将所述特征信息输入对象边缘检测模块中,得到所述样本图像包括的检测对象的初始边缘信息,基于Softmax处理模块,对所述样本图像包括的检测对象的初始边缘信息进行处理,得到所述样本图像包括的检测对象的边缘信息。
可选的,所述装置还包括删除单元,所述删除单元,被配置为:
在所述训练后的图像分割网络中删除所述对象边缘检测模块。
根据本公开实施例的第四方面,提供一种图像分割的装置,包括:
获取单元,被配置为获取待分割的目标图像;
确定单元,被配置为基于所述目标图像和如上所述的训练后的图像分割网络,确定所述目标图像中的检测对象的目标位置信息。
可选的,所述确定单元,被配置为:
基于所述目标图像和训练后的特征提取模块,确定目标特征信息,基于所述目标特征信息和训练后的对象位置检测模块,确定所述目标图像中的检测对象的目标位置信息。
可选的,所述图像分割网络还包括Softmax处理模块,所述确定单元,还被配置为:
将所述目标特征信息输入训练后的对象位置检测模块中,得到所述目标图像包括的检测对象的初始位置信息;
基于Softmax处理模块,对所述目标图像包括的检测对象的初始位置信息进行处理,得到所述目标图像包括的检测对象的位置信息。
根据本公开实施例的第四方面,提供一种电子设备,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如第一方面所述的图像分割网络的训练方法或如第二方面所述的图像分割的方法。
根据本公开实施例的第五方面,提供一种存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如第一方面所述的图像分割网络的训练方法或如第二方面所述的图像分割的方法。
根据本公开实施例的第六方面,提供一种计算机程序产品,当计算机程序产品在服务器上运行时,使得服务器执行如第一方面所述的图像分割网络的训练方法或如第二方面所述的图像分割的方法。
本公开的实施例提供的技术方案至少带来以下有益效果:
本公开实施例,在训练图像分割网络时,增加了对象边缘检测模块,从检测对象的位置信息和边缘信息两个角度对图像分割网络进行训练,因为检测对象的边缘和位置是直接相关的,所以这种训练方式可以提高图像分割网络对对象的位置识别的准确度,可以降低图像中的噪声对识别结果的影响,可以降低复杂背景图像对识别结果的影响,可以降低强边缘对识别结果的影响,同时不会增加对图像进行分割时的运算量。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种图像分割网络的训练方法中图像分割网络的架构图。
图2是根据一示例性实施例示出的一种图像分割网络的训练方法的框图。
图3是根据一示例性实施例示出的一种图像分割的方法的框图。
图4a是一种图像分割的效果图。
图4b是根据一示例性实施例示出的一种图像分割的效果图。
图5是根据一示例性实施例示出的一种图像分割网络的训练的装置的框图。
图6是根据一示例性实施例示出的一种图像分割的的装置的框图。
图7是根据一示例性实施例示出的电子设备的结构示意图。
具体实施方式
本公开提供的图像分割网络的训练方法可以由计算机设备实现,该计算机设备可以是服务器或终端。可以由服务器或终端单独实现,也可以由服务器和终端共同实现。终端可以是手机、平板电脑、智能穿戴设备、台式计算机、笔记本电脑等。该服务器可以是一个单独的服务器也可以是一个服务器组,如果是单独的服务器,该服务器可以负责下述方案中的所有处理,如果是服务器组,服务器组中的不同服务器分别可以负责下述方案中的不同处理,具体的处理分配情况可以由技术人员根据实际需求任意设置,此处不再赘述。本实施例以服务器执行对象检测为例进行方案的说明,其它情况与之类似,不再赘述。
图1是根据一示例性实施例示出的一种图像分割网络的训练方法中图像分割网络的架构图。参见图1,本公开提供的图像分割网络的训练方法是通过大量的样本图像对待训练的图像分割网络进行学习训练,进而使图像分割网络达到将目标对象从图像中分割出来的目的。待训练的图像分割网络包括特征提取模块、位置检测模块和边缘检测模块,其中,特征提取模块将图片的特征信息提取出来传送给位置检测模块和边缘检测模块,位置检测模块和边缘检测模块再将目标对象的位置信息和边缘信息提取出来并与目标对象的基准位置信息和基准边缘信息进行对比计算得到损失值,将损失值利用梯度下降法进行反向传播,对特征提取模块中的参数进行调整。通过这样反复不断的学习训练,最终达到检测出目标对象在图片中准确区域的目的。
本公开实施例的提供的图像分割的方法,可以从任意图像中检测出其包含的各对象在图片中的所处位置,其中,对象可以是人体、人脸、动物、汽车或其他物体中的任意一类物体。本公开方案可以应用在各种与图像识别相关的场景,例如,公安机关通过卡口设备搜捕犯罪嫌疑人的过程中,使用本公开方案可以准确的提取出卡口设备抓拍的图像中的人体或车辆的图像,便于相关人员进行对比排查。也可以应用在无人驾驶领域,提高汽车识别周围物体的准确率。还可以应用在各种图片编辑软件中的,能够实现自动准确的对所需编辑对象进行抠图,提高图片编辑效率。本公开实施例中以人体为检测对象为例进行方案的详细说明,其他情况与之类似,不再赘述。
图2是根据一示例性实施例示出的一种图像分割网络的训练方法的流程图,其中,待训练的图像分割网络包括特征提取模块、对象位置检测模块和对象边缘检测模块,如图2所示,包括以下步骤。
在步骤S21中,获取样本图像、样本图像中检测对象的基准位置信息和基准边缘信息。
其中,检测对象的基准位置信息和后续内容中的位置信息的形式可以多种多样,例如,可以是检测对象的最小外接矩形的四个顶点的位置信息,也可以是位置标定图像,位置标定图像是一个二值图像,属于检测对象的像素点的像素值为第一数值,如255,不属于检测对象的像素点的像素值为第二数值,如0。
检测对象的基准边缘信息和和后续内容中的边缘信息的形式可以多种多样,例如,可以是边缘线上所有点的坐标,又例如,可以是边缘标定图像,边缘标定图像是一个二值图像,属于检测对象边缘的像素点的像素值为第一数值,如255,不属于检测对象边缘的像素点的像素值为第二数值,如0。
本公开实施例中,以基准位置信息、位置信息为位置标定图像,并以基准边缘信息、边缘信息为边缘标定图像为例,进行方案的详细说明,其它情况与之类似,本实施例不再赘述。
在实施中,对待训练的图像分割网络的训练方法是通过大量的样本图像对待训练的图像分割网络进行训练,使图像分割网络达到将任意被检测对象进行从目标图像中分割出来。样本图像中包括含有检测对象的图像和不含有检测对象的图像。在训练时,对于样本图像,还可以获取其中检测对象的基准位置信息和基准边缘信息,其中,基准位置信息和基准边缘信息可以通过人工标定的方式获取。
例如,把人体作为检测对象。首先需要准备大量样本图像,样本图像中有包含人体的图像也有不包含人体的图像。然后人工标出图片中属于人体的像素和不属于人体的像素,其中可以将属于人体的像素的像素值设置为255,将不属于人体的像素的像素值设置为0,这样就得到了人体的位置标定图像。将得到的人体的位置标定图像通过canny算子(一个多级边缘检测算法)进行边缘提取,确定人体的边缘的像素点,再将属于人体边缘的像素值设为255,不属于人体边缘的像素值设为0,这样就得到了人体的边缘标定图像。
在步骤S22中,将样本图像输入特征提取模块,得到样本图像的特征信息。
在实施中,可以将样本图像输入特征提取模块,特征提取模块可以对样本图像的数据进行处理计算,输出样本图像的特征信息。
在步骤S23中,基于特征信息和对象位置检测模块,确定样本图像包括的检测对象的位置信息,并基于特征信息和对象边缘检测模块,确定样本图像包括的检测对象的边缘信息。
在实施中,可以将特征提取模块输出的特征信息输入对象位置检测模块中,得到样本图像中检测对象的初始位置信息,其中,初始位置信息为初始位置标定图像,技术人员可以对初始位置标定图像中的像素值进行范围划分,来确定属于检测目标的像素。例如,可以设置两个数值范围,对于初始位置标定图像中每个像素位置,如果像素位置的像素值属于第一数值范围,则像素位置属于检测目标,如果像素位置的数值属于第二数值范围,则像素位置不属于检测目标。同样,可以将特征提取模块提取的特征信息输入对象边缘检测模块中,得到样本图像中检测对象的初始边缘信息,其中,初始边缘信息为初始边缘标定图像,技术人员可以对初始边缘标定图像中的像素值进行范围划分,来确定属于检测目标边缘的像素。例如,可以设置两个数值范围,对于初始边缘标定图像中每个像素位置,如果像素位置的数值属于第一数值范围,则像素位置属于检测目标的边缘,如果像素位置的数值属于第二数值范围,则像素位置不属于检测目标。
可选的,图像分割网络还包括Softmax处理模块,相应的,步骤S23的处理可以如下:将特征信息输入对象位置检测模块中,得到样本图像包括的检测对象的初始位置信息,基于Softmax处理模块,对样本图像包括的检测对象的初始位置信息进行处理,得到样本图像包括的检测对象的位置信息;将特征信息输入对象边缘检测模块中,得到样本图像包括的检测对象的初始边缘信息,基于Softmax处理模块,对样本图像包括的检测对象的初始边缘信息进行处理,得到样本图像包括的检测对象的边缘信息。
在实施中,图像分割网络中还可以设置有Softmax处理模块,Softmax处理模块可以通过Softmax函数对上述初始位置标定图像中每个像素位置进行处理,使初始位置信息中像素位置的数值统一置在预设范围内,进而得到样本图像中检测对象的位置信息。同样,可以利用Softmax处理模块中的Softmax函数对上述初始边缘标定图像中每个像素位置息进行处理,将初始位置信息中像素位置的数值统一置在预设范围内,进而得到样本图像中检测对象边缘的位置信息。
例如,将特征提取模块提取的图像的特征信息输入到对象位置检测模块中,得到样本图像中人体的初始位置标定图像,初始位置标定图像可以看做是一个矩阵。矩阵中有不同数值。经过Softmax函数处理后,可以将数值统一置在0-1的范围内,进而可以得到人体的位置标定图像。其中,人体的位置标定图像中趋近于0或趋近于1的数值最多,可将人体的位置标定图像近似看做为一个二值图像。还可以将位置标定图像中的数值乘以255,以便显示。同样,将特征信息输入对象位置检测模块中,得到样本图像中人体的初始边缘标定图像,即得到一个初始边缘信息的矩阵,经过Softmax函数处理后,可以将数值统一置在0-1的范围内,进而可以得到人体的边缘标定图像。其中,人体的边缘标定图像中趋近于0或趋近于1的数值最多,可将人体的边缘标定图像近似看做为一个二值图像。还可以将边缘标定图像中的数值乘以255,得到与上述人体的边缘标定图像的数据格式相同的位置信息,以便计算处理。
可选的,Softmax处理模块还可以设置在图像分割网络中的对象位置检测模块中,即对象位置检测模块中包括Softmax处理模块和对象位置检测子模块。相应的,步骤S23的处理可以如下:将特征信息输入对象位置检测子模块中,得到样本图像包括的检测对象的初始位置信息,基于Softmax处理模块,对样本图像包括的检测对象的初始位置信息进行处理,得到样本图像包括的检测对象的位置信息;将特征信息输入对象边缘检测子模块中,得到样本图像包括的检测对象的初始边缘信息,基于Softmax处理模块,对样本图像包括的检测对象的初始边缘信息进行处理,得到样本图像包括的检测对象的边缘信息。
在实施中,将样本图像的特征信息输入到对象位置检测子模块中,可以得到初始位置信息,然后可以利用Softmax处理模块对初始位置信息进行处理。将样本图像的特征信息输入到对象边缘检测子模块中,可以得到初始边缘信息,然后可以利用Softmax处理模块对初始边缘信息进行处理。其中,Softmax处理模块对初始位置信息和初始边缘信息进行处理的方式与上述Softmax处理模块对初始位置信息和初始边缘信息处理的方式相同,此处不再赘述。
在步骤S24中,基于位置信息、边缘信息、基准位置信息和基准边缘信息,对待训练的图像分割网络进行训练,得到训练后的图像分割网络。
在实施中,可根据上述得到的位置信息与基准位置信息的差异值对位置检测模块进行训练。根据上述得到的边缘信息与基准边缘信息的差异值对边缘检测模块进行训练。其中,训练的过程可以根据差异值调整对象位置检测模块和对象边缘检测模块中的参数值,使差异值越来越小。
可选的,通过位置信息与基准位置信息的差异值对待训练的图像分割网络进行训练。对待训练的图像分割网络进行训练的步骤如下:基于位置信息与基准位置信息的差异确定第一损失值,并基于边缘信息与基准边缘信息的差异确定第二损失值,对第一损失值和第二损失值求和,得到第三损失值,基于第三损失值,对特征提取模块、对象位置检测模块和对象边缘检测模块的模型参数进行调整。
在实施中,当得到上述的目标对象的位置信息和边缘信息后,会对位置信息和基准位置信息进行计算得到第一损失值,对边缘信息和基准边缘信息进行计算得到第二损失值,再将第一损失值和第二损失值求和,得到第三损失值。利用梯度下降法对第三损失值进行反向传播,对对象特征提取模块、对象位置检测模块和对象边缘检测模块分别进行训练,调整各模块中的参数。通过向图像分割网络中输入大量的样本对图像分割网络进行反复的训练,不断地调整特征提取模块、对象位置检测模块和对象边缘检测模块中的参数,使得第一损失值和第二损失值越来越小,当检测到图像分割网络的检测准确度达到一定的阈值,例如97%,便可结束对图像分割网络的训练。即得到了训练之后的图像分割网络,训练之后的图像分割网络可以将任意被检测对象进行从目标图像中分割出来。
例如,将上述得到的人***置信息与人体的位置标定图像进行对比计算得到一个交叉熵loss1(即第一损失值),将上述得到的人体边缘信息与人体的准确边缘信息进行对比计算得到另一个交叉熵loss2(即第二损失值),将loss1与loss2求和得到loss(即第三损失值)。利用梯度下降法将loss代入到训练函数中,根据训练函数的结果的调整特征提取模块、对象位置检测模块和对象边缘检测模块中的参数。然后,可以继续将其它样本图片输入到深度学习网络中,便可得到新的loss值,并进一步训练各模块中的参数,通过反复训练,不断地调整特征提取模块、对象位置检测模块和对象边缘检测模块中的参数,当检测到图像分割网络的检测准确度达到一定的阈值,例如97%,便可结束对图像分割网络的训练。
可选的,图像分割网络的实际应用中可以将对象边缘检测模块从网络中删除,或者将对象边缘检测模块屏蔽。相应的,训练完成后,可以在训练后的图像分割网络中删除对象边缘检测模块。
在实施中,第三损失值是第一损失值和第二损失值的求和,第一损失值是对象位置检测模块输出的位置信息与基准位置信息的差异值,第二损失值是对象边缘检测模块输出的边缘信息与基准边缘信息的差异值。通过第三损失值对图像分割网络进行训练,可以使图像分割网络中的对象位置检测模块受到第二损失值的影响,对象位置检测模块在检测对象的位置信息时,同时检测对象的边缘信息,综合对象的位置信息和对象的边缘信息输出最终的位置信息。在应用中,可将对象边缘检测模块在图像分割网络中删去。
本公开实施例,在训练图像分割网络时,增加了对象边缘检测模块,从检测对象的位置信息和边缘信息两个角度对图像分割网络进行训练,因为检测对象的边缘和位置是直接相关的,所以这种训练方式可以提高图像分割网络对对象的位置识别的准确度,可以降低图像中的噪声对识别结果的影响,可以降低复杂背景图像对识别结果的影响,可以降低强边缘对识别结果的影响,同时不会增加对图像进行分割时的运算量。
图3是根据一示例性实施例示出的一种图像分割的方法的流程图,如图3所示,包括以下步骤。
在步骤S31中,获取待分割的目标图像。
在步骤S32中,基于目标图像和训练后的图像分割网络,确定目标图像中的检测对象的目标位置信息。
在实施中,当步骤S24中训练后的图像分割网络可以将任意被检测对象进行从目标图像中分割出来后,便可将图像分割网络进行应用。在应用中,将目标图像输入到图像分割网络中,图像网络便可输出将目标图像中的被检对象在目标图像中突出显示,达到图像分割的效果。
可选的,图像分割网络的实际应用中可以将对象边缘检测模块从网络中删除,或者将对象边缘检测模块屏蔽。相应的,基于目标图像和训练后的特征提取模块,确定目标特征信息,基于所述目标特征信息和训练后的对象位置检测模块,确定所述目标图像中的检测对象的目标位置信息。
在实施中,图像分割网络的实际应用中可以将对象边缘检测模块从网络中删除,或者将对象边缘检测模块屏蔽。将特征提取模块提取的特征信息输入对象位置检测模块中,得到样本图像包括的检测对象的初始位置信息,其中,初始位置信息为初始位置标定图像,根据设置的数值范围,对于初始位置标定图像中每个像素位置,如果像素位置的数值属于第一数值范围,则像素位置属于检测目标,如果像素位置的数值属于第二数值范围,则像素位置不属于检测目标。
可选的,图像分割网络还包括Softmax处理模块,在确定目标图像中的检测对象的目标位置信息时,还可以有以下处理方式:将目标特征信息输入训练后的对象位置检测模块中,得到目标图像包括的检测对象的初始位置信息。基于Softmax处理模块,对目标图像包括的检测对象的初始位置信息进行处理,得到目标图像包括的检测对象的位置信息。
在实施中,图像分割网络还包括Softmax处理模块,Softmax处理模块可以用Softmax函数对检测对象的初始位置信息进行处理,将初始位置信息中像素位置的数值统一置在预设范围内,进而得到样本图像包括的检测对象的位置信息。
例如,将图像输入到训练好的深度学习网络中,特征提取模块将图像的特征信息提取出来,再将图像的特征信息输入对象位置检测模块,到得到样本图像中人体的初始位置标定图像。得到的初始位置标定图像经过Softmax函数处理,将初始位置标定图像中的每个像素值置为0-1范围内,其中像素值趋近于1的像素即为属于人体的像素,如此便可得到图像中人体的位置信息。如图4a为一般图像分割网络对人体的分割结果,图4b本公开提供的图像分割网络对人体的分割结果。
可选的,Softmax处理模块还可以设置在图像分割网络中的对象位置检测模块中,即对象位置检测模块中包括Softmax处理模块和对象位置检测子模块。相应的,将目标特征信息输入训练后的对象位置检测子模块中,得到目标图像包括的检测对象的初始位置信息;基于Softmax处理模块,对所述目标图像包括的检测对象的初始位置信息进行处理,得到所述目标图像包括的检测对象的位置信息。
在实施中,将样本图像的特征信息输入到对象位置检测子模块中,可以得到初始位置信息,然后可以利用Softmax处理模块对初始位置信息进行处理。将样本图像的特征信息输入到对象边缘检测子模块中,可以得到初始边缘信息,然后可以利用Softmax处理模块对初始边缘信息进行处理。其中,Softmax处理模块对初始位置信息进行处理的方式与上述Softmax处理模块对初始位置信息处理的方式相同,此处不再赘述。
本公开实施例,在训练图像分割网络时,增加了对象边缘检测模块,从检测对象的位置信息和边缘信息两个角度对图像分割网络进行训练,因为检测对象的边缘和位置是直接相关的,所以这种训练方式可以提高图像分割网络对对象的位置识别的准确度,可以降低图像中的噪声对识别结果的影响,可以降低复杂背景图像对识别结果的影响,可以降低强边缘对识别结果的影响,同时不会增加对图像进行分割时的运算量。
图5是根据一示例性实施例示出的一种图像分割网络的训练装置框图。参照图5,该装置包括获取单元151、输入单元152、确定单元153和训练单元154。
获取单元151,被配置为获取样本图像、所述样本图像中检测对象的基准位置信息和基准边缘信息,具体可以实现上述步骤S21中的获取功能,以及其他隐含步骤;
输入单元152,被配置为将所述样本图像输入所述特征提取模块,得到所述样本图像的特征信息,具体可以实现上述步骤S22中的输入功能,以及其他隐含步骤;
确定单元153,被配置为基于所述特征信息和所述对象位置检测模块,确定所述样本图像包括的检测对象的位置信息,并基于所述特征信息和所述对象边缘检测模块,确定所述样本图像包括的检测对象的边缘信息,具体可以实现上述步骤S23中的确定功能,以及其他隐含步骤;
训练单元154,被配置为基于所述位置信息、所述边缘信息、所述基准位置信息和所述基准边缘信息,对所述待训练的图像分割网络进行训练,得到训练后的图像分割网络,具体可以实现上述步骤S24中的训练功能,以及其他隐含步骤。
可选的,训练单元154,被配置为:
基于所述位置信息与所述基准位置信息的差异确定第一损失值,并基于所述边缘信息与所述基准边缘信息的差异确定第二损失值;
基于所述第一损失值和所述第二损失值,对所述待训练的图像分割网络进行训练。
可选的,所述训练单元154,被配置为:
对所述第一损失值和所述第二损失值求和,得到第三损失值;
基于所述第三损失值,对所述特征提取模块、所述对象位置检测模块和所述对象边缘检测模块的模型参数进行调整。
可选的,所述图像分割网络还包括Softmax处理模块,所述确定单元153,被配置为:
将所述特征信息输入对象位置检测模块中,得到所述样本图像包括的检测对象的初始位置信息,基于Softmax处理模块,对所述样本图像包括的检测对象的初始位置信息进行处理,得到所述样本图像包括的检测对象的位置信息;
将所述特征信息输入对象边缘检测模块中,得到所述样本图像包括的检测对象的初始边缘信息,基于Softmax处理模块,对所述样本图像包括的检测对象的初始边缘信息进行处理,得到所述样本图像包括的检测对象的边缘信息。
可选的,所述装置还包括删除单元,所述删除单元,被配置为:
在所述训练后的图像分割网络中删除所述对象边缘检测模块。
图6是根据一示例性实施例示出的一种图像分割的装置。参照图6,该装置包括获取单元161和提取单元162。
根据本公开实施例的第四方面,提供一种图像分割的装置,包括:
获取单元161,被配置为获取待分割的目标图像,具体可以实现上述步骤S31中的获取功能,以及其他隐含步骤;
确定单元162,被配置为基于所述目标图像和如上所述的训练后的图像分割网络,确定所述目标图像中的检测对象的目标位置信息,具体可以实现上述步骤S32中的确定功能,以及其他隐含步骤。
可选的,所述确定单元162,被配置为:
基于所述目标图像和训练后的特征提取模块,确定目标特征信息,基于所述目标特征信息和训练后的对象位置检测模块,确定所述目标图像中的检测对象的目标位置信息。
可选的,所述图像分割网络还包括Softmax处理模块,所述确定单元162,还被配置为:
将所述目标特征信息输入训练后的对象位置检测模块中,得到所述目标图像包括的检测对象的初始位置信息;
基于Softmax处理模块,对所述目标图像包括的检测对象的初始位置信息进行处理,得到所述目标图像包括的检测对象的位置信息。
需要说明的是:上述实施例提供的图像分割网络的训练装置在训练图像分割网络时,或上述实施例提供的图像分割的装置在进行图像分割时,仅以上述各功能单元的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元完成,即将设备的内部结构划分成不同的功能单元,以完成以上描述的全部或者部分功能。另外,关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图7是本申请实施例提供的一种服务器电子设备的结构示意图,该电子设备700可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(centralprocessing units,CPU)701和一个或一个以上的存储器702,其中,所述存储器702中存储有至少一条指令,所述至少一条指令由所述处理器701加载并执行以实现上述进行对象检测的方法。
在示例性实施例中,还提供了一种包括指令的存储介质,例如包括指令的存储器804,上述指令可由电子设备700的处理器701执行以完成上述方法。可选地,存储介质可以是非临时性计算机可读存储介质,例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (10)
1.一种图像分割网络的训练方法,其特征在于,待训练的图像分割网络包括特征提取模块、对象位置检测模块和对象边缘检测模块,所述方法包括:
获取样本图像、所述样本图像中检测对象的基准位置信息和基准边缘信息;
将所述样本图像输入所述特征提取模块,得到所述样本图像的特征信息;
基于所述特征信息和所述对象位置检测模块,确定所述样本图像包括的检测对象的位置信息,并基于所述特征信息和所述对象边缘检测模块,确定所述样本图像包括的检测对象的边缘信息;
基于所述位置信息、所述边缘信息、所述基准位置信息和所述基准边缘信息,对所述待训练的图像分割网络进行训练,得到训练后的图像分割网络。
2.根据权利要求1所述的方法,其特征在于,所述基于所述位置信息、所述边缘信息、所述基准位置信息和所述基准边缘信息,对待训练的图像分割网络进行训练的步骤,包括:
基于所述位置信息与所述基准位置信息的差异确定第一损失值,并基于所述边缘信息与所述基准边缘信息的差异确定第二损失值;
基于所述第一损失值和所述第二损失值,对所述待训练的图像分割网络进行训练。
3.根据权利要求2所述的方法,其特征在于,所述基于所述第一损失值和所述第二损失值,对待训练的图像分割网络进行训练的步骤,包括:
对所述第一损失值和所述第二损失值求和,得到第三损失值;
基于所述第三损失值,对所述特征提取模块、所述对象位置检测模块和所述对象边缘检测模块的模型参数进行调整。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述基于所述位置信息、所述边缘信息、所述基准位置信息和所述基准边缘信息,对所述待训练的图像分割网络进行训练,得到训练后的图像分割网络之后,所述方法还包括:
在所述训练后的图像分割网络中删除所述对象边缘检测模块。
5.一种图像分割的方法,其特征在于,所述方法包括:
获取待分割的目标图像;
基于所述目标图像和如权利要求1-4任一项所述的训练后的图像分割网络,确定所述目标图像中的检测对象的目标位置信息。
6.根据权利要求5所述的方法,其特征在于,所述基于所述目标图像和如权利要求1-4任一项所述的训练后的图像分割网络,确定所述目标图像中的检测对象的目标位置信息,包括:
基于所述目标图像和训练后的特征提取模块,确定目标特征信息,基于所述目标特征信息和训练后的对象位置检测模块,确定所述目标图像中的检测对象的目标位置信息。
7.一种图像分割网络的训练装置,其特征在于,待训练的图像分割网络包括特征提取模块、对象位置检测模块和对象边缘检测模块,所述装置包括:
获取单元,被配置为获取样本图像、所述样本图像中检测对象的基准位置信息和基准边缘信息;
输入单元,被配置为将所述样本图像输入所述特征提取模块,得到所述样本图像的特征信息;
确定单元,被配置为基于所述特征信息和所述对象位置检测模块,确定所述样本图像包括的检测对象的位置信息,并基于所述特征信息和所述对象边缘检测模块,确定所述样本图像包括的检测对象的边缘信息;
训练单元,被配置为基于所述位置信息、所述边缘信息、所述基准位置信息和所述基准边缘信息,对所述待训练的图像分割网络进行训练,得到训练后的图像分割网络。
8.一种图像分割的装置,其特征在于,所述装置包括:
获取单元,被配置为获取待分割的目标图像;
确定单元,基于所述目标图像和如权利要求7所述的训练后的图像分割网络,确定所述目标图像中的检测对象的目标位置信息。
9.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至4中任一项所述的图像分割网络的训练方法或权利要求5至6中任一项所述的一种图像分割的方法。
10.一种存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如权利要求1至4中任一项所述的图像分割网络的训练方法或权利要求5至6中任一项所述的一种图像分割的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910901524.0A CN110599514B (zh) | 2019-09-23 | 2019-09-23 | 图像分割的方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910901524.0A CN110599514B (zh) | 2019-09-23 | 2019-09-23 | 图像分割的方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110599514A true CN110599514A (zh) | 2019-12-20 |
CN110599514B CN110599514B (zh) | 2022-10-04 |
Family
ID=68862492
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910901524.0A Active CN110599514B (zh) | 2019-09-23 | 2019-09-23 | 图像分割的方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110599514B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111402164A (zh) * | 2020-03-18 | 2020-07-10 | 北京市商汤科技开发有限公司 | 矫正网络模型的训练方法和装置、文本识别方法和装置 |
CN113537209A (zh) * | 2021-06-02 | 2021-10-22 | 浙江吉利控股集团有限公司 | 一种图像处理方法、装置、设备及计算机可读存储介质 |
WO2024021825A1 (zh) * | 2022-07-26 | 2024-02-01 | 腾讯科技(深圳)有限公司 | 生理图像处理方法、模型训练方法、装置、设备及介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108229504A (zh) * | 2018-01-29 | 2018-06-29 | 深圳市商汤科技有限公司 | 图像解析方法及装置 |
CN109360222A (zh) * | 2018-10-25 | 2019-02-19 | 北京达佳互联信息技术有限公司 | 图像分割方法、装置及存储介质 |
CN110059769A (zh) * | 2019-04-30 | 2019-07-26 | 福州大学 | 用于街景理解的基于像素重排重建的语义分割方法及*** |
CN110059698A (zh) * | 2019-04-30 | 2019-07-26 | 福州大学 | 用于街景理解的基于边缘稠密重建的语义分割方法及*** |
-
2019
- 2019-09-23 CN CN201910901524.0A patent/CN110599514B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108229504A (zh) * | 2018-01-29 | 2018-06-29 | 深圳市商汤科技有限公司 | 图像解析方法及装置 |
CN109360222A (zh) * | 2018-10-25 | 2019-02-19 | 北京达佳互联信息技术有限公司 | 图像分割方法、装置及存储介质 |
CN110059769A (zh) * | 2019-04-30 | 2019-07-26 | 福州大学 | 用于街景理解的基于像素重排重建的语义分割方法及*** |
CN110059698A (zh) * | 2019-04-30 | 2019-07-26 | 福州大学 | 用于街景理解的基于边缘稠密重建的语义分割方法及*** |
Non-Patent Citations (1)
Title |
---|
DONGCAI CHENG ET AL.: """FusionNet: Edge Aware Deep Convolutional Networks for Semantic Segmentation of Remote Sensing Harbor Images""", 《IEEE JOURNAL OF SELECTED TOPICS IN APPLIED EARTH OBSERVATIONS AND REMOTE SENSING》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111402164A (zh) * | 2020-03-18 | 2020-07-10 | 北京市商汤科技开发有限公司 | 矫正网络模型的训练方法和装置、文本识别方法和装置 |
CN111402164B (zh) * | 2020-03-18 | 2023-10-24 | 北京市商汤科技开发有限公司 | 矫正网络模型的训练方法和装置、文本识别方法和装置 |
CN113537209A (zh) * | 2021-06-02 | 2021-10-22 | 浙江吉利控股集团有限公司 | 一种图像处理方法、装置、设备及计算机可读存储介质 |
WO2024021825A1 (zh) * | 2022-07-26 | 2024-02-01 | 腾讯科技(深圳)有限公司 | 生理图像处理方法、模型训练方法、装置、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110599514B (zh) | 2022-10-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10534957B2 (en) | Eyeball movement analysis method and device, and storage medium | |
US6661907B2 (en) | Face detection in digital images | |
CN109753928B (zh) | 违章建筑物识别方法和装置 | |
CN110599514B (zh) | 图像分割的方法、装置、电子设备及存储介质 | |
CN108734185B (zh) | 图像校验方法和装置 | |
JP2017531883A (ja) | 画像の主要被写体を抽出する方法とシステム | |
US9767383B2 (en) | Method and apparatus for detecting incorrect associations between keypoints of a first image and keypoints of a second image | |
CN109255802B (zh) | 行人跟踪方法、装置、计算机设备及存储介质 | |
CN112884782B (zh) | 生物对象分割方法、装置、计算机设备和存储介质 | |
US12014498B2 (en) | Image enhancement processing method, device, equipment, and medium based on artificial intelligence | |
CN111126393A (zh) | 车辆外观改装判断方法、装置、计算机设备及存储介质 | |
CN109255792B (zh) | 一种视频图像的分割方法、装置、终端设备及存储介质 | |
CN111368698A (zh) | 主体识别方法、装置、电子设备及介质 | |
CN112991159B (zh) | 人脸光照质量评估方法、***、服务器与计算机可读介质 | |
CN108647605B (zh) | 一种结合全局颜色与局部结构特征的人眼凝视点提取方法 | |
CN111582278B (zh) | 人像分割方法、装置及电子设备 | |
CN110751163B (zh) | 目标定位方法及其装置、计算机可读存储介质和电子设备 | |
CN111353330A (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN116052230A (zh) | 一种掌静脉识别方法、装置、设备及存储介质 | |
CN113255549B (zh) | 一种狼群围猎行为状态智能识别方法及*** | |
CN115311680A (zh) | 人体图像质量检测方法、装置、电子设备及存储介质 | |
CN108549855A (zh) | 面向智能家居场景的实时人形检测方法 | |
CN112183383A (zh) | 一种复杂化环境下测量人脸图像的信息处理方法和装置 | |
CN109934045B (zh) | 行人检测方法和装置 | |
CN113761987A (zh) | 一种行人重识别的方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |