CN106709924B

CN106709924B - 基于深度卷积神经网络和超像素的图像语义分割方法

Info

Publication number: CN106709924B
Application number: CN201611020101.0A
Authority: CN
Inventors: 闫镔; 陈健; 曾磊; 乔凯; 徐一夫; 李中国; 高飞
Original assignee: PLA Information Engineering University
Current assignee: PLA Information Engineering University
Priority date: 2016-11-18
Filing date: 2016-11-18
Publication date: 2019-11-22
Anticipated expiration: 2036-11-18
Also published as: CN106709924A

Abstract

本发明公开了一种基于深度卷积神经网络和超像素的图像语义分割方法，克服了现有技术中，现有语义分割方法的精度仍待提高的问题。该发明含有如下步骤：1：在图像分类数据集上训练一个由图像到类别标签的深度卷积网络分类模型；2：在深度卷积神经网络分类模型中加入反卷积层，在图像语义分割数据集上进行微调训练，实现从图像到图像语义分割结果的映射；3：将测试图像输入深度卷积神经网络语义分割模型中，得到各个像素的语义标签，同时将测试图像送入超像素分割算法，得到若干超像素区域；4：把超像素和语义标签进行融合，得到最终改善的语义分割结果。本方法改善现有图像语义分割方法的精度，在图像识别和应用中具有重要意义。

Description

基于深度卷积神经网络和超像素的图像语义分割方法

技术领域

该发明涉及一种图像语义分割方法，特别是涉及一种基于深度卷积神经网络和超像素的图像语义分割方法。

背景技术

随着卷积神经网络在公开数据集上分类错误率的不断下降，研究者开始关注图像像素级的分割，即图像语义分割。语义特征是一种更加高层的特征，将图像中每一像素标记为相应的类别，通用方法是通过对图像区域判别从而实现语义分割。Carreira等人、Farabet等人、Girshick等人通过使用超像素等手段把图像分成若干区域，通过深度卷积神经网络提取区域特征对其分类从而实现对整幅图像的语义分割。2015年Long等人基于深度卷积神经网络模型提出了一种端到端的语义分割模型。基于深度卷积神经网络的分类模型主要通过卷积层、池化层的堆叠以及最后若干的全连接层，完成特征表达和分类。为了实现图像级的预测，通过池化操作降低了输出尺寸，全连接层舍弃了图像空间信息。

使用卷积层替代分类网络中的全连接层，从而保留空间信息，在其后增加反卷积层对特征进行上采样从而实现逐像素的预测。该网络中的所有操作均可以看作卷积操作，因此称为Fully convolutional networks(FCN)。Long等人考虑了三种分类性能得到认可的模型，通过在训练好的分类网络上进行语义分割微调训练，从而减少了对大规模图像逐像素标记数据集的依赖。为了提高分割精度，FCN提出了skip结构，综合低层的细节信息和高层的抽象全局信息来通过反卷积对图像像素进行预测，分割精度得到了改善。Chen等人通过CRF来对分割结果进一步改善。2015年，Hyeonwoo等人基于FCN中反卷积层的思路，提出了对称的反卷积网络模型。通过反卷积层堆叠操作实现对特征图像的逐级上采样，该方法的上采样不同与FCN网络的直接一次上采样，因此分割精度得到了提高。2016年，Pim等人基于深度卷积神经网络通过对逐像素进行分类实现语义分割，该方法在MR图像分割上取得了较好的结果，且一定程度上解决了图像像素级标注数据集较小的问题。通过从几十张图像标注数据集中，可以取出足够数量的图像区域，用图像区域的中心像素类别标记该区域，进而训练分类网络实现对像素类别的预测。采用滑动的方式可以对图像中每个像素进行分类判别，最终实现对整幅图像的语义分割。采用多尺度的思想提高分类性能，以待判别像素为中心取三个尺寸的图像区域，通过特征提取和融合提高语义分割的鲁棒性。虽然基于深度卷积神经网络的语义分割模型取得了一系列较好的结果，但是在边缘等细节部分的分割精度仍然较低，需要进一步提高。

发明内容

本发明克服了现有技术中，现有语义分割方法的精度仍待提高的问题，提供一种使用效果较好的基于深度卷积神经网络和超像素的图像语义分割方法。

本发明的技术解决方案是，提供一种具有以下步骤的基于深度卷积神经网络和超像素的图像语义分割方法：含有如下步骤：

步骤1：在图像分类数据集上训练一个由图像到类别标签的深度卷积网络分类模型；

步骤2：在深度卷积神经网络分类模型中加入反卷积层，在图像语义分割数据集上进行微调训练，实现从图像到图像语义分割结果的映射；

步骤3：将测试图像输入深度卷积神经网络语义分割模型中，得到各个像素的语义标签，同时将测试图像送入超像素分割算法，得到若干超像素区域；

步骤4：把超像素和语义标签进行融合，得到最终改善的语义分割结果。

所述加入反卷积层的具体方法为：训练得到的深度卷积神经网络包含卷积层、矫正线性单元层、池化层和全连接层等，为了保留特征的空间信息，去掉分类网络中的全连接层，在最后一层池化层后面加入反卷积层，对特征上采样，实现图像到图像语义分割结果的端到端映射。

所述微调训练的具体方法为：基于分类网络构建语义分割模型的过程中，全连接层之前的模型保持不变，同样是用来特征提取和表达，在语义分割模型训练时，分类网络训练好的参数用来对语义分割模型相应参数初始化；然后在语义分割数据集上进行端到端的微调训练，得到语义分割模型。

所述超像素和语义标签进行融合的具体方法为：基于卷积神经网络的语义分割模型得到的语义分割结果较为粗糙，而超像素对于边缘等细节的保持性较好，对于某个像素的标签，通过其所在超像素区域所有像素的语义标签的平均作为该超像素的语义结果，从而纠正了基于卷积神经网络的图像语义分割结果中的错误分割结果。

与现有技术相比，本发明基于深度卷积神经网络和超像素的图像语义分割方法具有以下优点：本方法创新性综合深度卷积神经网络的高层语义标签和超像素在图像具有较好目标边缘贴合度的特点，提出了一种融合策略，从而改善现有图像语义分割方法的精度，在图像识别和应用中具有重要意义。

附图说明

图1是本发明基于深度卷积神经网络和超像素的图像语义分割方法的流程示意图。

具体实施方式

下面结合附图和具体实施方式对本发明基于深度卷积神经网络和超像素的图像语义分割方法作进一步说明：如图所示，本实施例中含有如下步骤：

步骤1中：在图像分类数据集上，训练一个由图像到类别标签的深度卷积网络分类模型，实现特征提取和分类的端到端映射，获得较好的分类结果。

步骤2中：加入反卷积层的具体方法为：训练得到的深度卷积神经网络包含卷积层、矫正线性单元(rectified linear units,ReLU)层、池化层和全连接层等，为了保留特征的空间信息，去掉分类网络中的全连接层，在最后一层池化层后面加入反卷积层，对特征上采样，弥补由于池化带来的图像特征尺寸降低的特点，从而实现图像到图像语义分割结果的端到端映射。

步骤3中：微调训练的具体方法为：基于分类网络构建语义分割模型的过程中，全连接层之前的模型保持不变，同样是用来特征提取和表达，在语义分割模型训练时，分类网络训练好的参数用来对语义分割模型相应参数初始化。然后在语义分割数据集上进行端到端的微调训练，得到语义分割模型。

步骤4中：超像素和语义标签融合的具体方法为：基于卷积神经网络的语义分割模型得到的语义分割结果较为粗糙，而超像素对于边缘等细节的保持性较好，对于某个像素的标签，通过其所在超像素区域所有像素的语义标签的平均作为该像素的语义结果，从而融合超像素对语义分割结果中的错误分割结果进行了纠正。

Claims

1.一种基于深度卷积神经网络和超像素的图像语义分割方法，其特征在于：含有如下步骤：

步骤2：在深度卷积神经网络分类模型中加入反卷积层，在图像语义分割数据集上进行微调训练，实现从图像到图像语义分割结果的映射；所述加入反卷积层的具体方法为：训练得到的深度卷积神经网络包含卷积层、矫正线性单元层、池化层和全连接层，为了保留特征的空间信息，去掉分类网络中的全连接层，在最后一层池化层后面加入反卷积层，对特征上采样，实现图像到图像语义分割结果的端到端映射；所述微调训练的具体方法为：基于分类网络构建语义分割模型的过程中，分类网络训练好的参数用来对语义分割模型相应参数初始化；然后在语义分割数据集上进行端到端的微调训练，得到语义分割模型；

2.根据权利要求1所述的基于深度卷积神经网络和超像素的图像语义分割方法，其特征在于：所述步骤4中超像素和语义标签进行融合的具体方法为：基于卷积神经网络的语义分割模型得到的语义分割结果粗糙，而超像素对于边缘细节的保持性好，对于某个像素的标签，通过其所在超像素区域所有像素的语义标签的平均作为该超像素的语义结果，从而纠正了基于卷积神经网络的图像语义分割结果中的错误分割结果。