CN111695569A

CN111695569A - 一种基于多分割图融合的图像像素级分类方法

Info

Publication number: CN111695569A
Application number: CN202010397565.3A
Authority: CN
Inventors: 姚莉; 乔昂
Original assignee: Southeast University
Current assignee: Southeast University
Priority date: 2020-05-12
Filing date: 2020-05-12
Publication date: 2020-09-22
Anticipated expiration: 2040-05-12
Also published as: CN111695569B

Abstract

本发明公开了一种基于多分割图融合的图像像素级分类方法。该方法有三个主要步骤,首先在多个分割图间引入指导机制，使用较高精度分割图指导较低精度分割图提高精度。接着引入一种共识机制，在各个图中可能产生分类冲突的边缘区域像素点间，通过协商策略达成分类共识。最后使用一种基于全卷积神经网络的融合策略，有效结合前述两种机制，得到最终输出。本发明能够有效地解决边缘区域的像素分类冲突问题，将多个分割图进行融合得到粒度更细的像素级分类结果。可与多种技术结合使用，包括但不限于深度神经网络、随机森林与支持向量机等有监督学习方法。该方法的使用，可以有效弥补现有方法对冲突像素点重视的不足，得到质量更高的融合分割结果。

Description

一种基于多分割图融合的图像像素级分类方法

技术领域

本发明涉及一种图像处理与分析技术,属于图像内容理解技术领域。

背景技术

图像内容理解是计算机视觉领域的一个重要的研究目标。随着计算机视觉技术的不断发展，对于图像内容的理解也在往更细粒度的方向发展。分割，也即像素粒度图像分类，作为实现图像内容理解的重要方法之一，如何在当前已有的技术基础上实现更细粒度的分类效果，是当前研究的重点所在。这其中不可避免地会涉及到不同现有技术间的像素点分类冲突问题，这种冲突一般发生在不同部分分割内容间的边缘部分。现有方法对于目前存在的几类冲突问题仍未提出有效的解决方案：

1)相同前景物体不同分割间的分类冲突。

2)相同背景内容不同分割间的分类冲突。

3)前景物体与背景内容相接部分的分类冲突。

发明内容

本发明的目的是为解决相同前景物体不同分割间的分类冲突、相同背景内容不同分割间的分类冲突、前景物体与背景内容相接部分的分类冲突的问题，本发明提出了一种分割图融合技术，该方法有针对性地解决了不同分割图间的三类像素分类冲突问题，提高了像素级分类精度与质量。

为达到上述目的，本发明采用的方法是：一种基于多分割图融合的图像像素级分类方法，包括以下步骤：

(1)在多个分割图间引入指导机制。根据各个部分分割内容的分割质量，使用注意力机制将高精度内容提供给低精度部分使其着重关注。以两分割图融合应用场景为例，若待融合输入为前景物体与背景内容分割图，背景内容分割由于相较前景物体分割对于局部及全局语义的要求更高，导致边缘部分的分类精度略低，可使用前景物体分割在边缘区域的分类结果作为注意力，对背景内容分割在相应区域的语义信息进行补充。多分割图情形可依此推之。

(2)在多分割图间引入共识机制，通过在有监督学习方法的学习阶段习得一个共识掩码，化解边缘区域可能存在的分类冲突。以两分割图应用场景为例，将两分割图分别编码为0与1。共识掩码为二值掩码，初始时为0值掩码，若(i,j)位置值为0表示双方达成了输入图对应位置像素分类与0编码分割图相同，值为1时反之。学习过程中在损失函数相应项的指导下，两部分不断地协商得出更加合理的共识掩码结果。多分割图情形可依此推之。

(3)使用一种基于全卷积神经网络的融合策略，有效结合前述两种机制，得出最终输出以两分割图应用场景为例，多分割图场景可依此推之。

作为本发明的一种改进，所述的融合策略通过以下子步骤来实现：

(3.1)完成初始化工作，对前述步骤得出的所有物体的分割块，以输入原图像尺寸为基准，进行尺寸配准；

(3.2)剔除重复分割块，若相同物体不同分割块间不完全重叠，则保留重叠部分；对于不同物体间重叠区域的像素归属问题，由后续后续子步骤解决；

(3.3)调整轮廓范围，将所有类别物体的分割块输入至一个编码器-解码器结构的全卷积神经网络中，通过学习调整各个物体的轮廓范围；

(3.4)合并掩码，将上一步得出的物体掩码进行合并，边缘重叠区域的像素点根据共识掩码判断其归属。

有益效果：

(1)本发明通过引入不同分割图间的指导机制，解决了图像相同前景物体、相同背景内容不同分割间的像素分类冲突问题。

(2)本发明通过引入不同分割间的共识机制，解决了图像前景物体与背景内容间边缘区域像素的分类冲突问题。

(3)本发明所提出方法可与多种有监督学习方法配合使用，包括但不限于深度神经网络、随机森林、支持向量机等方法，通过最后的融合策略，配合相应损失函数，可提高像素级分类精度，显著提高分割质量。

附图说明

图1多分割图间像素分类冲突解决方案整体流程图；

图2基于注意力的多分割图指导机制示意图；

图3基于共识掩码的多分割图共识机制示意图；

图4基于全卷积神经网络的多分割融合策略流程图；

具体实施方式

以下实施用于说明本发明，但不用来限制本发明的范围。

下面结合附图和实际对多分割图像素冲突解决的过程。

如图1所示，为本发明多分割图间像素分类冲突解决方案整体流程图，本发明的方法包括以下步骤：

(1)引入指导机制，根据各部分分割内容的分割质量，使用注意力机制将高精度内容提供给低精度部分使其着重关注，对相应区域的语义信息进行补充，提高低精度部分的分割精度；

(2)引入共识机制，在损失函数相应项的指导下，通过在有监督学习方法的学习阶段不断地协商习得一个边缘区域像素点上的共识掩码，化解边缘区域可能存在的分类冲突；

(3)使用一种基于全卷积神经网络的融合策略，综合前述两种机制结果得到最终输出。

下面以两分割图为例对本发明做进一步阐述，多分割图可依此推之。

(1)指导机制，使用较高精度分割图指导较低精度分割图提高精度：

基于注意力的指导机制如图2所示，对于两分割图，我们假设待融合输入为前景物体分割图mentor_fo与背景内容分割图in_bc，背景内容分割由于相较前景物体分割对于局部及全局语义的要求更高，导致边缘部分的分类精度略低，可使用前景物体分割在边缘区域的分类结果作为注意力，对背景内容分割在相应区域的语义信息进行补充。若定义out_bc为背景内容部分经过指导后的输出，则它们之间的关系可形式化为

其中

与

分别为逐像素乘与逐像素加操作，rescale(·)用于分割图间尺寸的配准，norm(·)为归一化操作，与分割图数目负相关。

定义p与g为预测输出与标注输出，此场景下指导损失项为

(2)共识机制，通过在有监督学习方法的学习阶段习得一个共识掩码，化解边缘区域可能存在的分类冲突，基于共识掩码的共识机制如图3所示：

(2.1)初始化共识掩码：

将两部分分别编码为0与1。共识掩码为二值掩码，初始时为0值掩码，若(i,j)位置值为0表示双方达成了输入图对应位置像素分类与0编码分割图相同，值为1时反之。将两分割图进行尺寸配准，调整为相同尺寸。

(2.2)计算前景掩码与背景掩码：

将输入分割图进行尺寸配准，调整为相同尺寸。

对于前景物体，将同属一类物体的不同分割块合并至同一掩码中，并使用一个习得的阈值进行截断。而后再将截断后的每一类掩码合并，使用类别数目对掩码像素点值进行规则化，计算得出二值前景掩码。

对于背景内容，将背景内容部分像素值赋以与初始化阶段相同的编码值，将非背景部分的像素值赋以相反的值，生成一个背景内容掩码。

(2.3)共识学习：

在有监督学习的学习过程中，不断地减小两者间的相关损失项，达到共识的学习。

损失函数定义如下，定义f与b为两个输入的分割图，N表示学习过程不断迭代输入的分割图数量，此场景下共识损失项为

(3)一种基于全卷积神经网络的融合策略，如图4所示，有效结合前述两种机制，得出最终输出。以两分割图应用场景为例，多分割图场景可依此推之，融合策略通过以下子步骤来实现：

(3.1)完成初始化工作。对前述步骤得出的所有物体的分割块，以输入原图像尺寸为基准，进行尺寸配准。

(3.2)剔除重复分割块。若相同物体不同分割块间不完全重叠，则保留重叠部分；对于不同物体间重叠区域的像素归属问题，由后续后续子步骤解决。

(3.3)调整轮廓范围。将所有类别物体的分割块输入至一个编码器-解码器结构的全卷积神经网络中，通过学习调整各个物体的轮廓范围。

(3.4)合并掩码。将上一步得出的物体掩码进行合并，边缘重叠区域的像素点根据共识掩码判断其归属。

Claims

1.一种基于多分割图融合的图像像素级分类方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于多分割图融合的图像像素级分类方法，其特征在于，所述步骤(1)中的指导机制通过以下子步骤来实现：

(1.1)定义待融合输入为前景物体分割图mentor_fo与背景内容分割图in_bc，定义out_bc为背景内容部分经过指导后的输出，则它们之间的关为

其中

与

分别为逐像素乘与逐像素加操作，rescale(·)用于分割图间尺寸的配准，norm(·)为归一化操作，与分割图数目负相关；

(1.2)在相应有监督学习方法中中配合如下损失项对指导效果进行衡量：定义p与g为预测输出与标注输出，此场景下指导损失项为

3.根据权利要求1所述的一种基于多分割图融合的图像像素级分类方法，其特征在于，所述步骤(2)中的共识机制通过以下子步骤来实现：

(2.1)初始化共识掩码，将两部分分别编码为0与1，共识掩码为二值掩码，初始时为0值掩码，若(i,j)位置值为0表示双方达成了输入图对应位置像素分类与0编码分割图相同，值为1时反之，将两分割图进行尺寸配准，调整为相同尺寸；

(2.2)计算前景掩码与背景掩码，将输入分割图进行尺寸配准，调整为相同尺寸，对于前景物体，将同属一类物体的不同分割块合并至同一掩码中，并使用一个习得的阈值进行截断，而后再将截断后的每一类掩码合并，使用类别数目对掩码像素点值进行规则化，计算得出二值前景掩码；对于背景内容，将背景内容部分像素值赋以与初始化阶段相同的编码值，将非背景部分的像素值赋以相反的值，生成一个背景内容掩码；

(2.3)共识学习，在有监督学习的学习过程中，不断地减小两者间的相关损失项，达到共识的学习，损失项定义如下，定义f与b为两个输入的分割图，N表示学习过程不断迭代输入的分割图数量，此场景下共识损失项为

4.根据权利要求1所述的一种基于多分割图融合的图像像素级分类方法，其特征在于，所述步骤3中的融合策略通过以下子步骤来实现：

(3.3)调整轮廓范围，将所有类别物体的分割块输入至一个编码器-解码器结构的全卷积神经网络中，通过学习对各个物体的轮廓范围进行微调；