CN113160233A

CN113160233A - 利用稀疏标注数据集训练实例分割神经网络模型的方法

Info

Publication number: CN113160233A
Application number: CN202110362718.5A
Authority: CN
Inventors: 张敏清; 李小军
Original assignee: Yipusen Health Technology Shenzhen Co ltd
Current assignee: Yipusen Health Technology Shenzhen Co ltd
Priority date: 2021-04-02
Filing date: 2021-04-02
Publication date: 2021-07-23

Abstract

本发明公开了利用稀疏标注数据集训练实例分割神经网络模型的方法，通过设计两阶段训练策略，在初始阶段和精修阶段通过不同的方式补充缺失的负样本，逐渐提供可靠的负样本监督信号，进而提升神经网络模型的判别能力。本发明解决了在稀疏标注数据的情况下，避免神经网络模型在训练的过程中被误导的问题，并使得神经网络模型具备一定的抗干扰能力。

Description

利用稀疏标注数据集训练实例分割神经网络模型的方法

技术领域

本发明涉及图像处理技术领域，特别涉及利用稀疏标注数据集训练实例分割神经网络模型的方法。

背景技术

目前，关于如何利用稀疏标注数据集训练实例分割神经网络模型的方法，相应的研究工作较少。有人提出可以认为与标注区域相邻的区域是可靠的负样本，但是这样的负样本采样策略存在非常严重的偏差，即提供的都是目标区域周边的负样本，而无法提供远离目标区域的负样本。也有人提出针对性的损失函数，通过损失阈值筛选出较为可靠的负样本，但这样的方法对于损失阈值的预设置较为敏感，并且在数据标注噪声较为严重时，效果不佳。

深度学习技术已经在图像处理领域中取得了巨大的成功，它们的成功都离不开神经网络模型的优异表现。在训练神经网络模型的过程中，数据及对应的标签(金标准)是除网络模型结构之外的关键因素之一。如果数据集的标签是不完美的，即存在一些错误标注引入的噪声标签，则会对网络的训练造成负面影响。尤其是当这样的噪声标签情况严重时，神经网络模型的表现会严重变差。

这一不完美标签情况在高分辨率图像(例如图像尺寸极大的显微镜图像) 的目标检测应用中异常严重。这是因为高分辨率图像通常具有非常大的图像尺寸，并且包含难以计数的目标数量(例如显微镜图像中的细胞)，因此在高分辨率图像中标识出每一个目标，进而得到完美的标签是几乎不可能完成的。为了降低标注难度以及提升标注效率，通常的做法是，只标注极少量比较具有代表性的目标，也称为稀疏标注。通过这样方式完成的数据标注，也是不完美标注，因为未标注区域包含大量待识别目标。并且，这类稀疏标注的数据，在高分辨率图像中非常普遍。

通常，针对目标检测任务训练神经网络模型的过程中，需要标注数据集提供正样本(目标区域)与负样本(背景区域)的监督。在完全标注数据情形下，正样本来自于标注区域，未标注区域则自然被认为是负样本。然而，稀疏标注数据集仅仅提供部分正样本监督。由于未标注区域不仅包含背景，也包含目标，因此不能被认为是可靠的负样本，进而缺失负样本监督。因此，稀疏标注数据对于神经网络模型的训练是存在负面影响的。

因此，本发明解决了在稀疏标注数据的情况下，避免神经网络模型在训练的过程中被误导，使得神经网络模型具备一定的抗干扰能力。

发明内容

针对现有技术存在的问题，本发明提供利用稀疏标注数据集训练实例分割神经网络模型的方法。

为实现上述目的，本发明的具体方案如下：

提供利用稀疏标注数据集训练实例分割神经网络模型的方法，包括如下步骤：

S1，生成原始稀疏标注数据集；

S2，生成负向样本增广数据集；

S3，混合负向样本增广数据集与原始稀疏标注数据集；

S4，初始阶段训练，形成预训练神经网络模型；

S5，精修阶段训练，根据自步学习参数生成伪标签，基于伪标签数据集训练神经网络模型，生成最终神经网络模型。

进一步地，步骤S4初始阶段训练中，按照公式

训练神经网络模型，

其中，1(.)是指示函数，

是损失函数，p_i，j是神经网络模型的输出。

进一步地，在步骤S4初始阶段训练中，训练样本为

其中

是负向样本增广图像，

是负向样本增广图像对应的标注。进一步地，在步骤S5精修阶段训练中，采用自步学习训练神经网络模型，根据公式

在每个训练的轮次t，动态地维护神经网络模型的预测结果，其中f(x_i，θ_t) 是神经网络模型针对图像i在第t轮次的输出，

是根据历史预测维护的神经网络模型预测累积结果，α是当前输出的权重。

进一步地，在步骤S5精修阶段训练中，在训练轮次t，根据神经网络模型的累积预测结果

在未标注区域中选取最为可信的前r_t％的像素作为伪标签

中的负样本监督；随着训练轮次t的增加，神经网络模型的分辨能力提升，r_t％也根据公式

线性增大，其中T是训练的总轮次，r_start和r_end分别是预设的开始和结束时选取的作为伪标签中负样本监督的像素个数占整个未标注像素个数的比例。

进一步地，在步骤S7精修阶段训练中，

在轮次t时的训练样本为

，并且对于每个像素j的伪标签由公式

确定。

进一步地，在步骤S5中还包括：

S51，判断是否达到最大迭代次数；

S52，如未达到最大迭代次数，更新自步学习参数；

S53，达到最大迭代次数，进入下一步，生成最终神经网络模型。

进一步地，所述神经网络模型是卷积神经网络模型或循环神经网络模型。

采用本发明的技术方案，具有以下有益效果：

附图说明

图1是本发明实施方式的流程图。

具体实施方式

以下结合附图和具体实施例，对本发明进一步说明。

结合图1：本发明的方法原理/步骤概述

实例分割，机器自动从图像中用目标检测方法框出不同实例，再用语义分割方法在不同实例区域内进行逐像素标记；本发明通过两阶段训练策略，提供利用稀疏标注数据集训练实例分割神经网络模型的方法。

对于数据集及其标注

其中X是图像集合， Y是标注集合，i代表样本序号，x_i代表第i个图像，y_i代表第i个图像对应的标注，N代表数据量。

对于某个图像的标注，

其中j是某个图像的像素序号，M代表像素总个数。如果是完全标注数据，则y_i，j＝0(背景)或1(目标)，神经网络模型以公式(1)为优化目标进行训练。

其中，1(.)是指示函数，

是损失函数，p_i，j是神经网络模型的输出。如果是稀疏标注数据，则y_i，j＝-1(未标注)或1(目标)。缺乏负样本即背景 (0)的监督，会严重阻碍网络模型的训练。

公式(1)中，y＝0代表背景/负样本，y＝1代表前景/目标/正样本/细胞核， y＝-1代表未标注区域，除了y＝-1，y＝0或1都参与神经网络模型训练。

本发明通过设计一个两阶段训练策略解决这一问题，分别是初始阶段 (start-up)和精修阶段(refinement)。两个阶段通过不同的方式补充缺失的负样本，逐渐提供可靠的负样本监督信号，进而提升神经网络模型的判别能力。

负向样本增广(Negative Data Augmentation,NDA)是扩充训练数据的技术，NDA通过一些变换，将图像的语义信息打破，因此可认为NDA图像中不再含有目标区域。因此，在初始阶段，随机初始化的神经网络模型没有判别能力，本发明通过NDA提供缺失的背景监督，并按照公式(1)训练神经网络模型。因此，初始阶段的训练样本为

其中

是NDA图像，

是NDA图像对应的标注。由于

不再含有目标区域，则对于每个像素j，

自步学习(Self-Paced Learning,SPL)是渐进式的学习策略，它通过神经网络模型的输出，从中选取较为可靠的未标注样本，并赋予伪标签，进行神经网络模型的训练。当初始阶段结束后，神经网络模型已经具备一定的判别能力，因此在精修阶段，本发明转而采用SPL训练策略进一步提升神经网络模型表现。具体地，在这一阶段，根据公式(2)，本发明在每个训练的轮次t，动态地维护网络的预测结果：

其中f(x_i，θ_t)是神经网络模型针对图像i在第t轮次(当前)的输出，

是根据历史预测维护的神经网络模型预测累积结果，α是当前输出的权重。这一过程可以被简单理解为，当前输出和历史输出的加权和作为当前的维护结果。在训练轮次t，根据网络的累积预测结果

本发明在未标注区域中选取最为可信的前r_t％的像素作为伪标签

中的负样本监督。其中，随着训练轮次t的增加，神经网络模型的分辨能力提升，r_t％也根据公式(3)线性增大。

其中，T是训练的总轮次，r_start和r_end分别是预设的开始和结束时的选取的作为伪标签中负样本监督的像素个数占整个未标注像素个数的比例。因此精修阶段，在轮次t时的训练样本为

并且对于每个像素j，伪标签则由公式(4)确定。

r_t是一个0到1之间的值，r_start和r_end决定r_t的上下界。r_t从r_start逐渐增大至r_end。

r_t是选取的作为伪标签中负样本监督的像素个数占整个未标注像素个数的比例。

例如一张图像120个像素。20个像素被标成前景了，那未标注像素就是100 个。然后当前的r_t＝0.4那么，就要从未标注的100个像素中挑选40个像素出来。

以上所述仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是在本发明的发明构思下，利用本发明说明书及附图内容所作的等效结构变换，或直接/间接运用在其他相关的技术领域均包括在本发明的保护范围内。