CN112164077A

CN112164077A - 基于自下而上路径增强的细胞实例分割方法

Info

Publication number: CN112164077A
Application number: CN202011019366.5A
Authority: CN
Inventors: 陈昱莅; 贾宇航; 陆铖; 马苗; 裴炤; 李雪; 任敬
Original assignee: Shaanxi Normal University
Current assignee: Shaanxi Normal University
Priority date: 2020-09-25
Filing date: 2020-09-25
Publication date: 2021-01-01
Anticipated expiration: 2040-09-25
Also published as: CN112164077B

Abstract

一种基于自下而上路径增强的细胞实例分割方法，由数据预处理、构建实例分割网络、训练实例分割网络、保存模型、验证实例分割网络、测试实例分割网络步骤组成。采用构建实例分割网络步骤中的主干网分支来提取图片中的特征，预测头分支生成实例的定位、分类、掩码系数信息，原型掩码分支生成原型掩码，通过线性结合掩码系数与原型掩码，对图片中的细胞进行实例分割。本发明与现有的Yolact方法相比，通过改进构建实例分割网络中的特征融合部分，充分利用了图片中信息，提高了物体的定位、分类的准确率，可用于细胞的定位、分类与实例分割。

Description

基于自下而上路径增强的细胞实例分割方法

技术领域

本发明属于计算机视觉技术领域，具体地涉及到图片中的细胞分类、定位与实例分割。

背景技术

实例分割是目标检测和语义分割的结合，在图像中将目标检测出来，然后对每个像素打上标签；随着互联网的发展和个人智能移动设备的大量增加，人们正产生、存储和使用大量的图片；实例分割技术在计算机视觉中是基础而又具有挑战性的。由于其广泛的应用场景和研究价值，该技术在学术界和工业界均引起了越来越多的关注。

目前主流的物体实例分割方法可以分成两大类别：基于ROI的自上而下的方法(如Mask R-CNN)和基于逐像素聚类、自下而上的方法，这些方法存在的主要问题是多阶段、多超参数、分割结果不够精细等问题。

在细胞实例分割技术领域，当前需解决的一个技术问题是提供一种方法简单、定位速度快、定位精度高的细胞实例分割方法。

发明内容

本发明所要解决的技术问题在于克服上述现有技术的缺点，提供一种方法简单、定位速度快、定位精度高的基于自下而上路径增强的细胞实例分割方法。

解决上述技术问题所采用的技术方案是由下述步骤组成：

(1)数据预处理

从PanNuke数据集中取原始图片分为验证集、测试集、训练集，验证集与测试集、训练集的数量比为1：1：4，训练集、验证集、测试集中的图片大小为550×550像素，将训练集、验证集、测试集图片中的每个细胞提取出来生成新的包含单个细胞的掩码图片，掩码图片的大小为550×550像素，用pycocotools工具将训练集、验证集、测试集中的图片和对应数据集的掩码图片转化为标签文件。

(2)构建实例分割网络

实例分割网络由主干网分支(1)、预测头分支(2)、原型掩码分支(3)连接构成，主干分支(1)的输出与预测头分支(2)和原型掩码分支(3)中的输入相连，主干网分支(1)、预测头分支(2)、原型掩码分支(3)的构建方法如下：

1)构建主干网分支

a特征金字塔网络提取特征图

将训练集中的每张图片输入到特征金字塔网络的基础特征提取网络(1-1)中提取特征图，得到基础特征图集合{C1，C2，C3，C4，C5}。

b融合特征图

将基础特征图集合{C1，C2，C3，C4，C5}输入到特征金字塔网络(1-2)中，进行特征融合，得到融合特征图集合{P₃，P₄，P₅，P₆，P₇}，用最近邻上采样法进行上采样，得到256通道的特征图集合，在特征金字塔网络输出的特征图上依次连接5个卷积核大小为3×3、步长为2的卷积层，构成路径增强网络(1-3)，由下式得到路径增强网络特征图集合{N₃，N₄，N₅，N₆，N₇}，构建成主干网分支(1)。

式中R为rule激活函数，C₃为卷积核大小为3×3、步长为2的卷积层，U为矩阵相加，i∈{3，4，5，6，7}。

2)构建预测头分支

预测头分支包括定位分支、分类分支、掩码系数分支。

a构建定位分支

将路径增强网络特征图集合{N₃，N₄，N₅，N₆，N₇}中的每个特征图上的每个像素点设置面积依次为[24,48,96,192,384]，长与宽比分别为1、1/2、2的锚，构成锚特征图，将锚特征图输入卷积层(2-1)、卷积层(2-2)，经2次卷积核大小为3×3、步长为1的卷积操作，得到(A×S，L_j，L_j)的特征图，将(A×S，L_j，L_j)的特征图的第一维与第三维位置进行交换，得到(L_j，L_j，A×S)的特征图，再将(L_j，L_j，A×S)的特征图第一维、第二维、第三维中的A进行相乘，得到(L_j×L_j×A，S)的预测结果，其中A为每个像素点设置的3个锚，S为锚的中心点和左上角点的坐标；将得到的(L_j×L_j×A，S)预测结果的第一维进行列拼接操作，得到(C，S)的定位结果，其中C由下式确定：

式中L_j∈{69,35,18,9,5}，j∈{1,2,3,4,5}，构建成定位分支(2-3)。

b构建分类分支

将路径增强网络特征图集合{N₃，N₄，N₅，N₆，N₇}中的每个特征图上的每个像素点设置面积依次为[24,48,96,192,384]，长与宽比分别为1、1/2、2的锚，构成锚特征图，将锚特征图输入卷积层(2-1)、卷积层(2-2)，经卷积核大小为3×3、步长为1的卷积操作，得到(A×D，L_j，L_j)的特征图，将(A×D，L_j，L_j)特征图的第一维与第三维位置进行交换，得到(L_j，L_j，A×D)的特征图，再将(L_j，L_j，A×D)的特征图第一维、第二维、第三维中的A进行相乘，得到(L_j×L_j×A，D)的预测结果，其中D表示训练集中离体的细胞类别数，将得到的(L_j×L_j×A，D)预测结果的第一维进行列拼接操作，得到(C，D)的分类结果，构建成分类分支(2-4)。

c构建掩码系数分支

将路径增强网络特征图集合{N₃，N₄，N₅，N₆，N₇}中的每个特征图上的每个像素点设置面积依次为[24,48,96,192,384]，长与宽比分别为1、1/2、2的锚，构成锚特征图，锚特征图输入卷积层(2-1)、卷积层(2-2)，经卷积核大小为3×3、步长为1的卷积操作，得到(A×K，L_j，L_j)的特征图，将(A×K，L_j，L_j)的特征图的第一维与第三维位置进行交换，得到(L_j，L_j,A×K)的特征图，再将(L_j，L_j，A×K)的特征图第一维、第二维、第三维中的A进行相乘，得到(L_j×L_j×A，K)的预测结果，其中K是生成掩码系数的个数，K为32或64；将得到的(L_j×L_j×A，K)预测结果的第一维进行列拼接操作，得到(C，K)的掩码系数，构建成掩码系数分支(2-5)。

3)构建原型掩码分支

将路径增强网络特征图集合{N₃，N₄，N₅，N₆，N₇}中的N₃输入卷积层(3-1)、卷积层3-2)，经卷积核大小为3×3、步长为1的卷积操作，用最近邻上采样法将卷积后的N₃上采样到原始图片尺寸的1/4，经2次重复的卷积层(3-3)、(3-4)，得到(32,138,138)的特征图，将(32,138,138)的特征图的第一维与第三维进行位置交换，得到(138，138，32)的原型掩码P，构建成原型掩码分支(3)；

(3)训练实例分割网络

(a)确定损失函数

损失函数Loss包括类别损失、预测框回归损失、掩码损失，损失函数loss由下式确定：

Loss＝αL_cls+βL_box+θL_mask

式中α、β、θ为三个损失的不同权重，分别为1、1.5、6.125。

(b)训练实例分割网络

将训练集、对应的标签文件、ImageNet网络上的预训练模型输入到实例分割网络中进行训练，在训练过程中，设定实例分割网络的学习率γ为0.0001，优化器设定为自适应矩估计优化器，迭代M次，每次迭代使用图片的数量为B，M和B为有限正整数，训练至实例分割网络的损失函数Loss收敛。

(4)保存权重文件

每迭代F次保存1次权重文件，其中F≤M，得到保存权重文件。

(5)验证实例分割网络

将验证集和对应的标签文件输入到实例分割网络中进行验证，网络每F次进行一次验证。

(6)测试实例分割网络

将保存权重文件、测试数据集以及对应的标签文件输入到实例分割网络中进行测试，按下式得到实例掩码Q：

Q＝σ(PW^T)

式中P为原型掩码，W为经过非极大值抑制和得分阈值处理后保留N×K大小的掩码系数，N为保留的掩码系数的个数，T为矩阵的转置，σ为sigmoid非线性激活函数，用构建预测头分支步骤(2)得到的(C，S)的定位结果对实例掩码Q进行裁剪和阈值为0.5的阈值化处理，得到细胞的实例分割。

在本发明的训练实例分割网络步骤(3)中，所述的迭代次数M最佳为200000，B最佳为8。

在本发明的保存权重文件步骤(4)中，所述的F最佳为10000。

由于本发明采用了将图片数据集分割成训练集、验证集、测试集，并采用了实例分割网络，实例分割网络是在特征金字塔网络上添加了路径增强网络构成，训练集在实例分割网络中进行训练，验证集在训练过程中进行验证，测试集利用保存训练过程中的权重文件进行测试，将图片中的细胞进行实例分割，充分地利用了图片中浅层信息，对图片中的细胞进行实例分割，解决了密集图片实例分割精度低，速度慢的问题。与现有技术相比，本发明具有方法简单、定位速度快、定位精度很高等优点，可对密集图片中的细胞进行实例分割。

附图说明

图1是本发明实施例1的流程图。

图2是本发明实施例1实例分割网络的结构示意图。

图3是PanNuKe数据集中一张医学病理图片。

图4是采用实例1方法对图3的分割结果图。

图5是本发明实施例1方法与Yolact网络的对比实验结果图。

具体实施方式

下面结合附图和实例对本发明进一步详细说明，但本发明不限于下述实施例。

实施例1

以在图片来自PanNuke数据集中取8160张离体的医学病理图片为例，本实施例的基于自下而上路径增强的细胞实例分割方法由下述步骤组成(参见图1)。

(1)数据预处理

从PanNuke数据集中取8160离体的医学病理原始图片，分为验证集、测试集、训练集，验证集与测试集、训练集的数量比为1：1：4，训练集、验证集、测试集中的图片大小为550×550像素，将训练集、验证集、测试集图片中的每个细胞提取出来生成新的包含单个细胞的掩码图片，掩码图片的大小为550×550像素，用pycocotools工具将训练集、验证集、测试集中的图片和对应数据集的掩码图片转化为标签文件。

(2)构建实例分割网络

在图2中，本实施例的实例分割网络由主干网分支(1)、预测头分支(2)、原型掩码分支(3)连接构成，主干分支(1)的输出与预测头分支(2)和原型掩码分支(3)中的输入相连，主干网分支(1)、预测头分支(2)、原型掩码分支(3)的构建方法如下：

1)构建主干网分支

a特征金字塔网络提取特征图

b融合特征图

将基础特征图集合{C1，C2，C3，C4，C5}输入到特征金字塔网络(1-2)中，进行特征融合，得到融合特征图集合{P₃，P₄，P₅，P₆，P₇}，用最近邻上采样法进行上采样，得到256通道的特征图集合，在特征金字塔网络输出的特征图上依次连接5个卷积核大小为3×3、步长为2的卷积层，构成路径增强网络(1-3)，由下式得到路径增强网络特征图集合{N₃，N₄，N₅，N₆，N₇}，构建成主干网分支(1)：

2)构建预测头分支

预测头分支包括定位分支、分类分支、掩码系数分支。

a构建定位分支

式中L_j∈{69,35,18,9,5}，j∈{1,2,3,4,5}，构建成定位分支(2-3)。

b构建分类分支

将路径增强网络特征图集合{N₃，N₄，N₅，N₆，N₇}中的每个特征图上的每个像素点设置面积依次为[24,48,96,192,384]，长与宽比分别为1、1/2、2的锚，构成锚特征图，将锚特征图输入卷积层(2-1)、卷积层(2-2)，经卷积核大小为3×3、步长为1的卷积操作，得到(A×D，L_j，L_j)的特征图，将(A×D，L_j，L_j)特征图的第一维与第三维位置进行交换，得到(L_j，L_j，A×D)的特征图，再将(L_j，L_j，A×D)的特征图第一维、第二维、第三维中的A进行相乘，得到(L_j×L_j×A，D)的预测结果，其中D表示训练集中离体的细胞类别数，将得到的(L_j×L_j×A，D)预测结果的第一维进行列拼接操作，得到(C，D)的分类结果，构建成分类分支(2-4)；本实施例的D为5，具体分为：肿瘤细胞(Neoplastic cells)、炎症细胞(Inflammatory)、软组织细胞(Soft tissue cells)、死细胞(Dead Cells)、上皮细胞(Epithelial)。

c构建掩码系数分支

将路径增强网络特征图集合{N₃，N₄，N₅，N₆，N₇}中的每个特征图上的每个像素点设置面积依次为[24,48,96,192,384]，长与宽比分别为1、1/2、2的锚，构成锚特征图，锚特征图输入卷积层(2-1)、卷积层(2-2)，经卷积核大小为3×3、步长为1的卷积操作，得到(A×K，L_j，L_j)的特征图，将(A×K，L_j，L_j)的特征图的第一维与第三维位置进行交换，得到(L_j，L_j,A×K)的特征图，再将(L_j，L_j，A×K)的特征图第一维、第二维、第三维中的A进行相乘，得到(L_j×L_j×A，K)的预测结果，其中K是生成掩码系数的个数，本实施例的K为32。将得到的(L_j×L_j×A，K)预测结果的第一维进行列拼接操作，得到(C，K)的掩码系数，构建成掩码系数分支(2-5)。

3)构建原型掩码分支

将路径增强网络特征图集合{N₃，N₄，N₅，N₆，N₇}中的N₃输入卷积层(3-1)、卷积层3-2)，经卷积核大小为3×3、步长为1的卷积操作，用最近邻上采样法将卷积后的N₃上采样到原始图片尺寸的1/4，经2次重复的卷积层(3-3)、(3-4)，得到(32,138,138)的特征图，将(32,138,138)的特征图的第一维与第三维进行位置交换，得到(138，138，32)的原型掩码P，构建成原型掩码分支(3)。

本发明采用了实例分割网络，是在特征金字塔网络上添加了路径增强网络构成，充分地利用了图片中浅层信息，对图片中的细胞进行实例分割，解决了密集图片实例分割精度低，速度慢的问题。

(3)训练实例分割网络

(a)确定损失函数

Loss＝αL_cls+βL_box+θL_mask

式中α、β、θ为三个损失的不同权重，分别为1、1.5、6.125。

(b)训练实例分割网络

(4)保存权重文件

每迭代F次保存1次权重文件，其中F≤M，得到保存权重文件；本实施例中F为10000。

(5)验证实例分割网络

(6)测试实例分割网络

Q＝σ(PW^T)

式中P为原型掩码，W为经过非极大值抑制和得分阈值处理后保留N×K大小的掩码系数，N为保留的掩码系数的个数，T为矩阵的转置，σ为sigmoid非线性激活函数，用构建预测头分支步骤(2)得到的(C，S)的定位结果对实例掩码Q进行裁剪和阈值为0.5的阈值化处理。完成对细胞实例分割，图3，图4是PanNuKe数据集中一张医学病理图片，图4是图3的实例分割结果图。由图3、4可见，本发明对离体图片中的混合细胞进行实例分割，分割成肿瘤细胞(Neoplastic cells)、炎症细胞(Inflammatory)、软组织细胞(Soft tissue cells)、死细胞(Dead Cells)、上皮细胞(Epithelial)五种细胞。

由于本发明采用了将图片数据集分割成训练集、验证集、测试集，并采用了实例分割网络，实例分割网络是在特征金字塔网络上添加了路径增强网络构成，训练集在实例分割网络中进行训练，验证集在训练过程中进行验证，测试集采用保存训练过程中的权重文件进行测试，充分地利用了图片中浅层信息，对图片中的细胞进行实例分割，解决了密集图片实例分割精度低，速度慢的技术问题。与现有技术相比，本发明具有方法简单、定位速度快、定位精度很高等优点，可对密集图片中的细胞进行实例分割。

实施例2

以在图片来自PanNuke数据集中取8160张离体的医学病理图片为例，本实施例的基于自下而上路径增强的细胞实例分割方法由下述步骤组成。

(1)数据预处理

该步骤与实施例1相同。

(2)构建实例分割网络

1)构建主干网分支

该步骤与实施例1相同。

2)构建预测头分支

预测头分支包括定位分支、分类分支、掩码系数分支。

a构建定位分支

该步骤与实施例1相同。

b构建分类分支

该步骤与实施例1相同。

c构建掩码系数分支

将路径增强网络特征图集合{N₃，N₄，N₅，N₆，N₇}中的每个特征图上的每个像素点设置面积依次为[24,48,96,192,384]，长与宽比分别为1、1/2、2的锚，构成锚特征图，锚特征图输入卷积层(2-1)、卷积层(2-2)，经卷积核大小为3×3、步长为1的卷积操作，得到(A×K，L_j，L_j)的特征图，将(A×K，L_j，L_j)的特征图的第一维与第三维位置进行交换，得到(L_j，L_j,A×K)的特征图，再将(L_j，L_j，A×K)的特征图第一维、第二维、第三维中的A进行相乘，得到(L_j×L_j×A，K)的预测结果，其中K是生成掩码系数的个数，本实施例的K为64。将得到的(L_j×L_j×A，K)预测结果的第一维进行列拼接操作，得到(C，K)的掩码系数，构建成掩码系数分支(2-5)。

3)构建原型掩码分支

该步骤与实施例1相同。

其它步骤与实施例1相同，完成对细胞实例分割。

为了验证本发明的有益效果，发明人采用本发明实施例1的方法与yolact网络进行了对比实验，用训练后的模型在PanNuke数据集同样的测试集上使用给定的评估代码测试模型精度，采用非极大值抑制不同交并比阈值的平均正确率mAP作为评价指标，实验结果见图5，在图5中，横坐标表示实例分割的目标定位mAP和实例掩码的mAP评估指标，纵坐标表示不同交并比阈值的平均正确率mAP值。由图5可见，yolact网络的目标定位mAP和实例掩码的mAP分别为32.77％和32.83％，本发明的目标定位mAP和实例掩码的mAP分别为34.03％和34.05％。

Claims

1.一种基于自下而上路径增强的细胞实例分割方法，其特征在于由下述步骤组成；

(1)数据预处理

从PanNuke数据集中取原始图片分为验证集、测试集、训练集，验证集与测试集、训练集的数量比为1：1：4，训练集、验证集、测试集中的图片大小为550×550像素，将训练集、验证集、测试集图片中的每个细胞提取出来生成新的包含单个细胞的掩码图片，掩码图片的大小为550×550像素，用pycocotools工具将训练集、验证集、测试集中的图片和对应数据集的掩码图片转化为标签文件；

(2)构建实例分割网络

1)构建主干网分支

a特征金字塔网络提取特征图

将训练集中的每张图片输入到特征金字塔网络的基础特征提取网络(1-1)中提取特征图，得到基础特征图集合{C1，C2，C3，C4，C5}；

b融合特征图

将基础特征图集合{C1，C2，C3，C4，C5}输入到特征金字塔网络(1-2)中，进行特征融合，得到融合特征图集合{P₃，P₄，P₅，P₆，P₇}，用最近邻上采样法进行上采样，得到256通道的特征图集合，在特征金字塔网络输出的特征图上依次连接5个卷积核大小为3×3、步长为2的卷积层，构成路径增强网络(1-3)，由下式得到路径增强网络特征图集合{N₃，N₄，N₅，N₆，N₇}，构建成主干网分支(1)；

式中R为rule激活函数，C₃为卷积核大小为3×3、步长为2的卷积层，U为矩阵相加，i∈{3，4，5，6，7}；

2)构建预测头分支

预测头分支包括定位分支、分类分支、掩码系数分支；

a构建定位分支

式中L_j∈{69,35,18,9,5}，j∈{1,2,3,4,5}，构建成定位分支(2-3)；

b构建分类分支

将路径增强网络特征图集合{N₃，N₄，N₅，N₆，N₇}中的每个特征图上的每个像素点设置面积依次为[24,48,96,192,384]，长与宽比分别为1、1/2、2的锚，构成锚特征图，将锚特征图输入卷积层(2-1)、卷积层(2-2)，经卷积核大小为3×3、步长为1的卷积操作，得到(A×D，L_j，L_j)的特征图，将(A×D，L_j，L_j)特征图的第一维与第三维位置进行交换，得到(L_j，L_j，A×D)的特征图，再将(L_j，L_j，A×D)的特征图第一维、第二维、第三维中的A进行相乘，得到(L_j×L_j×A，D)的预测结果，其中D表示训练集中离体的细胞类别数，将得到的(L_j×L_j×A，D)预测结果的第一维进行列拼接操作，得到(C，D)的分类结果，构建成分类分支(2-4)；

c构建掩码系数分支

将路径增强网络特征图集合{N₃，N₄，N₅，N₆，N₇}中的每个特征图上的每个像素点设置面积依次为[24,48,96,192,384]，长与宽比分别为1、1/2、2的锚，构成锚特征图，锚特征图输入卷积层(2-1)、卷积层(2-2)，经卷积核大小为3×3、步长为1的卷积操作，得到(A×K，L_j，L_j)的特征图，将(A×K，L_j，L_j)的特征图的第一维与第三维位置进行交换，得到(L_j，L_j,A×K)的特征图，再将(L_j，L_j，A×K)的特征图第一维、第二维、第三维中的A进行相乘，得到(L_j×L_j×A，K)的预测结果，其中K是生成掩码系数的个数，K为32或64；将得到的(L_j×L_j×A，K)预测结果的第一维进行列拼接操作，得到(C，K)的掩码系数，构建成掩码系数分支(2-5)；

3)构建原型掩码分支

(3)训练实例分割网络

(a)确定损失函数

Loss＝αL_cls+βL_box+θL_mask

式中α、β、θ为三个损失的不同权重，分别为1、1.5、6.125；

(b)训练实例分割网络

将训练集、对应的标签文件、ImageNet网络上的预训练模型输入到实例分割网络中进行训练，在训练过程中，设定实例分割网络的学习率γ为0.0001，优化器设定为自适应矩估计优化器，迭代M次，每次迭代使用图片的数量为B，M和B为有限正整数，训练至实例分割网络的损失函数Loss收敛；

(4)保存权重文件

每迭代F次保存1次权重文件，其中F≤M，得到保存权重文件；

(5)验证实例分割网络

将验证集和对应的标签文件输入到实例分割网络中进行验证，网络每F次进行一次验证；

(6)测试实例分割网络

Q＝σ(PW^T)

2.根据权利要求1所述的基于自下而上路径增强的细胞实例分割方法，其特征在于：在训练实例分割网络步骤(3)中，所述的迭代次数M为200000，B为8。

3.根据权利要求1所述的基于自下而上路径增强的细胞实例分割方法，其特征在于：在保存权重文件步骤(4)中，所述的F为10000。