CN115358975A

CN115358975A - 一种对脑肿瘤分割深度学习网络进行可解释分析的方法

Info

Publication number: CN115358975A
Application number: CN202210894707.6A
Authority: CN
Inventors: 陈皓; 杨雪莲; 杜方圆
Original assignee: Xian University of Posts and Telecommunications
Current assignee: Xian University of Posts and Telecommunications
Priority date: 2022-07-28
Filing date: 2022-07-28
Publication date: 2022-11-18

Abstract

本发明公开了一种基于核磁共振影像对深度学习分割网络实施可解释分析的方法，属于计算机视觉和模式识别领域。具体步骤为：1.使用分割网络对核磁共振影像进行分割计算；2.从核磁共振影像中提取放射组学特征；3.利用放射组学特征构建对分割网络进行拟合的决策树群并通过进化算法对决策树群进行结构优化；4.从树群中提取重要决策路径；5.针对需解释目标对决策路径集合进行分析，通过关联特征筛选挖掘出核心规则。本发明通过使用进化算法对决策树集合优化，提高对深度学习网络的模仿质量，优化树群结构，降低规则提取难度；所提出的关键决策路径提取方法以及关联特征筛选方法可解释深度学习网络在肿瘤边界分割过程中的决策逻辑。

Description

一种对脑肿瘤分割深度学习网络进行可解释分析的方法

技术领域

本发明属于计算机视觉和模式识别领域，具体涉及一种基于多序列磁共振影像(Magnetic Resonance Imaging，MRI)数据，通过所设计的基于进化优化的树集合模型实现对深度学习网络的可解释性分析方法。所述方法能够在降低树群的规模同时，提高树群的分割精度，有利于获取相对于随机森林更加集中的特征规律，在此基础上使用所发明的路径筛选算法在多颗树的情况下提取重要决策路径，并基于此获得关联特征实现对脑肿瘤分割深度学习网络的可解释性分析。

背景技术

脑胶质瘤是一种为大脑和脊髓胶质细胞癌变所产生的最常见的原发性颅内肿瘤。在脑肿瘤分割任务中，通常使用深度学习网络进行分割。目前，人工智能为计算机辅助诊断提供了一种更有效的方法，使诊断过程更加有效并可为大众所用。但是由于深度学习方法在医学图像处理领域中缺少可解释性，其表现与应用价值也受到了质疑。所以对模型本质的理解以及模型决策的解读在辅助医师进行脑肿瘤诊断过程中是至关重要的。

目前现有的机器学习可解释性方法可以分为内部可解释性模型和模型无关的可解释性模型。与模型无关的可解释性方法常分为两类，一种是基于样本解释，就是通过选择数据集的特定实例，对模型的行为进行解释。另一种可以使用传统的可解释性模型去近似原始的黑盒模型，例如使用决策树作为代理模型去解释模型内部的决策，但使用决策树作为代理模型，往往会受到决策树精度的影响。为了更好的全局代理，相对于决策树，集成学习模型的效果更好，但是庞大的树群让模型难以解释。基于上述问题，本发明通过利用进化优化树集合模型，使其能在与随机森林相接近的精度下，获得更少的决策路径，降低规则提取难度；同时通过设计一种树集合模型特征路径提取方法获取重要决策路径，以及关联特征提取方法获得肿瘤子区域的关联特征。该发明能够解释黑盒模型在边界分割过程中的决策逻辑，为探索和提高机器学习模型的可解释性提供了一条更有前途的途径。

发明内容

针对相关研究方法在可解释性分析中采用决策树拟合深度学习模型效果差以及基于集成学习的模型效果好但树群庞大使模型仍然难以理解等问题。本文发明了一种新的基于决策树群的树集合模型实现对深度模型的可解释性方法，该方法使用了一种进化优化算法，提取更少的决策路径，再在此基础上进行重要决策路径的提取，最后获得关联特征实现对深度学习模型的可解释性分析。为此，需要解决的关键技术包括：进化优化树集合的构造，重要路径提取，关联特征获取。

为实现上述目的，本发明的具体技术方案如下：

一种基于多序列核磁共振影像(Magnetic Resonance Imaging，MRI)数据，通过所设计的基于决策树群的模型拟合和解析计算实现对脑肿瘤分割深度学习网络的可解释分析方法，所述方法包括以下步骤：

步骤1：数据准备，具体为：

每个患者的MRI数据是可包含多个影像序列(例如T1，T1ce，T2和Flair)的多模态影像，通常脑肿瘤病灶将包含多个相异的子区域，如坏死非增强核心区(NET)、瘤周水肿区(ED)、增强核心区(ET)；

步骤2：数据预处理，具体为：使用线性函数归一化和偏置场矫正技术对图像进行预处理；

步骤3：通过进化优化过程产生基于决策树群的拟合模型，具体为：

步骤3.1：放射组学特征提取，具体为：首先，本发明中将获取像素点的patch宽度设置为10，记肿瘤子区域每个像素点的坐标为(i,j)，则肿瘤子区域的所有像素点集合P可表示为：

P＝{(i₁,j₁),(i₂,j₂),...,(i_n,j_n)}

遍历像素点集合P中每个像素点，获得当前肿瘤子区域的所有特征，包括一阶特征42维，二阶特征402维，共444维特征，然后对每个肿瘤子区域都进行此操作得到特征二维表F_P，可表示为：

F_P＝{(F_i,p_j)|0≤i≤m,0≤j≤n,p_j∈P}

其中，F_i表示特征，p_j表示像素点，i,j表示索引值，m表示444维特征，n表示像素点的个数，P表示像素点集合；

步骤3.2：初始化用于拟合计算的决策树群体，具体为：

步骤3.2.1：将特征二维表F_P作为拟合模型的输入，对需要分析的深度学习分割网络进行拟合计算，首先，生成初始化的决策树群体T₀，可表示为：

T₀＝{at₁,at₂,...,at_m,rt₁,rt₂,...,rt_n,st₁,st₂,...,st_i}

其中，at_m表示使用全部特征集生成的决策树，m代表基学习器群体中at的个数；rt_n是不依赖数据集，随机生成结点，生成的决策树；n代表基学习器群体中rt的个数；st_i是随机选择部分特征，部分数据生成的决策树，i代表st在基学习器种群中的个数，输出初始化决策树群体，群体规模为m+n+i；

步骤3.2.2：初始化集成器群体，具体为：根据步骤3.2.1的基学习器群体产生一个二进制编码群体，其中个体编码长度为m+n+i，且每个基因位唯一映射于基学习器群体中的子树，并规定基因位为1时所映射子树被选择加入二进制编码确定的一个集成器，为0则相反，使用en_len表示集成器群体的规模，dt_len表示集成器个体中包含的决策树个数，生成初始化集成器群体；

步骤3.3：利用进化搜索优化决策树群体对深度分割网络的拟合效果，具体为：

步骤3.3.1：新群体的搜索过程，具体为：首先，在子树群体内利用基于树形编码的交叉变异过程产生新的子树群体，然后在集成器群体内利用二进制编码的交叉变异运算产生新的组合群体。此过程是一个双向进化搜索的过程，将同步产生新的决策树群体及新的树群集成群体，搜索过程将在群体规模达到上限限制后停止；

步骤3.3.2：对集成器个体的拟合效果进行评估，具体为：以集成器个体对肿瘤不同子区域的分割精度和集成器中包含决策树的数目作为两个不同的评价指标进行多目标评估，保留高质量的集成器个体，删除劣势个体直到满足群体数量下限；

步骤3.3.3：达到终止条件后，根据最佳的集成器个体输出对应的决策树群，否则返回步骤3.3.1；

步骤4：对步骤3.3.3输出的决策树群中的规则进行解析，具体为：

步骤4.1：决策树集合模型特征路径提取，具体为：步骤3.3.3得到的决策树群中，寻找树群中所有决策树中可以正确预测不同肿瘤子区域的决策路径，循环遍历所有肿瘤子区域的像素块，分别获得不同肿瘤子区域决策路径集A，可表示为：

A＝{A₁,A₂,A₃,...,A_N}

其中，N表示路径集合中所有决策路径个数；

步骤4.2：重复路径筛选，具体为：输入路径集A，从路径集A中第i(i＝1,2,3....,N)条路径开始，与路径集合第i+1条路径进行比较，如果有相等的路径，则删除重复路径；直至路径集A中所有路径都不重复，输出路径集A；

步骤4.3：对需要解释的目标肿瘤子区域进行关联特征筛选，具体为：

步骤4.3.1：路径集合A中一条决策路径的特征表示如下：

其中，i表示路径集合中的路径，N表示路径集合中路径的个数，j代表第i条路径的特征，M代表第i条路径中的特征数；

步骤4.3.2：路径集合中的两条路径进行对比，具体方法如下：将路径集A中任意两条不同路径作为输入，并依次比较

与

是否相等，两条路径可表示为：

其中令p、q为1，即路径A₁、A₂上的首个特征，执行步骤4.3.3，直至所有路径均对比完毕，转至步骤4.3.5；

步骤4.3.3：若

转至步骤4.3.4，若

且q≠M，q自增1并重复本步骤，若

q＝M且p≠M，令q为1且p自增1并重复本步骤，若q＝M且p＝M，转至步骤4.3.2；

步骤4.3.4：记录当前p、q为p′和q′，令p′和q′同时自增1，直至

记录当前关联决策路径为

若SF不等于任一已保存的关联决策路径的连续子集，则保存SF，若存在已保存的关联决策路径不等于SF的任一连续子集，则删除该关联决策路径，转至步骤4.3.3；

步骤4.3.5：输出所有保存的关联决策特征，产生决策规则集。

附图说明

图1为本发明实例中基于决策树群的树集合模型的可解释性分析流程图。

图2为本发明实例中特征向量组成示意图。

图3为本发明实例中最优进化集成模型生成示意图。

图4为本发明实例中树集合模型重要决策路径提取示意图。

图5为本发明实例中重要特征提取结果图。

具体实施方法

下面结合附图并针对U-Net网络以NET和ED区域分割为例进行说明具体实施方法。以下实施例仅用于更加清楚地说明本发明的技术方案，而不能以此来限制本发明的保护范围。如图1所示的是一种基于决策树群的树集合模型的可解释性分析方法的过程，其实现具体步骤如下：

步骤1：输入原始的MRI四个序列图像，训练U-Net网络得到分割结果图；

步骤2：使用U-Net网络分割结果+MRI数据中4种序列图像对NET和ED区域进行影像组学特征提取都为444维，组成特征二维表F_P，每个像素点的特征向量结果参照图2；

步骤3：参考图3，基于特征二维表F_P作为输入，生成初始化决策树群体和集成器群体，然后利用进化算法优化拟合模型，根据最佳的集成器个体输出对应的决策树群；

步骤3：对拟合U-Net网络的决策树群模型进行可解释分析，具体为步骤4和步骤5；

步骤4：参考图4，输入进化优化的决策树集合模型，使用决策树集合模型路径提取算法分别对ED和NET区域进行路径提取；

步骤5：输入提取的决策路径，使用关联特征筛选算法，分别在ED和NET区域中获得重要的关联路径，结果参考图5。

Claims

1.一种基于多序列核磁共振影像(Magnetic Resonance Imaging，MRI)数据，通过所设计的基于决策树群的模型拟合和解析计算实现对脑肿瘤分割深度学习网络的可解释分析方法，所述方法包括以下步骤：