CN108960260A

CN108960260A - 一种分类模型生成方法、医学影像图像分类方法及装置

Info

Publication number: CN108960260A
Application number: CN201810765946.5A
Authority: CN
Inventors: 王晓婷; 栾欣泽; 孟健; 何光宇
Original assignee: Neusoft Corp
Current assignee: Neusoft Corp
Priority date: 2018-07-12
Filing date: 2018-07-12
Publication date: 2018-12-07
Anticipated expiration: 2038-07-12
Also published as: CN108960260B

Abstract

本申请实施例公开了一种分类模型生成方法、医学影像图分类方法及装置，该方法首先获取原始医学影像图像，再提取原始医学影像图像的至少一种图像特征，和/或，生成原始医学影像图像对应的至少一种变换图像，分别构成多组训练数据，利用每组训练数据训练生成一个基础分类模型，由各个基础分类模型共同构成医学影像图像分类模型，各个基础分类模型均具有各自的权重值，所生成的医学影像图像分类模型可以对医学影像图像进行分类，且分类的结果消除了主观性的影响，也更为准确。同时，本申请实施例可以针对任意类型的医学影像图像分别构建医学影像图像分类模型，构建医学影像图像分类模型的方式具有通用性。

Description

一种分类模型生成方法、医学影像图像分类方法及装置

技术领域

本申请涉及图像处理技术领域，具体涉及一种分类模型生成方法及装置，一种医学影像图像分类方法及装置。

背景技术

随着信息采集技术的发展以及大数据的普及，可以通过对采集的图像进行处理以获得有效信息。例如，目前已经出现一些利用智能终端设备对人体如舌体、眼底等部位进行图像采集的方案，给人们对人体的信息采集带来了极大的方便。

在现有技术中，采集到的原始医学影像图像可以传输给专业人员进行判断，例如判断舌体图像的属性、判断眼底图像的视网膜类型等等，但是人工判断的主观性强、难以量化，且效率较为低下，因此，在现有技术中缺乏对原始医学影像图像中进行快速、准确分类的方式。

发明内容

有鉴于此，本申请实施例提供一种分类模型生成方法及装置，一种医学影像图像分类方法及装置，以解决现有技术中无法快速、准确对医学影像图像进行分类的技术问题。

为解决上述问题，本申请实施例提供的技术方案如下：

一种分类模型生成方法，所述方法包括：

获取原始医学影像图像；

提取所述原始医学影像图像的至少一种图像特征，将所述原始医学影像图像的每种图像特征以及所述原始医学影像图像对应的分类标签作为一组第一训练数据；和/或，生成所述原始医学影像图像对应的至少一种变换图像，将所述原始医学影像图像对应的每种变换图像以及所述原始医学影像图像对应的分类标签作为一组第二训练数据；

根据每一组第一训练数据分别对初始分类模型进行训练，分别生成一个基础分类模型；和/或，根据每一组第二训练数据分别对初始深度学习模型进行训练，分别生成一个基础分类模型；

由各个所述基础分类模型共同构成医学影像图像分类模型，所述各个所述基础分类模型具有各自的权重值。

在一种可能的实现方式中，所述生成所述原始医学影像图像对应的至少一种变换图像，包括：

生成所述原始医学影像图像对应的尺度变换图像；

生成所述原始医学影像图像对应的旋转图像和/或镜像图像；

生成所述原始医学影像图像对应的亮度调节图像。

在一种可能的实现方式中，所述图像特征包括尺度不变特征变换特征，所述根据每一组第一训练数据分别对初始分类模型进行训练，分别生成一个基础分类模型，包括：

获取所述第一训练数据中所述原始医学影像图像的尺度不变特征变换特征；

根据所述原始医学影像图像的尺度不变特征变换特征计算词袋模型；

利用所述词袋模型以及所述原始医学影像图像对应的分类标签对支持向量机模型进行训练，生成一个基础分类模型。

在一种可能的实现方式中，各个所述基础分类模型的权重根据每个所述基础分类模型的基础分类结果对应的概率排序进行设置。

一种医学影像图像分类方法，所述方法包括：

获取待分类医学影像图像；

提取所述待分类医学影像图像的至少一种图像特征；和/或，生成所述待分类医学影像图像对应的至少一种变换图像；

将所述待分类医学影像图像的每种图像特征和/或每种变换图像分别输入医学影像图像分类模型中对应的基础分类模型，获得至少一个基础分类结果；所述医学影像图像分类模型是上述的分类模型生成方法所生成的；

根据各个所述基础分类模型的权重，对所述基础分类结果进行加权投票确定所述待分类医学影像图像的分类结果。

在一种可能的实现方式中，所述图像特征包括尺度不变特征变换特征。

在一种可能的实现方式中，所述生成所述待分类医学影像图像对应的至少一种变换图像，包括：

生成所述待分类医学影像图像对应的尺度变换图像；

生成所述待分类医学影像图像对应的旋转图像和/或镜像图像；

生成所述待分类医学影像图像对应的亮度调节图像。

一种分类模型生成装置，所述装置包括：

获取单元，用于获取原始医学影像图像；

训练数据生成单元，包括提取单元和/或生成单元；

所述提取单元，用于提取所述原始医学影像图像的至少一种图像特征，将所述原始医学影像图像的每种图像特征以及所述原始医学影像图像对应的分类标签作为一组第一训练数据；

所述生成单元，用于生成所述原始医学影像图像对应的至少一种变换图像，将所述原始医学影像图像对应的每种变换图像以及所述原始医学影像图像对应的分类标签作为一组第二训练数据；

训练单元包括第一训练单元和/或第二训练单元；

所述第一训练单元，用于根据每一组第一训练数据分别对初始分类模型进行训练，分别生成一个基础分类模型；

所述第二训练单元，用于根据每一组第二训练数据分别对初始深度学习模型进行训练，分别生成一个基础分类模型；

构成单元，用于由各个所述基础分类模型共同构成医学影像图像分类模型，所述各个所述基础分类模型具有各自的权重值。

在一种可能的实现方式中，所述生成单元具体用于：

生成所述原始医学影像图像对应的尺度变换图像；

生成所述原始医学影像图像对应的旋转图像和/或镜像图像；

生成所述原始医学影像图像对应的亮度调节图像，将所述原始医学影像图像对应的每种变换图像以及所述原始医学影像图像对应的分类标签作为一组第二训练数据。

在一种可能的实现方式中，所述图像特征包括尺度不变特征变换特征，所述第一训练单元具体包括：

获取子单元，用于获取所述第一训练数据中所述原始医学影像图像的尺度不变特征变换特征；

计算子单元，用于根据所述原始医学影像图像的尺度不变特征变换特征计算词袋模型；

训练子单元，用于利用所述词袋模型以及所述原始医学影像图像对应的分类标签对支持向量机模型进行训练，生成一个基础分类模型。

一种医学影像图像分类装置，所述装置包括：

获取单元，用于获取待分类医学影像图像；

第一提取单元包括第二提取单元和/或生成单元；

所述第二提取单元，用于提取所述待分类医学影像图像的至少一种图像特征；

所述生成单元，用于生成所述待分类医学影像图像对应的至少一种变换图像；

分类单元，用于将所述待分类医学影像图像的每种图像特征和/或每种变换图像分别输入医学影像图像分类模型中对应的基础分类模型，获得至少一个基础分类结果；所述医学影像图像分类模型是根据权利要求10-14任一项所述的分类模型生成装置所生成的；

确定单元，用于根据各个所述基础分类模型的权重，对所述基础分类结果进行加权投票确定所述待分类医学影像图像的分类结果。

在一种可能的实现方式中，所述生成单元具体用于：

生成所述待分类医学影像图像对应的尺度变换图像；

生成所述待分类医学影像图像对应的亮度调节图像。

一种计算机可读存储介质，所述机算机可读存储介质中存储有指令，当所述指令在终端设备上运行时，使得所述终端设备执行上述的分类模型生成方法或者上述的医学影像图像分类方法。

一种计算机程序产品，所述计算机程序产品在终端设备上运行时，使得所述终端设备执行上述的分类模型生成方法或者上述的医学影像图像分类方法。

由此可见，本申请实施例具有如下有益效果：

本申请实施例通过提取原始医学影像图像的至少一种图像特征，和/或，生成原始医学影像图像对应的至少一种变换图像，分别构成多组训练数据，利用每组训练数据训练生成一个基础分类模型，对各个基础分类模型加权融合可以生成医学影像图像分类模型，所生成的医学影像图像分类模型可以对医学影像图像进行分类，且分类的结果消除了主观性的影响，也更为准确。同时，本申请实施例可以针对任意类型的医学影像图像分别构建医学影像图像分类模型，构建医学影像图像分类模型的方式具有通用性。

附图说明

图1为本申请实施例提供的一种分类模型生成方法流程图；

图2为本申请实施例提供的分类模型训练流程图；

图3为本申请实施例提供的一种基础分类模型生成方法流程图；

图4为本申请实施例提供的最近邻算法示意图；

图5为本申请实施例提供的一种医学影像图像分类方法流程图；

图6为本申请实施例提供的一种分类模型生成装置结构图；

图7为本申请实施例提供的一种医学影像图像分类装置结构图。

具体实施方式

为使本申请的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本申请实施例作进一步详细的说明。

为便于理解本申请提供的技术方案，下面将对本申请技术方案的研究背景进行简单说明。

近年来，随着计算机技术的不断发展，人们可以利用更先进的技术对采集的图像进行处理以获得有效信息。例如，可以利用自带摄像头手机等智能终端对人体如舌体、眼睛等部位进行图像采集的方案，给人们对人体的信息采集带来了极大的方便。

但是，目前针对采集到的原始医学影像图像，仍然只能依靠专业人员进行判断，这种人工判断的方式主观性强、效率较为低下，且对原始医学影像图像的分类识别的准确率不高。

基于此，本申请提出了一种分类模型生成方法、医学影像图像分类方法及装置，训练生成医学影像图像分类模型，并利用该模型对医学影像图像进行分类，从而实现自动且快速地对医学影像图像进行分类，且分类结果消除了主观性的影响，也更为准确。

下面结合附图对本申请实施例提供的分类模型生成方法进行说明。

参见图1，其示出了本申请实施例提供的一种分类模型生成方法的流程图，如图1所示，该方法可以包括：

S101：获取原始医学影像图像。

在实际应用中，为了实现对医学影像图像进行分类，首先需要通过训练生成一种分类模型，而在分类模型的生成过程中，首先需要获取原始医学影像，其中，原始医学影像图像为可以用来进行分类模型训练的一组基本图像，该基本图像可以通过专用的设备进行拍摄得到。

可以理解的是，针对不同项目的医学检查可能会生成不同种类的医学影像图像，例如，针对舌体检查时，可以生成舌体原始医学影像图像、针对眼底检查，可以生成眼底原始医学影像图像。

在实际应用中，针对不同种类的医学影像图像，可以分别进行训练，以生成与该种类医学影像图像对应的分类模型。例如，针对舌体原始医学影像图像，将获取的所有舌体原始医学影像图像作为训练数据训练可以生成舌体医学影像图像分类模型；针对眼底原始医学影像图像，将获取的所有眼底原始医学影像图像作为训练数据，可以生成眼底视网膜医学影像图分类模型。

本实施例中，为了提高生成分类模型的分类准确性，在获取原始医学影像图像时，可以获取大量的原始医学影像图像，然后利用大量的原始医学影像图像执行S102。例如，在训练生成舌体医学影像图像分类模型时，可以获取100幅舌体原始医学影像图像；在训练生成眼底视网膜医学影像图像分类模型时，可以获取100幅眼底原始医学影像图像。

S102：提取原始医学影像图像的至少一种图像特征，将原始医学影像图像的每种图像特征以及原始医学影像图像对应的分类标签作为一组第一训练数据；和/或，生成原始医学影像图像对应的至少一种变换图像，将原始医学影像图像对应的每种变换图像以及原始医学影像图像对应的分类标签作为一组第二训练数据。

本实施例中，通过S101，获取到原始医学影像图像后，并不直接用于训练生成分类模型，而是需要提取的图像体征，和/或，生成原始医学影像图像对应的变换图像，从而将提取的图像特征或变换图像作为训练数据执行S103，增加训练数据的多样性。其中，原始医学影像图像的图像特征指的是将原始医学影像图像转换成一组具有明显物理特征向量，实现降维效果，进而可以利用提取的图像特征执行S103；变换图像指的是将原始医学影像图像利用变换算法转换成另一种图像，进而利用变换图像执行S103。

在具体实现时，原始医学影像图像的图像特征可以包括尺度不变特征变换特征，实际应用时，对于不同的医学影像图像其对应的图像特征除了尺度不变特征变换特征外，还可以包括其他图像特征，例如，针对舌体原始医学影像图像，其对应的图像特征还可以包括方向梯度直方图特征；对于眼底原始医学影像图像，其对应的图像特征还可以包括角点检测特征。其中，对于提取原始医学影像图像的图像特征的具体实现方式将在后续实施例中详细说明。

当对原始医学影像图像进行至少一种图像特征提取时，将每一种图像特征与原始医学影像图像对应的分类标签作为一组第一训练数据，从而获得至少一组第一训练数据。例如，获取100幅舌体原始医学影像图像，每幅图像已预先标注分类标签，分别对100幅舌体原始医学影像图像进行尺度不变特征变换特征提取和方向梯度直方图特征提取，其中，尺度不变特征变换特征以及舌体原始医学影像图像对应的分类标签为第一组第一训练数据；方向梯度直方图特征以及舌体原始医学影像图像对应的分类标签为第二组第一训练数据，则根据两组第一训练数据执行S103。

本实施例中，变换图像可以包括尺度变换图像、旋转图像和/或镜像图像以及亮度调节图像中的一种，生成原始医学影响图像对应的变换图像的具体实现方式将在后续实施例中详细说明。当针对原始医学影像图像生成至少一种变换图像时，则针对每一种变换图像以及原始医学影像图像对应的分类标签作为一组第二训练数据，从而获得至少一组第二训练数据。

在实际应用中，可以利用获得的第一训练数据执行S103，也可以利用生成的第二训练数据执行S103，当然也可以利用第一训练数据和第二训练数据共同执行S103，本实施例对训练数据的种类数量不做限定。

本实施例中，原始医学影像图像对应的分类标签为预先标注，用于表征该图像的类别。针对不同的原始医学影像图像可以根据该原始医学影像图像的特征进行不同分类。

例如，针对舌体原始医学影像图像，可以对舌质颜色进行分类，则舌体原始医学影像图像对应的分类标签为预先标注的舌质颜色分类对应的标签，舌质颜色分类一般可以分为淡白、淡红、红、绛、紫、青等六类，则相应的，舌体原始医学影像图像对应的舌质颜色分类标签也可以使用不同的字符进行标识，例如标签1对应的舌质颜色为淡白、标签2对应的舌质颜色为淡红、标签3对应的舌质颜色为红、标签4对应的舌质颜色为绛、标签5对应的舌质颜色为紫、标签6对应的舌质颜色为青。

又例如，针对眼底原始医学影像图像，可以对视网膜类型进行分类，则眼底原始医学影像图像对应的分类标签为预先标注的视网膜类型对应的标签，例如，视网膜分类一般可以分为出现小出血点的视网膜、出现出血斑的视网膜、出现棉绒斑的视网膜、出现新生血管的视网膜、出现纤维增值的视网膜、出现网膜脱离的视网膜等六类，则相应的，眼底训练图像对应的视网膜分类标签也可以使用不同的字符进行标识，例如标签1对应标识出现小出血点的视网膜、标签2对应标识出现出血斑的视网膜、标签3对应标识出现棉绒斑的视网膜、标签4对应标识出现新生血管的视网膜、标签5对应标识出现纤维增殖的视网膜、标签6对应标识出现网膜脱离的视网膜。

需要说明的是，对于原始医学影像图像对应的具体分类以及分类所对应的标签形式均可根据实际情况进行设置，本申请实施例对此不进行限定。

S103：根据每一组第一训练数据分别对初始分类模型进行训练，分别生成一个基础分类模型；和/或，根据每一组第二训练数据分别对初始深度学习模型进行训练，分别生成一个基础分类模型。

本实施例中，通过S102，获取训练数据后，可以根据一组第一训练数据中的图像特征以及分类标签对初始分类模型进行训练，生成一个基础分类模型，从而如果有多组第一训练数据，则可以生成多个基础分类模型；和/或，根据一组第二训练数据中的变换图像以及分类标签对初始深度学习模型进行训练，生成一个基础分类模型，从而如果有多组第二训练数据，则可以生成多个基础分类模型，然后，根据生成的基础分类模型执行S104。

本实例中，一种可选的实现方式是，本申请中的初始分类模型可以为支持向量机支持向量机(Support Vector Machine，简称SVM)模型，基于其算法的简单性以及较强的鲁棒性，能够进一步提高分类结果的准确性，对于训练初始分类模型的具体实现方式将在后续进行说明。

本实施例中，一种可选的实现方式是，本申请中的初始深度学习模型可以为一种谷歌网络模型(GoogLeNet)，该模型为一个22层的深度网络，在不增加计算负载的情况下，可以较好地利用计算资源增加网络的宽度和深度，进而能够提高基础分类模型分类结果的准确性。

S104：由各个基础分类模型共同构成医学影像图像分类模型，其中，各个基础分类模型具有各自的权重值。

本实施例中，可以预先为通过S103获得的多个基础分类模型分配权重，然后将各个基础分类模型共同构成医学影像图像分类模型。

本实施例中，一种可选的实施方式是，各个基础分类模型的权重可以根据每个基础分类模型的基础分类结果对应的概率排序进行设置。基础分类模型在输出某一基础分类结果的同时，还可以得到输出该基础分类结果的可能性的概率值。在对各个基础分类模型的权重进行分配时，可以根据每个基础分类模型输出的基础分类结果对应的概率从大到小分配权重，也就是说，基础分类模型的基础分类结果对应的概率越大，说明该基础分类模型分类的分类准确性越高，则该基础分类模型对应的权重也越大。另外，可以设置各个基础分类模型的权重相加为1。

例如，针对舌体原始医学影像图像，共生产4个基础分类模型，基础分类模型1的基础分类结果为淡白色，该基础分类结果的概率为0.9；基础分类模型2的基础分类结果为淡红色，该基础分类结果的概率为0.8；基础分类模型3的基础分类结果为红色，该基础分类结果的概率为0.7；基础分类模型4的基础分类结果为紫色，该基础分类结果的概率为0.6，则根据各基础分类模型输出基础分类结果的概率，可以按照基础分类模型1-4的权重依次递减来设置各基础分类模型的权重，如基础分类模型1的权重值为0.4、基础分类模型2的权重值为0.3、基础分类模型3的权重值为0.2、基础分类模型4的权重值为0.1。

然后，各个基础分类模块可以共同构成医学影像图像分类模型，在医学影像图像分类模型的使用过程中，可以将各基础分类模型产生的基础分类结果以及各基础分类模型的权重，加权投票确定出医学影像图像分类模型的分类结果，各基础分类模型产生基础分类结果以及加权投票确定医学影像图像分类模型的分类结果的过程可以参见后续实施例的说明。

由上述实施例可以看出，本申请实施例通过提取原始医学影像图像的至少一种图像特征，和/或，生成原始医学影像图像对应的至少一种变换图像，分别构成多组训练数据，利用每组训练数据训练生成一个基础分类模型，对各个基础分类模型加权融合可以生成医学影像图像分类模型，所生成的医学影像图像分类模型可以对医学影像图像进行分类，且分类的结果消除了主观性的影响，也更为准确。同时，本申请实施例可以针对任意类型的医学影像图像分别构建医学影像图像分类模型，构建医学影像图像分类模型的方式具有通用性。

参见图2，其示出了本申请实施例提供的一种分类模型训练的示例性流程图，如图2所示，在分类模型训练的过程中，本申请实施例可以首先需要获取带有标签的原始医学影像图像，然后，可以对原始医学图像进行尺度不变特征变换(Scale-invariant featuretransform，简称SIFT)特征提取，获得一种图像特征，同时，可以生成原始医学影像图像的尺度变换图像、旋转图像和亮度调节图像，再将图像特征和原始医学影像图像对应的分类标签作为一组第一训练数据训练SVM模型，得到基础分类模型1、分别利用尺度变换图像和原始医学影像图像对应的分类标签作为第一组第二训练数据、旋转图像和原始医学影像图像对应的分类标签作为第二组第二训练数据以及亮度调节图像和原始医学影像图像对应的分类标签作为第三组第二训练数据训练训练GooLeNet模型，得到基础分类模型2、基础分类模型3、基础分类模型4，最后，将4个基础分类模型进行加权融合，生成医学影像图像分类模型。

在本申请的一些可能的实现方式中，S102中提取原始医学影像图像的至少一种图像特征包括尺度不变特征变换特征。

当S102所提取的原始医学影像图像的图像特征为尺度不变特征变换特征是，则S103中根据每一组第一训练数据分别对初始分类模型进行训练，分别生成一个基础分类模型的具体实现方式可以通过下述实施例实现。

参见图3，其示出了一种可选的实施方式，生成基础分类模型可以包括：

S301：获取第一训练数据中原始医学影响图像的尺度不变特征变换特征。

本实施例中，如图2所示，对原始医学影像图像进行SIFT特征提取，以获得原始医学影像图像的尺度不变特征变换特征。下面，将对SIFT特征提取的具体实施方式进行说明。

SIFT特征是用于图像处理领域的一种描述。SIFT是利用原始图像与高斯核的卷积来建立尺度空间，并在高斯差分空间金字塔上提取出尺度不变性的特征点。该算法具有一定的仿射不变性，视角不变性，旋转不变性和光照不变性，所以在图像特征提取方面得到了最广泛的应用。

而SIFT特征提取算法的实现过程大致为：

(1)高斯差分金字塔的构建；

(2)特征点的搜索；

(3)特征描述。

在实际应用中，结合上述SIFT特征提取算法的实现大致过程，对原始医学影像图像进行SIFT特征提取的具体每一步的详细过程如下：

(1)在本申请的高斯差分金字塔的构建过程中，利用组与层的结构构建了一个具有线性关系的金字塔结构，以便可以在连续的高斯核尺度上查找特征点。

(2)在本申请的特征点搜索过程中，主要的关键步骤是极值点的插值，因为在离散的空间中，局部极值点可能并不是真正意义上的极值点，真正的极值点可能落在了离散点的缝隙中。所以要对这些缝隙位置进行插值，然后再求极值点的坐标位置。

(3)在本申请的特征描述过程中，特征点的方向的求法是需要对特征点邻域内的点的梯度方向进行直方图统计，选取直方图中比重最大的方向为特征点的主方向，还可以选择一个辅方向。在计算特征矢量时，需要对局部图像进行沿主方向旋转，然后再进邻域内的梯度直方图统计(4x4x8)。

进而可以通过SIFT特征提取算法获取到图像的特征向量，可以用[b₁,…,b_n]表示，进一步的，可继续执行S302。

该算法具有一定的仿射不变性，视角不变性，旋转不变性和光照不变性，在对图像进行特征提取后，有助于后续提高分类识别的准确率。

S302：根据原始医学影像图像的尺度不变特征变换特征计算词袋模型。

通过S301，获取原始医学影像图像的尺度不变特征变换特征，利用该尺度不变特征变换特征计算词袋模型，利用词袋模型量化图像特征，得到图像视觉单词特征直方图，以简化图像特征。

其中，词袋模型的基本原理是将文档看作一个装满词语的袋子，忽略词语间的顺序和句法，每个词语的出现并不依赖于其他词语，均为独立。词袋模型需要建立一个包含所有有意义词语的词典，每篇文档可以表示成词典中单词的直方图。

将词袋模型引入到图像处理领域，即将图像看作是一篇文档，将图像中的大量局部特征量化为有限个数视觉单词，每幅图像表示为视觉单词的直方图。计算词袋模型即为生成词典的过程，主要包括以下两个步骤：

(1)特征提取和描述

在该步骤中，主要是从图像中提取具有代表性的局部特征，作为图像的描述，即通过S301，进行SIFT特征提取获得原始医学影像图像中具有代表性的局部特征。

(2)词典生成

词典生成的本质主要是适当地划分整个特征空间，将落入同一划分区间的特征向量视为同一个视觉单词可以表达的范围。主要采用K-means聚类将SIFT特征聚成若干类，每一类的类中心即为视觉单词，所有的视觉单词构成视觉词典，视觉词典的大小即为视觉单词的数量。

本实施例中，当计算完成词袋模型后，则利用词袋模型执行S303。

S303：利用词袋模型以及原始医学影像图像对应的分类标签对支持向量机模型进行训练，生成一个基础分类模型。

通过S301，获得词袋模型后，可以根据词袋模型以及原始医学影像图像对应的分类标签对初始分类模型(支持向量模型)进行训练，以获得基础分类模型。

在实际应用时，对于提取的图像SIFT特征，用最近邻查找方法在词典中查找距离该特征最近的聚类中心，查找结果为该图像特征对应的视觉单词，然后统计图像中视觉单词出现的次数，得到图像视觉单词直方图，根据该图像视觉单词直方图以及对应的分类标签输入支持向量机模型中，对输入的不同特征进行分类，从而生成一个基础分类模型。

其中，支持向量机(Support Vector Machine，简称SVM)模型为特征空间上间隔最大的线性分类器，其核心思想是通过在特征空间中寻找最优分类超平面，从而对空间中的不同特征进行分类。

需要说明的是，本实施例中初始分类模型还可以为人工神经网络ArtificialNeural Network，简称ANN)模型，从而可以利用人工神经网络具有的较强鲁棒性和容错性，以及非线性映射能力解决非线性、样本数量较大的复杂模型的进行训练，生成基础分类模型。具体实现过程可以参见S101-S104，本实施例在此不再赘述。

通过本实施例提取原始医学影像图像的SIFT特征，根据SIFT特征计算词袋模型，利用词袋模型以及预先标注的分类标签对支持向量机进行训练生成基础分类模型，提高了基础分类模型的分类性能，从而为生成医学影像图像分类模型提供准确的基础分类模型。

在本申请的一些可能的实现方式中，S102中生成原始医学影像图像对应的至少一种变换图像包括尺度变换图像、旋转图像和/或镜像图像以及亮度调节图像，下面将分别介绍各种变换图像的生成。

(一)尺度变换图像

在实际应用时，可以采用尺度变化处理方法对原始医学影像图像进行尺度变化处理以生成原始医学影像图像对应的尺度变换图像，在具体实现时，可以采用双线性插值算法，该算法又称双性内插法。在数学上，双线性插值是有两个变量的插值函数的线性插值扩展，其核心思想是在两个方向分别进行一次线性插值。

假如想得到未知函数f在点P＝(x,y)的值，假设已知函数f在Q₁₁＝(x₁,y₁)，Q₁₂＝(x₁,y₂)，Q₂₁＝(x₂,y₁)及Q₂₂＝(x₂,y₂)四个点的值。

首先在x方向进行线性插值，得到：

其中，R₁＝(x,y₁)。

其中，R₂＝(x,y₂)。

然后，在y方向进行线性插值，得到：

这样，就得到所要的结果f(x,y)如下：

如果选择一个坐标***使得f的四个已知点坐标分别为(0，0)、(0，1)、(1，0)和(1，1)，那么对应的插值公式就可以简化为：

f(x,y)≈f(0,0)(1-x)(1-y)+f(1,0)x(1-y)+f(0,1)(1-x)y+f(1,1)xy

或者用矩阵运算表示为:

这种插值方法的结果通常不是线性的，线性插值的结果与插值的顺序无关。首先进行y方向的插值，然后进行x方向的插值，所得到的结果是一样的。

(二)旋转图像和/或镜像图像

其中，旋转图像可以通过对原始医学影像图像进行不同角度的旋转得到，在具体实现时，可以使用最近邻法进行旋转。最近邻法是将变换后的图像中的原像素点最邻近像素的灰度值赋给原像素点的方法。

为便于理解最近邻法，参见图4，共划分四个邻像素分别为A、B、C和D，待求像素坐标为(i+u，j+v)，其中，i，j为正整数，u和v大于零且小于1。如果u<0.5，v<0.5，即(i+u，j+v)落入A区中，则将左上角(i，j)像素的灰度值赋给待求像素；当0.5<u<1，v<0.5，落入B区，则将右上角(i+1，j)像素的灰度值赋给待求像素；当u<0.5，0.5<u<1，落入C区，则将左下角(i，j+1)像素的灰度值赋给待求像素；当0.5<u<1，0.5<v<1，落入D区，则将右下角(i+1，j+1)像素的灰度值赋给待求像素，经过上述处理后，得到旋转图像。

镜像图像是经过镜像处理获得的图像，镜像处理是指将原始医学影像图像沿垂直轴左右翻转。

(三)亮度调节图像

在实际应用时，首先判断获取的原始医学影像图像为彩色图像还是灰度图像，如果为灰度图像，则无需进行亮度调节，直接将获取的原始医学影像图像和对应的分类标签作为第二训练数据执行S103。当为彩色图像时，则对原始医学影像图像进行亮度调节处理，具体包括以下步骤：

(1)计算图像的RGB像素均值M；

(2)图像中每个像素点减去M，获得像素点P；

(3)将像素点P乘以对比度系数a，得到像素点Q，其中，a的取值范围在[0，4]；

(4)像素点Q与M相加，再乘以亮度系数b，其中，b的取值范围在[0,2]；

(5)将计算获得的像素值对图像中对应的像素点重新赋值。

对获取的所有原始医学影像图像均进行上述处理，生成亮度调节图像，将亮度调节图像和原始医学影像图像对应的分类标签作为一组第二训练数据执行S103。

通过上述方式对原始医学影像图像进行尺度变换、旋转处理和/或亮度调节处理后，可生成与原始医学影像图像对应的变换图像，从而增加训练数据的多样性，提高基础分类模型的分类准确性。

进而，通过S103，可以利用变换图像中一种或多种作为训练图像以及原始医学影像图像对应的分类标签训练初始深度学习模型，以生成基础分类模型。

在本申请实施例中，初始深度学习模型可以为GoogLeNet模型，该GoogLeNet模型的总体架构如下：

(1)包括Inception模块的所有卷积，都用了修正线性单元(ReLU)；

(2)采用RGB彩色通道，且RGB颜色空间为224×224，并减去均值；

(3)#3x3reduce和#5x5reduce分别表示3x3和5x5的卷积前缩减层中1x1滤波器的个数；pool proj表示嵌入的max-pooling之后的投影层中1x1滤波器的个数；缩减层和投影层都要用ReLU；

(4)网络包含22个带参数的层(如果考虑pooling层就是27层)，独立成块的层总共有约有100个；

(5)网络中间的层次生成的特征会具有区分性，给这些层增加一些辅助分类器。这些分类器以小卷积网络的形式放在Inception(4a)和Inception(4b)的输出上。在训练过程中，损失会根据折扣后的权重(折扣权重为0.3)叠加到总损失中。

在具体的模型训练过程中，本申请首先利用第二训练数据集合imagnet数据集对上述GoogLeNet模型进行训练，生成训练后的模型，作为基础分类模型，作为通用分类模型，进而可继续执行步骤S104。

其中，本申请通过大量实验确定出：在针对眼底训练图像进行训练时，采用的是异步随机梯度下降，动量为0.9，学习率每8个epoch下降4％。图像采样的patch大小从图像的8％到100％，选取的长宽比在3/4到4/3之间，从而使得光度扭曲有利于减少过拟合，并且还使用双线性插值法方法结合其他超参数的改变来调整图像大小。

通过上述方式可知，本申请采用的GoogLeNet模型是一个22层的深度网络，可以将全连接层变为稀疏连接层，从而解决了深度和宽度受限的问题，进而能够提高视网膜分类模型分类结果的准确性。

以上为本申请实施例提供的一种分类模型生成方法的具体实现方式，基于上述实施例中的医学影像图像分类模型，本申请实施例还提供了一种医学影像图像分类方法。

参见图5，其示出了本申请实施例提供的一种医学影像图像分类方法的流程图，如图5所示，该方法包括：

S501：获取待分类医学影像图像。

在实际应用中，基于上述实施例生成的医学影像图像分类模型，可以对获取的医学影像图像进行分类，在分类过程中，首先需要获取待分类医学影像图像，待分类医学影像图像与原始医学影像图像类似，相关说明可以参见上述实施例的S101所述内容，在此不再赘述，根据获取的待分类医学影像图像，执行S502。

S502：提取待分类医学影像图像的至少一种图像特征；和/或，生成待分类医学影像图像对应的至少一种变换图像。

本实施例中，可以对获取的待分类医学影像图像进行图像特征提取，以及对待分类医学影像图像进行变换，从而可以得到至少一种图像特征和/或至少一种变换图像，进而执行S503。

其中，一种可选的实现方式是，图像特征可以包括尺度不变特征变换特征，变换图像可以包括尺度变换图像、旋转图像和/或镜像图像、亮度调节图像。也就是说，可以提取待分类医学影像图像的尺度不变特征变换特征，生成尺度变换图像、旋转图像和/或镜像图像、亮度调节图像中的一种或多种，作为输入数据执行S503。

可以理解的是，提取待分类医学影像图像的图像特征，或者生成待分类医学影像图像的变换图像，需要与训练生成基础分类模型的数据类型相一致，例如，若训练初始分类模型包括尺度不变特征变换特征，则也需对待分类医学影像图像进行尺度不变特征变换特征提取，同理，若训练初始深度学习模型包括尺度变换图像和镜像图像时，则生成待分类医学影像图像的尺度变换图像和镜像图像。

需要说明的是，对于提取尺度不变特征变换特征以及生成不同变换图像的具体实现可以参见上述实施例，在此不再赘述。

S503：将待分类医学影像图像的每种图像特征和/或每种变换图像分别输入医学影像图像分类模型中对应的基础分类模型，获得至少一个基础分类模型结果。

本实施例中，将获取的待分类医学影像图像的图像特征和/或变换图像输入医学影像图像模型中与图像特征或变换图像对应的基础分类模型，从而获得基础分类结果。

例如，在上述实施例中利用原始医学影像图像的尺度不变特征变换特征训练初始分类模型生成基础分类模型1，利用原始医学影像图像的尺度变换图像训练初始深度学习模型生成基础分类模型2，利用原始医学影像图像的亮度调节图像训练初始深度学习模型生成基础分类模型3，利用原始医学影像图像的旋转图像训练初始深度学习模型生成基础分类模型4，则基础分类模型1、基础分类模型2、基础分类模型3和基础分类模型4加权融合成医学影像图像模型。

通过S502获取待分类医学影像图像的尺度不变特征变换特征，则将获取的尺度不变特征变换特征作为输入数据输入至基础分类模型1中，获得基础分类结果1；将获取的待分类医学影像图像的尺度变换图像作为输入数据输入至基础分类模型2中，获得基础分类结果2；将获取的待分类医学影像图像的亮度调节图像，作为输入数据输入至基础分类模型3中，获得基础分类结果3；将获取的待分类医学影像图像的旋转图像作为输入数据输入至基础分类模型4中，获得基础分类结果4。

其中，医学影像图像分类模型是根据上述实施例中的分类模型生成方法生成的。

S504：根据各个基础分类模型的权重，对基础分类结果进行加权投票确定待分类医学影像图像的分类结果。

通过S503，获取各个基础分类模型对应的基础分类结果，对基础分类结果进行投票，并将票数最高的基础分类结果作为待分类医学影像图像的分类结果。其中，投票过程可以根据各个基础分类模型的权重对基础分类模型对应的投票数进行设置，权重越大对应的投票数越多。例如，基础分类模型1输出基础分类结果1，基础分类模型2输出基础分类结果2，基础分类模型3输出基础分类结果2，基础分类模型4输出基础分类结果2，由于基础分类模型1的权重为0.4、则对基础分类结果1的投票数为4，基础分类模型2的权重为0.3、则对基础分类结果2的投票数为3，基础分类模型3的权重为0.2，则对基础分类结果2的投票数为2，基础分类模型4的权重为0.1，则对基础分类结果2的投票数为1，则基础分类结果1总共有4票，基础分类结果2总共有6票，则将基础分类结果2作为待分类医学影像图像的分类结果。

其中，各个基础分类模型的权重值根据每个基础分类模型的基础分类结果对应的概率排序进行设置。具体实现时，基础分类结果对应的概率越大则配置的权重越大。

由上述实施例可以看出，本申请首先提取待分类医学影像图像，提取待分类医学影像图像的图像特征和/或变换图像，然后将获取的图像特征和/或变换图像输入医学影像图像分类模型中对应的基础分类模型中，以获得基础分类结果，进而根据各个基础分类结果的权重，对基础分类结果进行加权投票确定待分类医学影像图像的分类结果，从实现自动且快速地对医学影像图像进行分类，且分类的结果是依据医学影像图像分类模型获得的，消除了主观性的影响，也更为准确。

基于上述方法实施例，本申请还提供了一种分类模型生成装置，下面将结合附图对该装置进行说明。

参见图6，其示出了本申请实施例提供的一种分类模型生成装置结构图，可以包括：

获取单元601，用于获取原始医学影像图像；

训练数据生成单元602，包括提取单元6021和/或生成单元6022；

提取单元6021，用于提取所述原始医学影像图像的至少一种图像特征，将所述原始医学影像图像的每种图像特征以及所述原始医学影像图像对应的分类标签作为一组第一训练数据；

生成单元6022，用于生成所述原始医学影像图像对应的至少一种变换图像，将所述原始医学影像图像对应的每种变换图像以及所述原始医学影像图像对应的分类标签作为一组第二训练数据；

训练单元603，包括第一训练单元6031和/或第二训练单元6032；

第一训练单元6031，用于根据每一组第一训练数据分别对初始分类模型进行训练，分别生成一个基础分类模型；

第二训练单元6032，用于根据每一组第二训练数据分别对初始深度学习模型进行训练，分别生成一个基础分类模型；

构成单元604，用于由各个所述基础分类模型共同构成医学影像图像分类模型，所述各个所述基础分类模型具有各自的权重值。

在本申请一些可能的实现方式中，所述生成单元具体用于：

生成所述原始医学影像图像对应的尺度变换图像；

生成所述原始医学影像图像对应的旋转图像和/或镜像图像；

在本申请一些可能的实现方式中，所述图像特征包括尺度不变特征变换特征，所述第一训练单元具体包括：

在本申请一些可能的实现方式中，各个所述基础分类模型的权重根据每个所述基础分类模型的基础分类结果对应的概率排序进行设置。

参见图7，其示出了本申请实施例提供的一种数据分类装置结构图，该装置可以包括：

获取单元701，用于获取待分类医学影像图像；

第一提取单元702，包括第二提取单元7021和/或生成单元7022；

第二提取单元7021，用于提取所述待分类医学影像图像的至少一种图像特征；

生成单元7022，用于生成所述待分类医学影像图像对应的至少一种变换图像；

分类单元703，用于将所述待分类医学影像图像的每种图像特征和/或每种变换图像分别输入医学影像图像分类模型中对应的基础分类模型，获得至少一个基础分类结果；所述医学影像图像分类模型是根据所述的分类模型生成装置所生成的；

确定单元704，用于根据各个所述基础分类模型的权重，对所述基础分类结果进行加权投票确定所述待分类医学影像图像的分类结果。

在本申请一些可能的实现方式中，所述图像特征包括尺度不变特征变换特征。

在本申请一些可能的实现方式中，所述生成单元具体用于：

生成所述待分类医学影像图像对应的尺度变换图像；

生成所述待分类医学影像图像对应的亮度调节图像。

另外，本申请实施例还提供一种计算机可读存储介质，所述机算机可读存储介质中存储有指令，当所述指令在终端设备上运行时，使得所述终端设备执行上述的分类模型生成方法或者上述的医学影像图像分类方法。

本申请实施例还提供一种计算机程序产品，所述计算机程序产品在终端设备上运行时，使得所述终端设备执行上述的分类模型生成方法或者上述的医学影像图像分类方法。

需要说明的是，本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的***或装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

应当理解，在本申请中，“至少一个(项)”是指一个或者多个，“多个”是指两个或两个以上。“和/或”，用于描述关联对象的关联关系，表示可以存在三种关系，例如，“A和/或B”可以表示：只存在A，只存在B以及同时存在A和B三种情况，其中A，B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达，是指这些项中的任意组合，包括单项(个)或复数项(个)的任意组合。例如，a，b或c中的至少一项(个)，可以表示：a，b，c，“a和b”，“a和c”，“b和c”，或“a和b和c”，其中a，b，c可以是单个，也可以是多个。

还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块，或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下，在其它实施例中实现。因此，本申请将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种分类模型生成方法，其特征在于，所述方法包括：

获取原始医学影像图像；

2.根据权利要求1所述的方法，其特征在于，所述生成所述原始医学影像图像对应的至少一种变换图像，包括：

生成所述原始医学影像图像对应的尺度变换图像；

生成所述原始医学影像图像对应的旋转图像和/或镜像图像；

生成所述原始医学影像图像对应的亮度调节图像。

3.根据权利要求1所述的方法，其特征在于，所述图像特征包括尺度不变特征变换特征，所述根据每一组第一训练数据分别对初始分类模型进行训练，分别生成一个基础分类模型，包括：

4.根据权利要求1所述的方法，其特征在于，各个所述基础分类模型的权重根据每个所述基础分类模型的基础分类结果对应的概率排序进行设置。

5.一种医学影像图像分类方法，其特征在于，所述方法包括：

获取待分类医学影像图像；

将所述待分类医学影像图像的每种图像特征和/或每种变换图像分别输入医学影像图像分类模型中对应的基础分类模型，获得至少一个基础分类结果；所述医学影像图像分类模型是根据权利要求1-5任一项所述的分类模型生成方法所生成的；

6.根据权利要求5所述的方法，其特征在于，所述图像特征包括尺度不变特征变换特征。

7.一种分类模型生成装置，其特征在于，所述装置包括：

获取单元，用于获取原始医学影像图像；

训练数据生成单元，包括提取单元和/或生成单元；

训练单元包括第一训练单元和/或第二训练单元；

8.一种医学影像图像分类装置，其特征在于，所述装置包括：

获取单元，用于获取待分类医学影像图像；

第一提取单元包括第二提取单元和/或生成单元；

分类单元，用于将所述待分类医学影像图像的每种图像特征和/或每种变换图像分别输入医学影像图像分类模型中对应的基础分类模型，获得至少一个基础分类结果；所述医学影像图像分类模型是根据权利要求7所述的分类模型生成装置所生成的；

9.一种计算机可读存储介质，其特征在于，所述机算机可读存储介质中存储有指令，当所述指令在终端设备上运行时，使得所述终端设备执行权利要求1-4任一项所述的分类模型生成方法或者权利要求5-6任一项所述的医学影像图像分类方法。

10.一种计算机程序产品，其特征在于，所述计算机程序产品在终端设备上运行时，使得所述终端设备执行权利要求1-4任一项所述的分类模型生成方法或者权利要求5-6任一项所述的医学影像图像分类方法。