CN109961423B

CN109961423B - 一种基于分类模型的肺结节检测方法、服务器及存储介质

Info

Publication number: CN109961423B
Application number: CN201910119541.9A
Authority: CN
Inventors: 刘新卉; 马进; 王健宗
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2019-02-15
Filing date: 2019-02-15
Publication date: 2024-05-31
Anticipated expiration: 2039-02-15
Also published as: CN109961423A

Abstract

本发明实施例公开了一种基于分类模型的肺结节检测方法、服务器及存储介质，该方法包括：获取肺部CT图像数据，并基于所述肺部CT图像数据和肺结节检测模型确定待检测肺结节候选项以及所述待检测肺结节候选项对应的目标图像数据；利用肺结节分类模型对所述目标图像数据进行处理，得到所述待检测肺结节候选项对应的分类结果；基于所述分类结果确定所述待检测肺结节候选项对应的目标检测结果；其中，所述肺结节分类模型包括第一分类模型和第二分类模型，所述第一分类模型和所述第二分类模型的网络结构不同；所述分类结果包括第一分类结果和第二分类结果。采用本发明实施例，可以有效提高肺结节的分类准确率，以有效降低检测结果中肺结节的假阳性。

Description

一种基于分类模型的肺结节检测方法、服务器及存储介质

技术领域

本发明涉及计算机技术领域，尤其涉及一种基于分类模型的肺结节检测方法、服务器及存储介质。

背景技术

由于环境的日益变差，大大增加了人们患上肺结节的概率，导致越来越多的人都患上了肺结节。肺部细胞增生或者异物都会导致肺结节的产生，而肺结节是造成肺癌的一重要因素。趁早摘除肺结节是有效防止肺结节转换成肺癌的关键。目前，现有的肺结节检测方式可以直接从肺部计算机体层摄影(Computed Tomography，CT)图中快速探测出肺结节，但检测结果中通常伴随着大量的假阳性肺结节。大量的假阳性肺结节会给医生的诊断带来严重干扰，从而增加误诊的几率。因此，如何有效降低检测结果中肺结节的假阳性是有待解决的问题。

发明内容

本发明实施例提供一种基于分类模型的肺结节检测方法、服务器及存储介质，可以有效提高肺结节的分类准确率，以有效降低检测结果中肺结节的假阳性。

第一方面，本发明实施例提供了一种基于分类模型的肺结节检测方法，包括：

获取肺部CT图像数据，并基于所述肺部CT图像数据和肺结节检测模型确定待检测肺结节候选项以及所述待检测肺结节候选项对应的目标图像数据；

利用肺结节分类模型对所述目标图像数据进行处理，得到所述待检测肺结节候选项对应的分类结果；

基于所述分类结果确定所述待检测肺结节候选项对应的目标检测结果；

其中，所述肺结节分类模型包括第一分类模型和第二分类模型，所述第一分类模型和所述第二分类模型的网络结构不同；所述分类结果包括第一分类结果和第二分类结果；所述利用肺结节分类模型对所述目标图像数据进行处理，得到所述待检测肺结节候选项对应的分类结果，包括：

将所述目标图像数据输入所述第一分类模型中进行处理，得到所述待检测肺结节候选项对应的所述第一分类结果；

将所述目标图像数据输入所述第二分类模型中进行处理，得到所述待检测肺结节候选项对应的所述第二分类结果。

在一实施方式中，所述第一分类结果用于指示所述待检测肺结节候选项是真实肺结节的概率为第一概率值，所述第二分类结果用于指示所述待检测肺结节候选项是真实肺结节的概率为第二概率值；

所述基于所述分类结果确定所述待检测肺结节候选项对应的目标检测结果，包括：

获取所述第一概率值以及所述第二概率值中的最大概率值；

将所述最大概率值确定为所述待检测肺结节候选项对应的目标检测结果。

在一实施方式中，所述第一分类结果用于指示所述待检测肺结节候选项是真实肺结节的概率为第一概率值，所述第二分类结果用于指示所述待检测肺结节候选项是真实肺结节的概率为第二概率值；所述肺结节分类模型还包括第三分类模型，所述第三分类模型和所述第一分类模型的输入数据的数据大小不同；所述分类结果还包括第三分类结果；

所述利用肺结节分类模型对所述目标图像数据进行处理，得到所述待检测肺结节候选项对应的分类结果，还包括：

将所述目标图像数据输入所述第三分类模型中进行处理，得到所述待检测肺结节候选项对应的所述第三分类结果，所述第三分类结果用于指示所述待检测肺结节候选项是真实肺结节的概率为第三概率值；

获取所述第一概率值、所述第二概率值以及所述第三概率值中的最大概率值；

在一实施方式中，所述基于所述肺部CT图像数据和肺结节检测模型确定待检测肺结节候选项以及所述待检测肺结节候选项对应的目标图像数据，包括：

利用所述肺结节检测模型对所述肺部CT图像数据进行检测，得到初始检测结果，所述初始检测结果包括多个肺结节候选项、所述多个肺结节候选项中每一个肺结节候选项是真实肺结节的概率以及所对应的结节坐标；

将所述多个肺结节候选项中是真实肺结节的概率大于或者等于概率阈值的肺结节候选项确定为待检测肺结节候选项；

基于所述待检测肺结节候选项对应的结节坐标从所述肺部CT图像数据中确定出所述待检测肺结节候选项对应的目标图像数据，所述目标图像数据的数据大小与所述肺结节分类模型的输入数据的数据大小相同。

在一实施方式中，所述方法还包括：

获取训练数据，所述训练数据包括多个肺结节候选项对应的初始图像数据，所述多个肺结节候选项中的每一个肺结节候选项是真实肺结节的概率均大于或者等于概率阈值；

对所述训练数据进行数据截取处理，得到所述肺结节分类模型对应的目标训练数据，所述目标训练数据的数据大小与所述肺结节分类模型的输入数据的数据大小相同；

利用所述目标训练数据对所述肺结节分类模型进行训练，得到训练后的肺结节分类模型。

在一实施方式中，所述目标训练数据包括正样本训练数据和负样本训练数据，所述利用所述目标训练数据对所述肺结节分类模型进行训练，得到训练后的肺结节分类模型，包括：

从所述目标训练数据中确定出所述正样本训练数据；

对所述正样本训练数据进行数据增强处理，得到第一目标正样本训练数据；

利用所述第一目标正样本训练数据以及所述负样本训练数据对所述肺结节分类模型进行训练，得到第一肺结节基础分类模型；

基于所述第一目标正样本训练数据、所述负样本训练数据以及所述第一肺结节基础分类模型，得到训练后的肺结节分类模型；

其中，所述第一目标正样本训练数据与所述负样本训练数据之间的数据比例为第一比例。

在一实施方式中，所述基于所述第一目标正样本训练数据、所述负样本训练数据以及所述第一肺结节基础分类模型，得到训练后的肺结节分类模型，包括：

对所述负样本训练数据进行数据筛选，得到第一目标负样本训练数据；

利用所述第一目标正样本训练数据以及所述第一目标负样本训练数据对所述第一肺结节基础分类模型进行训练，得到第二肺结节基础分类模型；

基于所述第一目标正样本训练数据、所述第一目标负样本训练数据以及所述第二肺结节基础分类模型，得到训练后的肺结节分类模型；

其中，所述第一目标正样本训练数据与所述第一目标负样本训练数据之间的数据比例为第二比例。

在一实施方式中，所述基于所述第一目标正样本训练数据、所述第一目标负样本训练数据以及所述第二肺结节基础分类模型，得到训练后的肺结节分类模型，包括：

对所述第一目标正样本训练数据进行数据筛选，得到第二目标正样本训练数据；

对所述第一目标负样本训练数据进行数据筛选，得到第二目标负样本训练数据；

利用所述第二目标正样本训练数据以及所述第二目标负样本训练数据对所述第二肺结节基础分类模型进行训练，得到训练后的肺结节分类模型；

其中，所述第二目标正样本训练数据与所述第二目标负样本训练数据之间的数据比例为所述第二比例。

第二方面，本发明实施例提供了一种基于分类模型的肺结节检测装置，包括：

获取单元，用于获取肺部CT图像数据；

处理单元，用于：

基于所述肺部CT图像数据和肺结节检测模型确定待检测肺结节候选项以及所述待检测肺结节候选项对应的目标图像数据；

其中，所述肺结节分类模型包括第一分类模型和第二分类模型，所述第一分类模型和所述第二分类模型的网络结构不同；所述分类结果包括第一分类结果和第二分类结果；所述处理单元，具体用于：

第三方面，本发明实施例提供了一种服务器，包括处理器、通信接口和存储器，所述处理器、所述通信接口和所述存储器相互连接，其中，所述存储器用于存储计算机程序，所述计算机程序包括程序指令，所述处理器被配置用于调用所述程序指令，执行上述第一方面任一项所述的基于分类模型的肺结节检测方法。

第四方面，本发明实施例提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时使所述处理器执行上述第一方面任一项所述的基于分类模型的肺结节检测方法。

本发明实施例中，基于肺部CT图像数据和肺结节检测模型确定出待检测肺结节候选项以及待检测肺结节候选项对应的目标图像数据后，再利用肺结节分类模型对目标图像数据进行处理得到分类结果，并基于分类结果确定出待检测肺结节候选项对应的目标检测结果，从而可以有效提高肺结节的分类准确率，以有效降低检测结果中肺结节的假阳性。

附图说明

为了更清楚地说明本发明实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明第一实施例提供的一种肺结节检测方法的流程示意图；

图2是本发明第二实施例提供的一种肺结节检测方法的流程示意图；

图3是本发明实施例提供的一种肺结节检测装置的结构示意图；

图4是本发明实施例提供的一种服务器的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述。

请参见图1，图1是本发明第一实施例提供的一种基于分类模型的肺结节检测方法的流程示意图。具体的，如图1所示，该肺结节检测方法可以包括以下步骤：

S101、服务器获取肺部CT图像数据，并基于所述肺部CT图像数据和肺结节检测模型确定待检测肺结节候选项以及所述待检测肺结节候选项对应的目标图像数据。

本发明实施例中，肺部CT图像数据是三维的数据，服务器可以直接从CT设备中获取该肺部CT图像数据。服务器获取到肺部CT图像数据之后，获取肺结节检测模型，该肺结节检测模型可以是存储在服务器本地，也可以存储在其他云端服务器中。服务器利用该肺结节检测模型对该肺部CT图像数据进行检测，得到初始检测结果。该初始检测结果包括确定出的多个肺结节候选项、该多个肺结节候选项中每一个肺结节候选项是真实肺结节的概率、以及该多个肺结节候选项中每一个肺结节候选项所对应的结节坐标。

进一步地，服务器将该多个肺结节候选项中是真实肺结节的概率大于或者等于概率阈值的肺结节候选项确定为待检测肺结节候选项，该概率阈值例如是85％，该待检测肺结节候选项可以是一个或者多个。服务器然后基于待检测肺结节候选项对应的结节坐标从肺部CT图像数据中确定出待检测肺结节候选项对应的目标图像数据，该目标图像数据的数据大小与肺结节分类模型的输入数据的数据大小相同。具体地，服务器以待检测肺结节候选项对应的结节坐标为中心点，从肺部CT图像数据中截取数据大小为目标数据大小的数据，作为待检测肺结节候选项对应的目标图像数据；肺结节分类模型的输入数据的数据大小也为该目标数据大小。

需要说明的是，服务器可以将该多个肺结节候选项中是真实肺结节的概率小于概率阈值的肺结节候选项直接确定为假阳性肺结节。

S102、所述服务器利用肺结节分类模型对所述目标图像数据进行处理，得到所述待检测肺结节候选项对应的分类结果。

本发明实施例中，服务器获取肺结节分类模型，该肺结节分类模型可以是存储在服务器本地，也可以存储在其他云端服务器中。肺结节分类模型包括第一分类模型和第二分类模型，该第一分类模型和该第二分类模型的网络结构不同。在一实施方式中，该第一分类模型的网络结构可以是以网络VGG-16为基础网络构建得到的，可以包含12层卷积。该第二分类模型的网络结构可以是以网络DualPathNetwork(DPN)-68为基础网络构建得到的。

其中，该第一分类模型的输入数据的数据大小为第一数据大小，该第二分类模型的输入数据的数据大小为第二数据大小；该第一数据大小和该第二数据大小可以相同，且与上述目标数据大小相同，例如是48*48*48。该分类结果包括第一分类结果和第二分类结果。服务器利用肺结节分类模型对目标图像数据进行处理，得到待检测肺结节候选项对应的分类结果，具体包括：服务器将该目标图像数据输入第一分类模型中进行处理，得到待检测肺结节候选项对应的第一分类结果；该第一分类结果用于指示待检测肺结节候选项是真实肺结节的概率为第一概率值。服务器将该目标图像数据输入第二分类模型中进行处理，得到待检测肺结节候选项对应的第二分类结果；该第二分类结果用于指示待检测肺结节候选项是真实肺结节的概率为第二概率值。

在一实施方式中，该第一数据大小和该第二数据大小也可以不同。该第一数据大小例如是48*48*48，该第二数据大小例如是64*64*64。上述目标数据大小包括第一数据大小和第二数据大小，该目标图像数据包括第一目标图像数据和第二目标图像数据。服务器基于待检测肺结节候选项对应的结节坐标从肺部CT图像数据中确定出待检测肺结节候选项对应的目标图像数据，具体包括：服务器以待检测肺结节候选项对应的结节坐标为中心点，从肺部CT图像数据中截取数据大小为第一数据大小的数据，作为第一分类模型对应的第一目标图像数据；并以待检测肺结节候选项对应的结节坐标为中心点，从肺部CT图像数据中截取数据大小为第二数据大小的数据，作为第二分类模型对应的第二目标图像数据。进一步地，服务器将该第一目标图像数据输入第一分类模型中进行处理，得到待检测肺结节候选项对应的第一分类结果；并将该第二目标图像数据输入第二分类模型中进行处理，得到待检测肺结节候选项对应的第二分类结果。

S103、所述服务器基于所述分类结果确定所述待检测肺结节候选项对应的目标检测结果。

本发明实施例中，服务器基于上述第一分类结果和第二分类结果确定待检测肺结节候选项对应的目标检测结果。具体地，服务器获取上述第一概率值以及第二概率值中的最大概率值，并将该最大概率值确定为待检测肺结节候选项对应的目标检测结果。该目标检测结果用于指示待检测肺结节候选项是真实肺结节的最终概率。采用上述方式，在检测模型针对肺结节候选项进行初始检测之后，利用第一分类模型和第二分类模型分别针对是真实肺结节的概率大于或者等于概率阈值的待检测肺结节候选项进行进一步分类处理；并基于第一分类模型和第二分类模型得到的分类结果，确定出检测肺结节候选项是真实肺结节的最终概率；从而可以结合检测模型、第一分类模型和第二分类模型同时进行肺结节检测，可以有效提高肺结节的分类准确率。

在一实施方式中，服务器基于上述分类结果确定出待检测肺结节候选项对应的目标检测结果之后，判断该目标检测结果所指示的待检测肺结节候选项是真实肺结节的最终概率是否大于或者等于预设数值，该预设数值例如是95％；若是，则确定该待检测肺结节候选项是真实肺结节；反之，则确定该待检测肺结节候选项是假阳性肺结节。采用上述方式，可以有效降低检测结果中肺结节的假阳性。

在一实施方式中，上述肺结节分类模型还包括第三分类模型，该第三分类模型的网络结构可以是以网络VGG-16为基础网络构建得到的，可以包含12层卷积。该第三分类模型的输入数据的数据大小为第三数据大小，该第三数据大小例如是32*32*32。第三分类模型和上述第一分类模型的输入数据的数据大小不同，也即是该第三数据大小和上述第一数据大小不同。具体地，该第三数据大小小于上述第一数据大小。上述目标数据大小还包括第三数据大小，该目标图像数据还包括第三目标图像数据。服务器基于待检测肺结节候选项对应的结节坐标从肺部CT图像数据中确定出待检测肺结节候选项对应的目标图像数据，还包括：服务器以待检测肺结节候选项对应的结节坐标为中心点，从肺部CT图像数据中截取数据大小为第三数据大小的数据，作为第三分类模型对应的第三目标图像数据。

其中，上述分类结果还包括第三分类结果。服务器利用肺结节分类模型对目标图像数据进行处理，得到待检测肺结节候选项对应的分类结果，还包括：服务器将第三目标图像数据输入第三分类模型中进行处理，得到待检测肺结节候选项对应的第三分类结果，该第三分类结果用于指示待检测肺结节候选项是真实肺结节的概率为第三概率值。服务器基于分类结果确定待检测肺结节候选项对应的目标检测结果的方式为：获取上述第一概率值、第二概率值以及第三概率值中的最大概率值，并将该最大概率值确定为待检测肺结节候选项对应的目标检测结果。

需要说明的是，第三分类模型和上述第二分类模型的输入数据的数据大小不同，也即是该第三数据大小和上述第二数据大小不同。具体地，第三数据大小小于上述第二数据大小。该第三分类模型与该第一分类模型以及该第二分类模型采用不同的输入数据大小，可以同时兼顾大结节和小结节的情况，从而可以扩大本方案适用的应用场景。

请参见图2，图2是本发明第二实施例提供的一种基于分类模型的肺结节检测方法的流程示意图。具体的，如图2所示，该肺结节检测方法可以包括以下步骤：

S201、服务器获取训练数据。

本发明实施例中，服务器获取初始CT图像数据，并利用肺结节检测模型对该初始CT图像数据进行检测，得到初始检测结果。该初始检测结果包括确定出的多个肺结节候选项、该多个肺结节候选项中每一个肺结节候选项是真实肺结节的概率、以及该多个肺结节候选项中每一个肺结节候选项所对应的结节坐标。进一步地，服务器基于目标肺结节候选项的结节坐标从初始CT图像数据中，获取目标肺结节候选项对应的初始图像数据，并将目标肺结节候选项对应的初始图像数据确定为训练数据。其中，目标肺结节候选项为该多个肺结节候选项中是真实肺结节的概率大于或者等于概率阈值的肺结节候选项，该目标肺结节候选项可以是多个。

S202、所述服务器对所述训练数据进行数据截取处理，得到肺结节分类模型对应的目标训练数据。

本发明实施例中，目标训练数据的数据大小与肺结节分类模型的输入数据的数据大小相同。具体地，服务器以目标肺结节候选项对应的结节坐标为中心点，从训练数据中截取数据大小为目标数据大小的数据作为肺结节分类模型对应的目标训练数据；肺结节分类模型的输入数据的数据大小也为该目标数据大小。其中，肺结节分类模型具体包括第一分类模型和第二分类模型。该第一分类模型的输入数据的数据大小为第一数据大小，该第二分类模型的输入数据的数据大小为第二数据大小。上述目标数据大小包括第一数据大小和第二数据大小，该目标训练数据包括第一目标训练数据和第二目标训练数据。服务器以目标肺结节候选项对应的结节坐标为中心点，从训练数据中截取数据大小为第一数据大小的数据，作为第一分类模型对应的第一目标训练数据；并以目标肺结节候选项对应的结节坐标为中心点，从训练数据中截取数据大小为第二数据大小的数据，作为第二分类模型对应的第二目标训练数据。

在一实施方式中，肺结节分类模型还包括第三分类模型，该第三分类模型的输入数据的数据大小为第三数据大小。上述目标数据大小还包括第三数据大小，该目标训练数据还包括第三目标训练数据。服务器以目标肺结节候选项对应的结节坐标为中心点，从训练数据中截取数据大小为第三数据大小的数据，作为第三分类模型对应的第三目标训练数据。

在一实施方式中，第三数据大小小于第一数据大小，可以以目标肺结节候选项对应的结节坐标为中心点，直接从该第一目标训练数据中截取数据大小为第三数据大小的数据，作为第三分类模型对应的第三目标训练数据。当第一数据大小与第二数据大小相同时，可以直接将第一目标训练数据作为第二分类模型对应的第二目标训练数据。

S203、所述服务器利用所述目标训练数据对所述肺结节分类模型进行训练，得到训练后的肺结节分类模型。

本发明实施例中，该目标训练数据包括正样本训练数据和负样本训练数据。可以是将目标训练数据中和真实肺结节之间的交集小于第一预设百分比(例如20％)的数据记为负样本训练数据；可以是将目标训练数据中和真实肺结节之间的交集大于第二预设百分比的数据记为正样本训练数据；正样本训练数据也可以直接根据数据中的标注信息确定出。

具体的，服务器首先从该目标训练数据中确定出正样本训练数据，并对该正样本训练数据进行数据增强处理，得到第一目标正样本训练数据，以使该第一目标正样本训练数据与该负样本训练数据之间的数据比例达到第一比例，该第一比例例如是1:3。服务器然后利用该第一目标正样本训练数据以及该负样本训练数据对肺结节分类模型进行训练，得到第一肺结节基础分类模型；最后基于该第一目标正样本训练数据、该负样本训练数据以及该第一肺结节基础分类模型，得到训练后的肺结节分类模型。

其中，由于目标训练数据中正样本训练数据与负样本训练数据之间的比例通常极度不平衡，故需要对目标训练数据中的正样本训练数据进行数据增强处理，以使数据增强处理后得到的第一目标正样本训练数据与负样本训练数据之间的数据比例达到第一比例。对正样本训练数据进行数据增强处理包括：对正样本训练数据中的三个坐标轴进行翻转(flip)、和/或对三个坐标轴的方向进行旋转(例如旋转90度、180度、270度)等数据增强操作。在一实施方式中，可以将正样本训练数据增强预设倍数(例如16倍)，以使正样本训练数据与负样本训练数据之间的比例可以达到第一比例。举例来说，数据增强16倍＝3(3个坐标轴的翻转)+3(3个角度的旋转)+3*3(翻转与旋转叠加)+原始数据。

在一实施方式中，服务器基于该第一目标正样本训练数据、该负样本训练数据以及该第一肺结节基础分类模型，得到训练后的肺结节分类模型的方式为：服务器首先对该负样本训练数据进行数据筛选，得到第一目标负样本训练数据，以使该第一目标正样本训练数据与该第一目标负样本训练数据之间的数据比例达到第二比例，该第二比例例如是1:1。其中，对该负样本训练数据进行数据筛选可以是：将该负样本训练数据中是真实肺结节的概率小于第一数值的目标肺结节候选项对应的数据去除，得到第一目标负样本训练数据。服务器然后利用该第一目标正样本训练数据以及该第一目标负样本训练数据对该第一肺结节基础分类模型进行训练，得到第二肺结节基础分类模型；最后基于该第一目标正样本训练数据、该第一目标负样本训练数据以及该第二肺结节基础分类模型，得到训练后的肺结节分类模型。其中，服务器利用该第一目标正样本训练数据以及该第一目标负样本训练数据对该第一肺结节基础分类模型进行训练之前，可以先调整该第一肺结节基础分类模型的学习率(learning rate)。

在一实施方式中，服务器基于该第一目标正样本训练数据、该第一目标负样本训练数据以及该第二肺结节基础分类模型，得到训练后的肺结节分类模型的方式为：服务器首先对该第一目标正样本训练数据进行数据筛选，得到第二目标正样本训练数据；并对该第一目标负样本训练数据进行数据筛选，得到第二目标负样本训练数据。该第二目标正样本训练数据与该第二目标负样本训练数据之间的数据比例保持为该第二比例。其中，对该第一目标正样本训练数据进行数据筛选可以是：将该第一目标正样本训练数据中是真实肺结节的概率小于第二数值的目标肺结节候选项对应的数据去除，得到第二目标正样本训练数据。对该第一目标负样本训练数据进行数据筛选可以是：将该第一目标负样本训练数据中是真实肺结节的概率小于第三数值的目标肺结节候选项对应的数据去除，得到第二目标负样本训练数据。服务器然后利用该第二目标正样本训练数据以及该第二目标负样本训练数据对该第二肺结节基础分类模型进行训练，得到训练后的肺结节分类模型。其中，服务器利用该第二目标正样本训练数据以及该第二目标负样本训练数据对该第二肺结节基础分类模型进行训练之前，可以先调整该第二肺结节基础分类模型的学习率。

需要说明的是，服务器得到训练后的肺结节分类模型之后，利用样本数据确定出训练后的肺结节分类模型的分类准确率。如果检测到训练后的肺结节分类模型的分类准确率大于或者等于预设准确率阈值，则停止训练。该预设准确率阈值例如是99％。如果检测到训练后的肺结节分类模型的分类准确率小于预设准确率阈值，则继续筛选第二目标正样本训练数据和第二目标负样本训练数据，不断缩小训练数据，调整肺结节分类模型的学习率；并利用筛选后的正负样本训练数据继续训练肺结节分类模型，直至训练后的肺结节分类模型的分类准确率达到预设准确率阈值为止。采用上述方式，可以不断提高肺结节分类模型的分类准确率。

本发明实施例中，服务器利用目标训练数据对肺结节分类模型进行训练，得到训练后的肺结节分类模型，具体包括：利用第一目标训练数据对第一分类模型进行训练，得到训练后的第一分类模型；利用第二目标训练数据对第二分类模型进行训练，得到训练后的第二分类模型；利用第三目标训练数据对第三分类模型进行训练，得到训练后的第三分类模型。具体训练方式可参考前文描述，在此不再赘述。

S204、所述服务器获取肺部CT图像数据，并基于所述肺部CT图像数据和肺结节检测模型确定待检测肺结节候选项以及所述待检测肺结节候选项对应的目标图像数据。

S205、所述服务器利用所述训练后的肺结节分类模型对所述目标图像数据进行处理，得到所述待检测肺结节候选项对应的分类结果。

S206、所述服务器基于所述分类结果确定所述待检测肺结节候选项对应的目标检测结果。

本发明实施例中，步骤S204至步骤S206的具体实现方式可以参照上述图1所示实施例中步骤S101至步骤S103的相关描述，此处不再赘述。

本发明实施例中，首先对训练数据进行数据截取处理得到目标训练数据，利用目标训练数据对肺结节分类模型进行训练，得到训练后的肺结节分类模型，然后基于肺部CT图像数据和肺结节检测模型确定出待检测肺结节候选项以及待检测肺结节候选项对应的目标图像数据后，再利用训练后的肺结节分类模型对目标图像数据进行处理得到分类结果，并基于分类结果确定出待检测肺结节候选项对应的目标检测结果，从而可以有效提高肺结节的分类准确率，以有效降低检测结果中肺结节的假阳性。

请参见图3，图3是本发明实施例提供的一种基于分类模型的肺结节检测装置的结构示意图。本发明实施例的肺结节检测装置包括用于执行上述肺结节检测方法的单元。具体的，本发明实施例的肺结节检测装置300可以包括：获取单元301、处理单元302和训练单元303。其中：

所述获取单元301，用于获取肺部CT图像数据；

所述处理单元302，用于：

其中，所述肺结节分类模型包括第一分类模型和第二分类模型，所述第一分类模型和所述第二分类模型的网络结构不同；所述分类结果包括第一分类结果和第二分类结果；所述处理单元302，具体用于：

在一实施方式中，所述第一分类结果用于指示所述待检测肺结节候选项是真实肺结节的概率为第一概率值，所述第二分类结果用于指示所述待检测肺结节候选项是真实肺结节的概率为第二概率值；所述处理单元302，具体用于：

获取所述第一概率值以及所述第二概率值中的最大概率值；

在一实施方式中，所述肺结节分类模型还包括第三分类模型，所述第三分类模型和所述第一分类模型的输入数据的数据大小不同；所述分类结果还包括第三分类结果；

所述处理单元302，还用于将所述目标图像数据输入所述第三分类模型中进行处理，得到所述待检测肺结节候选项对应的所述第三分类结果，所述第三分类结果用于指示所述待检测肺结节候选项是真实肺结节的概率为第三概率值；

所述处理单元302，具体用于：

在一实施方式中，所述处理单元302，具体用于：

在一实施方式中，所述获取单元301，还用于获取训练数据，所述训练数据包括多个肺结节候选项对应的初始图像数据，所述多个肺结节候选项中的每一个肺结节候选项是真实肺结节的概率均大于或者等于概率阈值；

所述处理单元302，还用于对所述训练数据进行数据截取处理，得到所述肺结节分类模型对应的目标训练数据，所述目标训练数据的数据大小与所述肺结节分类模型的输入数据的数据大小相同；

所述训练单元303，用于利用所述目标训练数据对所述肺结节分类模型进行训练，得到训练后的肺结节分类模型。

在一实施方式中，所述目标训练数据包括正样本训练数据和负样本训练数据，所述训练单元303，具体用于：

从所述目标训练数据中确定出所述正样本训练数据；

在一实施方式中，所述训练单元303，具体用于：

具体的，该肺结节检测装置300可通过上述单元实现上述图1或图2所示实施例中的肺结节检测方法中的部分或全部步骤。应理解，本发明实施例是对应方法实施例的装置实施例，对方法实施例的描述，也适用于本发明实施例。

请参见图4，图4是本发明实施例提供的一种服务器的结构示意图。该服务器用于执行上述的方法。如图4所示，本实施例中的服务器400可以包括：一个或多个处理器401和存储器402。可选的，该服务器还可包括一个或多个通信接口403。上述处理器401、通信接口403和存储器402可通过总线404连接，或者可以通过其他方式连接，图4中以总线方式进行示例说明。

其中，所述处理器401可以是中央处理单元(Central Processing Unit，CPU)，该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

所述通信接口403可用于收发信息或信令的交互，以及信号的接收和传递，通信接口403可包括接收器和发射器，用于与其他设备进行通信。所述存储器402可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作***、至少一个功能所需的存储程序(比如文字存储功能、位置存储功能等)；存储数据区可存储根据服务器的使用所创建的数据(比如图像数据、文字数据)等，并可以包括应用存储程序等。此外，存储器402可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

所述存储器402还用于存储程序指令。所述处理器401可以调用上述存储器402存储的程序指令，实现如本发明实施例所示的肺结节检测方法。

其中，处理器401可用于调用所述程序指令执行以下步骤：通过所述通信接口403获取肺部CT图像数据，并基于所述肺部CT图像数据和肺结节检测模型确定待检测肺结节候选项以及所述待检测肺结节候选项对应的目标图像数据；利用肺结节分类模型对所述目标图像数据进行处理，得到所述待检测肺结节候选项对应的分类结果；基于所述分类结果确定所述待检测肺结节候选项对应的目标检测结果。

其中，所述肺结节分类模型包括第一分类模型和第二分类模型，所述第一分类模型和所述第二分类模型的网络结构不同；所述分类结果包括第一分类结果和第二分类结果；处理器401在调用所述程序指令执行所述利用肺结节分类模型对所述目标图像数据进行处理，得到所述待检测肺结节候选项对应的分类结果时，具体执行以下步骤：将所述目标图像数据输入所述第一分类模型中进行处理，得到所述待检测肺结节候选项对应的所述第一分类结果；将所述目标图像数据输入所述第二分类模型中进行处理，得到所述待检测肺结节候选项对应的所述第二分类结果。

在一实施方式中，所述第一分类结果用于指示所述待检测肺结节候选项是真实肺结节的概率为第一概率值，所述第二分类结果用于指示所述待检测肺结节候选项是真实肺结节的概率为第二概率值；处理器401在调用所述程序指令执行所述基于所述分类结果确定所述待检测肺结节候选项对应的目标检测结果时，具体执行以下步骤：获取所述第一概率值以及所述第二概率值中的最大概率值；将所述最大概率值确定为所述待检测肺结节候选项对应的目标检测结果。

在一实施方式中，所述肺结节分类模型还包括第三分类模型，所述第三分类模型和所述第一分类模型的输入数据的数据大小不同；所述分类结果还包括第三分类结果；处理器401在调用所述程序指令执行所述利用肺结节分类模型对所述目标图像数据进行处理，得到所述待检测肺结节候选项对应的分类结果时，还用于执行以下步骤：将所述目标图像数据输入所述第三分类模型中进行处理，得到所述待检测肺结节候选项对应的所述第三分类结果，所述第三分类结果用于指示所述待检测肺结节候选项是真实肺结节的概率为第三概率值；处理器401在调用所述程序指令执行所述基于所述分类结果确定所述待检测肺结节候选项对应的目标检测结果时，具体执行以下步骤：获取所述第一概率值、所述第二概率值以及所述第三概率值中的最大概率值；将所述最大概率值确定为所述待检测肺结节候选项对应的目标检测结果。

在一实施方式中，处理器401在调用所述程序指令执行所述基于所述肺部CT图像数据和肺结节检测模型确定待检测肺结节候选项以及所述待检测肺结节候选项对应的目标图像数据时，具体执行以下步骤：利用所述肺结节检测模型对所述肺部CT图像数据进行检测，得到初始检测结果，所述初始检测结果包括多个肺结节候选项、所述多个肺结节候选项中每一个肺结节候选项是真实肺结节的概率以及所对应的结节坐标；将所述多个肺结节候选项中是真实肺结节的概率大于或者等于概率阈值的肺结节候选项确定为待检测肺结节候选项；基于所述待检测肺结节候选项对应的结节坐标从所述肺部CT图像数据中确定出所述待检测肺结节候选项对应的目标图像数据，所述目标图像数据的数据大小与所述肺结节分类模型的输入数据的数据大小相同。

在一实施方式中，处理器401还可调用所述程序指令执行以下步骤：通过所述通信接口403获取训练数据，所述训练数据包括多个肺结节候选项对应的初始图像数据，所述多个肺结节候选项中的每一个肺结节候选项是真实肺结节的概率均大于或者等于概率阈值；对所述训练数据进行数据截取处理，得到所述肺结节分类模型对应的目标训练数据，所述目标训练数据的数据大小与所述肺结节分类模型的输入数据的数据大小相同；利用所述目标训练数据对所述肺结节分类模型进行训练，得到训练后的肺结节分类模型。

在一实施方式中，所述目标训练数据包括正样本训练数据和负样本训练数据，处理器401在调用所述程序指令执行所述利用所述目标训练数据对所述肺结节分类模型进行训练，得到训练后的肺结节分类模型时，具体执行以下步骤：从所述目标训练数据中确定出所述正样本训练数据；对所述正样本训练数据进行数据增强处理，得到第一目标正样本训练数据；利用所述第一目标正样本训练数据以及所述负样本训练数据对所述肺结节分类模型进行训练，得到第一肺结节基础分类模型；基于所述第一目标正样本训练数据、所述负样本训练数据以及所述第一肺结节基础分类模型，得到训练后的肺结节分类模型；其中，所述第一目标正样本训练数据与所述负样本训练数据之间的数据比例为第一比例。

在一实施方式中，处理器401在调用所述程序指令执行所述基于所述第一目标正样本训练数据、所述负样本训练数据以及所述第一肺结节基础分类模型，得到训练后的肺结节分类模型时，具体执行以下步骤：对所述负样本训练数据进行数据筛选，得到第一目标负样本训练数据；利用所述第一目标正样本训练数据以及所述第一目标负样本训练数据对所述第一肺结节基础分类模型进行训练，得到第二肺结节基础分类模型；基于所述第一目标正样本训练数据、所述第一目标负样本训练数据以及所述第二肺结节基础分类模型，得到训练后的肺结节分类模型；其中，所述第一目标正样本训练数据与所述第一目标负样本训练数据之间的数据比例为第二比例。

在一实施方式中，处理器401在调用所述程序指令执行所述基于所述第一目标正样本训练数据、所述第一目标负样本训练数据以及所述第二肺结节基础分类模型，得到训练后的肺结节分类模型时，具体执行以下步骤：对所述第一目标正样本训练数据进行数据筛选，得到第二目标正样本训练数据；对所述第一目标负样本训练数据进行数据筛选，得到第二目标负样本训练数据；利用所述第二目标正样本训练数据以及所述第二目标负样本训练数据对所述第二肺结节基础分类模型进行训练，得到训练后的肺结节分类模型；其中，所述第二目标正样本训练数据与所述第二目标负样本训练数据之间的数据比例为所述第二比例。

具体实现中，本发明实施例中所描述的处理器401等可执行上述图1或图2所示的方法实施例中所描述的实现方式，也可执行本发明实施例图3所描述的各单元的实现方式，此处不赘述。

本发明实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时可实现图1或图2所对应实施例中描述的肺结节检测方法中的部分或全部步骤，也可实现本发明图3所示实施例的肺结节检测装置的功能，也可实现本发明图4所示实施例的服务器的功能，此处不赘述。

所述计算机可读存储介质可以是前述实施例所述的肺结节检测装置或者服务器的内部存储单元，例如肺结节检测装置或者服务器的硬盘或内存。所述计算机可读存储介质也可以是所述肺结节检测装置或者服务器的外部存储设备，例如所述肺结节检测装置或者服务器上配备的插接式硬盘，智能存储卡(Smart Media Card，SMC)，安全数字(SecureDigital，SD)卡，闪存卡(Flash Card)等。

本发明实施例还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述方法中的部分或全部步骤。

在本申请中，术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

在本申请的各种实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。

以上所述，仅为本发明的部分实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本发明的保护范围之内。

Claims

1.一种基于分类模型的肺结节检测方法，其特征在于，所述方法包括：

利用肺结节分类模型对所述目标图像数据进行处理，得到所述待检测肺结节候选项对应的分类结果；所述肺结节分类模型是基于正样本训练数据和负样本训练数据训练得到的，所述负样本训练数据是目标训练数据中和真实肺结节之间的交集小于第一预设百分比的数据；所述正样本训练数据是目标训练数据中和真实肺结节之间的交集大于第二预设百分比的数据；

其中，所述肺结节分类模型包括第一分类模型和第二分类模型，所述第一分类模型和所述第二分类模型的网络结构不同，所述第一分类模型的网络结构是以网络VGG为基础网络构建得到的，所述第二分类模型的网络结构是以双路径网络DPN为基础网络构建得到的；所述分类结果包括第一分类结果和第二分类结果；所述利用肺结节分类模型对所述目标图像数据进行处理，得到所述待检测肺结节候选项对应的分类结果，包括：

将所述目标图像数据输入所述第二分类模型中进行处理，得到所述待检测肺结节候选项对应的所述第二分类结果；所述方法还包括：

获取训练数据，对训练数据进行数据截取处理，得到所述肺结节分类模型对应的目标训练数据，目标训练数据包括正样本训练数据和负样本训练数据；

从所述目标训练数据中确定出所述正样本训练数据；对所述正样本训练数据进行数据增强处理，得到第一目标正样本训练数据；所述增强处理包括对正样本训练数据中的三个坐标轴进行翻转以及对三个坐标轴的方向进行旋转；

调整第一肺结节基础分类模型的学习率；利用所述第一目标正样本训练数据以及所述第一目标负样本训练数据对调整学习率后的第一肺结节基础分类模型进行训练，得到第二肺结节基础分类模型；

对第一目标正样本训练数据进行数据筛选，得到第二目标正样本训练数据；

对第一目标负样本训练数据进行数据筛选，得到第二目标负样本训练数据；

调整第二肺结节基础分类模型的学习率；利用所述第二目标正样本训练数据以及所述第二目标负样本训练数据对调整学习率后的第二肺结节基础分类模型进行训练，得到训练后的肺结节分类模型；

利用样本数据确定出训练后的肺结节分类模型的分类准确率；如果检测到训练后的肺结节分类模型的分类准确率大于或者等于预设准确率阈值，则停止训练；如果检测到训练后的肺结节分类模型的分类准确率小于预设准确率阈值，则继续筛选第二目标正样本训练数据和第二目标负样本训练数据，不断缩小训练数据，并调整肺结节分类模型的学习率；并利用筛选后的正负样本训练数据继续训练肺结节分类模型，直至训练后的肺结节分类模型的分类准确率达到预设准确率阈值为止；其中，第一目标正样本训练数据与负样本训练数据之间的数据比例为第一比例，所述第一目标正样本训练数据与所述第一目标负样本训练数据之间的数据比例为第二比例，所述第二目标正样本训练数据与所述第二目标负样本训练数据之间的数据比例为第二比例，第一比例小于第二比例。

2.根据权利要求1所述的方法，其特征在于，所述第一分类结果用于指示所述待检测肺结节候选项是真实肺结节的概率为第一概率值，所述第二分类结果用于指示所述待检测肺结节候选项是真实肺结节的概率为第二概率值；

获取所述第一概率值以及所述第二概率值中的最大概率值；

3.根据权利要求1所述的方法，其特征在于，所述第一分类结果用于指示所述待检测肺结节候选项是真实肺结节的概率为第一概率值，所述第二分类结果用于指示所述待检测肺结节候选项是真实肺结节的概率为第二概率值；所述肺结节分类模型还包括第三分类模型，所述第三分类模型和所述第一分类模型的输入数据的数据大小不同；所述分类结果还包括第三分类结果；

4.根据权利要求1至3中任一项所述的方法，其特征在于，所述基于所述肺部CT图像数据和肺结节检测模型确定待检测肺结节候选项以及所述待检测肺结节候选项对应的目标图像数据，包括：

5.一种服务器，其特征在于，包括处理器、通信接口和存储器，所述处理器、所述通信接口和所述存储器相互连接，其中，所述存储器用于存储计算机程序，所述计算机程序包括程序指令，所述处理器被配置用于调用所述程序指令，执行如权利要求1至4中任一项所述的基于分类模型的肺结节检测方法。

6.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时使所述处理器执行如权利要求1至4中任一项所述的基于分类模型的肺结节检测方法。