CN110097080B

CN110097080B - 一种分类标签的构建方法及装置

Info

Publication number: CN110097080B
Application number: CN201910251161.0A
Authority: CN
Inventors: 朱喻
Original assignee: Guangzhou Side Medical Technology Co ltd
Current assignee: Guangzhou Side Medical Technology Co ltd
Priority date: 2019-03-29
Filing date: 2019-03-29
Publication date: 2021-04-13
Anticipated expiration: 2039-03-29
Also published as: CN110097080A

Abstract

本发明实施例提供一种分类标签的构建方法及装置，所述方法包括：获取用于训练预设模型的样本图片；所述预设模型是用于识别原始图片的初筛网络模型；所述样本图片为拍摄物外表面包含异常特征的第二目标图片；根据所有样本图片的图片背景对所有样本图片进行分类；所述图片背景包括部分拍摄缺陷对应的图片背景、和/或附着有覆盖物的图片背景；将分类后的样本图片与每类第一目标图片分别进行比照，并根据比照结果对分类后的样本图片进行再次分类，并为再次分类的每类样本图片构建一一对应的标签。所述装置执行上述方法。本发明实施例提供的分类标签的构建方法及装置，能够提高样本图片的分类标签构建的合理性和准确度。

Description

一种分类标签的构建方法及装置

技术领域

本发明实施例涉及图片处理技术领域，尤其涉及一种分类标签的构建方法及装置。

背景技术

胶囊内镜具有无痛、无伤、拍摄图像信息量大等优点，具备广泛的应用价值。

现有技术采用人工方式识别通过胶囊内镜拍摄的原始图片、并对原始图片进行分类，为了更加准确、高效地识别原始图片，需要构建模型，但是模型在使用之前通常需要进行训练，针对上述原始图片的训练样本(可以是样本图片)的选择、以及对样本图片的分类标签的构建，尚没有有效的方法。

因此，如何避免上述缺陷，提高样本图片的分类标签构建的合理性和准确度，成为亟须解决的问题。

发明内容

针对现有技术存在的问题，本发明实施例提供一种分类标签的构建方法及装置。

本发明实施例提供一种分类标签的构建方法，包括：

获取用于训练预设模型的样本图片；所述预设模型是用于识别原始图片的初筛网络模型；所述样本图片为拍摄物外表面包含异常特征的第二目标图片；所述异常特征包括凸起特征和/或指定颜色特征；

根据所有样本图片的图片背景对所有样本图片进行分类；所述图片背景包括部分拍摄缺陷对应的图片背景、和/或附着有覆盖物的图片背景；

将分类后的样本图片与每类第一目标图片分别进行比照，并根据比照结果对分类后的样本图片进行再次分类，并为再次分类的每类样本图片构建一一对应的标签；所述第一目标图片为拍摄物外表面不包含异常特征的目标图片。

本发明实施例提供一种分类标签的构建装置，包括：

获取单元，用于获取用于训练预设模型的样本图片；所述预设模型是用于识别原始图片的初筛网络模型；所述样本图片为拍摄物外表面包含异常特征的第二目标图片；所述异常特征包括凸起特征和/或指定颜色特征；

分类单元，用于根据所有样本图片的图片背景对所有样本图片进行分类；所述图片背景包括部分拍摄缺陷对应的图片背景、和/或附着有覆盖物的图片背景；

构建单元，用于将分类后的样本图片与每类第一目标图片分别进行比照，并根据比照结果对分类后的样本图片进行再次分类，并为再次分类的每类样本图片构建一一对应的标签；所述第一目标图片为拍摄物外表面不包含异常特征的目标图片。

本发明实施例提供一种电子设备，包括：处理器、存储器和总线，其中，

所述处理器和所述存储器通过所述总线完成相互间的通信；

所述存储器存储有可被所述处理器执行的程序指令，所述处理器调用所述程序指令能够执行如下方法：

本发明实施例提供一种非暂态计算机可读存储介质，包括：

所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令使所述计算机执行如下方法：

本发明实施例提供的分类标签的构建方法及装置，通过对所有样本图片先后进行二次分类、并构建分类标签，能够提高样本图片的分类标签构建的合理性和准确度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明分类标签的构建方法实施例流程图；

图2(a)～图2(g)均为本发明实施例拍摄的半曝光图片的截图；

图3(a)～图3(g)均为本发明实施例拍摄的局部曝光图片的截图；

图4(a)～图4(h)均为本发明实施例拍摄的细节模糊图片的截图；

图5(a)～图5(g)均为本发明实施例拍摄的附着有覆盖物的原始图片的截图；

图6(a)～图6(h)均为本发明实施例拍摄的局部带有形状变化的第一目标图片的截图；

图7(a)～图7(h)均为本发明实施例拍摄的局部带有色调变化的第一目标图片的截图；

图8(a)～图8(f)均为本发明实施例拍摄的全局具有胃角结构的第一目标图片的截图；

图9(a)～图9(f)均为本发明实施例拍摄的全局具有纹理结构的第一目标图片的截图；

图10(a)～图10(h)均为本发明实施例拍摄的洞状结构第一目标图片的截图；

图11为本发明分类标签的构建装置实施例结构示意图；

图12为本发明实施例提供的电子设备实体结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图1为本发明分类标签的构建方法实施例流程图，如图1所示，本发明实施例提供的一种分类标签的构建方法，包括以下步骤：

S101：获取用于训练预设模型的样本图片；所述预设模型是用于识别原始图片的初筛网络模型；所述样本图片为拍摄物外表面包含异常特征的第二目标图片；所述异常特征包括凸起特征和/或指定颜色特征。

具体的，装置获取用于训练预设模型的样本图片；所述预设模型是用于识别原始图片的初筛网络模型；所述样本图片为拍摄物外表面包含异常特征的第二目标图片；所述异常特征包括凸起特征和/或指定颜色特征。需要说明的是：该原始图片是通过胶囊内镜拍摄的，对胶囊内镜的工作过程作如下说明：

·胶囊内镜从口腔进入消化道，再从***自然排出体外。

·胶囊内镜的电池续航力有限，其有效工作区间为口腔、食道、胃、十二指肠、小肠和大肠一部分。

·胶囊内镜的每次活动都产生域内检查图片和域外检查图片。

·域内检查图片是对消化道某一段所进行的拍摄结果。

·域外检查图片是除了域内检查图片以外，胶囊内镜顺便拍到的图片。

·全部图片均可自动识别，无需任何人工介入(包括图像预处理)。

·识别图像后，将胶囊内镜拍摄的图片分为六个大类(125个小类)，自动保存于125个图片文件夹中，其中，六个大类可以为：

第一大类：一类域外分类标签(10个类别)。

第二大类：二类域外分类标签(13个类别)。

第三大类：基于局部结构特征的第一目标图片分类标签(14个类别)。

第四大类：洞状结构第一目标图片分类标签(8个类别)。

第五大类：基于全局结构特征的第一目标图片分类标签(24个类别)。

第六大类：第二目标图片分类标签(56个类别)。

·能够自动识别口腔、食道、胃、十二指肠、小肠和大肠等消化道的不同部位。

每粒胶囊内镜每次可以拍摄的原始图片的数量可以为2000～3000张，即胶囊内镜获取到的图片集中的图片数量。

可以从医院信息***中导出、未经任何处理的胶囊内镜拍摄的原始图片(JPG格式)。本发明实施例的样本图片是上述第六大类(56个小类)对应的所有图片。初筛网络模型可以为卷积神经网络inceptionV3，输入原始图片至初筛网络模型，初筛网络模型的输出结果可以包括干扰图片、干扰图片可以理解为无法用于图片识别的图片、拍摄物外表面不包含异常特征的第一目标图片、拍摄物外表面包含所述异常特征的第二目标图片。异常特征可以包括凸起特征和/或指定颜色特征、凸起特征可以包括肿胀、颗粒状物凸起。指定颜色特征可以包括红色、白色，不作具体限定。当该预设模型输出结果包括第二目标图片时，可以生成针对异常特征的特殊标记，例如用方框框选异常特征，以指示相关人员对该方框框选部分进行仔细排查，即异常特征可以作为某些疾病诊断过程中的中间参考特征，仅仅依赖该异常特征还不足以诊断出疾病。需要说明的是：初筛网络模型输入的是整张原始图片，且由于医学图像的特性，例如复杂性、不易区分性，使得初筛网络模型的输出结果不够准确。本发明实施例涉及构建的分类标签是用于标记该初筛网络模型的第二目标图片分类训练集。

S102：根据所有样本图片的图片背景对所有样本图片进行分类；所述图片背景包括部分拍摄缺陷对应的图片背景、和/或附着有覆盖物的图片背景。

具体的，装置根据所有样本图片的图片背景对所有样本图片进行分类；所述图片背景包括部分拍摄缺陷对应的图片背景、和/或附着有覆盖物的图片背景。需要说明的是：部分拍摄缺陷对应的图片背景可以理解为：可以对异常特征进行比照的拍摄缺陷，例如：半曝光图片、局部曝光图片和细节模糊图片，图2(a)～图2(g)均为本发明实施例拍摄的半曝光图片的截图，图2(a)～图2(g)各图之间相互独立，都分别是半曝光图片的表现形式。这类图片的特征是：

半曝光图片(alpha_hw_big)：图幅50％以上面积因过曝光失去纹理和颜色特征，过曝光部分RGB数值接近于均质白色，正常曝光部分也存在RGB偏向白色的现象。此类图片数量占比大约是1.6％。尽管图片中有大片的区域发生过曝光，但仍有相当一部分区域曝光正常，存留的信息足以确定是否有异常特征，以及异常特征的类型和严重程度。因此，这部分图片不能被认定为“垃圾图片”。可以与有异常特征的对照组进行特征比对，进而确定是作为垃圾图片还是第二目标图片。

图3(a)～图3(g)均为本发明实施例拍摄的局部曝光图片的截图，图3(a)～图3(g)各图之间相互独立，都分别是局部曝光图片的表现形式。这类图片的特征是：

局部曝光图片(alpha_hw_small)：图幅20％-50％的面积因过曝光失去纹理和颜色特征，过曝光部分RGB数值接近于均质白色。此类图片数量占比大约是5％。尽管图片中有一部分的区域发生过曝光，但大部分区域曝光正常，存留的信息足以判断是否有异常特征，以及异常特征的类型和严重程度。因此，这部分图片不能被认定为“垃圾图片”。在分类体系中，这类图片被分为两个对照组：无异常特征的和有异常特征的。可以与有异常特征的对照组进行特征比对，进而确定是作为垃圾图片还是第二目标图片。

图4(a)～图4(h)均为本发明实施例拍摄的细节模糊图片的截图，图4(a)～图4(h)各图之间相互独立，都分别是细节模糊图片的表现形式。这类图片的特征是：

细节模糊图片(alpha_blur_blur)：由于对焦不准或者拍摄时晃动，导致图像细节线条模糊。但是图像结构信息保持完整，可以判别图像内容。图片数量占比7.8％，数量庞大。由于图像并不是完全模糊不清，大多数情况下，可以识别图像的拍摄位置和内容，特别是，如果这些图片里出现了异常特征信息，是很容易识别的。因此，不能把这类图片当作垃圾图片不去处理，相反，需要设立一个专门的类别，用于收集相似背景下的第二目标图片作对照分类，这个类别就是模糊异常特征集(focus_blur)。

附着有覆盖物的图片背景可以理解为被拍摄的拍摄物外表面被覆盖物附着的图片背景，覆盖物可以包括团块状悬浮物，气泡群，黏膜体，不作具体限定。图5(a)～图5(g)均为本发明实施例拍摄的附着有覆盖物的原始图片的截图，图5(a)～图5(g)各图之间相互独立，都分别是附着有覆盖物的原始图片的表现形式。

对根据所有样本图片的图片背景对所有样本图片进行分类，举例说明如下：

将可归属于半曝光图片的图片背景所有样本图片中的一部分A分类至半曝光图片的图片背景对应的类别a；将可归属于局部曝光图片的图片背景所有样本图片中的一部分B分类至局部曝光图片的图片背景对应的类别b；将可归属于细节模糊图片的图片背景所有样本图片中的一部分C分类至细节模糊图片的图片背景对应的类别c；将可归属于附着有覆盖物的图片背景所有样本图片中的一部分D分类至附着有覆盖物的图片背景对应的类别d，即上述A、B、C、D的总和构成了所有样本图片。为了体现分类的准确度，可以尽可能地细分分类，即如果附着有覆盖物的图片背景还可细分分类，则也可以进一步细分，可参照上述将拍摄缺陷细分为：半曝光图片、局部曝光图片和细节模糊图片的说明，不再赘述。

S103：将分类后的样本图片与每类第一目标图片分别进行比照，并根据比照结果对分类后的样本图片进行再次分类，并为再次分类的每类样本图片构建一一对应的标签；所述第一目标图片为拍摄物外表面不包含异常特征的目标图片。

具体的，装置将分类后的样本图片与每类第一目标图片分别进行比照，并根据比照结果对分类后的样本图片进行再次分类，并为再次分类的每类样本图片构建一一对应的标签；所述第一目标图片为拍摄物外表面不包含异常特征的目标图片。第一目标图片可以分为如下几类：基于局部结构特征的第一目标图片(14个类别)(对应上述第三大类)、所述基于局部结构特征的第一目标图片可以理解为是基于局部带有形状和/或色调变化的第一目标图片、洞状结构第一目标图片(8个类别)(对应上述第四大类)、基于全局结构特征的第一目标图片(24个类别)(对应上述第五大类)、所述基于全局结构特征的第一目标图片可以理解为是基于全局具有胃角结构和/或纹理结构的第一目标图片、分类后的样本图片可以与上述第三大类至第五大类中的每一类分别进行比照，为了更准确地识别图片、上述第三大类至第五大类中的每一类还可以继续细分、进一步地，还可以与每一类细分后的类型分别进行比照。以上述第三大类为例，可以再细分为局部带有形状变化的第一目标图片，图6(a)～图6(h)均为本发明实施例拍摄的局部带有形状变化的第一目标图片的截图，各图之间相互独立，都分别是局部带有形状变化的第一目标图片的表现形式，如图6(a)～图6(h)所示；可以再细分为局部带有色调变化的第一目标图片的截图、图7(a)～图7(h)均为本发明实施例拍摄的局部带有色调变化的第一目标图片的截图，各图之间相互独立，都分别是局部带有色调变化的第一目标图片的表现形式，如图7(a)～图7(h)所示。以上述第五大类为例，可以再细分为全局具有胃角结构的第一目标图片、图8(a)～图8(f)均为本发明实施例拍摄的全局具有胃角结构的第一目标图片的截图，各图之间相互独立，都分别是全局具有胃角结构的第一目标图片的表现形式，如图8(a)～图8(f)所示；全局具有纹理结构的第一目标图片、图9(a)～图9(f)均为本发明实施例拍摄的全局具有纹理结构的第一目标图片的截图，各图之间相互独立，都分别是全局具有纹理结构的第一目标图片的表现形式、如图9(a)～图9(f)所示。图10(a)～图10(h)均为本发明实施例拍摄的洞状结构第一目标图片的截图，各图之间相互独立，都分别是洞状结构第一目标图片的表现形式、洞状结构第一目标图片可以如图10(a)～图10(h)所示，还可以按照洞状面积的大小划分为大洞结构和小洞结构，并进一步进行细分。

以第三大类为例，对再次分类进行举例说明：参照上述举例，对于类别a可以再次分类为a1和a2，分别对应局部带有形状变化、局部带有色调变化、以a1为例，还可以进行进一步细分，例如可以根据形状变化的具体不同，再将a1划分为a11、a12等。参照上述举例，对类别a中的A再分类，将对应局部带有形状变化的A中的一部分A1再分类至a1，可以将a1作为再次分类的一类样本图片对应的标签、将对应局部带有色调变化的A中的一部分A2再分类至a2，可以将a2作为再次分类的一类样本图片对应的标签、同理，对其他再分类的情况不再赘述。

本发明实施例提供的分类标签的构建方法，通过对所有样本图片先后进行二次分类、并构建分类标签，能够提高样本图片的分类标签构建的合理性和准确度。

在上述实施例的基础上，所述并为再次分类的每类样本图片构建一一对应的标签的步骤之后，所述方法还包括：

获取每类样本图片分别对应的样本数量，并将少于第一预设数量的样本数量对应的每类样本图片作为每类第一目标样本图片。

具体的，装置获取每类样本图片分别对应的样本数量，并将少于第一预设数量的样本数量对应的每类样本图片作为每类第一目标样本图片。第一预设数量的具体数值可以根据实际情况自主设置，参照上述举例：如果a1对应的样本数量为300、如果a2对应的样本数量为150、第一预设数量为200，则将a2对应的一类样本图片作为第一目标样本图片。

生成增补模拟数据，并将所述增补模拟数据补入每类第一目标样本图片。

具体的，装置生成增补模拟数据，并将所述增补模拟数据补入每类第一目标样本图片。可以使用生成式对抗网络(Generative Adversarial Networks，简称“GAN”)生成增补模拟数据，所述增补模拟数据补入每类第一目标样本图片，以加强预设模型对该异常特征的记忆。参照上述举例，对于a2，可以生成的增补模拟数据为100个样本图片，再将这100个样本图片补入a2，使得增补后的a2中的样本数量为250。

本发明实施例提供的分类标签的构建方法，进一步能够提高样本图片的分类标签构建的合理性和准确度。

检测每类样本图片中的异常特征，将满足预设条件的每类样本图片作为每类第二目标样本图片；其中，所述预设条件包括异常特征所占据像素数少于预设像素数、且少于预设像素数的异常特征所对应的图片背景为复杂图片背景；所述复杂图片背景包括图片全局具有胃角结构和/或纹理结构的图片背景。

具体的，装置检测每类样本图片中的异常特征，将满足预设条件的每类样本图片作为每类第二目标样本图片；其中，所述预设条件包括异常特征所占据像素数少于预设像素数、且少于预设像素数的异常特征所对应的图片背景为复杂图片背景；所述复杂图片背景包括图片全局具有胃角结构和/或纹理结构的图片背景。需要说明的是：每类样本图片中的异常特征可以有多个，存在至少其中一个异常特征满足上述预设条件，即可触发确定每类第二目标样本图片的动作，预设像素数可以根据实际情况自主设置，该方案的应用场景为：小型异常特征(可以是占据50个像素以下的)出现在复杂图片背景中，这种情况下，复杂图片背景中会出现大量噪声信息，干扰了预设模型对上述小型异常特征的正确识别。参照上述举例，举例说明如下：对于a1，a1中的某一图片存在一个异常特征ax1，ax1所占据像素数少于预设像素数、且ax1对应的图片为a1中的y1(即上述某一图片)、且y1为复杂图片背景，则将y1作为对应a1的第二目标样本图片，对于存在多个异常特征都满足预设条件的情况，例如ax2和ax3，如果ax2和ax3对应的图片为a1中的同一张图片y2，且y2为复杂图片背景，则将y2作为对应a1的第二目标样本图片；如果ax2和ax3对应的图片为a1中的两张图片y3和y4，且y3和y4都为复杂图片背景，则将y3和y4都作为对应a1的第二目标样本图片。

生成增补模拟数据，并将所述增补模拟数据补入每类第二目标样本图片。

具体的，装置生成增补模拟数据，并将所述增补模拟数据补入每类第二目标样本图片。可参照上述实施例的说明，不再赘述。

在上述实施例的基础上，所述异常特征划分为异常子特征；相应的，所述并为再次分类的每类样本图片构建一一对应的标签的步骤之后，所述方法还包括：

获取每类样本图片对应的异常子特征，并获取每类异常子特征对应的样本图片数量；并将多于第二预设数量的样本图片数量对应的异常子特征所在的样本图片作为每类第三目标样本图片。

具体的，装置获取每类样本图片对应的异常子特征，并获取每类异常子特征对应的样本图片数量；并将多于第二预设数量的样本图片数量对应的异常子特征所在的样本图片作为每类第三目标样本图片。第二预设数量可根据实际情况自主设置，该方案的应用场景为：某个异常特征中聚集了过多的异常子特征，导致预设模型的识别精度下降。例如异常特征为拍摄物外表面发红，对应的异常子特征可以包括弥漫性发红、片状发红和长条状发红。举例说明如下：对于a1，a1中的异常特征为拍摄物外表面发红，异常子特征为弥漫性发红、片状发红和长条状发红、分别对应的样本图片数量为200、300和600，如果第二预设数量选为400，则将长条状发红所在的样本图片z1(数量为600)作为a1对应的第三目标样本图片。

分别拆分每类第三目标样本图片。

具体的，装置分别拆分每类第三目标样本图片。参照上述举例，可以将长条状发红对应的异常子特征，进一步进行细分，从而使得细分后分类中的样本图片数量较少。

本发明实施例提供的分类标签的构建方法，基于异常子特征进行拆分分类类别，进一步能够提高样本图片的分类标签构建的合理性和准确度。

在上述实施例的基础上，所述分别拆分每类第三目标样本图片，包括：

对于某一类第三目标样本图片j，获取第三目标样本图片j的所有图片背景。

具体的，装置对于某一类第三目标样本图片j，获取第三目标样本图片j的所有图片背景。参照上述举例，第三目标样本图片j对应上述z1。

比较所有图片背景之间的第一相似度，并将第一相似度低于第一预设相似度的每两个图片背景对应的图片进行拆分。

具体的，装置比较所有图片背景之间的第一相似度，并将第一相似度低于第一预设相似度的每两个图片背景对应的图片进行拆分。第一预设相似度可以根据实际情况自主设置。相似度的计算为本领域成熟技术，不再赘述。举例说明如下：对于长条状发红对应的600个样本图片，经过上述的相似度比较可以将相似程度较低的样本图片单独划分出来，例如，600个样本图片可以基于相似度分为三类d1～d3，使得d1～d3中的每一类中的样本图片的相似程度更高。

本发明实施例提供的分类标签的构建方法，通过基于异常子特征、图片背景的第一相似度进行拆分分类类别，进一步能够提高样本图片的分类标签构建的合理性和准确度。

在上述实施例的基础上，所述并将第一相似度低于第一预设相似度的每两个图片背景对应的图片进行拆分的步骤之后，所述方法还包括：

获取拆分后的每类第三样本图片对应的样本图片数量，并将多于第二预设数量的样本图片数量对应的拆分后的每类样本图片作为每类第四目标样本图片。

具体的，装置获取拆分后的每类第三样本图片对应的样本图片数量，并将多于第二预设数量的样本图片数量对应的拆分后的每类样本图片作为每类第四目标样本图片。参照上述举例，z1拆分后对应的d1～d3中的样本图片数量分别为450、100、50，d1对应的样本图片数量仍然多于第二预设数量，因此，将d1作为第四目标样本图片。

分别拆分每类第四目标样本图片。

具体的，装置分别拆分每类第四目标样本图片。即对d1进一步进行细分，从而使得细分后分类中的样本图片数量较少。

本发明实施例提供的分类标签的构建方法，通过继续拆分每类第四目标样本图片，进一步能够提高样本图片的分类标签构建的合理性和准确度。

在上述实施例的基础上，所述分别拆分每类第四目标样本图片，包括：

对于某一类第四目标样本图片i，获取第四目标样本图片i的所有异常子特征。

具体的，装置对于某一类第四目标样本图片i，获取第四目标样本图片i的所有异常子特征。参照上述举例，第四目标样本图片i对应上述d1。

比较所有异常子特征之间的第二相似度，并将第二相似度低于第二预设相似度的每两个异常子特征对应的图片进行拆分。

具体的，装置比较所有异常子特征之间的第二相似度，并将第二相似度低于第二预设相似度的每两个异常子特征对应的图片进行拆分。第二预设相似度可以根据实际情况自主设置。相似度的计算为本领域成熟技术，不再赘述。举例说明如下：对于上述d1对应的450个样本图片，经过上述的相似度比较可以将相似程度较低的样本图片单独划分出来，例如，450个样本图片可以基于相似度再次分为三类d11～d13，使得d11～d13中的每一类中的样本图片的相似程度更高。

本发明实施例提供的分类标签的构建方法，通过基于异常子特征、异常子特征的第二相似度进行拆分分类类别，进一步能够提高样本图片的分类标签构建的合理性和准确度。

即本发明实施例优先基于图片背景的第一相似度进行拆分分类类别、如果还存在某类臃肿的类别，再基于异常子特征的第二相似度进行再次拆分分类类别，避免存在某类臃肿的类别，便于提供预设模型识别图片的准确度。

图11为本发明分类标签的构建装置实施例结构示意图，如图11所示，本发明实施例提供了一种分类标签的构建装置，包括获取单元1101、分类单元1102和构建单元1103，其中：

获取单元1101用于获取用于训练预设模型的样本图片；所述预设模型是用于识别原始图片的初筛网络模型；所述样本图片为拍摄物外表面包含异常特征的第二目标图片；所述异常特征包括凸起特征和/或指定颜色特征；分类单元1102用于根据所有样本图片的图片背景对所有样本图片进行分类；所述图片背景包括部分拍摄缺陷对应的图片背景、和/或附着有覆盖物的图片背景；构建单元1103用于将分类后的样本图片与每类第一目标图片分别进行比照，并根据比照结果对分类后的样本图片进行再次分类，并为再次分类的每类样本图片构建一一对应的标签；所述第一目标图片为拍摄物外表面不包含异常特征的目标图片。

具体的，获取单元1101用于获取用于训练预设模型的样本图片；所述预设模型是用于识别原始图片的初筛网络模型；所述样本图片为拍摄物外表面包含异常特征的第二目标图片；所述异常特征包括凸起特征和/或指定颜色特征；分类单元1102用于根据所有样本图片的图片背景对所有样本图片进行分类；所述图片背景包括部分拍摄缺陷对应的图片背景、和/或附着有覆盖物的图片背景；构建单元1103用于将分类后的样本图片与每类第一目标图片分别进行比照，并根据比照结果对分类后的样本图片进行再次分类，并为再次分类的每类样本图片构建一一对应的标签；所述第一目标图片为拍摄物外表面不包含异常特征的目标图片。

本发明实施例提供的分类标签的构建装置，通过对所有样本图片先后进行二次分类、并构建分类标签，能够提高样本图片的分类标签构建的合理性和准确度。

本发明实施例提供的分类标签的构建装置具体可以用于执行上述各方法实施例的处理流程，其功能在此不再赘述，可以参照上述方法实施例的详细描述。

图12为本发明实施例提供的电子设备实体结构示意图，如图12所示，所述电子设备包括：处理器(processor)1201、存储器(memory)1202和总线1203；

其中，所述处理器1201、存储器1202通过总线1203完成相互间的通信；

所述处理器1201用于调用所述存储器1202中的程序指令，以执行上述各方法实施例所提供的方法，例如包括：获取用于训练预设模型的样本图片；所述预设模型是用于识别原始图片的初筛网络模型；所述样本图片为拍摄物外表面包含异常特征的第二目标图片；所述异常特征包括凸起特征和/或指定颜色特征；根据所有样本图片的图片背景对所有样本图片进行分类；所述图片背景包括部分拍摄缺陷对应的图片背景、和/或附着有覆盖物的图片背景；将分类后的样本图片与每类第一目标图片分别进行比照，并根据比照结果对分类后的样本图片进行再次分类，并为再次分类的每类样本图片构建一一对应的标签；所述第一目标图片为拍摄物外表面不包含异常特征的目标图片。

本实施例公开一种计算机程序产品，所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序，所述计算机程序包括程序指令，当所述程序指令被计算机执行时，计算机能够执行上述各方法实施例所提供的方法，例如包括：获取用于训练预设模型的样本图片；所述预设模型是用于识别原始图片的初筛网络模型；所述样本图片为拍摄物外表面包含异常特征的第二目标图片；所述异常特征包括凸起特征和/或指定颜色特征；根据所有样本图片的图片背景对所有样本图片进行分类；所述图片背景包括部分拍摄缺陷对应的图片背景、和/或附着有覆盖物的图片背景；将分类后的样本图片与每类第一目标图片分别进行比照，并根据比照结果对分类后的样本图片进行再次分类，并为再次分类的每类样本图片构建一一对应的标签；所述第一目标图片为拍摄物外表面不包含异常特征的目标图片。

本实施例提供一种非暂态计算机可读存储介质，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令使所述计算机执行上述各方法实施例所提供的方法，例如包括：获取用于训练预设模型的样本图片；所述预设模型是用于识别原始图片的初筛网络模型；所述样本图片为拍摄物外表面包含异常特征的第二目标图片；所述异常特征包括凸起特征和/或指定颜色特征；根据所有样本图片的图片背景对所有样本图片进行分类；所述图片背景包括部分拍摄缺陷对应的图片背景、和/或附着有覆盖物的图片背景；将分类后的样本图片与每类第一目标图片分别进行比照，并根据比照结果对分类后的样本图片进行再次分类，并为再次分类的每类样本图片构建一一对应的标签；所述第一目标图片为拍摄物外表面不包含异常特征的目标图片。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于一计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种分类标签的构建方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述并为再次分类的每类样本图片构建一一对应的标签的步骤之后，所述方法还包括：

获取每类样本图片分别对应的样本数量，并将少于第一预设数量的样本数量对应的每类样本图片作为每类第一目标样本图片；

3.根据权利要求1所述的方法，其特征在于，所述并为再次分类的每类样本图片构建一一对应的标签的步骤之后，所述方法还包括：

检测每类样本图片中的异常特征，将满足预设条件的每类样本图片作为每类第二目标样本图片；其中，所述预设条件包括异常特征所占据像素数少于预设像素数、且少于预设像素数的异常特征所对应的图片背景为复杂图片背景；所述复杂图片背景包括图片全局具有胃角结构和/或纹理结构的图片背景；

4.根据权利要求1至3任一所述的方法，其特征在于，所述异常特征划分为异常子特征；相应的，所述并为再次分类的每类样本图片构建一一对应的标签的步骤之后，所述方法还包括：

获取每类样本图片对应的异常子特征，并获取每类异常子特征对应的样本图片数量；并将多于第二预设数量的样本图片数量对应的异常子特征所在的样本图片作为每类第三目标样本图片；

分别拆分每类第三目标样本图片。

5.根据权利要求4所述的方法，其特征在于，所述分别拆分每类第三目标样本图片，包括：

对于某一类第三目标样本图片j，获取第三目标样本图片j的所有图片背景；

6.根据权利要求5所述的方法，其特征在于，所述并将第一相似度低于第一预设相似度的每两个图片背景对应的图片进行拆分的步骤之后，所述方法还包括：

获取拆分后的每类第三样本图片对应的样本图片数量，并将多于第二预设数量的样本图片数量对应的拆分后的每类样本图片作为每类第四目标样本图片；

分别拆分每类第四目标样本图片。

7.根据权利要求6所述的方法，其特征在于，所述分别拆分每类第四目标样本图片，包括：

对于某一类第四目标样本图片i，获取第四目标样本图片i的所有异常子特征；

8.一种分类标签的构建装置，其特征在于，包括：

9.一种非暂态计算机可读存储介质，其特征在于，所述非暂态计算机可读存储介质存储计算机指令，所述计算机指令使所述计算机执行如权利要求1至7任一所述的方法。