CN111860674A

CN111860674A - 样本类别识别方法、装置、计算机设备及存储介质

Info

Publication number: CN111860674A
Application number: CN202010738650.1A
Authority: CN
Inventors: 吴海萍; 陶蓉; 徐尚良; 张芮溟; 周鑫
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2020-07-28
Filing date: 2020-07-28
Publication date: 2020-10-30
Anticipated expiration: 2040-07-28
Also published as: WO2021121127A1; CN111860674B

Abstract

本发明涉及人工智能领域，本发明公开了一种样本类别识别方法、装置、计算机设备及存储介质，所述方法包括：获取待识别样本；输入第一样本检测模型进行样本特征提取及语义特征识别，得到待处理样本识别结果；在与所有第一样本类别均不匹配时，将样本特征空间结果和样本语义空间结果输入至第二样本检测模型中；对样本特征空间结果进行聚类处理得到第一异常结果，并对样本语义空间结果进行相似度匹配得到第二异常结果；输出待识别样本的样本类别。本发明实现了自动识别样本类别，节省人工成本，提高识别准确率。本发明适用于智慧交通或智慧医疗等领域，可进一步推动智慧城市的建设，本发明还涉及区块链技术，第一样本检测模型可存储于区块链中。

Description

样本类别识别方法、装置、计算机设备及存储介质

技术领域

本发明涉及人工智能的图像分类领域，尤其涉及一种样本类别识别方法、装置、计算机设备及存储介质。

背景技术

目前，随着科技的发展，在生活中图形识别的应用已经越来越普遍。在图像识别中要想得到比较好的识别效果就必须需要每一种类的大量样本图像来进行训练。但是，对于大量收集每一种类的训练样本在实际应用中往往很难实现，特别是对一种含有已知描述且难以收集的异常种类或者新的种类进行识别时，很难收集到这些种类的图像作为样本来进行训练，因为都是靠人工识别出这些异常种类或者新的种类，并且出现的概率极低(是由于需要靠破坏性实验得出或者需耗费代价成本高得出等等)，导致无法训练出可以准确识别出上述种类的模型，还需要花费较高的人工成本进行识别分类，所以在零样本的识别问题上就显得极为重要，而且这个问题越来越受到工业界的关注。比如，在零件质检上，正常零件、断裂零件的图像容易收集，出现轻微裂痕、轻微凹陷、内部断裂等异常情况的零件的图像就难于收集，识别结果不佳；在车辆定损识别上，划痕、刮擦、撕裂、凹陷的车辆损伤照片容易收集，出现褶皱、死折、缺失等严重损伤的车辆损伤照片就难于收集，定损识别就不佳；在医学影像检验上，肺部正常、肺炎、肺积水等常见的X光片容易收集，但是肺结核早期、肺癌早期等罕见的X光片就难于收集，肺部医学检测不佳等等。

发明内容

本发明提供一种样本类别识别方法、装置、计算机设备及存储介质，实现了通过基于端到端的第一样本检测模型和基于零样本学习的第二样本检测模型，自动识别出待识别样本的样本类别，本发明适用于智慧交通或智慧医疗等领域，可进一步推动智慧城市的建设，从而减少了人工识别的成本，并且提高了识别准确率。

一种样本类别识别方法，包括：

获取待识别样本；

将所述待识别样本输入第一样本检测模型进行样本特征提取及语义特征识别，得到待处理样本识别结果；所述待处理样本识别结果包括第一样本检测结果、样本特征空间结果和样本语义空间结果；

在所述第一样本检测结果与所有第一样本类别均不匹配时，则将所述样本特征空间结果和所述样本语义空间结果输入至第二样本检测模型中；

通过所述第二样本检测模型对所述样本特征空间结果进行聚类处理，得到第一异常结果，同时对所述样本语义空间结果进行相似度匹配，得到第二异常结果；

根据所述第一异常结果和所述第二异常结果，确定所述待识别样本的样本类别并输出。

一种样本类别识别装置，包括：

获取模块，用于获取待识别样本；

识别模块，用于将所述待识别样本输入第一样本检测模型进行样本特征提取及语义特征识别，得到待处理样本识别结果；所述待处理样本识别结果包括第一样本检测结果、样本特征空间结果和样本语义空间结果；

匹配模块，用于在所述第一样本检测结果与所有第一样本类别均不匹配时，则将所述样本特征空间结果和所述样本语义空间结果输入至第二样本检测模型中；

异常模块，用于通过所述第二样本检测模型对所述样本特征空间结果进行聚类处理，得到第一异常结果，同时对所述样本语义空间结果进行相似度匹配，得到第二异常结果；

输出模块，用于根据所述第一异常结果和所述第二异常结果，确定所述待识别样本的样本类别并输出。

一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述样本类别识别方法的步骤。

一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述样本类别识别方法的步骤。

本发明提供的样本类别识别方法、装置、计算机设备及存储介质，通过获取待识别样本；将所述待识别样本输入第一样本检测模型进行样本特征提取及语义特征识别，得到待处理样本识别结果；所述待处理样本识别结果包括第一样本检测结果、样本特征空间结果和样本语义空间结果；在所述第一样本检测结果与所有第一样本类别均不匹配时，则将所述样本特征空间结果和所述样本语义空间结果输入至第二样本检测模型中；通过所述第二样本检测模型对所述样本特征空间结果进行聚类处理，得到第一异常结果，同时对所述样本语义空间结果进行相似度匹配，得到第二异常结果；根据所述第一异常结果和所述第二异常结果，确定所述待识别样本的样本类别并输出，如此，实现了首先通过端到端的第一样本检测模型对待识别样本进行识别，在第一样本检测模型输出的第一样本检测结果与第一样本类别不匹配时，根据样本特征空间结果与样本语义空间结果之间的关联关系，通过基于零样本学习的第二样本检测模型，识别出待识别样本的样本类别，从而能够自动对难以收集或者新的样本类别的样本进行准确的样本类别识别，减少了人工识别的成本，自动给难以收集或者新的样本类别的样本标注样本类别，节省了人工成本，并且提高了识别准确率。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一实施例中样本类别识别方法的应用环境示意图；

图2是本发明一实施例中样本类别识别方法的流程图；

图3是本发明另一实施例中样本类别识别方法的流程图；

图4是本发明一实施例中样本类别识别方法的步骤S20的流程图；

图5是本发明一实施例中样本类别识别方法的步骤S206的流程图；

图6是本发明一实施例中样本类别识别方法的步骤S2063的流程图；

图7是本发明一实施例中样本类别识别方法的步骤S40的流程图；

图8是本发明一实施例中样本类别识别装置的原理框图；

图9是本发明一实施例中计算机设备的示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明提供的样本类别识别方法，可应用在如图1的应用环境中，其中，客户端(计算机设备)通过网络与服务器进行通信。其中，客户端(计算机设备)包括但不限于为各种个人计算机、笔记本电脑、智能手机、平板电脑、摄像头和便携式可穿戴设备。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一实施例中，如图2所示，提供一种样本类别识别方法，其技术方案主要包括以下步骤S10-S50：

S10，获取待识别样本。

可理解地，在对收集的样本进行识别样本类别的应用场景下触发样本识别请求，获取所述样本识别请求中的所述待识别样本，所述应用场景可以根据需求设定，比如在汽车零件的质检上对收集的零件样本图像进行识别，或者在车辆定损上对用于训练定损识别模型的样本进行识别，或者在医学影像检验上对用于训练肺部识别模型的样本进行识别等等，所述待识别样本为需要进行识别的样本图像或者照片文件。

S20，将所述待识别样本输入第一样本检测模型进行样本特征提取及语义特征识别，得到待处理样本识别结果；所述待处理样本识别结果包括第一样本检测结果、样本特征空间结果和样本语义空间结果。

可理解地，将所述待识别样本输入所述第一样本检测模型中，所述第一样本检测模型为通过多个第一样本类别的训练样本进行训练的多个分支识别的且训练完成的多分支卷积神经网络模型，所述第一样本类别为常规的、容易收集的、大量的样本类别，比如第一样本类别为车辆无损、划痕、刮擦、撕裂、凹陷等，所述第一样本检测模型的网络结构可以根据需求设定，比如网络结构可以为Resnet50的网络结构、CNN的网络结构、VGG的网络结构等等，作为优选，所述第一样本检测模型的网络结构为Resnet50的网络结构，所述样本特征为多个分支维度的与第一样本类别识别相关的特征，所述样本特征包括高维度显性特征和低维度隐性特征，所述样本特征可以根据需求设定，比如在车损识别中，高维度显性特征包括变形特征、色差特征等，低纬度隐性特征包括光滑度特征等，所述样本特征空间结果为通过所述第一样本检测模型对所述待识别样本进行多分支任务的特征卷积及正则化处理后得到的样本特征向量集合，所述样本特征向量为体现所述样本特征中的一种特征且通过特征向量进行衡量的数组，所述样本特征向量的维度可以根据需求设定，比如样本特征向量的维度可以为256维度，其中，一个分支任务对应所述样本特征中的一种特征，也对应一个所述样本特征向量，所述样本特征空间结果能够通过多个维度体现所述样本特征中的各特征，所述语义特征识别还包括通过输入收敛后的所述嵌入空间模型中的最终映射函数中进行转换，获取所述最终映射函数输出的与其输入对应的语义特征向量，所述最终映射函数为收敛之后的映射函数，将收敛后的所述嵌入空间模型根据所述样本特征空间结果输出的所有所述语义特征向量记录为所述样本语义空间结果。

其中，通过所述第一样本检测模型对所述待识别样本进行识别，获取识别出的与各所述第一样本类别对应的概率值，在所有与各第一样本类别对应的概率值中筛选出所有所述概率值中最大的值，若所有所述概率值中最大的值大于或等于预设的概率阈值，则将所有所述概率值中最大的值对应的第一样本类别确定为与所述待识别样本对应的所述第一样本检测结果；若所有所述概率值中最大的值小于所述概率阈值，则将与所述待识别样本对应的所述第一样本检测结果确认为空或者异常种类。

在一实施例中，如图3所示，所述步骤S20之后，即所述将所述待识别样本输入第一样本检测模型进行样本特征提取及语义特征识别，得到待处理样本识别结果之后，还包括：

S60，在所述第一样本检测结果与任一所述第一样本类别匹配时，将匹配的所述第一样本类别确定为所述待识别样本的样本类别。

可理解地，如果所述第一样本检测结果与所有所述第一样本类别中的其中一个匹配时，所述匹配的方式可以根据需求设定，比如匹配方式为与第一样本类别的内容完全一致，或者与第一样本类别的内容相似度达到预设的类别概率时确定为匹配等等，将匹配的所述第一样本类别记录为所述待识别样本的样本类别。

如此，通过将所述第一样本检测结果与任一个所述第一样本类别进行匹配，若存在与其中一个第一样本类别匹配，则确定出所述待识别样本的样本类别，因此，通过端到端的第一样本检测模型，能够准确识别出所述待识别样本是否为第一样本类别中的一种，提高了识别准确率。

在一实施例中，如图4所示，所述步骤S20之前，即所述将所述待识别样本输入第一样本检测模型进行样本特征提取及语义特征识别之前，包括：

S201，获取训练样本集；所述训练样本集包含多个训练样本，一个所述训练样本与一个第一样本类别以及一个第一样本描述关联。

可理解地，所述训练样本集为所述训练样本的集合，所述训练样本为容易收集的各种第一样本类别的图像，一个所述训练样本都与一个第一样本类别关联，而且与一个所述第一样本描述关联，所述第一样本描述为对所述训练样本中的所述第一样本类别的文本描述，比如一张车身被刮擦的车辆损伤照片作为训练样本，关联的第一样本类别为“刮擦”，关联的第一样本描述为“车身中间部分被刮出长度为7厘米和宽度为2厘米的无明显变形及凹陷的损伤面积”。

S202，将所述训练样本输入含有初始参数的多分支卷积神经网络模型。

可理解地，将所述训练样本输入至所述多分支卷积神经网络模型，所述多分支卷积神经网络模型包括所述初始参数，所述初始参数包括网络结构的参数和特征向量的维度参数等等。

在一实施例中，所述步骤S202之前，即所述将所述训练样本输入含有初始参数的多分支卷积神经网络模型之前，包括：

S2021，通过迁移学习，获取训练完成的无监督域训练模型的所有迁移参数，将所有所述迁移参数确定为所述多分支卷积神经网络模型中的所述初始参数。

可理解地，所述迁移学习(Transfer Learning，TL)为利用其他领域已有的训练模型的参数应用在本领域的任务中，即所述多分支卷积神经网络模型通过迁移学习的方式获取无监督域训练模型(unsupervised pre-training)的所有模型参数，所述无监督域训练模型可以为自然领域或者车辆识别领域的无监督学习的多分支卷积神经网络模型，然后将所述所有模型参数确定为所述多分支卷积神经网络模型的初始参数。如此，本发明通过迁移学习，从训练完成的无监督域训练模型中获取初始参数，能够缩短模型的迭代次数，简化训练过程，及提高训练效率。

S203，通过所述多分支卷积神经网络模型对所述训练样本进行样本特征提取，得到图像特征空间结果。

可理解地，所述样本特征为多个分支维度的与样本识别相关的特征，所述样本特征包括高维度显性特征和低维度隐性特征，所述样本特征可以根据需求设定，比如在车损识别中，高维度显性特征包括变形特征、色差特征等，低纬度隐性特征包括光滑度特征等，所述图像特征空间结果为通过所述多分支卷积神经网络模型对所述训练样本进行多分支任务的特征卷积及正则化处理后得到的图像特征向量，所述图像特征向量为体现所述样本特征中的一种特征且通过特征向量进行衡量的数组，所述图像特征向量的维度可以根据需求设定，比如图像特征向量的维度可以为256维度，其中，一个分支任务对应所述样本特征中的一种特征，也对应一个所述图像特征向量，所述图像特征空间结果能够通过多个维度体现所述样本特征中的各特征。

在一实施例中，所述S203中，即所述通过所述多分支卷积神经网络模型对所述训练样本进行样本特征提取，得到图像特征空间结果，包括：

S2031，对所述训练样本进行图像预处理，得到预处理样本图像；

可理解地，所述预处理为对所述训练样本进行特征区域识别、提取预设尺寸图像并对提取后的图像进行增强处理的操作过程，在所述训练样本中识别出存在样本特征的区域，可以通过YOLO(You Only Look Once)算法进行识别，识别出含有样本特征的特征区域后提取出预设尺寸的图像，预设尺寸可以根据需求设定，作为优选，预设尺寸为224×224的尺寸，对提取后的图像进行增强处理，所述增强处理可以根据需求设定，比如增强处理为去噪及锐化的处理，从而获得所述预处理样本图像。

S2032，对所述预处理样本图像进行特征提取，得到至少一个特征向量图；

可理解地，对所述预处理样本图像的各通道进行特征提取，所述特征提取为通过不同特征对应的各个不同的卷积核对各通道进行卷积输出特征向量图，卷积的过程根据所述多分支卷积神经网络模型的网络结构确定，比如对所述预处理样本图像的各个通道进行高维度特征的特征提取，得到高维度特征对应的特征向量图，所述特征向量图由多个特征向量值组成。

S2033，对各所述特征向量图进行正则化处理，得到与各所述特征向量图对应的图像特征向量；

可理解地，所述正则化处理为对各特征向量图中的特征向量值进行N次根正则化非线性处理，通过所述正则化处理可以对所述特征向量图进行微调，更能体现各特征，从而输出图像特征向量。

S2034，将所有所述图像特征向量确定为所述图像特征空间结果。

可理解地，将所有所述图像特征向量标记为所述图像特征空间结果。

本发明实现了通过对所述训练样本进行图像预处理，得到预处理样本图像；对所述预处理样本图像进行特征提取，得到至少一个特征向量图；对各所述特征向量图进行正则化处理，得到与各所述特征向量图对应的图像特征向量；将所有所述图像特征向量确定为所述图像特征空间结果，如此，通过图像预处理、特征提取和正则化处理，能够提高识别的准确率和可靠性。

S204，通过所述多分支卷积神经网络模型中的嵌入空间模型对所述图像特征空间结果进行语义特征识别，得到语义特征空间结果；所述嵌入空间模型为通过构建图像特征向量与语义特征向量之间的关联关系获得。

可理解地，所述嵌入空间模型为通过训练样本对应的图像特征向量和与训练样本对应的第一样本描述转换成语义特征向量之间的映射关系进行学习获得，即将训练样本的第一样本描述输入基于Word2vec的语义识别模型，对第一样本描述进行语义向量转换，得到与第一样本描述对应的语义特征向量，所述基于Word2vec的语义识别模型为训练完成的深度神经网络模型，所述语义识别模型能够将输入的文本进行语义向量转换生成与所述样本特征的各特征对应的语义特征的向量值，即生成语义特征向量，例如：第一样本描述描述为“车身中间部分被刮出长度为7厘米和宽度为2厘米的无明显变形及凹陷的损伤面积”经过语义向量转换之后会得到在变形相关的语义特征对应的向量值，在色差相关的语义特征对应的向量值，在光滑面相关的语义特征对应的向量值等等，建立训练样本对应的图像特征向量和语义特征向量之间的映射函数，通过所述多分支卷积神经网络模型的不断迭代，进而不断学习，直至达到所述多分支卷积神经网络模型收敛，此时训练样本对应的图像特征向量和语义特征向量之间的映射函数学习完成，即图像特征向量输入映射函数后输出的值和与图像特征向量对应的语义特征向量之间的均方差达到最小，也即所述嵌入空间模型收敛完成，所述语义特征识别为通过输入所述嵌入空间模型中的映射函数中进行转换，获取所述映射函数输出的与其输入对应的语义特征向量，将嵌入空间模型根据所述图像特征空间结果输出的所有所述语义特征向量记录为所述语义特征空间结果。

S205，通过K-means聚类算法，对所述图像特征空间结果进行识别，得到训练类别结果，并将所述训练类别结果、所述图像特征空间结果和所述语义特征空间结果确定为样本训练结果。

可理解地，所述K-means聚类算法也称K均值聚类算法，采用距离作为相似性的评价指标，通过根据靠近各训练类别的簇的距离确定其对应的训练类别，通过所述K-means聚类算法，计算出所述图像特征空间结果中的各图像特征向量与各训练类别结果的中心的欧式距离，根据各欧式距离确定出与其对应训练类别结果，所述训练类别结果中包含的类别与所述第一样本类别中包含的类别完全相同，从而做到端到端的识别，达到集中提取相同类别对应的特征，提高了识别准确率。

其中，将所述训练样本对应的所述训练类别结果、所述图像特征空间结果和所述语义特征空间结果标记为所述训练样本对应的所述样本训练结果。

S206，根据所述图像特征空间结果和与所述训练样本对应的所述第一样本类别，得到第一损失值；根据所述语义特征空间结果和与所述训练样本对应的所述第一样本描述，得到第二损失值。

可理解地，通过计算所述图像特征空间结果和与所述第一样本类别对应的中心向量之间的差距，得到所述第一损失值；将所述第一样本描述输入基于Word2vec的语义识别模型中，对所述第一样本描述进行语义向量转换，得到与所述第一样本描述对应的语义特征向量，通过计算所述语义特征空间结果和与该语义特征向量之间的语义相似度值，得到所述第二损失值，所述第二损失值表征了所述语义特征空间结果与该语义特征向量之间的差距。

在一实施例中，如图5所示，所述步骤S206中，即所述通过所述多分支卷积神经网络模型对所述训练样本进行样本特征提取，得到图像特征空间结果，包括：

S2061，通过所述多分支卷积神经网络模型将与所述训练样本对应的所述第一样本类别进行向量转换，得到与所述第一样本类别对应的中心向量；所述中心向量包括欧式域中心向量和角度域中心向量。

可理解地，将所述第一样本类别进行向量转换，所述向量转换为将文本类型的所述第一样本类别按照预设的映射关系进行转换，得到与所述第一样本类别匹配的所述中心向量，所述中心向量包括所述欧式域中心向量和所述角度域中心向量。

S2062，通过交叉熵损失算法，根据所述图像特征空间结果和所述欧式域中心向量，得到欧式损失值。

可理解地，通过交叉熵损失函数，计算出所述图像特征空间结果中的各所述图像特征向量与所述欧式域中心向量之间的损失值，将该损失值记录为所述欧式损失值。

S2063，通过ArcFace损失算法，根据所述图像特征空间结果和所述角度域中心向量，得到角度损失值。

可理解地，通过ArcFace损失函数，计算出所述图像特征空间结果中的各所述图像特征向量与所述角度域中心向量之间的损失值，将该损失值记录为所述角度损失值。

在一实例中，如图6所示，所述步骤S2063中，即所述通过ArcFace损失算法，根据所述图像特征空间结果和所述角度域中心向量，得到角度损失值，包括：

S20631，通过所述多分支卷积神经网络模型中的正则化模型，对所述图像特征空间结果进行正则化处理，得到正则化特征向量。

可理解地，所述多分支卷积神经网络模型包括所述正则化模型，所述正则化模型包含有正则化函数，将各所述图像特征向量输入正则化函数中，输出所述正则化特征向量，所述正则化特征向量为：

，其中，数学符号函数：

，b₁为图像特征向量中的第一个特征向量值，b_m为图像特征向量中的第m 个特征向量值，b_i为图像特征向量中的第i个特征向量值，N为预设的n次方根的值。

S20632，将所述正则化特征向量与所述角度域中心向量输入角度域损失模型，通过所述角度域损失模型中的所述ArcFace损失算法，得到角度损失值。

可理解地，所述ArcFace损失算法为通过ArcFace损失函数计算其损失值的算法，将所述正则化特征向量与所述角度域中心向量通过ArcFace损失函数中的余弦角度比对方法，通过角度域的方向衡量其差距，从而得到所述角度损失值。

如此，本发明实现了通过所述多分支卷积神经网络模型中的正则化模型、角度域损失模型，获得角度损失值，因此，通过正则化能够限制模型发散，起到在识别分类过程中微调的作用，在通过角度域损失模型能够增加类别之间距离紧凑的考虑。

S2064，对所述欧式损失值和所述角度损失值进行加权处理，得到所述第一损失值。

可理解地，通过将所述欧式损失值和所述角度损失值输入至第一损失函数中，将所述欧式损失值和所述角度损失值转换成同一维度的指标并进行加权乘积处理，得到所述第一损失函数输出的所述第一损失值，通过在欧式损失值的基础上增加角度损失值的考虑，能够不仅对正确类别分类的考虑，还对类别之间距离紧凑的考虑，使得第一损失函数在分类结果上有很好的表现力。如此，本发明实现了通过所述多分支卷积神经网络模型将与所述训练样本对应的所述第一样本类别进行向量转换，得到与所述第一样本类别对应的中心向量；通过交叉熵损失算法，获取欧式损失值；通过ArcFace损失算法，获取角度损失值；对所述欧式损失值和所述角度损失值进行加权处理，得到所述第一损失值，因此，通过引入角度损失值让识别向更加紧凑的识别方向靠拢，让识别精度更加准确。

S207，根据所述第一损失值和所述第二损失值，得到总损失值。

可理解地，将所述第一损失值和所述第二损失值输入所述多分支卷积神经网络模型中的含有总损失函数的总损失模型，所述总损失模型中的总损失函数可以根据需求设定，所述损失模型为生成所述总损失值的模型，通过所述总损失函数计算出所述总损失值。

在一实施例中，所述步骤S207中，即所述根据所述第一损失值和所述第二损失值，得到总损失值，包括：

S2071，将所述第一损失值和所述第二损失值输入预设的总损失模型，通过所述总损失模型中的总损失函数计算出所述总损失值；所述总损失函数为：

L＝w₁×X1+w₂×X2

其中，

X1为第一损失值；

X2为第二损失值；

w₁为第一损失值的权重；

w₂为第二损失值的权重。

S208，在所述总损失值未达到预设的收敛条件时，迭代更新所述多分支卷积神经网络模型的初始参数，并触发所述通过所述多分支卷积神经网络模型对所述训练样本进行样本特征提取，得到图像特征空间结果的步骤，直至所述总损失值达到所述预设的收敛条件时，将收敛之后的所述多分支卷积神经网络模型记录为训练完成的所述第一样本检测模型。

可理解地，所述收敛条件可以为所述总损失值经过了10000次计算后值为很小且不会再下降的条件，即在所述总损失值经过10000次计算后值为很小且不会再下降时，停止训练，并将收敛之后的所述多分支卷积神经网络模型记录为训练完成的所述第一样本检测模型；所述收敛条件也可以为所述总损失值小于设定阈值的条件，即在所述总损失值小于设定阈值时，停止训练，并将收敛之后的所述多分支卷积神经网络模型记录为训练完成的所述第一样本检测模型，可将训练完成的所述第一样本检测模型存储在区块链中。如此，在所述总损失值未达到预设的收敛条件时，不断更新迭代所述多分支卷积神经网络模型的初始参数，并触发所述通过所述多分支卷积神经网络模型对所述训练样本进行样本特征提取，得到图像特征空间结果的步骤，可以不断向准确的结果靠拢，让识别的准确率越来越高。

需要强调的是，为进一步保证上述第一样本检测模型的私密和安全性，上述第一样本检测模型还可以存储于区块链的节点中。

其中，本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。区块链提供的去中心化的完全分布式DNS服务通过网络中各个节点之间的点对点数据传输服务就能实现域名的查询和解析，可用于确保某个重要的基础设施的操作***和固件没有被篡改，可以监控软件的状态和完整性，发现不良的篡改，并确保所传输的数据没用经过篡改，将所述第一样本检测模型存储在区块链中，能够确保第一样本检测模型的私密和安全性。

在一实施例中，所述步骤S207之后，即所述根据所述第一损失值和所述第二损失值，得到总损失值之后，还包括：

S209，在所述总损失值达到所述收敛条件时，将收敛之后的所述多分支卷积神经网络模型记录为训练完成的所述第一样本检测模型。

可理解地，在第一次出现总损失值时，若所述总损失值达到所述收敛条件，说明所述总损失值已经达到最优的结果，此时所述多分支卷积神经网络模型已经收敛，将收敛之后的所述多分支卷积神经网络模型记录为训练完成的所述第一样本检测模型。

S30，在所述第一样本检测结果与所有第一样本类别均不匹配时，则将所述样本特征空间结果和所述样本语义空间结果输入至第二样本检测模型中。

可理解地，如果所述第一样本检测结果与所有所述第一样本类别中的任何一种类别都不匹配，则将所述待识别样本记录为所述异常样本，所述异常样本表明了与所有第一样本类别以外的结果都为异常，将所述样本特征空间结果和所述样本语义空间结果输入至所述第二样本检测模型中，所述第二样本检测模型为根据所述最终映射函数和K-近邻算法，对已知的第二样本类别在其对应的所述样本特征中的各特征中所体现的特征进行人工标记而学习的自适应模型，即建立所述样本特征中的各特征的聚类范围和语义特征向量的范围与已知的第二样本类别的映射关系，所述第二样本类别为难以收集的(少量的)且已知描述(已经知道的与样本特征相关的描述，也为全文中的第二样本描述)的样本类别和新发现的且已知描述的样本类别，比如在车辆定损识别上，基于对“缺失”特征认知(具有“撕裂”和“凹陷”的共性特征)，将邻近“撕裂”和“凹陷”的聚类簇的中心的预设区域范围内，或/和将在变形相关的语义特征对应的向量值，在色差相关的语义特征对应的向量值和在光滑面相关的语义特征对应的向量值进行加权相加后获得的值落在“撕裂”和“凹陷”的近邻范围值内，映射为“缺失”的第二样本类别，所述第二样本检测模型根据人工标记各第二样本类别与第一样本类别之间的共性特征自动调整映射关系中的映射函数，最终达到拟合程度最高的参数。

S40，通过所述第二样本检测模型对所述样本特征空间结果进行聚类处理，得到第一异常结果，同时对所述样本语义空间结果进行相似度匹配，得到第二异常结果。

可理解地，所述聚类处理的方式为通过K-means聚类算法对所述样本特征空间结果进行计算，计算出所述样本特征空间结果距离与各第一样本类别对应的簇类的中心(质心)的欧式距离值，通过所述第二样本检测模型计算出各欧式距离值后，根据各欧式距离值落在的区域范围内确定出与该区域范围对应的第二样本类别，将其确定为聚类异常类别，并将各欧式距离值转换成与各所述第二样本类别的概率值，将所述聚类异常类别和与各所述第二样本类别的概率值记录为所述第一异常结果，所述第一异常结果表明了通过样本特征空间的维度识别出的结果，同时通过所述第二样本检测模型计算出所述样本语义空间结果与所述各第一样本类别对应的语义特征向量之间的相似度值，得到正相似度值，计算正相似度值的算法可以根据需求设定，比如余弦相似度算法、Jaccard相似度算法等等，根据各所述正相似度值确定出邻近的第一样本类别，再根据其邻近的第一样本类别映射出语义相似类别，将映射出的所述语义相似类别和各正相似度值记录为所述第二异常结果，所述第二异常结果表明了通过语义空间结果的维度识别出的结果。

在一实施例中，如图7所示，所述步骤S40中，即所述对所述样本语义空间结果进行相似度匹配，得到第二异常结果，包括：

S401，通过所述第二样本检测模型中的Word2vec模型，计算所述样本语义空间结果与预设的各第二样本类别对应的第二样本描述之间的相似度值。

可理解地，所述第二样本检测模型还可以通过所述Word2vec模型将预设的各第二样本类别对应的第二样本描述进行词向量转换，得到与各所述第二样本类别对应的语义词向量，所述第二样本类别为难以收集的(少量的)且已知描述(已经知道的与样本特征相关的描述，也为全文中的第二样本描述) 的样本类别和新发现的且已知描述的样本类别，再通过所述Word2vec模型中的Word2vec算法计算出所述样本语义空间结果与各所述语义词向量之间的相似度值。

其中，所述Word2vec模型为基于Word2vec算法构建的神经网络模型，在所述Word2vec模型中预先设置了各第二样本类别对应的与样本特征中的各特征相关的第二样本描述。

S402，通过所述第二样本检测模型获取与所有所述相似度值中最大的所述相似度值对应的所述第二样本类别，将获取的所述第二样本类别确定为所述第二异常结果。

可理解地，从所有所述样本语义空间结果与各所述语义词向量之间的相似度值中获取最大的所述相似度值，并将其对应的所述异常类型确定为所述第二异常结果，所述第二异常结果中包括获取的最大的所述相似度值。

如此，本发明实现了通过所述第二样本检测模型中的Word2vec模型，计算所述样本语义空间结果与预设的各第二样本类别对应的第二样本描述之间的相似度值；再通过获取与所有所述相似度值中最大的所述相似度值对应的所述第二样本类别，将获取的所述第二样本类别确定为所述第二异常结果，因此，实现了基于Word2vec算法自动识别出第二异常结果，提供了一种语义识别的方法，让识别更加准确。

S50，根据所述第一异常结果和所述第二异常结果，确定所述待识别样本的样本类别并输出。

可理解地，通过将所述第一异常结果中的各概率值和所述第二异常结果中的各概率值进行加权处理，根据设定的权重参数进行计算得出最终的第二样本类别，通过权重参数拉开各第二样本类别对应的概率值的差距，让分类更加准确，比如经过权重参数进行加权后的“缺失”的第二样本类别在第一异常结果和第二异常结果中的概率值之和最大，则将“缺失”的第二样本类别确定为所述待识别样本的样本类别。

其中，所述样本类别包括所述第一样本类别和所述第二样本类别，在一应用场景中，从一批样本中，可以从该批样本中识别出第一样本类别的样本，也可以基于零个第二样本类别的训练样本基础上识别出第二样本类别的样本，例如：在收集的车损照片样本集中，可以识别出划痕、刮擦、撕裂、凹陷的第一样本类别的车损照片，以及可以识别出褶皱、死折、缺失等第二样本类别的车损照片(在此之前未收集到褶皱、死折、缺失等第二样本类别的照片)。

本发明实现了通过获取待识别样本；将所述待识别样本输入第一样本检测模型进行样本特征提取及语义特征识别，得到待处理样本识别结果；所述待处理样本识别结果包括第一样本检测结果、样本特征空间结果和样本语义空间结果；在所述第一样本检测结果与所有第一样本类别均不匹配时，则将所述样本特征空间结果和所述样本语义空间结果输入至第二样本检测模型中；通过所述第二样本检测模型对所述样本特征空间结果进行聚类处理，得到第一异常结果，同时对所述样本语义空间结果进行相似度匹配，得到第二异常结果；根据所述第一异常结果和所述第二异常结果，确定所述待识别样本的样本类别并输出，如此，实现了首先通过端到端的第一样本检测模型对待识别样本进行识别，在第一样本检测模型输出的第一样本检测结果与第一样本类别不匹配时，根据样本特征空间结果与样本语义空间结果之间的关联关系，通过基于零样本学习的第二样本检测模型，识别出待识别样本的样本类别，从而能够自动对难以收集或者新的样本类别的样本进行准确的样本类别识别，减少了人工识别的成本，自动给难以收集或者新的样本类别的样本标注样本类别，节省了人工成本，并且提高了识别准确率。

在一实施例中，提供一种样本类别识别装置，该样本类别识别装置与上述实施例中样本类别识别方法一一对应。如图8所示，该样本类别识别装置包括获取模块11、识别模块12、匹配模块13、异常模块14和输出模块15。

各功能模块详细说明如下：

获取模块11，用于获取待识别样本；

识别模块12，用于将所述待识别样本输入第一样本检测模型进行样本特征提取及语义特征识别，得到待处理样本识别结果；所述待处理样本识别结果包括第一样本检测结果、样本特征空间结果和样本语义空间结果；

匹配模块13，用于在所述第一样本检测结果与所有第一样本类别均不匹配时，则将所述样本特征空间结果和所述样本语义空间结果输入至第二样本检测模型中；

异常模块14，用于通过所述第二样本检测模型对所述样本特征空间结果进行聚类处理，得到第一异常结果，同时对所述样本语义空间结果进行相似度匹配，得到第二异常结果；

输出模块15，用于根据所述第一异常结果和所述第二异常结果，确定所述待识别样本的样本类别并输出。

关于样本类别识别装置的具体限定可以参见上文中对于样本类别识别方法的限定，在此不再赘述。上述样本类别识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图9所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种样本类别识别方法。

在一个实施例中，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时实现上述实施例中样本类别识别方法。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现上述实施例中样本类别识别方法。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本发明所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM) 或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM (DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM (SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。

以上所述实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围，均应包含在本发明的保护范围之内。

Claims

1.一种样本类别识别方法，其特征在于，包括：

获取待识别样本；

2.如权利要求1所述的样本类别识别方法，其特征在于，所述将所述待识别样本输入第一样本检测模型进行样本特征提取及语义特征识别，得到待处理样本识别结果之后，还包括：

在所述第一样本检测结果与任一所述第一样本类别匹配时，将匹配的所述第一样本类别确定为所述待识别样本的样本类别。

3.如权利要求1所述的样本类别识别方法，其特征在于，所述将所述待识别样本输入第一样本检测模型进行样本特征提取及语义特征识别之前，包括：

获取训练样本集；所述训练样本集包含多个训练样本，一个所述训练样本与一个第一样本类别以及一个第一样本描述关联；

将所述训练样本输入含有初始参数的多分支卷积神经网络模型；

通过所述多分支卷积神经网络模型对所述训练样本进行样本特征提取，得到图像特征空间结果；

通过所述多分支卷积神经网络模型中的嵌入空间模型对所述图像特征空间结果进行语义特征识别，得到语义特征空间结果；所述嵌入空间模型为通过构建图像特征向量与语义特征向量之间的关联关系获得；

通过K-means聚类算法，对所述图像特征空间结果进行识别，得到训练类别结果，并将所述训练类别结果、所述图像特征空间结果和所述语义特征空间结果确定为样本训练结果；

根据所述图像特征空间结果和与所述训练样本对应的所述第一样本类别，得到第一损失值；根据所述语义特征空间结果和与所述训练样本对应的所述第一样本描述，得到第二损失值；

根据所述第一损失值和所述第二损失值，得到总损失值；

在所述总损失值未达到预设的收敛条件时，迭代更新所述多分支卷积神经网络模型的初始参数，并触发所述通过所述多分支卷积神经网络模型对所述训练样本进行样本特征提取，得到图像特征空间结果的步骤，直至所述总损失值达到所述预设的收敛条件时，将收敛之后的所述多分支卷积神经网络模型记录为训练完成的所述第一样本检测模型。

4.如权利要求3所述的样本类别识别方法，其特征在于，所述将所述训练样本输入含有初始参数的多分支卷积神经网络模型之前，包括：

通过迁移学习，获取训练完成的无监督域训练模型的所有迁移参数，将所有所述迁移参数确定为所述多分支卷积神经网络模型中的所述初始参数。

5.如权利要求3所述的样本类别识别方法，其特征在于，所述根据所述图像特征空间结果和与所述训练样本对应的所述第一样本类别，得到第一损失值，包括：

通过所述多分支卷积神经网络模型将与所述训练样本对应的所述第一样本类别进行向量转换，得到与所述第一样本类别对应的中心向量；所述中心向量包括欧式域中心向量和角度域中心向量；

通过交叉熵损失算法，根据所述图像特征空间结果和所述欧式域中心向量，得到欧式损失值；

通过ArcFace损失算法，根据所述图像特征空间结果和所述角度域中心向量，得到角度损失值；

对所述欧式损失值和所述角度损失值进行加权处理，得到所述第一损失值。

6.如权利要求5所述的样本类别识别方法，其特征在于，所述通过ArcFace损失算法，根据所述图像特征空间结果和所述角度域中心向量，得到角度损失值，包括：

通过所述多分支卷积神经网络模型中的正则化模型，对所述图像特征空间结果进行正则化处理，得到正则化特征向量；

将所述正则化特征向量与所述角度域中心向量输入角度域损失模型，通过所述角度域损失模型中的所述ArcFace损失算法，得到角度损失值。

7.如权利要求1所述的样本类别识别方法，其特征在于，所述对所述样本语义空间结果进行相似度匹配，得到第二异常结果，包括：

通过所述第二样本检测模型中的Word2vec模型，计算所述样本语义空间结果与预设的各第二样本类别对应的第二样本描述之间的相似度值；

通过所述第二样本检测模型获取与所有所述相似度值中最大的所述相似度值对应的所述第二样本类别，将获取的所述第二样本类别确定为所述第二异常结果。

8.一种样本类别识别装置，其特征在于，包括：

获取模块，用于获取待识别样本；

9.一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述样本类别识别方法。

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述样本类别识别方法。