CN115795335B

CN115795335B - 物流网点异常识别方法、装置及电子设备

Info

Publication number: CN115795335B
Application number: CN202310053367.9A
Authority: CN
Inventors: 许良锋; 李惟聪; 陈曦; 王辉; 闻克宇; 朱家成; 师雪娇; 杨阳; 王必红; 胡梦阳; 马全峰
Original assignee: State Post Bureau Postal Industry Security Center
Current assignee: State Post Bureau Postal Industry Security Center
Priority date: 2023-02-02
Filing date: 2023-02-02
Publication date: 2023-07-25
Anticipated expiration: 2043-02-02
Also published as: CN115795335A

Abstract

本公开实施例公开了一种物流网点异常识别方法、装置及电子设备。该物流网点异常识别方法包括：对历史物流数据进行K‑means聚类，获取第一最优k值以及第一聚类结果；获取待分析物流数据，所述待分析物流数据包括所述历史物流数据以及新增物流数据；对所述待分析物流数据进行K‑means聚类，获取第二最优k值以及第二聚类结果；将所述第二最优k值与所述第一最优k值进行比对；根据比对结果、所述第一聚类结果和所述第二聚类结果识别异常物流网点。该方法能够有效识别出异常物流网点。

Description

物流网点异常识别方法、装置及电子设备

技术领域

本公开涉及数据处理技术领域，尤其涉及一种物流网点异常识别方法、装置及电子设备。

背景技术

近年来，我国物流行业飞速发展，快递在人们生活中已变成不可或缺的一部分，逐渐往“快递生活化、生活快递化”的趋势发展。

快递作为物品流通的一种方式，物流网点的稳定，则是在快递正常流转中起着举足轻重的作用，从快递下单后的及时揽收到快递流转接力中最后一棒的及时有效投递，均与物流网点息息相关。

发明人发现，现有技术中，缺乏对物流网点进行监控的智能方法，无法及时识别出现异常的物流网点，进而导致快递送达时间的延长甚至造成快递的丢失。

发明内容

有鉴于此，本公开实施例提供了一种物流网点异常识别方法、装置及电子设备，能够有效识别出异常物流网点。

第一方面，本公开实施例提供了一种物流网点异常识别方法，采用如下技术方案：

所述物流网点异常识别方法包括：

对历史物流数据进行K-means聚类，获取第一最优k值以及第一聚类结果，所述历史物流数据包括特定时间前一定时间段内从目标转运中心分拨至各物流网点的所有物流数据；

获取待分析物流数据，所述待分析物流数据包括所述历史物流数据以及新增物流数据，所述新增物流数据包括特定时间后从目标转运中心分拨至各物流网点的所有物流数据；

对所述待分析物流数据进行K-means聚类，获取第二最优k值以及第二聚类结果；

将所述第二最优k值与所述第一最优k值进行比对；

根据比对结果、所述第一聚类结果和所述第二聚类结果识别异常物流网点。

可选地，所述对历史物流数据进行K-means聚类包括：基于至少一种时间相关信息，对所述历史物流数据进行K-means聚类；

所述对所述待分析物流数据进行K-means聚类包括：基于至少一种时间相关信息，对所述待分析物流数据进行K-means聚类。

可选地，获取第一最优k值包括：通过损失函数确定所述第一最优k值；或者，遍历所有k值，选择所有聚类节点到对应的聚类中心之间的欧氏距离之和最小的k值作为所述第一最优k值；或者，遍历所有k值，选择所有聚类节点到对应的聚类中心之间的欧氏距离的均方差最小的k值作为所述第一最优k值；或者，遍历所有k值，选择聚类结果的各簇中聚类节点隶属于同一物流网点的比例最高的k值作为所述第一最优k值。

可选地，所述物流数据包括实际用时信息和延时许可信息；以实际用时信息进行聚类时，所述物流网点异常识别方法还包括：在对所述历史物流数据进行K-means聚类之前，去除所述历史物流数据中的实际用时时长低于延时许可时长的物流数据；在对所述待分析物流数据进行K-means聚类之前，去除所述待分析物流数据中的实际用时时长低于延时许可时长的物流数据。

可选地，所述根据比对结果、所述第一聚类结果和所述第二聚类结果识别异常物流网点包括：

在所述第二最优k值和所述第一最优k值相等时，计算所述第一聚类结果的第一特征向量与所述第二聚类结果的第二特征向量之间的余弦相似度；

若所述余弦相似度大于或等于第一阈值，则无异常物流网点；

若所述余弦相似度小于所述第一阈值，则将所述第一特征向量分解为多个第一子特征向量，将所述第二特征向量分解为多个第二子特征向量；

计算各第一子特征向量与对应的各第二子特征向量之间的余弦相似度，余弦相似度小于第二阈值的所述第二子特征向量对应的所有聚类节点为异常物流数据，所述异常物流数据对应的物流网点为异常物流网点。

可选地，所述第一特征向量基于所述第一聚类结果中各簇拥有节点数量的比例生成，所述第二特征向量基于所述第二聚类结果中各簇拥有节点数量的比例生成。

可选地，所述根据比对结果、所述第一聚类结果和所述第二聚类结果识别异常物流网点还包括：

在所述第二最优k值大于所述第一最优k值时，确定新增聚类中心；

将以各所述新增聚类中心所在的簇中的所有聚类节点判定为异常物流数据，所述异常物流数据对应的物流网点为异常物流网点。

可选地，所述确定新增聚类中心包括：在所述第二聚类结果中的所有聚类中心中，选择与所述第一聚类结果中的k个聚类中心之间的欧氏距离平均值最大的n个聚类中心作为新增聚类中心，n为所述第二最优k值与所述第一最优k值之间的差值。

第二方面，本公开实施例还提供了一种物流网点异常识别装置，采用如下技术方案：

所述物流网点异常识别装置包括：

第一聚类模块，用于对历史物流数据进行K-means聚类，获取第一最优k值以及第一聚类结果，所述历史物流数据包括特定时间前一定时间段内从目标转运中心分拨至各物流网点的所有物流数据；

数据获取模块，用于获取待分析物流数据，所述待分析物流数据包括所述历史物流数据以及新增物流数据，所述新增物流数据包括特定时间后从目标转运中心分拨至各物流网点的所有物流数据；

第二聚类模块，用于对所述待分析物流数据进行K-means聚类，获取第二最优k值以及第二聚类结果；

比对模块，用于将所述第二最优k值与所述第一最优k值进行比对；

异常识别模块，用于根据比对结果、所述第一聚类结果和所述第二聚类结果识别异常物流网点。

第三方面，本公开实施例还提供了一种电子设备，采用如下技术方案：

所述电子设备包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行以上任一所述的物流网点异常识别方法。

第四方面，本公开实施例还提供了一种计算机可读存储介质，该计算机可读存储介质存储计算机指令，该计算机指令用于使计算机执行以上任一所述的物流网点异常识别方法。

本公开实施例提供了物流网点异常识别方法、装置及电子设备，其中，在该物流网点异常识别方法中，首先，通过对历史物流数据进行K-means聚类，获取第一最优k值以及第一聚类结果，然后，获取待分析物流数据，对待分析物流数据进行K-means聚类，获取第二最优k值以及第二聚类结果，然后，将第二最优k值与第一最优k值进行比对，最后，根据比对结果、第一聚类结果和第二聚类结果识别异常物流网点。因此，通过本公开实施例中的物流网点异常识别方法能够有效识别出异常物流网点。

上述说明仅是本公开技术方案的概述，为了能更清楚了解本公开的技术手段，而可依照说明书的内容予以实施，并且为让本公开的上述和其他目的、特征和优点能够更明显易懂，以下特举较佳实施例，并配合附图，详细说明如下。

附图说明

为了更清楚地说明本公开实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1为本公开实施例提供的物流网点异常识别方法的流程图；

图2为本公开实施例提供的步骤S5的具体流程图；

图3为本公开实施例提供的物流网点异常识别装置的原理框图；

图4为本公开实施例提供的一种电子设备的原理框图。

具体实施方式

下面结合附图对本公开实施例进行详细描述。

应当明确，以下通过特定的具体实例说明本公开的实施方式，本领域技术人员可由本说明书所揭露的内容轻易地了解本公开的其他优点与功效。显然，所描述的实施例仅仅是本公开一部分实施例，而不是全部的实施例。本公开还可以通过另外不同的具体实施方式加以实施或应用，本说明书中的各项细节也可以基于不同观点与应用，在没有背离本公开的精神下进行各种修饰或改变。需说明的是，在不冲突的情况下，以下实施例及实施例中的特征可以相互组合。基于本公开中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本公开保护的范围。

需要说明的是，下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见，本文中所描述的方面可体现于广泛多种形式中，且本文中所描述的任何特定结构及/或功能仅为说明性的。基于本公开，所属领域的技术人员应了解，本文中所描述的一个方面可与任何其它方面独立地实施，且可以各种方式组合这些方面中的两者或两者以上。举例来说，可使用本文中所阐述的任何数目各方面来实施设备及/或实践方法。另外，可使用除了本文中所阐述的方面中的一或多者之外的其它结构及/或功能性实施此设备及/或实践此方法。

还需要说明的是，以下实施例中所提供的图示仅以示意方式说明本公开的基本构想，图式中仅显示与本公开中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制，其实际实施时各组件的型态、数量及比例可为一种随意的改变，且其组件布局型态也可能更为复杂。

另外，在以下描述中，提供具体细节是为了便于透彻理解实例。然而，所属领域的技术人员将理解，可在没有这些特定细节的情况下实践所述方面。

本公开实施例提供了一种物流网点异常识别方法，具体地，如图1所示，该物流网点异常识别方法包括：

步骤S1、对历史物流数据进行K-means聚类，获取第一最优k值以及第一聚类结果。

其中，历史物流数据包括特定时间前一定时间段内从目标转运中心分拨至各物流网点的所有物流数据，此部分物流数据都是正常物流网点的物流数据，不涉及异常物流网点的物流数据。例如，历史物流数据包括2022年10月31日前一个月内从转运中心A分拨至物流网点B1~Bn的所有物流数据。针对每条物流数据，可包括快递单号、出发时间、实际用时、物流网点、物流网点负责人、延时许可等信息中的多种。其中，延时许可信息可以根据寄件人要求、收件人要求、寄递物品要求等中的一种或几种进行确定。历史物流数据可以数据表格的方式呈现，可参考表一。

在对历史物流数据进行K-means聚类时，可基于实际快递运输过程中产生的一类或多类信息（如除快递单号、物流网点、物流网点负责人之外的其他信息）为基础进行K-means聚类，在聚类过程中将各物流数据的相关信息组成向量，以向量的终点作为聚类节点进行聚类。

考虑到在快递的寄递过程中，快递的时效性尤为关键，它是物品是否能精准到达的关键，基于此，本公开实施例中选择，基于至少一种时间相关信息，对历史物流数据进行K-means聚类，以使能够通过时间的维度识别异常物流网点。以上时间相关信息可以为实际用时信息，或，出发时间信息和实际用时信息，或，实际用时信息和延时许可信息，或，出发时间信息、实际用时信息和延时许可信息。

可选地，在物流数据包括实际用时信息和延时许可信息，以实际用时信息进行聚类时，物流网点异常识别方法还包括：在对历史物流数据进行K-means聚类之前，去除历史物流数据中的实际用时时长低于延时许可时长的物流数据，这些物流数据中的实际用时时长数值虽然较大，但仍为正常物流数据，去除这些数据有助于提高识别效率。

本公开实施例中，可以通过如下多种方式获取第一最优k值：

第一种，通过损失函数确定第一最优k值；第二种，遍历所有k值，选择所有聚类节点到对应的聚类中心之间的欧氏距离之和最小的k值作为第一最优k值；第三种，遍历所有k值，选择所有聚类节点到对应的聚类中心之间的欧氏距离的均方差最小的k值作为第一最优k值；第四种，遍历所有k值，选择聚类结果的各簇中聚类节点隶属于同一物流网点的比例最高的k值作为第一最优k值。

示例性地，第四种，遍历所有k值，选择聚类结果的各簇中聚类节点隶属于同一物流网点的比例最高的k值作为第一最优k值具体可以通过如下方式进行：例如，k为4时，聚类结果包括4个簇，分别为60%、70%、80%和90%，其中最高比例为90%，k为5时，聚类结果包括5个簇，5个簇中聚类节点隶属于同一物流网点的比例分别为55%、70%、60%、65%和80%，其中最高比例为80%，则k为4相较于k为5更优，以此类推，最终确定第一最优k值。以上数值仅为举例，并非限定。其中，一个簇中聚类节点隶属于同一物流网点的比例可以通过如下方式确定：若一个簇中所有聚类节点都隶属于同一物流网点，则该比例就是100%，若一个簇中所有聚类节点隶属于至少两个物流网点，则计算隶属于各物流网点的比例，选择最高值作为所需要的比例。当然，也可以先计算各比例的平均值（例如，k为4时，平均值为75%，k为5时，平均值为66%），然后进行比较的方式，确定聚类结果的各簇中聚类节点隶属于同一物流网点的比例最高的k值。

第一最优k值对应的聚类结果就是第一聚类结果。

步骤S2、获取待分析物流数据。

待分析物流数据包括历史物流数据以及新增物流数据，新增物流数据包括特定时间后从目标转运中心分拨至各物流网点的所有物流数据。例如，新增物流数据包括2022年10月31日以来15天内从转运中心A分拨至物流网点B1~Bn的所有物流数据。针对每条物流数据，可包括快递单号、出发时间、实际用时、物流网点、物流网点负责人、延时许可等信息中的多种。需要说明的是，新增物流数据包括的信息的种类应至少和历史物流数据包括的信息的种类相等。待分析物流数据也可以数据表格的方式呈现，具体可参考表一。

步骤S3、对待分析物流数据进行K-means聚类，获取第二最优k值以及第二聚类结果。

本公开实施例中选择，基于至少一种时间相关信息，对待分析物流数据进行K-means聚类，以使能够通过时间的维度识别异常物流网点。

可选地，物流数据包括实际用时信息和延时许可信息；在使用实际用时信息进行聚类时，物流网点异常识别方法还包括：在对待分析物流数据进行K-means聚类之前，去除待分析物流数据中的实际用时时长低于延时许可时长的物流数据。

对待分析物流数据进行K-means聚类，获取第二最优k值以及第二聚类结果的具体方式可参见步骤S1中对历史物流数据进行K-means聚类，获取第一最优k值以及第一聚类结果的具体方式，此处不再进行赘述。

步骤S4、将第二最优k值与第一最优k值进行比对。

将第二最优k值与第一最优k值进行比对的方式为，直接比对二者是否相等，比对结果可以为两种：第二最优k值和第一最优k值相等

步骤S5、根据比对结果、第一聚类结果和第二聚类结果识别异常物流网点。

可选地，如图2所示，本公开实施例中，根据比对结果、第一聚类结果和第二聚类结果识别异常物流网点包括：

子步骤S51、判断第二最优k值和第一最优k值是否相等。

判断结果可以为第二最优k值和第一最优k值相等，或者，第二最优k值大于第一最优k值。由于第二聚类结果中的聚类节点的数量大于第一聚类结果中聚类节点的数量，所以不存在第二最优k值小于第一最优k值的情况。

子步骤S52、在第二最优k值和第一最优k值相等时，计算第一聚类结果的第一特征向量与第二聚类结果的第二特征向量之间的余弦相似度。

其中，第一特征向量和第二特征向量只要是能表达出第一聚类结果和第二聚类结果的特性即可。示例性地，本公开实施例中第一特征向量基于第一聚类结果中各簇拥有节点数量的比例生成，例如，第一聚类结果中包括4个簇，各簇中拥有节点数量的比例为10:12:14:15，进而基于此比例生成第一特征向量，第二特征向量基于第二聚类结果中各簇拥有节点数量的比例生成。或者，第一特征向量基于第一聚类结果中各簇中聚类节点隶属于同一物流网点的比例生成，第二特征向量基于第二聚类结果中各簇中聚类节点隶属于同一物流网点的比例生成。该比例的计算方式如之前所述，此处不再进行赘述。

子步骤S53、根据余弦相似度来确定是否有异常物流网点。

具体地，根据余弦相似度来确定是否有异常物流网点包括：

若余弦相似度大于或等于第一阈值，则无异常物流网点，即各聚类节点对应的各条物流数据包括的物流网点均无异常。

若余弦相似度小于第一阈值，则将第一特征向量分解为多个第一子特征向量，将第二特征向量分解为多个第二子特征向量；

计算各第一子特征向量与对应的各第二子特征向量之间的余弦相似度，余弦相似度小于第二阈值的第二子特征向量对应的所有聚类节点为异常物流数据，异常物流数据对应的物流网点为异常物流网点。

以上第一阈值和第二阈值可以根据实际需要进行确定。第一特征向量的分解方式以及第二特征向量的分解方式相同，具体可以根据实际需要进行确定。多个指的是2个、3个、4个等。示例性地，以上第一特征向量可根据聚类节点数量等进行分解，例如，第一聚类结果中包括10个聚类节点，将第一特征向量拆解为2个第一特征子向量，每个第一特征子向量对应2个聚类节点。

可选地，根据比对结果、第一聚类结果和第二聚类结果识别异常物流网点还包括：

子步骤S54、在第二最优k值大于第一最优k值时，确定新增聚类中心；

子步骤S55、将以各新增聚类中心所在的簇中的所有聚类节点判定为异常物流数据，异常物流数据对应的物流网点为异常物流网点。

可选地，确定新增聚类中心包括：在第二聚类结果中的所有聚类中心中，选择与第一聚类结果中的k个聚类中心之间的欧氏距离平均值最大的n个聚类中心作为新增聚类中心，n为第二最优k值与第一最优k值之间的差值。其中，第二聚类结果中的一个聚类中心，与第一聚类结果中的k个聚类中心之间的欧氏距离平均值的计算方式如下：分别计算该聚类中心与第一聚类结果中的第1~k个聚类中心之间的欧式距离，然后计算所有欧式距离的平均值。如果第二聚类结果中的某一个簇是原有的（即存在于第一聚类结果中），则这个簇的聚类中心与第一聚类结果中的各聚类中心之间的欧氏距离则较小，而如果第二聚类结果中的某一个簇是新增的，则这个簇的聚类中心与第一聚类结果中的各聚类中心之间的欧氏距离则会较大，通过以上方式可以确定出新增聚类中心。

可选地，本公开实施例中的物流网点异常识别方法还包括：统计各异常物流网点对应的异常物流数据的数量，在以上数量超出对应的阈值时，提醒相关异常物流网点的负责人及相关异常物流网点的上级主管单位或监管部门。

在该物流网点异常识别方法中，首先，通过对历史物流数据进行K-means聚类，获取第一最优k值以及第一聚类结果，然后，获取待分析物流数据，对待分析物流数据进行K-means聚类，获取第二最优k值以及第二聚类结果，然后，将第二最优k值与第一最优k值进行比对，最后，根据比对结果、第一聚类结果和第二聚类结果识别异常物流网点。因此，通过本公开实施例中的物流网点异常识别方法能够有效识别出异常物流网点。

此外，本公开实施例还提供了一种物流网点异常识别装置，具体地，如图3所示，物流网点异常识别装置包括：

第一聚类模块100，用于对历史物流数据进行K-means聚类，获取第一最优k值以及第一聚类结果，历史物流数据包括特定时间前一定时间段内从目标转运中心分拨至各物流网点的所有物流数据；

数据获取模块200，用于获取待分析物流数据，待分析物流数据包括历史物流数据以及新增物流数据，新增物流数据包括特定时间后从目标转运中心分拨至各物流网点的所有物流数据；

第二聚类模块300，用于对待分析物流数据进行K-means聚类，获取第二最优k值以及第二聚类结果；

比对模块400，用于将第二最优k值与第一最优k值进行比对；

异常识别模块500，用于根据比对结果、第一聚类结果和第二聚类结果识别异常物流网点。

可选地，在物流数据包括实际用时信息和延时许可信息，以实际用时信息进行聚类时，物流网点异常识别装置还包括：预处理模块，用于在对历史物流数据进行K-means聚类之前，去除历史物流数据中的实际用时时长低于延时许可时长的物流数据；在对待分析物流数据进行K-means聚类之前，去除待分析物流数据中的实际用时时长低于延时许可时长的物流数据。

需要说明的是，物流网点异常识别方法中各步骤的相关细节均适用于物流网点异常识别装置中对应的模块，此处不再进行赘述。

此外，本公开实施例还提供了一种电子设备，采用如下技术方案：

电子设备包括：

至少一个处理器；以及，

与至少一个处理器通信连接的存储器；其中，

存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器能够执行以上任一的物流网点异常识别方法。

此外，本公开实施例还提供了一种计算机可读存储介质，该计算机可读存储介质存储计算机指令，该计算机指令用于使计算机执行以上任一的物流网点异常识别方法。

根据本公开实施例的电子设备包括存储器和处理器。该存储器用于存储非暂时性计算机可读指令。具体地，存储器可以包括一个或多个计算机程序产品，该计算机程序产品可以包括各种形式的计算机可读存储介质，例如易失性存储器和/或非易失性存储器。该易失性存储器例如可以包括随机存取存储器（RAM）和/或高速缓冲存储器（cache）等。该非易失性存储器例如可以包括只读存储器（ROM）、硬盘、闪存等。

该处理器可以是中央处理单元（CPU）或者具有数据处理能力和/或指令执行能力的其它形式的处理单元，并且可以控制电子设备中的其它组件以执行期望的功能。在本公开的一个实施例中，该处理器用于运行该存储器中存储的该计算机可读指令，使得该电子设备执行前述的本公开各实施例的物流网点异常识别方法全部或部分步骤。

本领域技术人员应能理解，为了解决如何获得良好用户体验效果的技术问题，本实施例中也可以包括诸如通信总线、接口等公知的结构，这些公知的结构也应包含在本公开的保护范围之内。

如图4为本公开实施例提供的一种电子设备的结构示意图。其示出了适于用来实现本公开实施例中的电子设备的结构示意图。图4示出的电子设备仅仅是一个示例，不应对本公开实施例的功能和使用范围带来任何限制。

如图4所示，电子设备可以包括处理装置（例如中央处理器、图形处理器等），其可以根据存储在只读存储器（ROM）中的程序或者从存储装置加载到随机访问存储器（RAM）中的程序而执行各种适当的动作和处理。在RAM中，还存储有电子设备操作所需的各种程序和数据。处理装置、ROM以及RAM通过总线彼此相连。输入/输出（I/O）接口也连接至总线。

通常，以下装置可以连接至I/O接口：包括例如传感器或者视觉信息采集设备等的输入装置；包括例如显示屏等的输出装置；包括例如磁带、硬盘等的存储装置；以及通信装置。通信装置可以允许电子设备与其他设备（比如边缘计算设备）进行无线或有线通信以交换数据。虽然图4示出了具有各种装置的电子设备，但是应理解的是，并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。

特别地，根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在非暂态计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信装置从网络上被下载和安装，或者从存储装置被安装，或者从ROM被安装。在该计算机程序被处理装置执行时，执行本公开实施例的物流网点异常识别方法的全部或部分步骤。

有关本实施例的详细说明可以参考前述各实施例中的相应说明，在此不再赘述。

根据本公开实施例的计算机可读存储介质，其上存储有非暂时性计算机可读指令。当该非暂时性计算机可读指令由处理器运行时，执行前述的本公开各实施例的物流网点异常识别方法的全部或部分步骤。

上述计算机可读存储介质包括但不限于：光存储介质（例如：CD－ROM和DVD）、磁光存储介质（例如：MO）、磁存储介质（例如：磁带或移动硬盘）、具有内置的可重写非易失性存储器的媒体（例如：存储卡）和具有内置ROM的媒体（例如：ROM盒）。

以上结合具体实施例描述了本公开的基本原理，但是，需要指出的是，在本公开中提及的优点、优势、效果等仅是示例而非限制，不能认为这些优点、优势、效果等是本公开的各个实施例必须具备的。另外，上述公开的具体细节仅是为了示例的作用和便于理解的作用，而非限制，上述细节并不限制本公开为必须采用上述具体的细节来实现。

在本公开中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序，本公开中涉及的器件、装置、设备、***的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的，可以按任意方式连接、布置、配置这些器件、装置、设备、***。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇，指“包括但不限于”，且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”，且可与其互换使用，除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”，且可与其互换使用。

另外，如在此使用的，在以“至少一个”开始的项的列举中使用的“或”指示分离的列举，以便例如“A、B或C的至少一个”的列举意味着A或B或C，或AB或AC或BC，或ABC（即A和B和C）。此外，措辞“示例的”不意味着描述的例子是优选的或者比其他例子更好。

还需要指出的是，在本公开的***和方法中，各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。

可以不脱离由所附权利要求定义的教导的技术而进行对在此所述的技术的各种改变、替换和更改。此外，本公开的权利要求的范围不限于以上所述的处理、机器、制造、事件的组成、手段、方法和动作的具体方面。可以利用与在此所述的相应方面进行基本相同的功能或者实现基本相同的结果的当前存在的或者稍后要开发的处理、机器、制造、事件的组成、手段、方法或动作。因而，所附权利要求包括在其范围内的这样的处理、机器、制造、事件的组成、手段、方法或动作。

提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本公开。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的，并且在此定义的一般原理可以应用于其他方面而不脱离本公开的范围。因此，本公开不意图被限制到在此示出的方面，而是按照与在此公开的原理和新颖的特征一致的最宽范围。

为了例示和描述的目的已经给出了以上描述。此外，此描述不意图将本公开的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例，但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims

1.一种物流网点异常识别方法，其特征在于，包括：

对历史物流数据进行K-means聚类，获取第一最优k值以及第一聚类结果，所述历史物流数据包括特定时间前一定时间段内从目标转运中心分拨至各物流网点的所有物流数据，所述历史物流数据都是正常物流网点的物流数据，不涉及异常物流网点的物流数据；

将所述第二最优k值与所述第一最优k值进行比对；

根据比对结果、所述第一聚类结果和所述第二聚类结果识别异常物流网点；

所述根据比对结果、所述第一聚类结果和所述第二聚类结果识别异常物流网点包括：

计算各第一子特征向量与对应的各第二子特征向量之间的余弦相似度，余弦相似度小于第二阈值的所述第二子特征向量对应的所有聚类节点为异常物流数据，所述异常物流数据对应的物流网点为异常物流网点；

2.根据权利要求1所述的物流网点异常识别方法，其特征在于，所述对历史物流数据进行K-means聚类包括：基于至少一种时间相关信息，对所述历史物流数据进行K-means聚类；

3.根据权利要求2所述的物流网点异常识别方法，其特征在于，获取第一最优k值包括：通过损失函数确定所述第一最优k值；或者，遍历所有k值，选择所有聚类节点到对应的聚类中心之间的欧氏距离之和最小的k值作为所述第一最优k值；或者，遍历所有k值，选择所有聚类节点到对应的聚类中心之间的欧氏距离的均方差最小的k值作为所述第一最优k值；或者，遍历所有k值，选择聚类结果的各簇中聚类节点隶属于同一物流网点的比例最高的k值作为所述第一最优k值。

4.根据权利要求2所述的物流网点异常识别方法，其特征在于，所述物流数据包括实际用时信息和延时许可信息；以实际用时信息进行聚类时，所述物流网点异常识别方法还包括：在对所述历史物流数据进行K-means聚类之前，去除所述历史物流数据中的实际用时时长低于延时许可时长的物流数据；在对所述待分析物流数据进行K-means聚类之前，去除所述待分析物流数据中的实际用时时长低于延时许可时长的物流数据。

5.根据权利要求1所述的物流网点异常识别方法，其特征在于，所述第一特征向量基于所述第一聚类结果中各簇拥有节点数量的比例生成，所述第二特征向量基于所述第二聚类结果中各簇拥有节点数量的比例生成。

6.根据权利要求5所述的物流网点异常识别方法，其特征在于，所述确定新增聚类中心包括：在所述第二聚类结果中的所有聚类中心中，选择与所述第一聚类结果中的k个聚类中心之间的欧氏距离平均值最大的n个聚类中心作为新增聚类中心，n为所述第二最优k值与所述第一最优k值之间的差值。

7.一种物流网点异常识别装置，其特征在于，包括：

第一聚类模块，用于对历史物流数据进行K-means聚类，获取第一最优k值以及第一聚类结果，所述历史物流数据包括特定时间前一定时间段内从目标转运中心分拨至各物流网点的所有物流数据，所述历史物流数据都是正常物流网点的物流数据，不涉及异常物流网点的物流数据；

异常识别模块，用于根据比对结果、所述第一聚类结果和所述第二聚类结果识别异常物流网点；

8.一种电子设备，其特征在于，所述电子设备包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-6任一所述的物流网点异常识别方法。