CN111612385B - 一种对待配送物品进行聚类的方法和装置 - Google Patents

一种对待配送物品进行聚类的方法和装置 Download PDF

Info

Publication number
CN111612385B
CN111612385B CN201910132026.4A CN201910132026A CN111612385B CN 111612385 B CN111612385 B CN 111612385B CN 201910132026 A CN201910132026 A CN 201910132026A CN 111612385 B CN111612385 B CN 111612385B
Authority
CN
China
Prior art keywords
association
degree
orders
order
distributed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910132026.4A
Other languages
English (en)
Other versions
CN111612385A (zh
Inventor
武玉东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingbangda Trade Co Ltd
Beijing Jingdong Zhenshi Information Technology Co Ltd
Original Assignee
Beijing Jingdong Zhenshi Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Zhenshi Information Technology Co Ltd filed Critical Beijing Jingdong Zhenshi Information Technology Co Ltd
Priority to CN201910132026.4A priority Critical patent/CN111612385B/zh
Publication of CN111612385A publication Critical patent/CN111612385A/zh
Application granted granted Critical
Publication of CN111612385B publication Critical patent/CN111612385B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/087Inventory or stock management, e.g. order filling, procurement or balancing against orders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0633Lists, e.g. purchase orders, compilation or processing
    • G06Q30/0635Processing of requisition or of purchase orders

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Finance (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Operations Research (AREA)
  • Human Resources & Organizations (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Quality & Reliability (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种对待配送物品进行聚类的方法和装置,涉及计算机技术领域。该方法的一个具体实施方式包括:获取订单的拆分信息,其中所述拆分信息包括根据所述订单拆分成的子订单和所述子订单包括的待配送物品;根据所述订单的拆分信息确定所述子订单之间的待配送物品的关联关系,计算对于所述关联关系的关联度;根据所述关联度确定需要进行聚类的待配送物品。该实施方式能够根据历史订单的拆分信息确定需要进行聚类的待配送物品,从而降低拆单率,节约订单配送成本,节约任务操作,从而提高对订单配送的时效控制,优化客户体验。

Description

一种对待配送物品进行聚类的方法和装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种对待配送物品进行聚类的方法、装置、电子设备和计算机可读介质。
背景技术
目前电商平台在仓库生产过程中重点关注的生产指标之一为拆单率。拆单率为拆分订单量与总订单量的比值,在以下场景下订单将有可能发生拆分操作:
(1)订单所包括的待配送物品仓库分布不同;
(2)订单所包括的待配送物品发货方不同(如包括第三方卖家或自营发货);
(3)客户选择了有货先发;
(4)其他拆分场景,如订单中含有不可以同时打包配送的待配送物品品类(如高价值待配送物品、大件待配送物品、食品、危险品如香水等不可以和其他待配送物品一起打包配送),以及不同物流公司对单个包裹的重量或体积都有特殊要求,超出物流公司限制的也需要拆单。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
造成订单拆分的一个主要原因是订单所包括的待配送物品仓库分布不同,导致不得不拆分为多个独立订单后再由仓库分别进配送,使得订单配送成本成倍增加,且对于订单配送信息的跟踪、采集处理等处理任务也会同时增加,不利于对订单配送时效的控制,同时也降低了客户体验。
发明内容
有鉴于此,本发明实施例提供一种对待配送物品进行聚类的方法和装置,能够根据历史订单的拆分信息确定需要进行聚类的待配送物品,从而降低拆单率,节约订单配送成本,节约任务操作,从而提高对订单配送的时效控制,优化客户体验。
为实现上述目的,根据本发明实施例的一个方面,提供了一种对待配送物品进行聚类的方法,包括:获取订单的拆分信息,其中所述拆分信息包括根据所述订单拆分成的子订单和所述子订单包括的待配送物品;根据所述订单的拆分信息确定所述子订单之间的待配送物品的关联关系,计算对于所述关联关系的关联度;根据所述关联度确定需要进行聚类的待配送物品。
可选地,所述关联度包括支持度、置信度和提升度中的一种或多种;其中,所述支持度为同时包括所述关联关系中的待配送物品的订单数量与总订单数量的比值;所述置信度为同时包括所述关联关系中的待配送物品的订单数量与至少包括所述关联关系中的一个子订单中的待配送物品的订单数量的比值;所述提升度为所述关联关系中的待配送物品的置信度与支持度的比值。
可选地,根据所述关联度确定需要进行聚类的待配送物品的方法包括:按照所述关联度由高到低对所述关联关系进行排序;选取关联度大于或等于第一阈值的关联关系中的待配送物品。
可选地,根据所述关联度确定需要进行聚类的待配送物品的方法包括:按照所述关联度由高到低对所述关联关系进行排序;计算选取排序前M个关联关系中的待配送物品进行聚类后的订单的拆单率,其中拆单率为拆分的订单数量与总订单数量的比值;确定所述拆单率是否大于第二阈值;若所述拆单率大于第二阈值,则递增M的数量,直到计算选取排序前M个关联关系中的待配送物品进行聚类后的拆单率不大于所述第二阈值,则确定所述M个关联关系中的待配送物品为需要进行聚类的待配送物品。
可选地,确定所述M个关联关系中的待配送物品为需要进行聚类的待配送物品的品类之后,所述方法还包括:根据所述待配送物品的预测销量确定需要进行聚类的所述待配送物品的数量。
为实现上述目的,根据本发明实施例的另一个方面,提供了一种对待配送物品进行聚类的装置,包括:获取模块,用于获取订单的拆分信息,其中所述拆分信息包括根据所述订单拆分成的子订单和所述子订单包括的待配送物品;计算模块,用于根据所述订单的拆分信息确定所述子订单之间的待配送物品的关联关系,计算对于所述关联关系的关联度;聚类模块,用于根据所述关联度确定需要进行聚类的待配送物品。
可选地,所述关联度包括支持度、置信度和提升度中的一种或多种;其中,所述支持度为同时包括所述关联关系中的待配送物品的订单数量与总订单数量的比值;所述置信度为同时包括所述关联关系中的待配送物品的订单数量与至少包括所述关联关系中的一个子订单中的待配送物品的订单数量的比值;所述提升度为所述关联关系中的待配送物品的置信度与支持度的比值。
可选地,所述聚类模块还用于按照所述关联度由高到低对所述关联关系进行排序;选取关联度大于或等于第一阈值的关联关系中的待配送物品。
可选地,所述聚类模块还用于按照所述关联度由高到低对所述关联关系进行排序;计算选取排序前M个关联关系中的待配送物品进行聚类后的订单的拆单率,其中拆单率为拆分的订单数量与总订单数量的比值;确定所述拆单率是否大于第二阈值;若所述拆单率大于第二阈值,则递增M的数量,直到计算选取排序前M个关联关系中的待配送物品进行聚类后的拆单率不大于所述第二阈值,则确定所述M个关联关系中的待配送物品为需要进行聚类的待配送物品。
可选地,所述聚类模块还用于根据所述待配送物品的预测销量确定需要进行聚类的所述待配送物品的数量。
为实现上述目的,根据本发明实施例的再一个方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现一种对待配送物品进行聚类的方法中任一所述的方法。
为实现上述目的,根据本发明实施例的再一个方面,提供了一种计算机可读介质,其上存储有计算机程序,所述程序被一个或多个处理器执行时实现一种对待配送物品进行聚类的方法中任一所述的方法。
上述发明中的一个实施例具有如下优点或有益效果:因为采用根据订单的拆分信息确定子订单之间的待配送物品的关联度,根据关联度确定需要进行聚类的待配送物品的技术手段,所以克服了传统方法订单的拆单率高、物流成本大技术问题,进而达到降低订单的拆单率和物流成本,提高客户体验的技术效果。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明实施例的一种将待配送物品进行聚类的方法的主要步骤的示意图;
图2是根据本发明实施例的根据所述关联度确定需要进行聚类的待配送物品的方法的主要步骤的示意图;
图3所示为根据本发明实施例的仓库间调拨的主要步骤的示意图;
图4是根据本发明实施例的一种将待配送物品进行聚类的装置的主要部分的示意图;
图5是本发明实施例可以应用于其中的示例性***架构图;
图6是适于用来实现本发明实施例的终端设备或服务器的计算机***的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是根据本发明实施例的一种将待配送物品进行聚类的方法的主要步骤的示意图,如图1所示:
步骤S101表示获取订单的拆分信息,其中所述拆分信息包括根据所述订单拆分成的子订单和所述子订单包括的待配送物品。分析待配送物品关联度的基础是拆分成的子订单中的待配送物品项,此步骤的目的是确定数据来源,缩小计算范围。
其中获取的订单可以有一定的时间范围,如获取过去近一周或近2个月的历史订单,在这些历史订单内查询被拆分的订单,获取这些被拆分的订单的拆分信息,拆分信息中除包括根据所述订单拆分成的子订单和所述子订单包括的待配送物品以外,还可包括被拆分的子订单数量、被拆分的订单的单号、子订单的单号、订单产生时间,以及订单中包括的待配送物品的编号、名称、数量和价格等信息,进一步地,还可以确定被拆分订单的拆分原因,从而挑选出如因未在同一仓库而导致订单拆分的订单。
获取的历史订单还可以根据待配送物品的品牌、发货仓库以及待配送物品分类的范围进行选取,例如根据发货仓库,提取拆单率前十的仓库订单明细数据,再分析这些仓库下的拆分订单数据;或者根据待配送物品分类,提取拆单率前十的待配送物品分类的订单数据,分析待配送物品分类下所有类别对应的拆分订单数据。
获取到的被拆分的订单数据可以保存在文本文件(如csv格式)中。例如表1所示,订单号分别为1~5的订单被拆分成若干子订单。具体地,对于订单号1,其包括待配送物品1、2、3,其中待配送物品1、3属于同一个仓库,因而被拆分至子订单1-1,待配送物品2所在的仓库与待配送物品1、3所在的仓库不同,因而被拆分至子订单1-2。
表1
进一步地,还可以使用稀疏矩阵保存订单数据,方便存储和计算。例如将表1的拆单信息转化为表2所示,每一行表示一个子订单,该行中值为0的元素表示该子订单内不包括对应该列的待配送物品,不为0的元素表示该子订单中包括对应该列的待配送物品,且该待配送物品的数量为该元素的值。具体地,为了计算存储方便,也可以省略待配送物品的数量,以1表示该子订单内包括对应的待配送物品,以0表示该子订单内不包括对应的待配送物品。
表2
在挑选出拆分订单后,计算当前的拆单率,为后续拆单率的优化提供比较依据。
步骤S102表示根据所述拆分信息确定所述子订单之间的待配送物品的关联关系,计算对于所述关联关系的关联度。关联度指示了关联关系中的待配送物品之间存在着某种关联关系,并且可以通过关联度的值衡量这种关联关系。本发明实施例以被拆分的订单中的每个子订单中的待配送物品之间的关系确定关联关系,例如,某一订单被拆分为子订单A和子订单B,其中子订单A中又包括待配送物品1和待配送物品2,子订单B中包括待配送物品3,则关联关系即为{待配送物品1,待配送物品2}与{待配送物品3}的关联,进一步地,此关联关系还带有指向性,即{待配送物品1,待配送物品2}对{待配送物品3}为一种关联关系,{待配送物品3}对{待配送物品1,待配送物品2}为另一种关联关系。在计算关联关系的关联度时,宜分别计算此两种关联关系,更进一步地,当一个订单被拆分为两个以上子订单时,关联关系也多于两个,宜计算所有的关联关系的关联度,以使得后续对关联度的选取更准确。其中所述关联度包括支持度、置信度和提升度中的一种或多种。
所述支持度为同时包括所述关联关系中的待配送物品的订单数量与总订单数量的比值;支持度(Support)的定义是设集合W中有s%的比例同时支持集合X和Y,s%称为关联关系X对Y的支持度。支持度描述了X和Y这两个集合的交集Z在集合W中出现的概率。进一步地,集合X对集合Y的支持度与集合Y对集合X的支持度相等。
例如,在历史订单中,总订单数为N;同时包括待配送物品A和待配送物品B的订单数为NAB,在这些订单中待配送物品A和待配送物品B常被拆分至两个子订单,确定为{待配送物品A}对{待配送物品B}的关联关系时,则关联关系中的待配送物品A对待配送物品B的支持度SA-B的计算公式为:
SA-B=NAB/N
所述置信度为同时包括所述关联关系中的待配送物品的订单数量与至少包括所述关联关系中的一个子订单中的待配送物品的订单数量的比值;置信度(Confidence)的定义是设集合W中支持集合X的情况下,有c%的比例同时也支持集合Y,c%称为关联关系X对Y的置信度。置信度是指在出现集合X的情况下,集合Y也同时出现的概率有多大,描述为集合X对集合Y的置信度。
例如,在历史订单中,总订单数为N;包括待配送物品A的订单数量为NA,包括待配送物品B的订单数量为NB;同时包括待配送物品A和待配送物品B的订单数为NAB(其中,NAB=NA∩NB);在这些订单中待配送物品A和待配送物品B常被拆分至两个子订单;确定为{待配送物品A}对{待配送物品B}的关联关系时,则待配送物品A对待配送物品B的支置信度CA-B的计算公式为:
CA-B=NAB/NA
确定为{待配送物品B}对{待配送物品A}的关联关系时,待配送物品B对待配送物品A的置信度为CB-A的计算公式为:
CB-A=NAB/NB
所述提升度为所述关联关系中的待配送物品的置信度与所述待配送物品的支持度的比值。提升度(Lift)用于描述在某种关联关系存在的情况下,一种事物对另一种事物的促进作用有多少,且这种促进作用是相互的,即集合X对集合Y的提升度与集合Y对集合X的提升度相等。
例如,在历史订单中,待配送物品A和待配送物品B常被拆分至两个子订单中,总订单数为N,同时包括待配送物品A和待配送物品B的订单数为NAB,包括待配送物品A的订单数量为NA,包括待配送物品A的订单数量为NB,确定为{待配送物品A}对{待配送物品B}的关联关系时,则待配送物品A对待配送物品B的提升度LA-B为的计算公式为:
LA-B=CA-B/SB=NAB/NA/(NB/N)=NAB·N/(NA·NB)
其中SB是待配送物品B的独立支持度,SB=NB/N,即包括该待配送物品的订单的数量与总订单数量的比值。
确定为{待配送物品B}对{待配送物品A}的关联关系时,待配送物品B对待配送物品A的提升度LB-A为的计算公式为:
LB-A=CB-A/SA=NAB/NB/(NA/N)=NAB·N/(NA·NB)
由此可见,LA-B=LB-A。进一步地,若在历史订单中,总订单数为N;待配送物品A和待配送物品B常被拆分至同一个子订单中,待配送物品C和待配送物品D被拆分至另一个子订单中;同时包括待配送物品A和待配送物品B的订单数为NAB,同时包括待配送物品C和待配送物品D的订单数量为NCD,同时包括待配送物品A、待配送物品B、待配送物品C和待配送物品D的订单数为NABCD(NABCD=NAB∩NCD),确定为{待配送物品A,待配送物品B}对{待配送物品C,待配送物品D}的关联关系时,则关联关系中的待配送物品A和待配送物品B对待配送物品C和待配送物品D的提升度LAB-CD为的计算公式为:
LAB-CD=CAB-CD/SCD=NABCD/NAB/(NCD/N)=NABCD·N/(NAB·NCD)
例如,根据表2中的订单拆分信息,设总订单数量为N,待配送物品待配送物品2和待配送物品3被拆分至两个子订单,则可确定关联关系为{待配送物品2}对{待配送物品3}的关联关系,同时包括待配送物品2和待配送物品3的订单数量为1,包括待配送物品2的订单数量为2,包括待配送物品3的订单数量为2,则待配送物品2对待配送物品3的支持度S1-2为1/N,待配送物品2对待配送物品3的置信度C2-3为1/2,待配送物品2对待配送物品3的提升度L2-3为N/4,即1·N/(2·2)。
以上计算步骤还可借助Apriori机器学习算法(Apriori算法是一种挖掘关联关系的频繁项集算法,其核心思想是通过候选集生成和情节的向下封闭检测两个阶段来挖掘频繁项集,该算法已经被广泛的应用到商业、网络安全等各个领域),建立关联关系的关联度计算模型,在对模型进行训练的过程中,可以对支持度、置信度和/或提升度的数值进行初始化,筛除支持度、置信度和/或提升度值较低的订单数据。
示例代码为:
grocery_rules<-apriori(data=Groceries,parameter=list(support=,confidence=,minlen=))
步骤S103表示根据所述关联度确定需要进行聚类的待配送物品。由于关联关系是根据被拆分的订单确定的,所以计算得到关联关系的关联度后,可以根据关联度的值对子订单中的待配送物品进行衡量,关联度的值越高,说明子订单之间的待配送物品存在较强的关联关系,选取关联度高的待配送物品的品类进行聚类,可以降低因待配送物品未在同一仓库而造成的拆单操作,继而降低了拆单率。进一步地,宜综合支持度、置信度和提升度三种关联度对待配送物品的关联度进行衡量。需要说明的是本发明所述的待配送物品的聚类不仅指逻辑上将待配送物品进行聚类,也指物理意义上将待配送物品进行聚类,在物流领域可称之为合仓操作。
进一步地,可按照所述关联度由高到低对所述关联关系进行排序;选取关联度大于或等于第一阈值的关联关系中的待配送物品。在计算完成关联度后,可将关联度总结至表格中,如表3所示为某次关联关系的关联度计算结果,子订单{待配送物品1,待配送物品2}对子订单{待配送物品4}的支持度为0.0069,置信度为0.40,提升度为2.8,以上数值表明在所有订单中,顾客在购买待配送物品1和待配送物品2的同时,有0.69%的概率同时购买待配送物品4;在购买了待配送物品1和待配送物品2的顾客中有40%的概率还同时购买了待配送物品4,所以待配送物品1和待配送物品2对于待配送物品4具有很大的提升作用。根据提升度的排序结果,若设定第一阈值为1,则大于第一阈值的关联关系为{待配送物品1}对{待配送物品3}和{待配送物品1,待配送物品2}对{待配送物品4},所以可确定需要将待配送物品1和待配送物品3进行聚类,将待配送物品1和待配送物品2与待配送物品4进行聚类,以减少拆单操作,降低拆单率。
表3
如图2所示,根据所述关联度确定需要进行聚类的待配送物品的方法还包括:
S201按照所述关联度由高到低对所述关联关系进行排序;其中,可分别按照置信度和提升度对关联关系进行排序。
S202计算选取排序前M个关联关系中的待配送物品进行聚类后的订单的拆单率,其中拆单率为拆分的订单数量与总订单数量的比值;其中,可分别选取置信度和提升度排名的前M个关联关系,M的初始值可为1或根据经验选取。
S203确定所述拆单率是否大于第二阈值;其中第二阈值可为预设的拆单率最大阈值。
S204若所述拆单率大于所述第二阈值,则递增M的数量,直到计算选取排序前M个关联关系中的待配送物品进行聚类后的拆单率不大于所述第二阈值,则确定所述M个关联关系中的待配送物品为需要进行聚类的待配送物品。
需要说明,步骤S201-204的目的是将确定需要聚类的待配送物品从历史订单的拆分订单数据中移除后的情况下,再对历史订单的拆单率进行试算,以达到确定需要聚类待配送物品,使拆单率进一步优化的目的。
例如,根据关联关系排序后,选取排序的前10的关联关系中的所有待配送物品进行聚类操作,即在历史订单中移除这些待配送物品的拆分订单后,再计算历史订单的拆单率,若拆单率仍大于第二阈值,则再计算选取排序前11的关联关系中的所有待配送物品进行聚类操作,并计算历史订单的拆单率,若拆单率不大于第二阈值,则确定排序前11的关联关系中的所有待配送物品为需要进行聚类的待配送物品。
进一步地,确定所述N种待配送物品为需要进行聚类的待配送物品的品类之后,所述方法还可包括:根据所述待配送物品的预测销量确定需要进行聚类的所述待配送物品的数量。在确定了需要聚类待配送物品之后,还可以对这些待配送物品的未来的销量进行预测,从而根据预测销量确定需要聚类的待配送物品的数量。
例如,确定待配送物品1和待配送物品2为需要进行聚类的待配送物品以后,可进一步根据待配送物品1和待配送物品2的历史销量预测未来一个月内待配送物品1和待配送物品2的销量,假设待配送物品1的预测销量为100,待配送物品2的预测销量为200,则可进一步确定需要将100个待配送物品1和200个待配送物品2进行聚类操作。如图3所示,步骤S301表示根据所述关联度确定需要进行聚类的待配送商品,步骤S302表示查询待配送物品在各仓库的库存数量,若不考虑发货仓库的位置,为了平衡仓库之间的库存,保证每个仓库之间的被确定需要聚类的待配送物品的数量相同,则执行步骤S303对需要进行聚类的待配送商品在仓库之间进行调拨,使每个仓库之间的被确定需要聚类的待配送物品的数量相同。
图4是根据本发明实施例的一种将待配送物品进行聚类的装置400的主要部分的示意图,如图4所示:
获取模块401,用于获取订单的拆分信息,其中所述拆分信息包括根据所述订单拆分成的子订单和所述子订单包括的待配送物品。目的是确定数据来源,缩小计算范围。
其中获取模块401获取的订单可以有一定的时间范围,如获取过去近一周或近2个月的历史订单,在这些历史订单内查询被拆分的订单,获取这些被拆分的订单的拆分信息,拆分信息中除包括根据所述订单拆分成的子订单和所述子订单包括的待配送物品以外,还可包括被拆分的子订单数量、被拆分的订单的单号、子订单的单号、订单产生时间,以及订单中包括的待配送物品的编号、名称、数量和价格等信息,进一步地,还可以确定被拆分订单的拆分原因,从而挑选出如因未在同一仓库而导致订单拆分的订单。
获取模块401获取的历史订单还可以根据待配送物品的品牌、发货仓库以及待配送物品分类的范围进行选取,例如根据发货仓库,获取模块401提取拆单率前十的仓库订单明细数据,再分析这些仓库下的拆分订单数据;或者根据待配送物品分类,提取拆单率前十的待配送物品分类的订单数据,分析待配送物品分类下所有类别对应的拆分订单数据。
获取模块401获取到的被拆分的订单数据可以保存在文本文件(如csv格式)中。例如表1所示,订单号分别为1~5的订单被拆分成若干子订单。具体地,对于订单号1,其包括待配送物品1、2、3,其中待配送物品1、3属于同一个仓库,因而被拆分至子订单1-1,待配送物品2所在的仓库与待配送物品1、3所在的仓库不同,因而被拆分至子订单1-2。
进一步地,获取模块401还可以使用稀疏矩阵保存订单数据,方便存储和计算。例如将表1的拆单信息转化为表2所示,每一行表示一个子订单,该行中值为0的元素表示该子订单内不包括对应该列的待配送物品,不为0的元素表示该子订单中包括对应该列的待配送物品,且该待配送物品的数量为该元素的值。具体地,为了计算存储方便,也可以省略待配送物品的数量,以1表示该子订单内包括对应的待配送物品,以0表示该子订单内不包括对应的待配送物品。
计算模块402,用于根据所述订单的拆分信息确定所述子订单之间的待配送物品的关联关系,计算对于所述关联关系的关联度;关联度指示了关联关系中的待配送物品之间存在着某种关联关系,并且可以通过关联度的值衡量这种关联关系。本发明实施例以被拆分的订单中的每个子订单中的待配送物品之间的关系确定关联关系,例如,某一订单被拆分为子订单A和子订单B,其中子订单A中又包括待配送物品1和待配送物品2,子订单B中包括待配送物品3,则关联关系即为{待配送物品1,待配送物品2}与{待配送物品3}的关联,进一步地,此关联关系还带有指向性,即{待配送物品1,待配送物品2}对{待配送物品3}为一种关联关系,{待配送物品3}对{待配送物品1,待配送物品2}为另一种关联关系。在计算关联关系的关联度时,宜分别计算此两种关联关系,更进一步地,当一个订单被拆分为两个以上子订单时,关联关系也多于两个,宜计算所有的关联关系的关联度,以使得后续对关联度的选取更准确。其中所述关联度包括支持度、置信度和提升度中的一种或多种。
其中,所述支持度为同时包括所述关联关系中的待配送物品的订单数量与总订单数量的比值;
所述置信度为同时包括所述关联关系中的待配送物品的订单数量与至少包括所述关联关系中的一个子订单中的待配送物品的订单数量的比值;
所述提升度为所述关联关系中的待配送物品的置信度与支持度的比值。
计算模块402中还可内置Apriori机器学习算法(Apriori算法是一种挖掘关联关系的频繁项集算法,其核心思想是通过候选集生成和情节的向下封闭检测两个阶段来挖掘频繁项集,该算法已经被广泛的应用到商业、网络安全等各个领域),建立关联关系的关联度计算模型,在对模型进行训练的过程中,可以对支持度、置信度和/或提升度的数值进行初始化,筛除支持度、置信度和/或提升度值较低的订单数据。
聚类模块403,用于根据所述关联度确定需要进行聚类的待配送物品。由于关联关系是根据被拆分的订单确定的,所以计算模块402计算得到关联关系的关联度后,聚类模块403可以根据关联度的值对子订单中的待配送物品进行衡量,关联度的值越高,说明子订单之间的待配送物品存在较强的关联关系,聚类模块403选取关联度高的待配送物品的品类进行聚类,可以降低因待配送物品未在同一仓库而造成的拆单操作,继而降低了拆单率。进一步地,聚类模块403宜综合支持度、置信度和提升度三种关联度对待配送物品的关联度进行衡量。
聚类模块403还用于按照所述关联度由高到低对所述关联关系进行排序;选取关联度大于或等于第一阈值的关联关系中的待配送物品。
聚类模块403还用于按照所述关联度由高到低对所述关联关系进行排序;计算选取排序前M个关联关系中的待配送物品进行聚类后的订单的拆单率,其中拆单率为拆分的订单数量与总订单数量的比值;确定所述拆单率是否大于第二阈值;若所述拆单率大于第二阈值,则递增M的数量,直到计算选取排序前M个关联关系中的待配送物品进行聚类后的拆单率不大于所述第二阈值,则确定所述M个关联关系中的待配送物品为需要进行聚类的待配送物品。
聚类模块403还用于根据所述待配送物品的预测销量确定需要进行聚类的所述待配送物品的数量。
图5示出了可以应用本发明实施例的一种将待配送物品进行聚类的方法或一种将待配送物品进行聚类的装置的示例性***架构500。
如图5所示,***架构500可以包括终端设备501、502、503,网络504和服务器505。网络504用以在终端设备501、502、503和服务器505之间提供通信链路的介质。网络504可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备501、502、503通过网络504与服务器505交互,以接收或发送消息等。
终端设备501、502、503可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器505可以是提供各种服务的服务器,例如对用户利用终端设备501、502、503提供支持的后台管理服务器。后台管理服务器可以对接收到的信息查询请求等数据进行分析等处理,并将处理结果(例如订单拆分信息等)反馈给终端设备。
需要说明的是,本发明实施例所提供的一种将待配送物品进行聚类的方法一般由服务器505执行,相应地,一种将待配送物品进行聚类的装置一般设置于服务器505中。
应该理解,图5中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
图6所示为适于用来实现本发明实施例的终端设备的计算机***600的结构示意图。图6所示的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图6所示,计算机***600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有***600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本发明公开的实施例,上文步骤图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行步骤图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本发明的***中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质包括计算机可读信号介质或计算机可读存储介质,或者是上述两者的任意组合。计算机可读存储介质包括但不限于电、磁、光、电磁、红外线、半导体的***、装置或器件,或者上述内容的任意组合。计算机可读存储介质具体包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述内容的任意组合。在本发明中,计算机可读存储介质包括任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用;计算机可读的信号介质包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码,这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述信号的任意组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF(射频)等,或者上述介质的任意组合。
附图中的步骤图或框图,图示了按照本发明各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作,步骤图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以并行地执行,有时也可以按相反的顺序执行,其执行顺序依所涉及的功能而定。也要注意的是,框图或步骤图中的每个方框以及其组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块或单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块或单元也可以设置在处理器中,例如,可以描述为:一种处理器包括获取模块、计算模块和聚类模块。其中,这些模块或单元的名称在某种情况下并不构成对该模块或单元本身的限定,例如,获取模块还可以被描述为“用于获取订单的拆分信息的模块”。
另一方面,本发明实施例还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:获取订单的拆分信息,其中所述拆分信息包括根据所述订单拆分成的子订单和所述子订单包括的待配送物品;根据所述订单的拆分信息确定所述子订单之间的待配送物品的关联关系,计算对于所述关联关系的关联度;根据所述关联度确定需要进行聚类的待配送物品。
根据本发明实施例的技术方案,能够根据历史订单的拆分信息确定需要进行聚类的待配送物品,从而降低拆单率,节约订单配送成本,节约任务操作,从而提高对订单配送的时效控制,优化客户体验。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (10)

1.一种对待配送物品进行聚类的方法,其特征在于,包括:
获取订单的拆分信息,其中所述拆分信息包括根据所述订单拆分成的子订单和所述子订单包括的待配送物品;
根据所述订单的拆分信息确定所述子订单之间的待配送物品的关联关系,计算对于所述关联关系的关联度;
根据所述关联度确定需要进行聚类的待配送物品,包括:
按照所述关联度由高到低对所述关联关系进行排序;
计算选取排序前M个关联关系中的待配送物品进行聚类后的订单的拆单率,其中拆单率为拆分的订单数量与总订单数量的比值;
确定所述拆单率是否大于第二阈值;
若所述拆单率大于第二阈值,则递增M的数量,直到计算选取排序前M个关联关系中的待配送物品进行聚类后的拆单率不大于所述第二阈值,则确定所述M个关联关系中的待配送物品为需要进行聚类的待配送物品。
2.根据权利要求1所述的方法,其特征在于,所述关联度包括支持度、置信度和提升度中的一种或多种;
其中,所述支持度为同时包括所述关联关系中的待配送物品的订单数量与总订单数量的比值;
所述置信度为同时包括所述关联关系中的待配送物品的订单数量与至少包括所述关联关系中的一个子订单中的待配送物品的订单数量的比值;
所述提升度为所述关联关系中的待配送物品的置信度与支持度的比值。
3.根据权利要求1或2所述的方法,其特征在于,根据所述关联度确定需要进行聚类的待配送物品的方法包括:
按照所述关联度由高到低对所述关联关系进行排序;
选取关联度大于或等于第一阈值的关联关系中的待配送物品。
4.根据权利要求1所述的方法,其特征在于,确定所述M个关联关系中的待配送物品为需要进行聚类的待配送物品的品类之后,所述方法还包括:
根据所述待配送物品的预测销量确定需要进行聚类的所述待配送物品的数量。
5.一种对待配送物品进行聚类的装置,其特征在于,包括:
获取模块,用于获取订单的拆分信息,其中所述拆分信息包括根据所述订单拆分成的子订单和所述子订单包括的待配送物品;
计算模块,用于根据所述订单的拆分信息确定所述子订单之间的待配送物品的关联关系,计算对于所述关联关系的关联度;
聚类模块,用于根据所述关联度确定需要进行聚类的待配送物品,还用于按照所述关联度由高到低对所述关联关系进行排序;
计算选取排序前M个关联关系中的待配送物品进行聚类后的订单的拆单率,其中拆单率为拆分的订单数量与总订单数量的比值;
确定所述拆单率是否大于第二阈值;
若所述拆单率大于第二阈值,则递增M的数量,直到计算选取排序前M个关联关系中的待配送物品进行聚类后的拆单率不大于所述第二阈值,则确定所述M个关联关系中的待配送物品为需要进行聚类的待配送物品。
6.根据权利要求5所述的装置,其特征在于,所述关联度包括支持度、置信度和提升度中的一种或多种;
其中,所述支持度为同时包括所述关联关系中的待配送物品的订单数量与总订单数量的比值;
所述置信度为同时包括所述关联关系中的待配送物品的订单数量与至少包括所述关联关系中的一个子订单中的待配送物品的订单数量的比值;
所述提升度为所述关联关系中的待配送物品的置信度与支持度的比值。
7.根据权利要求5或6所述的装置,其特征在于,所述聚类模块还用于按照所述关联度由高到低对所述关联关系进行排序;选取关联度大于或等于第一阈值的关联关系中的待配送物品。
8.根据权利要求5所述的装置,其特征在于,所述聚类模块还用于根据所述待配送物品的预测销量确定需要进行聚类的所述待配送物品的数量。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-4中任一所述的方法。
10.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被一个或多个处理器执行时实现如权利要求1-4中任一所述的方法。
CN201910132026.4A 2019-02-22 2019-02-22 一种对待配送物品进行聚类的方法和装置 Active CN111612385B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910132026.4A CN111612385B (zh) 2019-02-22 2019-02-22 一种对待配送物品进行聚类的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910132026.4A CN111612385B (zh) 2019-02-22 2019-02-22 一种对待配送物品进行聚类的方法和装置

Publications (2)

Publication Number Publication Date
CN111612385A CN111612385A (zh) 2020-09-01
CN111612385B true CN111612385B (zh) 2024-04-16

Family

ID=72199625

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910132026.4A Active CN111612385B (zh) 2019-02-22 2019-02-22 一种对待配送物品进行聚类的方法和装置

Country Status (1)

Country Link
CN (1) CN111612385B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112053068B (zh) * 2020-09-09 2021-08-24 上海有个机器人有限公司 一种递送机器人的云端调度方法、装置和服务器
CN114186903A (zh) * 2020-09-14 2022-03-15 上海顺如丰来技术有限公司 仓库选品方法、装置、计算机设备和存储介质
CN113393192A (zh) * 2021-06-16 2021-09-14 北京京东振世信息技术有限公司 一种物品出库方法、装置、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107016073A (zh) * 2017-03-24 2017-08-04 北京科技大学 一种文本分类特征选择方法
CN107545381A (zh) * 2016-06-24 2018-01-05 北京京东尚科信息技术有限公司 管理仓库库存的方法和仓库管理***
WO2018074851A1 (ko) * 2016-10-18 2018-04-26 주식회사 우아한형제들 배달주문 분배시스템 및 방법
WO2018205760A1 (zh) * 2017-05-09 2018-11-15 北京京东尚科信息技术有限公司 一种配送站选址的方法和装置
CN109146646A (zh) * 2018-09-25 2019-01-04 北京三快在线科技有限公司 拆单结算方法、装置、电子设备及计算机可读介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107545381A (zh) * 2016-06-24 2018-01-05 北京京东尚科信息技术有限公司 管理仓库库存的方法和仓库管理***
WO2018074851A1 (ko) * 2016-10-18 2018-04-26 주식회사 우아한형제들 배달주문 분배시스템 및 방법
CN107016073A (zh) * 2017-03-24 2017-08-04 北京科技大学 一种文本分类特征选择方法
WO2018205760A1 (zh) * 2017-05-09 2018-11-15 北京京东尚科信息技术有限公司 一种配送站选址的方法和装置
CN109146646A (zh) * 2018-09-25 2019-01-04 北京三快在线科技有限公司 拆单结算方法、装置、电子设备及计算机可读介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Water Distribution System Clustering and Partitioning Based on Social Network Algorithms;Armando Di Nardo等;《Procedia Engineering》;20151231;全文 *
数据挖掘在电商运营策略中的应用研究;尹胜燕;《中国优秀硕士学位论文全文数据库 经济与管理科学辑》;第2018年卷(第1期);第3章 *
面向最小化拆单率的基于订单分配顺序的库存优化研究;李建斌;孙哲;陈威帆;李文秀;;工业工程与管理;20171210(第06期);全文 *

Also Published As

Publication number Publication date
CN111612385A (zh) 2020-09-01

Similar Documents

Publication Publication Date Title
CN111612385B (zh) 一种对待配送物品进行聚类的方法和装置
CN112184348B (zh) 订单数据处理方法、装置、电子设备及介质
CN110059991B (zh) 仓库选品方法、***、电子设备和计算机可读介质
CN113095893A (zh) 确定物品销量的方法和装置
CN110826953B (zh) 一种仓库存储设备规划的方法和装置
CN113793081A (zh) 仓储监控方法、装置、计算机可读介质及电子设备
CN109255563B (zh) 物品的储位区域的确定方法和装置
CN110956417A (zh) 一种门店商品处理方法和装置
CN110895761A (zh) 一种售后服务申请信息的处理方法和装置
CN113762863A (zh) 一种库存管理方法和装置
CN112784212B (zh) 一种优化库存的方法和装置
CN110826948B (zh) 仓库选品方法和装置
CN112784861A (zh) 相似度的确定方法、装置、电子设备和存储介质
CN113112048A (zh) 一种物品回库方法和装置
CN112446652A (zh) 处理任务集的方法和装置
CN110956478A (zh) 确定物品进货量的方法和装置
CN114677174A (zh) 一种计算未上架物品销量的方法和装置
CN110880119A (zh) 一种数据处理方法和装置
CN115525665A (zh) 一种信息处理方法、装置、电子设备及计算机可读介质
CN113379173B (zh) 为仓库商品标记标签的方法和装置
CN110084541B (zh) 用于预测供应商送货时长的方法和装置
CN110738538B (zh) 识别相似物品的方法和装置
CN114723354A (zh) 一种针对供应商的线上商机挖掘方法、设备及介质
CN113743972B (zh) 一种生成物品信息的方法和装置
CN111833085A (zh) 一种计算物品价格的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
TA01 Transfer of patent application right

Effective date of registration: 20210304

Address after: 101, 1st floor, building 2, yard 20, Suzhou street, Haidian District, Beijing 100080

Applicant after: Beijing Jingbangda Trading Co.,Ltd.

Address before: 100086 8th Floor, 76 Zhichun Road, Haidian District, Beijing

Applicant before: BEIJING JINGDONG SHANGKE INFORMATION TECHNOLOGY Co.,Ltd.

Applicant before: BEIJING JINGDONG CENTURY TRADING Co.,Ltd.

Effective date of registration: 20210304

Address after: 6 / F, 76 Zhichun Road, Haidian District, Beijing 100086

Applicant after: Beijing Jingdong Zhenshi Information Technology Co.,Ltd.

Address before: 101, 1st floor, building 2, yard 20, Suzhou street, Haidian District, Beijing 100080

Applicant before: Beijing Jingbangda Trading Co.,Ltd.

TA01 Transfer of patent application right
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant