CN103984765A - 基于云服务平台大数据挖掘的仓位组合方法 - Google Patents

基于云服务平台大数据挖掘的仓位组合方法 Download PDF

Info

Publication number
CN103984765A
CN103984765A CN201410239142.3A CN201410239142A CN103984765A CN 103984765 A CN103984765 A CN 103984765A CN 201410239142 A CN201410239142 A CN 201410239142A CN 103984765 A CN103984765 A CN 103984765A
Authority
CN
China
Prior art keywords
transaction
item
frequent
commodity
array
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410239142.3A
Other languages
English (en)
Inventor
宋彧婕
杜小清
梁恒
李富强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu De Maian Science And Technology Ltd
Original Assignee
Chengdu De Maian Science And Technology Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu De Maian Science And Technology Ltd filed Critical Chengdu De Maian Science And Technology Ltd
Priority to CN201410239142.3A priority Critical patent/CN103984765A/zh
Publication of CN103984765A publication Critical patent/CN103984765A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Warehouses Or Storage Devices (AREA)

Abstract

本发明公开了一种基于云服务平台大数据挖掘的仓位组合方法,具体根据历史订单数据做数据挖掘分析,找出商品关联性,对仓位进行合并,重新进行储位调整,基于用户订单数据对仓位进行组合,更加符合实际需求;通过求关联方法,只需扫描一次数据库,在构建初始Id表时扫描一次数据库,把每一个商品对应的交易Id全部填入到表内,提高了计算效率;组合仓位根据访问频率进行设置,可提高捡货人员的作业效率。

Description

基于云服务平台大数据挖掘的仓位组合方法
技术领域
本发明属于电子信息技术领域,涉及电子商务中的大数据和云计算应用,具体涉及基于云服务平台大数据挖掘的仓位组合方法。 
背景技术
现代仓储管理更加注重仓储的时效性,是一种动态的管理,重视商品在拣货出库时的数量位置变化,从而配合其他仓储作业。储位管理就是利用储位来使商品处于被保管状态并且能够明确显示所储存的位置,同时当商品的位置发生变化时能够准确记录,使管理者能够随时掌握商品的数量、位置,以及去向。 
良好的储位分配策略可以减少捡货作业人员出入库移动的距离、缩短作业时间,甚至能够充分利用存储空间。目前比较较流行的储位指派技术:定位存储、随机存储和分类存储等。在传统的,规模较小的物流业中,这些储位指派或许能够满足业务需求,但是随着电子商务的不断发展,如何才能更快、更有效的配送货物是取得竞争优势的一大问题。捡货作业是物流重要环节,科学合理的仓位设计能够有效提高操作人员的捡货速度,从而减低成本。 
目前,对仓位组合***的优化方法很多,包括计算法、枚举法、随机算法等,随着研究的深入,有出现了通过遗传算法来解决货位组合优化问题,然而这些方案都仅仅只考虑到仓库货物,没有联系到用户的购买习惯,所以影响到了算法质量,从而降低了存取效率。 
在B/B电子商务中,每天产生大量看似庞杂的信息,而在这些信息背后蕴藏了丰富的用户购买组合规律和习惯。通过数据挖掘的手段找出这些规律和知识、来对仓位组合提供指导,以方便捡货作业。 
发明内容
本发明的目的是为了解决现有技术存在的上述问题,提出了一种基于云服务平台大数据挖掘的仓位组合方法。 
本发明的技术方案为:一种基于云服务平台大数据挖掘的仓位组合方法,具体包括如下步骤: 
将历史订单数据作为数据源,通过关联规则计算出商品之间的关联性,采用分布处理思想,首先求解频繁k‐1项集,然后自联接生成候选频繁k项集; 
频繁k项集的求解如下: 
a)将商品作为主键建立商品Id表。 
b)根据表中的数据求解频繁项集(假定最小支持数为s,求出交易项对应的交易Id数 组中元素的个数就求出了改交易项的支持数,如表1中的元素的个数就求出了改交易项的支持数s): 
求出交易项对应的交易Id数组中的元素个数得出该交易项的支出数;如果交易项不是频繁的(如果交易项对应的交易Id数组长度大于支持数s,则交易项是频繁的,否则不是频繁的)则从商品Id表中删除; 
定义一个数组IDArray,存储数据库汇总交易项和其交易Id,数组的长度为交易Id的总个数,把该数组的各个元素的初始值设为0,这个数组称为ID数组,ID数组只有1个。 
从生成的所有频繁k-1项集的第1个频繁项集开始;把该频繁项集对应的所有交易ID在数组中对应的元素设置为1,扫描所有其后面的频繁k-1项集和它进行自连接;如果和某个频繁k-1项集m生成了一个候选频繁k项集p,则累计m包含的交易ID在数组中的对应位置的值为1的个数n;如果n大于最小支持数则为频繁的,否则是非频繁的; 
如果生成的这个项集p为频繁的,则把p加入到商品Id表中;当扫描完某个频繁k-1项集后面的所有频繁k-1项集后,则以后的求解过程和该频繁k-1项集无关,把该频繁k-1项集的条目从商品Id表中删除;循环一直到不再生成候选频繁k项集结束,最后输出所有的频繁项集。 
新生成的商品Id表中的交易项即是商品关联项,根据表中的交易项组合仓位; 
根据新得到的商品Id表计算交易Id的频率,将交易项按照交易Id顺序进行排列,即仓位访问频率,将访问频率高的仓位组合设置在离仓库出口最近的地方。 
本发明的有益效果:本发明的方法根据历史订单数据做数据挖掘分析,找出商品关联性,对仓位进行合并,重新进行储位调整,基于用户订单数据对仓位进行组合,更加符合实际需求;通过求关联方法,只需扫描一次数据库,在构建初始Id表时扫描一次数据库,把每一个商品对应的交易Id全部填入到表内,提高了计算效率;组合仓位根据访问频率进行设置,可提高捡货人员的作业效率。 
具体实施方式
本发明实施例所用的方法如下: 
将历史订单数据作为数据源,通过关联规则计算出商品之间的关联性。采用分布处理思想,首先求解频繁项k‐1项,然后自联接声称候选频繁k项集,k项集的求解如下: 
有别于传统的将订单作为主键建立数据库方法,将商品作为主键建立商品——Id表。 
根据表中的数据求解频繁项集(假定最小支持数为s,求出交易项对应的交易Id数组中元素的个数就求出了改交易项的支持数,如表1中的元素的个数就求出了改交易项的支持数s): 
求出交易项对应的交易Id数组中的元素个数得出该交易项的支出数;如果交易项不是 频繁的,则从商品Id表中删除; 
定义一个数组IDArray,数组的长度为交易Id的总个数,把该数组的各个元素的初始值设为0,这个数组称为ID数组。在整个算法中,ID数组只有1个。 
从生成的所有频繁k‐1项集的第1个频繁项集开始;把该频繁项集对应的所有交易ID在数组中对应的元素设置为1,扫描所有其后面的频繁k‐1项集和它进行自连接;如果和某个频繁k‐1项集m生成了一个候选频繁k项集p,则累计m包含的交易ID在数组中的对应位置的值为1的个数n;如果n大于最小支持数则为频繁的,否则是非频繁的; 
如果生成的这个项集p为频繁的,则把p加入到商品‐ID表中;当扫描完某个频繁k‐1项集后面的所有频繁k‐1项集后,则以后的求解过程和该频繁k‐1项集无关,把该频繁k‐1项集的条目从商品Id表中删除;循环一直到不再生成候选频繁k项集结束,最后输出所有的频繁项集。 
新生成的商品Id表中的交易项即是商品关联项,根据表中的交易项组合仓位; 
根据新得到的商品Id表计算交易Id的频率,将交易项按照交易Id顺序进行排列,即仓位访问频率,将访问频率高的仓位组合设置在离仓库出口最近的地方。 
表1 商品为主键的数据库 
交易项 交易Id
A 1,2,3
B 1,3,5
C 1,2,3,4,5
D 1,2,4,5
说明:算法使用的数据库,该数据库以商品(即交易项)作为主键,是本算法的基础 
下面以表2中的商品ID表为例说明本发明方法的具体操作过程(假设最小支持数2): 
频繁1项集的求解:计算各个商品(交易项)。 
频繁1项集的求解:计算各个商品的交易Id数组的长度可以得到:A=3,B=3,C=5,D=4,,因为最小支持数位2,所以可求的频繁项集为:{A},{B},{C},{D}。 
频繁2项集的求解:取频繁项集的元素{A},Id数组清0,把商品‐Id表中所有交易Id在Id数组中的对应元素赋值为1,交易Id数组变为{1,1,0,0}。 
取频繁1项集中的元素{B}和{A}自连接生成 
侯选频繁2项集{A,B},计算{B}的所有交易ID在ID数组中对应的位置元素值为1的个数.可以看出1的位置元素值为1;3的位置元素值为1;5的位置元素值为0,则可以得出{A}和{B}有2个相同的交易ID(1和3).即有2个交易同时购买了{A}和{B},所设的最 小支持数为2,所以{A,B}为一个频繁2项集,把它追加到商品ID表中,如果是非频繁的,则舍弃该侯选频繁集,现在的商品ID表如表2所示。 
表2追加{A,B}后的商品‐Id表 
交易项 交易id
A 1,2,3
B 1,3,5
C 1,2,3,4,5
D 1,2,4,5
A,B 1,3
计算{A,C},{A,D},此时,不需要对ID表重新赋值,因为{A)的信息没有被破坏.可得{A,C)和{A,D)均为频繁2项集,把它们加入到商品ID表中.因为以后的计算都与{A)无关,所以,把{A)项从商品ID表中删除,现在的商品ID表如表3所示。 
表3删除{A}项后的商品‐Id表 
交易项 交易id
B 1,3,5
C 1,2,3,4,5
D 1,2,4,5
A,B 1,3
A,C 1,2,3
A,D 1,2
取商品ID表中的第1项{B)计算,当重新取个频繁项集计算时,需要把ID数组重新清0,并把该频繁项集的所有交易ID在ID数组中对应的位置元素设置为1,表示该频繁项集被该交易ID支持.重复以上步骤,当遍历完所有的频繁1项集时就得到了所有频繁2项集,商品一ID表如表4所示。 
表4求解频繁2项集后的商品ID表 
交易项 交易id
A,B 1,3
A,C 1,2,3
A,D 1,2
B,C 1,3,5
B,D 1,5
C,D 1,2,4,5
使用同样的方法求解频繁3项集如表5所示)。 
表5求解频繁3项集后的商品ID表 
交易项 交易id
A,B,C 1,3
A,C,D 1,2
B,C,D 1,5
使用同样的方法,可以发现没有频繁4项集,商品ID表为空表,操作过程结束。 

Claims (1)

1.一种基于云服务平台大数据挖掘的仓位组合方法,其特征在于,具体包括如下步骤:
将历史订单数据作为数据源,通过关联规则计算出商品之间的关联性,采用分布处理思想,首先求解频繁k‐1项集,然后自联接生成候选频繁k项集;
频繁k项集的求解如下:
a)将商品作为主键建立商品Id表;
b)根据表中的数据求解频繁项集,假定最小支持数为s,求出交易项对应的交易Id数组中元素的个数就求出了改交易项的支持数;
求出交易项对应的交易Id数组中的元素个数得出该交易项的支出数;如果交易项不是频繁的则从商品Id表中删除,所述的频繁的具体为:如果交易项对应的交易Id数组长度大于支持数s,则交易项是频繁的,否则不是频繁的;
定义一个数组IDArray,存储数据库汇总交易项和其交易Id,数组的长度为交易Id的总个数,把该数组的各个元素的初始值设为0,这个数组称为ID数组,ID数组只有1个。
从生成的所有频繁k-1项集的第1个频繁项集开始;把该频繁项集对应的所有交易ID在数组中对应的元素设置为1,扫描所有其后面的频繁k-1项集和它进行自连接;如果和某个频繁k-1项集m生成了一个候选频繁k项集p,则累计m包含的交易ID在数组中的对应位置的值为1的个数n;如果n大于最小支持数则为频繁的,否则是非频繁的;
如果生成的这个项集p为频繁的,则把p加入到商品Id表中;当扫描完某个频繁k-1项集后面的所有频繁k-1项集后,则以后的求解过程和该频繁k-1项集无关,把该频繁k-1项集的条目从商品Id表中删除;循环一直到不再生成候选频繁k项集结束,最后输出所有的频繁项集。
新生成的商品Id表中的交易项即是商品关联项,根据表中的交易项组合仓位;
根据新得到的商品Id表计算交易Id的频率,将交易项按照交易Id顺序进行排列,即仓位访问频率,将访问频率高的仓位组合设置在离仓库出口最近的地方。
CN201410239142.3A 2014-05-30 2014-05-30 基于云服务平台大数据挖掘的仓位组合方法 Pending CN103984765A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410239142.3A CN103984765A (zh) 2014-05-30 2014-05-30 基于云服务平台大数据挖掘的仓位组合方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410239142.3A CN103984765A (zh) 2014-05-30 2014-05-30 基于云服务平台大数据挖掘的仓位组合方法

Publications (1)

Publication Number Publication Date
CN103984765A true CN103984765A (zh) 2014-08-13

Family

ID=51276737

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410239142.3A Pending CN103984765A (zh) 2014-05-30 2014-05-30 基于云服务平台大数据挖掘的仓位组合方法

Country Status (1)

Country Link
CN (1) CN103984765A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107545381A (zh) * 2016-06-24 2018-01-05 北京京东尚科信息技术有限公司 管理仓库库存的方法和仓库管理***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070174499A1 (en) * 2006-01-03 2007-07-26 Ken Bhella System and method for configuring an electronic device
CN102609830A (zh) * 2012-02-16 2012-07-25 南京理工大学 一种基于关联规则的物流仓储仓位分配方法
CN103353880A (zh) * 2013-06-20 2013-10-16 兰州交通大学 一种利用相异度聚类和关联的数据挖掘方法
CN103473616A (zh) * 2013-09-17 2013-12-25 四川航天***工程研究所 用于处理多品种物资仓储的动态货位分配规划方法与***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070174499A1 (en) * 2006-01-03 2007-07-26 Ken Bhella System and method for configuring an electronic device
CN102609830A (zh) * 2012-02-16 2012-07-25 南京理工大学 一种基于关联规则的物流仓储仓位分配方法
CN103353880A (zh) * 2013-06-20 2013-10-16 兰州交通大学 一种利用相异度聚类和关联的数据挖掘方法
CN103473616A (zh) * 2013-09-17 2013-12-25 四川航天***工程研究所 用于处理多品种物资仓储的动态货位分配规划方法与***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王凯: "关联规则算法及其在智能药房***中的应用研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107545381A (zh) * 2016-06-24 2018-01-05 北京京东尚科信息技术有限公司 管理仓库库存的方法和仓库管理***
CN107545381B (zh) * 2016-06-24 2021-02-26 北京京东振世信息技术有限公司 管理仓库库存的方法和仓库管理***

Similar Documents

Publication Publication Date Title
CN105354641B (zh) 拣货路径优化方法及拣货路径优化装置
Zhang et al. New model of the storage location assignment problem considering demand correlation pattern
US9884721B2 (en) Shipping order allocation apparatus
Weidinger Picker routing in rectangular mixed shelves warehouses
WO2017124955A1 (zh) 一种仓库货位规划方法、装置及电子装置
CN103927643B (zh) 一种大规模订单处理与配送路径优化的方法
CN103632241A (zh) 仓库盘点方法及仓库盘点***
CN103607463B (zh) 定位数据存储***和存储方法
Liu et al. A capacitated vehicle routing problem with order available time in e-commerce industry
CN105550368A (zh) 一种高维数据的近似最近邻检索方法及检索***
Revillot-Narváez et al. Optimising the storage assignment and order-picking for the compact drive-in storage system
Kłodawski et al. Order picking area layout and its impact on efficiency of order picking process
CN109523314A (zh) 一种基于ai技术的供应链管控方法及其***和存储介质
CN101339635A (zh) 确定物料需求计划及获取物料低位码的方法、***及设备
Yuan et al. The pod assignment model and algorithm in robotic mobile fulfillment systems
CN104239447A (zh) 电网时序大数据存储方法
Wu et al. Optimization of Order‐Picking Problems by Intelligent Optimization Algorithm
CN103984765A (zh) 基于云服务平台大数据挖掘的仓位组合方法
WO2021077861A1 (zh) 订单处理方法、装置及存储介质
CN103838775A (zh) 数据分析方法以及数据分析设备
WO2016040919A4 (en) Read cycles for identifying rfid tags
Zhang et al. The Optimization of the Location of the Cargo in Three‐Dimension Shelf: Employing the FP‐Tree and the Artificial Fish Swarm Algorithms
Wang et al. A real-time synchronized zone order picking system for balancing pickers’ workload
CN112948531B (zh) 海量轨迹查询方法、检索服务器及***
Shen et al. Optimization of picking in the warehouse

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140813