CN112699174B - 一种大数据建筑用品驱动链图生成方法 - Google Patents

一种大数据建筑用品驱动链图生成方法 Download PDF

Info

Publication number
CN112699174B
CN112699174B CN202110306025.4A CN202110306025A CN112699174B CN 112699174 B CN112699174 B CN 112699174B CN 202110306025 A CN202110306025 A CN 202110306025A CN 112699174 B CN112699174 B CN 112699174B
Authority
CN
China
Prior art keywords
model
sku
order
driving
dbg
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110306025.4A
Other languages
English (en)
Other versions
CN112699174A (zh
Inventor
陶锋
张勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China State Construction eCommerce Co Ltd
Original Assignee
China State Construction eCommerce Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China State Construction eCommerce Co Ltd filed Critical China State Construction eCommerce Co Ltd
Priority to CN202110306025.4A priority Critical patent/CN112699174B/zh
Publication of CN112699174A publication Critical patent/CN112699174A/zh
Application granted granted Critical
Publication of CN112699174B publication Critical patent/CN112699174B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/087Inventory or stock management, e.g. order filling, procurement or balancing against orders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/08Construction

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Databases & Information Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computational Linguistics (AREA)
  • Tourism & Hospitality (AREA)
  • Human Resources & Organizations (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Fuzzy Systems (AREA)
  • Primary Health Care (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种大数据建筑用品驱动链图生成方法,包括如下步骤:基于订单生成建筑用品驱动关系基础数据并建立结构模型;识别驱动关系内部结构中的对象,将核心对象以及其它对象输入结构模型对应类结构中建立匹配模型;基于下单规律中各对象的参数关系计算各对象之间的驱动概率值;选定一个匹配模型,将其它匹配模型中其它对象与该匹配模型中核心对象进行比对,当相同时修改D‑model类结构的指向关系将该其它对象和核心对象对应类结构连接,结合驱动概率值对应作为关联关系的权值生成驱动链图。本发明提供驱动链图可表明一个主驱动商品与其它n组商品集合在不同的动态组合条件下的影响关系,可支撑销售采购人员更具体地进行库存满足程度以及缺口分析。

Description

一种大数据建筑用品驱动链图生成方法
技术领域
本发明涉及大数据分析技术领域,具体而言,涉及一种大数据建筑用品驱动链图生成方法。
背景技术
随着建筑用品采购销售的集中化,销售***中记录了大量批量式的采购订单,这些订单中包含有多种类别的建筑用品。这些采购订单背后是各类施工项目的实施需求,在建筑施工场景中,通常需要采购多个类别的建筑用品用于某一项施工。
在线销售模式的普及,使订单和库存的变化缩短为分钟甚至秒级,当新订单到来时,库存采购人员需要根据***后台的数据实时分析其他建筑用品的库存缺口,以支撑新的集中采购策略。该过程要求采购分析人员对自身***里的建筑用品之间的销售关系有更为清晰具体了解,目前支持采购人员进行分析的工具较为繁琐,依然需要大量人工经验。存在耗时长,易出错的问题。
建筑用品的订单需求与普通消费类商品在结构上有较大区别,各类别的建筑用品消耗有较为紧密的内在联系,而利用传统的大数据关联聚类方法不易发现更深层次的关系,因此不足以支撑该业务背景下的库存需求分析。
发明内容
本发明的目的在于提供一种大数据建筑用品驱动链图生成方法,其通过计算编程在***中运行并实时更新,可支撑采购人员用于建筑用品集中在线销售场景的库存缺口分析。本方法通过对后台***中的大量销售订单数据的分析,生成建筑用品驱动链图,以清楚的反应近期各类别建筑用品之间的支撑关系,进一步丰富高阶的订单数据分析手段。
本发明的实施例通过以下技术方案实现:一种大数据建筑用品驱动链图生成方法,包括如下步骤:
S1.根据获取的订单中各建筑用品之间的下单规律进行驱动关系挖掘,生成建筑用品驱动关系基础数据并建立驱动关系的结构模型;
S2.对驱动关系的内部结构进行识别确定驱动关系的核心对象以及其它对象,将核心对象以及其它对象输入驱动关系的结构模型对应的类结构中建立驱动关系匹配模型D-model;
S3.计算核心对象与其它对象之间的驱动概率值以及其它对象之间的驱动概率值;
S4.选定一个D-model,将其它D-model中的其它对象与该D-model中的核心对象进行比对,当相同时,将该其它对象和核心对象对应的类结构进行连接,结合步骤S3算得的驱动概率值生成驱动链图。
根据一种优选实施方式,步骤S1进一步包括如下步骤:
S11.根据建筑用品的下单规律,创建驱动关系的结构模型,其中驱动关系的结构模型的数据结构包括:主驱动商品类结构DG;被驱动商品集类结构DBG;次要被驱动商品集类结构S-DBGDGDBG之间的主驱动关系dRel-m;DGS-DBG之间的次驱动关系dRel-s;DBGS-DBG之间的辅驱动关系dRel-a;
S12.对获取的订单进行分析计算综合误差之和,生成对应到每个订单的驱动关系基础数据,综合误差之和计算公式为:
Figure 419646DEST_PATH_IMAGE001
(1)
式(1)中,在B小于预设阈值时,该订单符合驱动关系基础数据要求;m为该订单中的总建筑用品的类别数SKU的数量;k为该订单中当前SKU的排序,其中k的取值范围为[1,m];C为当前SKU的采购数;P为单价;
Figure 661271DEST_PATH_IMAGE002
为下单时间差比值;A为该SKU所属的材料大类,不同的材料大类对应不同的值。
根据一种优选实施方式,步骤S12中的
Figure 998712DEST_PATH_IMAGE002
通过以下方法算得:
k=1时,
Figure 642183DEST_PATH_IMAGE002
为1.0;当k=m时,
Figure 977349DEST_PATH_IMAGE002
为2.0;当k为其它值时,
Figure 706271DEST_PATH_IMAGE002
通过如下公式算得,公式表示为:
Figure 785085DEST_PATH_IMAGE003
(2)
式(2)中,T 1为第一个SKU下单时间,T m 为最后一个SKU下单时间,T k 为当下所计算的SKU下单时间。
根据一种优选实施方式,步骤S2进一步包括如下步骤:
S21.对订单中所有的SKU的影响值I进行计算,将最大影响值的SKU作为驱动关系核心对象,将驱动关系核心对象划入主驱动商品DG,其中计算影响值I的公式表示为:
Figure 96112DEST_PATH_IMAGE005
(3)
S22.将驱动关系核心对象排除,剩余的m-1个SKU作为其它对象;
S23.重复以上步骤,直至所有订单被处理并形成D-model。
根据一种优选实施方式,步骤S22还包括:
S221.通过对剩余的m-1个SKU的次级影响值DS进行计算,确定其它对象中的被驱动对象,公式表示为:
Figure 867759DEST_PATH_IMAGE007
(4)
S222.对计算所得的DS按值的大小降序排序逐个累加剩余的DS,当累加值恰好大于
Figure 818397DEST_PATH_IMAGE008
时,将参与累加的次级影响值对应的SKU划入被驱动商品集DBG,其中D total 为剩余的m-1个SKU的次级影响值之和;
S223.若还有剩余SKU,全部划入次要被驱动商品集S-DBG
根据一种优选实施方式,步骤S3进一步包括如下步骤:
S31.计算DG驱动DBG的概率值P m ,公式表示为:
Figure 700902DEST_PATH_IMAGE009
(5)
式(5)中,k 1 为与当前D-model中的DGDBG中的SKU序列相同的D-model的总数量;t e k 1 个相同的D-model中,对应订单的最晚的下单时间;t s k 1 个相同的D-model中,对应订单的最早的下单时间;t为当前D-model对应订单的下单时间;C DG 为与当前D-model中的DG相同的所有D-model对应订单的下单次数;C DBG 为与当前D-model中的DG的SKU和DBG的SKU序列均相同的所有D-model对应订单的下单次数;
S32.计算DG驱动S-DBG的概率值P S ,公式表示为:
Figure 53386DEST_PATH_IMAGE010
(6)
式(6)中,C S-DBG 为与当前D-model中的DG的SKU和S-DBG的SKU序列均相同的所有D-model对应订单的下单次数;
S33.DBG驱动S-DBG的概率值P a 根据P m P s 的大小确定,公式表示为:
Figure 58252DEST_PATH_IMAGE011
(7)。
根据一种优选实施方式,步骤S4进一步包括如下步骤:
S41.选定一个D-model,遍历另一D-model中DBG与S-DBG中的SKU序列,将其与选定的D-model中DG中的SKU进行比对,若存在相同SKU,则将存在相同SKU的DBG和S-DBG连接选定的D-model中的DG,并建立dRel-m、dRel-s或dRel-a关联关系;
其中,将计算所得的P m 作为关联关系dRel-m的权值,P s 作为关联关系dRel-s的权值,P a 则作为关联关系dRel-a的权值;
S42.重复上述步骤,直至所有的D-model均完成比对。
根据一种优选实施方式,步骤S41中该D-model与另一D-model之间建立dRel-m、dRel-s和dRel-a关联关系,具体为:
根据dRel-m、dRel-s和dRel-a关联关系,修改该D-model中类结构的指向关系;
步骤S41中将计算所得的P m 作为关联关系dRel-m的权值,P s 作为关联关系dRel-s的权值,P a 则作为关联关系dRel-a的权值,具体为:
根据P m P s P a 修改该D-model中类结构数据类实例中驱动概率成员变量。
根据一种优选实施方式,步骤S1之前还包括如下步骤:
订单批次合并,将预设时间范围内同一客户的零散订单进行合并,生成包括多种SKU的复合订单;
无效订单剔除,对合并后SKU数量为1的复合订单进行剔除,剩余订单作为有效订单;
根据订单的下单时间对有效订单进行排序。
根据一种优选实施方式,步骤S12中的材料大类包括主材类、辅材类以及工具类,其中,主材类的A值大于辅材类的A值大于工具类的A值。
本发明实施例的技术方案至少具有如下优点和有益效果:(1)通过本发明提供的方法生成的驱动链图,可表明一个主驱动商品与其它n组商品集合在不同的动态组合条件下的影响关系,具体可支撑销售采购人员更具体地进行库存满足程度以及缺口分析;
(2)驱动关系匹配模型D-model根据建筑施工时不同类型的用品的下单规律生成,有更强的行业针对性,可以更加直观的反应所有类别的建筑用品的影响关系,可为建筑用品库存需求的可视化提供数据基础;
(3)驱动链图以SKU为建筑用品分析唯一标识,可为订单发起客户的用户画像提供新的分析维度。
附图说明
图1为本发明实施例1提供的驱动链图生成方法步骤流程图;
图2为本发明实施例1提供的D-model逻辑结构示意图;
图3为本发明实施例1提供的D-model连接结果逻辑示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
实施例1
参阅图1所示,本实施例提供一种大数据建筑用品驱动链图生成方法,该方法通过计算编程在***中运行并实时更新,可支撑采购人员用于建筑用品集中在线销售场景的库存缺口分析。本方法通过对后台***中的大量销售订单数据的分析,生成建筑用品驱动链图。生成的驱动链图可以清楚地反应近期各类别建筑用品之间的支撑关系,进一步丰富高阶的订单数据分析手段,方法包括如下步骤:
步骤一,订单数据预处理,通过对后台***获得的销售订单数据进行预处理,确定具备条件进行驱动链图生成的源数据;预处理具体包括以下几个步骤:
在Hadoop的Hive数据库中创建预处理计算缓存池、预处理结果缓存池;将从后台业务***获取的销售订单数据载入到计算缓存池,按订单数据下单时间从远到近排序;将相近时间范围内同一个客户的零散订单进行合并,形成包含多种建筑用品SKU的复合虚拟订单。
使用JAVA程序读入计算缓存池的第一个订单成为类对象,找到第k个零散订单ORD k ,在该订单24小时内,若发现该时间之后有n个零散订单,将它们合并,形成包含n+1个SKU的复合订单,对原零散订单进行删除,合并后的复合订单存入Hive中的预处理结果缓存池。其中,对零散订单的判断方法为该订单中包含SKU的数量是否为1,若该订单的SKU数量为1,即只包含一个种类的建筑用品,则对该订单执行删除。重复上述步骤,直到所有计算预处理计算缓存池内的订单被处理。
预处理还包括无效订单剔除,即扫描预处理计算缓存池剩余订单,对依然为零散订单的数据,将其从预处理计算缓存池数据库中删除。
进一步的,还包括排序预处理流程,对所有的有效订单按建筑用品下单时间进行排序,排序规则优选为从远到近。
从后台业务***获取的数据进过数据预处理流程后,进入驱动关系挖掘步骤,驱动关系挖掘具体包括以下几个步骤:
创建驱动关系匹配模型D-model,根据建筑用品的下单规律,创建驱动关系的结构模型,其中驱动关系由主驱动商品DG、被驱动商品集DBG以及次要被驱动商品集S-DBG三大主要对象组成。进一步地,还包括主驱动关系dRel-m、次驱动关系dRel-s以及辅驱动关系dRel-a三种关系。其中DBGS-DBG可以包括多个建筑用品SKU,而DG作为主驱动商品仅包含一个SKU,即驱动核心对象。在本实施例中,驱动关系匹配模型D-model通过面向对象编程的类实现,分别对应创建SKU、DGDBGS-DBG类,其中,在DGDBGS-DBG类中创建带序号的SKU序列,SKU序列的初始状态为空元素序列。
创建dRel-m、dRel-s、dRel-a类结构数据类实现,并将P m P s P a 作为成员变量分别包含在其中。
创建D-model大类,包含以上所有类对象,形成最终的数据结构,最终形成的D-model逻辑结构如图2所示。
进一步的,生成驱动关系基础数据,具体包括以下几个步骤:
从预处理结果缓冲池中载入源数据,同时创建驱动关系基础数据池。
载入预处理结果缓冲池的第一个订单进行分析计算,生成对应的驱动关系基础数据,计算驱动关系匹配度。
计算第一步,求下单时间差比值
Figure 496186DEST_PATH_IMAGE002
,具体的,
Figure 916803DEST_PATH_IMAGE002
通过以下方式求得,当k=1时,
Figure 389373DEST_PATH_IMAGE002
为1.0;当k=m时,
Figure 502822DEST_PATH_IMAGE002
为2.0;
k为其它值时,
Figure 742567DEST_PATH_IMAGE002
为介于[1.0,2.0]之间的比例值,根据第k个建筑用品下单时间T k 、第1个建筑用品下单时间T 1与最后一个建筑用品下单时间T m 的比例得到,公式为:
Figure 966875DEST_PATH_IMAGE003
接下来计算综合误差之和B,公式为:
Figure 28372DEST_PATH_IMAGE001
式中,B即为计算驱动关系匹配度过程中的综合误差之和,在B小于预设阈值时,该订单符合驱动关系基础数据要求;m为该订单中的总建筑用品的类别数SKU的数量;k为该订单中当前SKU的排序,其中k的取值范围为[1,m];C为当前SKU的采购数;P为单价;
Figure 312723DEST_PATH_IMAGE002
为下单时间差比值;A为该SKU所属的材料大类,不同的材料大类对应不同的值;
本实施例中,材料大类包括主材类、辅材类以及工具类,通常情况下,主材类的A值大于辅材类的A值大于工具类的A值;优选的,主材类对应的A值为1.0,辅材类对应的A值为0.75,工具类对应的A值为0.5。本实施例中B的阈值设置为0.2,即,当B的值小于0.2时,认为该订单符合驱动关系基础数据,将该订单数据存入驱动关系基础数据池。重复以上步骤,知道预处理结果缓冲池中所有订单已处理。接下来对预处理结果缓冲池进行清空或删除。
进一步的,对订单进行驱动关系挖掘之后,对驱动关系中的核心对象进行识别,具体包括以下步骤:
载入驱动关系基础数据池中的第一个订单,先进行主驱动建筑用品识别,其中主驱动建筑用品指的是该订单中最大影响或作用的SKU,即最大影响值的SKU,计算影响值公式为:
Figure 725250DEST_PATH_IMAGE012
计算SKU的影响值I之后,将最大影响值的SKU划入D-model类结构中的DG类结构的SKU序列。
通过对剩余的m-1个SKU的次级影响值DS进行计算,确定其它对象中的被驱动对象,公式表示为:
Figure 815565DEST_PATH_IMAGE013
进一步的,对计算所得的DS按值的大小降序排序逐个累加剩余的DS,当累加值恰好大于
Figure 997148DEST_PATH_IMAGE008
时,将参与累加的次级影响值对应的SKU划入被驱动商品集DBG,其中D total 为剩余的m-1个SKU的次级影响值之和;若还有剩余SKU,全部划入次要被驱动商品集S-DBG
重复以上步骤,直至所有订单被处理并形成D-model。
进一步的,将所有元数据生成D-model后,计算核心对象与其它对象之间的驱动概率值以及其它对象之间的驱动概率值,具体包括:
将驱动关系基础数据池在内存中中复制一份,生成驱动概率计算待处理池,避免引用对象混乱。
在待处理池中载入第一个D-model,分别获取该D-model中DGDBGS-DBG中的SKU序列。根据上述三种SKU序列,在整个驱动关系基础数据池中搜索,计算C DG C DBG C S-DBG 的值。C DG 为与当前D-model中的DG相同的所有D-model对应订单的下单次数;C DBG 为与当前D-model中的DG的SKU和DBG的SKU序列均相同的所有D-model对应订单的下单次数;C S-DBG 为与当前D-model中的DG的SKU和S-DBG的SKU序列均相同的所有D-model对应订单的下单次数。
接下来,计算DG驱动DBG的概率值P m ,公式表示为:
Figure 186821DEST_PATH_IMAGE009
式中,k 1 为与当前D-model中的DGDBG中的SKU序列相同的D-model的总数量;t e k 1 个相同的D-model中,对应订单的最晚的下单时间;t s k 1 个相同的D-model中,对应订单的最早的下单时间;t为当前D-model对应订单的下单时间,时间单位为天。
进一步的,计算DG驱动S-DBG的概率值P S ,公式表示为:
Figure 86644DEST_PATH_IMAGE010
具体的,DBG驱动S-DBG的概率值P a 根据P m P s 的大小确定,公式表示为:
Figure 652754DEST_PATH_IMAGE011
P s P m P a 计算完成后,直接操作该D-model类实例对象,实现数值更新。
重复上述步骤,直至所有驱动概率计算待处理池的D-model的P s P m P a 完成更新。进一步的,重新引用驱动概率计算完成池到驱动概率计算待处理池的对象,避免引起混乱。
接下来进行驱动链图生成步骤,具体如下:
创建新的图数据结构,初始状态为0个节点、0条关系。随机选取一个D-model作为一个节点,加入到图数据结构。
遍历另一D-model中DBG与S-DBG中的SKU序列,将其与选定的D-model中DG中的SKU进行比对,若存在相同SKU,则将存在相同SKU的DBG和S-DBG连接选定的D-model中的DG,并建立dRel-m、dRel-s或dRel-a关联关系,即修改该D-model种链表数据类实例中的指向关系。
同时将计算所得的P m 作为关联关系dRel-m的权值,P s 作为关联关系dRel-s的权值,P a 则作为关联关系dRel-a的权值,即修改该D-model中链表数据类实例中的驱动概率P成员变量。优选的,除第一个选取的D-model以外,其余D-model的DG均只能被连接。
选取下一个D-model,重复上述操作,直至所有D-model的DBGS-DBG均完成比对。
参阅图3所示,该图示出了一个最小规模的链图结果逻辑:当DBG与S-DBG的某个SKU出现与其它D-model中DG的SKU相同时的连接结果逻辑示意图,以下进行具体说明:
随机选择选定一个D-model为当前D-model;同时扫描其它D-model的DG,当发现S-DBG中的SKU序列与某个D-model中的DG的SKU相同时(如均为20200911),该SKU(如实例为SKUb)与该新D-model的DG进行连接;
类似的,当发现DBG中的SKU序列与某个D-model中的DG的SKU相同时(如均为20200323),该SKU(如实例为SKU3)与该新D-model的DG进行连接。
通过上述步骤即获得一个由三个D-model连接组成的最小规模驱动链图。
综上所述,通过本发明提供的方法生成的驱动链图,可表明一个主驱动商品与其它n组商品集合在不同的动态组合条件下的影响关系,具体可支撑销售采购人员更具体地进行库存满足程度以及缺口分析;驱动关系匹配模型D-model根据建筑施工时不同类型的用品的下单规律生成,有更强的行业针对性,可以更加直观的反应所有类别的建筑用品的影响关系,可为建筑用品库存需求的可视化提供数据基础;驱动链图以SKU为建筑用品分析唯一标识,可为订单发起客户的用户画像提供新的分析维度。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种大数据建筑用品驱动链图生成方法,其特征在于,包括如下步骤:
S1.根据获取的订单中各建筑用品之间的下单规律进行驱动关系挖掘,生成建筑用品驱动关系基础数据并建立驱动关系的结构模型;其中,驱动关系用以反应各建筑用品之间的影响关系;具体包括:
S11.根据建筑用品的下单规律,创建驱动关系的结构模型,其中驱动关系的结构模型的数据结构包括:主驱动商品类结构DG;被驱动商品集类结构DBG;次要被驱动商品集类结构S-DBGDGDBG之间的主驱动关系dRel-m;DGS-DBG之间的次驱动关系dRel-s;DBGS- DBG之间的辅驱动关系dRel-a;
S2.对驱动关系的内部结构进行识别确定驱动关系的核心对象以及其它对象,将核心对象以及其它对象输入驱动关系的结构模型对应的类结构中建立驱动关系匹配模型D-model;
S3.基于下单规律中各对象的参数关系计算核心对象与其它对象之间的驱动概率值以及其它对象之间的驱动概率值;其中,驱动概率值指在驱动对象确定时,被驱动对象出现的概率;具体包括如下步骤:
S31.计算DG驱动DBG的概率值P m ,公式表示为:
Figure 49335DEST_PATH_IMAGE001
上式中,k 1 为与当前D-model中的DGDBG中的SKU序列相同的D-model的总数量,SKU指对应订单中的总建筑用品的类别;t e k 1 个相同的D-model中,对应订单的最晚的下单时间;t s k 1 个相同的D-model中,对应订单的最早的下单时间;t为当前D-model对应订单的下单时间;C DG 为与当前D-model中的DG相同的所有D-model对应订单的下单次数;C DBG 为与当前D-model中的DG的SKU和DBG的SKU序列均相同的所有D-model对应订单的下单次数;
S32.计算DG驱动S-DBG的概率值P S ,公式表示为:
Figure 583085DEST_PATH_IMAGE002
上式中,C S-DBG 为与当前D-model中的DG的SKU和S-DBG的SKU序列均相同的所有D-model对应订单的下单次数;
S33.DBG驱动S-DBG的概率值P a 根据P m P s 的大小确定,公式表示为:
Figure 512995DEST_PATH_IMAGE003
S4.选定一个D-model,将其它D-model中的其它对象与该D-model中的核心对象进行比对,当相同时,通过修改D-model类结构的指向关系将该其它对象和核心对象对应的类结构进行连接,结合步骤S3算得的驱动概率值对应作为关联关系的权值生成驱动链图,具体包括如下步骤:
S41.选定一个D-model,遍历另一D-model中DBG与S-DBG中的SKU序列,将其与选定的D-model中DG中的SKU进行比对,若存在相同SKU,则将存在相同SKU的DBG和S-DBG连接选定的D-model中的DG,并建立dRel-m、dRel-s或dRel-a关联关系;
其中,将计算所得的P m 作为关联关系dRel-m的权值,P s 作为关联关系dRel-s的权值,P a 则作为关联关系dRel-a的权值;
S42.重复上述步骤,直至所有的D-model均完成比对。
2.如权利要求1所述的大数据建筑用品驱动链图生成方法,其特征在于,步骤S1进一步包括如下步骤:
S12.对获取的订单进行分析计算综合误差之和,生成对应到每个订单的驱动关系基础数据,综合误差之和计算公式为:
Figure 614943DEST_PATH_IMAGE004
(1)
式(1)中,在B小于预设阈值时,该订单符合驱动关系基础数据要求;m为该订单中的总建筑用品的类别数SKU的数量;k为该订单中当前SKU的排序,其中k的取值范围为[1,m];C为当前SKU的采购数;P为单价;
Figure 387727DEST_PATH_IMAGE005
为下单时间差比值;A为该SKU所属的材料大类,不同的材料大类对应不同的值。
3.如权利要求2所述的大数据建筑用品驱动链图生成方法,其特征在于,步骤S12中的
Figure 69375DEST_PATH_IMAGE005
通过以下方法算得:
k=1时,
Figure 244004DEST_PATH_IMAGE005
为1.0;当k=m时,
Figure 976906DEST_PATH_IMAGE005
为2.0;当k为其它值时,
Figure 236986DEST_PATH_IMAGE005
通过如下公式算得,公式表示为:
Figure 987905DEST_PATH_IMAGE006
(2)
式(2)中,T 1为第一个SKU下单时间,T m 为最后一个SKU下单时间,T k 为当下所计算的SKU下单时间。
4.如权利要求2或3所述的大数据建筑用品驱动链图生成方法,其特征在于,步骤S2进一步包括如下步骤:
S21.对订单中所有的SKU的影响值I进行计算,将最大影响值的SKU作为驱动关系核心对象,将驱动关系核心对象划入主驱动商品DG,其中计算影响值I的公式表示为:
Figure 17041DEST_PATH_IMAGE007
(3)
S22.将驱动关系核心对象排除,剩余的m-1个SKU作为其它对象;
S23.重复以上步骤,直至所有订单被处理并形成D-model。
5.如权利要求4所述的大数据建筑用品驱动链图生成方法,其特征在于,步骤S22还包括:
S221.通过对剩余的m-1个SKU的次级影响值DS进行计算,确定其它对象中的被驱动对象,公式表示为:
Figure 195212DEST_PATH_IMAGE008
(4)
S222.对计算所得的DS按值的大小降序排序逐个累加剩余的DS,当累加值恰好大于
Figure 677009DEST_PATH_IMAGE009
时,将参与累加的次级影响值对应的SKU划入被驱动商品集DBG,其中D total 为剩余的m-1个SKU的次级影响值之和;
S223.若还有剩余SKU,全部划入次要被驱动商品集S-DBG
6.如权利要求1所述的大数据建筑用品驱动链图生成方法,其特征在于,步骤S41中该D-model与另一D-model之间建立dRel-m、dRel-s和dRel-a关联关系,具体为:
根据dRel-m、dRel-s和dRel-a关联关系,修改该D-model中类结构的指向关系;
步骤S41中将计算所得的P m 作为关联关系dRel-m的权值,P s 作为关联关系dRel-s的权值,P a 则作为关联关系dRel-a的权值,具体为:
根据P m P s P a 修改该D-model中类结构数据类实例中驱动概率成员变量。
7.如权利要求1所述的大数据建筑用品驱动链图生成方法,其特征在于,步骤S1之前还包括如下步骤:
订单批次合并,将预设时间范围内同一客户的零散订单进行合并,生成包括多种SKU的复合订单;
无效订单剔除,对合并后SKU数量为1的复合订单进行剔除,剩余订单作为有效订单;
根据订单的下单时间对有效订单进行排序。
8.如权利要求2所述的大数据建筑用品驱动链图生成方法,其特征在于,步骤S12中的材料大类包括主材类、辅材类以及工具类,其中,主材类的A值大于辅材类的A值大于工具类的A值。
CN202110306025.4A 2021-03-23 2021-03-23 一种大数据建筑用品驱动链图生成方法 Active CN112699174B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110306025.4A CN112699174B (zh) 2021-03-23 2021-03-23 一种大数据建筑用品驱动链图生成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110306025.4A CN112699174B (zh) 2021-03-23 2021-03-23 一种大数据建筑用品驱动链图生成方法

Publications (2)

Publication Number Publication Date
CN112699174A CN112699174A (zh) 2021-04-23
CN112699174B true CN112699174B (zh) 2021-08-17

Family

ID=75515423

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110306025.4A Active CN112699174B (zh) 2021-03-23 2021-03-23 一种大数据建筑用品驱动链图生成方法

Country Status (1)

Country Link
CN (1) CN112699174B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113077390B (zh) * 2021-06-04 2021-09-14 中建电子商务有限责任公司 一种基于深度学习的图像摆正方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108564244A (zh) * 2018-02-26 2018-09-21 新智数字科技有限公司 订单处理方法、装置、设备和半导体可读存储介质
CN111047009A (zh) * 2019-11-21 2020-04-21 腾讯科技(深圳)有限公司 事件触发概率预估模型训练方法及事件触发概率预估方法
CN112365295A (zh) * 2020-12-01 2021-02-12 杭州拼便宜网络科技有限公司 一种下单概率预测方法、装置、设备及可读存储介质

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8630890B2 (en) * 2008-12-03 2014-01-14 At&T Intellectual Property I, L.P. Product migration analysis using data mining by applying a time-series mathematical model
CN102663594A (zh) * 2012-03-31 2012-09-12 浙江工商大学 电子商务目录分销***
CN103700005B (zh) * 2013-12-17 2016-08-31 南京信息工程大学 一种基于自适应多最小支持度的关联规则推荐方法
CN105701681A (zh) * 2016-01-06 2016-06-22 北京京东尚科信息技术有限公司 用于预测订单量的方法和设备
CN106446943B (zh) * 2016-09-19 2019-07-30 大连海事大学 一种商品关联大数据稀疏网络快速聚类方法
CN106649714B (zh) * 2016-12-21 2020-08-04 重庆邮电大学 针对数据不均匀及数据稀疏的topN推荐***及方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108564244A (zh) * 2018-02-26 2018-09-21 新智数字科技有限公司 订单处理方法、装置、设备和半导体可读存储介质
CN111047009A (zh) * 2019-11-21 2020-04-21 腾讯科技(深圳)有限公司 事件触发概率预估模型训练方法及事件触发概率预估方法
CN112365295A (zh) * 2020-12-01 2021-02-12 杭州拼便宜网络科技有限公司 一种下单概率预测方法、装置、设备及可读存储介质

Also Published As

Publication number Publication date
CN112699174A (zh) 2021-04-23

Similar Documents

Publication Publication Date Title
US20220366268A1 (en) Progressive Objective Addition in Multi-objective Heuristic Systems and Methods
Rouyendegh et al. Supplier selection using integrated fuzzy TOPSIS and MCGP: a case study
US10387779B2 (en) Systems and methods for multi-objective evolutionary algorithms with soft constraints
CN103678447B (zh) 多变量交易分类
Pervin et al. An integrated inventory model with variable holding cost under two levels of trade-credit policy
EP1388104A2 (en) Assortment decisions
US7398227B2 (en) Methods, systems, and computer for managing purchasing data
CN103903148A (zh) C2c***、b2c***及其使用方法
CN112699174B (zh) 一种大数据建筑用品驱动链图生成方法
CN111080396A (zh) 一种基于竞对商品的商品定价方法、装置及存储介质
Rohaninejad et al. Multi-level lot-sizing and job shop scheduling with lot-streaming: Reformulation and solution approaches
CN111275294B (zh) 一种商品信息批量处理分析方法、装置和设备
CN102254240A (zh) 数据对象替代装置和数据对象替代方法
Patil et al. Fuzzy TOPSIS and grey relation analysis integration for supplier selection in fiber industry
TW202141386A (zh) 消費數據處理方法與系統
JP5018313B2 (ja) 情報構造化装置、情報構造化方法、及びプログラム
CN102567826A (zh) 处理物料单据的方法和***
Widyadana et al. Production inventory models for deteriorating items with stochastic machine unavailability time, lost sales and price-dependent demand
Sadeghi et al. An EPQ model for deteriorating products with delayed payments and shortage
Schuh et al. Data-based Approach for Reducing Process Complexity in Parts Manufacturing
Nikitin et al. Shopping Basket Analisys for Mining Equipment: Comparison and Evaluation of Modern Methods
CN116993461B (zh) 一种基于eshop的企业集群商业管理***及管理方法
US20090299879A1 (en) Catalog Builder with an Expert System
Elanchezhian et al. Vendor selection using analytical hierarchy process in supply chain management
US20230368230A1 (en) Incremental value assessment tool and user interface

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant