CN111882157A - 一种基于深度时空神经网络的需求预测方法、***及计算机可读存储介质 - Google Patents
一种基于深度时空神经网络的需求预测方法、***及计算机可读存储介质 Download PDFInfo
- Publication number
- CN111882157A CN111882157A CN202010586879.8A CN202010586879A CN111882157A CN 111882157 A CN111882157 A CN 111882157A CN 202010586879 A CN202010586879 A CN 202010586879A CN 111882157 A CN111882157 A CN 111882157A
- Authority
- CN
- China
- Prior art keywords
- demand
- data
- sequence data
- demand sequence
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 43
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000012549 training Methods 0.000 claims abstract description 38
- 230000001364 causal effect Effects 0.000 claims abstract description 27
- 238000007781 pre-processing Methods 0.000 claims abstract description 24
- 230000007246 mechanism Effects 0.000 claims abstract description 11
- 230000006870 function Effects 0.000 claims description 47
- 230000000977 initiatory effect Effects 0.000 claims description 13
- 238000012360 testing method Methods 0.000 claims description 12
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 5
- 238000004422 calculation algorithm Methods 0.000 claims description 5
- 230000000694 effects Effects 0.000 claims description 5
- 239000011159 matrix material Substances 0.000 claims description 5
- 238000013277 forecasting method Methods 0.000 claims 5
- 238000003062 neural network model Methods 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 6
- 210000002569 neuron Anatomy 0.000 description 6
- 230000004913 activation Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 238000010606 normalization Methods 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 4
- 238000004088 simulation Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000002203 pretreatment Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013278 delphi method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06315—Needs-based resource requirements planning or analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/04—Manufacturing
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- Development Economics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Tourism & Hospitality (AREA)
- General Health & Medical Sciences (AREA)
- Game Theory and Decision Science (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Educational Administration (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Manufacturing & Machinery (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
为了对未来的需求进行更好的预测,本发明公开了一种基于深度时空神经网络的需求预测方法,包括以下步骤:采集历史订单的需求序列数据,对采集历史订单的需求序列数据进行预处理,得到预处理后的历史订单的需求序列数据;基于预处理后的历史订单的需求序列数据构建数据集;搭建基于注意力机制和因果扩展卷积的神经网络的需求序列预测模型;利用数据集对需求序列预测模型进行训练,得到训练后的需求序列预测模;通过预处理后的历史订单的需求序列数据,结合训练后的需求序列预测模,得到未来的需求预测结果。本发明还公开了一种基于深度时空神经网络的需求预测***,以及对应存储有需求预测方法和/或需求预测***的计算机可读存储介质。
Description
技术领域
本发明涉及信息预测领域,更具体地,涉及一种基于深度时空神经网络的需求预测方法、***及计算机可读存储介质。
背景技术
制造业供应风险的影响因素识别及供应风险的管理和控制成为了提升制造效率的关键。其中,制造供应链需求信息的预测是研究中的一个关键点,因为准确的预测能够有效避免牛鞭效应。显然,供应链的递归效应决定了应当先预测下游的需求信息,然后根据需求产生相应订单,最后根据订单信息才能制定生产决策,并为库存管理提供依据.所以精准的需求预测可以控制库存成本,缩减供应提前期,同时降低断货、缺货的风险。
现有的预测方法主要包括定性法、因果关系法、仿真法和时间序列法。
定性方法主要依赖于人的主观判断,适用于只能获得很少的历史数据或专家的意见十分重要的场合,适用场景有限。主要有集体讨论法、类比法、市场研究法、德尔菲法。
因果关系法假定需求预测与某些外界因素(如经济状况、利率)等高度相关,找到这些外界因素与需求之间的关联性,通过预测外界因素的变化来预测需求。
仿真法通过建立仿真模型,通过仿真模型模拟需求方来预测需求。
时间序列数据法利用相关的预测模型,以历史数据作为输入,基于历史观察数据来预测未来的需求。如何找到并描述时间序列数据的变化规律,建立相应的预测模型从而降低模型的预测误差对时间序列数据预测至关重要。
发明内容
本发明克服了上述现有的技术不足,提供一种基于深度时空神经网络的需求预测方法、***及计算机可读存储介质。本发明结合实际需求数据突发性较强和时空依赖的特点进行模型训练和定量预测,其可以显著提高需求预测的精度。
为解决上述技术问题,本发明的技术方案如下:
一种基于深度时空神经网络的需求预测方法,包括以下步骤:
采集历史订单的需求序列数据,对采集历史订单的需求序列数据进行预处理,得到预处理后的历史订单的需求序列数据;
基于预处理后的历史订单的需求序列数据构建数据集,所述的数据集包括输入需求序列数据和预测结果序列数据;并数据集划分为训练数据子集和测试数据子集;所述的输入需求序列数据包括预处理后的历史订单的需求序列数据;
搭建基于注意力机制和因果扩展卷积的神经网络的需求序列预测模型;
利用数据集对需求序列预测模型进行训练,得到训练后的需求序列预测模型;
通过预处理后的历史订单的需求序列数据,结合训练后的需求序列预测模型,得到未来的需求预测结果。
本发明中通过基于因果扩展卷积的神经网络模型实现对供应链需求的预测功能,有效的提高了预测准确性,并且当数据样本差异性较大时,基于因果扩展卷积的神经网络模型的优势更加显著。
在一种优选的方案中,所述的预处理包括以下子步骤:
对采集历史订单的需求序列数据中存在缺失信息的需求序列数据和存在错误的需求序列数据进行删除;
若时间节点缺乏对应的需求序列数据,则以上述时间节点周围的时间节点的同类需求的平均值进行填充到上述时间节点中。
在一种优选的方案中,所述的数据集包括以下内容:
预处理后的历史订单的需求序列数据采用滑动窗口方法,通过选择一个需求序列数据为一个周期进行滑窗,从而构建多个训练窗口,扩大训练集数量;最后的a个需求序列数据作为预测结果序列数据,剩余的需求序列数据作为输入需求序列数据;所述的a是预设值;
将数据集中x的需求序列数据作为训练数据子集,将数据集中y的需求序列数据作为测试数据子集,所述的p+q=1。
在一种优选的方案中,所述的p=0.8。
在一种优选的方案中,所述的“搭建基于注意力机制和因果扩展卷积的神经网络的需求序列预测模型”中的需求序列预测模型包括以下内容:
需求序列预测模型的时空层包括β个inception模块,每个inception模块包含γ个分支,每个分支都包含因果卷积和扩展卷积。
本优选方案中,通过inception神经网络模块作为神经网络对数据进行训练,不仅灵活性高,且具备可移植性。
在一种优选的方案中,所述的β的取值范围是[3,7]。
在一种优选的方案中,所述的γ=5。
在一种优选的方案中,所述的“利用数据集对需求序列预测模型进行训练”包括以下内容:
inception模块的隐藏单元的输出值通过下式进行表达:
y=w·x+b
式中,所述的y表示输出值,所述的x表示输入值,所述的w表示权重值的矩阵,所述的b表示偏置值向量;
对输入数据进行训练时,通过损失函数评估需求序列预测模型的目标输出和实际输出的差距的函数,所述的函数值越小说明实际输出与目标输出的差值越小,表示权重值越合适;
通过Adam算法对损失函数进行优化,定义初始学习率δ,对损失函数进行迭代更新。
在一种优选的方案中,所述的损失函数通过下式进行表达:
式中,所述的Loss表示损失值;所述的y_result表示每次神经网络的输出值;所述的y_real表示实际的原始数据;所述的i表示输入的第i个需求序列数据;所述的n表示输入的需求序列数据的数量。
本优选方案中,将神经元的输出值y_result减去真实值y_real,再进行平方,最后使用计算平均计算得到方差;得到的方差也就是损失函数的损失值。
在一种优选的方案中,所述的δ=0.001。
本发明还公开了一种基于深度时空神经网络的需求预测***,包括采集模块、预处理模块、数据集模块、建模模块和预测模块,其中,
所述的采集模块用于采集历史订单的需求序列数据;
所述的预处理模块用于将采集模块的历史订单的需求序列数据进行预处理,得到预处理后的历史订单的需求序列数据;
所述的数据集模块通过预处理模块的预处理后的历史订单的需求序列数据构建数据集,所述的数据集包括输入需求序列数据和预测结果序列数据;并数据集划分为训练数据子集和测试数据子集;所述的输入需求序列数据包括预处理后的历史订单的需求序列数据;
所述的建模模块用于构建基于注意力机制和因果扩展卷积的神经网络的需求序列预测模型;再通过数据集模块的数据集对需求序列预测模型进行训练,得到训练后的需求序列预测模型;
所述的预测模块根据建模模块的训练后的需求序列预测模型,结合预处理模块的预处理后的历史订单的需求序列数据,得到未来的需求预测结果。
本发明中通过基于因果扩展卷积的神经网络模型实现对供应链需求的预测功能,有效的提高了预测准确性,并且当数据样本差异性较大时,基于因果扩展卷积的神经网络模型的优势更加显著。
在一种优选的方案中,所述的预处理模块包括以下功能:
对采集历史订单的需求序列数据中存在缺失信息的需求序列数据和存在错误的需求序列数据进行删除;
若时间节点缺乏对应的需求序列数据,则以上述时间节点周围的时间节点的同类需求的平均值进行填充到上述时间节点中。
在一种优选的方案中,所述的数据集模块包括以下功能:
预处理后的历史订单的需求序列数据采用滑动窗口方法,通过选择一个需求序列数据为一个周期进行滑窗,从而构建多个训练窗口,扩大训练集数量;最后的a个需求序列数据作为预测结果序列数据,剩余的需求序列数据作为输入需求序列数据;所述的a是预设值;
将数据集中x的需求序列数据作为训练数据子集,将数据集中y的需求序列数据作为测试数据子集,所述的p+q=1。
在一种优选的方案中,所述的p=0.8。
在一种优选的方案中,所述的建模模块的需求序列预测模型包括以下内容:
需求序列预测模型的时空层包括β个inception模块,每个inception模块包含γ个分支,每个分支都包含因果卷积和扩展卷积。
在一种优选的方案中,所述的β的取值范围是[3,7]。
本优选方案中,通过inception神经网络模块作为神经网络对数据进行训练,不仅灵活性高,且具备可移植性。
在一种优选的方案中,所述的γ=5。
在一种优选的方案中,所述的建模模块中的中的训练包括以下内容:
inception模块的隐藏单元的输出值通过下式进行表达:
y=w·x+b
式中,所述的y表示输出值,所述的x表示输入值,所述的w表示权重值的矩阵,所述的b表示偏置值向量;
对输入数据进行训练时,通过损失函数评估需求序列预测模型的目标输出和实际输出的差距的函数,所述的函数值越小说明实际输出与目标输出的差值越小,表示权重值越合适;
通过Adam算法对损失函数进行优化,定义初始学习率δ,对损失函数进行迭代更新。
在一种优选的方案中,所述的损失函数通过下式进行表达:
式中,所述的Loss表示损失值;所述的y_result表示每次神经网络的输出值;所述的y_real表示实际的原始数据;所述的i表示输入的第i个需求序列数据;所述的n表示输入的需求序列数据的数量。
本优选方案中,将神经元的输出值y_result减去真实值y_real,再进行平方,最后使用计算平均计算得到方差;得到的方差也就是损失函数的损失值。
本优选方案中,将神经元的输出值y_result减去真实值y_real,再进行平方,最后使用计算平均计算得到方差;得到的方差也就是损失函数的损失值。
在一种优选的方案中,所述的δ=0.001。
本发明还公开了一种计算机可读存储介质,存储有一种基于深度时空神经网络的需求预测方法和/或一种基于深度时空神经网络的需求预测***。
与现有技术相比,本发明技术方案的有益效果是:
本发明中通过基于因果扩展卷积的神经网络模型实现对供应链需求的预测功能,有效的提高了预测准确性,并且当数据样本差异性较大时,基于因果扩展卷积的神经网络模型的优势更加显著。
附图说明
图1为实施例的流程图。
图2为实施例的基于注意力机制和因果扩展卷积的神经网络的需求序列预测模型图。
图3为实施例的Inception模块图。
图4为需求序列数据示意图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;
对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
下面结合附图和实施例对本发明的技术方案做进一步的说明。
实施例
如图1所示,一种基于深度时空神经网络的需求预测方法,包括以下步骤:
采集历史订单的需求序列数据(如图4所示),对采集历史订单的需求序列数据进行预处理,得到预处理后的历史订单的需求序列数据;
基于预处理后的历史订单的需求序列数据构建数据集,数据集包括输入需求序列数据和预测结果序列数据;并数据集划分为训练数据子集和测试数据子集;输入需求序列数据包括预处理后的历史订单的需求序列数据;
搭建基于注意力机制和因果扩展卷积的神经网络的需求序列预测模型;
利用数据集对需求序列预测模型进行训练,得到训练后的需求序列预测模型;
通过预处理后的历史订单的需求序列数据,结合训练后的需求序列预测模型,得到未来的需求预测结果。
本实施例中通过基于因果扩展卷积的神经网络模型实现对供应链需求的预测功能,有效的提高了预测准确性,并且当数据样本差异性较大时,基于因果扩展卷积的神经网络模型的优势更加显著。
在实施例中,还可以进行以下扩展:预处理包括以下子步骤:
对采集历史订单的需求序列数据中存在缺失信息的需求序列数据和存在错误的需求序列数据进行删除;
若时间节点缺乏对应的需求序列数据,则以上述时间节点周围的时间节点的同类需求的平均值进行填充到上述时间节点中。
在实施例及上述改进实施例中,还可以进行以下扩展:数据集包括以下内容:
预处理后的历史订单的需求序列数据采用滑动窗口方法,通过选择一个需求序列数据为一个周期进行滑窗,从而构建多个训练窗口,扩大训练集数量;最后的a个需求序列数据作为预测结果序列数据,剩余的需求序列数据作为输入需求序列数据;a是预设值;
将数据集中x的需求序列数据作为训练数据子集,将数据集中y的需求序列数据作为测试数据子集,p+q=1。
在实施例及上述改进实施例中,还可以进行以下扩展:a的取值范围是[6,16]。
在实施例及上述改进实施例中,还可以进行以下扩展:p=0.8。
在实施例及上述改进实施例中,还可以进行以下扩展:“搭建基于注意力机制和因果扩展卷积的神经网络的需求序列预测模型”中的需求序列预测模型包括以下内容:
需求序列预测模型的时空层(如图2所示)包括β个inception模块,每个inception模块包含γ个分支,每个分支都包含因果卷积和扩展卷积。
本扩展实施例中,通过inception神经网络模块作为神经网络对数据进行训练,不仅灵活性高,且具备可移植性。
在实施例及上述改进实施例中,还可以进行以下扩展:γ=5,其中,
每个Inception模块包含5个因果和扩展卷积的分支,在分支前和分支后将多个数据矩阵按深度链接起来,参见图3。
5个因果和扩展卷积的分支具体包括:
分支4采用1*1的卷积核,按照扩张率1进行卷积;再进行采用1*2的卷积核,按照扩张率2进行卷积;第三次进行采用1*2的卷积核,按照扩张率2进行卷积;第四次进行采用1*2的卷积核,按照扩张率2进行卷积;通道数为256,加上批归一化层和ReLU激活层。
在实施例及上述改进实施例中,还可以进行以下扩展:β的取值范围是[3,7]。
在实施例及上述改进实施例中,还可以进行以下扩展:γ=5。
在实施例及上述改进实施例中,还可以进行以下扩展:“利用数据集对需求序列预测模型进行训练”包括以下内容:
inception模块的隐藏单元的输出值通过下式进行表达:
y=w·x+b
式中,y表示输出值,x表示输入值,w表示权重值的矩阵,b表示偏置值向量;
对输入数据进行训练时,通过损失函数评估需求序列预测模型的目标输出和实际输出的差距的函数,函数值越小说明实际输出与目标输出的差值越小,表示权重值越合适;
通过Adam算法对损失函数进行优化,定义初始学习率δ,对损失函数进行迭代更新。
在实施例及上述改进实施例中,还可以进行以下扩展:损失函数通过下式进行表达:
式中,Loss表示损失值;y_result表示每次神经网络的输出值;y_real表示实际的原始数据;i表示输入的第i个需求序列数据;n表示输入的需求序列数据的数量。
本改进方案中,将神经元的输出值y_result减去真实值y_real,再进行平方,最后使用计算平均计算得到方差;得到的方差也就是损失函数的损失值。
在实施例及上述改进实施例中,还可以进行以下扩展:δ=0.001。
本优选法方案中,初始学习率为0.001,迭代1000回合,每隔50回合,学习率变为原来的0.1倍。训练完毕后寻找损失最小的模型作为特征生成器模型,从而得到神经网络的模型参数。
一种基于深度时空神经网络的需求预测***,包括采集模块、预处理模块、数据集模块、建模模块和预测模块,其中,
采集模块用于采集历史订单的需求序列数据;
预处理模块用于将采集模块的历史订单的需求序列数据进行预处理,得到预处理后的历史订单的需求序列数据;
数据集模块通过预处理模块的预处理后的历史订单的需求序列数据构建数据集,数据集包括输入需求序列数据和预测结果序列数据;并数据集划分为训练数据子集和测试数据子集;输入需求序列数据包括预处理后的历史订单的需求序列数据;
建模模块用于构建基于注意力机制和因果扩展卷积的神经网络的需求序列预测模型;再通过数据集模块的数据集对需求序列预测模型进行训练,得到训练后的需求序列预测模型;
预测模块根据建模模块的训练后的需求序列预测模型,结合预处理模块的预处理后的历史订单的需求序列数据,得到未来的需求预测结果。
本发明中通过基于因果扩展卷积的神经网络模型实现对供应链需求的预测功能,有效的提高了预测准确性,并且当数据样本差异性较大时,基于因果扩展卷积的神经网络模型的优势更加显著。
在实施例中,还可以进行以下扩展:预处理模块包括以下功能:
对采集历史订单的需求序列数据中存在缺失信息的需求序列数据和存在错误的需求序列数据进行删除;
若时间节点缺乏对应的需求序列数据,则以上述时间节点周围的时间节点的同类需求的平均值进行填充到上述时间节点中。
在实施例及上述改进实施例中,还可以进行以下扩展:数据集模块包括以下功能:
预处理后的历史订单的需求序列数据采用滑动窗口方法,通过选择一个需求序列数据为一个周期进行滑窗,从而构建多个训练窗口,扩大训练集数量;最后的a个需求序列数据作为预测结果序列数据,剩余的需求序列数据作为输入需求序列数据;a是预设值;
将数据集中x的需求序列数据作为训练数据子集,将数据集中y的需求序列数据作为测试数据子集,p+q=1。
在实施例及上述改进实施例中,还可以进行以下扩展:a的取值范围是[6,16]。
在实施例及上述改进实施例中,还可以进行以下扩展:p=0.8。
在实施例及上述改进实施例中,还可以进行以下扩展:建模模块的需求序列预测模型包括以下内容:
需求序列预测模型的时空层包括β个inception模块,每个inception模块包含γ个分支,每个分支都包含因果卷积和扩展卷积。
在实施例及上述改进实施例中,还可以进行以下扩展:β的取值范围是[3,7]。
本优选方案中,通过inception神经网络模块作为神经网络对数据进行训练,
不仅灵活性高,且具备可移植性。
在实施例及上述改进实施例中,还可以进行以下扩展:γ=5。
在实施例及上述改进实施例中,还可以进行以下扩展:建模模块中的中的训练包括以下内容:
inception模块的隐藏单元的输出值通过下式进行表达:
y=w·x+b
式中,y表示输出值,x表示输入值,w表示权重值的矩阵,b表示偏置值向量;
对输入数据进行训练时,通过损失函数评估需求序列预测模型的目标输出和实际输出的差距的函数,函数值越小说明实际输出与目标输出的差值越小,表示权重值越合适;
通过Adam算法对损失函数进行优化,定义初始学习率δ,对损失函数进行迭代更新。
在实施例及上述改进实施例中,还可以进行以下扩展:损失函数通过下式进行表达:
式中,Loss表示损失值;y_result表示每次神经网络的输出值;y_real表示实际的原始数据;i表示输入的第i个需求序列数据;n表示输入的需求序列数据的数量。
本优选方案中,将神经元的输出值y_result减去真实值y_real,再进行平方,最后使用计算平均计算得到方差;得到的方差也就是损失函数的损失值。
本优选方案中,将神经元的输出值y_result减去真实值y_real,再进行平方,最后使用计算平均计算得到方差;得到的方差也就是损失函数的损失值。
在实施例及上述改进实施例中,还可以进行以下扩展:δ=0.001。
在上述具体实施方式的具体内容中,各技术特征可以进行任意不矛盾的组合,为使描述简洁,未对上述各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
相同或相似的标号对应相同或相似的部件;
附图中描述位置关系的用语仅用于示例性说明,不能理解为对本专利的限制;
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
Claims (10)
1.一种基于深度时空神经网络的需求预测方法,其特征在于,包括以下步骤:
采集历史订单的需求序列数据,对采集历史订单的需求序列数据进行预处理,得到预处理后的历史订单的需求序列数据;
基于预处理后的历史订单的需求序列数据构建数据集,所述的数据集包括输入需求序列数据和预测结果序列数据;并数据集划分为训练数据子集和测试数据子集;所述的输入需求序列数据包括预处理后的历史订单的需求序列数据;
搭建基于注意力机制和因果扩展卷积的神经网络的需求序列预测模型;
利用数据集对需求序列预测模型进行训练,得到训练后的需求序列预测模型;
通过预处理后的历史订单的需求序列数据,结合训练后的需求序列预测模型,得到未来的需求预测结果。
2.根据权利要求1所述的需求预测方法,其特征在于,所述的预处理包括以下子步骤:
对采集历史订单的需求序列数据中存在缺失信息的需求序列数据和存在错误的需求序列数据进行删除;
若时间节点缺乏对应的需求序列数据,则以上述时间节点周围的时间节点的同类需求的平均值进行填充到上述时间节点中。
3.根据权利要求1所述的需求预测方法,其特征在于,所述的数据集包括以下内容:
预处理后的历史订单的需求序列数据采用滑动窗口方法,通过选择一个需求序列数据为一个周期进行滑窗,从而构建多个训练窗口,扩大训练集数量;最后的a个需求序列数据作为预测结果序列数据,剩余的需求序列数据作为输入需求序列数据;所述的a是预设值;
将数据集中x的需求序列数据作为训练数据子集,将数据集中y的需求序列数据作为测试数据子集,所述的p+q=1。
4.根据权利要求1至3中任一权利要求所述的需求预测方法,其特征在于,所述的“搭建基于注意力机制和因果扩展卷积的神经网络的需求序列预测模型”中的需求序列预测模型包括以下内容:
需求序列预测模型的时空层包括β个inception模块,每个inception模块包含γ个分支,每个分支都包含因果卷积和扩展卷积。
5.根据权利要求4所述的需求预测方法,其特征在于,所述的“利用数据集对需求序列预测模型进行训练”包括以下内容:
inception模块的隐藏单元的输出值通过下式进行表达:
y=w·x+b
式中,所述的y表示输出值,所述的x表示输入值,所述的w表示权重值的矩阵,所述的b表示偏置值向量;
对输入数据进行训练时,通过损失函数评估需求序列预测模型的目标输出和实际输出的差距的函数,所述的函数值越小说明实际输出与目标输出的差值越小,表示权重值越合适;
通过Adam算法对损失函数进行优化,定义初始学习率δ,对损失函数进行迭代更新。
7.一种基于深度时空神经网络的需求预测***,其特征在于,包括采集模块、预处理模块、数据集模块、建模模块和预测模块,其中,
所述的采集模块用于采集历史订单的需求序列数据;
所述的预处理模块用于将采集模块的历史订单的需求序列数据进行预处理,得到预处理后的历史订单的需求序列数据;
所述的数据集模块通过预处理模块的预处理后的历史订单的需求序列数据构建数据集,所述的数据集包括输入需求序列数据和预测结果序列数据;并数据集划分为训练数据子集和测试数据子集;所述的输入需求序列数据包括预处理后的历史订单的需求序列数据;
所述的建模模块用于构建基于注意力机制和因果扩展卷积的神经网络的需求序列预测模型;再通过数据集模块的数据集对需求序列预测模型进行训练,得到训练后的需求序列预测模型;
所述的预测模块根据建模模块的训练后的需求序列预测模型,结合预处理模块的预处理后的历史订单的需求序列数据,得到未来的需求预测结果。
8.根据权利要求7所述的需求预测***,其特征在于,所述的预处理模块包括以下功能:
对采集历史订单的需求序列数据中存在缺失信息的需求序列数据和存在错误的需求序列数据进行删除;
若时间节点缺乏对应的需求序列数据,则以上述时间节点周围的时间节点的同类需求的平均值进行填充到上述时间节点中。
9.根据权利要求7或8所述的需求预测***,其特征在于,所述的数据集模块包括以下功能:
预处理后的历史订单的需求序列数据采用滑动窗口方法,通过选择一个需求序列数据为一个周期进行滑窗,从而构建多个训练窗口,扩大训练集数量;最后的a个需求序列数据作为预测结果序列数据,剩余的需求序列数据作为输入需求序列数据;所述的a是预设值;
将数据集中x的需求序列数据作为训练数据子集,将数据集中y的需求序列数据作为测试数据子集,所述的p+q=1。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有一种基于深度时空神经网络的需求预测方法和/或一种基于深度时空神经网络的需求预测***,所述的一种基于深度时空神经网络的需求预测方法被处理器执行时实现如权利要求1至6中任一权利要求所述的需求预测方法的步骤;所述的一种基于深度时空神经网络的需求预测***被处理器执行时实现如权利要求7至9中任一权利要求所述的需求预测***的内容。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010586879.8A CN111882157A (zh) | 2020-06-24 | 2020-06-24 | 一种基于深度时空神经网络的需求预测方法、***及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010586879.8A CN111882157A (zh) | 2020-06-24 | 2020-06-24 | 一种基于深度时空神经网络的需求预测方法、***及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111882157A true CN111882157A (zh) | 2020-11-03 |
Family
ID=73157868
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010586879.8A Pending CN111882157A (zh) | 2020-06-24 | 2020-06-24 | 一种基于深度时空神经网络的需求预测方法、***及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111882157A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113379125A (zh) * | 2021-06-11 | 2021-09-10 | 武汉大学 | 一种基于TCN和LightGBM组合模型的物流仓储销售量预测方法 |
CN113988264A (zh) * | 2021-10-29 | 2022-01-28 | 支付宝(杭州)信息技术有限公司 | 获得用于执行流量预测业务的图神经网络的方法及装置 |
CN116109234A (zh) * | 2022-12-01 | 2023-05-12 | 北京交通大学 | 一种基于预测与决策一体化的快递***智能订单分配方法 |
CN116541667A (zh) * | 2023-06-29 | 2023-08-04 | 厦门大学 | 一种浮标时间序列数据缺失值的插补方法及*** |
CN116627991A (zh) * | 2023-07-26 | 2023-08-22 | 山东朝阳轴承有限公司 | 基于物联网的企业信息化数据存储方法及*** |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005157685A (ja) * | 2003-11-25 | 2005-06-16 | Toshiba Corp | エネルギー需要予測システム |
CN107832897A (zh) * | 2017-11-30 | 2018-03-23 | 浙江工业大学 | 一种基于深度学习的股票市场预测方法 |
KR20180060317A (ko) * | 2016-11-28 | 2018-06-07 | 한국전력공사 | 심층 신경망 기반 수용가 전력 수요 예측 장치 및 방법 |
CN110085327A (zh) * | 2019-04-01 | 2019-08-02 | 东莞理工学院 | 基于注意力机制的多通道lstm神经网络流感疫情预测方法 |
CN110472779A (zh) * | 2019-07-30 | 2019-11-19 | 东莞理工学院 | 一种基于时间卷积网络的电力***短期负荷预测方法 |
CN111126680A (zh) * | 2019-12-11 | 2020-05-08 | 浙江大学 | 一种基于时间卷积神经网络的道路断面交通流量预测方法 |
-
2020
- 2020-06-24 CN CN202010586879.8A patent/CN111882157A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005157685A (ja) * | 2003-11-25 | 2005-06-16 | Toshiba Corp | エネルギー需要予測システム |
KR20180060317A (ko) * | 2016-11-28 | 2018-06-07 | 한국전력공사 | 심층 신경망 기반 수용가 전력 수요 예측 장치 및 방법 |
CN107832897A (zh) * | 2017-11-30 | 2018-03-23 | 浙江工业大学 | 一种基于深度学习的股票市场预测方法 |
CN110085327A (zh) * | 2019-04-01 | 2019-08-02 | 东莞理工学院 | 基于注意力机制的多通道lstm神经网络流感疫情预测方法 |
CN110472779A (zh) * | 2019-07-30 | 2019-11-19 | 东莞理工学院 | 一种基于时间卷积网络的电力***短期负荷预测方法 |
CN111126680A (zh) * | 2019-12-11 | 2020-05-08 | 浙江大学 | 一种基于时间卷积神经网络的道路断面交通流量预测方法 |
Non-Patent Citations (4)
Title |
---|
吴学华等: "基于多指标与卷积神经网络的化工产品需求预测", 《自动化仪表》, 31 August 2018 (2018-08-31), pages 17 * |
张冬;明新国;赵成雷;李冬;王鹏鹏;: "基于BP神经网络和设备特性的工业设备备件需求预测", 机械设计与研究, no. 01, 20 February 2010 (2010-02-20) * |
葛彦强;汪向征;王爱民;: "改进灰色神经网络的冰箱订单需求预测研究", 计算机仿真, no. 05, 15 May 2012 (2012-05-15) * |
陆敬筠等: "基于自注意力的扩展卷积神经网络情感分类", 《计算机工程与设计》, 16 June 2020 (2020-06-16), pages 2 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113379125A (zh) * | 2021-06-11 | 2021-09-10 | 武汉大学 | 一种基于TCN和LightGBM组合模型的物流仓储销售量预测方法 |
CN113379125B (zh) * | 2021-06-11 | 2022-05-13 | 武汉大学 | 一种基于TCN和LightGBM组合模型的物流仓储销售量预测方法 |
CN113988264A (zh) * | 2021-10-29 | 2022-01-28 | 支付宝(杭州)信息技术有限公司 | 获得用于执行流量预测业务的图神经网络的方法及装置 |
CN116109234A (zh) * | 2022-12-01 | 2023-05-12 | 北京交通大学 | 一种基于预测与决策一体化的快递***智能订单分配方法 |
CN116109234B (zh) * | 2022-12-01 | 2023-08-08 | 北京交通大学 | 一种基于预测与决策一体化的快递***智能订单分配方法 |
CN116541667A (zh) * | 2023-06-29 | 2023-08-04 | 厦门大学 | 一种浮标时间序列数据缺失值的插补方法及*** |
CN116541667B (zh) * | 2023-06-29 | 2023-11-03 | 厦门大学 | 一种浮标时间序列数据缺失值的插补方法及*** |
CN116627991A (zh) * | 2023-07-26 | 2023-08-22 | 山东朝阳轴承有限公司 | 基于物联网的企业信息化数据存储方法及*** |
CN116627991B (zh) * | 2023-07-26 | 2023-09-26 | 山东朝阳轴承有限公司 | 基于物联网的企业信息化数据存储方法及*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113962364B (zh) | 一种基于深度学习的多因素用电负荷预测方法 | |
CN111882157A (zh) | 一种基于深度时空神经网络的需求预测方法、***及计算机可读存储介质 | |
CN109062962B (zh) | 一种融合天气信息的门控循环神经网络兴趣点推荐方法 | |
CN111079931A (zh) | 一种基于图神经网络的状态空间概率性多时间序列预测方法 | |
CN109583565A (zh) | 基于注意力模型长短时记忆网络的洪水预测方法 | |
CN111680786B (zh) | 一种基于改进权重门控单元的时序预测方法 | |
CN116845889B (zh) | 一种基于层次化超图神经网络的电力负载预测方法 | |
CN111178585A (zh) | 基于多算法模型融合的故障接报量预测方法 | |
CN111985719A (zh) | 一种基于改进的长短期记忆网络的电力负荷预测方法 | |
CN112651534B (zh) | 一种预测资源供应链需求量的方法、装置及存储介质 | |
CN114694379B (zh) | 一种基于自适应动态图卷积的交通流预测方法及*** | |
CN110807508B (zh) | 计及复杂气象影响的母线峰值负荷预测方法 | |
CN116169670A (zh) | 一种基于改进神经网络的短期非居民负荷预测方法及*** | |
CN114154716B (zh) | 一种基于图神经网络的企业能耗预测方法及装置 | |
CN109784562B (zh) | 一种基于大数据时空聚类的智慧电网电力负荷预测方法 | |
CN115080795A (zh) | 一种多充电站协同负荷预测方法及装置 | |
Wang et al. | A transformer-based multi-entity load forecasting method for integrated energy systems | |
CN114091776A (zh) | 一种基于K-means的多分支AGCNN短期电力负荷预测方法 | |
CN115713044B (zh) | 一种多工况切换下的机电设备剩余寿命分析方法和装置 | |
CN116865254A (zh) | 一种电力负荷指标预测方法、***、设备及介质 | |
CN115115119A (zh) | 一种基于灰色关联的oa-gru的短期电力负荷预测方法 | |
CN115510948A (zh) | 一种基于鲁棒图分类的区块链钓鱼检测方法 | |
CN114611764A (zh) | 一种特定区域内企业工业用水异常监测预警方法 | |
CN114662009A (zh) | 一种基于图卷积的工业互联网工厂协同推荐算法 | |
Gao et al. | Integrated Deep Neural Networks‐Based Complex System for Urban Water Management |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB03 | Change of inventor or designer information |
Inventor after: Lv Cixing Inventor after: Yan Xiaohui Inventor after: Zhou Zirong Inventor before: Lv Cixing Inventor before: Yan Xiaohui |
|
CB03 | Change of inventor or designer information |