CN115994788B - 一种数据处理分析方法和装置 - Google Patents
一种数据处理分析方法和装置 Download PDFInfo
- Publication number
- CN115994788B CN115994788B CN202310268052.6A CN202310268052A CN115994788B CN 115994788 B CN115994788 B CN 115994788B CN 202310268052 A CN202310268052 A CN 202310268052A CN 115994788 B CN115994788 B CN 115994788B
- Authority
- CN
- China
- Prior art keywords
- sales
- unit
- commodity
- sample
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及计算机技术领域,提供一种数据处理分析方法和装置。其中方法包括:获取商品在销售区域下的区域特征,以及商品在销售区域下的各销售单位处的单位特征;基于销量预测模型的融合模块,应用区域特征分别与各单位特征之间的相关度,对区域特征和各单位特征进行特征融合,得到商品在各销售单位处的融合特征;基于销量预测模型的预测模块,应用商品在各销售单位处的融合特征进行销量预测。本发明提供的方法和装置,同时考虑了销售区域和销售单位之间的层级关系以及各销售单位的个性化信息,把销售区域和销售单位的销量并行作为学习目标,由此针对区域销量的预测,无需累加各个销售单位的销量,提高了区域销量预测的准确性。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种数据处理分析方法和装置。
背景技术
商品销量预测贯穿供应链的整个过程,可靠、准确的商品销量预测对于商品供应有着非常重要的意义。
目前的商品销量预测,多通过如下两种方案实现,一是基于门店进行商品销量建模,先预测门店的商品销量,再将各门店的商品销量累加,得到中心仓(DistributionCentre,DC)的商品销量,然而将门店销量累加到中心仓的方式很容易导致误差累积。二是基于中心仓进行商品销量建模,从而预测中心仓的商品销量,这一方式很难刻画商品在各个门店处的个性化信息,由此得到的中心仓销量的准确度也受到限制。
发明内容
本发明提供一种数据处理分析方法和装置,用以解决现有技术中销量预测的准确性和可靠性差的缺陷。
本发明提供一种数据处理分析方法,包括:
获取商品在销售区域下的区域特征,以及所述商品在所述销售区域下的各销售单位处的单位特征;
基于销量预测模型的融合模块,应用所述区域特征分别与各单位特征之间的相关度,对所述区域特征和所述各单位特征进行特征融合,得到所述商品在所述各销售单位处的融合特征;
基于所述销量预测模型的预测模块,应用所述商品在所述各销售单位处的融合特征进行销量预测。
根据本发明提供的一种数据处理分析方法,所述基于所述销量预测模型的预测模块,应用所述商品在所述各销售单位处的融合特征进行销量预测,包括:
基于所述预测模块,应用所述商品在所述各销售单位处的融合特征,预测所述商品在所述销售区域下的区域销量、所述商品在所述各销售单位处的单位销量以及所述商品对应所述各销售单位在所述销售区域中的销量占比中的至少一种;
所述销量预测模型以样本商品在样本销售区域下的样本区域特征和在所述样本销售区域下的各样本销售单位处的样本单位特征为训练样本,以所述样本商品在所述样本销售区域下的样本区域销量、在所述各样本销售单位处的样本单位销量以及样本销量占比为标签,训练得到。
根据本发明提供的一种数据处理分析方法,所述销量预测模型的训练步骤包括:
基于初始预测模型,应用所述样本区域特征和各样本单位特征,确定所述样本商品的预测区域销量、各预测单位销量,以及所述各样本销售单位的预测销量占比;
基于所述预测区域销量、所述各预测单位销量和所述各样本销售单位的预测销量占比,以及所述样本区域销量、各样本单位销量以及所述样本销量占比,确定预测损失;
基于所述样本区域销量,以及所述各预测单位销量,确定一致性损失;
基于所述预测损失和所述一致性损失,对所述初始预测模型进行参数迭代,得到所述销量预测模型。
根据本发明提供的一种数据处理分析方法,所述基于所述样本区域销量,以及所述各预测单位销量,确定一致性损失,包括:
基于所述各预测单位销量之和,确定预测综合销量;
基于所述样本区域销量与所述预测综合销量之间的差值,确定所述一致性损失。
根据本发明提供的一种数据处理分析方法,所述基于所述预测模块,应用所述商品在所述各销售单位处的融合特征,预测所述商品在所述销售区域下的区域销量,包括:
基于所述预测模块,融合所述商品在所述各销售单位处的融合特征,得到区域融合特征,并应用所述区域融合特征预测所述商品在所述销售区域下的区域销量。
根据本发明提供的一种数据处理分析方法,所述基于销量预测模型的融合模块,应用所述区域特征分别与各单位特征之间的相关度,对所述区域特征和所述各单位特征进行特征融合,得到所述商品在所述各销售单位处的融合特征,包括:
基于所述融合模块,应用所述区域特征分别与各单位特征之间的相关度,确定所述各销售单位在所述销售区域处的重要程度,并以所述各销售单位在所述销售区域处的重要程度为权重,将所述区域特征分别与所述各单位特征进行加权融合,得到所述商品在所述各销售单位处的融合特征。
根据本发明提供的一种数据处理分析方法,所述基于所述销量预测模型的预测模块,应用所述商品在所述各销售单位处的融合特征进行销量预测,之后还包括:
基于销量预测结果,进行商品调拨。
本发明还提供一种数据处理分析装置,包括:
获取单元,用于获取商品在销售区域下的区域特征,以及所述商品在所述销售区域下的各销售单位处的单位特征;
融合单元,用于基于销量预测模型的融合模块,应用所述区域特征分别与各单位特征之间的相关度,对所述区域特征和所述各单位特征进行特征融合,得到所述商品在所述各销售单位处的融合特征;
预测单元,用于基于所述销量预测模型的预测模块,应用所述商品在所述各销售单位处的融合特征进行销量预测。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述数据处理分析方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述数据处理分析方法。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述数据处理分析方法。
本发明提供的数据处理分析方法和装置,基于商品在销售区域下的区域特征分别与商品在销售区域下各销售单位处的单位特征之间的相关度,进行特征融合,并基于融合特征进行销量预测,实现在考虑了销售区域和销售单位之间的层级关系以及各销售单位的个性化信息的前提下的销量预测,从而能够提高销量预测的准确性,并且将销售区域和销售单位的销量并行作为学习目标,由此针对区域销量的预测,无需累加各个销售单位的销量,也能够提高销售区域销量预测的可靠性。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的数据处理分析方法的流程示意图;
图2是本发明提供的销量预测模型的运行流程示意图;
图3是本发明提供的数据处理分析装置的结构示意图;
图4是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
相关技术中,销量预测方法从实现原理的角度来看,主要有传统统计学方法和机器学***滑、ARIMA(AutoregressiveIntegrated Moving Average mode,差分整合移动平均自回归模型)模型、Holt模型为代表,Facebook 提出的Prophet算法,把时间序列分解为周期项、趋势项、误差项以及节假日项,通过拟合这几项,累加起来得到来时间序列的预测值。树模型预测的方法,通过构建多颗简单的树作为基学习器,每个基学习器学习上颗树和目标的偏差,所有基学习器的结果累加起来作为预测结果,主要以XGboost和LightGBM为代表。深度学习方法可以直接利用循环神经网络,如RNN(Recurrent Neural Network,循环神经网络)、LSTM(long short-termmemory,长短期记忆网络)等,把历史销量序列作为网络输入,来对商品的销量进行预测,DeepAR通过学习高斯分布的参数,预测商品销量。深度学习方法还有基于Attention网络进行建模的方法,如Transformer、Informer。还有融合了循环神经网络和Attention的模型,比如TFT(Temporal Fusion Transformers)等。
然而,上述销量预测方法,通常都没有考虑到实际应用场景下对于门店和中心仓的区分,更没有将门店和中心仓之间的层级关系建模到模型中去。常见的方法中,或是基于门店进行商品销量建模,先预测门店的商品销量,再将各门店的商品销量累加,得到中心仓商品销量预测的bottom-up方法,或是基于中心仓进行商品销量建模,从而预测中心仓商品销量的top-down方法。
前者累加计算的思路,会导致预测误差的累积,中心仓的销量预测可靠性较差;后者则忽略了商品在各个门店处的个性化信息,比如同一个商品在不同的门店可能会推行不同的促销活动,由此使得中心仓销量的预测准确度也受到限制。
针对上述问题,本发明实施例提供一种数据处理分析方法,以提高销量预测的准确性和可靠性。图1是本发明提供的数据处理分析方法的流程示意图,如图1所示,该方法包括:
步骤110,获取商品在销售区域下的区域特征,以及所述商品在所述销售区域下的各销售单位处的单位特征。
此处的商品即需要进行销量预测的商品,销售区域可以是中心仓所在的区域,也可以是其他按照区域划分的销售场所。一个销售区域下可以存在一个或者多个销售单位,此处的销售单位可以是门店,也可以是自动售卖机或者其他形式的可实现商品销售的个体单位。销售区域和销售单位之间存在归属关系,一个销售区域下的各销售单位对于一个商品的销量总和,即该销售区域的销量。
针对任意商品,商品在销售区域下的区域特征,可以反映该商品的区域性的销售特征,例如可以包括该商品本身的信息,类似商品名、商品类型、商品定价等,还可以包括该销售区域所覆盖的各个销售单元的信息,类似该销售区域下包含的销售单位的数量、位置分布、规模大小等统计信息,还可以包括该销售区域自身具备的区域性信息,例如该销售区域的传统节日、民俗习惯、气候条件、居民消费能力、居民消费偏好等,本发明实施例对此不作具体限定。
商品在销售区域下任一销售单位处的单位特征,可以反映该商品的任一销售单位处的销售特征,例如可以包括该商品在该销售单位处的促销手段,还可以包括该销售单位所处的位置、人流量、销售总额等,本发明实施例对此不作具体限定。
步骤120,基于销量预测模型的融合模块,应用所述区域特征分别与各单位特征之间的相关度,对所述区域特征和所述各单位特征进行特征融合,得到所述商品在所述各销售单位处的融合特征。
步骤130,基于所述销量预测模型的预测模块,应用所述商品在所述各销售单位处的融合特征进行销量预测。
具体地,在得到商品在销售区域下的区域特征,以及在各销售单位处的单位特征之后,即可基于区域特征和单位特征,进行销量预测。本发明实施例中,具体应用深度学习训练得到的销量预测模型,实现销量预测。
考虑到相关技术中的销量预测,忽略了对于销售区域和销售单位之间关系的建模,本发明实施例中,将销量预测模型划分为融合模块和预测模块两部分,并且在融合模块中计算并应用区域特征分别与各单位特征之间的相关度进行特征融合,以建模销售区域和销售单位之间的关系,并且通过区域特征分别与各单位特征之间的相关度,学习各销售单位之间的差异,由此提高销量预测的可靠性和准确性。
进一步地,在步骤120中,基于融合模块,可以计算输入的区域特征分别与各个销售单位处的单位特征之间的相关度,由此学习各个销售单位之间的个性化差异,并且在此基础上,应用区域特征分别与各个销售单位处的单位特征之间的相关度,将区域特征分别与各个销售单位处的单位特征进行特征融合,由此得到商品在各个销售单位处的融合特征。可以理解的是,针对任意销售单位而言,商品在该销售单位处的融合特征,能够针对性地从销售区域和销售单位本身两个层面上反映对于商品的销售特征。
在步骤130中,基于预测模块,可以应用商品在各销售单位处的融合特征进行销量预测,例如可以直接预测商品在该销售区域下的销量,或者既预测商品在该销售区域下的销量,也分别预测商品在各个销售单位处的销量。可以理解的是,由于商品在各销售单位处的融合特征,结合了区域特征和单位特征,基于此可实现在考虑了各销售单位的个性化信息的前提下的销售区域销量预测,从而能够提高销售区域销量预测的准确性。
本发明实施例提供的方法,基于商品在销售区域下的区域特征分别与商品在销售区域下各销售单位处的单位特征之间的相关度,进行特征融合,并基于融合特征进行销量预测,实现在考虑了销售区域和销售单位之间的层级关系以及各销售单位的个性化信息的前提下的销量预测,从而能够提高销量预测的准确性,并且将销售区域和销售单位的销量并行作为学习目标,由此针对区域销量的预测,无需累加各个销售单位的销量,也能够提高销售区域销量预测的可靠性。
基于上述实施例,步骤130包括:
基于所述预测模块,应用所述商品在所述各销售单位处的融合特征,预测所述商品在所述销售区域下的区域销量、所述商品在所述各销售单位处的单位销量以及所述商品对应所述各销售单位在所述销售区域中的销量占比中的至少一种;
所述销量预测模型以样本商品在样本销售区域下的样本区域特征和在所述样本销售区域下的各样本销售单位处的样本单位特征为训练样本,以所述样本商品在所述样本销售区域下的样本区域销量、在所述各样本销售单位处的样本单位销量以及样本销量占比为标签,训练得到。
具体地,针对预测模块而言,在基于商品在各销售单位处的融合特征进行销量预测时,可以实现区域销量、单位销量以及单位销量在区域销量中的销量占比,以上三种销量预测任务中的至少一种。
可以理解的是,针对单位销量或者销量占比此类对应单一销售单位而言的预测任务,可以将商品在该销售单位处的融合特征输入到预测模型的单位预测层中进行预测,此处的单位预测层可以是全连接层。
而针对区域销量的预测任务,则需要将商品在各个销售单位处的融合特征输入到预测模型的区域预测层中进行预测,在区域预测层中,可以先基于商品在各个销售单位处的融合特征,确定携带了所有销售单位的信息的区域融合特征进行区域销量预测,此处的区域预测层可以包括区域融合特征的提取层,以及用于实现预测的全连接层。
可以理解的是,为了能够实现至少一种销量预测任务,在销量预测模型训练阶段,也需要进行多任务训练。
具体可以将样本商品在样本销售区域下的样本区域特征和在样本销售区域下的各样本销售单位处的样本单位特征为训练样本,输入到初始预测模型中,由初始预测模型基于样本区域特征和各样本单位特征进行多任务预测,以获取初始预测模型输出的样本商品的预测区域销量、各预测单位销量,以及各样本销售单位的预测销量占比。
随后,即可比对预测区域销量和作为标签的样本区域销量之间的差异,各预测单位销量和作为标签的各样本单位销量之间的差异,以及预测销量占比和作为标签的样本销量占比之间的差异,建立损失函数,据此对初始预测模型进行参数迭代,以获取销量预测模型。
可以理解的是,在此训练过程中,初始预测模型能够同时学习到区域销量、单位销量以及销量占比三个预测目标,由于三个预测目标共用了销量预测模型的融合模块,针对融合模块的训练可靠性更强,由此预测所得的结果更加准确。
基于上述任一实施例,所述销量预测模型的训练步骤包括:
基于初始预测模型,应用所述样本区域特征和各样本单位特征,确定所述样本商品的预测区域销量、各预测单位销量,以及所述各样本销售单位的预测销量占比;
基于所述预测区域销量、所述各预测单位销量和所述各样本销售单位的预测销量占比,以及所述样本区域销量、各样本单位销量以及所述样本销量占比,确定预测损失;
基于所述样本区域销量,以及所述各预测单位销量,确定一致性损失;
基于所述预测损失和所述一致性损失,对所述初始预测模型进行参数迭代,得到所述销量预测模型。
具体地,在销量预测模型的多任务训练过程中,首先可以将样本商品在样本销售区域下的样本区域特征和在样本销售区域下的各样本销售单位处的样本单位特征为训练样本,输入到初始预测模型中,由初始预测模型基于样本区域特征和各样本单位特征进行多任务预测,以获取初始预测模型输出的样本商品的预测区域销量、各预测单位销量,以及各样本销售单位的预测销量占比。
可以理解的是,此处的初始预测模型与最终训练得到的销量预测模型具有相同的模型结构,且初始预测模型的模型参数是初始化得到的。即,在基于初始预测模型实现销量预测的过程中,初始预测模型同样基于样本区域特征分别与各样本单位特征之间的相关度,对样本区域特征和各样本单位特征进行特征融合,得到样本商品在各样本销售单位处的样本融合特征,随后基于样本商品在各样本销售单位处的样本融合特征进行销量预测。
随后,即可比对预测区域销量和作为标签的样本区域销量之间的差异,各预测单位销量和作为标签的各样本单位销量之间的差异,以及预测销量占比和作为标签的样本销量占比之间的差异,建立预测损失。此处的预测损失,可以体现为区域销量、单位销量和销量占比各自的损失,也可以体现为上述三个损失的加权结果,本发明实施例对此不作具体限定。
例如,可以通过下述公式分别表示区域销量、单位销量和销量占比的预测损失:
和/>通过均方误差损失计算得到,/>为第/>个样本的样本区域销量,/>为第个样本的预测区域销量,/>为第/>个样本下第/>个样本销售单位的样本单位销量,/>为第个样本下第/>个样本销售单位的预测单位销量;
此外,考虑到区域销量与单位销量之间的关系,还可以利用样本区域销量,对于预测所得的各预测单位销量进行约束,即,可以基于样本区域销量和各预测单位销量计算一致性损失,此处的一致性损失用于反映将各预测单位销量累加所得的结果与样本区域销量之间的差异。
由此,可以结合预测损失和一致性损失,对初始预测模型进行参数迭代,具体可以将预测损失和一致性损失进行加权求和以得到总体损失,从而应用总体损失对初始预测模型进行参数迭代,以获取销量预测模型。
本发明实施例提供的方法,在多任务学习的基础上,增加一致性损失,从而利用区域销量与单位销量之间的关系,对单位销量进行监督,进一步提高了销量预测的可靠性。
基于上述任一实施例,在销量预测模型的训练步骤中,所述基于所述样本区域销量,以及所述各预测单位销量,确定一致性损失,包括:
基于所述各预测单位销量之和,确定预测综合销量;
基于所述样本区域销量与所述预测综合销量之间的差值,确定所述一致性损失。
具体地,针对于一致性损失的计算,可以先将各样本销售单位的预测单位销量进行累加,即得到各预测单位销量之和,并且将各预测单位销量之和作为预测综合销量,可以理解的是,此处的预测综合销量,即从样本销售单位的层面上统计得到的样本销售区域的区域销量。
随后,即可比对样本区域销量和预测综合销量之间的差值,可以理解的是,此两者之间的差值,可以从各样本销售单位的整体层面,反映单位销量预测上的误差,即一致性损失。
例如,可以通过如下公式计算得到一致性损失:
基于上述任一实施例,步骤130中,所述基于所述预测模块,应用所述商品在所述各销售单位处的融合特征,预测所述商品在所述销售区域下的区域销量,包括:
基于所述预测模块,融合所述商品在所述各销售单位处的融合特征,得到区域融合特征,并应用所述区域融合特征预测所述商品在所述销售区域下的区域销量。
具体地,在预测模块中,为了实现商品在销售区域下的区域销量预测,可以对商品在各销售单位处的融合特征作进一步的特征融合,由此得到可以反映销售区域整体的销售情况的区域融合特征。例如,可以对商品在各销售单位处的融合特征进行加权求和,并将加权求和的结果作为区域融合特征。在得到区域融合特征之后,即可基于区域融合特征预测商品在销售区域下的区域销量。
进一步地,针对区域融合特征的获取,可以通过预测模块中的加权层WeightedLayer实现,具体可以通过加权层对商品在各销售单位处的融合特征进行加权求和,得到区域融合特征;针对区域销量的预测,可以通过预测模块中的全连接层Full ConnectedLayer实现,具体可以通过全连接层,应用区域融合特征预测区域销量。
基于上述任一实施例,步骤120包括:
基于所述融合模块,应用所述区域特征分别与各单位特征之间的相关度,确定所述各销售单位在所述销售区域处的重要程度,并以所述各销售单位在所述销售区域处的重要程度为权重,将所述区域特征分别与所述各单位特征进行加权融合,得到所述商品在所述各销售单位处的融合特征。
具体地,在融合模块中,可以计算输入的区域特征分别与各个销售单位处的单位特征之间的相关度,由此学习各个销售单位之间的个性化差异。此处,可以通过融合模块中的自注意力模块self-Atttion Blocks,对将区域特征与任一销售单位处的单位特征拼接所得的拼接特征进行自注意力转换,从而将自注意力转换所得的结果记为该销售单位处的单位特征与区域特征之间的相关度。需要说明的是,针对相关度的计算,各个单位特征所对应的相关度是相互独立的。
在此基础上,可以应用区域特征分别与各个销售单位处的单位特征之间的相关度,确定各个销售单位在销售区域内的重要程度,进而以重要程度作为权重进行加权融合。具体可以通过融合模块中的注意力层Attention Layer,对区域特征分别与各个销售单位处的单位特征之间的相关度与区域特征本身进行注意力交互,即可得到能够反映各个销售单位之间的销量差异性的融合特征。
基于上述任一实施例,步骤130之后还包括:
基于销量预测结果,进行商品调拨。
具体地,通过销量预测,可以得到商品在各销售单位处的单位销量、各销售单位在销售区域下的区域占比,以及销售区域的区域销量。基于上述销量预测结果,即可对于各销售区域以及各销售区域下的各销售单位进行商品调拨,从而能够将订货量调拨到销售单位。例如,在销售区域为中心仓DC,销售单位为门店的情况下,基于销售预测结果,可以在考虑到各门店的个性化信息的前提下,将DC的订货量调拨到各个门店,从而更好地实现商品调拨。
基于上述任一实施例,图2是本发明提供的销量预测模型的运行流程示意图,如图2所示,基于销量预测模型的运行流程,包括如下步骤:
假设商品在销售区域的区域特征为,/>,/>是一个n维的实数向量,其中的/>用于反映商品在n个维度的区域性的销售特征。假设商品在销售区域下的第i个销售单位处的单位特征为/>,/>,/>是一个m维的实数向量,其中的/>反映商品在该销售单位处的m个维度的销售特征。假设销售区域内共存在L个销售单位,则L个销售单位的销售特征可依次记为/>,即对应图2中的单位特征1、单位特征2、…、单位特征L。
在销量预测模型中,融合模块包括拼接Concat操作、自注意力模块和注意力层。
在融合模块的运行过程中,首先可以将区域特征分别与各单位特征进行拼接,使得销售区域能够感受到每个销售单位的个性化信息,由此得到的拼接特征1、拼接特征2、…、拼接特征L。由拼接特征构成的集合可以记为,其中,拼接特征i表示为/>,/>,式中的加号+表示向量拼接操作。
其次,可以将各销售单位分别对应的拼接特征1、拼接特征2、…、拼接特征L输入到自注意力模块self-Atttion Blocks。此处,自注意力模块self-Atttion Blocks的输入可以包括,并且/>。通过自注意力模块self-Atttion Blocks能够让销售区域学习到每个销售单位的差异性,并输出/>,其中/>表示区域特征与第i个销售单位的单位特征之间的相关度。
此处,自注意力模块self-Atttion Blocks的计算过程可以表示为如下公式:
式中的分别对应上述/>,/>是一个二维矩阵,均为可学习参数,d、k、h为实数,表示矩阵的维度,其中k=d/h为一个实数。自注意力模块self-Attention Blocks由self-Attention Block层的组成,上一个self-Attention Block层的输出为下一个self-Attention Block层的输入。FFN为前反馈神经网络。上式中输出的F即/>。
接着,可以将区域特征与各单位特征之间的相关度,以及区域特征本身,一并输入到注意力层Attention Layer,对每个销售单位的销量差异性进行评估,并输出,其中/>表示商品在第i个销售单位处的融合特征。
在销量预测模型中,预测模块包括加权层,以及全连接层Full ConnectedLayer1、2、3。其中,全连接层1用于实现单位销量预测,具体可以将融合特征输入到全连接层1,以获取各单位销量y_d1_pred,y_d2_pred,...,y_dL_pred,此处的y_d1_pred,y_d2_pred,..., y_dL_pred分别表示第1个至第L个销售单位的单位销量;全连接层2用于实现销量占比预测,可以将融合特征/>输入到全连接层2,以获取各销售单位的销量占比p_w_1,p_w_2,...,p_w_L,此处的p_w_1, p_w_2,...,p_w_L分别表示第1个至第L个销售单位的销量占比。
另外,可以将融合特征输入到加权层Weighted Layer,对/>中各销售单位的融合特征进行加权求和,得到区域融合特征。随后,将区域融合特征输入全连接层3,以获取销售区域的区域销量,此处的区域销量可以记为y_d_pred。
此处,加权层Weighted Layer的计算过程可以表示为如下公式:
全连接层的计算过程可以表示为如下公式:
基于上述任一实施例,在应用销量预测模型进行销量预测之前,需要通过模型训练以获取销量预测模型。
在针对销量预测模型的训练阶段,首先需要收集训练数据,此处的训练数据可以记为。其中,/>为样本商品k的样本区域特征,为样本商品k的样本单位特征集合,/>,/>为样本区域销量,/>为L个样本销售单位的样本单位销量,/>为L个样本销售单位的样本销量占比。可以理解的是,/>中,/>为训练样本,/>为标签。
具体在训练数据的收集时,可以将针对所有样本商品和样本销售区域的训练数据整理为数据集。例如可以将商品近四个月的数据生成数据集,按时间维度对数据集进行划分,前三个月为训练集,最后一个月的前15天为验证集,后15天为测试集,由此实现针对销售预测模型的训练、验证和测试。
具体在模型训练时,可以分别计算得到针对区域销量、单位销量和销量占比的预测损失、/>和/>,另外还可以计算得到一致性损失/>,由此,可以应用下式对预测损失和一致性损失进行加权,以得到最终的损失L进行模型参数迭代:
本发明实施例提供的方法,基于注意力机制和多任务学习的方法,能够同时预测商品在销售单位和销售区域的销量预测,以及商品在销售单位的销量占比预测,从而有效减少商品从销售单位销量预测累加到销售区域的误差累积问题,以及从销售区域预测销量,然后再调拨到门店的调拨问题。通过把销售区域和销售单位的关系建模到模型中和注意力机制,使得销售区域能够有效的感知到各个销售单位的个性化信息,提升了销售区域维度的销量预测的效果。此外,通过自定义的一致性约束损失函数,利用销售区域的销量监督销售单位的销量预测,提升了销售单位的销量预测的效果。
基于上述任一实施例,图3是本发明提供的数据处理分析装置的结构示意图,如图3所示,数据处理分析装置包括:
获取单元310,用于获取商品在销售区域下的区域特征,以及所述商品在所述销售区域下的各销售单位处的单位特征;
融合单元320,用于基于销量预测模型的融合模块,应用所述区域特征分别与各单位特征之间的相关度,对所述区域特征和所述各单位特征进行特征融合,得到所述商品在所述各销售单位处的融合特征;
预测单元330,用于基于所述销量预测模型的预测模块,应用所述商品在所述各销售单位处的融合特征进行销量预测。
本发明实施例提供的装置,基于商品在销售区域下的区域特征分别与商品在销售区域下各销售单位处的单位特征之间的相关度,进行特征融合,并基于融合特征进行销量预测,实现在考虑了销售区域和销售单位之间的层级关系以及各销售单位的个性化信息的前提下的销量预测,从而能够提高销量预测的准确性,并且将销售区域和销售单位的销量并行作为学习目标,由此针对区域销量的预测,无需累加各个销售单位的销量,也能够提高销售区域销量预测的可靠性。
基于上述任一实施例,预测单元用于:
基于所述预测模块,应用所述商品在所述各销售单位处的融合特征,预测所述商品在所述销售区域下的区域销量、所述商品在所述各销售单位处的单位销量以及所述商品对应所述各销售单位在所述销售区域中的销量占比中的至少一种;
所述销量预测模型以样本商品在样本销售区域下的样本区域特征和在所述样本销售区域下的各样本销售单位处的样本单位特征为训练样本,以所述样本商品在所述样本销售区域下的样本区域销量、在所述各样本销售单位处的样本单位销量以及样本销量占比为标签,训练得到。
基于上述任一实施例,该装置还包括训练单元,训练单元用于:
基于初始预测模型,应用所述样本区域特征和各样本单位特征,确定所述样本商品的预测区域销量、各预测单位销量,以及所述各样本销售单位的预测销量占比;
基于所述预测区域销量、所述各预测单位销量和所述各样本销售单位的预测销量占比,以及所述样本区域销量、各样本单位销量以及所述样本销量占比,确定预测损失;
基于所述样本区域销量,以及所述各预测单位销量,确定一致性损失;
基于所述预测损失和所述一致性损失,对所述初始预测模型进行参数迭代,得到所述销量预测模型。
基于上述任一实施例,训练单元具体用于:
基于所述各预测单位销量之和,确定预测综合销量;
基于所述样本区域销量与所述预测综合销量之间的差值,确定所述一致性损失。
基于上述任一实施例,预测单元具体用于:
基于所述预测模块,融合所述商品在所述各销售单位处的融合特征,得到区域融合特征,并应用所述区域融合特征预测所述商品在所述销售区域下的区域销量。
基于上述任一实施例,融合单元具体用于:
基于所述融合模块,应用所述区域特征分别与各单位特征之间的相关度,确定所述各销售单位在所述销售区域处的重要程度,并以所述各销售单位在所述销售区域处的重要程度为权重,将所述区域特征分别与所述各单位特征进行加权融合,得到所述商品在所述各销售单位处的融合特征。
基于上述任一实施例,该装置还包括调拨单元,调拨单元用于:
基于销量预测结果,进行商品调拨。
图4示例了一种电子设备的实体结构示意图,如图4所示,该电子设备可以包括:处理器(processor)410、通信接口(Communications Interface)420、存储器(memory)430和通信总线440,其中,处理器410,通信接口420,存储器430通过通信总线440完成相互间的通信。处理器410可以调用存储器430中的逻辑指令,以执行数据处理分析方法,该方法包括:获取商品在销售区域下的区域特征,以及所述商品在所述销售区域下的各销售单位处的单位特征;基于销量预测模型的融合模块,应用所述区域特征分别与各单位特征之间的相关度,对所述区域特征和所述各单位特征进行特征融合,得到所述商品在所述各销售单位处的融合特征;基于所述销量预测模型的预测模块,应用所述商品在所述各销售单位处的融合特征进行销量预测。
此外,上述的存储器430中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的数据处理分析方法,该方法包括:获取商品在销售区域下的区域特征,以及所述商品在所述销售区域下的各销售单位处的单位特征;基于销量预测模型的融合模块,应用所述区域特征分别与各单位特征之间的相关度,对所述区域特征和所述各单位特征进行特征融合,得到所述商品在所述各销售单位处的融合特征;基于所述销量预测模型的预测模块,应用所述商品在所述各销售单位处的融合特征进行销量预测。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的数据处理分析方法,该方法包括:获取商品在销售区域下的区域特征,以及所述商品在所述销售区域下的各销售单位处的单位特征;基于销量预测模型的融合模块,应用所述区域特征分别与各单位特征之间的相关度,对所述区域特征和所述各单位特征进行特征融合,得到所述商品在所述各销售单位处的融合特征;基于所述销量预测模型的预测模块,应用所述商品在所述各销售单位处的融合特征进行销量预测。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (9)
1.一种数据处理分析方法,其特征在于,包括:
获取商品在销售区域下的区域特征,以及所述商品在所述销售区域下的各销售单位处的单位特征,所述区域特征包括统计信息和区域性信息,所述统计信息包括所述销售区域下包含的销售单位的数量、位置分布、规模大小中的至少一种,所述区域性信息包括该销售区域的传统节日、民俗习惯、气候条件、居民消费能力、居民消费偏好中的至少一种;所述单位特征包括所述商品在所述销售单位处的促销手段,以及所述销售单位处的位置和/或人流量;
基于销量预测模型的融合模块,应用所述区域特征分别与各单位特征之间的相关度,确定所述各销售单位在所述销售区域处的重要程度,并以所述各销售单位在所述销售区域处的重要程度为权重,将所述区域特征分别与所述各单位特征进行加权融合,得到所述商品在所述各销售单位处的融合特征;
基于所述销量预测模型的预测模块,应用所述商品在所述各销售单位处的融合特征进行销量预测。
2.根据权利要求1所述的数据处理分析方法,其特征在于,所述基于所述销量预测模型的预测模块,应用所述商品在所述各销售单位处的融合特征进行销量预测,包括:
基于所述预测模块,应用所述商品在所述各销售单位处的融合特征,预测所述商品在所述销售区域下的区域销量、所述商品在所述各销售单位处的单位销量以及所述商品对应所述各销售单位在所述销售区域中的销量占比中的至少一种;
所述销量预测模型以样本商品在样本销售区域下的样本区域特征和在所述样本销售区域下的各样本销售单位处的样本单位特征为训练样本,以所述样本商品在所述样本销售区域下的样本区域销量、在所述各样本销售单位处的样本单位销量以及样本销量占比为标签,训练得到。
3.根据权利要求2所述的数据处理分析方法,其特征在于,所述销量预测模型的训练步骤包括:
基于初始预测模型,应用所述样本区域特征和各样本单位特征,确定所述样本商品的预测区域销量、各预测单位销量,以及所述各样本销售单位的预测销量占比;
基于所述预测区域销量、所述各预测单位销量和所述各样本销售单位的预测销量占比,以及所述样本区域销量、各样本单位销量以及所述样本销量占比,确定预测损失;
基于所述样本区域销量,以及所述各预测单位销量,确定一致性损失;
基于所述预测损失和所述一致性损失,对所述初始预测模型进行参数迭代,得到所述销量预测模型。
4.根据权利要求3所述的数据处理分析方法,其特征在于,所述基于所述样本区域销量,以及所述各预测单位销量,确定一致性损失,包括:
基于所述各预测单位销量之和,确定预测综合销量;
基于所述样本区域销量与所述预测综合销量之间的差值,确定所述一致性损失。
5.根据权利要求2所述的数据处理分析方法,其特征在于,所述基于所述预测模块,应用所述商品在所述各销售单位处的融合特征,预测所述商品在所述销售区域下的区域销量,包括:
基于所述预测模块,融合所述商品在所述各销售单位处的融合特征,得到区域融合特征,并应用所述区域融合特征预测所述商品在所述销售区域下的区域销量。
6.根据权利要求1至5中任一项所述的数据处理分析方法,其特征在于,所述基于所述销量预测模型的预测模块,应用所述商品在所述各销售单位处的融合特征进行销量预测,之后还包括:
基于销量预测结果,进行商品调拨。
7.一种数据处理分析装置,其特征在于,包括:
获取单元,用于获取商品在销售区域下的区域特征,以及所述商品在所述销售区域下的各销售单位处的单位特征,所述区域特征包括统计信息和区域性信息,所述统计信息包括所述销售区域下包含的销售单位的数量、位置分布、规模大小中的至少一种,所述区域性信息包括该销售区域的传统节日、民俗习惯、气候条件、居民消费能力、居民消费偏好中的至少一种;所述单位特征包括所述商品在所述销售单位处的促销手段,以及所述销售单位处的位置和/或人流量;
融合单元,用于基于销量预测模型的融合模块,应用所述区域特征分别与各单位特征之间的相关度,确定所述各销售单位在所述销售区域处的重要程度,并以所述各销售单位在所述销售区域处的重要程度为权重,将所述区域特征分别与所述各单位特征进行加权融合,得到所述商品在所述各销售单位处的融合特征;
预测单元,用于基于所述销量预测模型的预测模块,应用所述商品在所述各销售单位处的融合特征进行销量预测。
8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述数据处理分析方法。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述数据处理分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310268052.6A CN115994788B (zh) | 2023-03-20 | 2023-03-20 | 一种数据处理分析方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310268052.6A CN115994788B (zh) | 2023-03-20 | 2023-03-20 | 一种数据处理分析方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115994788A CN115994788A (zh) | 2023-04-21 |
CN115994788B true CN115994788B (zh) | 2023-06-30 |
Family
ID=85992238
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310268052.6A Active CN115994788B (zh) | 2023-03-20 | 2023-03-20 | 一种数据处理分析方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115994788B (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109509030A (zh) * | 2018-11-15 | 2019-03-22 | 北京旷视科技有限公司 | 销量预测方法及其模型的训练方法、装置和电子*** |
CN111724211A (zh) * | 2020-06-30 | 2020-09-29 | 名创优品(横琴)企业管理有限公司 | 一种线下门店商品销量预测方法、装置和设备 |
CN113888235A (zh) * | 2021-10-22 | 2022-01-04 | 创优数字科技(广东)有限公司 | 一种销量预测模型的训练方法、销量预测方法及相关装置 |
CN114358874A (zh) * | 2021-12-28 | 2022-04-15 | 京东科技信息技术有限公司 | 补货方法、装置及电子设备 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8504406B2 (en) * | 2003-03-31 | 2013-08-06 | Restaurant Services, Inc. | Method of product ordering and inventory repositioning for a promotion |
JP4897713B2 (ja) * | 2008-01-16 | 2012-03-14 | 株式会社野村総合研究所 | 販売情報分析装置 |
CN104951843B (zh) * | 2014-03-27 | 2018-10-26 | 日立(中国)研究开发有限公司 | 销量预测***及方法 |
WO2020026359A1 (ja) * | 2018-07-31 | 2020-02-06 | 株式会社オプティム | コンピュータシステム、販売方法及びプログラム |
CN110599234A (zh) * | 2019-08-13 | 2019-12-20 | 广东工业大学 | 一种产品销售预测方法 |
CN113743969A (zh) * | 2020-05-29 | 2021-12-03 | 北京京东智能城市大数据研究院 | 用于销量数据预测的方法、装置、设备及存储介质 |
CN112017000B (zh) * | 2020-08-28 | 2022-10-25 | 杭州拼便宜网络科技有限公司 | 一种商品信息推送方法、装置、设备及存储介质 |
CN112734494A (zh) * | 2021-01-18 | 2021-04-30 | 深圳市轱辘车联数据技术有限公司 | 一种销量预测方法、装置、终端设备及可读存储介质 |
CN113850651A (zh) * | 2021-09-30 | 2021-12-28 | 广州品唯软件有限公司 | 一种线下门店配货方法及相关设备 |
CN114387037A (zh) * | 2022-01-18 | 2022-04-22 | 华院分析技术(上海)有限公司 | 基于深度学习的零售商品销售预测方法 |
CN115018543A (zh) * | 2022-06-05 | 2022-09-06 | 王东祥 | 一种应用云计算服务的大数据处理***及方法 |
-
2023
- 2023-03-20 CN CN202310268052.6A patent/CN115994788B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109509030A (zh) * | 2018-11-15 | 2019-03-22 | 北京旷视科技有限公司 | 销量预测方法及其模型的训练方法、装置和电子*** |
CN111724211A (zh) * | 2020-06-30 | 2020-09-29 | 名创优品(横琴)企业管理有限公司 | 一种线下门店商品销量预测方法、装置和设备 |
CN113888235A (zh) * | 2021-10-22 | 2022-01-04 | 创优数字科技(广东)有限公司 | 一种销量预测模型的训练方法、销量预测方法及相关装置 |
CN114358874A (zh) * | 2021-12-28 | 2022-04-15 | 京东科技信息技术有限公司 | 补货方法、装置及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN115994788A (zh) | 2023-04-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lim et al. | Temporal fusion transformers for interpretable multi-horizon time series forecasting | |
US11100387B2 (en) | Systems and methods for learning and predicting transactions | |
US11281969B1 (en) | Artificial intelligence system combining state space models and neural networks for time series forecasting | |
US10936947B1 (en) | Recurrent neural network-based artificial intelligence system for time series predictions | |
Van Steenbergen et al. | Forecasting demand profiles of new products | |
Omar et al. | A hybrid neural network model for sales forecasting based on ARIMA and search popularity of article titles | |
CN111052128B (zh) | 用于检测和定位视频中的对象的描述符学习方法 | |
Kirichenko et al. | Comparative analysis of conversion series forecasting in e-commerce tasks | |
CN112328646B (zh) | 多任务课程推荐方法、装置、计算机设备及存储介质 | |
Olvera-Juarez et al. | Forecasting bitcoin pricing with hybrid models: A review of the literature | |
CN111898904A (zh) | 一种数据处理方法及装置 | |
CN114240555A (zh) | 训练点击率预测模型和预测点击率的方法和装置 | |
CN115994788B (zh) | 一种数据处理分析方法和装置 | |
CN117391866A (zh) | 一种数据处理方法、装置、设备及其存储介质 | |
Poornima et al. | Prediction of water consumption using machine learning algorithm | |
CN111768218A (zh) | 用于处理用户交互信息的方法和装置 | |
CN110414690A (zh) | 利用机器学习模型执行预测的方法及装置 | |
CN115049458A (zh) | 基于用户人群建模的商品推送方法及装置、介质、设备 | |
CN112036641A (zh) | 基于人工智能的留存预测方法、装置、计算机设备及介质 | |
Tran et al. | Building a Lucy hybrid model for grocery sales forecasting based on time series | |
Loureiro et al. | Predicting Multiple Domain Queue Waiting Time via Machine Learning | |
Koçak | Deep Learning Techniques for Short-Term Air Passenger Demand Forecasting with Destination Insight: A Case Study in The New Zealand Air Market | |
CN114596120B (zh) | 一种商品销量预测方法、***、设备及存储介质 | |
Hütsch et al. | A Structured Literature Review on the Application of Machine Learning in Retail. | |
Anitha et al. | A Web-based Real-time Sales Data Analysis using LSTM Model for Better Insight |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |