CN117196695B - 一种目标产品的销量数据的预测方法及装置 - Google Patents
一种目标产品的销量数据的预测方法及装置 Download PDFInfo
- Publication number
- CN117196695B CN117196695B CN202311452296.6A CN202311452296A CN117196695B CN 117196695 B CN117196695 B CN 117196695B CN 202311452296 A CN202311452296 A CN 202311452296A CN 117196695 B CN117196695 B CN 117196695B
- Authority
- CN
- China
- Prior art keywords
- data
- time
- product
- target product
- preset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 70
- 238000012549 training Methods 0.000 claims description 47
- 238000012545 processing Methods 0.000 claims description 24
- 230000008569 process Effects 0.000 claims description 16
- 238000012360 testing method Methods 0.000 claims description 12
- 230000006870 function Effects 0.000 claims description 10
- 238000007781 pre-processing Methods 0.000 claims description 8
- 238000012216 screening Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 3
- 230000008901 benefit Effects 0.000 abstract description 5
- 238000004364 calculation method Methods 0.000 description 13
- 238000009499 grossing Methods 0.000 description 5
- 230000001419 dependent effect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000010006 flight Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000001932 seasonal effect Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- KJONHKAYOJNZEC-UHFFFAOYSA-N nitrazepam Chemical compound C12=CC([N+](=O)[O-])=CC=C2NC(=O)CN=C1C1=CC=CC=C1 KJONHKAYOJNZEC-UHFFFAOYSA-N 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-M valinate Chemical compound CC(C)C(N)C([O-])=O KZSNJWFQEVHDMF-UHFFFAOYSA-M 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种目标产品的销量数据的预测方法及装置。所述方法包括:获取目标产品的至少一个维度的第一特征数据;获取与所述目标产品相关性大于预设值的相似产品的至少一个维度的第二特征数据;确定所述第一特征数据和所述第二特征数据的相关性权重;将所述相似产品的至少一个维度的第二特征数据输入预设预测模型进行销量数据预测,获得相似产品在预设时间段内的预测结果;根据所述预测结果和所述相关性权重,确定目标产品在预设时间段内的销量数据。本发明利用与目标产品的相似产品的相关数据,计算得到目标产品在预设时间段内的销量数据,提高了对目标产品销量预测的准确性和可靠性,具有准确性较高的优点。
Description
技术领域
本发明涉及销量预测技术领域,还涉及一种目标产品的销量数据的预测方法及装置。
背景技术
航空公司作为服务行业的重要组成部分,需要不断推出新产品以满足乘客需求,并提升市场竞争力。其中,预付费产品的引入不仅能够吸引更多的乘客,还有助于航空公司提前规划和管理销售收入。准确预测已推出的新型预付费产品销量进而作出收益分析至关重要。其对加速产品市场推广,降低企业运营成本具有重要作用。但是,与传统销量预测方法需依赖大规模历史数据相比,新型预付费产品销量数据较少,并且,预付费产品的销量受到飞行航线、飞行日期、季节性因素等多种因素的影响,销量趋势与变化规律难以准确挖掘。然而,传统方法和简单模型无法准确捕捉到新型预付费产品销量的潜在模式和趋势。
发明内容
本发明要解决的技术问题是提供一种目标产品的销量数据的预测方法及装置,以解决现有技术中对预付费产品的销量预测不够准确的问题。
为解决上述技术问题,本发明的技术方案如下:
一种目标产品的销量数据的预测方法,包括:
获取目标产品的至少一个维度的第一特征数据;
获取与所述目标产品相关性大于预设值的相似产品的至少一个维度的第二特征数据;
确定所述第一特征数据和所述第二特征数据的相关性权重;
将所述相似产品的至少一个维度的第二特征数据输入预设预测模型进行销量数据预测,获得相似产品在预设时间段内的预测结果;
根据所述预测结果和所述相关性权重,确定目标产品在预设时间段内的销量数据。
可选的,获取目标产品的至少一个维度的第一特征数据,包括:
获取目标产品的产品规则维度、产品购买信息维度以及至少一个时间段维度的第一特征数据。
可选的,所述目标产品与所述相似产品的相关性通过以下过程确定:
获取目标产品的规则特征和衍生特征、相似产品的规则特征和衍生特征;
根据所述目标产品的规则特征和衍生特征、所述相似产品的规则特征和衍生特征,计算得到所述目标产品与所述相似产品的相关性;公式为:
,
其中,s为目标产品与相似产品的相关性,g为规则特征/衍生特征,m为规则特征和
衍生特征的总个数,为目标产品的规则特征/衍生特征,为相似产品的规则特征/衍生
特征。
可选的,确定所述第一特征数据和所述第二特征数据的相关性权重,包括:
获取目标产品的规则特征和衍生特征、相似产品的规则特征和衍生特征;
根据所述目标产品的规则特征和衍生特征、所述相似产品的规则特征和衍生特
征,计算得到特征相关性;公式为:;
根据所述特征相关性,计算得到所述第一特征数据和所述第二特征数据的相关性
权重;公式为:;
其中,为第i个规则特征/衍生特征的相关性权重,为目标产品与相似产品第i
个规则特征/衍生特征的特征相关性,m为规则特征和衍生特征的总个数,为目标产品的
第i个规则特征/衍生特征,为相似产品的第i个规则特征/衍生特征。
可选的,将所述相似产品的至少一个维度的第二特征数据输入预设预测模型进行销量数据预测,获得相似产品在预设时间段内的预测结果,包括:
将所述相似产品的至少一个维度的第二特征数据构建为时间序列数据;所述时间序列数据包括时间和规则特征/衍生特征;
对所述时间序列数据进行处理,得到预设位浮点数的第二特征数据;
对所述预设位浮点数的第二特征数据进行处理,得到有监督学习的数据;
根据所述有监督学习的数据和公式,得到遗忘参数;
根据所述遗忘参数和公式、、,得到更新后的状态数据;
根据所述更新后的状态数据和公式、,得到
相似产品在预设时间段内的预测结果;
其中,为t时刻的遗忘参数,为激活函数,为t时刻遗忘门的权重,为t-1时
刻的预测结果,为预设时间段,为t时刻遗忘门的偏差向量,为t时刻的输入门,为t时
刻输入门的权重, 为t时刻输入门的偏差向量,为t时刻的候选值,为t时刻候选值的
权重,为t时刻候选值的偏差向量,为t时刻的元胞状态,为t-1时刻的元胞状态,为
t时刻的输出门,为t时刻输出门的权重,为t时刻输出门的偏差向量,为t时刻的预测
结果。
可选的,预设预测模型通过以下过程进行训练:
获取相似产品历史时间段内的产品规则维度、产品购买信息维度以及至少一个时间段维度的历史第二特征数据;
对所述历史第二特征数据进行预处理,得到预处理后的历史第二特征数据;
对所述预处理后的历史第二特征数据进行筛选,得到筛选后的历史第二特征数据;
将所述筛选后的历史第二特征数据构建为历史时间序列数据;
对所述历史时间序列数据进行处理,得到32位浮点数的训练数据;
对所述训练数据进行处理,得到有监督学习的训练数据;
将所述有监督学习的训练数据按照预设比例进行划分,得到训练集和测试集;
按照预设窗口长度和训练集对预设网络模型进行训练,得到训练后的网络模型;
使用测试集对所述训练后的网络模型进行验证,得到预设预测模型。
可选的,根据所述预测结果和所述相关性权重,确定目标产品在预设时间段内的销量数据,包括:
将所述预测结果和所述相关性权重输入公式,计算得到目标产
品在预设时间段内的销量数据;
其中,为目标产品在预设时间段内的销量数据,为相似产品的总个数,为第i个
相似产品的预测结果,为第i个规则特征/衍生特征的相关性权重,z为所有相似产品的预
测结果的总和,w为所有规则特征和衍生特征的相关性权重构成的权重向量。
根据本发明的另一个方面,提供了一种目标产品的销量数据的预测装置,包括:
第一获取模块,用于获取目标产品的至少一个维度的第一特征数据;
第二获取模块,用于获取与所述目标产品相关性大于预设值的相似产品的至少一个维度的第二特征数据;
确定模块,用于确定所述第一特征数据和所述第二特征数据的相关性权重;
输入模块,用于将所述相似产品的至少一个维度的第二特征数据输入预设预测模型进行销量数据预测,获得相似产品在预设时间段内的预测结果;
预测模块,用于根据所述预测结果和所述相关性权重,确定目标产品在预设时间段内的销量数据。
根据本发明的另一个方面,提供了一种计算设备,包括:处理器、存储有计算机程序的存储器,所述计算机程序被处理器运行时,执行如上述中任一项所述的方法。
根据本发明的另一个方面,提供了一种计算机可读存储介质,其上存储指令,当所述指令在计算机上运行时,使得计算机执行如上述中任一项所述的方法。
本发明的上述方案至少包括以下有益效果:
本发明的上述方案,通过获取目标产品的第一特征数据,以及与目标产品相关性大于预设值的相似产品的第二特征数据,再确定第一特征数据和第二特征数据的相关性权重,根据相似产品在预设时间段内的销量预测结果和相关性权重,计算得到目标产品在预设时间段内的销量数据,提高了对目标产品销量预测的准确性和可靠性,具有准确性较高的优点。
附图说明
图1是本发明实施例中的目标产品的销量数据的预测方法的流程示意图;
图2是本发明实施例中的目标产品的销量数据的预测方法的一个具体实施例的流程示意图;
图3是本发明实施例中的目标产品的销量数据的预测装置的结构示意图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
如图1所示,本发明的实施例提出一种目标产品的销量数据的预测方法,包括以下步骤:
S11、获取目标产品的至少一个维度的第一特征数据;
S12、获取与所述目标产品相关性大于预设值的相似产品的至少一个维度的第二特征数据;
S13、确定所述第一特征数据和所述第二特征数据的相关性权重;
S14、将所述相似产品的至少一个维度的第二特征数据输入预设预测模型进行销量数据预测,获得相似产品在预设时间段内的预测结果;
S15、根据所述预测结果和所述相关性权重,确定目标产品在预设时间段内的销量数据。
本发明实施例提出的目标产品的销量数据的预测方法,通过获取目标产品的第一特征数据,以及与目标产品相关性大于预设值的相似产品的第二特征数据,再确定第一特征数据和第二特征数据的相关性权重,根据相似产品在预设时间段内的销量预测结果和相关性权重,计算得到目标产品在预设时间段内的销量数据,提高了对目标产品销量预测的准确性和可靠性,具有准确性较高的优点。
本发明的一可选实施例中,S11包括:
获取目标产品的产品规则维度、产品购买信息维度以及至少一个时间段维度的第一特征数据。
具体的,可以从航空公司的业务***中获取到目标产品(如预付费新产品)的业务信息,这种业务信息包括产品规则维度,如出行周期、客票类型、适用航线、可兑换次数、航线兑换次数、未成行航班数、产品售价等信息;还包括产品购买信息维度,如产品名称、购买日期和销量;还包括时间段维度,如星期、月份、季节、假期等。获取到包含产品规则维度、产品购买信息维度以及至少一个时间段维度的第一特征数据,是为了使得后续目标产品与相似产品的相关性、相关性权重更加准确,以及最终得到的目标产品的预测销量更加准确和贴合实际,提高方法的准确性和可靠性。
本发明的一可选实施例中,S12中的所述目标产品与所述相似产品的相关性通过以下过程确定:
S121、获取目标产品的规则特征和衍生特征、相似产品的规则特征和衍生特征;
S122、根据所述目标产品的规则特征和衍生特征、所述相似产品的规则特征和衍生特征,计算得到所述目标产品与所述相似产品的相关性;公式为:
,
其中,s为目标产品与相似产品的相关性,g为规则特征/衍生特征,m为规则特征和
衍生特征的总个数,为目标产品的规则特征/衍生特征,为相似产品的规则特征/衍生
特征。
通过上述对目标产品与相似产品的相关性的计算,尽量选取与目标产品的制定规则相似性高的产品,从而使得通过相似产品的预测销量来预测目标产品的销量的方法具有更高的准确性。
具体的,目标产品或者相似产品的规则特征包括以下中的至少一项:出行周期、客票类型、适用航线、可兑换次数、航线兑换次数、未成行航班数、产品售价等信息;衍生特征包括以下中的至少一项:星期、月份、季节、假期特征。根据目标产品与相似产品同一规则特征/衍生特征的相关性,得到目标产品与相似产品的相关性,选取相关性取值较大的几个相似产品,用于后续对目标产品销量的预测。
本发明的一可选实施例中,S13,包括:
S131、获取目标产品的规则特征和衍生特征、相似产品的规则特征和衍生特征;
S132、根据所述目标产品的规则特征和衍生特征、所述相似产品的规则特征和衍
生特征,计算得到特征相关性;公式为:;
S133、根据所述特征相关性,计算得到所述第一特征数据和所述第二特征数据的
相关性权重;公式为:;
其中,为第i个规则特征/衍生特征的相关性权重,为目标产品与相似产品第i
个规则特征/衍生特征的特征相关性,m为规则特征和衍生特征的总个数,为目标产品的
第i个规则特征/衍生特征,为相似产品的第i个规则特征/衍生特征。
具体的,目标产品或者相似产品的规则特征包括以下中的至少一项:出行周期、客票类型、适用航线、可兑换次数、航线兑换次数、未成行航班数、产品售价等信息;衍生特征包括以下中的至少一项:星期、月份、季节、假期特征。首先计算目标产品与相似产品同一规则特征/衍生特征的特征相关性,根据特征相关性得到相关性权重,用于后续对目标产品销量的预测。
本发明的一可选实施例中,S14,包括:
S1411、将所述相似产品的至少一个维度的第二特征数据构建为时间序列数据;所述时间序列数据包括时间和规则特征/衍生特征;
S1412、对所述时间序列数据进行处理,得到预设位浮点数的第二特征数据;
S1413、对所述预设位浮点数的第二特征数据进行处理,得到有监督学习的数据;
S1414、根据所述有监督学习的数据和公式,得到遗忘参
数;
S1415、根据所述遗忘参数和公式、、,得到更新后的状态数据;
S146、根据所述更新后的状态数据和公式、,
得到相似产品在预设时间段内的预测结果;
其中,为t时刻的遗忘参数,为激活函数,为t时刻遗忘门的权重,为t-1时
刻的预测结果,为预设时间段,为t时刻遗忘门的偏差向量,为t时刻的输入门,为t时
刻输入门的权重, 为t时刻输入门的偏差向量,为t时刻的候选值,为t时刻候选值的
权重,为t时刻候选值的偏差向量,为t时刻的元胞状态,为t-1时刻的元胞状态,为
t时刻的输出门,为t时刻输出门的权重,为t时刻输出门的偏差向量,为t时刻的预测
结果。
该实施例中的预设预测模型通过以下过程进行训练:
S1421、获取相似产品历史时间段内的产品规则维度、产品购买信息维度以及至少一个时间段维度的历史第二特征数据;
具体的,从历史业务数据中获取到相似产品在过去的一段时间内(该时间段可以由用户设置,如过去的一年)的业务数据,该业务数据包括产品规则维度,包括以下中的至少一项:出行周期、客票类型、适用航线、可兑换次数、航线兑换次数、未成行航班数、产品售价等信息;产品购买信息维度,包括以下三项:产品名称、购买日期、销量;时间段维度,包括以下中的至少一项:星期、月份、季节、假期特征。
S1422、对所述历史第二特征数据进行预处理,得到预处理后的历史第二特征数据;
获取到业务数据后,对其进行预处理操作,包括数据去重、字段分离、填充缺失项等,确保数据的准确性和完整性。
具体的,对业务数据中对异常数据及缺失数据进行插补时,设互异节点为,对应
函数值为,构造n次插值多项式,该过程可表示为:
其中,为差值多项式,为第k个对应函数值,为插值基函数,为,为对
应函数值,x为第1个互异节点,为第k-1个互异节点,为第k个互异节点,为第k+1
个互异节点,i,k∈{0,1,……n}。
由于销量数据上下界相差较大,数值波动幅度变动较大会对预测模型的准确性造
成影响,因此对销量数据y进行对数平滑处理,该过程可表示为: ,其中,为
平滑处理后的销量数据,y为原始销量数据。
另外,由于销量数据数值可能过大,会导致后续计算量过大,因此,将原始销量数
据转换到[0,1]区间,以减小计算量,提高工作效率。转换方法为:,其中,为转换后的销量数据,为平滑处理后的销量数据,为平滑处理后的销量数据中
的最小值,为平滑处理后的销量数据中的最大值。
S1423、对所述预处理后的历史第二特征数据进行筛选,得到筛选后的历史第二特征数据;
由于销量受到季节性、周期性等明显时间特征的影响,还需计算星期、月份、季节、
假期特征等(统称为衍生特征)属性与销量的关系,即计算衍生特征与销量的相关系数,筛
选出相关系数高于预设值的衍生特征作为后续的训练数据。相关系数r计算过程可表示为:,其中,Cov(X,Y)为相似产品衍生特征与目标产品衍生特征的协方差;
Var[X]、Var[Y]分别表示相似产品衍生特征的方差、目标产品衍生特征的方差。
通过上述对业务数据的预处理和筛选,得到了符合要求的衍生特征数据和销量数据。
S1424、将所述筛选后的历史第二特征数据构建为历史时间序列数据;
将处理好的业务数据按照购买日期进行排序,得到有序的销量数据、规则特征数据和衍生特征数据。
S1425、对所述历史时间序列数据进行处理,得到32位浮点数的训练数据;
由于32 位浮点数的数据类型具有可以表示较大范围的实数、精度较高、适用于大多数计算场景,同时,32 位浮点数的运算速度较快,计算结果较为稳定,因此,将历史时间序列数据处理成32 位浮点数的数据类型的训练数据,有利于提高计算效率和方法的稳定性。
S1426、对所述训练数据进行处理,得到有监督学习的训练数据;
S1427、将所述有监督学习的训练数据按照预设比例进行划分,得到训练集和测试集;
具体的,可以按照8:2的比例对训练数据进行划分,选取大比例样本数作训练集,小比例样本数作测试集,并参与后续迭代训练。
S1428、按照预设窗口长度和训练集对预设网络模型进行训练,得到训练后的网络模型;
预设窗口长度为选取的数据量,如预设窗口长度10,则对预设网络模型进行训练时,将10天的数据量输入预设网络模型进行训练。
S1429、使用测试集对所述训练后的网络模型进行验证,得到预设预测模型。
本发明的一可选实施例中,S15,包括:
将所述预测结果和所述相关性权重输入公式,计算得到目标产
品在预设时间段内的销量数据;
其中,为目标产品在预设时间段内的销量数据,为相似产品的总个数,为第i个
相似产品的预测结果,为第i个规则特征/衍生特征的相关性权重,z为所有相似产品的预
测结果的总和,w为所有规则特征和衍生特征的相关性权重构成的权重向量。
由于原始销量数据做了平滑处理,因此,计算得到目标产品在预设时间段内的销
量数据后,还需进行反平滑处理,得到真实的预测销量,方法为:,其中,s为目标
产品在预设时间段内真实的预测销量,为目标产品在预设时间段内的销量数据。
本发明的一可选实施例中,所述目标产品的销量数据的预测方法还包括:
S16、获取目标产品在预设时间段内的真实销量数据;
S17、使用所述真实销量数据和所述第一特征数据对所述预设预测模型进行调整。
具体的,记录预测到目标产品在未来预设时间段内如D天销量的数据,待其真实销
量数据产生后,将真实数据作为反馈,与预测结果进行比较并计算误差。设目标产品销售天
数为X,当时,将目标产品的真实销量数据及其规则特征、衍生特征加入模型的训
练数据中,对预设预测模型重新训练。此时通过动态学习和修正的方式调整特征权重,即重
新计算多个相似产品的总销量预测数值,动态减小预测误差。
如图2所示,本发明实施例的目标产品的销量数据的预测方法的一个具体实施例为:
新款预付费产品销售一段时间后,会产生一些业务数据,从航空公司的业务***中获取新款预付费产品的产品规则维度、产品购买信息维度以及多个时间段维度的第一特征数据,产品规则维度为产品规则特征,包括以下中的至少一项:出行周期、客票类型、适用航线、可兑换次数、航线兑换次数、未成行航班数、产品售价等信息;产品购买信息维度为产品购买信息,至少包括以下三项:产品名称、购买日期、销量;时间段维度是从产品规则维度中提取出的衍生特征,包括以下中的至少一项:星期、月份、季节、假期特征。第一特征数据为包括上述三个维度的业务数据。
选取与目标产品(新预付费产品)制定规则相似的多个历史产品,从航空公司的业务***中获取过去一个时间段内(可设定为以当前时间为准的过去的范围性时间段)各相似产品的产品规则维度、产品购买信息维度以及多个时间段维度的第二特征数据,第二特征数据是与第一特征数据的数据类型相同的包括上述三个维度的业务数据。历史产品选型并非局限于固定的几种,可根据航司新推出的目标产品的特征并根据业务进行分析,根据新产品的特征进行判断,优先选择与其制定规则相似性高的产品;各历史产品之间的特征与新产品特征之间应尽量满足控制变量法。
设历史产品的产品规则特征的数量为v,通过标签编码或者独热编码的方式对产
品规则特征进行标识,如以数字代表某个产品规则特征,方便查看和计算,节省工作量。收
集以上数据后需对其进行预处理操作,包括数据去重、字段分离、填充缺失项等,确保数据
的准确性和完整性。现有数据中,销量数据上下界相差较大。数值波动幅度变动较大会对模
型的准确性造成影响。现对销量y进行对数平滑处理,该过程可表示为: ,其
中,为平滑处理后的销量数据,y为原始销量数据。
此外,由于特征中包含离散属性(如规则特征和衍生特征)和连续属性,现将离散
属性用标签编码处理,以数字代表某个产品规则特征。连续属性则选用min-max标准化方
式,将原始销量数据映射到[0,1]区间,以节省计算量,提高方法的效率。转换函数可表示
为: ,其中,为转换后的销量数据,为平滑处理后的销量数据,为平滑处理后的销量数据中的最小值,为平滑处理后的销量数据中的最大值。
由于销量受到季节性、周期性等明显时间特征的影响,还需计算星期、月份、季节、
假期特征等(下文统一称为衍生特征)属性与销量的关系。相关系数r计算过程可表示为:,其中,Cov(X,Y)为相似产品衍生特征与目标产品衍生特征的协方差;
Var[X]、Var[Y]分别表示相似产品衍生特征的方差、目标产品衍生特征的方差。
将r小于0.8与销量相关性较小的衍生特征删除,选取符合条件的系数值对应的衍生特征加入特征集。此时,设符合条件的衍生特征数为j,再设选取历史N个产品,每一产品均包括以上衍生特征,数量为P。则除销量数据外,共P-1个特征。
将处理好的原始数据按时间序列排序,构建为时间序列数据,并以8:2的比例对数据集进行划分。选取大比例样本数作训练集,小比例样本数作测试集,并参与后续迭代训练。
由于每种预付费产品的销售时间不同,销量也因制约其本身的各种规则影响而呈
现多样性。现将时间作为自变量按24小时制划分,每种预付费产品的销量作为因变量。此
外,将上文提及并选出的衍生特征也作因变量。设因变量个数为F。将数据定义为,,其中i表示窗口位序,L表示时间序列的长度(如10天、20天等),N为每一产品对
应时间的销量,变量j表示符合条件的衍生特征数。现需在源域时间序列中定义窗口,设窗
口长度为k,则k≤L。预测的未来周期由k决定。滑动窗口及产生系列模式可表示为, 。具体过程可以是:
输入:数据集dataset
输出:预测值predata
方法:
1:Dataset ← read_csv(train_set)、read_csv(val_set);//读取数据集
2:Values ← Dataset.values.astype(float32);//将数据构造成32位浮点数
3:Reframed ← series_to_supervised(Scaler); //有监督数据转换
4:train_X, train_y ← train[]; //拆分输入输出
5:val_X, val_y ← val[];//拆分输入输出
6:model.compile();//建模
7:model.fit();//训练模型
8:predata ← model.predict();//得到预测结果
9:return predata;//将预测结果返回
设置动态学习率,初始值为0.01,分别在训练批次为8、32处缩小为原来的0.1倍。
新预付费产品的销量数据较少,为小样本数据,因此,计算新预付费产品的规则特
征与相似产品的规则特征的相关性、新预付费产品的衍生特征与相似产品的衍生特征的相
关性,过程为:,
其中,s为目标产品与相似产品的相关性,s∈,取值范围为[-1,1]。其数值越
大,相关性越强,g为规则特征/衍生特征,m为规则特征和衍生特征的总个数(即v+j),为
目标产品的规则特征/衍生特征,为相似产品的规则特征/衍生特征。
再对相关系数进行标准化处理,计算过程可表示为:
其中,为第i个规则特征/衍生特征的相关性权重,为目标产品与相似产品第i
个规则特征/衍生特征的特征相关性,m为规则特征和衍生特征的总个数,为目标产品的
第i个规则特征/衍生特征,为相似产品的第i个规则特征/衍生特征。
相关性权重受特征相关性影响,呈线性正相关。
此时,可计算新预付费产品的未来销量。设预测未来的时间长度为D,D为正整数,
可为1、2、3…7、10…365、…、可表示为未来一天、未来一周、未来一年等,D可自定义设置。将
每个长度为k的窗口向后依次递推至D天,得到多个相似产品的总销量预测值z,z∈。为
得到新预付费产品的销量值,其计算过程可表示为:
;
其中,为目标产品在预设时间段内的销量数据, ,为相似产品的总个
数,为第i个相似产品的预测结果,为第i个规则特征/衍生特征的相关性权重,z为所有
相似产品的预测结果的总和,w为所有规则特征和衍生特征的相关性权重构成的权重向量。
得到新预付费产品未来D天的预测销量值后,还需对其进行反平滑处理得到真实
预测数值,计算过程可表示为:,其中,s为目标产品在预设时间段内真实的预测
销量,为目标产品在预设时间段内的销量数据。
记录预测到新预付费产品未来D天销量的数据,待其真实销量数据产生后,将真实
数据作为反馈,与预测结果进行比较并计算误差。设待新产品销售天数为X,当时,
将新产品销量加入模型的输入数据中,即因变量数增加1,表示为。此时通过动态
学习和修正的方式调整特征权重,即重新计算多个相似产品的总的销量预测的数值,动态
减小预测误差。
本发明实施例的目标产品的销量数据的预测方法根据业务基础,选取部分与新推出的预付费产品相似的历史产品,动态提取其购买信息以及新产品现有的少量购买数据,同时探究数据中的趋势性、周期性及季节性等对销量的影响因素,进行数据处理与分析;利用预设预测模型,通过皮尔逊积矩相关系数及余弦相似度分别计算各产品对应特征与销量之间的相关性及新产品与历史产品的相似程度,建立基于迁移学习的航司预付费产品销量预测方法对新产品销量联合预测,进而作出收益分析。以此为航空公司提供有力的决策支持,帮助其合理规划生产和供应链,优化库存管理,并制定合理的生产计划和有效的市场推广策略,从而提高企业的市场竞争力和盈利能力。
如图3所示,本发明的实施例提出一种目标产品的销量数据的预测装置100,包括:
第一获取模块101,用于获取目标产品的至少一个维度的第一特征数据;
第二获取模块102,用于获取与所述目标产品相关性大于预设值的相似产品的至少一个维度的第二特征数据;
确定模块103,用于确定所述第一特征数据和所述第二特征数据的相关性权重;
输入模块104,用于将所述相似产品的至少一个维度的第二特征数据输入预设预测模型进行销量数据预测,获得相似产品在预设时间段内的预测结果;
预测模块105,用于根据所述预测结果和所述相关性权重,确定目标产品在预设时间段内的销量数据。
本发明实施例提出的目标产品的销量数据的预测装置,通过获取目标产品的第一特征数据,以及与目标产品相关性大于预设值的相似产品的第二特征数据,再确定第一特征数据和第二特征数据的相关性权重,根据相似产品在预设时间段内的销量预测结果和相关性权重,计算得到目标产品在预设时间段内的销量数据,提高了对目标产品销量预测的准确性和可靠性,具有准确性较高的优点。
可选的,获取目标产品的至少一个维度的第一特征数据,包括:
获取目标产品的产品规则维度、产品购买信息维度以及至少一个时间段维度的第一特征数据。
可选的,所述目标产品与所述相似产品的相关性通过以下过程确定:
获取目标产品的规则特征和衍生特征、相似产品的规则特征和衍生特征;
根据所述目标产品的规则特征和衍生特征、所述相似产品的规则特征和衍生特征,计算得到所述目标产品与所述相似产品的相关性;公式为:
,
其中,s为目标产品与相似产品的相关性,g为规则特征/衍生特征,m为规则特征和
衍生特征的总个数,为目标产品的规则特征/衍生特征,为相似产品的规则特征/衍生
特征。
可选的,确定所述第一特征数据和所述第二特征数据的相关性权重,包括:
获取目标产品的规则特征和衍生特征、相似产品的规则特征和衍生特征;
根据所述目标产品的规则特征和衍生特征、所述相似产品的规则特征和衍生特
征,计算得到特征相关性;公式为:;
根据所述特征相关性,计算得到所述第一特征数据和所述第二特征数据的相关性
权重;公式为:;
其中,为第i个规则特征/衍生特征的相关性权重,为目标产品与相似产品第i
个规则特征/衍生特征的特征相关性,m为规则特征和衍生特征的总个数,为目标产品的
第i个规则特征/衍生特征,为相似产品的第i个规则特征/衍生特征。
可选的,将所述相似产品的至少一个维度的第二特征数据输入预设预测模型进行销量数据预测,获得相似产品在预设时间段内的预测结果,包括:
将所述相似产品的至少一个维度的第二特征数据构建为时间序列数据;所述时间序列数据包括时间和规则特征/衍生特征;
对所述时间序列数据进行处理,得到预设位浮点数的第二特征数据;
对所述预设位浮点数的第二特征数据进行处理,得到有监督学习的数据;
根据所述有监督学习的数据和公式,得到遗忘参数;
根据所述遗忘参数和公式、、,得到更新后的状态数据;
根据所述更新后的状态数据和公式、,得到
相似产品在预设时间段内的预测结果;
其中,为t时刻的遗忘参数,为激活函数,为t时刻遗忘门的权重,为t-1时
刻的预测结果,为预设时间段,为t时刻遗忘门的偏差向量,为t时刻的输入门,为t时
刻输入门的权重, 为t时刻输入门的偏差向量,为t时刻的候选值,为t时刻候选值的
权重,为t时刻候选值的偏差向量,为t时刻的元胞状态,为t-1时刻的元胞状态,为
t时刻的输出门,为t时刻输出门的权重,为t时刻输出门的偏差向量,为t时刻的预测
结果。
可选的,预设预测模型通过以下过程进行训练:
获取相似产品历史时间段内的产品规则维度、产品购买信息维度以及至少一个时间段维度的历史第二特征数据;
对所述历史第二特征数据进行预处理,得到预处理后的历史第二特征数据;
对所述预处理后的历史第二特征数据进行筛选,得到筛选后的历史第二特征数据;
将所述筛选后的历史第二特征数据构建为历史时间序列数据;
对所述历史时间序列数据进行处理,得到32位浮点数的训练数据;
对所述训练数据进行处理,得到有监督学习的训练数据;
将所述有监督学习的训练数据按照预设比例进行划分,得到训练集和测试集;
按照预设窗口长度和训练集对预设网络模型进行训练,得到训练后的网络模型;
使用测试集对所述训练后的网络模型进行验证,得到预设预测模型。
可选的,根据所述预测结果和所述相关性权重,确定目标产品在预设时间段内的销量数据,包括:
将所述预测结果和所述相关性权重输入公式,计算得到目标产
品在预设时间段内的销量数据;
其中,为目标产品在预设时间段内的销量数据,为相似产品的总个数,为第i个
相似产品的预测结果,为第i个规则特征/衍生特征的相关性权重,z为所有相似产品的预
测结果的总和,w为所有规则特征和衍生特征的相关性权重构成的权重向量。
本发明的一可选实施例中,所述目标产品的销量数据的预测装置还包括:
第三获取模块106,用于获取目标产品在预设时间段内的真实销量数据;
调整模块107,用于使用所述真实销量数据和所述第一特征数据对所述预设预测模型进行调整。
需要说明的是,该装置是与上述目标产品的销量数据的预测方法对应的装置,上述方法实施例中的所有实现方式均适用于该装置的实施例中,也能达到相同的技术效果。本实施例中不再赘述。
本发明实施例还提供一种计算设备,包括:处理器、存储有计算机程序的存储器,所述计算机程序被处理器运行时,执行如上述实施例中任一项所述的方法。上述方法实施例中的所有实现方式均适用于该装置的实施例中,也能达到相同的技术效果。本实施例中不再赘述。
本发明实施例还提供一种计算机可读存储介质,其上存储指令,当所述指令在计算机上运行时,使得计算机执行如上述实施例中任一项所述的方法。上述方法实施例中的所有实现方式均适用于该装置的实施例中,也能达到相同的技术效果。本实施例中不再赘述。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (8)
1.一种目标产品的销量数据的预测方法,其特征在于,包括:
获取目标产品的至少一个维度的第一特征数据;
获取与所述目标产品相关性大于预设值的相似产品的至少一个维度的第二特征数据;
确定所述第一特征数据和所述第二特征数据的相关性权重;
将所述相似产品的至少一个维度的第二特征数据输入预设预测模型进行销量数据预测,获得相似产品在预设时间段内的预测结果;
根据所述预测结果和所述相关性权重,确定目标产品在预设时间段内的销量数据;
其中,将所述相似产品的至少一个维度的第二特征数据输入预设预测模型进行销量数据预测,获得相似产品在预设时间段内的预测结果,包括:
将所述相似产品的至少一个维度的第二特征数据构建为时间序列数据;所述时间序列数据包括时间和规则特征/衍生特征;
对所述时间序列数据进行处理,得到预设位浮点数的第二特征数据;
对所述预设位浮点数的第二特征数据进行处理,得到有监督学习的数据;
根据所述有监督学习的数据和公式,得到遗忘参数;
根据所述遗忘参数和公式、/>、,得到更新后的状态数据;
根据所述更新后的状态数据和公式、/>,得到相似产品在预设时间段内的预测结果;
其中,为t时刻的遗忘参数,/>为激活函数,/>为t时刻遗忘门的权重,/>为t-1时刻的预测结果,/>为预设时间段,/>为t时刻遗忘门的偏差向量,/>为t时刻的输入门,/>为t时刻输入门的权重, />为t时刻输入门的偏差向量,/>为t时刻的候选值,/>为t时刻候选值的权重,为t时刻候选值的偏差向量,/>为t时刻的元胞状态,/>为t-1时刻的元胞状态,/>为t时刻的输出门,/>为t时刻输出门的权重,/>为t时刻输出门的偏差向量,/>为t时刻的预测结果;
其中,预设预测模型通过以下过程进行训练:
获取相似产品历史时间段内的产品规则维度、产品购买信息维度以及至少一个时间段维度的历史第二特征数据;其中,历史第二特征数据包括与产品购买信息维度中销量的相关系数高于预设值的衍生特征;
对所述历史第二特征数据进行预处理,得到预处理后的历史第二特征数据;
对所述预处理后的历史第二特征数据进行筛选,得到筛选后的历史第二特征数据;
将所述筛选后的历史第二特征数据构建为历史时间序列数据;
对所述历史时间序列数据进行处理,得到32位浮点数的训练数据;
对所述训练数据进行处理,得到有监督学习的训练数据;
将所述有监督学习的训练数据按照预设比例进行划分,得到训练集和测试集;
按照预设窗口长度和训练集对预设网络模型进行训练,得到训练后的网络模型;
使用测试集对所述训练后的网络模型进行验证,得到预设预测模型。
2.根据权利要求1所述的目标产品的销量数据的预测方法,其特征在于,获取目标产品的至少一个维度的第一特征数据,包括:
获取目标产品的产品规则维度、产品购买信息维度以及至少一个时间段维度的第一特征数据。
3.根据权利要求1所述的目标产品的销量数据的预测方法,其特征在于,所述目标产品与所述相似产品的相关性通过以下过程确定:
获取目标产品的规则特征和衍生特征、相似产品的规则特征和衍生特征;
根据所述目标产品的规则特征和衍生特征、所述相似产品的规则特征和衍生特征,计算得到所述目标产品与所述相似产品的相关性;公式为:
,
其中,s为目标产品与相似产品的相关性,g为规则特征/衍生特征,m为规则特征和衍生特征的总个数,为目标产品的规则特征/衍生特征,/>为相似产品的规则特征/衍生特征。
4.根据权利要求1所述的目标产品的销量数据的预测方法,其特征在于,确定所述第一特征数据和所述第二特征数据的相关性权重,包括:
获取目标产品的规则特征和衍生特征、相似产品的规则特征和衍生特征;
根据所述目标产品的规则特征和衍生特征、所述相似产品的规则特征和衍生特征,计算得到特征相关性;公式为:;
根据所述特征相关性,计算得到所述第一特征数据和所述第二特征数据的相关性权重;公式为:;
其中,为第i个规则特征/衍生特征的相关性权重,/>为目标产品与相似产品第i个规则特征/衍生特征的特征相关性,m为规则特征和衍生特征的总个数,/>为目标产品的第i个规则特征/衍生特征,/>为相似产品的第i个规则特征/衍生特征。
5.根据权利要求1所述的目标产品的销量数据的预测方法,其特征在于,根据所述预测结果和所述相关性权重,确定目标产品在预设时间段内的销量数据,包括:
将所述预测结果和所述相关性权重输入公式,计算得到目标产品在预设时间段内的销量数据;
其中,为目标产品在预设时间段内的销量数据,/>为相似产品的总个数,/>为第i个相似产品的预测结果,/>为第i个规则特征/衍生特征的相关性权重,z为所有相似产品的预测结果的总和,w为所有规则特征和衍生特征的相关性权重构成的权重向量。
6.一种目标产品的销量数据的预测装置,其特征在于,包括:
第一获取模块,用于获取目标产品的至少一个维度的第一特征数据;
第二获取模块,用于获取与所述目标产品相关性大于预设值的相似产品的至少一个维度的第二特征数据;
确定模块,用于确定所述第一特征数据和所述第二特征数据的相关性权重;
输入模块,用于将所述相似产品的至少一个维度的第二特征数据输入预设预测模型进行销量数据预测,获得相似产品在预设时间段内的预测结果;
其中,将所述相似产品的至少一个维度的第二特征数据输入预设预测模型进行销量数据预测,获得相似产品在预设时间段内的预测结果,包括:
将所述相似产品的至少一个维度的第二特征数据构建为时间序列数据;所述时间序列数据包括时间和规则特征/衍生特征;
对所述时间序列数据进行处理,得到预设位浮点数的第二特征数据;
对所述预设位浮点数的第二特征数据进行处理,得到有监督学习的数据;
根据所述有监督学习的数据和公式,得到遗忘参数;
根据所述遗忘参数和公式、/>、,得到更新后的状态数据;
根据所述更新后的状态数据和公式、/>,得到相似产品在预设时间段内的预测结果;
其中,为t时刻的遗忘参数,/>为激活函数,/>为t时刻遗忘门的权重,/>为t-1时刻的预测结果,/>为预设时间段,/>为t时刻遗忘门的偏差向量,/>为t时刻的输入门,/>为t时刻输入门的权重, />为t时刻输入门的偏差向量,/>为t时刻的候选值,/>为t时刻候选值的权重,为t时刻候选值的偏差向量,/>为t时刻的元胞状态,/>为t-1时刻的元胞状态,/>为t时刻的输出门,/>为t时刻输出门的权重,/>为t时刻输出门的偏差向量,/>为t时刻的预测结果;
其中,预设预测模型通过以下过程进行训练:
获取相似产品历史时间段内的产品规则维度、产品购买信息维度以及至少一个时间段维度的历史第二特征数据;
对所述历史第二特征数据进行预处理,得到预处理后的历史第二特征数据;
对所述预处理后的历史第二特征数据进行筛选,得到筛选后的历史第二特征数据;其中,历史第二特征数据包括与产品购买信息维度中销量的相关系数高于预设值的衍生特征;
将所述筛选后的历史第二特征数据构建为历史时间序列数据;
对所述历史时间序列数据进行处理,得到32位浮点数的训练数据;
对所述训练数据进行处理,得到有监督学习的训练数据;
将所述有监督学习的训练数据按照预设比例进行划分,得到训练集和测试集;
按照预设窗口长度和训练集对预设网络模型进行训练,得到训练后的网络模型;
使用测试集对所述训练后的网络模型进行验证,得到预设预测模型;
预测模块,用于根据所述预测结果和所述相关性权重,确定目标产品在预设时间段内的销量数据。
7.一种计算设备,其特征在于,包括:处理器、存储有计算机程序的存储器,所述计算机程序被处理器运行时,执行如权利要求1至5任一项所述的方法。
8.一种计算机可读存储介质,其特征在于,其上存储指令,当所述指令在计算机上运行时,使得计算机执行如权利要求1至5任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311452296.6A CN117196695B (zh) | 2023-11-03 | 2023-11-03 | 一种目标产品的销量数据的预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311452296.6A CN117196695B (zh) | 2023-11-03 | 2023-11-03 | 一种目标产品的销量数据的预测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117196695A CN117196695A (zh) | 2023-12-08 |
CN117196695B true CN117196695B (zh) | 2024-02-27 |
Family
ID=88990876
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311452296.6A Active CN117196695B (zh) | 2023-11-03 | 2023-11-03 | 一种目标产品的销量数据的预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117196695B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117708691B (zh) * | 2024-02-06 | 2024-05-10 | 东北大学 | 间歇过程监控方法及存储介质、计算机设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107038190A (zh) * | 2016-10-28 | 2017-08-11 | 厦门大学 | 一种应用于淘宝网的智能促销方案建模方法 |
KR20200036219A (ko) * | 2018-09-28 | 2020-04-07 | 충북대학교 산학협력단 | Lstm을 이용한 농산물 가격 및 판매량 예측 방법 |
CN114677174A (zh) * | 2022-03-25 | 2022-06-28 | 北京京东尚科信息技术有限公司 | 一种计算未上架物品销量的方法和装置 |
CN114881676A (zh) * | 2021-02-05 | 2022-08-09 | 株式会社日立制作所 | 一种新产品销量的预测方法 |
CN115423538A (zh) * | 2022-11-02 | 2022-12-02 | 深圳市云积分科技有限公司 | 新品销量数据的预测方法及装置、存储介质、电子设备 |
CN116308486A (zh) * | 2023-03-16 | 2023-06-23 | 广西中烟工业有限责任公司 | 一种目标卷烟销量预测方法、装置、电子设备及存储介质 |
-
2023
- 2023-11-03 CN CN202311452296.6A patent/CN117196695B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107038190A (zh) * | 2016-10-28 | 2017-08-11 | 厦门大学 | 一种应用于淘宝网的智能促销方案建模方法 |
KR20200036219A (ko) * | 2018-09-28 | 2020-04-07 | 충북대학교 산학협력단 | Lstm을 이용한 농산물 가격 및 판매량 예측 방법 |
CN114881676A (zh) * | 2021-02-05 | 2022-08-09 | 株式会社日立制作所 | 一种新产品销量的预测方法 |
CN114677174A (zh) * | 2022-03-25 | 2022-06-28 | 北京京东尚科信息技术有限公司 | 一种计算未上架物品销量的方法和装置 |
CN115423538A (zh) * | 2022-11-02 | 2022-12-02 | 深圳市云积分科技有限公司 | 新品销量数据的预测方法及装置、存储介质、电子设备 |
CN116308486A (zh) * | 2023-03-16 | 2023-06-23 | 广西中烟工业有限责任公司 | 一种目标卷烟销量预测方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN117196695A (zh) | 2023-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Rico-Juan et al. | Machine learning with explainability or spatial hedonics tools? An analysis of the asking prices in the housing market in Alicante, Spain | |
CN110969285B (zh) | 预测模型训练方法、预测方法、装置、设备及介质 | |
CN111563706A (zh) | 一种基于lstm网络的多变量物流货运量预测方法 | |
CN108710905B (zh) | 一种基于多模型联合的备件数量预测方法和*** | |
CN117196695B (zh) | 一种目标产品的销量数据的预测方法及装置 | |
CN109978230B (zh) | 一种基于深度卷积神经网络的电力销售金额智能预测方法 | |
CN111476677A (zh) | 一种基于大数据的用电类别售电量分析与预测方法及*** | |
CN114549046A (zh) | 基于融合模型的销售预测方法、***、设备及存储介质 | |
Chang et al. | A hybrid system by evolving case-based reasoning with genetic algorithm in wholesaler's returning book forecasting | |
CN113962745A (zh) | 基于prophet模型及大数据的销量预测方法和*** | |
US11995667B2 (en) | Systems and methods for business analytics model scoring and selection | |
CN107958297A (zh) | 一种产品需求预测方法及产品需求预测装置 | |
Нгуен et al. | Non-stationary time series prediction using one-dimensional convolutional neural network models | |
CN115587865B (zh) | 基于风险映射的土地价格评估方法、计算设备及存储介质 | |
CN116977091A (zh) | 个股投资组合的确定方法、装置、电子设备及可读存储介质 | |
CN116308448A (zh) | 一种基于神经网络的商户日交易量预测方法及*** | |
CN115936184A (zh) | 一种适应多用户类型的负荷预测匹配方法 | |
CN113326976B (zh) | 一种基于时空关联的港口货运量在线预测方法及*** | |
CN115130924A (zh) | 一种源网荷储背景下微电网电力设备资产评估方法及*** | |
CN114282657A (zh) | 一种市场数据长期预测模型训练方法、装置、设备及存储介质 | |
JP3268520B2 (ja) | ガス需要量の予測方法 | |
CA3160715A1 (en) | Systems and methods for business analytics model scoring and selection | |
KR20220147968A (ko) | 실시간 거시지표 예측 기반 주가 예측 시스템 | |
Nagashima et al. | Data Imputation Method based on Programming by Example: APREP-S | |
CN114548620A (zh) | 物流准时保业务推荐方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |