CN113962745A - 基于prophet模型及大数据的销量预测方法和*** - Google Patents

基于prophet模型及大数据的销量预测方法和*** Download PDF

Info

Publication number
CN113962745A
CN113962745A CN202111278216.0A CN202111278216A CN113962745A CN 113962745 A CN113962745 A CN 113962745A CN 202111278216 A CN202111278216 A CN 202111278216A CN 113962745 A CN113962745 A CN 113962745A
Authority
CN
China
Prior art keywords
sales
model
data
optimal
historical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111278216.0A
Other languages
English (en)
Inventor
侯坤
董蕴博
王在清
姚建丰
刘民娜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing Changan Automobile Co Ltd
Original Assignee
Chongqing Changan Automobile Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing Changan Automobile Co Ltd filed Critical Chongqing Changan Automobile Co Ltd
Priority to CN202111278216.0A priority Critical patent/CN113962745A/zh
Publication of CN113962745A publication Critical patent/CN113962745A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Artificial Intelligence (AREA)
  • Game Theory and Decision Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及大数据挖掘技术领域,针对现有的汽车行业的销量预测方法预测准确率低的问题,提出一种基于Prophet算法的行业大数据销量预测方法,包括:基于facebook的prophet算法,对历史销量数据进行节假日、事件等分析确定影响参数,采用历史销量数据对proohet模型进行训练测试得到最优模型并对销量进行预测得到预测值一;对影响因子进行移动平均、变形、降维、滞后等处理,采用历史销量数据和所有影响因子数据进行机器学习模型(神经网络、xgboost等)训练测试得到最优机器学习模型,利用最优机器学习模型和因子预测值对销量进行预测得到预测值二;根据销量预测值一、销量预测值二得到最终的销量预测值。本发明适用于汽车产品销量的预测。

Description

基于prophet模型及大数据的销量预测方法和***
技术领域
本发明涉及大数据技术领域,特别涉及一种基于数据挖掘技术的行业产品销售预测方法。
背景技术
为了更好地控制库存量,降低资金压力进而从根本上控制成本,提高市场应变能力,提升企业利润,迫切需要有效的销量预测方法,特别是汽车行业,资金占用成本高,改款周期长,库存压力大。目前,汽车行业处于普及初期向普及后期的过渡阶段,在结束了单边增长,且大量不具有竞争力的产品被市场边缘化,销量预测一方面可以促进产销匹配,另一方面则可以识别细分市场趋势变化,为产品改款提供支撑。销量预测使用历史销量数据和相关影响因素数据,通过数据分析、算法模型等技术搭建销量预测***。目前已有的销量预测技术不适用于汽车行业且准确率偏低。
公开号为CN109214601A,名称为“家电行业大数据销量预测方法”的中国专利,通过历史销量数据和影响因子数据建立两种时间序列模型和一种机器学习模型,该专利中使用的时间序列模型选择需要特定的专业知识,节假日和事件影响无法体现在模型中,且无法通过因子的前瞻性预测未来的风险和机会。
公开号为CN106779859A,名称为“一种移动终端产品实时销量预测方法”的中国发明专利,通过历史销量数据以及用户访问搜索引擎和电子商务网站的历史记录数据进行销量的预测,该专利中使用的行业特性数据只有用户的搜索频率,特征量较少,在利用算法模型对销量进行预测前未对历史销量趋势进行分析,存在所选择的时间序列模型不符合实际的风险。
公开号CN109685583A,发明名称“一种基于大数据的供应链需求预测方法”通过使用商品的历史销售数据来构造不同的数据划分和特征工程,并且采用树模型和线性模型两种算法构建模型进行预测,从而保证模型的差异性,最终将规则模型和差异度较大且预测效果精准的算法模型进行基于树形结构的融合得到最终的预测未来的销量结果;能够精准预测远期的商品销售,为供应链提供数据基础,为企业建立全球化供应链方案提供关键的技术支持。使用规则模型的最优常值回归方法,对用户的历史行为数据进行处理,并预测出供应链需求的第一结果,划分出历史行为数据区间中满足销量变化趋势的训练集数据,并对训练集数据进行选择以及扩充操作;对用户历史数据进行特征操作,构建出不同特征的样本集;对构建出的样本集进行基于均方根误差最小值的特征选择;建立包括回归模型和多个树模型;将规则模型与算法模型进行基于树形结构的融合,从而获得供应链需求的最终预测结果。但上述预测方法没有考虑行业的特征及不同时间及事件对销量影响因素,预测结果不够准确。
发明内容
本发明所要解决的技术问题是:针对现有的产品销量预测***,没有考虑汽车行业销售中受事件影响、改型周期长、占用资金量大等方面因素,采用通用的方法预测准确率低等问题,提出一种基于大数据挖掘技术的汽车行业销量预测方法。
本发明解决上述技术问题采用的技术方案是:提出一种基于可分解模型prophet及大数据挖掘的销量预测方法,包括步骤:采集历史销量数据并分析节假日和事件影响,确定影响周期和强度,设置参数集并建立prophet模型,利用历史销量数据及影响周期和强度对prophet模型进行训练和测试得到销量最优prophet模型,利用该销量的最优prophet模型对销量进行预测得到销量预测值一;根据历史销量数据的相关性及回归效果预测影响因子,对影响因子和历史销量数据经过移动平均、变形、滞后处理,输入机器学***均值得到最终的销量预测值。
进一步地,设定销量均值持续偏离高于阈值的时间段为影响周期,销量均值变化量为强度,分析节假日和事件前后销量变化,确定不同级别事件的影响周期和强度。
进一步地,将历史销量数据按照时间顺序按预定比例分为训练集和测试集,利用训练集对设置好参数集的prophet模型进行训练,并用测试集对训练后的模型进行测试,调整参数集取值范围,得到误差最小的prophet模型为销量的最优prophet模型。
进一步地,将所有历史数据按照比例随机分为训练集和测试集,设置模型参数的取值范围、每组参数的取值组合,通过训练集训练机器学习模型,将测试集输入训练好的模型进行测试,选择测试集中误差最小时对应的参数作为最优参数,利用最优参数和所有历史数据再训练机器学习模型,获得最优机器学习模型。
进一步地,若影响因子的历史数据存在的缺失量未超过预定值,则根据缺失量两侧数据的均值进行填充,如超过预定值则删除影响因子对应的历史数据;若影响因子的历史数据变化剧烈,则进行移动平均处理;若影响因子的历史数据差异超过量级阈值,则对影响因子进行取对数处理;若多个影响因子存在强相关,则进行加权聚合构建一个复合影响因子;若影响因子的历史数据与销量相关性绝对值低于预设值,则删除该影响因子。
进一步地,采用影响因子各自对应的历史数据对时间序列进行训练得到各自相应的最优时间序列模型,根据最优时间序列模型对相应影响因子预测得到影响因子的预测值。
进一步地,prophet模型包括:趋势分析非周期变化g(t):用于拟合时间t序列中的分段线性增长或逻辑增长,季节性销量周期变化s(t),分析非规律性的节假日效应h(t),Prophet预测模型使用时间t为回归元,拟合线性和非线性的时间函数项,根据公式:y(t)=g(t)+s(t)+h(t)+et优化Prophet模型参数y(t)(时间函数),其中,误差项et反映异常变动。Prophet模型基于傅里叶级数建立季节效应模型计算季节性周期变化s(t)拟合并预测季节的销量,
Figure BDA0003330222580000041
其中,P为预测周期(通常可设为12个月),N为傅里叶阶数(用于控制精度),an和bn为傅里叶系数,。
本发明还提出一种基于可分解模型prophet及大数据挖掘的销量预测***,采集模块采集历史销量数据并分析节假日和事件影响,确定影响周期和强度,设置参数集并建立prophet模型,训练模块利用历史销量数据及影响周期和强度对prophet模型进行训练和测试得到销量最优prophet模型,预测模块利用该销量的最优prophet模型对销量进行预测得到销量预测值一,数据处理模块根据历史销量数据的相关性及回归效果预测影响因子,对影响因子和历史销量数据经过移动平均、变形、滞后处理,输入机器学***均值得到最终的销量预测值。
本发明通过prophet模型对时间序列数据处理的灵活性,将历史上在节假日和政策等内外部事件对汽车销量变化的影响周期和强度进行归纳汇总,并内置为prophet参数集,解决了人为标注的问题;对内外部影响因子数据深入分析,通过移动平均、变形、降维、滞后等处理,解决因子的自相关性问题,并通过机器学习模型识别关键影响因素,再结合滞后处理可得到前瞻性因子,为业务规划提供支撑;采用两种算法模型进行销量数据的预测,解决了已有技术中算法模型单一不能充分体现数据之间的复杂关系的问题,考虑汽车行业销售中受事件影响、改型周期长、占用资金量大等方面因素,提升了销量预测方法的准确率和合理性。
附图说明
图1为本发明预测方法的原理图;
图2本发明实施例预测方法实施流程图;
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚,以下结合附图及如下实施例对本发明进行进一步详细说明。如图1所示,行业大数据销量预测方法流程图,包括如下步骤:S1,根据历史销量数据并分析节假日和事件影响,确定不同节假日和事件的影响周期和强度,设置prophet模型的参数集,建立基于可分解模型prophet(基于可分解(趋势+季节+节假日)模型的开源库。可用简单直观的参数进行高精度的时间序列预测,并且支持自定义季节和节假日的影响)模型的参数集,采用历史销量数据进行训练和测试得到销量最优可分解模型prophet模型,利用该最优prophet模型对销量进行预测得到销量预测值一;S2,经过移动平均、变形、滞后等处理后的影响因子数据和历史销量数据,对机器学***均值得到最终的销量预测值。
根据分析结果确定不同节假日和事件的影响周期和强度,包括:例如若遇阳历节假日直接分析在当日前后14天、当月前后3个月的销量变化;若阴历节假日,转换为对应阳历日期,分析其影响周期和强度,销量均值持续偏离高于50%的时间段定义为影响周期,销量均值变化量为强度;若为事件,例如购置税政策、产品质量问题等,分析事件发生前后销量的变化,确定不同级别事件的影响周期和强度;周期和强度确定方式同上。通过影响因子的相关性及回归效果确定影响因子。每一个影响因子都有历史数据,例如时间段内每天的实销数据、库存数据、线索量数据、舆情数据;每月的宏观经济数据、竞品情报数据等。
Prophet预测模型使用时间为回归元,尝试拟合线性和非线性的时间函数项,采取类似指数平滑方法,将季节作为额外的成分建模。模型可分解为三个主要组成部分:趋势分析非周期变化:用于拟合时间序列中的分段线性增长或逻辑增长等非周期变化g(t),季节性周期变化s(t),节假日分析非规律性的节假日效应h(t)。根据公式:y(t)=g(t)+s(t)+h(t)+et优化Prophet模型参数,其中,误差项et反映异常变动。模型参数汇总如下:
表1:模型参数汇总表
参数名称 参数说明
growth ‘linear’或‘logistic’
changepoints 包括潜在突变点的日期列表
n_changepoints 突变点数量
changepoint_prior_scale 设定自动突变点选择的灵活性
interval_width 设置置信区间
changepoint_range 设置寻找突变点的比例
holidays 节假日名称和日期
yearly_seasonality 年度拟合
daily_seasonality 日度拟合
holiday_prior_scale 假日模型的强度
seasonality_mode 模型学习的方式
以下以简单举例对上述参数进行具体说明。其中,growth='linear'或growth="logistic",默认应该是linear,changepoint_prior_scale是设置模型对转折点拟合的灵敏度,值越高越灵活;interval_width=0.8(默认值),值越小,上下线的带宽越小;changepoint_range=0.9默认从数据的前90%中寻找异常数据;yearly_seasonality是年的拟合度,值越高越灵活,同时可以选择True和False来设定是否进行年度的拟合,同理与weekly_seasonality和daily_seasonality;holidays_prior_scale是假期的拟合度,同样值越高越灵活,前提是需要加入假期信息;模型学习的方式seasonality_mode默认情况下为加性,也可以选择乘性(multiplicative)、
趋势是对时间序列中的非周期部分或趋势部分拟合分段线性函数,线性拟合会将特殊点和缺失数据的影响降到最小,同时可根据随着人口变化的汽车保有量限制确定饱和增长曲线的最大值。当出现新产品发布、不可预见的灾难等情况时,增长率会发生突变,这些突变点是自动的,有需要的时候也可以手动输入突变点,随着突变点数量的增多,拟合变得更灵活。
为了拟合并预测季节的效果,基于傅里叶级数建立季节效应方程S(t),具体方程如下:
Figure BDA0003330222580000081
其中,P是周期(如年度数据的P是365.25,周数据的P是7),t是时间,n是累计求和的变量,an和bn为傅里叶系数,傅里叶阶数N是一个重要的参数,它用来定义模型中是否考虑高频变化,并用于提升预测精度,对季节性建模时,需要在给定N的情况下,估计参数[a1,b1……aN,bN]。
节假日和大事件会导致时间序列中出现可预测的波动。这些大事件前后的日期将会被单独考虑,并且通过拟合附加的参数模拟节假日和事件的效果。其中,可将历史销量数据按照确定的时间维度例如年、月、周、日进行汇总,分析历史销量数据在节假日和事件区间前后销量变化趋势的特征,如春节期间销量几乎为0,五一假日销量提升50%,购置税减半影响当年12月销量提高50%以上等,所述根据分析结果确定不同节假日和事件的影响周期和强度。
若阳历节假日直接分析在当日、当月及其前后一段时间的销量变化;若阴历节假日,通过年份转换为阳历日期,再分析其影响周期和强度;若为事件,例如购置税政策、产品质量问题等,分析事件发生前后销量的变化情况,分析确定不同级别事件的影响周期和强度;
若影响因子的历史数据存在缺失且缺失量未超过预定量,则根据缺失值两侧数据的均值进行填充,否则删除对应影响因子的历史数据;若影响因子的历史数据变化剧烈,则进行移动平均处理;若影响因子的历史数据量级差异大,则对影响因子进行取对数处理;若多个影响因子存在较强的相关性,则进行加权聚合构建一个复合因子;若影响因子的历史数据与销量相关性绝对值低于预设值,则删除该影响因子;对影响因子的总量、同比等形式进行分析,优选最优的形式;基于影响因子与销量的时间差,对影响因子做相应的滞后处理;所述机器学习模型可采用神经网络模型和Xgboost(Extreme Gradient Boosting)(大规模并行boosted tree的工具包。)模型。
采用影响因子各自的历史数据对时间序列模型进行训练得到各自相应的最优时间序列模型,根据最优时间序列模型对相应影响因子预测得到影响因子的预测值。企业内部与销量相关的数据包括销售属性数据、库存数据、产品生命周期数据、渠道数据、折扣数据和关键部件采购数据,企业外部与销量相关的数据包括经济数据、人口数据、竞争产品数据和网络舆情监控及口碑数据。所述销售属性数据包括车系、配置、价格、折扣、地区等(可通过威尔森***数据接口获取量化数据)。参数项分为自定义和模型自带,自定义参数根据历史数据特征确定,模型自带参数通过模型调试不断优化,经验数据被模型交叉检验效果。
采用历史销量数据对设置好参数集的prophet模型进行训练和测试得到销量最优prophet模型。具体为,将历史销量数据按照时间顺序按预定比例分为训练集和测试集,利用训练集对prophet模型进行训练得到训练模型,将测试集输入训练模型,比较测试集上预测结果与实际值的误差,调整参数集取值范围,得到误差最小的prophet模型为最优prophet模型。将需要进行预测的时间输入上述最优prophet模型得到与输入时间相对应的销量预测值一。
采用经过移动平均、变形、降维、滞后等处理后的影响因子数据和历史销量数据对机器学习模型进行训练和测试得到销量的最优机器学习模型,利用最优机器学习模型和影响因子预测值对销量进行预测得到销量预测值二,影响因子包括企业内部与销量相关的数据和企业外部与销量相关的数据。
若影响因子的历史数据存在缺失且缺失量未超过预定量,根据缺失值两侧数据的均值进行填充,否则删除对应影响因子的历史数据,如缺失预定量为不超过10%,例如每年1月国家***不公布进出口总额数据,填充即把上年12月和2月的平均值作为1月的值;若影响因子的历史数据变化剧烈,则进行移动平均处理,如数据方差较大即判断为变化剧烈,通过移动平均处理可得到一条平稳变化的曲线。若影响因子的历史数据量级差异大,则对因子进行取对数处理,如数据最大最小值相差10倍以上,通过对数坐标变换,得到一条平滑的曲线。若多个影响因子存在较强的相关性,则进行加权聚合构建一个复合因子,如相关系数大于阈值,通过特征线性组合结合阈值得到一条与各因子都相关的综合曲线。
若影响因子的历史数据与销量相关性绝对值低于预设值,则删除该影响因子。对影响因子的总量、同比等形式进行分析,优选最优的形式,基于影响因子与销量的时间差,对影响因子做相应的滞后处理,(可分以下情况进行处理,有业务逻辑关系的,直接数据后退相应的周期;没有业务逻辑关系的,取相关性最大的周期为滞后期)。
采用影响因子各自的历史数据,企业内部与销量相关的数据包括销售属性数据、库存数据、产品生命周期数据、渠道数据、折扣数据和关键部件采购数据,所述企业外部与销量相关的数据包括宏观经济数据、人口数据、竞争产品数据和网络舆情监控及口碑数据。所述销售属性数据包括车系、配置、价格、折扣、地区等。进行训练得到各自相应的最优模型,根据最优模型对相应影响因子进行预测得到影响因子的预测值。
所述企业内部与销量相关的数据包括销售属性数据、库存数据、产品生命周期数据、渠道数据、折扣数据和关键部件采购数据,所述企业外部与销量相关的数据包括宏观经济数据、人口数据、竞争产品数据和网络舆情监控及口碑数据。所述销售属性数据包括车系、配置、价格、折扣、地区等。
上述机器学习模型可为神经网络模型或Xgboost模型,机器学习模型需要使用所有历史数据,历史数据包括历史销量数据和影响因子的历史数据,可将所有历史数据按照比例(如70%和30%的)随机分为训练集和测试集,设置模型关键参数的取值范围,对每组参数的取值组合,在训练集上训练模型,将测试集输入训练好的模型进行测试,得到测试集上预测结果与实际值的误差,选择测试集上误差最小时对应的参数作为最优参数,利用最优参数和所有历史数据训练模型,将该模型作为最优机器学习模型,将因子的预测值和需要进行预测的时间输入到最优机器学习模型中得到与输入时间对应的销量预测值二。
对销量预测值一和销量预测值二的总和取平均值得到最终的销量预测值。
预测效果如下表所示。
表2预测效果图
Figure BDA0003330222580000121
针对各部门总销量、车系销量进行月度预测,每月25日更新预测结果,滚动18个月的预测销量形成阶梯表,同时更新上月真实销量,取最新的预测值计算准确率,通过1年多的市场跟踪和模型优化,平均准确率从80%多提升至95%左右。未来1—3个月的销量预测可支撑销售部门的短期市场动作,未来1年半的销量预测可支撑财务年度预算达成及战略趋势研判。
采用本发明预测方法,建立相关模型根据历史数据综合考虑汽车行业销售中多方面影响因素,提升了销量预测方法的准确率和合理性。

Claims (14)

1.一种基于可分解模型prophet及大数据挖掘的销量预测方法,其特征在于,包括步骤:采集历史销量数据,确定节假日和事件影响周期和强度,设置参数集并建立prophet模型,利用历史销量数据及影响周期和强度对prophet模型进行训练和测试得到最优prophet模型,利用该最优prophet模型对指定时间内销量进行预测得到销量预测值一;根据历史销量数据的相关性及回归效率计算影响因子,对影响因子和历史销量数据经过移动平均、变形、滞后处理,输入机器学***均值得到最终的销量预测值。
2.根据权利要求1所述的销量预测方法,其特征在于,销量均值持续偏离高于阈值的时间段为影响周期,销量均值变化量为强度,分析节假日和事件发生前后时间段内销量变化,根据上述方法确定不同级别事件的影响周期和强度。
3.根据权利要求1或2所述的销量预测方法,其特征在于,将历史销量数据按照时间顺序按预定比例分为训练集和测试集,利用训练集对设置好参数集的prophet模型进行训练,并用测试集对训练后的模型进行测试,调整参数集,得到误差最小的prophet模型为销量的最优prophet模型。
4.根据权利要求1或2所述的销量预测方法,其特征在于,将所有历史数据按照比例随机分为训练集和测试集,设置模型参数的取值范围、每组参数的取值组合,通过训练集训练机器学习模型,将测试集输入训练好的模型进行测试,选择测试集中误差最小时对应的参数作为最优参数,利用最优参数构建最优机器学习模型。
5.根据权利要求1所述的销量预测方法,其特征在于,采用影响因子各自对应的历史数据对时间序列进行训练得到各自相应的最优时间序列模型,根据最优时间序列模型确定相应影响因子。
6.根据权利要求1或5所述的销量预测方法,其特征在于,若影响因子的历史数据存在的缺失量未超过预定值,则根据缺失量两侧数据的均值进行填充,如超过预定值则删除影响因子对应的历史数据;若影响因子的历史数据变化剧烈,则进行移动平均处理;若影响因子的历史数据差异超过量级阈值,则对影响因子取对数处理;若多个影响因子存在强相关,则进行加权聚合构建一个复合影响因子;若影响因子的历史数据与销量相关性绝对值低于预设值,则删除该影响因子。
7.根据权利要求3所述的销量预测方法,其特征在于,根据趋势分析非周期变化g(t)、用于拟合时间序列中的分段线性增长或逻辑增长的季节性周期变化s(t)、节假日效应h(t),Prophet预测模型使用时间为回归元,根据公式:y(t)=g(t)+s(t)+h(t)+et优化参数,拟合线性和非线性的时间函数y(t),其中,et为误差项。
8.根据权利要求1-7其中之一所述的销量预测方法,其特征在于,基于傅里叶级数建立季节效应模型计算销量季节性周期随时间t变化s(t)拟合并预测季节的销量,
Figure FDA0003330222570000021
其中,P为预测周期,N为傅里叶阶数,an和bn为傅里叶系数。
9.一种基于可分解模型prophet及大数据挖掘的销量预测***,其特征在于,采集模块采集历史销量数据并分析节假日和事件影响,确定影响周期和强度,设置参数集并建立prophet模型,训练模块利用历史销量数据及影响周期和强度对prophet模型进行训练和测试得到销量最优prophet模型,预测模块利用该最优prophet模型对销量进行预测得到销量预测值一,数据处理模块根据历史销量数据的相关性及回归效率预测影响因子,对影响因子和历史销量数据经过处理,输入机器学***均值得到最终的销量预测值。
10.根据权利要求9所述的销量预测***,其特征在于,将历史销量数据按照时间顺序按预定比例分为训练集和测试集,利用训练集对设置好参数集的prophet模型进行训练,用测试集对训练后的模型进行测试,调整参数集得到误差最小的prophet模型为最优prophet模型。
11.根据权利要求9所述的销量预测***,其特征在于,将所有历史数据按照比例随机分为训练集和测试集,设置模型参数、参数的取值组合,通过训练集训练机器学习模型,测试集输入训练好的模型进行测试,选择误差最小时对应的参数作为最优参数,利用最优参数构建最优机器学习模型。
12.根据权利要求9所述的销量预测***,其特征在于,采用影响因子各自对应的历史数据对时间序列进行训练得到各自的最优时间序列模型,根据最优时间序列模型预测影响因子。
13.根据权利要求9或10所述的销量预测方法,其特征在于,根据趋势分析非周期变化g(t)、用于拟合时间序列中的分段线性增长或逻辑增长的季节性周期变化s(t)、节假日效应h(t),Prophet预测模型使用时间为回归元,根据公式:y(t)=g(t)+s(t)+h(t)+et优化参数,拟合线性和非线性的时间函数y(t),其中,et为误差项。
14.根据权利要求9-12其中之一所述的销量预测***,其特征在于,基于傅里叶级数建立季节效应模型计算销量季节性周期变化s(t)拟合并预测季节的销量,
Figure FDA0003330222570000041
其中,P为预测周期,N为傅里叶阶数,an和bn为傅里叶系数。
CN202111278216.0A 2021-10-30 2021-10-30 基于prophet模型及大数据的销量预测方法和*** Pending CN113962745A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111278216.0A CN113962745A (zh) 2021-10-30 2021-10-30 基于prophet模型及大数据的销量预测方法和***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111278216.0A CN113962745A (zh) 2021-10-30 2021-10-30 基于prophet模型及大数据的销量预测方法和***

Publications (1)

Publication Number Publication Date
CN113962745A true CN113962745A (zh) 2022-01-21

Family

ID=79468489

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111278216.0A Pending CN113962745A (zh) 2021-10-30 2021-10-30 基于prophet模型及大数据的销量预测方法和***

Country Status (1)

Country Link
CN (1) CN113962745A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114756604A (zh) * 2022-06-13 2022-07-15 西南交通大学 一种基于Prophet组合模型的监测时序数据预测方法
CN114978956A (zh) * 2022-04-11 2022-08-30 北京邮电大学 智慧城市网络设备性能异常突变点检测方法及装置
CN115660565A (zh) * 2022-12-27 2023-01-31 北京京东乾石科技有限公司 出库数量确定方法、装置、电子设备和计算机可读介质
CN116188061A (zh) * 2023-04-27 2023-05-30 北京永辉科技有限公司 商品销量预测方法、装置、电子设备及存储介质
CN117010942A (zh) * 2023-08-11 2023-11-07 新立讯科技股份有限公司 基于神经网络和线性模型的农产品销售预测方法和***
CN117788038A (zh) * 2024-02-28 2024-03-29 山东硕为思大数据科技有限公司 一种汽车行业平台数据智能监测分析处理方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109214601A (zh) * 2018-10-31 2019-01-15 四川长虹电器股份有限公司 家电行业大数据销量预测方法
CN113553540A (zh) * 2020-04-24 2021-10-26 株式会社日立制作所 一种商品销量的预测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109214601A (zh) * 2018-10-31 2019-01-15 四川长虹电器股份有限公司 家电行业大数据销量预测方法
CN113553540A (zh) * 2020-04-24 2021-10-26 株式会社日立制作所 一种商品销量的预测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
梁议丹: "基于组合模型的酒店线上销量预测的研究", 《中国优秀硕士学位论文全文数据库 经济与管理科学辑 》, no. 02, 15 February 2019 (2019-02-15), pages 2 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114978956A (zh) * 2022-04-11 2022-08-30 北京邮电大学 智慧城市网络设备性能异常突变点检测方法及装置
CN114978956B (zh) * 2022-04-11 2024-04-09 北京邮电大学 智慧城市网络设备性能异常突变点检测方法及装置
CN114756604A (zh) * 2022-06-13 2022-07-15 西南交通大学 一种基于Prophet组合模型的监测时序数据预测方法
CN114756604B (zh) * 2022-06-13 2022-09-09 西南交通大学 一种基于Prophet组合模型的监测时序数据预测方法
CN115660565A (zh) * 2022-12-27 2023-01-31 北京京东乾石科技有限公司 出库数量确定方法、装置、电子设备和计算机可读介质
CN116188061A (zh) * 2023-04-27 2023-05-30 北京永辉科技有限公司 商品销量预测方法、装置、电子设备及存储介质
CN116188061B (zh) * 2023-04-27 2023-10-17 北京永辉科技有限公司 商品销量预测方法、装置、电子设备及存储介质
CN117010942A (zh) * 2023-08-11 2023-11-07 新立讯科技股份有限公司 基于神经网络和线性模型的农产品销售预测方法和***
CN117010942B (zh) * 2023-08-11 2024-02-20 新立讯科技股份有限公司 基于神经网络和线性模型的农产品销售预测方法和***
CN117788038A (zh) * 2024-02-28 2024-03-29 山东硕为思大数据科技有限公司 一种汽车行业平台数据智能监测分析处理方法
CN117788038B (zh) * 2024-02-28 2024-05-07 山东硕为思大数据科技有限公司 一种汽车行业平台数据智能监测分析处理方法

Similar Documents

Publication Publication Date Title
CN113962745A (zh) 基于prophet模型及大数据的销量预测方法和***
US10453142B2 (en) System and method for modeling and quantifying regulatory capital, key risk indicators, probability of default, exposure at default, loss given default, liquidity ratios, and value at risk, within the areas of asset liability management, credit risk, market risk, operational risk, and liquidity risk for banks
Aastveit et al. Nowcasting GDP in real time: A density combination approach
Bańbura et al. A look into the factor model black box: publication lags and the role of hard and soft data in forecasting GDP
Angelini et al. Short‐term forecasts of euro area GDP growth
CN113553540A (zh) 一种商品销量的预测方法
Navratil et al. Decomposition and forecasting time series in the business economy using prophet forecasting model
CN107346502A (zh) 一种基于大数据的迭代产品销售预测方法
Maaß et al. Improving short-term demand forecasting for short-lifecycle consumer products with data mining techniques
Bazen et al. Looking for a Needle in a Haystack? A Re‐examination of the Time Series Relationship between Teenage Employment and Minimum Wages in the United States
CN111738504A (zh) 企业财务指标资金量预测方法和装置、设备及存储介质
US11995667B2 (en) Systems and methods for business analytics model scoring and selection
US20150235319A1 (en) Method for selecting equity investments using quantitative multi-factor models of the relationship between common business characteristics and current stock prices
JP2020112847A (ja) 水需要予測方法およびシステム
WO2022261603A1 (en) Systems and methods for dynamic cash flow modeling
Wehrli et al. Scale-, time-and asset-dependence of Hawkes process estimates on high frequency price changes
Ariyanti et al. Comparison of Arima and Sarima for forecasting crude oil prices
CN113469595A (zh) 智慧供应链***及服务器平台
Rosolia Does information about current inflation affect expectations and decisions? Another look at Italian firms
CN116992265A (zh) 碳排放量估算方法、装置、设备和存储介质
Vasileiou Inaccurate value at risk estimations: Bad modeling or inappropriate data?
Perera et al. The evaluation of the Australian office market forecast accuracy
US20170004521A1 (en) Systems and methods for generating industry outlook scores
Abebe Modeling time-varying coffee price volatility in Ethiopia
CN115907848A (zh) 销量预测方法、***、作业机械、电子设备及计算机介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination