CN107767191A - 一种基于医药大数据预测药品销售趋势的方法 - Google Patents
一种基于医药大数据预测药品销售趋势的方法 Download PDFInfo
- Publication number
- CN107767191A CN107767191A CN201711269692.XA CN201711269692A CN107767191A CN 107767191 A CN107767191 A CN 107767191A CN 201711269692 A CN201711269692 A CN 201711269692A CN 107767191 A CN107767191 A CN 107767191A
- Authority
- CN
- China
- Prior art keywords
- mrow
- msub
- munderover
- medicine
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
一种基于医药大数据预测药品销售趋势的方法,包括以下步骤:(1)基于医药大数据获取平稳时间序列数据,(2)基于医药大数据建立自回归移动平均模型,(3)验证时间序列模型的残差序列是否是白噪声序列检验模型,(4)在建立长期趋势预测模型之后,计算药品的周期性指数,(5)运用最小二乘法估算获得周期性指数预测模型,(6)利用标准差计算两种预测模型所占比重的权值,获得组合预测模型,(7)预测结果的分析比较和呈现。本发明利用医药销售大数据建立ARIMA模型、周期性指数模型、组合预测模型,完成了对非线性、时变的时间序列数据的精确预测,实现了对药品销售预测功能。
Description
技术领域
本发明涉及信息技术领域,具体涉及一种基于医药大数据预测药品销售趋势的方法。
背景技术
预测方法是产品零售领域最有应用价值的研究问题之一,在社会经济发展、市场趋势分析、产品销售等方面具有非常广泛的应用。常用的一些预测方法,如ARIMA、BP神经网络、灰度预测能取得较好的预测结果,但是,药品销售数据实际是非线性、时变的时间序列数据,单一的预测方法很难对药品的销售进行精确的预测,因此构建一个既能对时间序列数据进行长期趋势的预测又能对短期趋势进行预测的组合方法一直是药品销售预测方法领域的研究重点。目前,对于大数据***中的药品销售预测,还缺乏能反映药品销售周期特点、时间特性的预测方法。
发明内容
为了克服现有技术的不足,本发明的目的是提供一种基于医药大数据预测药品销售趋势的方法,不仅可以有效预测长期趋势,又可以反映药品的周期性特点,从而实现对总体趋势的有效预测。
为了达到上述目的,本发明采取的技术方案是:
一种基于医药大数据预测药品销售趋势的方法,包括如下步骤:
步骤一:基于医药大数据获取平稳时间序列数据
(1)依据药品的销售金额,获取需要预测药品的***时间序列数据,
(2)对获取的时间序列数据,用单位根(ADF)进行检验,如果ADF检验的值等于0或者小于设定的值(一般选取0.01、0.05),则判断时间序列数据为平稳时间序列;对于明显的非平稳时间序列要先进行1阶差分运算,再用ADF检验判断是否为平稳时间序列,对于检验后的非平稳时间序列再进行2阶差分运算,获取平稳时间序列数据;
步骤二:基于医药大数据建立自回归移动平均模型
(1)根据步骤一的差分阶数确定参数d的值,对于非平稳时间序列进行了1阶差分,则d=1,进行了2阶差分,则d=2,
(2)对已经获得的平稳时间序列,分别求自相关系数ACF和偏自相关系数PACF,并通过对自相关图和偏自相关图的分析,得到阶层p和阶数q,
(3)利用ARIMA(p,d,q)模型,选择不同的p,q值,分别计算AIC,BIC,HQIC的值,
(4)分别比较不同ARIMA模型的AIC,BIC,HQIC值,选择一个最优的模型,同时确定出p,q值,
(5)根据得到的p、d、q值,得到提取长期趋势的ARIMA模型,然后对该模型进行模型检验;
步骤三:验证时间序列模型的残差序列是否是白噪声序列检验模型
建立步骤二的ARIMA模型后,对残差的估计序列进行白噪声检验,如果检验值小于给定的假设值,说明是高斯白噪声;如果不是高斯白噪声,说明选择的ARIMA模型并不是一个适合预测的模型,需要返回步骤二,重新选择ARIMA模型;
步骤四:在建立长期趋势预测模型之后,计算药品的周期性指数
(1)计算药品周期的平均数
式(1)中esj,i表示药品周期内的平均值,n表示规定时段内的周期数,asi表示药品周期的平均数;
(2)计算药品周期的总平均数
式(2)中t表示时段数,ts表示药品周期的总平均数;
(3)计算药品周期的周期性指数,即药品周期的平均数/药品周期的总平均数:
步骤五:运用最小二乘法估算获得周期性指数预测模型
(1)计算药品周期内平均销售金额,
(2)利用最小二乘法拟合平均销售金额对时间的回归方程组,
(3)利用回归模型计算药品短期销售的预测值,
(4)短期预测值乘以药品的周期性指数得到修正的预测值;
步骤六:利用标准差计算两种预测模型所占比重的权值,获得组合预测模型
(1)利用步骤二获得的长期趋势预测模型ARIMA和步骤五获得的基于药品指数周期的周期性指数预测模型,以两种预测模型的标准差所占比重确定每种模型的权重W1和W2,所述权重的计算满足公式(7)
权重W1=u,W2=1-u,u的最优解为满足公式(7)实际值与预测值方差和最小,ε是实际值Pi *与预测值Pi之间的误差,n指预测个数,
(2)根据两种模型的权重确定组合预测模型,所述模型为:
Pt=W1P1t+W2P2t (8)
式(8)中Pt是组合模型的预测结果,P1t是ARIMA模型的预测值,P2t是周期性指数预测模型预测值,W1,W2分别是两种模型的加权系数,为保证组合预测模型的无偏性,两者需要满足W1+W2=1,W1≥0,W2≥0;
步骤七:预测结果的分析比较和呈现
(1)通过组合预测模型计算药品短期预测值,
(2)比较ARIMA模型、周期性指数预测模型和组合预测模型三种模型的平均绝对相对误差(MAPE)和均方误差(MAE),
(3)将预测值的大数据可视化呈现并进行存储。
本发明的有益效果:
本发明利用医药销售大数据建立ARIMA模型,较好的实现了对药品销售的长期趋势预测;利用药品周期性指数较好的实现药品的短期趋势预测,在此基础上利用标准差计算两种预测模型所占比重的权值,获得组合预测模型,完成了对非线性、时变的时间序列数据的精确预测,保证了预测的有效性和准确性,实现了基于医药大数据对药品销售预测功能,满足各种实时在线查看或者决策需要。
附图说明
图1是本发明组合预测***的结构示意图;
图2是本发明周期指数计算模块结构示意图;
图3是本发明组合模型预测模块结构示意图;
图4是本发明自相关系数ACF和偏自相关系数PACF。
具体实施方式
以下结合具体实施例对本发明做进一步说明。
实施例
一种基于医药大数据预测药品销售趋势的方法,包括如下步骤:
步骤一:基于医药大数据获取平稳时间序列数据
(1)依据药品的销售金额,获取需要预测药品的***时间序列数据,
表1 “haowanjia”医药网站销售的***时间序列数据
时间段 | 平均销售数据 | 时间段 | 平均销售数据 |
2015.12.01~2015.12.10 | 304.3 | 2016.05.21~2016.05.31 | 2007.56 |
2015.12.11~2015.12.20 | 889.8 | 2016.06.01~2016.06.10 | 1981.81 |
2015.12.21~2015.12.31 | 488.2 | 2016.06.11~2016.06.20 | 11544.76 |
2016.01.01~2016.01.10 | 272.58 | 2016.06.21~2016.06.30 | 1161.38 |
2016.01.11~2016.01.20 | 586.34 | 2016.07.01~2016.07.10 | 2409.55 |
2016.01.21~2016.01.31 | 280.55 | 2016.07.11~2016.07.20 | 13561.3 |
2016.02.01~2016.02.10 | 585.1 | 2016.07.21~2016.07.31 | 6794.96 |
2016.02.11~2016.02.20 | 1093.7 | 2016.08.01~2016.08.10 | 13082.5 |
2016.02.21~2016.02.29 | 4951.0 | 2016.08.11~2016.08.20 | 6681.02 |
2016.03.01~2016.03.10 | 6935.0 | 2016.08.21~2016.08.31 | 8600.59 |
2016.03.11~2016.03.20 | 11733.89 | 2016.09.01~2016.09.10 | 1335.36 |
2016.03.21~2016.03.31 | 6243.00 | 2016.09.11~2016.09.20 | 1695.8 |
2016.04.01~2016.04.10 | 2337.9 | 2016.09.21~2016.09.30 | 3190.73 |
2016.04.11~2016.04.20 | 2330.1 | 2016.10.01~2016.10.10 | 1311.37 |
2016.03.21~2016.03.30 | 1753.45 | 2016.10.11~2016.10.20 | 2177.9 |
2016.05.01~2016.05.10 | 589.5 | 2016.10.21~2016.10.31 | 3251.52 |
2016.05.11~2016.05.20 | 1600.72 |
(2)对表1中获取的时间序列数据,用单位根(ADF)进行检验,检测结果值为1,因而判断该时间序列数据为平稳时间序列;
步骤二:基于医药大数据建立自回归移动平均模型
(1)根据步骤一的差分阶数确定参数d的值,在实施过程中对该获取的数据仍然进行了1阶差分,故d=1,
(2)对已经获得的平稳时间序列,分别求自相关系数ACF和偏自相关系数PACF,所得自相关图ACF和偏自相关图PACF如图4所示。
通过对自相关图分析,滞后8个周期后,ACF的值逐渐变小,然后趋近于0,因此p=8;通过对偏自相关图的分析,滞后4个周期后,PACF的值逐渐变小,故q=4;
(3)利用ARIMA(p,q)模型,选择不同的p,q取值,分别计算AIC,BIC,HQIC的值如表2所示:
表2 AIC,BIC,HQIC计算值
p | q | AIC | BIC | HQIC |
0 | 1 | 623.1143 | 627.51 | 624.57 |
1 | 0 | 621.6080 | 626.05 | 623.06 |
1 | 1 | 622.843 | 628.706 | 624.78 |
8 | 1 | 631.59 | 647.72 | 636.94 |
8 | 0 | 629.85 | 644.46 | 634.66 |
0 | 4 | 624.94 | 633.73 | 627.855 |
(4)分别比较不同ARIMA模型的AIC,BIC,HQIC值,选择一个最优的模型,同时确定出p,q值,实施过程中选择一个误差平方最小的AIC、BIC和HQIC值,本算法中选择p=8,q=0;
(5)根据得到的d、p、q值,得到提取长期趋势的ARIMA(8,1,0)模型,然后对该模型进行模型检验;
步骤三:验证时间序列模型的残差序列是否是白噪声序列检验模型
根据德宾-沃森(Durbin-Watson)检验方法,当DW值显著的接近于0或4时,则存在自相关性,而接近于2时,则不存在(一阶)自相关性,检验结果是DW=2.02424743723,说明不存在自相关性;
步骤四:计算药品销售的周期性指数
药品周期的平均数是指某种药品一定时间周期内的平均值,例如药品的周期为10天,分别计算每月上、中、下旬的平均数,以一年为周期,计算一年内上、中、下旬的总平均数;
(1)计算药品销售周期内平均销售金额如表3所示,
表3 药品销售周期内的平均销售金额
时间段 | 销售值 | 时间段 | 销售值 | 时间段 | 销售值 |
2015.12.01~2015.12.10 | 304.3 | 2015.12.11~2015.12.20 | 889.8 | 2015.12.21~2015.12.31 | 488.2 |
2016.01.01~2016.01.10 | 272.58 | 2016.01.11~2016.01.20 | 586.34 | 2016.01.21~2016.01.31 | 280.55 |
2016.02.01~2016.02.10 | 585.1 | 2016.02.11~2016.02.20 | 1093.7 | 2016.02.21~2016.02.29 | 4951.0 |
2016.03.01~2016.03.10 | 6935.0 | 2016.03.11~2016.03.20 | 11733.8 | 2016.03.21~2016.03.31 | 6243.00 |
2016.04.01~2016.04.10 | 2337.9 | 2016.04.11~2016.04.20 | 2330.1 | 2016.03.21~2016.03.30 | 1753.45 |
2016.05.01~2016.05.10 | 589.5 | 2016.05.11~2016.05.20 | 1600.7 | 2016.05.21~2016.05.31 | 2007.56 |
2016.06.01~2016.06.10 | 1981.81 | 2016.06.11~2016.06.20 | 11544.7 | 2016.06.21~2016.06.30 | 1161.38 |
2016.07.01~2016.07.10 | 2409.55 | 2016.07.11~2016.07.20 | 13561 | 2016.07.21~2016.07.31 | 6794.96 |
2016.08.01~2016.08.10 | 13082.5 | 2016.08.11~2016.08.20 | 6681.0 | 2016.08.21~2016.08.31 | 8600.59 |
2016.09.01~2016.09.10 | 1335.36 | 2016.09.11~2016.09.20 | 1695.8 | 2016.09.21~2016.09.30 | 3190.73 |
2016.10.01~2016.10.10 | 1311.37 | 2016.10.11~2016.10.20 | 2177.9 | 2016.10.21~2016.10.31 | 3251.52 |
上旬平均值 | 2831.36 | 中旬平均值 | 4899.5 | 下旬平均值 | 3520.27 |
(2)药品周期内的2015年10月1日至2016年10月31日之间总的平均销售值3750.386。
(3)上旬的周期指数分别为:2831.36/3750.386=0.75
中旬的周期指数分别为:4899.5/3750.386=1.31
下旬的周期指数分别为:3520.27/3750.386=0.94
步骤五:运用最小二乘法估算获得周期性指数预测模型
(1)利用最小二乘法拟合平均销售金额对时间的回归方程组,
选择误差的平方和最小的拟合阶数21,所得预测方程如下:
y=100x10-1200x9+8800x8-49600x7+21300x6-68300x5+158400x4-2541400x3+2633300x2-1560100x+396400
(2)利用回归模型计算药品短期销售的预测值,如表4所示:
表4 药品短期销售的预测值
时间段 | 预测值 | 时间段 | 预测值 | 时间段 | 预测值 |
2015.12.01~2015.12.10 | 333.89 | 2015.12.11~2015.12.20 | 901.17 | 2015.12.21~2015.12.31 | 440.65 |
2016.01.01~2016.01.10 | 462.79 | 2016.01.11~2016.01.20 | 167.06 | 2016.01.21~2016.01.31 | 762.80 |
2016.02.01~2016.02.10 | 443.49 | 2016.02.11~2016.02.20 | 910.21 | 2016.02.21~2016.02.29 | 4495.40 |
2016.03.01~2016.03.10 | 8790.42 | 2016.03.11~2016.03.20 | 9622.8 | 2016.03.21~2016.03.31 | 6693.73 |
2016.04.01~2016.04.10 | 3312.26 | 2016.04.11~2016.04.20 | 1797.9 | 2016.03.21~2016.03.30 | 1454.09 |
2016.05.01~2016.05.10 | 980.51 | 2016.05.11~2016.05.20 | 892.91 | 2016.05.21~2016.05.31 | 2375.65 |
2016.06.01~2016.06.10 | 4715.23 | 2016.06.11~2016.06.20 | 5689.2 | 2016.06.21~2016.06.30 | 4866.27 |
2016.07.01~2016.07.10 | 4852.61 | 2016.07.11~2016.07.20 | 7693.4 | 2016.07.21~2016.07.31 | 11116.00 |
2016.08.01~2016.08.10 | 11175.1 | 2016.08.11~2016.08.20 | 8336.2 | 2016.08.21~2016.08.31 | 6143.34 |
2016.09.01~2016.09.10 | 3741.71 | 2016.09.11~2016.09.20 | 280.42 | 2016.09.21~2016.09.30 | 3905.98 |
2016.10.01~2016.10.10 | 1208.03 | 2016.10.11~2016.10.20 | 2452.0 | 2016.10.21~2016.10.31 | 3866.58 |
(3)短期预测值乘以药品的周期性指数得到修正的预测值如表5所示:
表5 药品销售预测值的修正值
步骤六:利用标准差计算两种预测模型所占比重的权值,获得组合预测模型
Pt=W1P1t+W2P2t (e)
按照ARIMA标准差=1654.9,EP指数模型标准差=1820.9,所得预测模型为:
Predict=0.476*ARIMA+0.524*EP
步骤七:预测结果的分析比较和呈现
(1)利用三种不同的模型计算药品销售预测值如表6所示,
表6 不同模型的药品销售预测值
时间段 | 实际值 | 指数模型EP | ARIMA模型 | 组合预测模型 |
2016.08.21~2016.08.31 | 8600.59 | 5774.74 | 5372.792880 | 5583.413171 |
2016.09.01~2016.09.10 | 1335.36 | 2806.28 | 3559.193028 | 3164.666601 |
2016.09.11~2016.09.20 | 1695.8 | 367.35 | 1612.539642 | 960.0602696 |
2016.09.21~2016.09.30 | 3190.73 | 3671.62 | 2677.994462 | 3198.654244 |
2016.10.01~2016.10.10 | 1311.37 | 906.022 | 275.746566 | 606.0108934 |
2016.10.11~2016.10.20 | 2177.9 | 3212.1 | 2120.959362 | 2692.717056 |
2016.10.21~2016.10.31 | 3251.52 | 3634.58 | 1721.675630 | 2724.03752 |
(2)比较ARIMA模型、周期性指数模型EP和组合预测模型三种模型的平均绝对相对误差(MAPE)和平均绝对误差(MAE)如表7所示,
表7 三种模型的评价结果
预测模型 | 平均绝对相对误差(MAPE) | 平均绝对误差MAE |
周期性指数模型EP | 0.433117 | 1132.7 |
ARIMA模型 | 0.454692 | 1238.6 |
组合预测模型 | 0.400339 | 1048.3 |
综上,无论是平均绝对相对误差(MAPE)还是平均绝对误差(MAE),本发明提取的组合预测模型均优于现有的ARIMA模型和周期性指数模型EP,实现了精确的药品销售预测。
另外,本发明流程中,各个模块所起的作用如图1~图3的描述:
图1示出了本发明短期药品销售组合预测***的流程示意图,包括:
数据获取模块,用于获取基于时间序列的药品销售数据,通过数据的清洗,解决数据的完整性;
检测模块,用于检测数据的平稳性,对于序列趋势数据,利用差分的方法,解决数据的平稳性;
参数选取模块,用于选择ARIMA模型的参数p、q的值;
模型验证模块,用于验证模型的残差值是否是高斯白噪声;
周期指数计算模块,用于计算药品周期的平均数、总平均数,计算药品的周期指数;
组合模型预测模块,用于获取组合预测模型的权重;
可视化展示模块,用于药品预测值的存储,药品预测值的大数据可视化呈现。
图2示出了本发明周期指数计算模块结构示意图,该模块包括:
周期指数计算单元:计算药品周期指数
序列数据拟合单元:指数周期的平均值对时间的拟合计算;
药品短期预测单元:利用周期指数乘以拟合数值计算短期预测数据。
图3示出了本发明组合模型预测模块结构示意图,该模块包括:
权重计算单元:基于拉格朗日定理的模型权重的计算;
组合计算单元:ARIMA模型、指数周期模型、组合预测模型预测结果的平均绝对相对误差(MAPE)和平均绝对误差(MAE)的比较、分析;
结果可视化分析单元:结果的可视化展示与存储。
Claims (1)
1.一种基于医药大数据预测药品销售趋势的方法,其特征在于,包括如下步骤:
步骤一:基于医药大数据获取平稳时间序列数据
(1)依据药品的销售金额,获取需要预测药品的***时间序列数据,
(2)对获取的时间序列数据,用单位根ADF进行检验,如果ADF检验的值等于0或者小于设定的值,该设定值选取0.01或0.05,则判断时间序列数据为平稳时间序列;对于明显的非平稳时间序列要先进行1阶差分运算,再用ADF检验判断是否为平稳时间序列,对于检验后的非平稳时间序列再进行2阶差分运算,获取平稳时间序列数据;
步骤二:基于医药大数据建立自回归移动平均模型
(1)根据步骤一的差分阶数确定参数d的值,对于非平稳时间序列进行了1阶差分,则d=1,进行了2阶差分,则d=2,
(2)对已经获得的平稳时间序列,分别求自相关系数ACF和偏自相关系数PACF,并通过对自相关图和偏自相关图的分析,得到阶层p和阶数q,
(3)利用ARIMA(p,d,q)模型,选择不同的p,q值,分别计算AIC,BIC,HQIC的值,
(4)分别比较不同ARIMA模型的AIC,BIC,HQIC值,选择一个最优的模型,同时确定出p,q值,
(5)根据得到的p、d、q值,得到提取长期趋势的ARIMA模型,然后对该模型进行模型检验;
步骤三:验证时间序列模型的残差序列是否是白噪声序列检验模型
建立步骤二的ARIMA模型后,对残差的估计序列进行白噪声检验,如果检验值小于给定的假设值,说明是高斯白噪声;如果不是高斯白噪声,说明选择的ARIMA模型并不是一个适合预测的模型,需要返回步骤二,重新选择ARIMA模型;
步骤四:在建立长期趋势预测模型之后,计算药品的周期性指数
(1)计算药品周期的平均数
<mrow>
<msub>
<mi>as</mi>
<mi>i</mi>
</msub>
<mo>=</mo>
<mfrac>
<mrow>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>n</mi>
</munderover>
<msub>
<mi>es</mi>
<mrow>
<mi>j</mi>
<mo>,</mo>
<mi>i</mi>
</mrow>
</msub>
</mrow>
<mi>n</mi>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>1</mn>
<mo>)</mo>
</mrow>
</mrow>
式(1)中esj,i表示药品周期内的平均值,n表示规定时段内的周期数,asi表示药品周期的平均数;
(2)计算药品周期的总平均数
<mrow>
<mi>t</mi>
<mi>s</mi>
<mo>=</mo>
<mfrac>
<mrow>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>n</mi>
</munderover>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>t</mi>
</munderover>
<msub>
<mi>es</mi>
<mrow>
<mi>j</mi>
<mo>,</mo>
<mi>i</mi>
</mrow>
</msub>
</mrow>
<mrow>
<mi>n</mi>
<mo>*</mo>
<mi>t</mi>
</mrow>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>2</mn>
<mo>)</mo>
</mrow>
</mrow>
式(2)中t表示时段数,ts表示药品周期的总平均数;
(3)计算药品周期的周期性指数,即药品周期的平均数/药品周期的总平均数:
<mrow>
<msub>
<mi>ep</mi>
<mi>i</mi>
</msub>
<mo>=</mo>
<mfrac>
<mrow>
<msub>
<mi>as</mi>
<mi>i</mi>
</msub>
</mrow>
<mrow>
<mi>t</mi>
<mi>s</mi>
</mrow>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>3</mn>
<mo>)</mo>
</mrow>
</mrow>
步骤五:运用最小二乘法估算获得周期性指数预测模型
(1)计算药品周期内平均销售金额,
(2)利用最小二乘法拟合平均销售金额对时间的回归方程组,
<mrow>
<mfenced open = "{" close = "">
<mtable>
<mtr>
<mtd>
<mrow>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>n</mi>
</munderover>
<msub>
<mi>y</mi>
<mi>i</mi>
</msub>
<mo>=</mo>
<mi>n</mi>
<mi>a</mi>
<mo>+</mo>
<mi>b</mi>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>n</mi>
</munderover>
<msub>
<mi>t</mi>
<mi>i</mi>
</msub>
</mrow>
</mtd>
</mtr>
<mtr>
<mtd>
<mrow>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>n</mi>
</munderover>
<msub>
<mi>t</mi>
<mi>i</mi>
</msub>
<msub>
<mi>y</mi>
<mi>i</mi>
</msub>
<mo>=</mo>
<mi>a</mi>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>n</mi>
</munderover>
<msub>
<mi>t</mi>
<mi>i</mi>
</msub>
<mo>+</mo>
<mi>b</mi>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>n</mi>
</munderover>
<msubsup>
<mi>t</mi>
<mrow>
<mi>i</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mn>2</mn>
</msubsup>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>4</mn>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<mi>a</mi>
<mo>=</mo>
<mfrac>
<mrow>
<mi>&Sigma;</mi>
<mi>y</mi>
</mrow>
<mi>n</mi>
</mfrac>
<mo>-</mo>
<mi>b</mi>
<mfrac>
<mrow>
<mi>&Sigma;</mi>
<mi>t</mi>
</mrow>
<mi>n</mi>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>5</mn>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<mi>b</mi>
<mo>=</mo>
<mfrac>
<mrow>
<mi>n</mi>
<mi>&Sigma;</mi>
<mi>y</mi>
<mi>t</mi>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mi>&Sigma;</mi>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mrow>
<mo>(</mo>
<mi>&Sigma;</mi>
<mi>y</mi>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<msup>
<mi>n&Sigma;t</mi>
<mn>2</mn>
</msup>
<mo>-</mo>
<msup>
<mrow>
<mo>(</mo>
<mi>&Sigma;</mi>
<mi>t</mi>
<mo>)</mo>
</mrow>
<mn>2</mn>
</msup>
</mrow>
</mfrac>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>6</mn>
<mo>)</mo>
</mrow>
</mrow>
(3)利用回归模型计算药品短期销售的预测值,
(4)短期预测值乘以药品的周期性指数得到修正的预测值;
步骤六:利用标准差计算两种预测模型所占比重的权值,获得组合预测模型
(1)利用步骤二获得的长期趋势预测模型ARIMA和步骤五获得的基于药品指数周期的周期性指数预测模型,以两种预测模型的标准差所占比重确定每种模型的权重W1和W2,所述权重的计算满足公式(7)
<mrow>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>n</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>N</mi>
</munderover>
<msubsup>
<mi>&epsiv;</mi>
<mi>min</mi>
<mn>2</mn>
</msubsup>
<mo>=</mo>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>n</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>n</mi>
</munderover>
<msubsup>
<mrow>
<mo>(</mo>
<msubsup>
<mi>p</mi>
<mi>n</mi>
<mo>*</mo>
</msubsup>
<mo>-</mo>
<msub>
<mi>p</mi>
<mrow>
<mn>2</mn>
<mi>n</mi>
</mrow>
</msub>
<mo>-</mo>
<mi>u</mi>
<mo>(</mo>
<mrow>
<msub>
<mi>p</mi>
<mrow>
<mn>2</mn>
<mi>n</mi>
</mrow>
</msub>
<mo>-</mo>
<msub>
<mi>p</mi>
<mrow>
<mn>1</mn>
<mi>n</mi>
</mrow>
</msub>
</mrow>
<mo>)</mo>
<mo>)</mo>
</mrow>
<mi>min</mi>
<mn>2</mn>
</msubsup>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>7</mn>
<mo>)</mo>
</mrow>
</mrow>
权重W1=u,W2=1-u,u的最优解为满足公式(7)实际值与预测值方差和最小,ε是实际值Pi *与预测值Pi之间的误差,n指预测个数,
(2)根据两种模型的权重确定组合预测模型,所述模型为:
Pt=W1P1t+W2P2t (8)
式(8)中Pt是组合模型的预测结果,P1t是ARIMA模型的预测值,P2t是周期性指数预测模型预测值,W1,W2分别是两种模型的加权系数,为保证组合预测模型的无偏性,两者需要满足W1+W2=1,W1≥0,W2≥0;
步骤七:预测结果的分析比较和呈现
(1)通过组合预测模型计算药品短期预测值,
(2)比较ARIMA模型、周期性指数预测模型和组合预测模型三种模型的平均绝对相对误差MAPE和均方误差MAE,
<mfenced open = "" close = "">
<mtable>
<mtr>
<mtd>
<mrow>
<mi>M</mi>
<mi>A</mi>
<mi>P</mi>
<mi>E</mi>
<mo>=</mo>
<mfrac>
<mn>1</mn>
<mi>n</mi>
</mfrac>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>t</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>n</mi>
</munderover>
<mo>|</mo>
<mfrac>
<mrow>
<msub>
<mi>y</mi>
<mi>t</mi>
</msub>
<mo>-</mo>
<msub>
<mover>
<mi>y</mi>
<mo>^</mo>
</mover>
<mi>t</mi>
</msub>
</mrow>
<msub>
<mi>y</mi>
<mi>t</mi>
</msub>
</mfrac>
<mo>|</mo>
<mo>-</mo>
<mo>-</mo>
<mo>-</mo>
<mrow>
<mo>(</mo>
<mn>9</mn>
<mo>)</mo>
</mrow>
</mrow>
</mtd>
<mtd>
<mrow>
<mi>M</mi>
<mi>A</mi>
<mi>E</mi>
<mo>=</mo>
<mfrac>
<mn>1</mn>
<mi>n</mi>
</mfrac>
<munderover>
<mo>&Sigma;</mo>
<mrow>
<mi>t</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>n</mi>
</munderover>
<mo>|</mo>
<msub>
<mi>y</mi>
<mi>t</mi>
</msub>
<mo>-</mo>
<msub>
<mover>
<mi>y</mi>
<mo>^</mo>
</mover>
<mi>t</mi>
</msub>
<mo>|</mo>
</mrow>
</mtd>
</mtr>
</mtable>
</mfenced>
(3)将预测值的大数据可视化呈现并进行存储。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711269692.XA CN107767191A (zh) | 2017-12-05 | 2017-12-05 | 一种基于医药大数据预测药品销售趋势的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711269692.XA CN107767191A (zh) | 2017-12-05 | 2017-12-05 | 一种基于医药大数据预测药品销售趋势的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107767191A true CN107767191A (zh) | 2018-03-06 |
Family
ID=61277438
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711269692.XA Pending CN107767191A (zh) | 2017-12-05 | 2017-12-05 | 一种基于医药大数据预测药品销售趋势的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107767191A (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109599170A (zh) * | 2018-12-05 | 2019-04-09 | 易必祥 | 基于大数据的医药管理方法及*** |
CN109783532A (zh) * | 2018-12-12 | 2019-05-21 | 航天信息股份有限公司 | 基于微服务架构的食品/药品分析方法和*** |
CN110276491A (zh) * | 2019-06-24 | 2019-09-24 | 重庆锐云科技有限公司 | 粉丝预测管理方法、装置、计算机设备及存储介质 |
CN110415013A (zh) * | 2019-06-12 | 2019-11-05 | 河海大学 | 一种网约车短时出行需求的组合预测方法 |
CN110555578A (zh) * | 2018-06-01 | 2019-12-10 | 北京京东尚科信息技术有限公司 | 一种销量预测方法和装置 |
CN111598310A (zh) * | 2020-04-27 | 2020-08-28 | 天闻数媒科技(北京)有限公司 | 一种基于时间序列分析的图书热度预测方法以及设备 |
CN112115416A (zh) * | 2020-08-06 | 2020-12-22 | 深圳市水务科技有限公司 | 预测性维护方法、设备及存储介质 |
CN112183906A (zh) * | 2020-12-02 | 2021-01-05 | 北京蒙帕信创科技有限公司 | 一种基于多模型组合模型的机房环境预测方法及*** |
CN112988978A (zh) * | 2021-04-27 | 2021-06-18 | 河南金明源信息技术有限公司 | 一种公益诉讼重点领域案件趋势分析*** |
CN113267256A (zh) * | 2021-04-14 | 2021-08-17 | 国网山东省电力公司济宁供电公司 | 一种配电线路接点温度预测***及方法 |
CN113743971A (zh) * | 2020-06-17 | 2021-12-03 | 北京沃东天骏信息技术有限公司 | 一种数据处理方法和装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102385724A (zh) * | 2010-08-27 | 2012-03-21 | 上海财经大学 | 一种应用于库存管理的零配件组合需求预测信息处理方法 |
CN103002164A (zh) * | 2012-11-21 | 2013-03-27 | 江苏省电力公司电力科学研究院 | 电力呼叫中心话务量预测方法 |
CN103984998A (zh) * | 2014-05-30 | 2014-08-13 | 成都德迈安科技有限公司 | 基于云服务平台大数据挖掘的销售预测方法 |
CN105976199A (zh) * | 2016-04-26 | 2016-09-28 | 重庆大学 | 一种基于混合模型的医药销量的预测方法及*** |
CN106920009A (zh) * | 2017-03-03 | 2017-07-04 | 北京北青厚泽数据科技有限公司 | 医院服务量的预测方法 |
CN107146015A (zh) * | 2017-05-02 | 2017-09-08 | 联想(北京)有限公司 | 多变量时间序列预测方法和*** |
-
2017
- 2017-12-05 CN CN201711269692.XA patent/CN107767191A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102385724A (zh) * | 2010-08-27 | 2012-03-21 | 上海财经大学 | 一种应用于库存管理的零配件组合需求预测信息处理方法 |
CN103002164A (zh) * | 2012-11-21 | 2013-03-27 | 江苏省电力公司电力科学研究院 | 电力呼叫中心话务量预测方法 |
CN103984998A (zh) * | 2014-05-30 | 2014-08-13 | 成都德迈安科技有限公司 | 基于云服务平台大数据挖掘的销售预测方法 |
CN105976199A (zh) * | 2016-04-26 | 2016-09-28 | 重庆大学 | 一种基于混合模型的医药销量的预测方法及*** |
CN106920009A (zh) * | 2017-03-03 | 2017-07-04 | 北京北青厚泽数据科技有限公司 | 医院服务量的预测方法 |
CN107146015A (zh) * | 2017-05-02 | 2017-09-08 | 联想(北京)有限公司 | 多变量时间序列预测方法和*** |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110555578A (zh) * | 2018-06-01 | 2019-12-10 | 北京京东尚科信息技术有限公司 | 一种销量预测方法和装置 |
CN110555578B (zh) * | 2018-06-01 | 2024-04-16 | 北京京东尚科信息技术有限公司 | 一种销量预测方法和装置 |
CN109599170A (zh) * | 2018-12-05 | 2019-04-09 | 易必祥 | 基于大数据的医药管理方法及*** |
CN109783532A (zh) * | 2018-12-12 | 2019-05-21 | 航天信息股份有限公司 | 基于微服务架构的食品/药品分析方法和*** |
CN110415013A (zh) * | 2019-06-12 | 2019-11-05 | 河海大学 | 一种网约车短时出行需求的组合预测方法 |
CN110276491A (zh) * | 2019-06-24 | 2019-09-24 | 重庆锐云科技有限公司 | 粉丝预测管理方法、装置、计算机设备及存储介质 |
CN111598310A (zh) * | 2020-04-27 | 2020-08-28 | 天闻数媒科技(北京)有限公司 | 一种基于时间序列分析的图书热度预测方法以及设备 |
CN113743971A (zh) * | 2020-06-17 | 2021-12-03 | 北京沃东天骏信息技术有限公司 | 一种数据处理方法和装置 |
CN112115416A (zh) * | 2020-08-06 | 2020-12-22 | 深圳市水务科技有限公司 | 预测性维护方法、设备及存储介质 |
CN112183906A (zh) * | 2020-12-02 | 2021-01-05 | 北京蒙帕信创科技有限公司 | 一种基于多模型组合模型的机房环境预测方法及*** |
CN113267256A (zh) * | 2021-04-14 | 2021-08-17 | 国网山东省电力公司济宁供电公司 | 一种配电线路接点温度预测***及方法 |
CN112988978A (zh) * | 2021-04-27 | 2021-06-18 | 河南金明源信息技术有限公司 | 一种公益诉讼重点领域案件趋势分析*** |
CN112988978B (zh) * | 2021-04-27 | 2024-03-26 | 河南金明源信息技术有限公司 | 一种公益诉讼重点领域案件趋势分析*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107767191A (zh) | 一种基于医药大数据预测药品销售趋势的方法 | |
KR101012863B1 (ko) | 고객기준부하 산출을 위한 부하 예측 비교 분석 시스템 | |
CN104915735B (zh) | 企业运营分析预警***的预警分析方法 | |
CN107992968B (zh) | 基于集成时间序列分析技术的电能表计量误差预测方法 | |
CN104021430B (zh) | 一种城市轨道交通站点客流不确定性分析方法 | |
CN110648026A (zh) | 预测模型构建方法、预测方法、装置、设备及介质 | |
CN111104981A (zh) | 一种基于机器学习的水文预报精度评价方法及*** | |
JP5226746B2 (ja) | 変数スコアリングを使用するモデル最適化システム | |
JP2011248885A5 (zh) | ||
CN104574220A (zh) | 基于最小二乘支持向量机的电力客户信用评估方法 | |
CN103268519A (zh) | 基于改进Lyapunov指数的电力***短期负荷预测方法及装置 | |
CN104537211A (zh) | 一种基于层次分析法及灰色理论的企业安全风险预警方法 | |
CN106126944B (zh) | 一种电力变压器顶层油温区间预测方法及*** | |
WO2019187341A1 (ja) | 指標算出装置、予測システム、経過予測評価方法およびプログラム | |
CN103678869A (zh) | 一种飞行参数缺失数据的预测估计方法 | |
CN103942461A (zh) | 基于在线贯序极限学习机的水质参数预测方法 | |
CN109918833A (zh) | 一种数值模拟可信度的定量分析方法 | |
CN106777997A (zh) | 一种航天器健康状态评估方法 | |
CN109635382A (zh) | 基于改进支持向量机钢筋混凝土简支梁火灾损伤识别方法 | |
Yuan et al. | Calibration of stochastic computer models using stochastic approximation methods | |
CN104008433A (zh) | 基于贝叶斯动态模型的中长期电力负荷预测方法 | |
CN111626844A (zh) | 基于大数据分析的企业信用评估方法及装置 | |
Han et al. | The role of dispersed information in inflation and inflation expectations | |
CN113762470A (zh) | 预测模型构建方法、预测方法、装置、设备及介质 | |
CN106154170B (zh) | 电池剩余容量的估算方法及*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 510665 No. 293 Shipai Zhongshan Avenue, Tianhe District, Guangzhou City, Guangdong Province Applicant after: GUANGDONG POLYTECHNIC NORMAL University Address before: 510665 No. 293 Shipai Zhongshan Avenue, Tianhe District, Guangzhou City, Guangdong Province Applicant before: GUANGDONG POLYTECHNIC NORMAL University |
|
CB02 | Change of applicant information |