CN113393057A - 一种基于深度融合机器学习模型的小麦产量集成预测方法 - Google Patents
一种基于深度融合机器学习模型的小麦产量集成预测方法 Download PDFInfo
- Publication number
- CN113393057A CN113393057A CN202110790877.5A CN202110790877A CN113393057A CN 113393057 A CN113393057 A CN 113393057A CN 202110790877 A CN202110790877 A CN 202110790877A CN 113393057 A CN113393057 A CN 113393057A
- Authority
- CN
- China
- Prior art keywords
- model
- yield
- data
- wheat
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 241000209140 Triticum Species 0.000 title claims abstract description 102
- 235000021307 Triticum Nutrition 0.000 title claims abstract description 102
- 238000000034 method Methods 0.000 title claims abstract description 45
- 230000004927 fusion Effects 0.000 title claims abstract description 42
- 238000010801 machine learning Methods 0.000 title claims abstract description 33
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 claims abstract description 31
- 238000012545 processing Methods 0.000 claims abstract description 14
- 238000012847 principal component analysis method Methods 0.000 claims abstract description 6
- 230000006870 function Effects 0.000 claims description 21
- 239000013598 vector Substances 0.000 claims description 14
- 238000012549 training Methods 0.000 claims description 13
- 238000004364 calculation method Methods 0.000 claims description 12
- 239000011159 matrix material Substances 0.000 claims description 12
- 238000007689 inspection Methods 0.000 claims description 10
- 230000004913 activation Effects 0.000 claims description 9
- 238000011161 development Methods 0.000 claims description 7
- 238000010606 normalization Methods 0.000 claims description 7
- 238000000513 principal component analysis Methods 0.000 claims description 7
- 238000005311 autocorrelation function Methods 0.000 claims description 6
- 230000001186 cumulative effect Effects 0.000 claims description 6
- 238000012360 testing method Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 5
- 238000004422 calculation algorithm Methods 0.000 claims description 4
- 238000002474 experimental method Methods 0.000 claims description 4
- 239000003337 fertilizer Substances 0.000 claims description 4
- 230000010354 integration Effects 0.000 claims description 4
- 238000005457 optimization Methods 0.000 claims description 4
- 230000005540 biological transmission Effects 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 3
- 238000005314 correlation function Methods 0.000 claims description 3
- 238000011478 gradient descent method Methods 0.000 claims description 3
- 238000003973 irrigation Methods 0.000 claims description 3
- 230000002262 irrigation Effects 0.000 claims description 3
- 238000012886 linear function Methods 0.000 claims description 3
- 230000001537 neural effect Effects 0.000 claims description 3
- 238000003062 neural network model Methods 0.000 claims description 3
- 238000010899 nucleation Methods 0.000 claims description 3
- 238000009825 accumulation Methods 0.000 claims description 2
- 230000003044 adaptive effect Effects 0.000 claims description 2
- 238000000605 extraction Methods 0.000 claims description 2
- 238000012417 linear regression Methods 0.000 claims description 2
- 238000004088 simulation Methods 0.000 claims description 2
- 239000000126 substance Substances 0.000 claims 3
- 230000005611 electricity Effects 0.000 claims 1
- 238000003971 tillage Methods 0.000 claims 1
- 230000009286 beneficial effect Effects 0.000 abstract description 3
- 230000001276 controlling effect Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 230000035764 nutrition Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2135—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/02—Agriculture; Fishing; Forestry; Mining
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Agronomy & Crop Science (AREA)
- Animal Husbandry (AREA)
- Marine Sciences & Fisheries (AREA)
- Mining & Mineral Resources (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于深度融合机器学***均相对误差S1和预测值;S4.通过LSTM网络得到产量数据拟合值的平均相对误差S2和预测值;S5.建立多因素灰色预测模型对原始数据序列进行拟合,得到产量数据拟合值的平均相对误差S3和预测值;S6.对模型进行加权融合;S7.在需要预测时,通过融合后的模型预测小麦产量。本发明能够有效增强预测模型的抗干扰能力,有助于缩小误差,使得小麦产量预测更加准确、可靠。
Description
技术领域
本发明属于农作物产量的预测技术领域,涉及一种基于深度融合机器学习模型的小麦产量集成预测方法,特别涉及一种基于主成分分析的LSTM网络、多因素灰色预测模型和 ARIMA模型的小麦产量集成预测方法。
背景技术
小麦是我国主要的粮食作物之一,也是提供人们日常营养的重要来源之一,小麦的产量关乎我国14亿人民的生存问题,为了提前了解小麦的产量以及时调节指导小麦的生产作业过程,对一定时期小麦产量的预测研究显得尤为重要。使用科学的方法预测小麦的产量,对指导小麦生产,科学及时调控小麦产业发展,确保小麦稳步增产,保持农业持续稳定发展,促进社会发展等具有十分重要的意义。
小麦的产量受到诸多因素的影响,其最终产量是由多个影响因素共同作用的,在这其中,有些影响因素对产量的影响比较大,有些则比较小,这就需要科学的挖掘这些影响因素对小麦生长的影响程度。随着科学技术的不断进步,近些年来机器学习方法被广泛应用到作物产量预测研究中,在实际运用中取得较好的效果,但大多采用了单一的预测模型,总体的预测精度并不高。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于深度融合机器学习模型的小麦产量集成预测方法,能够有效减轻单个模型预测精度不足和算法鲁棒性较差的问题,增强预测模型的抗干扰能力,有助于缩小误差,使得小麦产量预测更加准确、可靠。
本发明的目的是通过以下技术方案来实现的:一种基于深度融合机器学习模型的小麦产量集成预测方法,包括以下步骤:
S1.给定与小麦产量相关的若干个初始影响因素,选择历史数据:
从历史数据库中随机选择n年的历史数据;从选择的历史数据中提取每一个初始影响因素在n年内的因素值,同时从选择的历史数据中提取n年的小麦产量数据,形成小麦历史年产量数据序列;
S2.对设定年限内小麦产量的初始影响因素值作标准化处理,计算相关系数矩阵和特征向量,利用主成分分析方法提取主成分指标,得到小麦产量的显著影响因素作为特征数据;
S3.采用ARIMA模型对小麦历史年产量数据序列进行处理,得到产量数据拟合值的平均相对误差S1和预测值;
选择ARIMA模型,首先采用ADF单位根检验法,对小麦历史年产量数据序列进行平稳性检验,如果未通过ADF检验,则可以认为该数据序列是非稳定的,应采用对原数据序列做一阶差分的方法使原始序列转化为平稳序列,直到差分序列通过ADF平稳性检验,同时确定模型ARIMA(p,d,q)的差分阶数d;结合一阶差分序列自相关函数ACF以及偏相关函数PACF,确定模型ARIMA(p,d,q)中的参数p,q,对于p,q不同的取值,从低阶到高阶分别建立ARIMA模型,计算所有模型的AIC值,选择使得AIC值达到最小的模型,即为最优模型。
其中,ARIMA模型的形式为:
ut=a+φ1ut-1+…+φput-p+εt+θ1εt-1+…+θqεt-q
式中:p为自回归模型的阶数,d为差分次数,q为移动平均阶数;ut为差分后的平稳序列; a为常数,φ为自回归模型系数,θ为移动平均模型系数,εt为零均值白噪声序列。
AIC值计算公式为:
其中k是参数的个数,N为观察者数,SSR为残差平方和。
将历史的每年小麦产量数据作为模型的输入数据,使用得到的最优模型进行运算得到最近T年的产量预测值,记为数组P1,并计算最近T年产量的预测值的平均相对误差S1。
S4.对主成分指标对应的数据序列进行差分处理,通过LSTM网络模型得到产量数据拟合值的平均相对误差S2和预测值;
所述步骤S4中,LSTM是由多个同构单元格组成,每个单元格由4个主要元素构成:输入门、遗忘门、输出门和单元状态,LSTM模型描述为:
ft=σ(Wf×[ht-1,xt]+bf)
it=σ(Wi×[ht-1,xt]+bi)
ot=σ(Wo×[ht-1,xt]+bo)
ht=ot tanh(Ct)
式中:x为LSTM单元的输入向量;h为单元格输出向量;f·i、o分别表示遗忘门、输入门和输出门;C表示单元状态;下标t表示时刻;σ、tanh分别为sigmoid、tanh激活函数;W和b分别表示权重和偏差矩阵;
LSTM的关键是单元状态C,它在t时刻保持单元状态的记忆,通过遗忘门ft和输入门it进行调节;遗忘门的作用是让细胞记住或忘记它之前的状态Ct-1,输入门的作用是允许或阻止传入信号更新单元状态;输出门的作用是控制单元状态C输出和传输到下一个单元格;
在训练时,LSTM网络每个时刻都有对应的监督值st,一般情况下可以构建一个损失函数让相关网络参数可以得到不断的优化,损失函数表达为:
其中,j(θ)为目标函数,θ为需要优化的参数,优化的目的是取得最佳的θ值让j(θ)值最小,一般的优化方式采用梯度下降法;
LSTM训练方法采用反向传播算法;
在模型实际构建中,首先对经过主成分分析后的的数据序列进行数据归一化处理,归一化处理公式为:
其中,r为该数据序列的其中一个数值,rmax为该序列中的最大值,rmin为该序列中的最小值;
然后,采用多对一的LSTM神经网络模型,LSTM层神经单元的激活函数为tanh函数,输出层的激活函数使用线性函数;
通过实验寻找并选择合适的LSTM网络输入层、输出层、隐含层单元数和网络训练方法,建立LSTM模型;
将历史每年和小麦产量相关的影响因素数据和产量数据作为模型的训练集,最近T年内和小麦产量相关的影响因素数据作为测试集,使用训练过的LSTM模型进行运算得到最近T 年的产量预测值,记为数组P2,并计算近几年产量的预测值的平均相对误差S2。
S5.建立多因素灰色预测模型对原始数据序列进行拟合,得到产量数据拟合值的平均相对误差S3和预测值;
S6.对模型进行加权融合:
设置误差阈值,根据平均相对误差确定ARIMA模型、LSTM网络模型、多因素灰色预测模型预测值的权重;按照确定的权重对三个模型的预测值进行加权融合得到的集成预测值;判断集成预测值与实际值的误差是否大于误差阈值,若是误差大于预测阈值,返回步骤S1,从历史数据库中选择更多的历史数据,再执行步骤S1~步骤S6,重新训练基于深度融合机器学习模型的小麦产量集成预测模型,直至由步骤S6计算得到的预测误差不大于误差阈值,保存此时的ARIMA模型、LSTM网络模型、多因素灰色预测模型和模型的权重信息,作为深度融合机器学习模型下的小麦产量集成预测模型;
S7.在需要预测时,基于深度融合机器学习模型下的小麦产量集成预测模型进行预测得到预测值,并按照保存的权重进行加权融合和得到最终的预测结果。
优选地,所述步骤S6中模型权重计算公式为:
式中:wj表示第j个模型的权重,Sj表示第j个模型的平均相对误差的绝对值,m表示模型的数量。
优选地,所述步骤S3~S5中,平均相对误差的计算方式为:
式中,pi为数组中的第i个预测值,yi为与预测值pi同一年份的实际值,T为数据个数, i=1,2,3,...,T。
优选地,所述预测方法还包括自适应学习步骤S8:
在完成一次实际数据的预测后,将预测后的数据增加新的历史数据,随着数据的更新,每增加预定数量的历史数据后,按照步骤S1~S6重新进行训练,得到基于深度融合机器学习模型的小麦产量集成预测模型。
本发明的有益效果是:本发明在选取影响产量的影响因素时使用了主成分分析方法,深度挖掘小麦产量潜在的变化规律,使用与小麦产量关系密切的影响因素作为有关模型的输入数据,同时多原理、多角度地预测小麦产量;本发明选取ARIMA模型、LSTM网络、灰色模型3种在计算原理上差异较大的模型作为预测模型,对其进行拟合和测试,在最终预测产量时基于加权平均的思想,根据将3种模型的预测值依据不同的权重进行集成,能够有效减轻单个模型预测精度不足和算法鲁棒性较差的问题;同时,本发明设置了误差阈值对集成预测结果进行充分验证,增强预测模型的抗干扰能力,最大限度的缩小误差,使得小麦产量预测更加准确、可靠。
附图说明
图1为本发明的方法流程图;
图2为实施例中的预测流程示意图;
图3为为实例中各模型预测结果平均相对误差对比图。
具体实施方式
下面结合附图进一步详细描述本发明的技术方案,但本发明的保护范围不局限于以下所述。
如图1所示,一种基于深度融合机器学习模型的小麦产量集成预测方法,包括以下步骤:
S1.给定与小麦产量相关的若干个初始影响因素,选择历史数据:
从历史数据库中随机选择n年的历史数据;从选择的历史数据中提取每一个初始影响因素在n年内的因素值,同时从选择的历史数据中提取n年的小麦产量数据,形成小麦历史年产量数据序列;
S2.对设定年限内小麦产量的初始影响因素值作标准化处理,计算相关系数矩阵和特征向量,利用主成分分析方法提取主成分指标,得到小麦产量的显著影响因素作为特征数据;
S3.采用ARIMA模型对小麦历史年产量数据序列进行处理,得到产量数据拟合值的平均相对误差S1和预测值;
S4.对主成分指标对应的数据序列进行差分处理,通过LSTM网络模型得到产量数据拟合值的平均相对误差S2和预测值;
S5.建立多因素灰色预测模型对原始数据序列进行拟合,得到产量数据拟合值的平均相对误差S3和预测值;
S6.对模型进行加权融合:
设置误差阈值,根据平均相对误差确定ARIMA模型、LSTM网络模型、多因素灰色预测模型预测值的权重;按照确定的权重对三个模型的预测值进行加权融合得到的集成预测值;判断集成预测值与实际值的误差是否大于误差阈值,若是误差大于预测阈值,返回步骤S1,从历史数据库中选择更多的历史数据,再执行步骤S1~步骤S6,重新训练基于深度融合机器学习模型的小麦产量集成预测模型,直至由步骤S6计算得到的预测误差不大于误差阈值,保存此时的ARIMA模型、LSTM网络模型、多因素灰色预测模型和模型的权重信息,作为深度融合机器学习模型下的小麦产量集成预测模型;
S7.在需要预测时,基于深度融合机器学习模型下的小麦产量集成预测模型进行预测得到预测值,并按照保存的权重进行加权融合和得到最终的预测结果。
在本申请的实施例中,采用某市1990~2018年间每年小麦作物播种面积、单位面积产量、有效灌溉面积、机耕面积、化肥使用量、农村用电量、乡村劳动者数量、第一产业比重、受灾面积、农用薄膜使用量、财政农业支出、小麦市场价格、农用机械总动力以及1~4月份、 11~12月份的平均温度、降雨量的数据进行实验,其中1990~2013年的相关数据作为后续模型的训练数据,2014~2018年的数据作为测试数据,小麦产量作为输出结果,预测方法流程图如图2所示:
步骤S1、获取该市1990~2018年与小麦产量相关的数据,包括每年小麦作物播种面积、单位面积产量、有效灌溉面积、机耕面积、化肥使用量、农村用电量、乡村劳动者数量、第一产业比重、受灾面积、农用薄膜使用量、财政农业支出、小麦市场价格、农用机械总动力以及1~4月份、11~12月份的平均温度、降雨量等15个影响因素。
步骤S2、将数据导入SPSS软件,使用SPSS软件,对原始数据进行标准化处理后,计算相关系数矩阵和特征向量,利用主成分分析方法提取主成分指标,将通过主成分分析后得到的影响产量较显著的影响因素对应的数据作为特征数据;
在主成分分析中,首先对原始数据作标准化处理:
设选取的产量初始值共有n个,影响产量的初始影响因素共有k个,这k个因素为x1,x2,x3,…xk,同时xij代表第i个样本在第j个指标上的取值,然后对各指标xij进行数据标准化过程,转换成标准化指标标准化公式为:
标准化过程完成后,计算相关系数矩阵R,R=(rij)m×m其中第i个指标与第j个指标的相关系数表示为rij;再计算得到相关系数矩阵的特征值λ1≥λ2≥…≥λm≥0,及对应的特征向量u1,u2,…um,其中uj=(u1j,u2j,…,umj)T。
通过得到的特征向量可以构造m个新的指标:
yi=ui1x1+ui2x2+…uikxk,(i=1,2,…m)
其中y1,y2,…ym分别表示第1个到第m个主成分;再计算特征值λj(j=1,2,…m)的信息贡献率aj,从而得到累计信息贡献率bp。
yj的信息贡献率aj计算公式为:
累计信息贡献率bp计算公式为:
提取bp值大于0.85的前p个主成分指标,
在本申请的实施例中,相关矩阵特征值的贡献率与累计贡献率如表1所示;由表1可知,前9个数据标准化后的数据主成分累计贡献率已经达到了86.42%,从而可以选定前9个成分作为影响该地区小麦产量的主成分yi(i=1,2,…,9),即小麦作物播种面积、化肥使用量、第一产业比重、受灾面积、小麦市场价格、农用机械总动力以及1~4月份、11~12月份的平均温度、降雨量,相关数据作为后续模型的输入数据。
表1
步骤S3、自回归积分滑动平均模型ARIMA(p,d,q)模型的一般形式:
ut=a+φ1ut-1+…+φput-p+εt+θ1εt-1+…+θqεt-q
式中:p为自回归模型的阶数,d为差分次数,q为移动平均阶数;ut为差分后的平稳序列; a为常数,φ为自回归模型系数,θ为移动平均模型系数,εt为零均值白噪声序列。
使用Python软件导入数据并建立ARIMA模型,首先选择ARIMA模型,首先采用ADF单位根检验法,对1990~2013年小麦产量数据序列进行平稳性检验和差分处理,确定模型ARIMA(p,d,q)的差分阶数d=1;结合一阶差分序列自相关函数ACF以及偏相关函数PACF,确定模型ARIMA(p,d,q)中的参数p,q,对于p,q不同的取值,从低阶到高阶分别建立ARIMA 模型,计算所有模型的AIC值,选择使得AIC值达到最小的模型,找到模型一步误差最小值对应的p=3.q=3,选定最优模型为ARIMA(3,1,3)。
将1990~2013年每年的小麦产量数据作为训练数据输入ARIMA(3,1,3)中,构建预测模型对1990~2013年的数据进行拟合,并进行运算。使用该模型得到2014~2018年产量数据拟合值的平均相对误差S1和预测值,预测值记为数组P1。
步骤S4、使用Python软件导入数据并建立LSTM模型,LSTM是由多个同构单元格组成,每个单元格由4个主要元素构成:输入门、遗忘门、输出门和单元状态。LSTM模型可以描述为:
ft=σ(Wf×[ht-1,xt]+bf)
it=σ(Wi×[ht-1,xt]+bi)
ot=σ(Wo×[ht-1,xt]+bo)
ht=ot tanh(Ct)
式中:x为LSTM单元的输入向量;h为单元格输出向量;f·i、o分别表示遗忘门、输入门和输出门;C表示单元状态;下标t表示时刻;σ、tanh分别为sigmoid、tanh激活函数;W和b分别表示权重和偏差矩阵。
LSTM的关键是单元状态C,它在t时刻保持单元状态的记忆,通过遗忘门ft和输入门it进行调节;遗忘门的作用是让细胞记住或忘记它之前的状态Ct-1,输入门的作用是允许或阻止传入信号更新单元状态;输出门的作用是控制单元状态C输出和传输到下一个单元格;
在模型构建中,首先对经过主成分分析后的的九大数据序列进行数据归一化处理,归一化处理公式为:
其中,r为该数据序列的其中一个数值,rmax为该序列中的最大值,rmin为该序列中的最小值;
然后,采用多对一的LSTM神经网络模型,LSTM层神经单元的激活函数为tanh函数,输出层的激活函数使用线性函数;
通过实验寻找并选择合适的LSTM网络输入层单元数为9,输出层单元数为1,隐含层单元数为30,网络训练方法采用梯度下降法,采用的是具有两层隐藏层的神经网络,建立LSTM模型;
将1990~2013年每年小麦产量相关的影响因素数据和产量数据作为模型的训练集, 2014~2018年和小麦产量相关的影响因素数据作为测试集,使用训练过的LSTM模型进行运算得到最近几年的产量预测值,记为数组P2,并计算近几年产量的预测值的平均相对误差S2。
步骤S5、使用Python软件导入数据并建立多因素灰色与预测模型,采用了GM(1,1)模型,可以描述为:
(1)设待研究事务的特征因素时间序列为y=(y1,y2,…,yn),而影响其发展的因素有q个,设
(3)然后,多因素灰色预测模型可以表示为:y(t)=b0+b1x1(t)+b2x2(t)+…+bqxq(t)
其中y(t)为事物在t时刻的预测值,为第i个因素在t时刻的预测值, bi,i=1,2,…,q为估计参数,利用历史数据y(1),y(2),…,y(m)和 xi(1),xi(2),…,xi(m),i=1,2,…,q,可以求出多因素灰色预测模型估计参数 b=[b0,b1,…,bq]T=(XTX)- 1XTY1
由于假设多因素灰色预测模型是一个线性回归模型,所以最后求出的各因素的预测值代入方程y(t)=b0+b1x1(t)+b2x2(t)+…+bqxq(t),即可求出多因素灰色预测模型的预测值。
令y为小麦产量,经主成分分析后的九大影响指标分别用x1,x2,x3,x4,x5,x6,x7,x8,x9表示,然后分别对1990~2013年9个因素建立灰色GM(1,1)预测模型并对原始数据序列进行拟合,得到2014~2018年产量数据拟合值的平均相对误差S3和预测值,预测值记为数组P3。
步骤S6、根据步骤S3、步骤S4、步骤S5得到的结果,得到以上三个模型的单独最优平均相对误差预测值。
根据以下公式:
式中:wj表示第j个模型的权重,Sj表示第j个模型的平均相对误差的绝对值,m表示模型的数量。
计算出单一模型的权重,如表2所示;
表2
利用表2预测模型的权重进行加权计算,最后根据2014~2018年各模型的预测值以及相对应的权重进行加权,将所求得的结果作为最终的集成预测值。
设置误差阈值为2.6%,验证最终预测值是否准确。
步骤S7、对于实际数据,基于深度融合机器学习模型的小麦产量集成预测模型建立完毕,并且通过步骤S6验证预测模型的准确性:
若由步骤S6计算得到的预测误差不大于误差阈值,则以基于深度融合机器学习模型的小麦产量集成预测值作为最终预测值;
若由步骤S6计算得到的预测误差大于误差阈值,则采集更多历史数据,返回执行步骤 S1~步骤S6,重新训练基于深度融合机器学习模型的小麦产量集成预测模型,直至由步骤 S6计算得到的预测误差小于等于误差阈值。
本实例中集成预测值平均相对误差在2.6%以内,小于误差阈值,预测效果较好。
如图3所示,集成预测模型的预测平均相对误差低于单个的ARIMA、LSTM和灰色模型的平均相对误差,预测结果表明基于深度融合机器学习模型的小麦产量集成预测方法预测准确度更高,可以准确预测未来5年的小麦产量数据。
以上实施例仅用以说明本申请的技术方案,而非对其限制;以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有一定的修改或者替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的保护范围。
Claims (10)
1.一种基于深度融合机器学习模型的小麦产量集成预测方法,其特征在于:包括以下步骤:
S1.给定与小麦产量相关的若干个初始影响因素,选择历史数据:
从历史数据库中随机选择n年的历史数据;从选择的历史数据中提取每一个初始影响因素在n年内的因素值,同时从选择的历史数据中提取n年的小麦产量数据,形成小麦历史年产量数据序列;
S2.对设定年限内小麦产量的初始影响因素值作标准化处理,计算相关系数矩阵和特征向量,利用主成分分析方法提取主成分指标,得到小麦产量的显著影响因素作为特征数据;
S3.采用ARIMA模型对小麦历史年产量数据序列进行处理,得到产量数据拟合值的平均相对误差S1和预测值;
S4.对主成分指标对应的数据序列进行差分处理,通过LSTM网络模型得到产量数据拟合值的平均相对误差S2和预测值;
S5.建立多因素灰色预测模型对原始数据序列进行拟合,得到产量数据拟合值的平均相对误差S3和预测值;
S6.对模型进行加权融合:
设置误差阈值,根据平均相对误差确定ARIMA模型、LSTM网络模型、多因素灰色预测模型预测值的权重;按照确定的权重对三个模型的预测值进行加权融合得到的集成预测值;判断集成预测值与实际值的误差是否大于误差阈值,若是误差大于预测阈值,返回步骤S1,从历史数据库中选择更多的历史数据,再执行步骤S1~步骤S6,重新训练基于深度融合机器学习模型的小麦产量集成预测模型,直至由步骤S6计算得到的预测误差不大于误差阈值,保存此时的ARIMA模型、LSTM网络模型、多因素灰色预测模型和模型的权重信息,作为深度融合机器学习模型下的小麦产量集成预测模型;
S7.在需要预测时,基于深度融合机器学习模型下的小麦产量集成预测模型进行预测得到预测值,并按照保存的权重进行加权融合和得到最终的预测结果。
2.根据权利要求1所述的一种基于深度融合机器学习模型的小麦产量集成预测方法,其特征在于:步骤S1中所述的历史数据库包含N的历史数据,N>n,每一年的历史数据包括该年内小麦的产量,以及该年内小麦各个初始影响因素的因素值。
3.根据权利要求1所述的一种基于深度融合机器学***均温度和降雨量。
4.根据权利要求1所述的一种基于深度融合机器学习模型的小麦产量集成预测方法,其特征在于:所述步骤S2包括:
S201.对小麦产量初始影响因素的因素值作标准化处理:
S202.标准化过程完成后,计算相关系数矩阵R,R=(rij)m×m,其中第i个初始影响因素与第j个初始影响因素的相关系数表示为rij;再计算得到相关系数矩阵的特征值λ1≥λ2≥…≥λm≥0,及对应的特征向量u1,u2,…um,其中uj=(u1j,u2j,…,umj)T;
S203.通过得到的特征向量构造m个新的指标:
yi=ui1x1+ui2x2+…uikxk,(i=1,2,m)
其中y1,y2,…ym分别表示第1个到第m个主成分;再计算特征值λj(j=1,2,…m)的信息贡献率aj,从而得到累计信息贡献率bp;
yj的信息贡献率aj计算公式为:
累计信息贡献率bp计算公式为:
提取bp值大于0.85的前p个主成分指标作为特征数据。
5.根据权利要求1所述的一种基于深度融合机器学习模型的小麦产量集成预测方法,其特征在于:所述步骤S3包括:
选择ARIMA模型,首先采用ADF单位根检验法,对小麦历史年产量数据序列进行平稳性检验,如果未通过ADF检验,则认为该数据序列是非稳定的,采用对原数据序列做一阶差分的方法使原始序列转化为平稳序列,直到差分序列通过ADF平稳性检验,同时确定模型ARIMA(p,d,q)的差分阶数d;结合一阶差分序列自相关函数ACF以及偏相关函数PACF,确定模型ARIMA(p,d,q)中的参数p,q,对于p,q不同的取值,从低阶到高阶分别建立ARIMA模型,计算所有模型的AIC值,选择使得AIC值达到最小的模型,即为最优模型。
其中,ARIMA模型的形式为:
ut=a+φ1ut-1+…+φput-p+εt+θ1εt-1+…+θqεt-q
式中:p为自回归模型的阶数,d为差分次数,q为移动平均阶数;ut为差分后的平稳序列;a为常数,φ为自回归模型系数,θ为移动平均模型系数,εt为零均值白噪声序列。
AIC值计算公式为:
其中k是参数的个数,N为观察者数,SSR为残差平方和;
将历史的每年小麦产量数据作为模型的输入数据,使用得到的最优模型进行运算得到最近T年的产量预测值,记为数组P1,并计算最近T年产量的预测值的平均相对误差S1。
6.根据权利要求4所述的一种基于深度融合机器学习模型的小麦产量集成预测方法,其特征在于:所述步骤S4中,LSTM是由多个同构单元格组成,每个单元格由4个主要元素构成:输入门、遗忘门、输出门和单元状态,LSTM模型描述为:
ft=σ(Wf×[ht-1,xt]+bf)
it=σ(Wi×[ht-1,xt]+bi)
ot=σ(Wo×[ht-1,xt]+bo)
ht=ottanh(Ct)
式中:x为LSTM单元的输入向量;h为单元格输出向量;f、i、o分别表示遗忘门、输入门和输出门;C表示单元状态;下标t表示时刻;σ、tanh分别为sigmoid、tanh激活函数;W和b分别表示权重和偏差矩阵;
LSTM的关键是单元状态C,它在t时刻保持单元状态的记忆,通过遗忘门ft和输入门it进行调节;遗忘门的作用是让细胞记住或忘记它之前的状态Ct-1,输入门的作用是允许或阻止传入信号更新单元状态;输出门的作用是控制单元状态C输出和传输到下一个单元格;
在训练时,LSTM网络每个时刻都有对应的监督值st,一般情况下可以构建一个损失函数让相关网络参数可以得到不断的优化,损失函数表达为:
其中,j(θ)为目标函数,θ为需要优化的参数,优化的目的是取得最佳的θ值让j(θ)值最小,一般的优化方式采用梯度下降法;
LSTM训练方法采用反向传播算法;
在模型实际构建中,首先对经过主成分分析后的的数据序列进行数据归一化处理,归一化处理公式为:
其中,r为该数据序列的其中一个数值,rmax为该序列中的最大值,rmin为该序列中的最小值;
然后,采用多对一的LSTM神经网络模型,LSTM层神经单元的激活函数为tanh函数,输出层的激活函数使用线性函数;
通过实验寻找并选择合适的LSTM网络输入层、输出层、隐含层单元数和网络训练方法,建立LSTM模型;
将历史每年和小麦产量相关的影响因素数据和产量数据作为模型的训练集,最近T年内和小麦产量相关的影响因素数据作为测试集,使用训练过的LSTM模型进行运算得到最近T年的产量预测值,记为数组P2,并计算近几年产量的预测值的平均相对误差S2。
7.根据权利要求5所述的一种基于深度融合机器学习模型的小麦产量集成预测方法,其特征在于:所述步骤S5包括:
S501,设待研究事务的特征因素时间序列为y=(y1,y2,…,yn),而影响其发展的因素有q个,分别为:
其中:
a=[a,u]T=(BTB)-1BTY;
Y=[x(0)(2),x(0)(3),…,x(0)(n)]T;
(3)多因素灰色预测模型表示为:y(t)=b0+b1x1(t)+b2x2(t)+…+bqxq(t)
其中y(t)为事物在t时刻的预测值,为第i个因素在t时刻的预测值,bi,i=1,2,…,q为估计参数,利用历史数据y(1),y(2),…,y(m)和xi(1),xi(2),…,xi(m),i=1,2,…,q,求出多因素灰色预测模型估计参数b=[b0,b1,…,bq]T=(XTX)-1XTY1
由于假设多因素灰色预测模型是一个线性回归模型,所以最后求出的各因素的预测值代入方程y(t)=b0+b1x1(t)+b2x2(t)+…+bqxq(t),从而求出多因素灰色预测模型的预测值;
将历史每年和小麦产量相关的影响因素数据和产量数据作为模型的训练集,最近T年内和小麦产量相关的影响因素数据作为测试集,使用多因素灰色预测模型运算得到最近T年的产量预测值,记为数组P3,并计算T年产量的预测值的平均相对误差S3。
9.根据权利要求1所述的一种基于深度融合机器学习模型的小麦产量集成预测方法,其特征在于:所述预测方法还包括自适应学习步骤S8:
在完成实际数据的预测后,将预测后的数据增加新的历史数据,随着数据的更新,每增加预定数量的历史数据后,按照步骤S1~S6重新进行训练,得到基于深度融合机器学习模型的小麦产量集成预测模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110790877.5A CN113393057A (zh) | 2021-07-13 | 2021-07-13 | 一种基于深度融合机器学习模型的小麦产量集成预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110790877.5A CN113393057A (zh) | 2021-07-13 | 2021-07-13 | 一种基于深度融合机器学习模型的小麦产量集成预测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113393057A true CN113393057A (zh) | 2021-09-14 |
Family
ID=77626143
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110790877.5A Pending CN113393057A (zh) | 2021-07-13 | 2021-07-13 | 一种基于深度融合机器学习模型的小麦产量集成预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113393057A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114708927A (zh) * | 2022-03-09 | 2022-07-05 | 北京理工大学 | 基于灰色预测和lstm的高温合金疲劳性能预测方法 |
CN115758089A (zh) * | 2022-11-08 | 2023-03-07 | 海南师范大学 | 一种钻孔应变数据预测方法 |
CN117273237A (zh) * | 2023-11-15 | 2023-12-22 | 宁德市天铭新能源汽车配件有限公司 | 一种基于人工智能的汽车零部件产能预测方法及*** |
CN117606036A (zh) * | 2023-11-22 | 2024-02-27 | 广东宝杰环保科技有限公司 | 固体废物燃烧污染防治设备及其灰渣积聚预测方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109859469A (zh) * | 2019-02-15 | 2019-06-07 | 重庆邮电大学 | 一种基于集成lstm神经网络的车流量预测方法 |
CN111260136A (zh) * | 2020-01-17 | 2020-06-09 | 上海电力大学 | 一种基于arima-lstm组合模型的楼宇短期负荷预测方法 |
CN111563706A (zh) * | 2020-03-05 | 2020-08-21 | 河海大学 | 一种基于lstm网络的多变量物流货运量预测方法 |
-
2021
- 2021-07-13 CN CN202110790877.5A patent/CN113393057A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109859469A (zh) * | 2019-02-15 | 2019-06-07 | 重庆邮电大学 | 一种基于集成lstm神经网络的车流量预测方法 |
CN111260136A (zh) * | 2020-01-17 | 2020-06-09 | 上海电力大学 | 一种基于arima-lstm组合模型的楼宇短期负荷预测方法 |
CN111563706A (zh) * | 2020-03-05 | 2020-08-21 | 河海大学 | 一种基于lstm网络的多变量物流货运量预测方法 |
Non-Patent Citations (6)
Title |
---|
孙柯华等: ""基于长短期记忆网络的城市建筑垃圾产量预测"", 《华东交通大学学报》 * |
尹晓燕等: ""基于灰色理论和时间序列模型预测棉花产量可行性研究"", 《棉花科学》 * |
谢恒星等: ""灰色预测方法在山东省粮食总产量预测中的应用"", 《水土保持研究》 * |
贾梦琦等: ""基于机器学习的粮食产量预测模型研究"", 《河北农业大学学报》 * |
连强等: ""基于多因素灰色模型的河南省财政收入预测"", 《中国市场》 * |
郭亚菲等: ""基于主成分分析和粒子群优化神经网络的粮食产量预测"", 《江苏农业科学》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114708927A (zh) * | 2022-03-09 | 2022-07-05 | 北京理工大学 | 基于灰色预测和lstm的高温合金疲劳性能预测方法 |
CN115758089A (zh) * | 2022-11-08 | 2023-03-07 | 海南师范大学 | 一种钻孔应变数据预测方法 |
CN117273237A (zh) * | 2023-11-15 | 2023-12-22 | 宁德市天铭新能源汽车配件有限公司 | 一种基于人工智能的汽车零部件产能预测方法及*** |
CN117273237B (zh) * | 2023-11-15 | 2024-02-27 | 宁德市天铭新能源汽车配件有限公司 | 一种基于人工智能的汽车零部件产能预测方法及*** |
CN117606036A (zh) * | 2023-11-22 | 2024-02-27 | 广东宝杰环保科技有限公司 | 固体废物燃烧污染防治设备及其灰渣积聚预测方法 |
CN117606036B (zh) * | 2023-11-22 | 2024-06-04 | 广东宝杰环保科技有限公司 | 固体废物燃烧污染防治设备及其灰渣积聚预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109858647B (zh) | 一种耦合gis和gbdt算法的区域洪涝灾害风险评价与预估方法 | |
CN111563706A (zh) | 一种基于lstm网络的多变量物流货运量预测方法 | |
CN113393057A (zh) | 一种基于深度融合机器学习模型的小麦产量集成预测方法 | |
CN110414788B (zh) | 一种基于相似日和改进lstm的电能质量预测方法 | |
CN101793887B (zh) | 大菱鲆养殖水质评价的模糊神经网络专家***的构建方法 | |
CN111047094A (zh) | 一种基于深度学习算法的抄表数据异常分析方法 | |
CN111626785A (zh) | 一种基于结合注意力的cnn-lstm网络基金价格预测方法 | |
CN109143408B (zh) | 基于mlp的动态区域联合短时降水预报方法 | |
CN106778838A (zh) | 一种预测空气质量的方法 | |
CN111210089A (zh) | 基于kalman滤波的门控循环单元神经网络的股票价格预测方法 | |
CN113592144A (zh) | 一种中长期径流概率预报方法及*** | |
CN113537469B (zh) | 一种基于LSTM网络和Attention机制的城市需水预测方法 | |
CN113159439A (zh) | 一种作物产量的预测方法、***、存储介质和电子设备 | |
CN105184400A (zh) | 一种烟田土壤水分预测方法 | |
CN111461466A (zh) | 基于lstm时间序列的供暖户阀调节方法、***及设备 | |
CN112668822A (zh) | 科技成果转化平台共享***、方法、存储介质、手机app | |
CN116187835A (zh) | 一种基于数据驱动的台区理论线损区间估算方法及*** | |
JPH04372046A (ja) | 需要量予測方法及び装置 | |
CN109190810B (zh) | 基于tdnn的中国北方草原地区ndvi的预测方法 | |
Akinwale Adio et al. | Translated Nigeria stock market price using artificial neural network for effective prediction | |
CN117520784A (zh) | 基于卷积注意力长短期神经网络的地下水位多步预测方法 | |
CN110852415B (zh) | 基于神经网络算法的植被指数预测方法、***及设备 | |
CN116993548A (zh) | 基于增量学习的LightGBM-SVM的教育培训机构信用评估方法及*** | |
CN107704944A (zh) | 一种基于信息论学习的股市波动区间预测方法 | |
CN115759343A (zh) | 一种基于e-lstm的用户电量预测方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210914 |
|
RJ01 | Rejection of invention patent application after publication |