CN114169505A - 一种产量预测模型的训练方法、***及相关设备 - Google Patents
一种产量预测模型的训练方法、***及相关设备 Download PDFInfo
- Publication number
- CN114169505A CN114169505A CN202111513930.3A CN202111513930A CN114169505A CN 114169505 A CN114169505 A CN 114169505A CN 202111513930 A CN202111513930 A CN 202111513930A CN 114169505 A CN114169505 A CN 114169505A
- Authority
- CN
- China
- Prior art keywords
- neural network
- network model
- yield
- model
- current
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 90
- 238000012549 training Methods 0.000 title claims abstract description 53
- 238000003062 neural network model Methods 0.000 claims abstract description 90
- 230000002068 genetic effect Effects 0.000 claims abstract description 47
- 238000012417 linear regression Methods 0.000 claims abstract description 27
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 24
- 238000012216 screening Methods 0.000 claims abstract description 13
- 210000002569 neuron Anatomy 0.000 claims description 69
- 230000008569 process Effects 0.000 claims description 30
- 230000006870 function Effects 0.000 claims description 23
- 238000004519 manufacturing process Methods 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 13
- 230000004913 activation Effects 0.000 claims description 9
- 230000001419 dependent effect Effects 0.000 claims description 9
- 238000010998 test method Methods 0.000 claims description 9
- 238000003860 storage Methods 0.000 claims description 7
- 238000005457 optimization Methods 0.000 claims description 6
- 238000012353 t test Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 4
- 238000013528 artificial neural network Methods 0.000 abstract description 16
- 238000013473 artificial intelligence Methods 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 15
- 238000004364 calculation method Methods 0.000 description 8
- 239000011159 matrix material Substances 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 238000007418 data mining Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000007614 genetic variation Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/086—Learning methods using evolutionary algorithms, e.g. genetic algorithms or genetic programming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/12—Computing arrangements based on biological models using genetic models
- G06N3/126—Evolutionary algorithms, e.g. genetic algorithms or genetic programming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Business, Economics & Management (AREA)
- Biophysics (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Tourism & Hospitality (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Physiology (AREA)
- Primary Health Care (AREA)
- Educational Technology (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Genetics & Genomics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明适用于人工智能应用领域,提供了一种产量预测模型的训练方法、***及相关设备,所述方法包括获取往期产量数据,使用多元线性回归模型对所述往期产量数据进行筛选,得到影响因子;根据所述影响因子搭建BP神经网络模型;对所述BP神经网络模型分别进行前向传播、后向传播,根据传播结果调整所述BP神经网络模型;使用遗传算法对所述BP神经网络模型进行权值和阈值初始化,并输出产量预测模型。本发明简化了输入数据,降低了BP神经网络的复杂度,避免了过拟合、并减少了模型训练时间,进一步提高了基于BP神经网络的产量预测模型的预测精确度。
Description
技术领域
本发明属于人工智能应用领域,尤其涉及一种产量预测模型的训练方法、***及相关设备。
背景技术
农作物的产量预测是经济学和管理学重要的研究课题,目前常用的农作物产量预测方法包括温室传感器数据采集、光谱分析、卫星遥感等,虽然这些方法经过多年的技术迭代,能够取得很好的预测效果,但无一例外地需要持续的资金投入在设备生产、部署、运营的部分,这也是商业农作物预测方案的特点,因此不太适用于规模较小、作物种植不具备普遍性的情况。
对此,在具备复杂计算能力的微型计算机得到普遍运用的现代社会,从计算机学的角度,对农作物的预测可以使用人工智能的方法来进行,在研究中常采用回归模型和基于神经网络的数据挖掘技术,其中,回归模型用于统计分析影响农作物生长因素之间的关联,常用的回归模型包括岭回归、LASS0回归、KNN等,而数据挖掘则是根据各个农作物生长因素以预测最终的产量。在这个问题上,回归模型的参数会直接影响到基于神经网络的数据挖掘的性能,因此如何精简和优化参数,使得整个产量预测的过程轻量化、从而增加部署场景的问题是当前研究的重点。
发明内容
本发明实施例提供一种产量预测模型的训练方法、***及相关设备,旨在解决使用BP神经网络用于产量预测时参数过多、复杂度大的问题。
第一方面,本发明实施例提供一种产量预测模型的训练方法,所述方法包括:
获取往期产量数据,使用多元线性回归模型对所述往期产量数据进行筛选,得到影响因子;
根据所述影响因子搭建BP神经网络模型;
对所述BP神经网络模型分别进行前向传播、后向传播,根据传播结果调整所述BP神经网络模型;
使用遗传算法对所述BP神经网络模型进行权值和阈值初始化,并输出产量预测模型。
更进一步地,所述获取往期产量数据,使用多元线性回归模型对所述往期产量数据进行筛选,得到影响因子的步骤,包括以下子步骤:
使用statsmodels库中的ols函数进行回归参数求解,并使用predict函数预测因变量,结合所述回归参数和所述因变量构建所述多元线性回归模型;
对所述往期产量数据中的离散数据做哑变量处理,并将所述往期产量数据输入至所述多元线性回归模型;
在所述多元线性回归模型中结合F检验、t检验、方差膨胀因子、相关性系数的检验方法根据所述往期产量数据输出优化后的所述影响因子。
更进一步地,所述根据所述影响因子搭建BP神经网络模型的步骤,包括以下子步骤:
根据所述影响因子确定输入层神经元的个数,同时,确定用于产量预测的输出层神经元的个数为1个;
结合Kolmogorov定理,通过所述输入层神经元的个数和所述输出层神经元的个数计算隐藏层神经元的个数区间;
在所述隐藏层神经元的个数区间内试算均方根误差,将均方根误差最小时的所述隐藏层神经元的个数作为隐藏层神经元的最终个数;
根据所述输入层神经元的个数、所述隐藏层神经元的最终个数、所述输出层神经元的个数构建前后层全连接结构的所述BP神经网络模型。
更进一步地,对所述BP神经网络模型分别进行前向传播、后向传播,根据传播结果调整所述BP神经网络模型的步骤,包括以下子步骤:
以所述影响因子作为训练数据集,对所述BP神经网络模型进行所述前向传播,得到预测产量值;
根据所述预测产量值计算实际差异,并在所述BP神经网络模型中进行所述后向传播,得到所述BP神经网络模型中输入层、隐藏层、输出层之间的误差,并根据误差对所述BP神经网络模型进行调整。
更进一步地,所述使用遗传算法对所述BP神经网络模型进行权值和阈值初始化的步骤,具体为:
通过分析所述BP神经网络模型的结构,并定义包含所述权值和所述阈值的种群个体,以所述种群个体进行编码,得到初始种群;
进入遗传迭代流程,对所述初始种群进行解码,得到每一个所述种群个体的当前权值和当前阈值,以所述当前权值和所述当前阈值对所述BP神经网络模型进行训练,得到关于每一个所述种群个体的所述当前权值和所述当前阈值的适应度;
复制大于预设高适应度值的所述种群个体,并删除小于预设低适应度值的所述种群个体,在剩下的所述种群个体之间进行交叉变异,得到第二种群,完成所述遗传迭代流程;
判断所述第二种群是否满足预设遗传终止条件,其中:
若不满足,则利用所述第二种群进行所述遗传迭代流程;
若满足,则对所述第二种群进行解码,得到最终权值和最终阈值,并输出产量预测模型。
更进一步地,对所述BP神经网络模型分别进行前向传播、后向传播的步骤中,使用sigmoid作为所述隐藏层的激活函数,使用identity作为所述输出层的激活函数。
更进一步地,对所述BP神经网络模型分别进行前向传播、后向传播的步骤中,使用随机梯度下降算法作为所述后向传播的优化函数。
第二方面,本发明实施例还提供一种产量预测模型的训练***,包括:
数据筛选模块,用于获取往期产量数据,使用多元线性回归模型对所述往期产量数据进行筛选,得到影响因子;
模型构建模块,用于根据所述影响因子搭建BP神经网络模型;
模型调整模块,用于对所述BP神经网络模型分别进行前向传播、后向传播,根据传播结果调整所述BP神经网络模型;
遗传算法优化模块,用于使用遗传算法对所述BP神经网络模型进行权值和阈值初始化,并输出产量预测模型。
第三方面,本发明实施例还提供一种计算机设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述实施例中任意一项所述的产量预测模型的训练方法中的步骤。
第四方面,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述实施例中任意一项所述的产量预测模型的训练方法中的步骤。
本发明所达到的有益效果,由于通过多元线性模型简化了输入数据,从而降低了BP神经网络的复杂度,并且,通过采取遗传算法优化BP神经网络的权值、阈值参数,避免了模型训练的过拟合、减少了训练时间,进一步提高了基于BP神经网络的产量预测模型的预测精确度。
附图说明
图1是本发明实施例提供的产量预测模型的训练方法的流程框图;
图2是本发明实施例提供的产量预测模型的训练方法中步骤S101的子流程框图;
图3是本发明实施例提供的产量预测模型的结构示意图;
图4是本发明实施例提供的产量预测模型的训练方法中步骤S102的子流程框图;
图5是本发明实施例提供的产量预测模型的训练方法中步骤S103的子流程框图;
图6是本发明实施例提供的产量预测模型的训练方法中步骤S104的子流程框图;
图7是本发明实施例提供的产量预测模型的训练***200的结构示意图;
图8是本发明实施例提供的计算机设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
请参照图1,图1是本发明实施例提供的产量预测模型的训练方法的流程框图,具体包括以下步骤:
S101、获取往期产量数据,使用多元线性回归模型对所述往期产量数据进行筛选,得到影响因子。
请参照图2,图2是本发明实施例提供的产量预测模型的训练方法中步骤S101的子流程框图,具体包括以下子步骤:
S1011、使用statsmodels库中的ols函数进行回归参数求解,并使用predict函数预测因变量,结合所述回归参数和所述因变量构建所述多元线性回归模型。
具体的,所述statsmodels库是python的一种统计分析库,其中,所述ols函数(Ordinary Least Squares,最小二乘法)用于将样本数据进行最小二乘拟合,即将样本数据最小化,而predict函数用于判断样本数据的分类概率,并返回一个概率值作为线性回归的因变量,在本发明实施例中,所述多元线性回归模型先后包括所述ols函数以及所述predict函数,并在数据输入所述多元线性回归模型后按照函数顺序进行所述回归参数和所述因变量的求解。
S1012、对所述往期产量数据中的离散数据做哑变量处理,并将所述往期产量数据输入至所述多元线性回归模型。
在本发明实施例中,所述往期产量数据是现有的某一区域的农作物往期产量数据,所述往期产量数据足够丰富,数据中包括多种影响因素和对应的数据样本,例如,区域中的多个城市过去十年内的某一作物的年产量、总产量等,此外还包括天气信息、良种率、人为辅助作物生长的信息等,其中,以字符而不是数字的形式存储于所述往期产量数据中的数据称为离散数据,例如某城市的名称,在本发明实施例中,为了进一步减少数据集的冗余度,对所述往期产量数据中的离散数据作哑变量处理,之后,将经过哑变量处理的所述往期产量数据输入所述多元线性回归模型。
S1013、在所述多元线性回归模型中结合F检验、t检验、方差膨胀因子、相关性系数的检验方法根据所述往期产量数据输出优化后的所述影响因子。
具体的,所述F检验为方差齐性检验,即在比较两个数据样本时,判断两者的总体方差是否相同,所述t检验用于检测两者的数据样本均数是否相同,所述方差膨胀因子(Variance Inflation Factor,简称VIF)用于反映数据样本之间的多重共线性导致的方差增加程度,所述相关性系数用于反映两个数据样本之间变化的趋势和程度,根据以上的检验方法结合所述多元线性回归模型,将所述往期产量数据进行优化,从中提取出最具有相关性的信息,得到相对于所述往期产量数据更少、但是数据之间关系更明显的优化数据,将其作为所述影响因子,并通过所述多元线性回归模型输出。此外,因为变量之间的相关性具有大小区别,所述影响因子中变量的个数可以根据实际需求选择,实例性的,在本发明实施例所选取的所述往期产量数据中提取到的所述影响因子中变量的个数为最具有相关性的6个,如无特殊说明,在本发明实施例的下文中均以所述影响因子包括6个变量作为实施例对象进行说明。
S102、根据所述影响因子搭建BP神经网络模型。
请同时参照图3和图4,图3是本发明实施例提供的产量预测模型的结构示意图,图4是本发明实施例提供的产量预测模型的训练方法中步骤S102的子流程框图,具体包括以下子步骤:
S1021、根据所述影响因子确定输入层神经元的个数,同时,确定用于产量预测的输出层神经元的个数为1个。
在本发明实施例中,结合影响因子中变量的个数确定所述BP(Back Propagation,前馈)神经网络模型的所述输入层神经元的个数,由所述多元线性回归模型提取出的所述影响因子包含6个变量,因此所述BP神经网络模型的所述输入层神经元的个数为6个,同时,在将所述BP神经网络模型用于产量预测时输出1个预测值,因此所述BP神经网络模型的所述输出层神经元的个数为1个。
S1022、结合Kolmogorov定理,通过所述输入层神经元的个数和所述输出层神经元的个数计算隐藏层神经元的个数区间。
具体的,所述Kolmogorov定理是一种概率论定理,用于描述随机变量序列的算术平均值向常数收敛的情况,在本发明实施例中,使用所述Kolmogorov定理计算出所述隐藏层神经元的数量,定义n为所述输入层神经元的个数,定义m为所述输出层神经元的个数,则对于所述隐藏层神经元的数量HN通过所述Kolmogorov定理表示为以下计算式:
其中,a为自然数序列,a=[1,10],在本发明实施例中,n的数值为6,m的数值为1,则所述隐藏层神经元的个数HN区间为[3,12]。
S1023、在所述隐藏层神经元的个数区间内试算均方根误差,将均方根误差最小时的所述隐藏层神经元的个数作为隐藏层神经元的最终个数。
根据所述隐藏层神经元的个数区间HN,在所述个数区间内HN将所有自然数取值并代入所述BP神经网络模型进行均方根误差计算,得到每一个HN的取值的均方根误差,取所述均方根误差最小的对应的HN值作为所述BP神经网络模型的隐藏层神经元的最终个数,在本发明实施例中,计算出的最小均方根误差为4,即HN取值为4时,使得本发明实施例中的所述BP神经网络的精确度最高,因此本发明实施例中设置的所述隐藏层神经元的个数为4。
S1024、根据所述输入层神经元的个数、所述隐藏层神经元的最终个数、所述输出层神经元的个数构建前后层全连接结构的所述BP神经网络模型。
在本发明实施例中,根据上述步骤中得到的所述输入层神经元的个数、所述隐藏层神经元的最终个数、所述输出层神经元的个数构建前后层全连接结构的所述BP神经网络模型,即,模型中的每一个神经元都与下一层的所有神经元连接,每一对连接都通过一组神经元参数来表示。
S103、对所述BP神经网络模型分别进行前向传播、后向传播,根据传播结果调整所述BP神经网络模型。
请参照图5,图5是本发明实施例提供的产量预测模型的训练方法中步骤S103的子流程框图,具体包括以下子步骤:
S1031、以所述影响因子作为训练数据集,对所述BP神经网络模型进行所述前向传播,得到预测产量值。
所述前向传播指的是根据所述BP神经网络的结构,从前往后顺序计算,直到预设的输出层输出结果的过程。在本发明实施例中,使用上述步骤中筛选出来的所述影响因子作为所述前向传播和所述后向传播时使用的训练数据集,其中,定义l为所述BP神经网络模型中的神经元层数,W为第l层的参数矩阵,X为第l-1层所输入数据的矩阵,f为所述BP神经网络的激活函数,则所述前向传播过程中每一神经元层的计算满足如下公式:
Xl=f(WlXl-1)
在本发明实施例中,使用Sigmoid作为所述隐藏层的激活函数,使用identity作为所述输出层的激活函数,那么,所述前向传播的过程的计算过程满足如下公式:
根据上式,所述隐藏层使用Sigmoid作为损失函数时,输出的y值满足如下公式:
之后,所述输出层使用identity作为损失函数时,利用所述训练数据集输出的所述预测产量值y预测满足如下公式:
S1032、根据所述预测产量值计算实际差异,并在所述BP神经网络模型中进行所述后向传播,得到所述BP神经网络模型中输入层、隐藏层、输出层之间的误差,并根据误差对所述BP神经网络模型进行调整。
在本发明实施例中,使用MSE(均方误差)的方法计算所述预测产量值与实际数值之间的差异,差异计算过程满足如下公式:
其中,使用对MSE的值开根号得到的数值作为所述BP神经网络模型的评估标准。
之后,根据所述预测产量值与实际数值之间的差异,使用随机梯度下降算法(Stochastic Gradient Decent,简称SGD)做所述后向传播,从后往前调整所述BP神经网络模型的参数,并减小各神经元层之间的误差,从而设置整个模型训练的学习率。在本发明实施例中,根据所述前向传播和所述后向传播调整后的参数,设置学习率为0.008,训练的迭代次数为1000次。
S104、使用遗传算法对所述BP神经网络模型进行权值和阈值初始化。
请参照图6,图6是本发明实施例提供的产量预测模型的训练方法中步骤S104的子流程框图,具体包括以下子步骤:
S1041、通过分析所述BP神经网络模型的结构,并定义包含所述权值和所述阈值的种群个体,以所述种群个体进行编码,得到初始种群。
示例性的,本发明实施例的所述BP神经网络模型中,所述输入层包括6个神经元,所述隐藏层包括4个神经元,所述输出层包括1个神经元,并且,所述输入层的神经元个数与输入数据的信息维度一致,在本发明实施例中将输入数据表示为[1,6]的矩阵,则该矩阵中包括6个参数,而所述隐藏层包括4个神经元,则所述隐藏层通过与所述输入层全连接表示的权重参数为[6,4]的矩阵,该矩阵包括24个权重参数,所述输出层包括1个神经元,则所述输出层通过全连接与所述隐藏层全连接表示的权重参数为[4,1]的矩阵,该矩阵包括4个权重参数,根据上述数值,在本发明实施例中的所述BP神经网络中一共包含28个权重参数,以下简称为权值,且对应的全连接结构中包含5个阈值,因此参数初始化的数据数量总共为33个。
在本发明实施例中,为使用遗传算法设置用于参与遗传迭代的初始种群,定义种群个体数量为8,并根据所述种群个体进行编码,得到包含8个种群数据的所述初始种群,其中,每个所述种群个体都包括28个权值和5个阈值。需要说明的是,所述种群个体的数量仅用于进行遗传算法的计算,从数据量的角度,所述种群个体数量越多、数据差异越大,那么通过遗传变异得到的结果就越丰富,因此所述种群个体的数量可以根据需要进行选择,对此本发明仅作举例说明,不对具体数值做出限制。
S1042、进入遗传迭代流程,对所述初始种群进行解码,得到每一个所述种群个体的当前权值和当前阈值,以所述当前权值和所述当前阈值对所述BP神经网络模型进行训练,得到关于每一个所述种群个体的所述当前权值和所述当前阈值的适应度。
本步骤开始利用所述遗传算法进行的一组所述遗传迭代流程,将所述初始种群进行解码,得到每一个所述种群个体的所述当前权值和所述当前阈值,并将所述当前权值和所述当前阈值所述BP神经网络的实际参数,以所述影响因子所述训练集再进行训练,并在模型输出结果后计算关于所述当前权值和所述当前阈值的适应度,具体的,所述适应度的值为当前的所述BP神经网络模型输出的所述预测值与实际值之间的误差绝对值的倒数。
S1043、复制大于预设高适应度值的所述种群个体,并删除小于预设低适应度值的所述种群个体,在剩下的所述种群个体之间进行交叉变异,得到第二种群,完成所述遗传迭代流程。
在计算得到所述初始种群中每一个所述种群个体的所述适应度之后,根据适应度的大小关系,根据所述预设高适应度值和所述预设低适应度值对所述种群个体进行复制和删除,实例性的,所述预设高适应度值为适应度排序中的第二个值,所述预设低适应度值为适应度排序中的倒数第二个值,在这种情况下,适应度较大的前两个所述种群个体会被复制,而适应度最低的前两个所述种群个体会被删除,使得所述种群个体的数量不变,并将复制和删除后的所有所述种群个体进行交叉变异,从而得到所述第二种群,并完成一组所述遗传迭代流程,这种方法更有利于变异出高适应度的所述种群个体。
S1044、判断所述第二种群是否满足预设遗传终止条件,其中:
1044a、若不满足,则利用所述第二种群进行所述遗传迭代流程。
在本发明实施例中,所述预设遗传终止条件为所述种群个体中适应度最高的值大于某一个预设值,对此,还可以将所述预设遗传终止条件设置为完成具体次数的所述遗传迭代流程,为了平衡迭代结果的有效度和迭代计算的时长,可以根据实际需求进行选择。当完成了一次所述遗传迭代流程后,若不满足所述预设遗传终止条件,则使用当前的所述第二种群重复步骤S1042中的所述遗传迭代流程,继续遗传变异的计算。
1044b、若满足,则对所述第二种群进行解码,得到最终权值和最终阈值,并输出产量预测模型。
当完成了一次所述遗传迭代流程后,若满足所述预设遗传终止条件,则对所述第二种群进行解码,得到适应度值最高的一组所述权值和所述阈值,将其作为所述最终权值和所述最终阈值赋予所述BP神经网络作为参数初值,以取代原来使用随机值作为参数初值的做法,从而提高网络的收敛速度,避免陷入局部极小值的情况。最后,将完成了所述参数初值赋予的所述BP神经网络输出,作为最终的所述产量预测模型。
本发明所达到的有益效果,由于通过多元线性模型简化了输入数据,从而降低了BP神经网络的复杂度,并且,通过采取遗传算法优化BP神经网络的权值、阈值参数,避免了模型训练的过拟合、减少了训练时间,进一步提高了基于BP神经网络的产量预测模型的预测精确度。
本发明实施例还提供一种产量预测模型的训练***,具体的,请参照图7,图7是本发明实施例提供的产量预测模型的训练***200的结构示意图,包括数据筛选模块201、模型构建模块202、模型调整模块203、遗传算法优化模块204,其中:
所述数据筛选模块201,用于获取往期产量数据,使用多元线性回归模型对所述往期产量数据进行筛选,得到影响因子;
所述模型构建模块202,用于根据所述影响因子搭建BP神经网络模型;
所述模型调整模块203,用于对所述BP神经网络模型分别进行前向传播、后向传播,根据传播结果调整所述BP神经网络模型;
所述遗传算法优化模块204,用于使用遗传算法对所述BP神经网络模型进行权值和阈值初始化,并输出产量预测模型。
所述产量预测模型的训练***200能够实现如上述实施例中的产量预测模型的训练方法中的步骤,且能实现同样的技术效果,参上述实施例中的描述,此处不再赘述。
本发明实施例还提供一种计算机设备,请参照图8,图8是本发明实施例提供的计算机设备的结构示意图,所述计算机设备300包括:存储器302、处理器301及存储在所述存储器302上并可在所述处理器301上运行的计算机程序。
所述处理器301调用所述存储器302存储的计算机程序,执行本发明实施例提供的园区管理方法中的步骤,请结合图1,具体包括:
S101、获取往期产量数据,使用多元线性回归模型对所述往期产量数据进行筛选,得到影响因子。
更进一步地,所述获取往期产量数据,使用多元线性回归模型对所述往期产量数据进行筛选,得到影响因子的步骤,包括以下子步骤:
使用statsmodels库中的ols函数进行回归参数求解,并使用predict函数预测因变量,结合所述回归参数和所述因变量构建所述多元线性回归模型;
对所述往期产量数据中的离散数据做哑变量处理,并将所述往期产量数据输入所述多元线性回归模型;
在所述多元线性回归模型中结合F检验、t检验、方差膨胀因子、相关性系数的检验方法根据所述往期产量数据输出优化后的所述影响因子。
S102、根据所述影响因子搭建BP神经网络模型。
更进一步地,所述根据所述影响因子搭建BP神经网络模型的步骤,包括以下子步骤:
根据所述影响因子确定输入层神经元的个数,同时,确定用于产量预测的输出层神经元的个数为1个;
结合Kolmogorov定理,通过所述输入层神经元的个数和所述输出层神经元的个数计算隐藏层神经元的个数区间;
在所述隐藏层神经元的个数区间内试算均方根误差,将均方根误差最小时的所述隐藏层神经元的个数作为隐藏层神经元的最终个数;
根据所述输入层神经元的个数、所述隐藏层神经元的最终个数、所述输出层神经元的个数构建前后层全连接结构的所述BP神经网络模型。
S103、对所述BP神经网络模型分别进行前向传播、后向传播,根据传播结果调整所述BP神经网络模型。
更进一步地,对所述BP神经网络模型分别进行前向传播、后向传播,根据传播结果调整所述BP神经网络模型的步骤,包括以下子步骤:
以所述影响因子作为训练数据集,对所述BP神经网络模型进行所述前向传播,得到预测产量值;
根据所述预测产量值计算实际差异,并在所述BP神经网络模型中进行所述后向传播,得到所述BP神经网络模型中输入层、隐藏层、输出层之间的误差,并根据误差对所述BP神经网络模型进行调整。
S104、使用遗传算法对所述BP神经网络模型进行权值和阈值初始化,并输出产量预测模型。
更进一步地,所述使用遗传算法对所述BP神经网络模型进行权值和阈值初始化的步骤,具体为:
通过分析所述BP神经网络模型的结构,并定义包含所述权值和所述阈值的种群个体,以所述种群个体进行编码,得到初始种群;
进入遗传迭代流程,对所述初始种群进行解码,得到每一个所述种群个体的当前权值和当前阈值,以所述当前权值和所述当前阈值对所述BP神经网络模型进行训练,得到关于每一个所述种群个体的所述当前权值和所述当前阈值的适应度;
复制大于预设高适应度值的所述种群个体,并删除小于预设低适应度值的所述种群个体,在剩下的所述种群个体之间进行交叉变异,得到第二种群,完成所述遗传迭代流程;
判断所述第二种群是否满足预设遗传终止条件,其中:
若不满足,则利用所述第二种群进行所述遗传迭代流程;
若满足,则对所述第二种群进行解码,得到最终权值和最终阈值,并输出产量预测模型。
更进一步地,对所述BP神经网络模型分别进行前向传播、后向传播的步骤中,使用sigmoid作为所述隐藏层的激活函数,使用identity作为所述输出层的激活函数。
更进一步地,对所述BP神经网络模型分别进行前向传播、后向传播的步骤中,使用随机梯度下降算法作为所述后向传播的优化函数。
本发明实施例提供的计算机设备300能够实现如上述实施例中的产量预测模型的训练方法中的步骤,且能实现同样的技术效果,参上述实施例中的描述,此处不再赘述。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现本发明实施例提供的产量预测模型的训练方法中的各个过程及步骤,且能实现相同的技术效果,为避免重复,这里不再赘述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存取存储器(Random AccessMemory,简称RAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,所揭露的仅为本发明较佳实施例而已,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式用等同变化,均属于本发明的保护之内。
Claims (10)
1.一种产量预测模型的训练方法,其特征在于,所述方法包括:
获取往期产量数据,使用多元线性回归模型对所述往期产量数据进行筛选,得到影响因子;
根据所述影响因子搭建BP神经网络模型;
对所述BP神经网络模型分别进行前向传播、后向传播,根据传播结果调整所述BP神经网络模型;
使用遗传算法对所述BP神经网络模型进行权值和阈值初始化,并输出产量预测模型。
2.如权利要求1所述的产量预测模型的训练方法,其特征在于,所述获取往期产量数据,使用多元线性回归模型对所述往期产量数据进行筛选,得到影响因子的步骤,包括以下子步骤:
使用statsmodels库中的ols函数进行回归参数求解,并使用predict函数预测因变量,结合所述回归参数和所述因变量构建所述多元线性回归模型;
对所述往期产量数据中的离散数据做哑变量处理,并将所述往期产量数据输入至所述多元线性回归模型;
在所述多元线性回归模型中结合F检验、t检验、方差膨胀因子、相关性系数的检验方法,根据所述往期产量数据输出优化后的所述影响因子。
3.如权利要求2所述的产量预测模型的训练方法,其特征在于,所述根据所述影响因子搭建BP神经网络模型的步骤,包括以下子步骤:
根据所述影响因子确定输入层神经元的个数,同时,确定用于产量预测的输出层神经元的个数为1个;
结合Kolmogorov定理,通过所述输入层神经元的个数和所述输出层神经元的个数计算隐藏层神经元的个数区间;
在所述隐藏层神经元的个数区间内试算均方根误差,将均方根误差最小时的所述隐藏层神经元的个数作为隐藏层神经元的最终个数;
根据所述输入层神经元的个数、所述隐藏层神经元的最终个数、所述输出层神经元的个数构建前后层全连接结构的所述BP神经网络模型。
4.如权利要求3所述的产量预测模型的训练方法,其特征在于,对所述BP神经网络模型分别进行前向传播、后向传播,根据传播结果调整所述BP神经网络模型的步骤,包括以下子步骤:
以所述影响因子作为训练数据集,对所述BP神经网络模型进行所述前向传播,得到预测产量值;
根据所述预测产量值计算实际差异,并在所述BP神经网络模型中进行所述后向传播,得到所述BP神经网络模型中输入层、隐藏层、输出层之间的误差,并根据误差对所述BP神经网络模型进行调整。
5.如权利要求4所述的产量预测模型的训练方法,其特征在于,使用遗传算法对所述BP神经网络模型进行权值和阈值初始化的步骤,具体为:
通过分析所述BP神经网络模型的结构,并定义包含所述权值和所述阈值的种群个体,以所述种群个体进行编码,得到初始种群;
进入遗传迭代流程,对所述初始种群进行解码,得到每一个所述种群个体的当前权值和当前阈值,以所述当前权值和所述当前阈值对所述BP神经网络模型进行训练,得到关于每一个所述种群个体的所述当前权值和所述当前阈值的适应度;
复制大于预设高适应度值的所述种群个体,并删除小于预设低适应度值的所述种群个体,在剩下的所述种群个体之间进行交叉变异,得到第二种群,完成所述遗传迭代流程;
判断所述第二种群是否满足预设遗传终止条件,其中:
若不满足,则利用所述第二种群进行所述遗传迭代流程;
若满足,则对所述第二种群进行解码,得到最终权值和最终阈值,并输出产量预测模型。
6.如权利要求4所述的产量预测模型的训练方法,其特征在于,对所述BP神经网络模型分别进行前向传播、后向传播的步骤中,使用sigmoid作为所述隐藏层的激活函数,使用identity作为所述输出层的激活函数。
7.如权利要求4所述的产量预测模型的训练方法,其特征在于,对所述BP神经网络模型分别进行前向传播、后向传播的步骤中,使用随机梯度下降算法作为所述后向传播的优化函数。
8.一种产量预测模型的训练***,其特征在于,包括:
数据筛选模块,用于获取往期产量数据,使用多元线性回归模型对所述往期产量数据进行筛选,得到影响因子;
模型构建模块,用于根据所述影响因子搭建BP神经网络模型;
模型调整模块,用于对所述BP神经网络模型分别进行前向传播、后向传播,根据传播结果调整所述BP神经网络模型;
遗传算法优化模块,用于使用遗传算法对所述BP神经网络模型进行权值和阈值初始化,并输出产量预测模型。
9.一种计算机设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至7中任意一项所述的产量预测模型的训练方法中的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任意一项所述的产量预测模型的训练方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111513930.3A CN114169505A (zh) | 2021-12-10 | 2021-12-10 | 一种产量预测模型的训练方法、***及相关设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111513930.3A CN114169505A (zh) | 2021-12-10 | 2021-12-10 | 一种产量预测模型的训练方法、***及相关设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114169505A true CN114169505A (zh) | 2022-03-11 |
Family
ID=80485774
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111513930.3A Pending CN114169505A (zh) | 2021-12-10 | 2021-12-10 | 一种产量预测模型的训练方法、***及相关设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114169505A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115270506A (zh) * | 2022-08-16 | 2022-11-01 | 青岛理工大学 | 一种人群沿楼梯上行的通行时间预测方法及*** |
CN117079737A (zh) * | 2023-10-17 | 2023-11-17 | 深圳市永霖科技有限公司 | 一种基于成分分析的抛光液预测方法和装置 |
CN117273237A (zh) * | 2023-11-15 | 2023-12-22 | 宁德市天铭新能源汽车配件有限公司 | 一种基于人工智能的汽车零部件产能预测方法及*** |
-
2021
- 2021-12-10 CN CN202111513930.3A patent/CN114169505A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115270506A (zh) * | 2022-08-16 | 2022-11-01 | 青岛理工大学 | 一种人群沿楼梯上行的通行时间预测方法及*** |
CN115270506B (zh) * | 2022-08-16 | 2024-02-23 | 青岛理工大学 | 一种人群沿楼梯上行的通行时间预测方法及*** |
CN117079737A (zh) * | 2023-10-17 | 2023-11-17 | 深圳市永霖科技有限公司 | 一种基于成分分析的抛光液预测方法和装置 |
CN117273237A (zh) * | 2023-11-15 | 2023-12-22 | 宁德市天铭新能源汽车配件有限公司 | 一种基于人工智能的汽车零部件产能预测方法及*** |
CN117273237B (zh) * | 2023-11-15 | 2024-02-27 | 宁德市天铭新能源汽车配件有限公司 | 一种基于人工智能的汽车零部件产能预测方法及*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114169505A (zh) | 一种产量预测模型的训练方法、***及相关设备 | |
CN108231201B (zh) | 一种疾病数据分析处理模型的构建方法、***及应用方法 | |
CN107729999A (zh) | 考虑矩阵相关性的深度神经网络压缩方法 | |
CN112488183B (zh) | 一种模型优化方法、装置、计算机设备及存储介质 | |
CN109886343B (zh) | 图像分类方法及装置、设备、存储介质 | |
CN112288086A (zh) | 一种神经网络的训练方法、装置以及计算机设备 | |
CN112910690A (zh) | 基于神经网络模型的网络流量预测方法、装置及设备 | |
CN110929798A (zh) | 基于结构优化稀疏卷积神经网络的图像分类方法及介质 | |
CN112288137A (zh) | 一种计及电价和Attention机制的LSTM短期负荷预测方法及装置 | |
CN108647772B (zh) | 一种用于边坡监测数据粗差剔除的方法 | |
CN111985719A (zh) | 一种基于改进的长短期记忆网络的电力负荷预测方法 | |
CN114358197A (zh) | 分类模型的训练方法及装置、电子设备、存储介质 | |
CN114694379B (zh) | 一种基于自适应动态图卷积的交通流预测方法及*** | |
CN115409292A (zh) | 一种电力***短期负荷预测方法及相关装置 | |
CN116170328A (zh) | 图形编码的使用带宽预测方法及装置 | |
CN110826692B (zh) | 一种自动化模型压缩方法、装置、设备及存储介质 | |
CN113011532A (zh) | 分类模型训练方法、装置、计算设备及存储介质 | |
CN111932091A (zh) | 一种基于梯度生存提升树的生存分析风险函数预测方法 | |
CN112200208A (zh) | 基于多维度特征融合的云工作流任务执行时间预测方法 | |
CN111524348A (zh) | 一种长短期交通流预测模型及方法 | |
CN116415177A (zh) | 一种基于极限学习机的分类器参数辨识方法 | |
CN115131646A (zh) | 基于离散系数的深度网络模型压缩方法 | |
CN114358186A (zh) | 一种数据处理方法、装置及计算机可读存储介质 | |
Alrubaie | Cascade-Forward neural network for volterra integral equation solution | |
CN112463964A (zh) | 文本分类及模型训练方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |