CN111915097B - 基于改进遗传算法优化lstm神经网络的水质预测方法 - Google Patents
基于改进遗传算法优化lstm神经网络的水质预测方法 Download PDFInfo
- Publication number
- CN111915097B CN111915097B CN202010818549.7A CN202010818549A CN111915097B CN 111915097 B CN111915097 B CN 111915097B CN 202010818549 A CN202010818549 A CN 202010818549A CN 111915097 B CN111915097 B CN 111915097B
- Authority
- CN
- China
- Prior art keywords
- water quality
- data
- neural network
- lstm neural
- genetic algorithm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 title claims abstract description 98
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 68
- 230000002068 genetic effect Effects 0.000 title claims abstract description 55
- 238000000034 method Methods 0.000 title claims abstract description 25
- 238000012549 training Methods 0.000 claims abstract description 45
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 claims abstract description 34
- 229910052760 oxygen Inorganic materials 0.000 claims abstract description 34
- 239000001301 oxygen Substances 0.000 claims abstract description 34
- 238000012360 testing method Methods 0.000 claims abstract description 26
- 238000004364 calculation method Methods 0.000 claims abstract description 7
- 238000007781 pre-processing Methods 0.000 claims abstract description 4
- 230000006870 function Effects 0.000 claims description 21
- 239000011159 matrix material Substances 0.000 claims description 12
- 238000003062 neural network model Methods 0.000 claims description 11
- 230000004913 activation Effects 0.000 claims description 9
- 230000003044 adaptive effect Effects 0.000 claims description 9
- 230000035772 mutation Effects 0.000 claims description 7
- 238000011156 evaluation Methods 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 5
- 230000000694 effects Effects 0.000 claims description 4
- 230000002159 abnormal effect Effects 0.000 claims description 3
- 238000011478 gradient descent method Methods 0.000 claims description 3
- 238000012544 monitoring process Methods 0.000 claims description 3
- 210000002569 neuron Anatomy 0.000 claims description 3
- 238000011425 standardization method Methods 0.000 claims description 3
- 230000009469 supplementation Effects 0.000 claims 1
- 241000238557 Decapoda Species 0.000 description 5
- 238000005457 optimization Methods 0.000 description 4
- 238000009360 aquaculture Methods 0.000 description 3
- 244000144974 aquaculture Species 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 230000001502 supplementing effect Effects 0.000 description 2
- 241000238631 Hexapoda Species 0.000 description 1
- 241000607479 Yersinia pestis Species 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/12—Computing arrangements based on biological models using genetic models
- G06N3/126—Evolutionary algorithms, e.g. genetic algorithms or genetic programming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/02—Agriculture; Fishing; Forestry; Mining
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A20/00—Water conservation; Efficient water supply; Efficient water use
- Y02A20/152—Water filtration
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Business, Economics & Management (AREA)
- Biomedical Technology (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Tourism & Hospitality (AREA)
- Evolutionary Biology (AREA)
- Marketing (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Business, Economics & Management (AREA)
- Animal Husbandry (AREA)
- Mining & Mineral Resources (AREA)
- Agronomy & Crop Science (AREA)
- Primary Health Care (AREA)
- Marine Sciences & Fisheries (AREA)
- Physiology (AREA)
- Genetics & Genomics (AREA)
- Development Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
Abstract
本发明公开了一种基于改进遗传算法优化LSTM神经网络的水质预测方法,步骤如下:由无人巡航船搭载的水质传感器采集养殖池温度、溶氧、pH三种原始特征数据并存至HBase数据库中,利用CDH大数据集群Spark计算组件对原始数据进行预处理;再进行Max‑min标准化,利用标准化后数据集构建训练集和测试集;构建基于改进遗传算法优化LSTM神经网络的水质预测模型,优化确定LSTM神经网络和改进遗传算法的基本结构参数;利用构造的训练集训练模型预测养殖池未来某一时刻的水质数据。本发明在LSTM神经网络中引入遗传算法对神经网络训练的步长进行动态调整,从而降低LSTM神经网络预测水质时的相对误差,提高预测精度。
Description
技术领域
本发明属于水质预测领域,具体为一种基于改进遗传算法优化LSTM神经网络的水质预测方法。
背景技术
我国是全球水产养殖第一大国,其产量约占全球养殖60%。根据对养殖失败原因分析发现,导致养殖失败的主要原因有水质问题、气候环境问题、养殖模式问题、苗种质量问题、塘口管理问题以及病害问题,集中表现就是虾苗长不大或者死虾。由于目前国内对虾养殖虾苗一代苗基本依赖进口,因此期望从种苗选育上提高养虾成功率效果不大,所以当前养殖户主要通过努力改善水产养殖水质参数、预防病虫害及提升塘口管理水平方面降低养殖失败率。因此,建立合适的水质预测模型,可以有效的解决水质突变问题,提高养殖产量。
目前关于水质预测的方法有很多,通常使用神经网络进行水质预测。常见的BP神经网络能够对水质数据变化趋势进行预测,但容易陷入局部最优的情况;LSTM神经网络具有较强的时间捕获性,较好的适应水质数据的时序特征,因此LSTM相比于传统的BP神经网络更加准确。但LSTM存在一定局限性,忽视不同时刻的水质指标对结果存在一定影响,且网络结构固定化,不适应不同的水质数据集。
发明内容
发明目的:针对上述问题,本发明引入一种基于改进遗传算法优化LSTM神经网络的水质预测方法。该方法在LSTM神经网络的基础上,引入改进遗传算法对神经网络的训练步长进行动态调整,赋予不同时刻的神经网络不同的训练步长,从而降低训练的误差,提高预测的准确度。
技术方案:一种基于改进遗传算法优化LSTM神经网络的水质预测方法,包括如下步骤:
步骤1)由无人巡航船搭载的水质传感器采集养殖池温度、溶氧、pH三种原始特征数据并存放至HBase集群数据库中,利用CDH大数据集群中Spark内存计算组件对原始特征数据集进行数据预处理,降低数据冗余度和复杂性;
步骤2)将处理过后的数据进行Max-min标准化处理,利用处理好的数据集构建训练集和测试集;
步骤3)构建基于改进遗传算法优化LSTM神经网络的水质预测模型,优化确定LSTM神经网络和改进的遗传算法的基本结构参数;
步骤4)利用构造的训练集训练构建的基于改进遗传算法优化LSTM神经网络的水质预测模型预测养殖池未来某一时刻的水质数据。
进一步地,所述步骤1中,利用无人巡航船在养殖池中监测一定时间,获得按时间排序的养殖池温度、溶氧、pH三种原始特征数据集D,
D={(Dtemp1,Dox1,Dph1)1,(Dtemp2,Dox2,Dph2)2,...,(Dtempi,Doxi,Dphi)n},其中n表示原始数据集D的记录数量,Dt empi,Doxi,Dphi为第i个时间节点的养殖池温度、溶氧、pH数据。
进一步地,所述步骤2中,利用Max-min标准化方法对养殖池温度、溶氧、pH三种原始特征数据集进行标准化处理,通过下式计算E*:
其中,Etemp,oxy,ph表示Max-min标准化前第i个时间节点的养殖池温度、溶氧、pH数据,Et emp,oxy,ph *表示Max-min标准化后的第i个时间节点的养殖池温度、溶氧、pH数据,Dtemp,oxy,phmin表示养殖池温度、溶氧、pH数据中的样本最小值,Dtemp,oxy,phmax表示养殖池温度、溶氧、pH数据中的样本最大值;
通过对采集的养殖池温度、溶氧、pH数据进行Max-min标准化,获得标准化后的数据集为:
D*={(Dtemp1,Dox1,Dph1)1 *,(Dtemp2,Dox2,Dph2)2 *,...,(Dtempi,Doxi,Dphi)n *},其中n表示原始数据集D在Max-min标准化后的记录数量,Dtempi *,Doxi *,Dphi *为第i个时间节点在Max-min标准化后的养殖池温度、溶氧、pH数据;
标准化处理完成后将数据集D*拆分成训练集Train和测试集Test,训练集的数量为a,则测试集的数量为n-a,在三个特征数据后增加一列新的特征值y,y的值代表当前水质的情况,y的值取值为0或1,0代表水质不正常情况,1代表水质正常的情况,对原始数据集进行水质情况的判断补充。
进一步地,所述步骤3中,构造LSTM神经网络模型和改进遗传算法模型,构造改进遗传算法模型用于优化LSTM神经网络的水质预测模型,具体步骤如下:
步骤3-1:构造LSTM神经网络模型,具体步骤如下:
步骤3-1-1:确定LSTM神经网络的初始网络结构、确定隐藏层层数和输出层层数,初始化训练步长η,确定输出层状态矩阵H=(h1,h2,...,hq);
步骤3-1-2:设置LSTM神经网络输入层到隐藏层的连接矩阵U、隐藏层到隐藏层的连接矩阵W、隐藏层到输出层的连接权重V均为随机实数;
步骤3-1-3:设置LSTM神经网络的激活函数,规定输入门、遗忘门和输出门的激活函数均为Sigmod函数,单元状态的激活函数为tanh函数;
步骤3-2:构造改进遗传网络模型,具体步骤如下:
步骤3-2-1:采用二进制编码初始化种群,设置各个参数;
步骤3-2-2:设置适应度函数,计算个体的适应度值,保留适应度最大的个体;
步骤3-2-3:判断是否满足算法结束条件,如果满足收敛条件,则输出结果,否则进入步骤3-2-4;
步骤3-2-5:判断选择操作的结果是否满足算法结束条件,若满足结果则结束算法,否则回到步骤3-2-2;
步骤3-3:构造改进遗传算法模型用于优化LSTM神经网络的水质预测模型,具体步骤如下:
步骤3-3-1:利用步骤3-1构建的LSTM神经网络模型作为水质预测模型的主要架构,输入层层数设置为3,输出层输出状态矩阵H;
步骤3-3-2:确定RMSE作为误差评价标准,将RMSE同时作为步骤3-2改进遗传算法的评价函数;
步骤3-3-3:利用步骤3-2改进遗传算法动态计算每次LSTM训练的步长的适应值,确定适应值最优的步长作为LSTM神经网络训练步长η。
进一步地,所述步骤4中,利用构造的训练集训练构建的基于改进遗传算法优化LSTM神经网络的水质预测模型预测养殖池未来某一时刻的水质数据,具体步骤如下:
步骤4-2:使用均方根误差计算水质情况实际预测值与预期输出值的误差;利用反向传播算法将每次运算的误差传递给LSTM每一个神经元,随后利用随机梯度下降法更新每一个连接权重,更新权重后利用改进遗传算法进行训练步长的调整,调整为适应值最大的作为步长;
步骤4-3:设置迭代1000次,在迭代中不断更新LSTM神经网络连接权重。
步骤4-4:利用测试集数据Test测试模型训练效果,LSTM前向计算输出为h(t):
单元状态:g(t)=tanh(Wgxx(t)+Wghh(t-1)+bg);
输入门:i(t)=σ(Wixx(t)+Wihh(t-1)+bi);
遗忘门:f(t)=σ(Wfxx(t)+Wfhh(t-1)+bf);
输出门:o(t)=σ(Woxx(t)+Wohh(t-1)+bo);
当前状态:s(t)=g(t)*i(t)+s(t-1)*f(t);
输出:h(t)=tanh(s(t))*o(t);
其中i(t)表示当前水质数据中的第t个时间节点的需要更新的信息,
f(t)表示该水质数据中的第t个时间节点需要丢弃的信息,o(t)表示该水质数据中第t个时间节点需要输出的信息,g(t)表示该水质数据在第t个时间节点的单元状态,s(t)表示该水质数据在第t个时间节点的当前状态,
h(t)表示该水质数据中第t个时间节点输出的值;
步骤4-5:将作为测试集的水质数据利用LSTM神经网络前向计算模型进行输出,得到预测的水质数据。
有益效果:本发明的水质预测方法,在LSTM神经网络中引入遗传算法对神经网络训练的步长进行动态调整,从而降低LSTM神经网络预测水质时的相对误差,提高预测精度。
本发明针对LSTM神经网络训练过程中网络结构的固定性,提出一种基于改进遗传算法优化LSTM神经网络的水质预测方法,该方法在LSTM神经网络的基础上,引入改进遗传算法对神经网络的训练步长进行动态调整,赋予不同时刻的神经网络不同的训练步长,从而降低训练的误差,提高预测的准确度,使得水质的预测具有更高的实时性和实用性。
附图说明
图1为本发明的基于改进遗传算法优化LSTM神经网络的水质预测方法步骤示意图;
图2为本发明的基于改进遗传算法优化LSTM神经网络的水质预测方法流程图;
图3为本发明的基于改进遗传算法优化LSTM神经网络模型图;
图4为本发明的基于改进遗传算法优化LSTM神经网络模型测试集数据拟合图。
具体实施方式
下面结合说明书附图对本发明的技术方案做进一步的详细说明。
如图1-4所示,一种基于改进遗传算法优化LSTM神经网络的水质预测方法,包括如下步骤:
步骤1)由无人巡航船搭载的水质传感器采集养殖池温度、溶氧、pH三种原始特征数据并存放至HBase集群数据库中,利用CDH大数据集群中Spark内存计算组件对原始特征数据集进行数据预处理,降低数据冗余度和复杂性;
所述步骤1中,利用无人巡航船在养殖池中监测一定时间,获得按时间排序的养殖池温度、溶氧、pH三种原始特征数据集D,
D={(Dtemp1,Dox1,Dph1)1,(Dtemp2,Dox2,Dph2)2,...,(Dtemp i,Doxi,Dphi)n},其中n表示原始数据集D的记录数量,Dt empi,Doxi,Dphi为第i个时间节点的养殖池温度、溶氧、pH数据。
步骤2)将处理过后的数据进行Max-min标准化处理,利用处理后的数据集构建训练集和测试集;
所述步骤2中,使用Max-min标准化方法对养殖池温度、溶氧、pH三种原始特征数据集进行标准化处理,通过下式计算E*:
其中,Etemp,oxy,ph表示Max-min标准化前第i个时间节点的养殖池温度、溶氧、pH数据,Et emp,oxy,ph *表示Max-min标准化后的第i个时间节点的养殖池温度、溶氧、pH数据,Dtemp,oxy,phmin表示养殖池温度、溶氧、pH数据中的样本最小值,Dtemp,oxy,phmax表示养殖池温度、溶氧、pH数据中的样本最大值;
通过对采集的养殖池温度、溶氧、pH数据进行Max-min标准化,获得标准化后的数据集为:
D*={(Dtemp1,Dox1,Dph1)1 *,(Dtemp2,Dox2,Dph2)2 *,...,(Dtempi,Doxi,Dphi)n *},其中n表示原始数据集D在Max-min标准化后的记录数量,Dtempi *,Doxi *,Dphi *为第i个时间节点在Max-min标准化后的养殖池温度、溶氧、pH数据;
标准化处理完成后将数据集D*拆分成训练集Train和测试集Test,训练集的数量为a,则测试集的数量为n-a,在三个特征数据后增加一列新的特征值y,y的值代表当前水质的情况,y的值取值为0或1,0代表水质不正常情况,1代表水质正常的情况,对原始数据集进行水质情况的判断补充。
步骤3)构建基于改进遗传算法优化LSTM神经网络的水质预测模型,优化确定LSTM神经网络和改进的遗传算法的基本结构参数;
所述步骤3中,构造LSTM神经网络模型和改进遗传算法模型,构造改进遗传算法模型用于优化LSTM神经网络的水质预测模型,具体步骤如下:
步骤3-1:构造LSTM神经网络模型,具体步骤如下:
步骤3-1-1:确定LSTM神经网络的初始网络结构、确定隐藏层层数和输出层层数,初始化训练步长η,确定输出层状态矩阵H=(h1,h2,...,hq);
步骤3-1-2:设置LSTM神经网络输入层到隐藏层的连接矩阵U、隐藏层到隐藏层的连接矩阵W、隐藏层到输出层的连接权重V均为随机实数;
步骤3-1-3:设置LSTM神经网络的激活函数,规定输入门、遗忘门和输出门的激活函数均为Sigmod函数,单元状态的激活函数为tanh函数;
步骤3-2:构造改进遗传网络模型,具体步骤如下:
步骤3-2-1:采用二进制编码初始化种群,设置各个参数;
步骤3-2-2:设置适应度函数,计算个体的适应度值,保留适应度最大的个体;
步骤3-2-3:判断是否满足算法结束条件,如果满足收敛条件,则输出结果,否则进入步骤3-2-4;
步骤3-2-5:判断选择操作的结果是否满足算法结束条件,若满足结果则结束算法,否则回到步骤3-2-2;
步骤3-3:构造改进遗传算法模型用于优化LSTM神经网络的水质预测模型,具体步骤如下:
步骤3-3-1:利用步骤3-1构建LSTM神经网络模型作为水质预测模型的主要架构,输入层层数设置为3,输出层输出状态矩阵H;
步骤3-3-2:确定RMSE作为误差评价标准,将RMSE同时作为步骤3-2改进遗传算法的评价函数;
步骤3-3-3:利用步骤3-2改进遗传算法动态计算每次LSTM训练的步长的适应值,确定适应值最优的步长作为LSTM神经网络训练步长η。
步骤4)利用构造的训练集训练构建基于改进遗传算法优化LSTM神经网络的水质预测模型预测养殖池未来某一时刻的水质数据;
所述步骤4中,利用构造的训练集训练基于改进遗传算法优化LSTM神经网络的水质预测模型预测养殖池未来某一时刻的水质数据,具体步骤如下:
步骤4-2:使用均方根误差计算水质情况实际预测值与预期输出值的误差;利用反向传播算法将每次运算的误差传递给LSTM每一个神经元,随后利用随机梯度下降法更新每一个连接权重,更新权重后利用改进遗传算法进行训练步长的调整,调整为适应值最大的作为步长;
步骤4-3:设置迭代1000次,在迭代中不断更新LSTM神经网络连接权重。
步骤4-4:利用测试集数据Test测试模型训练效果,LSTM前向计算输出为h(t):
单元状态:g(t)=tanh(Wgxx(t)+Wghh(t-1)+bg);
输入门:i(t)=σ(Wixx(f)+Wihh(t-1)+bi);
遗忘门:f(t)=σ(Wfxx(t)+Wfhh(t-1)+bf);
输出门:o(t)=σ(Woxx(t)+Wohh(t-1)+bo);
当前状态:s(t)=g(t)*i(t)+s(t-1)*f(t);
输出:h(t)=tanh(s(t))*o(t);
其中i(t)表示当前水质数据中的第t个时间节点的需要更新的信息,f(t)表示该水质数据中的第t个时间节点需要丢弃的信息,o(t)表示该水质数据中第t个时间节点需要输出的信息,g(t)表示该水质数据在第t个时间节点的单元状态,s(t)表示该水质数据在第t个时间节点的当前状态,
h(t)表示该水质数据中第t个时间节点输出的值;
步骤4-5:将作为测试集的水质数据利用LSTM神经网络前向计算模型进行输出,得到预测的水质数据。
本发明针对LSTM神经网络训练过程中网络结构的固定性,提出一种基于改进遗传算法优化LSTM神经网络的水质预测方法,该方法在LSTM神经网络的基础上,引入改进遗传算法对神经网络的训练步长进行动态调整,赋予不同时刻的神经网络不同的训练步长,从而降低训练的误差,提高预测的准确度,使得水质的预测具有更高的实时性和实用性。
以上所述仅为本发明的实验室环境下较佳的实施方式,本发明保护范围并不以上述实施方式为限制,但凡本领域普通技术人员根据本发明所揭示内容所作的等效修改和修饰变化,皆应纳入权利要求书记载的保护范围。
Claims (1)
1.一种基于改进遗传算法优化LSTM神经网络的水质预测方法,其特征在于:所述方法包括如下步骤:
步骤1)由无人巡航船搭载的水质传感器采集养殖池温度、溶氧、pH三种原始特征数据并存放至HBase集群数据库中,利用CDH大数据集群中Spark内存计算组件对原始特征数据集进行数据预处理,降低数据冗余度和复杂性;
步骤2)将处理过后的数据进行Max-min标准化处理,利用处理好的数据集构建训练集和测试集;
步骤3)构建基于改进遗传算法优化LSTM神经网络的水质预测模型,优化确定LSTM神经网络和改进的遗传算法的基本结构参数;
步骤4)利用构造的训练集训练构建的基于改进遗传算法优化LSTM神经网络的水质预测模型预测养殖池未来某一时刻的水质数据;
所述步骤1中,利用无人巡航船在养殖池中监测一定时间,获得按时间排序的养殖池温度、溶氧、pH三种原始特征数据集D,D={(Dtemp1,Dox1,Dph1)1,(Dtemp2,Dox2,Dph2)2,...,(Dtempi,Doxi,Dphi)n},其中n表示原始数据集D的记录数量,Dtempi,Doxi,Dphi为第i个时间节点的养殖池温度、溶氧、pH数据;
所述步骤2中,使用Max-min标准化方法对养殖池温度、溶氧、pH三种原始特征数据集进行标准化处理,通过下式计算E*:
其中,Etemp,oxy,ph表示Max-min标准化前第i个时间节点的养殖池温度、溶氧、pH数据,Etemp,oxy,ph *表示Max-min标准化后的第i个时间节点的养殖池温度、溶氧、pH数据,Dtemp,oxy, phmin表示养殖池温度、溶氧、pH数据中的样本最小值,Dtemp,oxy,phmax表示养殖池温度、溶氧、pH数据中的样本最大值;
通过对采集的养殖池温度、溶氧、pH数据进行Max-min标准化,获得标准化后的数据集为:
D*={(Dtemp1,Dox1,Dph1)1 *,(Dtemp2,Dox2,Dph2)2 *,...,(Dtempi,Doxi,Dphi)n *},其中n表示原始数据集D在Max-min标准化后的记录数量,Dtempi *,Doxi *,Dphi *为第i个时间节点在Max-min标准化后的养殖池温度、溶氧、pH数据;
标准化处理完成后将数据集D*拆分成训练集Train和测试集Test,训练集的数量为a,则测试集的数量为n-a,在三个特征数据后增加一列新的特征值y,y的值代表当前水质的情况,y的值取值为0或1,0代表水质不正常情况,1代表水质正常的情况,对原始数据集进行水质情况的判断补充;
所述步骤3中,构造LSTM神经网络模型和改进遗传算法模型,构造改进遗传算法模型用于优化LSTM神经网络的水质预测模型,具体步骤如下:
步骤3-1:构造LSTM神经网络模型,具体步骤如下:
步骤3-1-1:确定LSTM神经网络的初始网络结构、确定隐藏层层数和输出层层数,初始化训练步长η,确定输出层状态矩阵H=(h1,h2,...,hq);
步骤3-1-2:设置LSTM神经网络输入层到隐藏层的连接矩阵U、隐藏层到隐藏层的连接矩阵W、隐藏层到输出层的连接权重V均为随机实数;
步骤3-1-3:设置LSTM神经网络的激活函数,规定输入门、遗忘门和输出门的激活函数均为Sigmod函数,单元状态的激活函数为tanh函数;
步骤3-2:构造改进遗传网络模型,具体步骤如下:
步骤3-2-1:采用二进制编码初始化种群,设置各个参数;
步骤3-2-2:设置适应度函数,计算个个体的适应度值,保留适应度最大的个体;
步骤3-2-3:判断是否满足算法结束条件,如果满足收敛条件,则输出结果,否则进入步骤3-2-4;
步骤3-2-5:判断选择操作的结果是否满足算法结束条件,若满足结果则结束算法,否则回到步骤3-2-2;
步骤3-3:构造改进遗传算法模型用于优化LSTM神经网络的水质预测模型,具体步骤如下:
步骤3-3-1:使用步骤3-1构建的LSTM神经网络模型作为水质预测模型的主要架构,输入层层数设置为3,输出层输出状态矩阵H;
步骤3-3-2:确定RMSE作为误差评价标准,将RMSE同时作为步骤3-2改进遗传算法的评价函数;
步骤3-3-3:使用步骤3-2改进遗传算法动态计算每次LSTM训练的步长的适应值,确定适应值最优的步长作为LSTM神经网络训练步长η;
所述步骤4中,利用构造的训练集训练构建的基于改进遗传算法优化LSTM神经网络的水质预测模型预测养殖池未来某一时刻的水质数据,具体步骤如下:
步骤4-2:使用均方根误差计算水质情况实际预测值与预期输出值的误差;利用反向传播算法将每次运算的误差传递给LSTM每一个神经元,随后利用随机梯度下降法更新每一个连接权重,更新权重后利用改进遗传算法进行训练步长的调整,调整为适应值最大的作为步长;
步骤4-3:设置迭代1000次,在迭代中不断更新LSTM神经网络连接权重;
步骤4-4:利用测试集数据Test测试模型训练效果,LSTM前向计算输出为h(t):
单元状态:g(t)=tanh(Wgxx(t)+Wghh(t-1)+bg);
输入门:i(t)=σ(Wixx(t)+Wihh(t-1)+bi);
遗忘门:f(t)=σ(Wfxx(t)+Wfhh(t-1)+bf);
输出门:o(t)=σ(Woxx(t)+Wohh(t-1)+bo);
当前状态:s(t)=g(t)*i(t)+s(t-1)*f(t);
输出:h(t)=tanh(s(t))*o(t);
其中i(t)表示当前水质数据中的第t个时间节点的需要更新的信息,f(t)表示该水质数据中的第t个时间节点需要丢弃的信息,o(t)表示该水质数据中第t个时间节点需要输出的信息,g(t)表示该水质数据在第t个时间节点的单元状态,s(t)表示该水质数据在第t个时间节点的当前状态,h(t)表示该水质数据中第t个时间节点输出的值;
步骤4-5:将作为测试集的水质数据利用LSTM神经网络前向计算模型进行输出,得到预测的水质数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010818549.7A CN111915097B (zh) | 2020-08-14 | 2020-08-14 | 基于改进遗传算法优化lstm神经网络的水质预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010818549.7A CN111915097B (zh) | 2020-08-14 | 2020-08-14 | 基于改进遗传算法优化lstm神经网络的水质预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111915097A CN111915097A (zh) | 2020-11-10 |
CN111915097B true CN111915097B (zh) | 2022-11-11 |
Family
ID=73283113
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010818549.7A Active CN111915097B (zh) | 2020-08-14 | 2020-08-14 | 基于改进遗传算法优化lstm神经网络的水质预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111915097B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112946187B (zh) * | 2021-01-22 | 2023-04-07 | 西安科技大学 | 一种基于神经网络的避难硐室实时状态监测方法 |
CN114548482A (zh) * | 2021-12-24 | 2022-05-27 | 中铁西北科学研究院有限公司 | 一种基于蠕变型滑坡动能变化率临滑预警方法 |
CN114386686B (zh) * | 2021-12-30 | 2022-10-18 | 北京师范大学 | 一种基于改进lstm的流域水质短期预测方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108986470A (zh) * | 2018-08-20 | 2018-12-11 | 华南理工大学 | 粒子群算法优化lstm神经网络的行程时间预测方法 |
CN110321361A (zh) * | 2019-06-15 | 2019-10-11 | 河南大学 | 基于改进的lstm神经网络模型的试题推荐判定方法 |
CN110633868A (zh) * | 2019-07-19 | 2019-12-31 | 中国石油化工股份有限公司 | 遗传算法优化神经网络进行探井试油层油气性质预测方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7280987B2 (en) * | 2004-03-26 | 2007-10-09 | Halliburton Energy Services, Inc. | Genetic algorithm based selection of neural network ensemble for processing well logging data |
CN109243172B (zh) * | 2018-07-25 | 2021-06-08 | 华南理工大学 | 基于遗传算法优化lstm神经网络的交通流预测方法 |
CN110428082B (zh) * | 2019-05-31 | 2022-07-22 | 南京邮电大学 | 基于注意力神经网络的水质预测方法 |
-
2020
- 2020-08-14 CN CN202010818549.7A patent/CN111915097B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108986470A (zh) * | 2018-08-20 | 2018-12-11 | 华南理工大学 | 粒子群算法优化lstm神经网络的行程时间预测方法 |
CN110321361A (zh) * | 2019-06-15 | 2019-10-11 | 河南大学 | 基于改进的lstm神经网络模型的试题推荐判定方法 |
CN110633868A (zh) * | 2019-07-19 | 2019-12-31 | 中国石油化工股份有限公司 | 遗传算法优化神经网络进行探井试油层油气性质预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111915097A (zh) | 2020-11-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111915097B (zh) | 基于改进遗传算法优化lstm神经网络的水质预测方法 | |
CN104751842B (zh) | 深度神经网络的优化方法及*** | |
CN106022521B (zh) | 基于Hadoop架构的分布式BP神经网络的短期负荷预测方法 | |
CN106228185A (zh) | 一种基于神经网络的通用图像分类识别***及方法 | |
CN109920248B (zh) | 一种基于gru神经网络的公交到站时间预测方法 | |
CN111929748A (zh) | 一种气象要素预报方法和*** | |
CN112906828A (zh) | 一种基于时域编码和脉冲神经网络的图像分类方法 | |
CN111461463A (zh) | 一种基于tcn-bp的短期负荷预测方法、***及设备 | |
CN115034126A (zh) | 一种通过灰狼算法优化lstm神经网络模型的方法与*** | |
CN110097929A (zh) | 一种高炉铁水硅含量在线预测方法 | |
CN114004152B (zh) | 基于图卷积和循环神经网络的多风场风速时空预测方法 | |
CN114862015A (zh) | 一种基于FEN-ConvLSTM模型的台风风速智能预测方法 | |
CN113962819A (zh) | 一种基于极限学习机的工厂化水产养殖溶解氧预测方法 | |
CN117349622A (zh) | 基于混合深度学习机制的风电场风速预测方法 | |
CN113011091A (zh) | 一种自动分组的多尺度轻量型深度卷积神经网络优化方法 | |
CN116525135B (zh) | 基于气象因素的时空模型对疫情发展态势进行预测的方法 | |
CN117351440A (zh) | 基于开放式文本检测的半监督船舶检测方法及*** | |
CN112651499A (zh) | 一种基于蚁群优化算法和层间信息的结构化模型剪枝方法 | |
CN116029604B (zh) | 一种基于健康舒适度的笼养肉鸭养殖环境调控方法 | |
CN111524023A (zh) | 温室调节方法及*** | |
CN113807005B (zh) | 基于改进fpa-dbn的轴承剩余寿命预测方法 | |
CN115205577A (zh) | 用于图像分类的卷积神经网络的自适应优化训练方法 | |
CN114139783A (zh) | 基于非线性加权组合的风电短期功率预测方法及装置 | |
CN110543724B (zh) | 面向总体设计的卫星结构性能预测方法 | |
CN110728292A (zh) | 一种多任务联合优化下的自适应特征选择算法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |