CN109886454B - 一种基于自组织深度信念网络和相关向量机的淡水环境水华预测方法 - Google Patents
一种基于自组织深度信念网络和相关向量机的淡水环境水华预测方法 Download PDFInfo
- Publication number
- CN109886454B CN109886454B CN201910021950.5A CN201910021950A CN109886454B CN 109886454 B CN109886454 B CN 109886454B CN 201910021950 A CN201910021950 A CN 201910021950A CN 109886454 B CN109886454 B CN 109886454B
- Authority
- CN
- China
- Prior art keywords
- hidden layer
- value
- neurons
- neuron
- self
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种基于自组织深度信念网络和相关向量机的淡水环境的水华预测方法,本发明包括以下几个步骤:1.将叶绿素a的浓度作为描述藻类水华形成的表征指标,把与叶绿素a浓度相关的风速、风向、湿度、蓝绿藻、pH值、前一时刻的叶绿素a、溶解氧、氨氮、和水体温度这9个影响因素作为预测模型的输入参数,并进行数据的预处理。2.采用自组织深度信念网络对输入样本数据进行训练,从而完成自组织网络的结构自动调整和原始数据特征的降维和提取。3.将提取的数据特征送入到相关向量机中实现藻类水华的预测。本发明解决了传统深度信念网络在水华预测时预测精度欠佳,结构冗余,容易过拟合的问题,同时使网络在精准预测的前提下实现了结构的更加紧凑。
Description
技术领域
本发明涉及淡水环境保护领域,具体而言,涉及到一种基于自组织深度信念网络和相关向量机的淡水环境水华预测方法。
背景技术
随着经济社会的高速发展,水体富营养化程度日趋严重,藻类水华现象频繁发生,水体环境生态安全遭受到了前所未有的威胁,对城市发展以及居民的日常生活产生了极大的影响。同时也严重制约了经济建设以及社会的发展,藻类水华的防治已经迫在眉睫。深入研究水华形成的机理模型,并对水华暴发这一非常规突发事件进行有效预测,对促进水环境保护和技术进步具有现实意义。
现有的藻类水华预测研究中,目前比较广泛应用的方法主要是基于数理统计分析和神经网络技术的藻类水华预测,然而现有的数理统计方法没有充分挖掘影响藻类生成影响因素间的相互作用关系,对水质监测信息的利用率不高,另外就神经网络技术而言,随着时间复杂程度增加,神经网络预测方法在网络结构选取,参数设置时随意性大,训练时间将大大增加,存在训练过度或不充分现象,往往导致模型的泛化能力较差,进而影响到藻类水华预测结果,因此考虑到现有的数理统计及人工神经网络方法存在的不足,深度学习在藻类水华上的预测应运而生,该领域的学者提出的深度信念网络藻类水华预测方法对数据信息利用率充分,而且在一定程度上取得了比前面主流方法更好的预测效果,然而其所存在的结构冗余,预测精度不甚理想,容易过拟合的问题同样不可忽略,因此解决这些问题对于藻类水华预测具有十分积极的意义。
发明内容
本发明的主要目的在于克服现有深度信念网络技术存在的不足,提供了一种基于自组织深度信念网络和相关向量机的淡水环境水华预测方法,以期能够解决深度信念网络结构冗余,容易过拟合,预测精度不佳的问题,从而在准确的实现藻类水华精准预测的基础上,达到结构更加精简紧凑的目的。
为达到上述目的,本发明所采用的技术方案为:
本发明一种基于自组织深度信念网络和相关向量机的淡水环境水华预测方法的特点是按如下步骤进行:
步骤1:综合考量将叶绿素a浓度作为作为描述水华形成的表征指标,并将与叶绿素a浓度相关的风速,风向,湿度,蓝绿藻,pH值,前一时刻的叶绿素a,溶解氧,氨氮,和水体温度这9个影响因素作为预测模型的输入。
步骤2:通过一系列传感器收集研究对象的状态数据,形成数据集。对数据集中的数据进行数据降噪、奇异点清除和归一化这一系列的预处理操作,将数据归一化到0-1之间,防止在运算中出现大数吃小数导致有效数据丢失。最后总共得到1104组数据,随机选取前百分之八十作为训练数据,剩下的百分之二十作为测试数据,进行水华预测。
步骤3:在对输入样本数据训练过程中,自组织深度信念网络通过改变隐含神经元个数来实现自身结构的自动调整,这实际上相当于增加和修剪神经元之间的连接权重。自组织深度信念网络的初始权值取(0,1)之间的随机值,且保证每次机器时钟随机给定的初始值相同,隐含层结构调整的依据依赖于隐含层神经元的尖峰强度值(尖峰强度值与突触前神经元在生物神经***中的尖峰频率相似)以及隐含层神经元的互信息值,如果某个隐藏层神经元的尖峰强度值大于等于0.7时,则该隐含神经元将被***为两个新的神经元,而如果尖峰强度值小于0.7时,该隐含神经元则会被修剪掉。同时如果两个隐含层神经元之间的互信息值大于3.25时,则说明这两个隐含层神经元有着相似的信息处理能力,则可以将这两个神经元合并为一个神经元,从而达到精简结构的目的。
自组织深度信念网络隐含层神经元的增长和删除依赖于隐藏层神经元的尖峰强度值,而隐含层神经元的合并则依赖于神经元之间的互信息值,尖峰强度值以及互信息的表达式如式(1)和式(3)所示:
其中pij是第i个神经元的第j个输入,wij是第j个输入神经元和第i个神经元之间的权重,qi是第i个神经元的输入神经元的总数。
其中:I(X;Y)代表代表变量神经元输出变量X和Y的互信息,KX和KY分别代表把变量X和Y的取值范围等分为宽度为Δx和Δy片段的个数,N为样本总数,和分别为为样本落入第ki,kj个片段中的个数,为落入单元(ki,kj)中的样本的数量。
KX及KY的表达式分别如式(4)(5)所示:
其中ε为一个定值可以根据样本总数直接计算得出,round代表最接近实变量的整数。
SI值能够反映出隐含层神经元的兴奋程度,由神经生物学可以知道,如果SI值是足够大的,神经元将会进入激活状态。然而,尽管SI值反映了隐含神经元的兴奋程度,但实际上根据神经生物学理论,神经元并不能产生一个极度兴奋的程度,来确定无限的SI值。在这种情况下,有必要来增加神经元的数量来改善神经网络的效率,对于隐含层神经元数目的增长,当其满足式(7)时,第i个隐含神经元将被***为两个隐含神经元。
SI≥SIth (7)
修剪阶段主要是指对隐含层神经元数量进行修剪,研究表明当SI值足够小时,隐含层神经元是不活跃的或者不工作的,因此,需要对隐含神经元进行修剪从而获得一个更加紧凑的神经网络结构,对于隐含层神经元个数的修剪,当其满足式(8)时,第i个隐含神经元将被修剪或者删除。
SI<SIth (8)
其中SIth取值为0.7。
为了使隐含层神经元之间相关性比较小,即使每个隐含层具有各自的功能,自组织深度信念网络将互信息超过设定值的两个隐含层神经元,合并为一个神经元。对于任意的a,b两个隐含层神经元,利用式(3)计算a,b两个隐含层神经元之间的互信息值I(a,b),如果满足式(9),则将其合并为一个神经元:
I(a,b)>Ith (9)
其中:
Ith=λImean (10)
其中Ith为互信息合并隐含神经元的所满足的值,本文取值为3.25,λ为常数,其取值为3,Imean为所有隐含层神经元之间互信息的平均值,n1为隐含层神经元的个数。
通过上述步骤的操作,实现了自组织深度信念网络结构的自动调整,自组织深度信念网络能够反复地和可选择的进行增长、修剪以及合并操作。
步骤4网络结构调整好后,然后用调整好的自组织深度信念网络重新对输入样本数据进行特征提取,之后将提取到的特征输入到相关向量机单元中,借助于相关向量机实现淡水环境藻类水华的精准预测。
相比现有技术,本发明构建了一种基于自组织深度信念网络和相关向量机的淡水环境水华预测方法,其将与叶绿素a浓度相关的风速,风向,湿度,蓝绿藻,pH值,前一时刻的叶绿素a,溶解氧,氨氮,和水体温度作为预测模型的输入参数,并进行数据预处理,接着采用自组织深度信念网络对输入样本数据进行训练,从而完成自组织网络的结构自动调整和原始数据特征的降维和提取,最后将自组织深度信念网络单元提取的数据特征送入到相关向量机中完成最后的预测。本发明不但可以解决传统深度信念网络在水华时预测精度不高,结构冗余,容易过拟合的问题,同时实现了网络结构的更加紧凑。
附图说明
图1为本发明基于自组织深度信念网络和相关向量机的淡水环境水华预测方法的结构框图。
图2为深度信念网络结构框图
图3为自组织深度信念网络结构框图
具体实施方式
下面结合实施例及附图,对本发明作进一步详细的说明,但本发明的实施方式不限于此。
图2中受限玻尔兹曼机(RBM)为深度信念网络(DBN)的核心组成部分,W0,W1,W2分别为连接权值,V0,V1,V2代表可视层,H1,H2代表隐含层。参照图1、2、3所示,其为一种基于自组织深度信念网络和相关向量机的淡水环境水华预测方法,所述方法包括以下步骤:
步骤1:综合考量将叶绿素a浓度作为作为描述水华形成的表征指标,并将与叶绿素a浓度相关的风速,风向,湿度,蓝绿藻,pH值,前一时刻的叶绿素a,溶解氧,氨氮,和水体温度这9个影响因素作为预测模型的输入。
表1部分样本数据示例
步骤2:通过一系列传感器收集研究对象的状态数据,形成数据集。对数据集中的数据进行数据降噪、奇异点清除和归一化这一系列的预处理操作,将数据归一化到0-1之间,防止在运算中出现大数吃小数导致有效数据丢失。最后总共得到1104组数据,随机选取前百分之八十作为训练数据,剩下的百分之二十作为测试数据,进行水华预测。
步骤3:在对输入样本数据训练过程中,自组织深度信念网络通过改变隐含神经元个数来实现自身结构的自动调整,这实际上相当于增加和修剪神经元之间的连接权重。自组织深度信念网络的初始权值取(0,1)之间的随机值,且保证每次机器时钟随机给定的初始值相同,隐含层结构调整的依据依赖于隐含层神经元的尖峰强度值(尖峰强度值与突触前神经元在生物神经***中的尖峰频率相似)以及隐含层神经元的互信息值,如果某个隐藏层神经元的尖峰强度值大于等于SIth(取0.7)时,则该隐含神经元将被***为两个新的神经元,而如果尖峰强度值小于SIth(取0.7)时,该隐含神经元则会被修剪掉。同时如果两个隐含层神经元之间的互信息值大于Ith(取3.25)时,则说明这两个隐含层神经元有着相似的信息处理能力,则可以将这两个神经元合并为一个神经元,从而达到精简结构的目的。
自组织深度信念网络隐含层神经元的增长和删除依赖于隐藏层神经元的尖峰强度值,而隐含层神经元的合并则依赖于神经元之间的互信息值,尖峰强度值以及互信息的表达式如式(1)和式(3)所示:
其中pij是第i个神经元的第j个输入,wij是第j个输入神经元和第i个神经元之间的权重,qi是第i个神经元的输入神经元的总数。
其中:I(X;Y)代表代表变量神经元输出变量X和Y的互信息,KX和KY分别代表把变量X和Y的取值范围等分为宽度为Δx和Δy片段的个数,N为样本总数,和分别为为样本落入第ki,kj个片段中的个数,为落入单元(ki,kj)中的样本的数量。
KX及KY的表达式分别如式(4)(5)所示:
其中ε为一个定值可以根据样本总数直接计算得出,round代表最接近实变量的整数。
SI值能够反映出隐含层神经元的兴奋程度,由神经生物学可以知道,如果SI值是足够大的,神经元将会进入激活状态。然而,尽管SI值反映了隐含神经元的兴奋程度,但实际上根据神经生物学理论,神经元并不能产生一个极度兴奋的程度,来确定无限的SI值。在这种情况下,有必要来增加神经元的数量来改善神经网络的效率,对于隐含层神经元数目的增长,当其满足式(7)时,第i个隐含神经元将被***为两个隐含神经元。
SI≥SIth (7)
修剪阶段主要是指对隐含层神经元数量进行修剪,研究表明当SI值足够小时,隐含层神经元是不活跃的或者不工作的,因此,需要对隐含神经元进行修剪从而获得一个更加紧凑的神经网络结构,对于隐含层神经元个数的修剪,当其满足式(8)时,第i个隐含神经元将被修剪或者删除。
SI<SIth (8)
其中SIth取值为0.7。
为了使隐含层神经元之间相关性比较小,即使每个隐含层具有各自的功能,自组织深度信念网络将互信息超过设定值的两个隐含层神经元,合并为一个神经元。对于任意的a,b两个隐含层神经元,利用式(3)计算a,b两个隐含层神经元之间的互信息值I(a,b),如果满足式(9),则将其合并为一个神经元:
I(a,b)>Ith (9)
其中:
Ith=λImean (10)
其中Ith为互信息合并隐含神经元需满足的值,本文取值为3.25,λ为常数,其取值为3,Imean为所有隐含层神经元之间互信息的平均值,n1为隐含层神经元的个数。
通过上述步骤的操作,实现了自组织深度信念网络结构的自动调整,自组织深度信念网络能够反复地和可选择的进行增长、修剪以及合并操作。
步骤4:用调整好的自组织深度信念网络单元重新对输入样本数据进行特征提取,之后将特征输入到相关向量机单元中,最后借助于相关向量机输出和标签之间的偏差调整相关向量机内部的参数。
步骤5:测试阶段:将测试数据输入到训练好的自组织深度信念网络单元和相关向量机单元,通过内部参数映射得到预测输出,从而完成淡水环境藻类水华的精准预测,预测结果平均可提高两个百分点。
表2理想预测效果对比
算法 | 预测1步 | 预测5步 | 预测10步 |
深度信念网络 | 92.28% | 92.79% | 90.7% |
改进的算法 | 94.30% | 94.00% | 93.10% |
本发明设计合理,不但可以解决传统深度信念网络在水华预测时预测精度不高,结构冗余,容易过拟合的问题,而且实现了网络结构更加紧凑。
尽管上面对本发明说明性的具体方式,以便于本技术领域的技术人员能够理解本发明,但是本发明不仅限于具体实施方式的范围,对本技术领域的普通技术人员而言,只要各种变化包含在所附的权利要求限定和确定的本发明精神和范围内,一切利用本发明构思的发明创造均在保护之列。
Claims (1)
1.一种基于自组织深度信念网络和相关向量机的淡水环境水华预测方法,包括以下几个步骤:
步骤1:综合考量将叶绿素a浓度作为作为描述水华形成的表征指标,并将与叶绿素a浓度相关的风速,风向,湿度,蓝绿藻,pH值,前一时刻的叶绿素a,溶解氧,氨氮,和水体温度这9个影响因素作为预测模型的输入;
步骤2:通过一系列传感器收集研究对象的状态数据,形成数据集;对数据集中的数据进行预处理,随机选取部分作为训练数据,剩下的部分作为测试数据,进行水华预测;
步骤3:自组织深度信念网络的初始权值取(0,1)之间的随机值,且保证每次机器时钟随机给定的初始值相同,隐含层结构调整的依据依赖于隐含层神经元的尖峰强度值以及隐含层神经元的互信息值,
自组织深度信念网络隐含层神经元的增长和删除依赖于隐藏层神经元的尖峰强度值,而隐含层神经元的合并则依赖于神经元之间的互信息值,尖峰强度值以及互信息的表达式如式(1)和式(3)所示:
其中pij是第i个神经元的第j个输入,wij是第j个输入神经元和第i个神经元之间的权重,qi是第i个神经元的输入神经元的总数;
其中:I(X;Y)代表代表变量神经元输出变量X和Y的互信息,KX和KY分别代表把变量X和Y的取值范围等分为宽度为Δx和Δy片段的个数,N为样本总数,和分别为为样本落入第ki,kj个片段中的个数,为落入单元(ki,kj)中的样本的数量;
KX及KY的表达式分别如式(4)(5)所示:
其中ε为一个定值根据样本总数直接计算得出,round代表最接近实变量的整数;
对于隐含层神经元数目的增长,当其满足式(7)时,第i个隐含神经元将被***为两个隐含神经元;
SI≥SIth (7)
当其满足式(8)时,第i个隐含神经元将被修剪或者删除;
SI<SIth (8)
其中SIth取值为0.7;
对于任意的a,b两个隐含层神经元,利用式(3)计算a,b两个隐含层神经元之间的互信息值I(a;b),如果满足式(9),则将其合并为一个神经元:
I(a;b)>Ith (9)
其中:
Ith=λImean (10)
其中Ith为互信息合并隐含神经元的所满足的值,取值为3.25,λ为常数,其取值为3,Imean为所有隐含层神经元之间互信息的平均值,n1为隐含层神经元的个数;
步骤4:网络结构调整好后,然后用调整好的自组织深度信念网络重新对输入样本数据进行特征提取,之后将提取到的特征输入到相关向量机单元中,借助于相关向量机实现淡水环境藻类水华的预测。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910021950.5A CN109886454B (zh) | 2019-01-10 | 2019-01-10 | 一种基于自组织深度信念网络和相关向量机的淡水环境水华预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910021950.5A CN109886454B (zh) | 2019-01-10 | 2019-01-10 | 一种基于自组织深度信念网络和相关向量机的淡水环境水华预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109886454A CN109886454A (zh) | 2019-06-14 |
CN109886454B true CN109886454B (zh) | 2021-03-02 |
Family
ID=66925785
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910021950.5A Active CN109886454B (zh) | 2019-01-10 | 2019-01-10 | 一种基于自组织深度信念网络和相关向量机的淡水环境水华预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109886454B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112862173B (zh) * | 2021-01-29 | 2022-10-11 | 北京工商大学 | 基于自组织深度置信回声状态网的湖库蓝藻水华预测方法 |
CN114169646B (zh) * | 2021-12-31 | 2023-02-03 | 中科三清科技有限公司 | 水华预测方法、装置、电子设备及计算机可读存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160132787A1 (en) * | 2014-11-11 | 2016-05-12 | Massachusetts Institute Of Technology | Distributed, multi-model, self-learning platform for machine learning |
CN106682316A (zh) * | 2016-12-29 | 2017-05-17 | 北京工业大学 | 一种基于尖峰径向基神经网络的出水总磷实时监测*** |
CN107071716A (zh) * | 2017-06-14 | 2017-08-18 | 扬州大学 | 基于td-lte专网的水环境监测***及方法 |
CN107609718A (zh) * | 2017-10-18 | 2018-01-19 | 仲恺农业工程学院 | 一种养殖水体中溶解氧的预测方法及*** |
CN108469507A (zh) * | 2018-03-13 | 2018-08-31 | 北京工业大学 | 一种基于自组织rbf神经网络的出水bod软测量方法 |
-
2019
- 2019-01-10 CN CN201910021950.5A patent/CN109886454B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160132787A1 (en) * | 2014-11-11 | 2016-05-12 | Massachusetts Institute Of Technology | Distributed, multi-model, self-learning platform for machine learning |
CN106682316A (zh) * | 2016-12-29 | 2017-05-17 | 北京工业大学 | 一种基于尖峰径向基神经网络的出水总磷实时监测*** |
CN107071716A (zh) * | 2017-06-14 | 2017-08-18 | 扬州大学 | 基于td-lte专网的水环境监测***及方法 |
CN107609718A (zh) * | 2017-10-18 | 2018-01-19 | 仲恺农业工程学院 | 一种养殖水体中溶解氧的预测方法及*** |
CN108469507A (zh) * | 2018-03-13 | 2018-08-31 | 北京工业大学 | 一种基于自组织rbf神经网络的出水bod软测量方法 |
Non-Patent Citations (2)
Title |
---|
基于机器学习理论的水质预测技术研究;刘国锋;《中国优秀硕士学位论文全文数据库》;20180228;第33-43页 * |
笪英云.基于机器学习理论的水质预测技术研究.《中国优秀硕士学位论文全文数据库》.2016, * |
Also Published As
Publication number | Publication date |
---|---|
CN109886454A (zh) | 2019-06-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104899653B (zh) | 基于专家***及蓝藻生长机理时序模型的湖库蓝藻水华预测方法 | |
CN110046645A (zh) | 一种基于主成分分析与bp神经网络的藻类水华预测方法 | |
CN109242236B (zh) | 基于关联全连接神经网络和lstm的pmu一次调频负荷预测方法 | |
CN110969346B (zh) | 基于指标筛选的流域水生态功能分区治理需求评价方法 | |
CN109886454B (zh) | 一种基于自组织深度信念网络和相关向量机的淡水环境水华预测方法 | |
CN102313796B (zh) | 一种污水处理生化需氧量软测量方法 | |
Sotirov et al. | Modular neural network preprocessing procedure with intuitionistic fuzzy intercriteria analysis method | |
CN102818642B (zh) | 刺参病害预警*** | |
CN109828089A (zh) | 一种基于dbn-bp的水质参数亚硝酸氮的在线预测方法 | |
CN107480815A (zh) | 一种电力***台区负荷预测方法 | |
CN110188383A (zh) | 一种基于选择性集成模型的电站scr脱硝建模方法 | |
CN104215616B (zh) | 基于叶绿素荧光的浮游植物光合速率快速检测方法 | |
CN110070228A (zh) | 一种神经元分支进化的bp神经网络风速预测方法 | |
CN105701280A (zh) | 南美白对虾围塘养殖水质预测方法 | |
CN107168292A (zh) | 基于elm算法的水下航行器电路故障诊断方法 | |
CN109308544A (zh) | 基于对比散度-长短期记忆网络的蓝藻水华预测方法 | |
CN114242156A (zh) | 海洋微塑料上致病性弧菌相对丰度的实时预测方法及*** | |
CN111125907B (zh) | 一种基于混合智能模型的污水处理氨氮软测量方法 | |
CN110197704B (zh) | 一种基于受限玻尔兹曼机的自组织bp神经网络出水总磷预测方法 | |
CN108122077A (zh) | 一种水环境安全评价方法及装置 | |
Huan et al. | River dissolved oxygen prediction based on random forest and LSTM | |
Ni et al. | An improved attention-based bidirectional LSTM model for cyanobacterial bloom prediction | |
CN102550455A (zh) | 一种大黄鱼刺激隐核虫病害程度的判别方法 | |
CN117575289A (zh) | 水量-水质多目标协同的水库优化调度方法 | |
CN109408896A (zh) | 一种污水厌氧处理产气量多元智能实时监控方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |