CN109934334B - 一种基于扰动的叶绿素a含量相关因子敏感性分析方法 - Google Patents

一种基于扰动的叶绿素a含量相关因子敏感性分析方法 Download PDF

Info

Publication number
CN109934334B
CN109934334B CN201910161142.9A CN201910161142A CN109934334B CN 109934334 B CN109934334 B CN 109934334B CN 201910161142 A CN201910161142 A CN 201910161142A CN 109934334 B CN109934334 B CN 109934334B
Authority
CN
China
Prior art keywords
disturbance
data
training
value
sensitivity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201910161142.9A
Other languages
English (en)
Other versions
CN109934334A (zh
Inventor
蒋定国
全秀峰
戴会超
刘伟
李飞
王蒙蒙
杨晨昱
姚义振
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Three Gorges Corp
China Three Gorges University CTGU
Original Assignee
China Three Gorges Corp
China Three Gorges University CTGU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Three Gorges Corp, China Three Gorges University CTGU filed Critical China Three Gorges Corp
Priority to CN201910161142.9A priority Critical patent/CN109934334B/zh
Publication of CN109934334A publication Critical patent/CN109934334A/zh
Application granted granted Critical
Publication of CN109934334B publication Critical patent/CN109934334B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本发明公开了一种基于扰动的叶绿素a含量相关因子敏感性分析方法,属于水环境管理技术领域。所述方法包括监测数据随机性预处理;水体叶绿素a含量预测模型构建;基于输入扰动的神经网络训练以及随机化重复训练。所述基于扰动的敏感性分析方法依据监测数据概率分布设置标准差扰动,克服了传统基于扰动敏感性分析中因扰动添加方式忽略原始数据的本质特征及变动范围,易导致分析结果错误的难题,为基于神经网络分析水体水华主要影响因素提供方法;且方法机理简单,更具普适性,特别是针对工程人员对象的推广使用。

Description

一种基于扰动的叶绿素a含量相关因子敏感性分析方法
技术领域
本发明涉及一种基于扰动的叶绿素a含量相关因子敏感性分析方法,属于水环境管理技术领域,具体地说,是在构建水体叶绿素a含量神经网络预测模型基础上,维持神经网络设置不变,分析输入因子标准差扰动添加前后输出值变化程度的敏感性分析方法。
背景技术
水体叶绿素a含量是反映水体浮游生物存量和水体理化性质的重要表征指标之一,伴随水体富营养化程度加深,水体中叶绿素a浓度亦会随着显著变动,特别是藻类水华这类伴随水体富营养化的典型现象,时常以叶绿素a含量作为构建藻华爆发预警模型关键指标。因此,对水体中叶绿素含量及其影响因子进行研究,可为水体富营养化形成机制研究提供重要支撑,为水污染防治以及水生态环境控制措施建制提供关键依据。
其研究方法,可基于自动监测数据本身分析,也可基于数据构建预测模型进行输入因子敏感性分析;但相对前者,叶绿素a相关控制措施及控制标准难以确定,而基于预测模型讨论和分析水体叶绿素a的影响因子敏感性,更能直观体现其内在联系,为水体叶绿素a的控制措施研究提供参考。基于监测数据,采用神经网络构建叶绿素a预测模型,已成为水体叶绿素a含量预测的主要手段之一。但限于BP神经网络的“黑箱”特性,无法直接分析模型中输出输入因子的响应机制,以计算模型输入参数的敏感程度,来确定水体叶绿素a含量相关因子敏感性。
目前,针对水体叶绿素含量变化的复杂体系,难以直接在机理上确定其关键作用因子,预测模型的输入往往是监测大量可能影响指标。大量重复、影响弱小的不必要监测指标采集,极大增加了样本随机性,给神经网络训练带来可变性,呈现模型预测精度不高问题;同时,不必要的数据采集,也增大了样本监测布施成本,造成经济浪费。在基于神经网络的叶绿素a含量预测模型应用中,研究输入因子敏感性,对剔除弱影响指标,探寻叶绿素含量变化的关键敏感因子具有重要意义。鉴于此,国内外学者对神经网络输入参数敏感性进行了深入研究,研究方法大体可分为偏导、连接权及扰动分析三大类。相比基于偏导、连接权值两类方法,基于扰动敏感性分析的原理简单,易实现,应用范围更广。已有研究表明在扰动敏感性分析中,扰动添加方式是敏感性分析准确与否的重点,也是限制扰动敏感性分析准确性与适用性的关键。因此,为了明确水体叶绿素a含量变化的主要影响因子,对基于扰动的敏感性分析扰动设置方式探讨,发明相应神经网络因子输入的敏感性分析方法十分必要。
发明内容
本发明要解决的技术问题在于,针对传统基于扰动敏感性分析中因扰动添加方式忽略原始数据的本质特征及变动范围,进而引发分析结果错误的问题,提供一种基于扰动的叶绿素a含量相关因子敏感性分析方法,进行预测模型输入因子敏感性分析,为基于神经网络分析水体水华主要影响因素提供方法。
具体而言,是在构建水体叶绿素a预测模型的基础上,维持神经网络设置不变,赋予某一输入变量不同程度标准差干扰后重新训练网络,分析扰动添加前后输出值波动程度,来评定水体叶绿素a含量对该输入因子的敏感程度。
本发明提供的一种基于扰动的叶绿素a含量相关因子敏感性分析方法,包括以下四个步骤:
一种基于扰动的叶绿素a含量相关因子敏感性分析方法,所述方法用于基于神经网络分析水体水华主要影响因素,具体包括以下步骤:
步骤一、监测数据随机性预处理;
步骤二、水体叶绿素a含量预测模型构建;
(1)神经网络结构设置;
针对叶绿素a相关监测数据归一化后的初始值,对神经网络的拓扑结构进行选择,设置隐含层层数,并确定各层神经元数,选择对应传递函数、训练函数、输出函数,并设定最大学习迭代次数、最小均方误差、学习步长;
其中,输入层神经元数为输入的相关因子数目,输出层神经元数为输出变量数,隐含层神经元数可由下列经验公式确定:
Figure GDA0002937529080000021
式中,K为隐含层神经元数;n,为输入变量数目;a为经验常数;
(2)样本数据训练学习;
以水体叶绿素a含量的相关影响因子作为输入参数,叶绿素a含量作为输出参数,利用监测得到的有效数据,随机选择学习样本划分训练集对神经网络进行训练,余下数据作为对比验证对象,构建基于神经网络的水体叶绿素a含量预测模型;
(3)模型预测精度分析;
根据模型训练效果,判定预测精度是否达到预期要求,若进度未达到预期精度要求返回上一步重新进行神经网络结构设置后,进行样本训练学习;若达到预期精度期望,保存训练结束的神经网络权值、初始预测值,进行下一步;
步骤三、基于输入扰动的神经网络训练;
(1)输入因子扰动设置;
考虑原始数据的原始特征及变动范围,依据样本概率分布添加标准差扰动,即在监测数据归一化后的初始值上逐渐添加不同幅度的标准差扰动;
(2)神经网络扰动训练;
在满足精度要求的神经网络中,固定权值、结构不变,赋予某一输入变量扰动设置后,保持其它变量不变,依据原始训练集验证集比例划分,进行神经网络扰动训练,记录扰动添加后叶绿素a含量预测模型输出值;
对n个输入变量依次进行神经网络不同扰动训练后,表示该组神经网络扰动训练结束,一组神经训练结束记为单次敏感性分析训练结束;
样本数N中,单次网络训练中因子敏感性由下式计算:
Figure GDA0002937529080000031
式中,Si表示第i个输入变量的单次训练敏感系数,Si值越大敏感性越高;C′chla表示添加扰动后的叶绿素a含量预测值,Cchla表示构建叶绿素a含量预测模型输出的初始预测值;
(3)因子敏感度计算;
为了量化汇总敏感性分析结果,在调整区间η∈[-0.8,0.8]内,单次敏感性分析的因子敏感度由下式计算:
Figure GDA0002937529080000032
式中,
Figure GDA0002937529080000033
表示第i个输入变量单次敏感性分析的因子敏感度;Sij)表示第 i个输入变量在扰动调整系数为ηj时,单次网络训练的因子敏感性;m为调整系数个数,即取值范围[-0.8,0.8]内,调整系数由小到大依次取了m种工况;
步骤四、随机化重复训练;
引入随机化重复训练方法,确定最终基于标准差扰动分析的因子敏感度,完成基于扰动的叶绿素a含量相关因子敏感性分析。
优选地,所述步骤一具体包括以下步骤:
(1)数据不一致性处理;
对于同一监测指标在不同数据源的不一致表达进行处理,消除重复冗沉指标,统一量级表达;
(2)数据异常值处理;
针对水体叶绿素a相关数据样本量大特点,采用拉依达准则判定样本数据中异常值,即
Figure GDA0002937529080000041
Figure GDA0002937529080000042
其中,σ为贝赛尔公式计算的标准差,影响因素监测值xi与该因素监测样本平均值
Figure GDA0002937529080000047
之差超出范围[-3σ,3σ],则判定该监测值为异常值,对于异常值,按照缺失值处理,以临近几点均值代替;
(3)数据平滑处理;
采用“smooth函数”中的“Adjacent Averaging”法对临近数据进行算数加权平均转换,消除监测数据中的“噪音”影响,在保持数据客观真实性的基础上,将数据转换为更适合分析的表述模式,即
Figure GDA0002937529080000043
Figure GDA0002937529080000044
式中,wij为以监测点i为计算中心的监测点j对应的平滑权重;
Figure GDA0002937529080000045
由各点到平滑中心点距离权重归一化得到,
Figure GDA0002937529080000046
针对不同的影响因素具体设置临***滑点数k值;
(4)数据类型转换;
将监测数据进行极差归一化处理,排除量纲量级影响,使后续训练网络快速收敛,采用极差归一化公式如下:
Figure GDA0002937529080000051
式中:yi,第i项监测指标数据归一化后的数值,作为模型输入的数据初始值;
Figure GDA0002937529080000052
第i项监测指标数据平滑处理值;
Figure GDA0002937529080000053
第i项监测指标平滑处理的最小值;
Figure GDA0002937529080000054
第i项监测指标平滑处理的最大值。
优选地,所述步骤三中,输入因子扰动设置方式是依据监测样本数据概率分布添加标准差扰动,即在监测数据归一化后的初始值上逐渐添加不同幅度的标准差扰动,单次扰动具体调整如下:
Figure GDA0002937529080000055
式中,zi为叶绿素a含量预测模型第i项输入变量初始值;η,为调整系数,取值范围为η∈[-0.8,0.8],调整系数可由小到大逐渐添加;σi,为第i项输入变量数据统计标准差。
优选地,所述步骤四中,引进随机化重复训练方法为:固定权值重复扰动训练1000次,计算各输入变量单次因子敏感度,统计1000次因子基于标准差扰动的敏感性均值,作为最终基于标准差扰动分析的因子敏感度。
本发明的有益效果在于:
1、本文提出的基于标准差扰动的敏感性分析,引入输入变量的标准差干扰代替常用的扰动设置,保持其它变量不变,分析各因子扰动添加前后输出变化进行敏感性分析,相对现有的神经网络中基于偏导等敏感性分析方法,物理概念清晰,计算耗机时少,易实现,更具普适性,特别是针对工程人员对象的推广使用。
2、敏感性分析中引入了随机化重新训练,避免了神经网络易陷入局部最优的限制,影响敏感性分析结论准确性,分析结果更为精准。
附图说明
图1基于扰动的叶绿素a含量相关因子敏感性分析方法流程图;
图2监测指标pH监测值与平滑处理值对比图;
图3神经网络预测模型的实测值拟合值对比效果图;
图4基于标准差扰动的敏感性统计均值分布图;
图5基于神经网络偏导的敏感性分析结果图;
图6基于百分比扰动因子敏感性分析结果图;
图7百分比扰动输入因子变化范围图。
具体实施方式
下面结合实施例来进一步说明本发明,但本发明要求保护的范围并不局限于实施例表述的范围。
实施例1
本发明提供一种基于扰动的叶绿素a含量相关因子敏感性分析方法。如图1 所示流程,具体步骤如下:
步骤一、监测数据随机性预处理;
采用数据为某水库监测时段内的pH、氨氮、化学需氧量、水温、溶解氧、叶绿素a、海平面气压、极大风速、最低气温、相对湿度、水汽压、降雨量及光强等13项现场监测数据,数据采集频次为1小时一次。无论是***搜集还是人工采集的***数据,不可避免的或多或少随机存在数据不一致性、不完整性以及重复性,此处采取以下步骤对数据进行预处理。
1.数据不一致性处理;
水体叶绿素a含量变化机理复杂,影响因子较多;预测模型的构建需要集成了来自不同实际应用***的13项相关监测数据。由于各应用***的数据缺乏统一标准的定义,数据结构也有较大的差异;因此,需要对于同一监测指标在不同数据源的不一致表达进行处理,消除重复冗沉指标,统一量级表达,此处对来自不同数据源的海平面气压kPa、Pa进行了单位统一转换。
2.数据异常值处理;
由于监测数据易受外界干扰,数据随机性大,监测数据会有明显与实际不符的结果出现。针对藻华数据样本量大特点,本发明采用了拉依达准则判定样本数据中异常值,即
Figure GDA0002937529080000061
Figure GDA0002937529080000062
式中,σ为贝赛尔公式计算的标准差,影响因素监测值xi与该因素监测样本平均值
Figure GDA0002937529080000063
之差超出范围[-3σ,3σ],则判定该监测值为异常值。对于异常值,按照缺失值处理,以临近几点均值代替。
3.数据平滑处理;
本发明采用“smooth函数”中的“Adjacent Averaging(AAv)”法对临近数据进行算数加权平均转换,消除监测数据中的“噪音”影响,在保持数据客观真实性的基础上,将数据转换为更适合分析的表述模式,即
Figure GDA0002937529080000071
Figure GDA0002937529080000072
式中,wij为以监测点i为计算中心的监测点j对应的平滑权重;
Figure GDA0002937529080000073
由各点到平滑中心点距离权重归一化得到,
Figure GDA0002937529080000074
针对不同的影响因素具体设置临***滑点数k值。部分监测数据时段平滑后的结果对比如图2所示,比选确定临近12点平滑pH指标最佳。
4.数据类型转换;
将监测数据进行极差归一化处理,排除量纲量级影响,使网络快速收敛。采用归一化公式如下
Figure GDA0002937529080000075
式中:yi,第i项监测指标数据归一化后的数值,作为模型输入的数据初始值;
Figure GDA0002937529080000076
第i项监测指标数据平滑处理值;
Figure GDA0002937529080000077
第i项监测指标平滑处理的最小值;
Figure GDA0002937529080000078
第i项监测指标平滑处理的最大值。
步骤二、水体叶绿素a含量预测模型构建;
1.神经网络结构设置;
采用三层BP神经网络构建叶绿素a含量预测模型,输入变量x1,x2,…,xn为叶绿素a含量变化影响因子,确定输入层神经元数12;输出变量为叶绿素a含量,确定输出层神经元数为1;隐含层由经验公式
Figure GDA0002937529080000079
多次试探调试, a∈[1,10],确定神经元数K=12。
其它基础设置如下:隐含层甄选使用tansig传递函数、trainlm训练函数、learngdm阈值学习函数,输出层采用线性传递purelin函数;设定网络的最大学习迭代次数为1000次,最小均方误差为0.000001,学习步长0.001
2.样本数据训练学习;
以12项影响因子监测数据为输入值,叶绿素a含量监测数据为输出值,利用监测得到的有效数据1400余组,随机选择1100组对神经网络进行训练,余下 300余组作为对比验证对象,得到了研究水域叶绿素a含量的BP神经网络预测模型。
3.模型预测精度分析;
水体叶绿素预测模型的预测精度98.7%,实测值拟合值对比效果如图3,模型具有较好的精度,满足预测精度不低于90%的预期期望。保存训练结束的神经网络,输出的初始预测值,进行下一步。
步骤三、基于输入扰动的神经网络训练;
1.输入因子扰动设置;
考虑原始数据的原始特征及变动范围,本发明提出依据样本概率分布添加标准差扰动,即在监测数据的初始值上添加不同幅度的标准差扰动。扰动具体调整如下:
Figure GDA0002937529080000081
式中,zi为叶绿素a含量预测模型第i项输入变量初始值;η,为调整系数,经反复调试验证,取值范围为η∈[-0.8,0.8];σi,为第i项输入变量数据统计标准差。此处案例以0.1为调整间隔,双侧对称取调整系数,部分监测指标的调整值如下表1。
表1:基于标准差扰动单侧调整值
影响因子 0.8σ 0.7σ 0.6σ 0.5σ 0.4σ 0.3σ 0.2σ 0.1σ
化学需氧量 12.10 10.59 9.07 7.56 6.05 4.54 3.02 1.51
氨氮 0.36 0.32 0.27 0.23 0.18 0.14 0.09 0.05
溶解氧 2.92 2.55 2.19 1.82 1.46 1.09 0.73 0.36
海平面气压 405.35 354.68 304.01 253.34 202.68 152.01 101.34 50.67
相对湿度 9.96 8.71 7.47 6.22 4.98 3.73 2.49 1.24
2.神经网络扰动训练;
在满足精度要求的神经网络中,固定权值、结构不变,赋予某一输入变量扰动设置后,保持其它变量不变,依据原始训练集验证集比例划分,进行神经网络扰动训练,记录扰动添加后叶绿素a含量预测模型输出值。对n个输入变量依次进行[-0.8,0.8]范围内0.1幅度间隔共16种扰动神经网络扰动训练后,表示该组神经网络扰动训练结束,一组结束记为单次敏感性分析训练结束。
样本数N中,单次扰动训练因子敏感性由下式计算:
Figure GDA0002937529080000091
式中,Si表示第i个输入变量的敏感系数,Si值越大敏感性越高;C′chl-a表示添加扰动后的叶绿素a含量预测值,Cchl-a表示构建叶绿素a含量预测模型输出的初始预测值。单次的敏感性分析结果如下表2:
表2:单次训练的敏感性分析结果
扰动幅度 pH值 氨氮 溶解氧 最低气温 水汽压 水温
-0.8σ 0.382 0.434 0.307 0.317 0.263 0.259
-0.7σ 0.337 0.378 0.271 0.276 0.231 0.225
-0.6σ 0.291 0.321 0.234 0.236 0.199 0.191
-0.5σ 0.244 0.263 0.197 0.195 0.167 0.158
-0.4σ 0.196 0.205 0.159 0.155 0.134 0.125
-0.3σ 0.148 0.150 0.120 0.116 0.101 0.093
-0.2σ 0.099 0.098 0.081 0.077 0.068 0.061
-0.1σ 0.051 0.048 0.041 0.038 0.034 0.031
0.1σ 0.054 0.047 0.042 0.038 0.035 0.030
0.2σ 0.110 0.094 0.084 0.076 0.071 0.060
0.3σ 0.168 0.139 0.128 0.113 0.107 0.090
0.4σ 0.228 0.184 0.172 0.151 0.144 0.120
0.5σ 0.291 0.228 0.216 0.189 0.181 0.150
0.6σ 0.357 0.271 0.261 0.227 0.219 0.181
0.7σ 0.426 0.313 0.306 0.266 0.258 0.211
0.8σ 0.497 0.354 0.351 0.306 0.297 0.240
表2:单次训练的敏感性分析结果(续)
Figure GDA0002937529080000092
Figure GDA0002937529080000101
3.因子敏感度计算;
为了量化汇总敏感性分析结果,在调整区间η∈[-0.8,0.8]内,本发明单次敏感性分析的因子敏感度由下式计算:
Figure GDA0002937529080000102
式中,
Figure GDA0002937529080000103
表示第i个输入变量单次敏感性分析的因子敏感度;Sij)表示第 i个输入变量在扰动调整系数为ηj时,单次网络训练的因子敏感性;m为调整系数个数,即取值范围[-0.8,0.8]内,调整系数由小到大依次取了m种工况,此处 [-0.8,0.8]范围内0.1幅度间隔共16种工况,单次训练的因子敏感度结果如表3 所示。
表3:单次训练的因子敏感度
Figure GDA0002937529080000104
Figure GDA0002937529080000111
步骤四、随机化重复训练;
为了避免神经网络陷入局部最优,影响分析结论准确性,本发明引入随机化重复训练方法,固定权值重复扰动训练1000次,计算各输入变量单次因子敏感性,统计1000次因子基于标准差扰动的敏感性均值,作为最终基于标准差扰动分析的因子敏感度。绘制的基于标准差扰动的敏感性均值统计分布如图4所示。
以各因子敏感度占所有因子敏感度百分比计算因子相对敏感度,如表4所示,与较为经典的基于神经网络偏导Dimopnlos敏感性分析结果对比,检验本发明提出的标准差扰动的输入因子敏感性分析方法合理性。从理论出发的Dimopnlos 敏感性分析结果如图5所示,水体叶绿素a含量变化对光强、极大风速、降雨量三项指标相对敏感性较弱,相对敏感度0.029~0.068;对pH因子的相对敏感性最高,达到0.119。其它8项指标,对叶绿素a影响程度居中,相对敏感度波动 0.081~0.100,影响程度基本一致。
表4:基于标准差扰动的敏感性分析因子相对敏感度
影响因子 因子相对敏感度 影响因子 因子相对敏感度
pH值 0.148 相对湿度 0.085
氨氮 0.135 化学需氧量 0.072
溶解氧 0.115 海平面气压 0.065
最低气温 0.108 光强 0.032
水汽压 0.097 降雨量 0.030
水温 0.086 极大风速 0.029
显然,基于标准差扰动的敏感性分析,因子的敏感性强弱层次分明,光强、降雨量与极大风速三项指标相对敏感性较弱,相对敏感度0.032、0.030、0.029; pH、氨氮、溶解氧等因子敏感性较强,相对敏感度0.148、0.135、0.115,其结论与基于神经网络偏导的Dimopnlos敏感性分析结果一致,但强弱因子分离效果更为显著。在不同幅度标准差扰动下,各因子的敏感性变化趋势一致,皆随扰动幅度的增加而递增,且随扰动的增减双向设置而近似对称,敏感性分析结果可靠,敏感性分析时可单向设置扰动简化计算。相对基于偏导的敏感性分析,需要较高的BP神经网络数理基础,本发明提出的基于标准差扰动的敏感性分析物理概念清晰且容易实现,更具普适性,特别适合工程技术人员使用。
此外,对比传统的基于百分比扰动敏感性分析,以主因子加减10%设置扰动,进行网络训练1000次,结果如图6所示:水体叶绿素a含量对光照、降雨量有较强敏感性,相对敏感度0.215、0.166;而对pH指标的敏感性较小,仅为0.014。其分析结果与标准差扰动及偏导的两种方法得到结果存在较大差异,这可能与百分比添加扰动方式有关,该方法在原始值的基础上增加10%,其数据变化范围超出了监测数据的物理意义上的变动范围(如图7所示),继而得到迥异的分析结果。综上本发明提出的依据监测数据概率分布出发的,一种基于扰动的叶绿素a含量相关因子敏感性分析方法更实用、准确。
以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (2)

1.一种基于扰动的叶绿素a含量相关因子敏感性分析方法,其特征在于,所述方法用于基于神经网络分析水体水华主要影响因素,具体包括以下步骤:
步骤一、监测数据随机性预处理;
步骤二、水体叶绿素a含量预测模型构建;
(1)神经网络结构设置;
针对叶绿素a相关监测数据归一化后的初始值,对神经网络的拓扑结构进行选择,设置隐含层层数,并确定各层神经元数,选择对应传递函数、训练函数、输出函数,并设定最大学习迭代次数、最小均方误差、学习步长;
其中,输入层神经元数为输入的相关因子数目,输出层神经元数为输出变量数,隐含层神经元数可由下列经验公式确定:
Figure FDA0002937529070000011
式中,K为隐含层神经元数;n,为输入变量数目;a为经验常数;
(2)样本数据训练学习;
以水体叶绿素a含量的相关影响因子作为输入参数,叶绿素a含量作为输出参数,利用监测得到的有效数据,随机选择学习样本划分训练集对神经网络进行训练,余下数据作为对比验证对象,构建基于神经网络的水体叶绿素a含量预测模型;
(3)模型预测精度分析;
根据模型训练效果,判定预测精度是否达到预期要求,若精度未达到预期精度要求返回上一步重新进行神经网络结构设置后,进行样本训练学习;若达到预期精度期望,保存训练结束的神经网络权值、初始预测值,进行下一步;
步骤三、基于输入扰动的神经网络训练;
(1)输入因子扰动设置;
考虑原始数据的原始特征及变动范围,依据样本概率分布添加标准差扰动,即在监测数据归一化后的初始值上逐渐添加不同幅度的标准差扰动;
输入因子扰动设置方式是依据监测样本数据概率分布添加标准差扰动,即在监测数据归一化后的初始值上逐渐添加不同幅度的标准差扰动,单次扰动具体调整如下:
Figure FDA0002937529070000021
式中,zi为叶绿素a含量预测模型第i项输入变量初始值;η,为调整系数,取值范围为η∈[-0.8,0.8],调整系数可由小到大逐渐添加;σi,为第i项输入变量数据统计标准差;
(2)神经网络扰动训练;
在满足精度要求的神经网络中,固定权值、结构不变,赋予某一输入变量扰动设置后,保持其它变量不变,依据原始训练集验证集比例划分,进行神经网络扰动训练,记录扰动添加后叶绿素a含量预测模型输出值;
对n个输入变量依次进行神经网络不同扰动训练后,表示该组神经网络扰动训练结束,一组神经训练结束记为单次敏感性分析训练结束;
样本数N中,单次网络训练中因子敏感性由下式计算:
Figure FDA0002937529070000022
式中,Si表示第i个输入变量的单次训练敏感系数,Si值越大敏感性越高;Cc'hla表示添加扰动后的叶绿素a含量预测值,Cchla表示构建叶绿素a含量预测模型输出的初始预测值;
(3)因子敏感度计算;
为了量化汇总敏感性分析结果,在调整区间η∈[-0.8,0.8]内,单次敏感性分析的因子敏感度由下式计算:
Figure FDA0002937529070000023
式中,
Figure FDA0002937529070000024
表示第i个输入变量单次敏感性分析的因子敏感度;Sij)表示第i个输入变量在扰动调整系数为ηj时,单次网络训练的因子敏感性;m为调整系数个数,即取值范围[-0.8,0.8]内,调整系数由小到大依次取了m种工况;
步骤四、随机化重复训练;
引入随机化重复训练方法,确定最终基于标准差扰动分析的因子敏感度,完成基于扰动的叶绿素a含量相关因子敏感性分析;
引进随机化重复训练方法为:固定权值重复扰动训练1000次,计算各输入变量单次因子敏感度,统计1000次因子基于标准差扰动的敏感性均值,作为最终基于标准差扰动分析的因子敏感度。
2.根据权利要求1所述的基于扰动的叶绿素a含量相关因子敏感性分析方法,其特征在于,所述步骤一具体包括以下步骤:
(1)数据不一致性处理;
对于同一监测指标在不同数据源的不一致表达进行处理,消除重复冗沉指标,统一量级表达;
(2)数据异常值处理;
针对水体叶绿素a相关数据样本量大特点,采用拉依达准则判定样本数据中异常值,即
Figure FDA0002937529070000031
Figure FDA0002937529070000032
其中,σ为贝赛尔公式计算的标准差,影响因素监测值xi与该因素监测样本平均值
Figure FDA0002937529070000033
之差超出范围[-3σ,3σ],则判定该监测值为异常值,对于异常值,按照缺失值处理,以临近几点均值代替;
(3)数据平滑处理;
采用“smooth函数”中的“Adjacent Averaging”法对临近数据进行算数加权平均转换,消除监测数据中的“噪音”影响,在保持数据客观真实性的基础上,将数据转换为更适合分析的表述模式,即
Figure FDA0002937529070000034
Figure FDA0002937529070000035
式中,wij为以监测点i为计算中心的监测点j对应的平滑权重;
Figure FDA0002937529070000036
由各点到平滑中心点距离权重归一化得到,
Figure FDA0002937529070000037
针对不同的影响因素具体设置临***滑点数k值;
(4)数据类型转换;
将监测数据进行极差归一化处理,排除量纲量级影响,使后续训练网络快速收敛,采用极差归一化公式如下:
Figure FDA0002937529070000041
式中:yi,第i项监测指标数据归一化后的数值,作为模型输入的数据初始值;
Figure FDA0002937529070000042
第i项监测指标数据平滑处理值;
Figure FDA0002937529070000043
第i项监测指标平滑处理的最小值;
Figure FDA0002937529070000044
第i项监测指标平滑处理的最大值。
CN201910161142.9A 2019-03-04 2019-03-04 一种基于扰动的叶绿素a含量相关因子敏感性分析方法 Expired - Fee Related CN109934334B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910161142.9A CN109934334B (zh) 2019-03-04 2019-03-04 一种基于扰动的叶绿素a含量相关因子敏感性分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910161142.9A CN109934334B (zh) 2019-03-04 2019-03-04 一种基于扰动的叶绿素a含量相关因子敏感性分析方法

Publications (2)

Publication Number Publication Date
CN109934334A CN109934334A (zh) 2019-06-25
CN109934334B true CN109934334B (zh) 2021-04-20

Family

ID=66986205

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910161142.9A Expired - Fee Related CN109934334B (zh) 2019-03-04 2019-03-04 一种基于扰动的叶绿素a含量相关因子敏感性分析方法

Country Status (1)

Country Link
CN (1) CN109934334B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110930012B (zh) * 2019-11-15 2023-04-07 广东工业大学 基于敏感性分析及改进阴性选择法的能耗异常定位方法
CN110968949A (zh) * 2019-11-25 2020-04-07 北京交通大学 一种高速列车车载设备电磁敏感性预测模型的建模方法
CN117056732B (zh) * 2023-10-11 2023-12-15 山东科技大学 一种顾及非各向同性的narx对流层延迟格网预测方法
CN117763508A (zh) * 2023-12-22 2024-03-26 江南大学 一种针对小样本水体的叶绿素含量辅助预测方法及***

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101158674B (zh) * 2007-11-15 2011-09-21 天津市市政工程设计研究院 基于BP神经网络的水体中叶绿素a浓度预测方法
US9483727B2 (en) * 2013-09-18 2016-11-01 Fair Isaac Corporation Reduction of computation complexity of neural network sensitivity analysis
CN109272031B (zh) * 2018-09-05 2021-03-30 宽凳(北京)科技有限公司 一种训练样本生成方法及装置、设备、介质

Also Published As

Publication number Publication date
CN109934334A (zh) 2019-06-25

Similar Documents

Publication Publication Date Title
CN109934334B (zh) 一种基于扰动的叶绿素a含量相关因子敏感性分析方法
CN105117602B (zh) 一种计量装置运行状态预警方法
CN108564229A (zh) 一种基于arima模型的工业污水进水量预测的方法
CN106055918A (zh) 一种电力***负荷数据辨识及修复方法
CN111354423A (zh) 一种基于多元时间序列分析的自组织递归模糊神经网络的出水氨氮浓度预测方法
CN111126471A (zh) 微地震事件检测方法及***
CN110542748B (zh) 一种基于知识的鲁棒型出水氨氮软测量方法
CN108510180B (zh) 一种生产设备所处性能区间的计算方法
CN103577676A (zh) 污水处理工艺综合评价的灰色加权法
CN114757413A (zh) 一种基于时序数列分析耦合神经网络预测的不良数据辨识方法
CN111191855B (zh) 一种基于管网多元水质时序数据的水质异常事件识别预警方法
CN114912716A (zh) 基于双向长短时记忆网络的短期电力负荷预测方法及***
CN112149870B (zh) 一种基于ISODATA聚类与Elman神经网络的猪舍氨气浓度组合预测方法
CN112446168A (zh) 一种基于mic及rbfnn的出水bod浓度软测量方法
CN110991616B (zh) 一种基于删减型前馈小世界神经网络出水bod预测方法
CN116386756A (zh) 一种基于集成神经网络可信度估计与加权学习的软测量建模方法
CN112858208A (zh) 基于红外光谱主成分和神经网络的生物质钾含量测量与建模方法
CN115236616A (zh) 基于组合赋权灰色云模型的雷达***质量确定方法及***
CN111062118B (zh) 一种基于神经网络预测分层的多层软测量建模***及方法
CN109766522B (zh) 一种刮板输送机链轮的非概率可靠性灵敏度分析方法
CN107220393B (zh) 常减压装置常压塔常一线干点预测方法
CN107220252B (zh) 常减压装置常压塔常一线闪点预测方法
CN117474298B (zh) 一种基于上下游工位反馈的发动机连杆生产管理方法及***
CN114757412A (zh) 一种基于聚类分析耦合神经网络预测的不良数据辨识方法
CN110298142B (zh) 一种基于实测数据的脱硝催化剂工艺特性指标预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20210128

Address after: 443002 No. 8, University Road, Xiling District, Yichang, Hubei

Applicant after: CHINA THREE GORGES University

Applicant after: CHINA THREE GORGES Corp.

Address before: 443002 No. 8, University Road, Xiling District, Yichang, Hubei

Applicant before: CHINA THREE GORGES University

GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20210420