CN113887635B - 一种流域相似性分类方法及分类装置 - Google Patents

一种流域相似性分类方法及分类装置 Download PDF

Info

Publication number
CN113887635B
CN113887635B CN202111170738.9A CN202111170738A CN113887635B CN 113887635 B CN113887635 B CN 113887635B CN 202111170738 A CN202111170738 A CN 202111170738A CN 113887635 B CN113887635 B CN 113887635B
Authority
CN
China
Prior art keywords
basin
similarity
average
preset
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111170738.9A
Other languages
English (en)
Other versions
CN113887635A (zh
Inventor
张珂
牛杰帆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hohai University HHU
Original Assignee
Hohai University HHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hohai University HHU filed Critical Hohai University HHU
Priority to CN202111170738.9A priority Critical patent/CN113887635B/zh
Publication of CN113887635A publication Critical patent/CN113887635A/zh
Application granted granted Critical
Publication of CN113887635B publication Critical patent/CN113887635B/zh
Priority to GB2213018.1A priority patent/GB2612682A/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/043Architecture, e.g. interconnection topology based on fuzzy logic, fuzzy membership or fuzzy inference, e.g. adaptive neuro-fuzzy inference systems [ANFIS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Operations Research (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Automation & Control Theory (AREA)
  • Fuzzy Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Cultivation Of Plants (AREA)

Abstract

本发明公开了一种流域相似性分类方法及分类装置,分类方法包括以下步骤:收集预定流域的水文、气象、下垫面数据,提取气象与下垫面因子,构建特征指标;设定相关性阈值确定气象、下垫面相似性指标;基于SOM与FCM融合算法,在预定流域进行栅格尺度水文气象分区;在气象同质区内构建子流域尺度聚类集体,利用融合模型进行子流域分类;根据流域所处的气象分区与所包含的子流域类别,利用子流域的模糊隶属度构建流域相似性综合度量,使用最大最小贴近度法对流域间的相似程度进行评估,识别流域之间的相似性。本发明为无资料流域的参证流域选择和参数移植提供理论依据,促进无资料地区模型参数区域化和水文预警预报等工作的深入发展。

Description

一种流域相似性分类方法及分类装置
技术领域
本发明属于水文技术领域,具体为一种流域相似性分类方法及分类装置,主要用于无资料地区的相似流域判别与水文预警预报等工作。
背景技术
近年来,受气候变化和人类活动的影响,极端天气事件呈现增多增强趋势,山洪、泥石流等严重水害灾害频发。尤其对于水文资料匮乏的地区,由于缺少有效的水情监测手段,对灾害的检测力度不足,灾害发生迅猛,损失严重,严重制约着经济社会的可持续发展。针对无资料地区水文预报问题,国际水文科学协会(IAHS)于2002年启动了PUB国际水文计划,该计划旨在探索无资料地区的水文工作从传统的对观测数据进行率定的方法转变为机理分析的新方法。目前常用的无资料地区模型参数确定方法为区域化方法,即通过选取与目标流域相似的有资料流域,利用有资料流域已率定的模型参数推求无资料流域的模型参数,从而实现对目标流域的水文预报。
随着遥感、GIS等技术的发展,气候与下垫面资料较易获取,通过挖掘无资料流域结构特征的有效信息,利用气候和流域特征的相似性,以一种近似的方式推求水文相似性,为无资料地区的径流预测提供了可能。近些年来,计算机技术发展迅速,模式识别、聚类算法、模糊数学从研究理论到实际应用都取得了很大进展,为水文相似性研究提供了技术支撑。因此建立流域气象与下垫面相似性的综合判据,构建高维异质特征空间水文相似区辨识方法具有一定的理论依据和现实意义。
传统相似流域的选取往往依赖于决策者的经验,没有统一的量化标准,在实际应用中具有较强的不确定性。同时,目前还尚未形成一个通用的相似性指标组合,特定的相似性指标可能无法捕捉全面的水文规律,如何选取相似性指标,构建相似流域评价体系,成为了水文相似性与参数区域化研究中关键的一步。因此,本发明在此背景下提出了一种通用的流域相似性分类方法及分类装置。
发明内容
本发明所要解决的技术问题是提供一种流域相似性分类方法及分类装置,为无资料地区相似流域的选择与参数移植提供了理论依据。
为了实现上述目的,本发明采用了以下技术方案:一种流域相似性分类方法,其特征在于,包括以下步骤:
步骤1,收集预定流域的水文、气象、下垫面数据,提取气象与下垫面因子,构建特征指标;
步骤2,利用预定流域水文特征与气象、下垫面因子的距离相关系数进行特征指标选择,设定相关性阈值确定气象、下垫面相似性指标;
步骤3,基于SOM与FCM融合算法,构建栅格尺度聚类集体,在预定流域进行水文气象分区;
步骤4,基于水文气象分区结果,在气象同质区内构建子流域尺度聚类集体,利用融合模型进行子流域分类;
步骤5,根据流域所处的气象分区与所包含的子流域类别,利用子流域的模糊隶属度构建流域相似性综合度量。使用最大最小贴近度法对流域间的相似程度进行评估,识别流域之间的相似性.
步骤1包括:
步骤11,收集预定流域的水文、气象、下垫面数据,其中水文数据包含预定流域的径流系数和多年平均日径流量,气象数据包含预定流域的多年平均月降水量、多年平均月潜在蒸发量和多年平均月温度数据,下垫面数据包含预定流域的地形特征、植被类型、土壤类型与土地利用类型;
步骤12,根据预定流域的气象数据,计算以下气象因子作为特征指标:年平均湿润指数、年内月湿润指数最大差、降雪占比、年平均气温、年内月气温最大差和降雪时间占比:
Figure BDA0003293014020000021
Figure BDA0003293014020000022
Im,r=max(MI(1,2,...12))-min(MI(1,2,...12))
Figure BDA0003293014020000031
Figure BDA0003293014020000032
Tm,r=max(T(1,2,...12))-min(T(1,2,...12))
Figure BDA0003293014020000033
式中,MI(t)为第t月的湿润指数;Im,Im,r,fs,Tm,Tm,r,Ds分别表示年平均湿润指数、年内月湿润指数最大差、降雪占比、年平均气温、年内月气温最大差和降雪时间占比;P(t),EP(t),T(t)分别为第t月的多年平均降水量、第t月的多年平均潜在蒸发量和第t月的多年平均温度值;D(t)为第t月的天数;T0为温度阈值,低于该温度的降水形式为雪,本专利设置其为0℃。
步骤13,根据预定流域的下垫面信息,提取以下下垫面因子作为特征指标,包括地形特征因子、土壤植被特征因子以及形状特征因子。地形特征因子包括预定流域的平均高程、最大高程差、面积-高程积分、面积高程曲线斜率、平均地形指数和平均坡度。其中,面积-高程积分表示预定流域内地表物质量,面积-高程曲线斜率反映预定流域地形起伏程度,两者都通过面积-高程曲线计算;平均地形指数为预定流域内单元栅格地形指数的算数平均,计算公式如下:
Figure BDA0003293014020000034
Figure BDA0003293014020000035
Figure BDA0003293014020000036
式中,HI、AS和TI分别为面积-高程积分值、面积-高程曲线斜率和平均地形指数;面积-高程曲线f(x)为x=a/A和y=h/H组成的拟合曲线,a为预定流域内某条等高线以上面积;h为该等高线与预定流域内最低点的高差;A为预定流域总面积;H为预定流域内最大相对高差;f(0.2)和f(0.8)分别表示面积占比为0.2和0.8时在面积-高程曲线上对应的相对高差;ai为预定流域内第i个单元栅格的集水面积;βi为第i个单元栅格的坡度;n为预定流域内的栅格总数;
土壤植被特征因子包括流域土壤砂粒含量、粉粒含量、粘粒含量和归一化植被指数;形状特征因子包括流域面积、流域长度、流域形态因子、流域伸长比以及流域河网密度。
步骤2包括:
选用距离相关系数对气象与下垫面因子进行特征指标选择,设定相关性阈值确定气象、下垫面相似性指标的方法是:
计算不同因子之间的距离相关系数:
Figure BDA0003293014020000041
式中,X为某个下垫面或气象特征因子序列,Y为水文特征因子序列;dCor(X,Y)为X与Y序列之间的距离相关系数;dCov(X,Y)为X与Y序列的距离协方差;dVar(X)和dVar(Y)分别为X序列与Y序列的距离标准差;
设定阈值ω,将距离相关系数dCor(X,Y)>ω的下垫面或气象特征因子作为相似性指标进行聚类。阈值ω选取为0.5,根据距离相关系数确定出的相似性指标分别为:
年平均降水量、年平均湿润指数和年内月湿润指数最大差等3个气象指标;流域土壤砂粒含量、流域粘粒含量、流域归一化植被指数、流域面积、流域长度、流域形态因子和流域伸长比等7个下垫面指标。
步骤3包括:
在栅格尺度上构建水文气象聚类集体,利用SOM与FCM融合模型进行训练分区,聚类过程分为两个阶段:第一阶段,利用SOM算法进行初聚类,训练结束后得到竞争输出层;第二阶段,以SOM输出层节点对应权向量作为FCM算法的聚类样本,进行迭代计算直至达到收敛条件。
步骤3中,基于SOM-FCM融合算法的聚类过程为:
步骤31,SOM神经网络的初始化:设置SOM神经网络竞争层结构、初始领域半径δ(0)、初始学习率
Figure BDA0003293014020000059
迭代次数k和迭代总次数ks;对N维相似性指标进行归一化处理得到训练样本G;设置竞争层中各神经元对应权向量Wj(k)=(Wj,1(k),Wj,2(k),...,Wj,N(k)),(j=1,2,...,M),对权向量进行初始化,其中M为竞争层神经元数量,k的初始值为0;
步骤32,输入训练样本:随机选取第i个样本Gi=(G1,G2,...,GN)T至输入层;
步骤33,寻找获胜神经元,计算Gi与Wj(k)之间的距离,选择距离最小的神经元作为获胜神经元r;
Figure BDA0003293014020000051
步骤34,调整神经元连接权值:对获胜神经元r邻域内神经元的连接权向量Wj进行调整;
Figure BDA0003293014020000052
式中,
Figure BDA0003293014020000053
为学习率;
Figure BDA0003293014020000054
为获胜神经元r的领域半径;
步骤35,训练迭代计数器k=k+1;更新
Figure BDA0003293014020000055
Figure BDA0003293014020000056
步骤36,重复步骤32-35,直到训练迭代计数k达到预先设定的迭代总次数ks,得到SOM输出层神经网络;
步骤37,以SOM输出层神经网络各神经元权值Wj作为FCM算法输入向量,设置FCM算法的聚类数c、隶属度因子m、限定误差ε和最大迭代次数kf,初始化隶属度矩阵U,设置迭代次数k为0;
步骤38,根据隶属度矩阵U计算聚类中心,第i个聚类中心Ci为:
Figure BDA0003293014020000057
式中,
Figure BDA0003293014020000058
是输入向量Wj对于Ci的隶属度;
步骤39,根据聚类中心,对隶属度矩阵U更新:
Figure BDA0003293014020000061
式中,dij是输入向量Wj对于Ci的欧几里得距离;dqj是输入向量Wj对于Cq的欧几里得距离,q=1,2,...,c;
步骤310,训练迭代计数器k=k+1;
步骤311,重复步骤39-310,直到|U(k)-U(k+1)|≤ε或迭代次数k达到最大迭代次数kf
步骤3中,SOM网络结构根据最小误差的原则进行选取,选用量化误差QE和拓扑误差TE评估,两种指标可以表达SOM神经网络聚类的质量:
Figure BDA0003293014020000062
TE=∑v(Gi)
式中,QE为输入样本与相应获胜神经元之间的平均相对距离,Wr(Gi)为Gi所对应获胜神经元的权向量;TE为输入空间相邻的样本在竞争层网络中邻近的程度,若与样本Gi相邻的样本在输出空间仍保持相邻性,则v(Gi)为1。
步骤3中,SOM-FCM算法聚类数c根据Davies-Bouldin指数(DBI)确定,通过评估不同聚类数下的聚类效果,对c进行优选:
Figure BDA0003293014020000063
Figure BDA0003293014020000064
式中,c为聚类数;Mi为所属类别为i的样本数量;Ci为类别i的聚类中心,Cq为类别q的聚类中心,其中,i=1,2,...,c,q=1,2,...,c;
Figure BDA0003293014020000065
分别为类别i和类别q样本点到Ci和Cq的平均距离。
步骤5中,根据流域所处的气象分区与所包含的子流域类别,利用子流域的模糊隶属度构建流域相似性综合度量。使用最大最小贴近度法对流域间的相似程度进行评估,流域B1和流域B2的相似度表达为:
Figure BDA0003293014020000071
Figure BDA0003293014020000072
式中,
Figure BDA0003293014020000073
为流域B1和流域B2的相似度;
Figure BDA0003293014020000074
表示流域B1和B2对于流域类别i的面积加权隶属度;
Figure BDA0003293014020000075
Figure BDA0003293014020000076
分别为流域B1和B2中第j个子流域面积与流域总面积的比值;NB1和NB2为流域B1和B2中的子流域数量;
Figure BDA0003293014020000077
Figure BDA0003293014020000078
表示流域B1和B2中第j个子流域对于流域类别i的模糊隶属度;∧和∨分别表示求取最小值和最大值计算。
一种流域相似性分类装置,其特征在于,包括处理器和存储器;所述存储器中存储有程序或指令,所述程序或指令由所述处理器加载并执行以实现如权利要求1至9任一所述分类方法的步骤。
本发明的有益成果:本发明提供的一种流域相似性分类方法及分类装置,通过计算流域因子间的距离相关系数,构建了流域相似性指标体系;采用SOM与FCM融合模型划分水文气象同质区,在此基础上利用融合模型实现了子流域分类;利用最大最小贴近度法结合子流域的模糊隶属度构建流域相似性综合度量,实现流域间相似程度的综合评估。本发明采用了SOM与FCM结合的模型进行水文气象分区与子流域聚类,融合模型具有SOM算法自组织、非线性映射强的特点,同时融入了模糊集合的概念,能够解释边界较难定义的非线性和高度异构的水文数据。同时,基于聚类内部指标选取最佳聚类数,保证了聚类结果的高效性和客观稳定性。通过模糊隶属度对流域间的相似性进行表达,为相似流域的识别提供客观的量化准则,可为无资料流域参证流域的选择和参数移植提供理论依据,促进无资料地区模型参数区域化和水文预警预报等工作的深入发展。
附图说明
图1是本发明提供的流域相似性分类方法的计算流程示意图;
图2是具体实施例中水文特征与气象、下垫面特征距离相关系数图;
图3是具体实施例中水文气象分区SOM神经网络网络结构测试图;
图4是具体实施例中水文气象分区数-Davies-Bouldin指数变化关系图;
图5是具体实施例中子流域聚类数-Davies-Bouldin指数变化关系图;
图6是具体实施例中示例流域间相似度示意图。
具体实施方式
下面结合附图和具体实例对本发明作进一步描述。
应当理解的是,此处所描述的具体实施方式仅仅用以解释本发明,并不用于限定本发明。
如图1所示,本发明提供了一种流域相似性分类方法,包括以下步骤:
步骤1,收集预定流域的水文、气象、下垫面数据,提取气象与下垫面因子,构建特征指标;
步骤2,利用预定流域水文特征与气象、下垫面因子的距离相关系数进行特征指标选择,设定相关性阈值确定气象、下垫面相似性指标;
步骤3,基于SOM与FCM融合算法,构建栅格尺度聚类集体,在预定流域进行水文气象分区;
步骤4,基于水文气象分区结果,在气象同质区内构建子流域尺度聚类集体,利用融合模型进行子流域分类;
步骤5,根据流域所处的气象分区与所包含的子流域类别,利用子流域的模糊隶属度构建流域相似性综合度量。使用最大最小贴近度法对流域间的相似程度进行评估,识别流域之间的相似性。
以屯溪、分水江、马渡王、板桥、大河坝、陈河、戴营、大阁、志丹、绥德10个流域作为典型流域,进行小流域分类与流域相似性研究。具体为:
步骤1,收集预定流域的水文、气象、下垫面数据,提取气象与下垫面因子,构建特征指标;
包括:
步骤11,收集预定流域的水文、气象、下垫面数据,其中水文数据包含预定流域的径流系数和多年平均日径流量,气象数据包含预定流域的多年平均月降水量、多年平均月潜在蒸发量和多年平均月温度数据,下垫面数据包含预定流域的地形特征、植被类型、土壤类型与土地利用类型;
步骤12,根据预定流域的气象数据,提取以下气象因子作为特征指标:年平均湿润指数、年内月湿润指数最大差、降雪占比、年平均气温、年内月气温最大差和降雪时间占比:
Figure BDA0003293014020000091
Figure BDA0003293014020000092
Im,r=max(MI(1,2,...12))-min(MI(1,2,...12)) (3)
Figure BDA0003293014020000093
Figure BDA0003293014020000094
Tm,r=max(T(1,2,...12))-min(T(1,2,...12)) (6)
Figure BDA0003293014020000095
式中,MI(t)为第t月的湿润指数;Im,Im,r,fs,Tm,Tm,r,Ds分别表示年平均湿润指数、年内月湿润指数最大差、降雪占比、年平均气温、年内月气温最大差和降雪时间占比;P(t),EP(t),T(t)分别为第t月的多年平均降水量、第t月的多年平均潜在蒸发量和第t月的多年平均温度值;D(t)为第t月的天数;T0为温度阈值,低于该温度的降水形式为雪,本专利设置其为0℃。
步骤13,根据预定流域的下垫面信息,提取以下下垫面因子作为特征指标,包括地形特征因子、土壤植被特征因子以及形状特征因子。地形特征因子包括预定流域的平均高程(Hm)、最大高程差(Hr)、面积-高程积分(HI)、面积-高程曲线斜率(As)、平均地形指数(Ti)和平均坡度(β)。其中,面积-高程积分表示预定流域内地表物质量,面积-高程曲线斜率反映预定流域地形起伏程度,两者都通过面积-高程曲线计算;平均地形指数为预定流域内单元栅格地形指数的算数平均,计算公式如下:
Figure BDA0003293014020000101
Figure BDA0003293014020000102
Figure BDA0003293014020000103
式中,HI、AS和TI分别为面积-高程积分值、面积-高程曲线斜率和平均地形指数;面积-高程曲线f(x)为x=a/A和y=h/H组成的拟合曲线,a为预定流域内某条等高线以上面积;h为该等高线与预定流域内最低点的高差;A为预定流域总面积;H为预定流域内最大相对高差;f(0.2)和f(0.8)分别表示面积占比为0.2和0.8时在面积-高程曲线上对应的相对高差;ai为预定流域内第i个单元栅格的集水面积;βi为第i个单元栅格的坡度;n为预定流域内的栅格总数;
土壤植被特征因子包括流域土壤砂粒含量(Sand)、流域粉粒含量(Clay)、流域粘粒含量(Silt)和流域归一化植被指数(NDVI);形状特征因子包括流域面积(A)、流域长度(L)、流域形态因子(Rf)、流域伸长比(Re)以及流域河网密度(Rd)。
步骤2,利用预定流域水文特征与气象、下垫面因子的距离相关系数进行特征指标选择,绘制特征因子距离相关系数图,如图2所示,构建流域径流系数(ψ)与流域特征的距离相关矩阵,确定模型模拟训练指标;
选用距离相关系数对气象与下垫面因子进行特征指标选择,设定相关性阈值确定气象、下垫面相似性指标的方法是:
计算不同因子之间的距离相关系数:
Figure BDA0003293014020000111
式中,X为某个下垫面或气象特征因子序列,Y为水文特征因子序列;dCor(X,Y)为X与Y序列之间的距离相关系数;dCov(X,Y)为X与Y序列的距离协方差;dVar(X)和dVar(Y)分别为X序列与Y序列的距离标准差。
设定阈值ω,将距离相关系数dCor(X,Y)>ω的下垫面或气象特征因子作为相似性指标进行聚类。阈值ω选取为0.5,根据距离相关系数确定出的相似性指标分别为:
年平均降水量、年平均湿润指数和年内月湿润指数最大差等3个气象指标;流域土壤砂粒含量、流域粘粒含量、流域归一化植被指数、流域面积、流域长度、流域形态因子和流域伸长比等7个下垫面指标。
步骤3,基于SOM与FCM融合算法,构建栅格尺度聚类集体,在预定流域进行水文气象分区;
在栅格尺度上构建水文气象聚类集体,利用SOM与FCM融合模型进行训练分区,聚类过程分为两个阶段:第一阶段,利用SOM算法进行初聚类,训练结束后得到竞争输出层;第二阶段,以SOM输出层节点对应权向量作为FCM算法的聚类样本,进行迭代计算直至达到收敛条件。
基于SOM-FCM融合算法的聚类过程为:
步骤31,SOM神经网络的初始化:设置SOM神经网络竞争层结构、初始领域半径δ(0)、初始学习率
Figure BDA0003293014020000112
迭代次数k和迭代总次数ks;对N维相似性指标进行归一化处理得到训练样本G;设置竞争层中各神经元对应权向量Wj(k)=(Wj,1(k),Wj,2(k),...,Wj,N(k)),(j=1,2,...,M),对权向量进行初始化,其中M为竞争层神经元数量,k的初始值为0;
步骤32,输入训练样本:随机选取第i个样本Gi=(G1,G2,...,GN)T至输入层;
步骤33,寻找获胜神经元,计算Gi与Wj(k)之间的距离,选择距离最小的神经元作为获胜神经元r;
Figure BDA0003293014020000121
步骤34,调整神经元连接权值,对获胜神经元r邻域内神经元的连接权向量Wj进行调整;
Figure BDA0003293014020000122
式中,
Figure BDA0003293014020000125
为学习率;
Figure BDA0003293014020000126
为获胜神经元r的领域半径;
步骤35,训练迭代计数器k=k+1;更新
Figure BDA0003293014020000127
和δ(k);
步骤36,重复步骤32-35,直到训练迭代计数k达到预先设定的迭代总次数ks,得到SOM输出层神经网络;
步骤37,以SOM输出层神经网络各神经元权值Wj作为FCM算法输入向量,设置FCM算法的聚类数c、隶属度因子m、限定误差ε和最大迭代次数kf,初始化隶属度矩阵U,设置迭代次数k为0;
步骤38,根据隶属度矩阵U计算聚类中心,第i个聚类中心Ci为:
Figure BDA0003293014020000123
式中,
Figure BDA0003293014020000128
是输入向量Wj对于Ci的隶属度;
步骤39,根据聚类中心,对隶属度矩阵U更新:
Figure BDA0003293014020000124
式中,dij是输入向量Wj对于Ci的欧几里得距离;
步骤310,训练迭代计数器k=k+1;
步骤311,重复步骤39-310,直到|U(k)-U(k+1)|≤ε或迭代次数k达到最大迭代次数kf
SOM-FCM算法中SOM网络结构根据最小误差的原则进行选取,选用量化误差QE和拓扑误差TE评估,两种指标可以表达SOM神经网络聚类的质量:
Figure BDA0003293014020000131
TE=∑v(Gi) (17)
式中,QE为输入样本与相应获胜神经元之间的平均相对距离,Wr(Gi)为Gi所对应获胜神经元的权向量;TE为输入空间相邻的样本在竞争层网络中邻近的程度,若与样本Gi相邻的样本在输出空间仍保持相邻性,则v(Gi)为1。
图3为水文气象分区SOM神经网络网络结构测试结果,最终选取模型输出节点数为14×22。
SOM-FCM算法聚类数c根据Davies-Bouldin指数(DBI)确定,通过评估不同聚类数下的聚类效果,对c进行优选:
Figure BDA0003293014020000132
Figure BDA0003293014020000133
式中,c为聚类数;Mi为所属类别为i的样本数量;Ci为类别i的聚类中心,Cq为类别q的聚类中心,其中,i=1,2,...,c,q=1,2,...,c;
Figure BDA0003293014020000134
分别为类别i和类别q样本点到Ci和Cq的平均距离。
对k进行优选,当k取值为7时,DBI达到最小值,水文气象分区数k的优选过程如图4所示。
步骤4,基于水文气象分区结果,在气象同质区内构建子流域尺度聚类集体,利用融合模型进行子流域分类;
使用SOM-FCM算法对子流域进行分类,根据最小误差的原则,选用量化误差QE和拓扑误差TE对SOM网络结构进行选取,根据DBI评估不同聚类数下的聚类效果,对k进行优选。当k取值为9时,DBI达到最小值,子流域分类数k的优选过程如图5所示。
步骤5,根据流域所处的气象分区与所包含的子流域分类,利用子流域的模糊隶属度构建流域相似性综合度量。使用最大最小贴近度法对流域间的相似程度进行评估,识别流域之间的相似性,以大阁流域为目标流域,典型流域间相似度如图6所示。
使用最大最小贴近度法对流域间的相似程度进行评估,流域B1和流域B2的相似度表达为:
Figure BDA0003293014020000141
Figure BDA0003293014020000142
式中,
Figure BDA0003293014020000143
为流域B1和流域B2的相似度;
Figure BDA0003293014020000144
表示流域B1和B2对于流域类别i的面积加权隶属度;
Figure BDA0003293014020000145
Figure BDA0003293014020000146
分别为流域B1和B2中第j个子流域面积与流域总面积的比值;NB1和NB2为流域B1和B2中的子流域数量;
Figure BDA0003293014020000147
Figure BDA0003293014020000148
表示流域B1和B2中第j个子流域对于流域类别i的模糊隶属度;∧和∨分别表示求取最小值和最大值计算。
本发明实施例还提供了一种流域相似性分类装置,包括处理器和存储器;所述存储器中存储有程序或指令,所述程序或指令由所述处理器加载并执行以实现上述实施例中分类方法的步骤。

Claims (9)

1.一种流域相似性分类方法,其特征在于,包括以下步骤:
步骤1,收集预定流域的水文、气象、下垫面数据,提取气象与下垫面因子,构建特征指标;
步骤2,利用预定流域水文特征与气象、下垫面因子的距离相关系数进行特征指标选择,设定相关性阈值确定气象、下垫面相似性指标;
步骤3,基于SOM与FCM融合算法,构建栅格尺度聚类集体,在预定流域进行水文气象分区;
步骤4,基于水文气象分区结果,在气象同质区内构建子流域尺度聚类集体,利用融合模型进行子流域分类;
步骤5,根据流域所处的气象分区与所包含的子流域类别,利用子流域的模糊隶属度构建流域相似性综合度量;使用最大最小贴近度法对流域间的相似程度进行评估,识别流域之间的相似性;
步骤1中,构建的特征指标包括年平均湿润指数、年内月湿润指数最大差、降雪占比、年平均气温、年内月气温最大差和降雪时间占比、地形特征因子、土壤植被特征因子以及形状特征因子;地形特征因子包括预定流域的平均高程、最大高程差、面积-高程积分、面积-高程曲线斜率、平均地形指数和平均坡度;
步骤2中,选用距离相关系数对气象与下垫面因子进行特征指标选择,设定相关性阈值确定气象、下垫面相似性指标的方法是:
计算不同因子之间的距离相关系数:
Figure FDA0003606802310000011
式中,X为某个下垫面或气象特征因子序列,Y为水文特征因子序列;dCor(X,Y)为X与Y序列之间的距离相关系数;dCov(X,Y)为X与Y序列的距离协方差;dVar(X)和dVar(Y)分别为X序列与Y序列的距离标准差;
设定阈值ω,将距离相关系数dCor(X,Y)>ω的下垫面或气象特征因子作为相似性指标进行聚类。
2.根据权利要求1所述的方法,其特征在于,步骤1包括:
步骤11,收集预定流域的水文、气象、下垫面数据,其中水文数据包含预定流域的径流系数和多年平均日径流量,气象数据包含预定流域的多年平均月降水量、多年平均月潜在蒸发量和多年平均月温度数据,下垫面数据包含预定流域的地形特征、植被类型、土壤类型与土地利用类型;
步骤12,根据预定流域的气象数据,计算以下气象因子作为特征指标:年平均湿润指数、年内月湿润指数最大差、降雪占比、年平均气温、年内月气温最大差和降雪时间占比;
Figure FDA0003606802310000021
Figure FDA0003606802310000022
Im,r=max(MI(1,2,...12))-min(MI(1,2,...12))
Figure FDA0003606802310000023
Figure FDA0003606802310000024
Tm,r=max(T(1,2,...12))-min(T(1,2,...12))
Figure FDA0003606802310000025
式中,MI(t)为第t月的湿润指数;Im,Im,r,fs,Tm,Tm,r,Ds分别表示年平均湿润指数、年内月湿润指数最大差、降雪占比、年平均气温、年内月气温最大差和降雪时间占比;P(t),EP(t),T(t)分别为第t月的多年平均降水量、第t月的多年平均潜在蒸发量和第t月的多年平均温度值;D(t)为第t月的天数;T0为温度阈值,低于该温度的降水形式为雪,T0为0℃;
步骤13,根据预定流域的下垫面信息,提取以下下垫面因子作为特征指标,包括地形特征因子、土壤植被特征因子以及形状特征因子;地形特征因子包括预定流域的平均高程、最大高程差、面积-高程积分、面积-高程曲线斜率、平均地形指数和平均坡度;其中,面积-高程积分表示预定流域内地表物质量,面积-高程曲线斜率反映预定流域地形起伏程度,两者都通过面积-高程曲线计算;平均地形指数为预定流域内单元栅格地形指数的算数平均,计算公式如下:
Figure FDA0003606802310000031
Figure FDA0003606802310000032
Figure FDA0003606802310000033
式中,HI、AS和TI分别为面积-高程积分、面积-高程曲线斜率和平均地形指数;面积-高程曲线f(x)为x=a/A和y=h/H组成的拟合曲线,a为预定流域内某条等高线以上面积;h为该等高线与预定流域内最低点的高差;A为预定流域总面积;H为预定流域内最大相对高差;f(0.2)和f(0.8)分别表示面积占比为0.2和0.8时在面积-高程曲线上对应的相对高差;ai为预定流域内第i个单元栅格的集水面积;βi为第i个单元栅格的坡度;n为预定流域内的栅格总数;
土壤植被特征因子包括流域土壤砂粒含量、粉粒含量、粘粒含量和归一化植被指数;形状特征因子包括流域面积、流域长度、流域形态因子、流域伸长比以及流域河网密度。
3.根据权利要求1所述的方法,其特征在于,
阈值ω选取为0.5,根据距离相关系数确定出的相似性指标为:
年平均降水量、年平均湿润指数和年内月湿润指数最大差3个气象指标;流域土壤砂粒含量、流域粘粒含量、流域归一化植被指数、流域面积、流域长度、流域形态因子和流域伸长比7个下垫面指标。
4.根据权利要求1所述的方法,其特征在于,所述步骤3中,在栅格尺度上构建水文气象聚类集体,利用SOM与FCM融合模型进行训练分区,聚类过程分为两个阶段:第一阶段,利用SOM算法进行初聚类,训练结束后得到竞争输出层;第二阶段,以SOM输出层节点对应权向量作为FCM算法的聚类样本,进行迭代计算直至达到收敛条件。
5.根据权利要求1所述的方法,其特征在于,所述步骤3中,基于SOM-FCM融合算法的聚类过程为:
步骤31,SOM神经网络的初始化:设置SOM神经网络竞争层结构、初始领域半径δ(0)、初始学习率
Figure FDA0003606802310000047
迭代次数k和迭代总次数ks;对N维相似性指标进行归一化处理得到训练样本G;设置竞争层中各神经元对应权向量Wj(k)=(Wj,1(k),Wj,2(k),...,Wj,N(k)),(j=1,2,...,M),对权向量进行初始化,其中M为竞争层神经元数量,k的初始值为0;
步骤32,输入训练样本:随机选取第i个样本Gi=(G1,G2,...,GN)T至输入层;
步骤33,寻找获胜神经元:计算Gi与Wj(k)之间的距离,选择距离最小的神经元作为获胜神经元r;
Figure FDA0003606802310000041
步骤34,调整神经元连接权值:对获胜神经元r邻域内神经元的连接权向量Wj进行调整;
Figure FDA0003606802310000042
式中,
Figure FDA0003606802310000043
为学习率;
Figure FDA0003606802310000044
为获胜神经元r的领域半径;
步骤35,训练迭代计数器k=k+1;更新
Figure FDA0003606802310000045
和δ(k);
步骤36,重复步骤32-35,直到训练迭代次数k达到预先设定的迭代总次数ks,得到SOM输出层神经网络;
步骤37,以SOM输出层神经网络各神经元权值Wj作为FCM算法输入向量,设置FCM算法的聚类数c、隶属度因子m、限定误差ε和最大迭代次数kf,初始化隶属度矩阵U,设置迭代次数k为0;
步骤38,根据隶属度矩阵U计算聚类中心,第i个聚类中心Ci为:
Figure FDA0003606802310000046
式中,
Figure FDA0003606802310000051
是输入向量Wj对于Ci的隶属度;
步骤39,根据聚类中心,对隶属度矩阵U更新:
Figure FDA0003606802310000052
式中,dij是输入向量Wj对于Ci的欧几里得距离;dqj是输入向量Wj对于Cq的欧几里得距离,q=1,2,...,c;
步骤310,训练迭代计数器k=k+1;
步骤311,重复步骤39-310,直到|U(k)-U(k+1)|≤ε或迭代次数k达到最大迭代次数kf
6.根据权利要求5所述的方法,其特征在于,所述步骤3中,SOM网络结构根据最小误差的原则进行选取,选用量化误差QE和拓扑误差TE评估,两种指标可以表达SOM神经网络聚类的质量:
Figure FDA0003606802310000053
TE=∑v(Gi)
式中,QE为输入样本与相应获胜神经元之间的平均相对距离,Wr(Gi)为Gi所对应获胜神经元的权向量;TE为输入空间相邻的样本在竞争层网络中邻近的程度,若与样本Gi相邻的样本在输出空间仍保持相邻性,则v(Gi)为1。
7.根据权利要求6所述的方法,其特征在于,所述步骤3中,SOM-FCM算法聚类数c根据Davies-Bouldin指数确定,通过评估不同聚类数下的聚类效果,对c进行优选:
Figure FDA0003606802310000054
Figure FDA0003606802310000055
式中,c为聚类数;Mi为所属类别为i的样本数量;Ci为类别i的聚类中心,Cq为类别q的聚类中心,其中,i=1,2,...,c,q=1,2,...,c;
Figure FDA0003606802310000061
分别为类别i和类别q样本点到Ci和Cq的平均距离。
8.根据权利要求1所述的方法,其特征在于,所述步骤5中,根据流域所处的气象分区与所包含的子流域类别,利用子流域的模糊隶属度构建流域相似性综合度量;使用最大最小贴近度法对流域间的相似程度进行评估,流域B1和流域B2的相似度表达为:
Figure FDA0003606802310000062
Figure FDA0003606802310000063
式中,
Figure FDA0003606802310000064
为流域B1和流域B2的相似度;
Figure FDA0003606802310000065
表示流域B1和B2对于流域类别i的面积加权隶属度;
Figure FDA0003606802310000066
Figure FDA0003606802310000067
分别为流域B1和B2中第j个子流域面积与流域总面积的比值;NB1和NB2为流域B1和B2中的子流域数量;
Figure FDA0003606802310000068
Figure FDA0003606802310000069
表示流域B1和B2中第j个子流域对于流域类别i的模糊隶属度;∧和∨分别表示求取最小值和最大值计算。
9.一种流域相似性分类装置,其特征在于,包括处理器和存储器;所述存储器中存储有程序或指令,所述程序或指令由所述处理器加载并执行以实现如权利要求1至8任一所述分类方法的步骤。
CN202111170738.9A 2021-10-08 2021-10-08 一种流域相似性分类方法及分类装置 Active CN113887635B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202111170738.9A CN113887635B (zh) 2021-10-08 2021-10-08 一种流域相似性分类方法及分类装置
GB2213018.1A GB2612682A (en) 2021-10-08 2022-09-06 Basin similarity classification method and device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111170738.9A CN113887635B (zh) 2021-10-08 2021-10-08 一种流域相似性分类方法及分类装置

Publications (2)

Publication Number Publication Date
CN113887635A CN113887635A (zh) 2022-01-04
CN113887635B true CN113887635B (zh) 2022-07-01

Family

ID=79005316

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111170738.9A Active CN113887635B (zh) 2021-10-08 2021-10-08 一种流域相似性分类方法及分类装置

Country Status (2)

Country Link
CN (1) CN113887635B (zh)
GB (1) GB2612682A (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115293577B (zh) * 2022-08-05 2023-07-21 水利部珠江水利委员会技术咨询(广州)有限公司 基于机器学习的高寒流域地下水化学控制因素分析方法
CN117951540A (zh) * 2023-10-19 2024-04-30 中国水利水电科学研究院 一种基于特征立方体的流域相似性分析方法
CN117291349B (zh) * 2023-11-24 2024-03-19 济宁御龙源水务有限公司 一种地下水位恢复预测方法及***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106815467A (zh) * 2016-12-12 2017-06-09 河海大学 一种基于大数据统计相似分析的流域水文区划方法
CN107092653A (zh) * 2017-03-15 2017-08-25 西安工程大学 一种基于模糊聚类分析法的滑坡临界雨量阈值确定方法
CN111985389A (zh) * 2020-08-18 2020-11-24 中国电建集团成都勘测设计研究院有限公司 一种基于流域属性距离的流域相似判别方法
CN112347155A (zh) * 2020-10-29 2021-02-09 南京大学 基于数据挖掘的场地污染特征因子识别和监测指标优化方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016127918A1 (zh) * 2015-02-13 2016-08-18 北京嘀嘀无限科技发展有限公司 一种运力调度方法及***
CN109388664A (zh) * 2018-09-29 2019-02-26 河海大学 一种中小河流流域相似性判别方法
CN109840873A (zh) * 2019-02-02 2019-06-04 中国水利水电科学研究院 一种基于机器学习的无资料地区水文模型参数区域化方法
CN111242472B (zh) * 2020-01-09 2022-08-19 河海大学 一种基于Copula经验密度函数的流域相似性程度识别方法
CN113377750B (zh) * 2021-05-19 2022-03-29 山东大学 水文数据清洗方法及***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106815467A (zh) * 2016-12-12 2017-06-09 河海大学 一种基于大数据统计相似分析的流域水文区划方法
CN107092653A (zh) * 2017-03-15 2017-08-25 西安工程大学 一种基于模糊聚类分析法的滑坡临界雨量阈值确定方法
CN111985389A (zh) * 2020-08-18 2020-11-24 中国电建集团成都勘测设计研究院有限公司 一种基于流域属性距离的流域相似判别方法
CN112347155A (zh) * 2020-10-29 2021-02-09 南京大学 基于数据挖掘的场地污染特征因子识别和监测指标优化方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"Regional flood frequency analysis by combining;V.V. Srinivas etal.;《ELSEVIER》;20081231;第148-166页 *

Also Published As

Publication number Publication date
GB2612682A (en) 2023-05-10
GB202213018D0 (en) 2022-10-19
CN113887635A (zh) 2022-01-04

Similar Documents

Publication Publication Date Title
CN113887635B (zh) 一种流域相似性分类方法及分类装置
CN108304668B (zh) 一种结合水文过程数据和历史先验数据的洪水预测方法
Shahabi et al. Flash flood susceptibility mapping using a novel deep learning model based on deep belief network, back propagation and genetic algorithm
Pham et al. Can deep learning algorithms outperform benchmark machine learning algorithms in flood susceptibility modeling?
Huang et al. Uncertainty study of landslide susceptibility prediction considering the different attribute interval numbers of environmental factors and different data-based models
CN110471950B (zh) 一种中小河流实时洪水预报智能模型预报方法
Soma et al. Optimization of causative factors using logistic regression and artificial neural network models for landslide susceptibility assessment in Ujung Loe Watershed, South Sulawesi Indonesia
Rodrigues et al. Estimation of renewable energy and built environment-related variables using neural networks–A review
CN115271255B (zh) 基于知识图谱和机器学习的雨洪相似性分析方法和***
CN114254561A (zh) 一种内涝预测方法、***及存储介质
CN113705877A (zh) 基于深度学习模型的实时月径流预报方法
CN113139329B (zh) 一种基于水文相似性和人工神经网络的新安江模型参数率定方法
CN111027764A (zh) 一种基于机器学习的适用于径流资料缺乏流域的洪水预报方法
CN116090625A (zh) 基于LightGBM和水文水动力模型的滨海城市洪涝快速预测方法
Dehghanian et al. Evaluation of coupled ANN-GA model to prioritize flood source areas in ungauged watersheds
Huang et al. Modelling landslide susceptibility prediction: a review and construction of semi-supervised imbalanced theory
Saab et al. Review on generating optimal operation for dam and reservoir water system: simulation models and optimization algorithms
Liu et al. Gully erosion susceptibility assessment based on machine learning-A case study of watersheds in Tuquan County in the black soil region of Northeast China
CN117808214A (zh) 水利工程数据分析***
CN114372631A (zh) 一种基于小样本学习和lstm的缺资料地区径流预测方法
CN117494419A (zh) 一种多模型耦合的流域水土流失遥感监测方法
Chen et al. Development of design hyetographs for ungauged sites using an approach combining PCA, SOM and kriging methods
Refonaa et al. Cognitive computing techniques based rainfall prediction—a study
Filchev et al. Assessing of soil erosion risk through geoinformation sciences and remote sensing—a review
CN111274545A (zh) 一种栅格尺度基于地形地貌的多模式产流计算方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant