CN113256101B - 一种城乡湖泊蓄水量变化的关键驱动力分析方法 - Google Patents
一种城乡湖泊蓄水量变化的关键驱动力分析方法 Download PDFInfo
- Publication number
- CN113256101B CN113256101B CN202110549208.9A CN202110549208A CN113256101B CN 113256101 B CN113256101 B CN 113256101B CN 202110549208 A CN202110549208 A CN 202110549208A CN 113256101 B CN113256101 B CN 113256101B
- Authority
- CN
- China
- Prior art keywords
- water storage
- storage capacity
- item set
- change
- driving force
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 title claims abstract description 107
- 238000003860 storage Methods 0.000 title claims abstract description 96
- 230000008859 change Effects 0.000 title claims abstract description 87
- 238000004458 analytical method Methods 0.000 title claims abstract description 19
- 238000000034 method Methods 0.000 claims abstract description 46
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 32
- 238000005070 sampling Methods 0.000 claims abstract description 25
- 238000011160 research Methods 0.000 claims abstract description 21
- 238000012216 screening Methods 0.000 claims abstract description 11
- 238000004364 calculation method Methods 0.000 claims abstract description 10
- 238000007781 pre-processing Methods 0.000 claims abstract description 9
- 230000008569 process Effects 0.000 claims description 14
- 230000001965 increasing effect Effects 0.000 claims description 13
- 239000002689 soil Substances 0.000 claims description 12
- 230000002829 reductive effect Effects 0.000 claims description 10
- 238000007619 statistical method Methods 0.000 claims description 10
- 238000013138 pruning Methods 0.000 claims description 9
- 230000003247 decreasing effect Effects 0.000 claims description 8
- 238000001704 evaporation Methods 0.000 claims description 7
- 230000008020 evaporation Effects 0.000 claims description 7
- 230000002093 peripheral effect Effects 0.000 claims description 7
- 238000012271 agricultural production Methods 0.000 claims description 6
- 238000013501 data transformation Methods 0.000 claims description 4
- 238000007689 inspection Methods 0.000 claims description 4
- 238000004140 cleaning Methods 0.000 claims description 3
- 238000013480 data collection Methods 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 claims description 3
- 238000002474 experimental method Methods 0.000 claims description 3
- 230000010354 integration Effects 0.000 claims description 3
- 230000009467 reduction Effects 0.000 description 9
- 238000001556 precipitation Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 4
- 238000004445 quantitative analysis Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 241000282414 Homo sapiens Species 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000002352 surface water Substances 0.000 description 2
- 235000017166 Bambusa arundinacea Nutrition 0.000 description 1
- 235000017491 Bambusa tulda Nutrition 0.000 description 1
- 244000025254 Cannabis sativa Species 0.000 description 1
- 235000009024 Ceanothus sanguineus Nutrition 0.000 description 1
- 240000003553 Leptospermum scoparium Species 0.000 description 1
- 235000015459 Lycium barbarum Nutrition 0.000 description 1
- 244000082204 Phyllostachys viridis Species 0.000 description 1
- 235000015334 Phyllostachys viridis Nutrition 0.000 description 1
- 241000124033 Salix Species 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 239000011425 bamboo Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000013100 final test Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 239000005416 organic matter Substances 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000004162 soil erosion Methods 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000003892 spreading Methods 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Educational Administration (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Probability & Statistics with Applications (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Databases & Information Systems (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- General Health & Medical Sciences (AREA)
Abstract
本发明公开一种城乡湖泊蓄水量变化的关键驱动力分析方法,包括以下步骤:对研究区域进行等距网格划分,根据筛选标准选出若干单位面积蓄水量的典型取样点;建立承载驱动力因素的数据库,进行数据预处理;扫描湖泊流域特征趋势数据库,形成候选项集C1;对候选项集C1进行判断,生成频繁项集L1,并绘制L1各项柱状图;采用Apriori‑Gen算法,将频繁项集L1中的各项数据进行组合,形成候选项集C2;对候选项集C2进行判断,形成频繁项集L2;迭代生成最大频繁项集,确定几项湖泊蓄水量变化的关键驱动力。本发明利用关联算法对影响城乡湖泊蓄水量变化的因素进行逐一分析,通过关联算法的迭代计算判断得出影响城乡湖泊蓄水量变化的关键驱动力。
Description
技术领域
本发明涉及景观水文领域,具体的是一种城乡湖泊蓄水量变化的关键驱动力分析方法。
背景技术
湖泊水体是城乡水资源的重要组成部分,承担着防洪排涝、调节气候、改善城乡生态环境、提供休闲娱乐场所等多种功能,与人类的生存和发展紧密相关;但湖泊资源往往面临开发过度、生态功能退化、水环境恶化等严峻问题。对城乡湖泊生态***的水量和水生态进行研究,基于生态***服务功能的演变过程分析其影响因子的相对重要性,可为湖泊资源的可持续利用和生态恢复提供依据。
水文过程与生态景观格局的形成及演化密切相关、相互作用,出入湖径流量、湖面降水及蒸发、植被环境、主导土壤类型、气候类型、地形条件和水文类型等被认为是城乡湖泊变化的主要影响因素,但关于湖泊蓄水量变化主导因子的解释一直存在争议。当前广为应用的景观水文定量分析方法包括配对流域试验法、生态水文模型法和非模型法,这些方法均存在一定的局限性。配对流域试验仅适用于面积较小的流域且需要长期定位观测;生态水文模型对数据的要求较高,数据质量会较大程度影响模拟的质量,针对大流域的生态水文模型则更加耗时耗力;生态水文非模型法主要利用统计方法和水文图形进行快速评价,对数据的要求低,但难以揭示流域内部具体的水文响应和机制。
发明内容
为解决上述背景技术中提到的不足,本发明的目的在于提供一种城乡湖泊蓄水量变化的关键驱动力分析方法,利用关联算法(Apriori)对影响城乡湖泊蓄水量变化的因素进行逐一分析,通过关联算法的迭代计算判断得出影响城乡湖泊蓄水量变化的关键驱动力,实现对景观水文各影响因素的量化分析,并以此为依据对城乡湖泊流域进行可持续管理、利用和生态恢复。
本发明的目的可以通过以下技术方案实现:
一种城乡湖泊蓄水量变化的关键驱动力分析方法,包括以下步骤:
步骤A:对研究区域进行等距网格划分,根据筛选标准选出若干单位面积蓄水量的典型取样点;
步骤B:定义水文、径流、气候、蒸发、地形、土壤、植被环境、农业生产、周边用地类型、城市化程度共10类影响因素的60项属性数据变化趋势为项,建立承载驱动力因素的数据库,进行数据预处理;
步骤C:扫描湖泊流域特征趋势数据库,形成候选项集C1,C1中的每组包含一项影响湖泊蓄水量的属性数据变化趋势,共60组;
步骤D:对候选项集C1进行判断,比较其中每一项属性数据变化趋势的支持度是否大于最小支持度,所有大于最小支持度的项生成频繁项集L1,并绘制L1各项柱状图;
步骤E:采用Apriori-Gen算法,将上述频繁项集L1中的各项数据进行组合,形成候选项集C2,因此C2中的每组包含2项影响湖泊蓄水量的属性数据变化趋势;
步骤F:对候选项集C2进行判断,比较其中每组属性数据变化趋势的支持度是否大于最小支持度,所有大于最小支持度的项形成频繁项集L2,其中各项均为承载湖泊蓄水量变化的关键驱动力的候选集,并生成描述流域属性相关性的分析图表;
步骤G:迭代生成最大频繁项集,确定几项湖泊蓄水量变化的关键驱动力;
步骤H:利用风景园林专业相关知识结合统计分析方法进一步检验,验证结果准确性。
进一步优选地,步骤A具体为:对研究区域进行等距网格划分,把湖泊命名为A、B、C、...、N,明确研究对象与范围之后,选取100m*100m的网格,等距分布于研究区域各部分,对网格进行编号,以西北角第一个网格为编号1,从左向右、从上向下依次进行编号,1、2、3、...、n;根据筛选标准选出单位面积蓄水量的典型取样点;确定取样点后,区分蓄水量增多与蓄水量减少的取样点,蓄水量增多区域以圆形点标示,减少区域以方形点标示,完成底图上的总体标示;
其中单位面积蓄水量典型取样点的筛选标准需同时满足以下条件:
(1)生态单元单位时间内的单位面积蓄水量具有明显变化。考虑数据收集可行性,确定单位时间为1年,收集近十年数据进行统计分析;
(2)生态单元有一项或多项驱动力数据具有明显变化;
(3)生态单元取样点最终成组出现,避免某一区域内只有一个取样点的情况。
进一步优选地,步骤B具体为:定义每种影响湖泊蓄水量变化的每一属性变化趋势为一项,建立数据库,进行数据预处理;以研究区域自然地理环境及社会人文环境中所包含的多种不同属性,包括水文、径流、气候、蒸发、地形、土壤、植被环境、农业生产、周边用地类型、城市化程度共10类影响因素中的60项属性数据,作为影响城乡湖泊蓄水量变化的驱动力备选因素,以每种属性的每一种变化趋势,即增加趋势或减少趋势为一项,将所有取样点内各项相关数据导入,建立数据库,该数据库即为承载驱动力因素的数据库,然后对数据库的数据进行预处理,主要包括:数据清洗、数据集成、数据变换、数据规约。
进一步优选地,步骤C具体为:扫描数据库,形成每组包含一项属性数据变化趋势的候选项集C1,C1中的每一项均对应一种属性的一种变化趋势,即影响湖泊蓄水量变化的驱动力。
进一步优选地,步骤D具体为:对候选项集C1进行判断,比较其中每一项属性数据变化趋势的支持度是否大于最小支持度,所有大于最小支持度的项,生成频繁项集L,其中,最小支持度的取值决定着生成结果,过高的取值会影响有效频繁项集的生成,过低的取值则会导致无意义的结果,经反复实验,可将最小支持度取值界定在0.5-0.6之间,即影响湖泊蓄水量的相关属性数据趋势变化至少达到50%,才进入频繁项集L1,间隔0.02实现Apriori算法,并绘制对应图表,横轴为最小支持度取值,纵轴对应最大频繁项集中频繁项的数量。
进一步优选地,步骤E具体为:利用Apriori-Gen算法,将频繁项集L1中的各项数据进行组合,形成每组包含2项属性数据变化趋势的候选项集C2,函数Apriori-Gen是对候选项集进行连接步骤和剪枝步骤的合称,连接过程把两个子集连接生成潜在的候选项集,减少了计算量;剪枝过程中,若候选K项集中某个K-1项集为非频繁,则根据性质进行剔除,也提高了算法的计算效率,由于每个候选都由一对频繁K-1项集合并而成,因此只需要附加的候选剪枝步骤来确保该候选的其余K-2个子集是频繁的,在此环节中,研究对象所形成的候选2项集为每组包含2项,即2项影响湖泊蓄水量的属性数据变化趋势,或称驱动力的组合。
进一步优选地,步骤F具体为:对候选项集C2进行判断,将其中每组属性数据变化趋势的支持度与最小支持度进行比较,所有大于最小支持度的项形成频繁2项集L2,生成描述流域属性相关性的分析图表,进行关联度分析。
进一步优选地,步骤G具体为:继续利用Apriori-Gen算法对频繁项集L2进行重新组合,将上述频繁项集L2中的各项数据进行组合,形成每组包含3项属性数据变化趋势的候选项集C3;对候选项集C3进行判断,将其中每组属性数据变化趋势的支持度与最小支持度进行比较,所有大于最小支持度的项形成频繁3项集L3;重复此过程,直到迭代形成各项均为关键驱动力的最大频繁K项集LK,从而确定至多有哪几项湖泊蓄水量变化的关键驱动力。
进一步优选地,步骤H具体为:通过多次运行关联算法,得到影响研究地区湖泊蓄水量的关键驱动力因素后,利用风景园林专业相关知识结合统计分析方法进行进一步检验,验证结果准确性;检验过程以遥感影像为主要信息源,利用地理信息***技术和数理统计方法,对研究地区景观格局变化进行分析,检验最终结果应与关联算法产生结果一致。
本发明的有益效果:
本发明利用关联算法(Apriori)对影响城乡湖泊蓄水量变化的因素进行逐一分析,通过关联算法的迭代计算判断得出影响城乡湖泊蓄水量变化的关键驱动力,实现对景观水文各影响因素的量化分析,并以此为依据对城乡湖泊流域进行可持续管理、利用和生态恢复。
附图说明
下面结合附图对本发明作进一步的说明。
图1是本发明城乡湖泊蓄水量变化的关键驱动力分析方法的流程示意图;
图2是本发明实施例湖泊分区示例图;
图3是本发明实施例湖泊研究区网格划分示例图;
图4是本发明实施例取样点筛选后示例图;
图5是本发明实施例湖泊A最小支持度取值变化图;
图6是本发明实施例L1柱状图;
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在本发明的描述中,需要理解的是,术语“开孔”、“上”、“下”、“厚度”、“顶”、“中”、“长度”、“内”、“四周”等指示方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的组件或元件必须具有特定的方位,以特定的方位构造和操作,因此不能理解为对本发明的限制。
本发明目的在于利用关联算法(Apriori)对影响城乡湖泊蓄水量变化的因素进行逐一分析,通过关联算法的迭代计算判断得出影响城乡湖泊蓄水量变化的关键驱动力,实现对景观水文各影响因素的量化分析,并以此为依据对城乡湖泊流域进行可持续管理、利用和生态恢复。
一种基于关联算法的城乡湖泊蓄水量变化的关键驱动力分析方法,利用人工智能关联算法定量探究影响城乡湖泊蓄水量变化背后的关键驱动力及其机制,包括一下步骤:
步骤1:对研究区域进行等距网格划分,根据筛选标准选出若干单位面积蓄水量的典型取样点。
以南京江宁黄龙岘地区为例,对其较大湖泊从A到E进行编号,明确研究对象。(如图2)
其中所述网格划分操作方法为:
对研究区域进行网格划分,选取100m*100m的网格,等距分布于研究区域各部分,对网格进行编号,以西北角第一个网格为编号1,从左向右、从上向下依次进行编号,1、2、3、......、n。(如图3)
其中单位面积蓄水量典型取样点的筛选标准需同时满足以下条件:
(1)生态单元单位时间内的单位面积蓄水量具有明显变化。考虑数据收集可行性,确定单位时间为1年,收集近十年数据进行统计分析;
(2)生态单元有一项或多项驱动力数据具有明显变化;
(3)生态单元取样点最终成组出现,避免某一区域内只有一个取样点的情况。
确定取样点后,区分蓄水量增多与蓄水量减少的取样点,蓄水量增多区域以圆形点标示,减少区域以方形点标示,完成底图上的总体标示。(如图4)
步骤2:定义每种影响湖泊蓄水量变化的每一属性变化趋势为一项,建立数据库,进行数据预处理。
以黄龙岘区域自然地理环境及社会人文环境中所包含的多种不同属性,包括水文、径流、气候、蒸发、地形、土壤、植被环境、农业生产、周边用地类型、城市化程度共10类影响因素中的60项属性数据,作为影响该区域蓄水量变化的驱动力备选因素。以每种属性的每一种变化趋势,即增加趋势或减少趋势为一项,将所有取样点内各项相关数据导入,建立数据库。该数据库即为承载驱动力因素的数据库。
数据库建立时,须区分为两组,即导致湖泊蓄水量增加的驱动力因素和导致湖泊蓄水量减少的驱动力因素。
影响城乡湖泊蓄水量变化的因素包括以下10类因素、60项属性:
(1)水文S因素,相关属性包括:S1湖泊水质、S2汛期水位、S3常水位、S4枯水位、S5湖面面积、S6湖泊汇水面积、S7地表水使用、S8地下水使用;
(2)径流J因素,相关属性包括:J1地表径流入湖水量、J2地表径流出湖水量、J3地下径流入湖水量、J4地下径流出湖水量;
(3)气候Q因素,相关属性包括:Q1湖面年平均降水量、Q2年降水量分布、Q3日平均温度、Q4日平均相对湿度、Q5日照时数、Q6平均风速、Q7太阳辐射日均值;
(4)蒸发Z因素,相关属性包括:Z1湖面潜在蒸散量、Z2湖面实际蒸散量;
(5)地形D因素,相关属性包括:D1高程、D2坡度、D3坡向、D4起伏度;
(6)土壤T因素,数据类型包括:T1土壤类型、T2土壤类型分布、T3土壤湿度、T4土壤质地、T5土壤厚度、T6土壤有机质含量、T7土壤侵蚀强度;
(7)植被环境H因素,相关属性包括:H1植被类型、H2植被分布、H3生长状态、H4植被覆盖度、H5三维绿量、H6植被季相变化、H7净初级生产力;
(8)农业生产N因素,相关属性包括:N1种植规模、N2种植结构、N3节水工程;
(9)周边用地类型Y因素,相关属性包括:Y1耕地面积、Y2林地面积、Y3牧草地面积、Y4湿地面积、Y5园地面积、Y6鱼塘面积、Y7建设用地面积、Y8未利用地面积;
(10)城市化程度C因素,相关属性包括:C1道路等级、C2路网密度、C3建筑密度、C4建筑高度、C5城镇人口密度、C6农业人口密度、C7人群活动时段、C8城镇化率、C9工业发展程度、C10农村产业化率。
汇总属性数据时,先将水量增加或减少的区域分开,再进行后续各属性要素分析。
其中所述收集数据需进行数据预处理的方法为:
数据清洗:将原始数据中的无关数据与重复数据进行删除处理,处理缺失值、异常值等。处理内容为实地踏勘后获取的地理信息数据,包括影响湖泊蓄水量的驱动力因素参考属性中的所有数据。例如,某年A湖泊precipitation数值明显高于邻近两年数值,则将异常值视为缺失值,利用缺失值处理办法即插补方法进行处理。
(2)数据集成:将来自多个数据源的数据进行合并,并存放在一个一致的数据仓库中。由于来自多个数据源的现实世界的实体表达形式不同,有可能数据之间不匹配,因此需考虑实体识别和属性冗余问题。例如,本研究中数据源A中的agr_area和数据源B中的agr_ar都是描述耕地面积的,即agr_area=agr_ar,应将两个数据源中的耕地面积数据进行合并,并存放在数据仓库中。
(3)数据变换:对数据进行规范化处理,将数据转换成适当的形式,以适用于算法的需要。以数据变换中的属性构造方法为例,该方法需要利用已有的属性集构造出新的属性,并加入到现有的属性集合中。例如在本研究中,已有的土地利用类型属性为年耕地面积,为更清晰地探究影响湖泊蓄水量变化的驱动力因素,需要构造新的属性,即耕地面积的变化趋势,该属性对应两个项,“耕地面积的增加”和“耕地面积的减少”,即agr_area_INC和agr_area_DEC。其中,若前一年耕地面积数多于后一年,即为“耕地面积的增加”,反之则为“耕地面积的减少”。
(4)数据规约:在大数据集上进行复杂的数据分析和挖掘需要很长时间,数据规约会产生更小但保持原数据完整性的新数据集,从而降低无效、错误数据对建模的影响,降低存储数据的成本,并利用少量且具有代表性的数据大幅缩减计算时间。例如,在本研究中,处理土地利用类型相关属性时,采用合并属性方法,原有属性包括“茶树面积”、“柳树面积”、“竹林面积”等,规约后将这些属性合并为新的属性“林地面积”,即for_area。
步骤3:扫描上述数据库,形成每组包含一项属性数据变化趋势的候选项集C1。C1中的每一项均对应一种属性的一种变化趋势,即影响湖泊蓄水量变化的驱动力。例如:草地面积的增多、年平均降水量的减少等。
步骤4:对候选项集C1进行判断,比较其中每一项属性数据变化趋势的支持度是否大于最小支持度,所有大于最小支持度的项,生成频繁项集L1。
其中,最小支持度的取值决定着生成结果,过高的取值会影响有效频繁项集的生成,过低的取值则会导致无意义的结果。经反复实验,研究将最小支持度参考取值界定在0.5-0.6之间,即影响湖泊蓄水量的相关属性数据趋势变化至少达到50%,才进入频繁项集L1。间隔0.02实现Apriori算法,并绘制对应图表,横轴为最小支持度取值,纵轴对应最大频繁项集中频繁项的数量。随着最小支持度的升高,频繁项数量随之减少,即关键驱动力因素减少。(如图5)
根据L1中各项属性数据变化趋势支持度大小,绘制柱状图。绘制方式如下:区分不同地域和蓄水量增减的数据,分别绘制不同地域不同蓄水量的柱状图表,横轴为L1各项名称,竖轴为支持度大小,横向按照支持度由大到小的顺序排列L1中的每一项,比较L1各项即各属性变化趋势的支持度大小,初步判断关键驱动力的可能属性。图中以A湖泊为例,初步认为关键驱动力因素包括三项,按照支持度大小排列,依次为降水减少、森林面积减少、地表水减少。(如图6)
步骤5:利用Apriori-Gen算法,将上述频繁项集L1中的各项数据进行组合,形成每组包含2项属性数据变化趋势的候选2项集C2。
函数Apriori-Gen是对候选项集进行连接步骤和剪枝步骤的合称,连接过程把两个子集连接生成潜在的候选项集,减少了计算量;剪枝过程中,若候选K项集中某个K-1项集为非频繁,则根据性质进行剔除,也提高了算法的计算效率。由于每个候选都由一对频繁K-1项集合并而成,因此只需要附加的候选剪枝步骤来确保该候选的其余K-2个子集是频繁的。
在此环节中,研究对象所形成的候选2项集为每组包含2项,即2项影响湖泊蓄水量的属性数据变化趋势,或称驱动力的组合。以A湖泊为例,频繁2项集中包含[城镇化率增加、湿地减少],[森林减少、农业用地减少],[森林减少、降水减少],[城镇化率增加、农业用地减少]等项。
步骤6:对候选项集C2进行判断,将其中每组属性数据变化趋势的支持度与最小支持度进行比较,所有大于最小支持度的项形成频繁2项集L2,生成描述流域属性相关性的分析图表,进行关联度分析。
其中所述图表制作方式如下:
首先区分蓄水量增加和蓄水量减少的数据,分别绘制增加和减少的图表。以绘制蓄水量增加图表为例,表格横向依次排布关联度的不同取值区间,纵向依次为研究的不同地域。其中关联度代表流域属性之间的相关性。
例如,A湖泊蓄水量变化的驱动力因素中城镇化率增加和农业用地面积减少关联度最高,即相关性最高。
步骤7:继续利用Apriori-Gen算法对频繁项集L2进行重新组合,将上述频繁项集L2中的各项数据进行组合,形成每组包含3项属性数据变化趋势的候选3项集C3。对候选项集C3进行判断,将其中每组属性数据变化趋势的支持度与最小支持度进行比较,所有大于最小支持度的项形成频繁3项集L3。重复此过程,直到迭代形成各项均为关键驱动力的最大频繁K项集LK,从而确定至多有哪几项湖泊蓄水量变化的关键驱动力。
例如,经多次分析得到影响A湖泊蓄水量减少的关键驱动力因素为三项,包括年平均降水量减少、森林减少和城镇化率增加,如表1:
表1置信度分析
步骤8:结果检验。通过多次运行关联算法,得到影响黄龙岘地区湖泊蓄水量的关键驱动力因素后,利用风景园林专业相关知识结合统计分析方法进一步检验,验证结果准确性。
检验过程以遥感影像为主要信息源,利用地理信息***技术和数理统计方法,对2000-2020年黄龙岘地区景观格局变化进行分析。选择6个景观指标开展研究,分别是景观斑块数(NP)、景观斑块密度(PD)、景观形状指数(LSI)、香农景观多样性指数(SHDI)、香农景观优势度指数(SHEI)和景观蔓延度指数(CONTAG),分析各项因素对湖泊蓄水量的影响,利用统计方法筛选驱动力因素,并归纳影响其湖泊蓄水量变化的关键因素。
检验最终结果与关联算法产生的结果一致,以A湖泊为例,年平均降水量减少、森林减少和城镇化率增加为影响A湖泊蓄水量减少的关键驱动力因素
在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。
Claims (9)
1.一种城乡湖泊蓄水量变化的关键驱动力分析方法,其特征在于,包括以下步骤:
步骤A:对研究区域进行等距网格划分,根据筛选标准选出若干单位面积蓄水量的典型取样点;
步骤B:定义水文、径流、气候、蒸发、地形、土壤、植被环境、农业生产、周边用地类型、城市化程度共10类影响因素的60项属性数据变化趋势为项,建立承载驱动力因素的数据库,进行数据预处理;
步骤C:扫描湖泊流域特征趋势数据库,形成候选项集C1,C1中的每组包含一项影响湖泊蓄水量的属性数据变化趋势,共60组;
步骤D:对候选项集C1进行判断,比较其中每一项属性数据变化趋势的支持度是否大于最小支持度,所有大于最小支持度的项生成频繁项集L1,并绘制L1各项柱状图;
步骤E:采用Apriori-Gen算法,将上述频繁项集L1中的各项数据进行组合,形成候选项集C2,因此C2中的每组包含2项影响湖泊蓄水量的属性数据变化趋势;
步骤F:对候选项集C2进行判断,比较其中每组属性数据变化趋势的支持度是否大于最小支持度,所有大于最小支持度的项形成频繁项集L2,其中各项均为承载湖泊蓄水量变化的关键驱动力的候选集,并生成描述流域属性相关性的分析图表;
步骤G:迭代生成最大频繁项集,确定几项湖泊蓄水量变化的关键驱动力;
步骤H:利用风景园林专业相关知识结合统计分析方法进一步检验,验证结果准确性。
2.根据权利要求1所述的城乡湖泊蓄水量变化的关键驱动力分析方法,其特征在于,所述步骤A具体为:对研究区域进行等距网格划分,把湖泊命名为A、B、C、...、N,明确研究对象与范围之后,选取100m*100m的网格,等距分布于研究区域各部分,对网格进行编号,以西北角第一个网格为编号1,从左向右、从上向下依次进行编号,1、2、3、...、n;根据筛选标准选出单位面积蓄水量的典型取样点;确定取样点后,区分蓄水量增多与蓄水量减少的取样点,蓄水量增多区域以圆形点标示,减少区域以方形点标示,完成底图上的总体标示;
其中单位面积蓄水量典型取样点的筛选标准需同时满足以下条件:
(1)生态单元单位时间内的单位面积蓄水量具有明显变化, 考虑数据收集可行性,确定单位时间为1年,收集近十年数据进行统计分析;
(2)生态单元有一项或多项驱动力数据具有明显变化;
(3)生态单元取样点最终成组出现,避免某一区域内只有一个取样点的情况。
3.根据权利要求1所述的城乡湖泊蓄水量变化的关键驱动力分析方法,其特征在于,所述步骤B具体为:定义每种影响湖泊蓄水量变化的每一属性变化趋势为一项,建立数据库,进行数据预处理;以研究区域自然地理环境及社会人文环境中所包含的多种不同属性,包括水文、径流、气候、蒸发、地形、土壤、植被环境、农业生产、周边用地类型、城市化程度共10类影响因素中的60项属性数据,作为影响城乡湖泊蓄水量变化的驱动力备选因素,以每种属性的每一种变化趋势,即增加趋势或减少趋势为一项,将所有取样点内各项相关数据导入,建立数据库,该数据库即为承载驱动力因素的数据库,然后对数据库的数据进行预处理,主要包括:数据清洗、数据集成、数据变换、数据规约。
4.根据权利要求1所述的城乡湖泊蓄水量变化的关键驱动力分析方法,其特征在于,所述步骤C具体为:扫描数据库,形成每组包含一项属性数据变化趋势的候选项集C1,C1中的每一项均对应一种属性的一种变化趋势,即影响湖泊蓄水量变化的驱动力。
5.根据权利要求1所述的城乡湖泊蓄水量变化的关键驱动力分析方法,其特征在于,所述步骤D具体为:对候选项集C1进行判断,比较其中每一项属性数据变化趋势的支持度是否大于最小支持度,所有大于最小支持度的项,生成频繁项集L,其中,最小支持度的取值决定着生成结果,过高的取值会影响有效频繁项集的生成,过低的取值则会导致无意义的结果,经反复实验,可将最小支持度取值界定在0.5-0.6之间,即影响湖泊蓄水量的相关属性数据趋势变化至少达到50%,才进入频繁项集L1,间隔0.02实现Apriori算法,并绘制对应图表,横轴为最小支持度取值,纵轴对应最大频繁项集中频繁项的数量。
6.根据权利要求1所述的城乡湖泊蓄水量变化的关键驱动力分析方法,其特征在于,所述步骤E具体为:利用Apriori-Gen算法,将频繁项集L1中的各项数据进行组合,形成每组包含2项属性数据变化趋势的候选项集C2,函数Apriori-Gen是对候选项集进行连接步骤和剪枝步骤的合称,连接过程把两个子集连接生成潜在的候选项集,减少了计算量;剪枝过程中,若候选K项集中某个K-1项集为非频繁,则根据性质进行剔除,也提高了算法的计算效率,由于每个候选都由一对频繁K-1项集合并而成,因此只需要附加的候选剪枝步骤来确保该候选的其余K-2个子集是频繁的,在此环节中,研究对象所形成的候选2项集为每组包含2项,即2项影响湖泊蓄水量的属性数据变化趋势,或称驱动力的组合。
7.根据权利要求1所述的城乡湖泊蓄水量变化的关键驱动力分析方法,其特征在于,所述步骤F具体为:对候选项集C2进行判断,将其中每组属性数据变化趋势的支持度与最小支持度进行比较,所有大于最小支持度的项形成频繁2项集L2,生成描述流域属性相关性的分析图表,进行关联度分析。
8.根据权利要求1所述的城乡湖泊蓄水量变化的关键驱动力分析方法,其特征在于,所述步骤G具体为:继续利用Apriori-Gen算法对频繁项集L2进行重新组合,将上述频繁项集L2中的各项数据进行组合,形成每组包含3项属性数据变化趋势的候选项集C3;对候选项集C3进行判断,将其中每组属性数据变化趋势的支持度与最小支持度进行比较,所有大于最小支持度的项形成频繁3项集L3;重复此过程,直到迭代形成各项均为关键驱动力的最大频繁K项集LK,从而确定至多有哪几项湖泊蓄水量变化的关键驱动力。
9.根据权利要求1所述的城乡湖泊蓄水量变化的关键驱动力分析方法,其特征在于,所述步骤H具体为:通过多次运行关联算法,得到影响研究地区湖泊蓄水量的关键驱动力因素后,利用风景园林专业相关知识结合统计分析方法进行进一步检验,验证结果准确性;检验过程以遥感影像为主要信息源,利用地理信息***技术和数理统计方法,对研究地区景观格局变化进行分析,检验最终结果应与关联算法产生结果一致。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110549208.9A CN113256101B (zh) | 2021-05-20 | 2021-05-20 | 一种城乡湖泊蓄水量变化的关键驱动力分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110549208.9A CN113256101B (zh) | 2021-05-20 | 2021-05-20 | 一种城乡湖泊蓄水量变化的关键驱动力分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113256101A CN113256101A (zh) | 2021-08-13 |
CN113256101B true CN113256101B (zh) | 2022-10-28 |
Family
ID=77182898
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110549208.9A Active CN113256101B (zh) | 2021-05-20 | 2021-05-20 | 一种城乡湖泊蓄水量变化的关键驱动力分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113256101B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115994639B (zh) * | 2023-02-06 | 2023-09-26 | 天津大学 | 一种基于冗余分析的水网格局与地形地貌关联性评价方法 |
CN117149935B (zh) * | 2023-10-30 | 2024-01-19 | 北京江云智能科技有限公司 | 一种基于数字孪生的水网数据监管***及方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109598082A (zh) * | 2018-12-17 | 2019-04-09 | 河海大学 | 基于氢氧同位素的湖泊蒸发量及关键水文信息的计算方法 |
CN111504424A (zh) * | 2020-06-17 | 2020-08-07 | 水利部交通运输部国家能源局南京水利科学研究院 | 一种基于遥感的湖泊蓄水变化量监测方法 |
-
2021
- 2021-05-20 CN CN202110549208.9A patent/CN113256101B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109598082A (zh) * | 2018-12-17 | 2019-04-09 | 河海大学 | 基于氢氧同位素的湖泊蒸发量及关键水文信息的计算方法 |
CN111504424A (zh) * | 2020-06-17 | 2020-08-07 | 水利部交通运输部国家能源局南京水利科学研究院 | 一种基于遥感的湖泊蓄水变化量监测方法 |
Non-Patent Citations (1)
Title |
---|
近40年来纳木错水面面积及蓄水量变化特征;李蒙等;《水电能源科学》;20170225(第02期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113256101A (zh) | 2021-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109002621B (zh) | 一种顾及邻域与地理差异的林分平均高与胸径计算方法 | |
CN104486435B (zh) | 基于传感器网络的低能耗生态环境监控节点部署方法 | |
CN108984803B (zh) | 一种农作物产量空间化的方法及*** | |
CN101916337B (zh) | 一种基于地理信息***的水稻生产潜力动态预测方法 | |
CN107256451A (zh) | 农业大数据基于gis的农业适宜性评价分析方法 | |
CN113256101B (zh) | 一种城乡湖泊蓄水量变化的关键驱动力分析方法 | |
CN109582755A (zh) | 一种基于网格的精准农业数据库实现方法 | |
CN111445116A (zh) | 国土空间规划辅助编制*** | |
CN116757357B (zh) | 一种耦合多源遥感信息的土地生态状况评估方法 | |
CN110222656A (zh) | 基于遥感技术的地上植被生态水定量反演方法 | |
Sui et al. | Spatiotemporal variation of cultivated land ecosystem stability in typical regions of Lower Liaohe Plain China based on stress-buffer-response | |
Gonfa et al. | Land suitability and surface water resources potential for irrigation in Becho Plain, upper Awash basin, Ethiopia | |
CN114792274A (zh) | 一种干旱区山地人工植被建设的布局方法 | |
Kimaro et al. | Distribution of traditional irrigation canals and their discharge dynamics at the southern slopes of Mount Kilimanjaro | |
CN117494419A (zh) | 一种多模型耦合的流域水土流失遥感监测方法 | |
CN113570273A (zh) | 一种灌溉耕地统计数据的空间化方法及*** | |
CN106980701A (zh) | 一种地理影响民居建筑形态的统计***及统计方法 | |
Miao et al. | Measurement of cultivated land ecosystem resilience in black soil region of Northeast China under the background of cultivated land protection policy in China: Case study of Qiqihar City | |
Zuo et al. | Analysis of the gains and losses of ecosystem service value under land use change and zoning in Qiqihar | |
CN113935658A (zh) | 一种基于地形梯度的山区土地利用变化评价方法 | |
CN114416692A (zh) | 一种构建流域水环境管理数据资源体系的方法 | |
Meirelles et al. | Data mining in the reduction of the number of places of experiments for plant cultivates | |
Cong et al. | A Rapid Integration Method of Wild Ornamental Plant Resources Based on Improved Clustering Algorithm | |
Santos | Synergy between digital soil mapping and crop modeling: influence of soil data on sugarcane attainable yield | |
Paiboonvorachat | Using remote sensing and GIS techniques to assess land use/land cover changes in the Nan Watershed, Thailand |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |