CN115563493A - 一种基于聚类算法划分乡村景观生态单元的方法 - Google Patents

一种基于聚类算法划分乡村景观生态单元的方法 Download PDF

Info

Publication number
CN115563493A
CN115563493A CN202211410012.2A CN202211410012A CN115563493A CN 115563493 A CN115563493 A CN 115563493A CN 202211410012 A CN202211410012 A CN 202211410012A CN 115563493 A CN115563493 A CN 115563493A
Authority
CN
China
Prior art keywords
grids
data
clustering
type
grid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211410012.2A
Other languages
English (en)
Inventor
徐宁
张超
樊梦楚
王伟
成玉宁
宋义智
伊丹阳
刘琦琳
王思宇
徐小东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southeast University
Original Assignee
Southeast University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southeast University filed Critical Southeast University
Priority to CN202211410012.2A priority Critical patent/CN115563493A/zh
Publication of CN115563493A publication Critical patent/CN115563493A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Algebra (AREA)
  • Evolutionary Biology (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开一种基于聚类算法划分乡村景观生态单元的方法,属于风景园林学研究领域;方法包括:S1对研究区域进行网格划分,得到A、B两类网格划分结果;S2收集研究区域的基本信息,建立各区域的基本信息库;S3整理所采集的基本信息数据并进行预处理,并准备对网格进行二次分析;S4对A类网格进行多维聚类分析;S5对A类网格的聚类结果进行命名和区分;S6以A类网格的分类结果为参照,完善B类网格的数据;S7对B类网格进行多维聚类分析,对结果进行命名和区分;S8将A、B类网格分析结果数据可视化输出,以不同灰度的色块进行分类结果的区分;S9合并相同灰度颜色且相邻的网格,依据分析结果生成生态单元。

Description

一种基于聚类算法划分乡村景观生态单元的方法
技术领域
本发明属于风景园林学研究领域,具体涉及一种基于聚类算法划分乡村景观生态单元的方法。
背景技术
目前现有的景观生态单元的划分方法较少,且大部分聚焦于纯自然景观和城市景观。普遍采用的生态单元划分方法有自然分区法和公里网格法等,但两者分别存在区域形状不规则、面积不一以及界线不明显导致后期工作量大等问题。
由于不同土地利用类型的生态功能不同,即使是同一种土地利用类型,也会因为面积的不同、水文、气候、高程和植被覆盖度的差别等,其生态功能也会有所差异。
发明内容
针对现有技术的不足,本发明的目的在于提供一种基于聚类算法划分乡村景观生态单元的方法,考虑了不同区域的自然地理条件、行政区划以及植被条件现状,增加研究和制图精度,使得景观生态单元划分能够适应各类尺度、更加符合生态单元的时间和空间上的动态变化特征的问题。
本发明的目的可以通过以下技术方案实现:
一种基于聚类算法划分乡村景观生态单元的方法,所述方法包括以下步骤:
S1,对研究区域进行网格划分,得到A、B两类网格划分结果;
S2,收集研究区域的基本信息,建立各区域的基本信息库;
S3,整理所采集的基本信息数据并进行预处理,并准备对网格进行二次分析;
S4,对A类网格进行多维聚类分析;
S5,对A类网格的聚类结果进行命名和区分;
S6,以A类网格的分类结果为参照,完善B类网格的数据;
S7,对B类网格进行多维聚类分析,对结果进行命名和区分;
S8,将A、B类网格分析结果数据可视化输出,以不同灰度的色块进行分类结果的区分;
S9,合并相同灰度颜色且相邻的网格,依据分析结果生成生态单元。
进一步地,所述S1中,划分网格的步骤包括:
S11,计算研究对象的区域尺度:
X方向最大长度H和Y方向最大长度L,按照计算公式:
Y方向的网格数
Figure BDA0003937281210000021
单元总数
Figure BDA0003937281210000022
其中x为Y方向的网格数,x为正整数;n为单元边长;将相应尺度的网格覆盖在研究对象的卫星图上,去除内容为空的网格,留下的网格成为有效网格;
S12,根据有效单元网格中,存在单个网格内部功能、构成及形态的差异大小来划分为A、B类网格。
进一步地,所述S2中收集的基本信息包括:用地性质、水文与气候、高程与坡度、土壤敏感度以及植被覆盖度。
进一步地,所述S3中,数据预处理的步骤为:
S31,对数据进行清洗、变换,得到能有效处理的数据;
S32,将连续数据转化为离散型数据;
S33,通过PCA主成分分析方法对数据的维度进行预处理之后,选取95%能量因数维度的数据进行聚类,将高维的数据样本在信息损失较低的情况下降维。
进一步地,所述S4中,对A类网格进行多维聚类分析步骤为:
S41,初始化一个矩阵来存储每个网格的数据;
S42,采用Python语言中Scikit-learn库函数的K-means算法对划分的网格进行聚类,k为初始选取的样本中心数,通过多次质心的迭代计算收敛,使总体分类的误差平方和函数最终达到一个最小值,得到K个样本的中心;
S43,对算法中的k值和初始质心的位置进行多次尝试,选取聚类效果最好的一组结果作为最终的聚类结果。
进一步地,所述S5中,对A类网格的聚类结果进行命名和区分的步骤为:
S51,多维聚类分析后,得到聚类结果,不同组别聚类结果的网格单元用不同颜色标示;
S52,利用网格的相邻位置将颜色分区确定相似地块,即为一个生态单元,并分别命名。
进一步地,在所述S6中,完善B类网格的数据时,需要添加条件:与A类不同生态单元的相邻情况。
进一步地,所述S7中,B类网格进行多维聚类分析步骤为:
1)初始化一个矩阵来存储每个网格的数据;
2)创建质心,随机k个质心;
3)计算距离,欧式距离计算:n维欧氏空间的每个点X可以表示为(x[1]x[2]…x[n])其中x(i=12…n)是实数,称为X的第i个坐标两个点A=(a[1]a[2]…a[n])和B=(b[1]b[2]…b[n])之间的距离d(AB),定义为公式d(AB)=sqrt[∑((a-b)^2)](i=12…n);
4)判断k值大小,迭代计算距离;
5)得出B类网格聚类结果。
进一步地,所述S33中,对PCA降维处理的步骤为:
1)将样本集X=[x1,x2,x3,x4,...]进行中心化处理,即每个样本的每个属性减去对应属性在样本集中的均值;
2)计算协方差矩阵D=XXT;
3)对特征值从大到小排序,选择相关性最低的k个属性的投影方向进行线性组合,然后将其对应的k个特征向量分别作为行向量组成特征向量矩阵P;
4)将数据转换到k个特征向量构建的新空间中,即Y=PX。
进一步地,所述S42的具体步骤为:
首先随机选择任意一个数字k,将k个中心分别记为μ12,…,μk;其次根据每个聚类对象的均值,代入公式组:
Figure BDA0003937281210000041
D=min Disj
计算每个对象与这些中心对象的欧氏距离Dis,并根据最小距离D重新对相应对象进行划分,进而计算每个所获新聚类的聚类中心
Figure BDA0003937281210000042
不断重复这一过程直到均方差标准测度函数开始收敛为止;计算公式如下:
Figure BDA0003937281210000051
E为数据库中所有对象的均方差和;p为对象的空间中的一个点;μi:聚类xi的均值。
本发明的有益效果:
1、本发明考虑了不同区域的自然地理条件、行政区划以及植被条件现状,增加研究和制图精度,使得景观生态单元划分能够适应各类尺度、更加符合生态单元的时间和空间上的动态变化特征的问题;
2、本发明利用人工智能算法对乡村景观生态单元进行划分,弥补现有乡村景观生态单元划分方法基于主观读图和感性判断的不足,提供一种以乡村生态景观单元划分为主要研究对象,引入计算机编程算法,结合现有的网格划分方法实现对乡村景观生态单元划分的量化分析方法。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的整体流程图;
图2是本发明实施例的网格划分示意图;
图3是本发明实施例的研究范围网格示意图;
图4是本发明实施例的用地性质示意图;
图5是本发明实施例的坡度分布示意图;
图6是本发明实施例的土地敏感度示意图;
图7是本发明实施例的植被覆盖度示意图;
图8是本发明实施例的A类网格聚类过程示意图;
图9是本发明实施例的最终聚类结果示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
“聚类算法”是以距离作为相似度指标的算法,以样本点到类别中心的误差平方和作为聚类优劣的评价标准,通过不断迭代的方法使总体分类的误差平方和函数最终达到一个最小值的聚类方法。
如图1所示,一种基于聚类算法划分乡村景观生态单元的方法,包括以下步骤:
S1,将研究区域根据标准进行合理的网格划分,得到A、B两类网格划分结果;具体步骤为:
S11,计算研究对象的区域尺度;
X方向最大长度H和Y方向最大长度L,按照计算公式:
Y方向的网格数
Figure BDA0003937281210000061
单元总数
Figure BDA0003937281210000062
其中x为Y方向的网格数,x为正整数;n为单元边长,n的大小取决于研究对象的规模大小;当研究对象的面积在10km2及以内时,n建议取值100m;当研究对象在10km2以上时,n的取值范围一般在[100,500]之间;将相应尺度的网格覆盖在研究对象的卫星图上,去除内容为空的网格,留下的网格成为有效网格。
S12,将网格划分为A、B两类,并命名;
有效单元网格中存在单个网格内部功能、构成及形态等较一致的网格,称为A类网格;也存在功能、构成、形态等差异较大的网格,称为B类网格;分别对其进行命名,其中A类网格从西北角开始命名为A1,从左到右从上到下依次进行编号A1、A2、A3……,B类网格同理命名为B1、B2、B3……。
S2,调研收集研究区域的基本信息,建立各区域的基本信息库;
调研收集研究区域的基本信息,包括用地性质、水文与气候、高程与坡度、土壤敏感度以及植被覆盖度共5大类要素,建立各区域的基本信息库;
用地性质:根据《土地利用现状分类》(GB/T21010-2017),我国土地利用类型分为耕地、园地、林地、牧草地、居民点及工矿用地、交通用地、水域、未利用地共8种一级类型;据此分类收集研究区域的用地信息。
水文与气候:包括水文要素和气候要素;水文要素根据是否有表面径流决定收集数据情况,包括水位、流量和流速等;气候要素包括气温特征、降水特征、风向风力和降水量;
高程与坡度:高程数据收集的同时记录坡向和坡度;
土壤敏感度:指研究区域发生土壤侵蚀模数的高低程度;通常根据土壤侵蚀模数分为六级:微度侵蚀、轻度侵蚀、中度侵蚀、强烈侵蚀、极强烈侵蚀和剧烈侵蚀;
植被覆盖度:指植被在地面的垂直投影面积占统计区总面积的百分比,在收集数据的同时记录植被种类。
S3,整理所采集的基本信息数据并进行预处理,准备对网格进行二次分析;具体包括以下步骤:
S31,数据预处理,包括数据清洗、数据变换等,得到能有效处理的数据,针对数据量大且复杂的对象进行清洗,并对数据进行规范化处理;
S32,数据转化,将连续数据转化为离散型数据;
S33,PCA(主成分分析)降维处理,通过PCA主成分分析方法对数据的维度进行预处理之后选取95%能量因数维度的数据进行聚类,将高维的数据样本在信息损失较低的情况下降维,提高算法的运行性能和处理效果。
S4,对A类网格进行多维聚类分析;
将A类数据导入Python进行多维聚类,加载数据后,对A类数据的欧式距离进行计算,其中多维聚类算法分析包括以下步骤:
S41,初始化一个矩阵来存储每个网格的数据;包括网格名称和对应的用地性质、水位、流量、流速、径流量、平均气温、年降水量、高程、坡度、土壤敏感度和植被覆盖度条目数据;
S42,采用Python语言中Scikit-learn库函数的K-means算法对划分的网格进行聚类,其中k为初始选取的样本中心数;通过多次质心的迭代计算收敛,使总体分类的误差平方和函数最终达到一个最小值,得到K个样本的中心;
S43,对算法中的k值进行多次尝试,以及对于初始质心的位置进行多次尝试,最后选取聚类效果最好的一组结果作为最终的聚类结果;
S4的程序代码为:
Figure BDA0003937281210000081
Figure BDA0003937281210000091
Figure BDA0003937281210000101
Figure BDA0003937281210000111
S5,对A类网格的聚类结果进行命名和区分;具体包括以下步骤:
S51,多维聚类分析后,得到聚类结果,不同组别聚类结果的网格单元用不同颜色标示;
S52,利用网格的相邻位置将颜色分区确定相似地块,即为一个生态单元;分别命名为L1、L2……。
S5的程序代码为:
Figure BDA0003937281210000112
Figure BDA0003937281210000121
Figure BDA0003937281210000131
Figure BDA0003937281210000141
S6,以A类网格的分类结果为参照,完善B类网格的数据;
因为作为复杂地块的B类网格所包括的不同地理特征的区域与相邻的生态单元有着地理和特征上的联系,所以在B类网格的数据中加一条件:与A类不同生态单元的相邻情况;如:处于L1、L2之间的就标为与L1、L2地块相邻。
S7,对B类网格进行多维聚类分析,对结果进行命名和区分;具体包括以下步骤:
S71,加载数据;
S72,多维聚类算法,k均值聚类;
①初始化一个矩阵来存储每个网格的数据,包括网格名称和对应的用地种类数目、用地性质、水位、流量、流速、径流量、平均气温、年降水量、高程、坡度、土壤敏感度、植被覆盖度、与周围A类地块相邻情况等各项条目;
②创建质心,随机k个质心;
③计算距离,欧式距离计算:n维欧氏空间的每个点X可以表示为(x[1]x[2]…x[n])其中x(i=12…n)是实数,称为X的第i个坐标两个点A=(a[1]a[2]…a[n])和B=(b[1]b[2]…b[n])之间的距离d(AB),定义为公式d(AB)=sqrt[∑((a-b)^2)](i=12…n);
④判断k值大小,迭代计算距离;
⑤得出B类网格聚类结果;
S73,利用网格的相邻位置将颜色分区确定相似地块,即为一个生态单元;分别命名为P1、P2……。
S8,将A、B类网格分析结果数据可视化输出,以不同灰度的色块进行分类结果的区分;具体步骤为:
S81,将不同组别聚类结果所得的乡村景观生态单元用不同颜色标示;
S82,将可视化之后的网格数据数组按照顺序原位放回地图。
S9,合并相同灰度颜色且相邻的网格,依据分析结果生成生态单元;具体步骤为:
S91,按照行政区划和地理位置分析网格颜色,合并相同灰度颜色且相邻的网格,即为一个生态单元;
S92,分别给各个单元根据特征***化命名;如XX村XX山地、XX水库、XX交界湿地等。
实施例:
下面以某地为例,利用聚类算法划分乡村景观生态单元,实现基于聚类算法对乡村景观生态单元的科学划分,通过分类研究单一和复合生态区域划分出特征明确的景观生态单元,具体实施步骤为:
S1,根据标准进行合理的网格划分,得到A、B两类网格划分结果。
S11,该地区总面积8.2平方公里,根据研究对象的区域尺度,100m*100m的网格对应的研究精度适用于该研究对象,取n=100m;按照网格标准,利用ArcGIS中的渔网工具,对牌坊社区的外接矩形范围进行网格划分,共形成353*564个网格,建立单个网格为100m*100m的***,如图2所示;
创建fishnet label对应每个网格的几何中心,定为网格的采样点;最后去除外接矩形中内容为空的网格,如图3所示;
S12,有效单元网格中存在单个网格内部功能、构成及形态等较一致的网格(称为A类网格),也存在功能、构成、形态等差异较大的网格(称为B类网格);分别对其进行命名,其中A类网格从西北角开始命名为A1,从左到右从上到下依次进行编号A1、A2、A3……,B类网格同理命名为B1、B2、B3……。
S2,调研收集所选区域的基本信息,包括用地性质、水文与气候、高程与坡度、土壤敏感度、植被覆盖度等具体因素,建立各区域的基本信息库;
用地类型:根据《土地利用现状分类》(GB/T21010-2017),我国土地利用类型分为耕地、园地、林地、牧草地、居民点及工矿用地、交通用地、水域、未利用地共8种一级类型,据此收集研究区域的用地信息,如图4所示;
水文气候:包括水文要素和气候要素;水文要素根据是否有表面径流决定收集数据情况,包括水位、流量和流速等;气候要素包括气温特征、降水特征、风向风力和降水量等;
高程:高程数据收集的同时记录坡向和坡度;如图5所示;
土壤敏感度:指研究区域发生土壤侵蚀模数的高低程度;通常根据土壤侵蚀模数分为六级:微度侵蚀、轻度侵蚀、中度侵蚀、强烈侵蚀、极强烈侵蚀和剧烈侵蚀;如图6所示;
植被覆盖度:指植被在地面的垂直投影面积占统计区总面积的百分比。在收集数据的同时记录植被种类;如图7所示;
采集数据需注意以下事项:
(1)以网格为单位采集数据;
(2)在A类网格收集数据时,注意平均取值,以网格为单位,每个网格采集一套数据,在网格内部数据要有代表性。其中:用地性质根据当地提供的用地性质图进行记录;水文气候包括水文要素和气候要素,水文要素包括该网格是否有表面径流,当存在表面径流时,同步收集径流量数据。气候要素采集时通过网络数据获取每个网格所处位置的平均气温和年降水量;高程与坡度采取平均取样法,在每个小格中等距选取三行三列取样点后,计算高程平均值和方差得出结果;植被覆盖度用网格面积中植被的面积占比来计算该数据。
(3)在B类网格采集数据时,注意不同种类的自然地理性质的要素提取。如:同一网格单元内包括水域、耕地和住宅用地,则分别进行数据采集。其中:用地性质根据当地提供的用地性质图进行记录;植被覆盖度在采集数据时,同一网格内以非水域面积为分母,并标注出水域面积;
S3,整理所采集的基本信息数据并进行预处理,准备对网格进行二次分析;
S31,数据预处理,包括数据清洗、数据变换等,得到能有效处理的数据;
数据清洗指的是删除原始数据中的无关数据、重复数据,处理异常值和正常值;主要针对数据量大且复杂的对象进行清洗,按照规则去除异常数值。对缺失值的处理采用插补法,如对“高程”缺失值的处理:采用等距采样法时若有数据缺失,可以使用均值/中位数/众数法进行插补;
数据变换指的是对数据进行规范化处理;因为收集到的原始数据中不同特征数据的量纲可能不一致,数值差值可能很大,如“高程平均值”的取值范围往往与“植被覆盖度”差别较大,此时可以通过数据规范化将“高程平均值”按比例进行缩放。通过规定高程的最大值max=1,最小值min=-1,将中间值按比例缩放到[-1,1]的范围内,从而增加不同类型数据之间的可比性;
S32,数据转化
将收集到的数据以Excel表格形式呈现,一个网格对应一条数据;其中A类数据包括用地性质、水位、流量、流速、径流量、平均气温、年降水量、高程、坡度、土壤敏感度和植被覆盖度11项条目;当网格内部不存在表面径流时,条目径流量数据不存在;对于A类数据聚类时,实际考虑条目数量为10或11项;B类数据由于地块的复杂性,包括两种以上的用地种类,因此数据收集除上述的常规数据外,还需统计单个网格范围内包含的用地种类数目;如:某地块包括耕地、水域和林地三种用地,则用地种类数为3。
数据转化:将连续数据转化为离散型数据。对连续化的数据类型分段赋予标识;如:等宽法处理高程数据,将高程数据的值域分成具有相同宽度的区间,区间的个数由数据本身特点决定。
S33,PCA(主成分分析)降维处理
通过PCA主成分分析方法对数据的维度进行预处理之后选取95%能量因数维度的数据进行聚类,将高维的数据样本在信息损失较低的情况下降维,提高算法的运行性能和处理效果;主要步骤包括:
1)样本集X=[x1,x2,x3,x4,...]进行中心化处理,即每个样本的每个属性减去对应属性在样本集中的均值;如A类网格中的样本集X=[用地性质、水位、流量、流速、径流量、平均气温、年降水量、高程、坡度、土壤敏感度、植被覆盖度];
2)计算协方差矩阵D=XXT(反映不同属性间的相关程度);
3)对特征值从大到小排序,选择相关性最低的k个属性的投影方向进行线性组合,然后将其对应的k个特征向量分别作为行向量组成特征向量矩阵P;
4)将数据转换到k个特征向量构建的新空间中,即Y=PX。
S4,对A类网格进行多维聚类分析;
将A类数据导入Python进行多维聚类,加载数据后,对A类数据的欧式距离进行计算;其中所述多维聚类算法分析包括:
初始化一个矩阵来存储每个网格的数据,包括网格名称和对应的用地性质、水位、流量、流速、径流量、平均气温、年降水量、高程、坡度、土壤敏感度和植被覆盖度条目数据;
Python语言的三维聚类过程包括:首先随机选择任意一个数字k(代表研究对象最终乡村景观单元的种类),将k个中心分别记为μ12,…,μk;其次根据每个聚类对象的均值,代入公式组:
Figure BDA0003937281210000191
D=min Disj
计算每个对象与这些中心对象的欧氏距离Dis,并根据最小距离D重新对相应对象进行划分,进而计算每个所获新聚类的聚类中心
Figure BDA0003937281210000192
(该聚类中所有对象的均值),不断重复这一过程直到均方差标准测度函数开始收敛为止;计算公式如下:
Figure BDA0003937281210000193
E为数据库中所有对象的均方差和;p为对象的空间中的一个点;μi为聚类xi的均值(p和μi均是多维的);如图8所示。
S5,对A类网格的聚类结果进行命名和区分;
S51,多维聚类分析后,得到聚类结果;不同组别聚类结果的网格单元用不同颜色标示;
S52,利用网格的相邻位置将颜色分区确定相似地块,即为一个生态单元;分别命名为L1、L2……。
S6,以A类网格的分类结果为参照,完善B类网格的数据;
因为作为复杂地块的B类网格所包括的不同地理特征的区域与相邻的生态单元有着地理和特征上的联系,所以在B类网格的数据中加一条件:与A类不同生态单元的相邻情况;如:处于L1、L2之间的就标为与L1、L2地块相邻。
S7,对B类网格进行多维聚类分析,对结果进行命名和区分。包括:
S71,加载数据;
S72,多维聚类算法,k均值聚类;
①初始化一个矩阵来存储每个网格的数据,包括网格名称和对应的用地种类数目、用地性质、水位、流量、流速、径流量、平均气温、年降水量、高程、坡度、土壤敏感度、植被覆盖度、与周围A类地块相邻情况等各项条目;
②创建质心,随机k个质心;
③计算距离,欧式距离计算:n维欧氏空间的每个点X可以表示为(x[1]x[2]…x[n])其中x(i=12…n)是实数,称为X的第i个坐标两个点A=(a[1]a[2]…a[n])和B=(b[1]b[2]…b[n])之间的距离d(AB),定义为公式d(AB)=sqrt[∑((a-b)^2)](i=12…n);
④判断k值大小,迭代计算距离;
⑤得出B类网格聚类结果;
S73,利用网格的相邻位置将颜色分区确定相似地块,即为一个生态单元。分别命名为P1、P2……。
S8,将A、B类网格分析结果数据可视化输出,以不同灰度的色块进行分类结果的区分;
S81,将不同组别聚类结果所得的乡村景观生态单元用不同颜色标示;
S82,将可视化之后的网格数据数组按照顺序原位放回地图。
S9,合并相同灰度颜色且相邻的网格,依据分析结果生成生态单元;
S91,按照行政区划和地理位置分析网格颜色,合并相同灰度颜色且相邻的网格,即为一个生态单元;(如图9所示);
S92,分别给各个单元根据特征***化命名。如XX村XX山地、XX水库、XX交界湿地等。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。

Claims (10)

1.一种基于聚类算法划分乡村景观生态单元的方法,其特征在于,所述方法包括以下步骤:
S1,对研究区域进行网格划分,得到A、B两类网格划分结果;
S2,收集研究区域的基本信息,建立各区域的基本信息库;
S3,整理所采集的基本信息数据并进行预处理,并准备对网格进行二次分析;
S4,对A类网格进行多维聚类分析;
S5,对A类网格的聚类结果进行命名和区分;
S6,以A类网格的分类结果为参照,完善B类网格的数据;
S7,对B类网格进行多维聚类分析,对结果进行命名和区分;
S8,将A、B类网格分析结果数据可视化输出,以不同灰度的色块进行分类结果的区分;
S9,合并相同灰度颜色且相邻的网格,依据分析结果生成生态单元。
2.根据权利要求1所述的一种基于聚类算法划分乡村景观生态单元的方法,其特征在于,所述S1中,划分网格的步骤包括:
S11,计算研究对象的区域尺度:
X方向最大长度H和Y方向最大长度L,按照计算公式:
Y方向的网格数
Figure FDA0003937281200000011
单元总数
Figure FDA0003937281200000012
其中x为Y方向的网格数,x为正整数;n为单元边长;将相应尺度的网格覆盖在研究对象的卫星图上,去除内容为空的网格,留下的网格成为有效网格;
S12,根据有效单元网格中,存在单个网格内部功能、构成及形态的差异大小来划分为A、B类网格。
3.根据权利要求1所述的一种基于聚类算法划分乡村景观生态单元的方法,其特征在于,所述S2中收集的基本信息包括:用地性质、水文与气候、高程与坡度、土壤敏感度以及植被覆盖度。
4.根据权利要求1所述的一种基于聚类算法划分乡村景观生态单元的方法,其特征在于,所述S3中,数据预处理的步骤为:
S31,对数据进行清洗、变换,得到能有效处理的数据;
S32,将连续数据转化为离散型数据;
S33,通过PCA主成分分析方法对数据的维度进行预处理之后,选取95%能量因数维度的数据进行聚类,将高维的数据样本在信息损失较低的情况下降维。
5.根据权利要求4所述的一种基于聚类算法划分乡村景观生态单元的方法,其特征在于,所述S4中,对A类网格进行多维聚类分析步骤为:
S41,初始化一个矩阵来存储每个网格的数据;
S42,采用Python语言中Scikit-learn库函数的K-means算法对划分的网格进行聚类,k为初始选取的样本中心数,通过多次质心的迭代计算收敛,使总体分类的误差平方和函数最终达到一个最小值,得到K个样本的中心;
S43,对算法中的k值和初始质心的位置进行多次尝试,选取聚类效果最好的一组结果作为最终的聚类结果。
6.根据权利要求5所述的一种基于聚类算法划分乡村景观生态单元的方法,其特征在于,所述S5中,对A类网格的聚类结果进行命名和区分的步骤为:
S51,多维聚类分析后,得到聚类结果,不同组别聚类结果的网格单元用不同颜色标示;
S52,利用网格的相邻位置将颜色分区确定相似地块,即为一个生态单元,并分别命名。
7.根据权利要求6所述的一种基于聚类算法划分乡村景观生态单元的方法,其特征在于,在所述S6中,完善B类网格的数据时,需要添加条件:与A类不同生态单元的相邻情况。
8.根据权利要求7所述的一种基于聚类算法划分乡村景观生态单元的方法,其特征在于,所述S7中,B类网格进行多维聚类分析步骤为:
1)初始化一个矩阵来存储每个网格的数据;
2)创建质心,随机k个质心;
3)计算距离,欧式距离计算:n维欧氏空间的每个点X可以表示为(x[1]x[2]…x[n])其中x(i=12…n)是实数,称为X的第i个坐标两个点A=(a[1]a[2]…a[n])和B=(b[1]b[2]…b[n])之间的距离d(AB),定义为公式d(AB)=sqrt[∑((a-b)^2)](i=12…n);
4)判断k值大小,迭代计算距离;
5)得出B类网格聚类结果。
9.根据权利要求4所述的一种基于聚类算法划分乡村景观生态单元的方法,其特征在于,所述S33中,对PCA降维处理的步骤为:
1)将样本集X=[x1,x2,x3,x4,...]进行中心化处理,即每个样本的每个属性减去对应属性在样本集中的均值;
2)计算协方差矩阵D=XXT;
3)对特征值从大到小排序,选择相关性最低的k个属性的投影方向进行线性组合,然后将其对应的k个特征向量分别作为行向量组成特征向量矩阵P;
4)将数据转换到k个特征向量构建的新空间中,即Y=PX。
10.根据权利要求5所述的一种基于聚类算法划分乡村景观生态单元的方法,其特征在于,所述S42的具体步骤为:
首先随机选择任意一个数字k,将k个中心分别记为μ12,…,μk;其次根据每个聚类对象的均值,代入公式组:
Figure FDA0003937281200000041
计算每个对象与这些中心对象的欧氏距离Dis,并根据最小距离D重新对相应对象进行划分,进而计算每个所获新聚类的聚类中心
Figure FDA0003937281200000042
不断重复这一过程直到均方差标准测度函数开始收敛为止;计算公式如下:
Figure FDA0003937281200000043
E为数据库中所有对象的均方差和;p为对象的空间中的一个点;μi为聚类xi的均值。
CN202211410012.2A 2022-11-10 2022-11-10 一种基于聚类算法划分乡村景观生态单元的方法 Pending CN115563493A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211410012.2A CN115563493A (zh) 2022-11-10 2022-11-10 一种基于聚类算法划分乡村景观生态单元的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211410012.2A CN115563493A (zh) 2022-11-10 2022-11-10 一种基于聚类算法划分乡村景观生态单元的方法

Publications (1)

Publication Number Publication Date
CN115563493A true CN115563493A (zh) 2023-01-03

Family

ID=84770537

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211410012.2A Pending CN115563493A (zh) 2022-11-10 2022-11-10 一种基于聚类算法划分乡村景观生态单元的方法

Country Status (1)

Country Link
CN (1) CN115563493A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115860695A (zh) * 2023-02-09 2023-03-28 广东智环创新环境科技有限公司 基于生态空间的环保信息化管理***
CN116484266A (zh) * 2023-05-18 2023-07-25 广东国地规划科技股份有限公司 一种精细城市用地类型识别模型训练方法
CN117079124A (zh) * 2023-07-14 2023-11-17 北京大学 一种基于社群差异化的城乡景观意象量化及提升方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115860695A (zh) * 2023-02-09 2023-03-28 广东智环创新环境科技有限公司 基于生态空间的环保信息化管理***
CN116484266A (zh) * 2023-05-18 2023-07-25 广东国地规划科技股份有限公司 一种精细城市用地类型识别模型训练方法
CN116484266B (zh) * 2023-05-18 2023-11-24 广东国地规划科技股份有限公司 一种精细城市用地类型识别模型训练方法
CN117079124A (zh) * 2023-07-14 2023-11-17 北京大学 一种基于社群差异化的城乡景观意象量化及提升方法
CN117079124B (zh) * 2023-07-14 2024-04-30 北京大学 一种基于社群差异化的城乡景观意象量化及提升方法

Similar Documents

Publication Publication Date Title
CN112966926B (zh) 一种基于集成学习的洪水敏感性风险评估方法
Schulz et al. Land use mapping using Sentinel-1 and Sentinel-2 time series in a heterogeneous landscape in Niger, Sahel
CN111666918B (zh) 一种基于多因素的海岸线变化识别方法
CN115563493A (zh) 一种基于聚类算法划分乡村景观生态单元的方法
Bai et al. Recent land degradation and improvement in China
CN111598045B (zh) 一种基于对象图谱和混合光谱的遥感耕地变化检测方法
CN113642849B (zh) 考虑空间分布特征的地质灾害危险性综合评价方法及装置
CN115965812B (zh) 无人机影像对湿地植被物种和地物分类的评估方法
CN117171533B (zh) 一种地理测绘作业数据实时采集处理方法及***
CN117036061B (zh) 一种智能农险的智能化解决方案提供方法及***
CN113570273A (zh) 一种灌溉耕地统计数据的空间化方法及***
Nelson et al. Spatial statistical techniques for aggregating point objects extracted from high spatial resolution remotely sensed imagery
Qu et al. Mapping large area tea plantations using progressive random forest and Google Earth Engine
CN114706900B (zh) 一种基于图像特征组合的降水相似预报方法
CN115719453A (zh) 一种基于深度学习的水稻种植结构遥感提取方法
CN115861629A (zh) 一种高分耕地影像提取方法
CN115457386A (zh) 一种村庄用地信息化生成方法
Serra et al. Thematic accuracy consequences in cadastre land-cover enrichment from a pixel and from a polygon perspective
CN113780459A (zh) 一种基于空间谱系的城乡聚落类型自动识别的方法与***
Bao et al. An automatic extraction method for individual tree crowns based on self-adaptive mutual information and tile computing
Furberg et al. Satellite monitoring of urbanization and environmental impacts in Stockholm, Sweden, through a multiscale approach
Suwanlee et al. Population Estimation Using Land-Use Change Data from Multi-Sensor Images in Maha Sarakham Province, Thailand
Adusei Land Cover Change in a Savanna Environment. A Case Study of Bawku Municipal
Ozdemir et al. Separation of citrus plantations from forest cover using Landsat imagery
CN117931793A (zh) 一种创建作物面积抽样统计模型集群的方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination