CN113159154B - 一种面向农作物分类的时间序列特征重建及动态识别方法 - Google Patents
一种面向农作物分类的时间序列特征重建及动态识别方法 Download PDFInfo
- Publication number
- CN113159154B CN113159154B CN202110399004.1A CN202110399004A CN113159154B CN 113159154 B CN113159154 B CN 113159154B CN 202110399004 A CN202110399004 A CN 202110399004A CN 113159154 B CN113159154 B CN 113159154B
- Authority
- CN
- China
- Prior art keywords
- classification
- missing
- filling
- data
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 230000006872 improvement Effects 0.000 claims abstract description 5
- 230000001373 regressive effect Effects 0.000 claims abstract description 4
- 238000012549 training Methods 0.000 claims description 14
- 238000012795 verification Methods 0.000 claims description 9
- 238000010200 validation analysis Methods 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 4
- 230000008859 change Effects 0.000 claims description 3
- 238000012217 deletion Methods 0.000 claims description 3
- 230000037430 deletion Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 claims description 2
- 238000012804 iterative process Methods 0.000 claims description 2
- 238000003306 harvesting Methods 0.000 description 10
- 241000209094 Oryza Species 0.000 description 6
- 235000007164 Oryza sativa Nutrition 0.000 description 6
- 235000009566 rice Nutrition 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 238000011835 investigation Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000000306 recurrent effect Effects 0.000 description 3
- 244000068988 Glycine max Species 0.000 description 2
- 235000010469 Glycine max Nutrition 0.000 description 2
- 235000010716 Vigna mungo Nutrition 0.000 description 2
- 240000001417 Vigna umbellata Species 0.000 description 2
- 235000011453 Vigna umbellata Nutrition 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 241000209140 Triticum Species 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000035558 fertility Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 230000015654 memory Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000002310 reflectometry Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Abstract
一种面向农作物分类的时间序列特征重建及动态识别方法,包括:步骤1:初始样本数据集构建;步骤2:缺失数据区域预测填充;步骤3:缺失数据区域取值范围取值填充;步骤4:回归器与分类器迭代;步骤5:动态分类;重复步骤2至步骤4,进行第r+1维特征回归器与分类器的构建,直到完成对所有R维特征的回归器与分类器的建立;实现数据缺失部分的重建和农作物分类,完成农作物的动态识别。本发明通过以LSTM网络模型作为框架,将用于缺失值填充的回归器和用于作物分类的分类器进行协同优化,实现对时序遥感数据缺失部分的填充,并根据动态增加的遥感数据对农作物进行分类,实现分类结果精度的逐步提高。
Description
技术领域
本发明属于图像处理模式分类领域,具体涉及一种面向农作物分类的时间序列特征重建及动态识别方法。
背景技术
及时地、准确地获取作物的空间分布信息是作物的长势监测、产量预估和灾害评估等工作的重要前提,对精准农业及其相关应用有重要意义。遥感技术具有覆盖面积广、重访周期短、数据获取相对容易、信息量大和费用低等优点,相比传统的实地调查方式,是一种高效的信息获取方法。因而,基于遥感数据的作物类型、种植面积和空间分布信息获取方法越来越多地应用于农业领域。由于时间序列(以下简称时序)遥感影像具有追踪作物生长信息演变的能力,使用基于时序遥感影像的方法进行作物分类成为获得高精度作物分布制图的有效手段(Roy D P,Yan L.Robust Landsat-based crop time series modelling[J].Remote Sensing of Environment,2018:110810)。
时序特征向量(如时序归一化植被指数(Normalized Difference VegetationIndex,NDVI))描述了土地覆被随时间的变化,不同时间维度的特征之间存在较强的相关性,即前后时相之间是相互关联的。但由于传统分类模型(例如深度卷积神经网络,支持向量机等)假定特征的各个维度之间是相互独立的,从而无法有效地描述时序特征表达的演变,造成分类结果精度较低。循环神经网络(Recurrent Neural Network,RNN)模型,通过在网络结构中引入环,使得隐藏层的值hi不仅取决于当前的输入值xi,还取决于上一输入获得的隐藏层值hi-1,该结构使得神经网络能够记住之前的网络状态,实现对顺序输入各维特征的时间相关性建模。
其中,长短期记忆网络(Long Short-Term Memory,LSTM)通过引入一种称为门(或者记忆细胞)特殊的隐层来记住前面的输入,是一种特殊的循环神经网络,该网络有效地解决了训练时存在梯度激增或消失的问题。目前,该网络已经应用基于时间序列影像的农作物分类,并取得了优于传统方法的精度(Zhou Ya’nan,Luo Jiancheng,Feng Li,YangYingpin,Chen Yuehong,Wu Wei(2019):Long-short-term-memory-based cropclassification using high-resolution optical images and multi-temporal SARdata[J],GIScience&Remote Sensing,56(8):1170-1191)。
然而,上述方法在农作物类型监测等应用中存在着方法和数据两个方面的问题:方法上,由于遥感技术按照一定的周期重访,是一种流式的、动态的获取数据。传统的分类方法要求同时处理所有数据,即所有的数据需要在分类之前一次性准备好;数据方面,由于遥感影像中云及其阴影的存在,直接获取到完整的、无缺失的作物时序信息是极其困难的。这使光学图像的特征取决于部分或全部缺少的数据,导致在不同维度上产生不一致的特征,阻碍了特征的精确对齐(D.Pouliot and R.Latifovic,“Reconstruction of Landsattime series in the presence of irregular and sparse observations:Developmentand assessment in north-eastern Alberta,Canada,”Remote Sens.Environ.,vol.204,no.July 2017,pp.979–996,2018.)。
因而,利用光学时间序列影像构建动态分类器,需要解决缺失区域重建和动态分类两个方面的问题。以LSTM为代表的RNN在多种应用中取得了良好的效果,但该类方法都是将循环神经网络作为一种特征提取工具和分类性能优异的分类器。对此,本发明以LSTM网络模型作为框架,将缺失值填充(称为回归器)和作物分类(称为分类器)进行协同优化,实现时序遥感数据缺失部分的填充,并根据动态获取的遥感数据对农作物进行分类,实现分类精度和分类结果的逐步提高。
发明内容
本发明要克服现有技术的上述缺点,提出一种面向农作物分类的时间序列特征重建及动态识别方法。
首先,本发明利用LSTM网络构建回归器模型,对缺失数据进行填充,完成时序特征重建;然后,基于LSTM网络构建分类器模型,对已经填充的数据进行分类,再根据对分类结果的评价对回归器和分类器进行协同优化;最后,随着时序作物数据的动态增加不断生成新的回归器与分类器,实现作物的动态分类。
根据以上原理,本发明的一种面向农作物分类的时间序列特征重建及动态识别方法,包括以下步骤:
步骤1:初始样本数据集构建;
假设研究区域已经采集了R景影像X(R),根据采集日期D进行排序得到:
X(R)=<X1,X2,...,XR> (1)
D(R)=<d1,d2,...,dR> (2)
其中,Xi∈X(R)表示构成时间序列的影像,di∈D表示对应影像的获取日期。
从遥感影像X(R)中获取的时序特征x(R)可以表示为:
x(R)=<x1,x2,...,xR> (3)
作物类型根据通过NDVI随时间的变化来区分。
待分类的n种作物K(n)可以表示为:
K(n)=<k1,k2,...,kn> (4)
通过实地数据采集或者图像解译获得带有标签的样本集S表示为:
S={s1,s2,...,sm}T (5)
其中,m为获得的样本个数,T为转置符号。样本集中的元素si∈S标记了作物类型,对应标签集表示为L。为了表示时间序列中可用的特征维数R,样本数据集和标签集分别表示为SR和LR。同时存在一个独立的验证数据集S'R,对应标签集表示为L'R。
由于云和云阴影的影响,样本集在部分维度上是缺失的。
步骤2:缺失数据区域预测填充;
利用基于LSTM网络构建的回归器模型对初始数据集SR和验证数据集S'R的缺失数据区域进行填充。
假设r(1<r≤R)表示待填充的特征维度,前r-1维特征的缺失区域已填充完毕,可以使用合适的方法进行填充。
将初始数据集在第r维特征上无数据缺失的部分表示为vr,对应的前r-1维部分数据表示为Vr-1;将初始数据集在第r维特征上数据缺失的部分表示为ur,对应的前r-1维部分数据表示为Ur-1。类似地,验证数据集的相应部分分别用v'r,V'r-1,u'r,U'r-1表示。
基于LSTM网络构建第r维特征的回归器模型Mreg(r)。为了表示迭代的过程,我们将其表示为上标0表示迭代次数。该模型训练时的输入为Vr-1,输出为vr。
将Ur-1输入得到预测结果ur,将ur填充进数据集的对应位置得到前r维特征无缺失数据集Sr(P),以及填充ur后得到原先在第r维特征上数据缺失的前r维部分数据Ur。用同样的方式得到验证数据集的前r维特征无缺失数据集Sr'(P)。
步骤3:缺失数据区域取值范围取值填充;
首先,利用Vr作为输入,Lr作为输出,训练分类器模型将步骤2中得到的Ur输入/>中进行分类,对比分类结果与对应的实际标签。将数据集Ur中的每一个样本的标签分别与该样本在前r-1维和前r维特征的分类结果进行对比,会产生以下4种情况:(1)“T-T”情况:在前r-1维和前r维特征上均分类正确(T),说明实际特征与预测填充特征均能正确分类;(2)“F-T”情况:前r-1维特征分类错误(F),但新增第r维特征后能正确分类(T),说明新的特征能够提供有价值的附加信息使分类结果正确;(3)“T-F”情况:前r-1维特征分类正确(T),但新增第r维特征后分类错误(F),说明新增特征中的附加信息错误的引导了模型的分类,需要对样本进行调整以达到正确的分类;(4)“F-F”情况:在前r-1维和前r维特征上均分类错误(F),说明现有的特征无法提供有价值的附加信息使模型能够正确的分类。
得到分类结果为第3种“T-F”情况的样本集Qr。前r-1维特征已经能够正确分类,但是新加入特征反而不能正确分类,主要是由于新加的特征加入了误导性信息,使得分类结果出现错误。因而,本发明在一定的取值范围进行取值,并填充缺失值,具体方法如下:
利用vr计算作物类型ki∈K在第r维特征上非缺失数据集的均值和标准差/>得到作物ki在第r维特征上数据集的合理取值范围F(ki):
其中,λ表示第r维特征中作物ki数据的λ倍标准差,取值为1或2,因为过大的λ会使F(ki)超出NDVI的合理数值范围。
之后,对Qr中的每一个样本q,从其对应标签ki的取值范围F(ki)中先以最小值填充q的第r维特征,之后每次以0.01的步长取值填充。每填充一个数值就利用对样本q进行分类,记录使用新的分类结果为“T-T”的分类概率及对应填充值,直到取值超出F(ki)的范围,最终获得样本q填充后分类结果为“T-T”情况的分类概率的集合{qp(z)},z为分类概率对应的填充值。取集合中的最大分类概率对应的填充值作为样本q在第r维上的最优填充值Zm:
Zm=argmax{qp(z)} (7)
在时间序列分类过程中,通过Softmax函数可以获得各个类别的概率,将各个类别最大的值作为估计结果。
Qr中所有样本采用取值范围取值填充方式填充了最优值后,得到一个新的无缺失数据集Sr(Q)。
步骤4:回归器与分类器迭代;
利用步骤3得到的Sr(Q)训练回归器,得到迭代了1次的回归器模型再利用预测验证数据集的第r维缺失部分u'r,得到前r维特征无缺失的验证数据集Sr'。
将Sr(Q)作为输入,Lr作为输出,训练分类器,得到迭代了1次的分类器模型将Sr'输入/>中进行分类,得到分类结果。
采用上述方法填充数据集样本中的缺失区域,可以提高相同类型作物样本的相似性,使回归器预测结果与实际类型数值逐渐接近,实现分类精度的提高。
步骤5:动态分类;
重复步骤2至步骤4,进行第r+1维特征回归器与分类器的构建,直到完成对所有R维特征的回归器与分类器的建立。实现数据缺失部分的重建和农作物分类,完成农作物的动态识别。
本发明采用上述方案的优点是:本发明通过以LSTM网络模型作为框架,将用于缺失值填充的回归器和用于作物分类的分类器进行协同优化,实现对时序遥感数据缺失部分的填充,并根据动态增加的遥感数据对农作物进行分类,实现分类结果精度的逐步提高。
附图说明
附图1是本发明方法的流程图。
附图2(a)~图2(b)是本发明的实施例的研究区域位置。图2(a)为寿县在安徽省的位置;图2(b)为寿县的哨兵2号卫星影像,该影像按照标准假彩色方式合成,即近红外、红、绿波段分别作为红、绿、蓝波段。
附图3是本发明的实施例采用的影像。图中标明了采用影像的日期,每幅子图种的百分比表示当前日期影像中缺失区域的百分比。
附图4(a)~图4(h)是本发明的实施例研究区域的局部分类结果。图4(a)为夏收作物在4月5日影像中的局部区域;图4(b)为夏收作物在5月20日影像中的局部区域;图4(c)夏收作物在6月4日影像中的局部区域;图4(e)为秋收作物在7月14日影像中的局部区域;图4(f)为秋收作物在9月22日影像中的局部区域;图4(g)为秋收作物在10月29日影像中的局部区域;图4(d)、(h)分别为本发明实施例的夏收作物与秋收作物的局部分类结果。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合实施例和附图1的发明流程对本发明作进一步的详细描述。应当理解,此处描述的具体实施例仅用于解释本发明,并不用于限定本发明,及所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。因而,基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
本实施例的研究区域为安徽省淮南市寿县(如图2(a)~图2(b)所示),本研究区域采用哨兵2号卫星2019年全年影像,共有145景。由于云和云阴影的影响,造成时序特征在部分维度上的缺失,本实施例仅保留能够为分类提供有效信息的26景影像(如图3所示),影像数目越多,越能够提高分类结果精度,可以根据需求及其数据获取情况进行选择。在本实施例中,分类以地块方式进行实施。地块数据是通过将中国高分2号卫星获得的0.8m全色数据和2m多光谱数据进行积分获得的。之后通过系列操作提取了200多万个地块。
本实施例对研究区域收集到的2019年全年的哨兵2号卫星影像,利用Sen2cor模型对其进行大气校正,获得Level-2A级表面反射率产品后,采用基于深度学习的云掩膜算法结合人工目视解译方式,获得研究区域的时序无云影像。根据研究区域内主要农作物的物候信息选取每期哨兵2号无云影像上的对应像元,提取像元在每景影像上的NDVI数据,构成基于时序影像的高维特征向量作为训练样本数据集。
本实施例将研究区域内的作物分为两大类别:夏季收获作物(以下简称夏收,作物生长周期为9、10月份至第二年的5月份)和秋季收获作物(以下简称秋收,作物生长周期为5月份至10、11月份)。夏收作物包括:小麦、油菜,为了保持土壤肥力,夏收作物还包含了较多的休耕地;秋收作物包括:中稻、晚稻、大豆。
本发明的一种面向农作物分类的时间序列特征重建及动态识别方法,针对传统模型无法有效地描述时序特征表达的演变过程以及传统分类方法无法实现对流式获取的遥感作物数据的动态分类的问题,结合附图说明本发明的具体实施方式,流程如下:
步骤1:初始样本数据集构建;
本实施例按照时间顺序将保留的26景影像进行排列,从中选取符合本实施例研究作物类型物候特征的像元集合,赋予其解译的作物类型标签。之后,计算像元集合内所有像元在每景影像上的NDVI,结合标签,构成时序NDVI数据集作为初始样本数据集。由于保留影像中依然有存在云和云阴影影响的影像,时序特征在部分维度上缺失,因此,获取的数据集含有缺失数据。本实施例提取样本数据集2000条,获取验证数据集1227条,验证数据集中夏收作物样本500条,秋收作物样本727条。
步骤2:缺失数据区域预测填充;
根据夏收作物与秋收作物的生命周期,将步骤1获得的数据集按照作物类型分为夏收作物样本数据集和秋收作物样本数据集。由于秋收作物生命周期从5月份开始,需要进行5月之前的时序特征的缺失数据区域填充,秋收作物特征包含了所有的26景日期。本实施例以对秋收作物的分类作说明,用r(1<r≤R)表示当前填充的特征维度,前r-1维特征的缺失区域已填充完毕,其中,第1维特征使用其他非学习方式填充,其他维度特征使用后续步骤进行填充。后续步骤以秋收作物数据集第14维特征(日期为7月24日)为例作说明,其中,训练数据集在该维特征上数据缺失的样本为342条,无缺失样本为1658条。验证数据集在该维特征上的数据缺失样本为101条,无缺失样本为626条。
利用LSTM网络构建第14维特征的回归器模型将第14维特征上无缺失的并含有前13维经过缺失填充的1658条无缺失样本数据集输入回归器/>进行训练。之后,将第14维特征上缺失的并含有前13维经过缺失填充的342条样本输入训练好的回归器中,预测这342条样本第14维特征上的数据,得到2000条前14维特征无缺失的训练数据集。以同样的方式预测秋收作物验证数据集上的101条缺失数据,得到727条前14维特征无缺失的验证数据集。
步骤3:缺失数据区域取值范围取值填充;
本步骤以秋收作物中稻为例。计算训练集1658条无缺失样本中类型为中稻的样本在第14维特征上的均值和标准差,取参数λ为2,获得中稻在该维度上的取值范围。
之后,使用这1658条无缺失样本训练分类器模型将步骤2中经过预测填充的342条样本输入分类器/>中,将得到的分类结果与实际标签对比,筛选出这342条中类型为中稻,且第13维特征上分类正确但第14维特征上分类错误(既分类结果情况为“T-F”)的样本作为待重新填充的样本集。
对待重新填充样本集中的每一个样本,先从中稻的取值范围中取最小值填充到该样本的第14维特征上,之后每次以0.01的步长取值填充。每填充一个数值,就将当前重新填充的样本输入进行分类,记录分类正确时(既“T-T”情况)的分类概率及当前的填充值,直到取值超出取值范围。
从记录的分类概率中选择最大概率对应的填充值作为当前样本第14维特征上的最优填充值。
分别以同样的方式填充样本类型为晚稻和大豆的待重新填充样本集。所有待重新填充的样本集获得最优填充值后,将得到一个新的前14维特征无缺失的2000条样本集。
步骤4:回归器与分类器迭代;
利用步骤3中得到的新的前14维特征无缺失的2000条样本集训练回归器模型,获得一个经过迭代的回归器模型将验证样本集中的101条缺失样本集输入回归器中进行预测填充,得到727条前14维特征无缺失的样本集。
以步骤3中得到的新的前14维特征无缺失的2000条样本集训练分类器模型,得到一个经过迭代的分类器模型在/>中输入经过/>预测填充的727条前14维特征无缺失的验证样本集,得到分类结果。
步骤5:动态分类;
重复步骤2至步骤4,进行第15维特征的回归器与分类器的构建,直到所有26维特征的回归器与分类器的建立完毕。实现数据缺失部分的重建和农作物分类,完成农作物的动态识别。
上述过程主要说明了本发明使用的方法的具体实施过程。
本实施例中包含夏收和秋收两大类作物,分别对这两大类作物执行上述步骤操作,得到夏收作物与秋收作物的分类器模型和回归器模型,利用这两种模型对研究区域进行分类预测,选取预测的部分区域,得到如图4(a)~图4(h)的分类结果,从中可以看出夏收作物与秋收作物的分类均较准确,说明了本发明方法的有效性。
本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护范围不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也给予本领域技术人员根据本发明构思所能够想到的等同技术手段。
Claims (3)
1.一种面向农作物分类的时间序列特征重建及动态识别方法,包括以下步骤:
步骤1:初始样本数据集构建;
假设研究区域已经采集了R景影像X(R),根据采集日期D进行排序得到:
X(R)=<X1,X2,...,XR〉 (1)
D(R)=<d1,d2,...,dR〉 (2)
其中,Xi∈X(R)表示构成时间序列的影像,di∈D表示对应影像的获取日期;
从遥感影像X(R)中获取的时序特征x(R)可以表示为:
x(R)=<x1,x2,...,xR> (3)
作物类型根据通过NDVI随时间的变化来区分;
待分类的n种作物K(n)可以表示为:
K(n)=<k1,k2,...,kn> (4)
通过实地数据采集或者图像解译获得带有标签的样本集S表示为:
S={s1,s2,...,sm}T (5)
其中,m为获得的样本个数,T为转置符号;样本集中的元素si∈S标记了作物类型,对应标签集表示为L;为了表示时间序列中可用的特征维数R,样本数据集和标签集分别表示为SR和LR;同时存在一个独立的验证数据集S′R,对应标签集表示为L′R;
由于云和云阴影的影响,样本集在部分维度上是缺失的;
步骤2:缺失数据区域预测填充;
利用基于LSTM网络构建的回归器模型对初始数据集SR和验证数据集S′R的缺失数据区域进行填充;
假设r(1<r≤R)表示待填充的特征维度,前r-1维特征的缺失区域已填充完毕,可以使用合适的方法进行填充;
将初始数据集在第r维特征上无数据缺失的部分表示为vr,对应的前r-1维部分数据表示为Vr-1;将初始数据集在第r维特征上数据缺失的部分表示为ur,对应的前r-1维部分数据表示为Ur-1;类似地,验证数据集的相应部分分别用v′r,V′r-1,u′r,U′r-1表示;
基于LSTM网络构建第r维特征的回归器模型Mreg(r);为了表示迭代的过程,将其表示为上标0表示迭代次数;该模型训练时的输入为Vr-1,输出为vr;
将Ur-1输入得到预测结果ur,将ur填充进数据集的对应位置得到前r维特征无缺失数据集Sr(P),以及填充ur后得到原先在第r维特征上数据缺失的前r维部分数据Ur;用同样的方式得到验证数据集的前r维特征无缺失数据集S′r(P);
步骤3:缺失数据区域取值范围取值填充;
首先,利用Vr作为输入,Lr作为输出,训练分类器模型将步骤2中得到的Ur输入中进行分类,对比分类结果与对应的实际标签;将数据集Ur中的每一个样本的标签分别与该样本在前r-1维和前r维特征的分类结果进行对比,会产生以下4种情况:(1)“T-T”情况:在前r-1维和前r维特征上均分类正确(T),说明实际特征与预测填充特征均能正确分类;(2)“F-T”情况:前r-1维特征分类错误(F),但新增第r维特征后能正确分类(T),说明新的特征能够提供有价值的附加信息使分类结果正确;(3)“T-F”情况:前r-1维特征分类正确(T),但新增第r维特征后分类错误(F),说明新增特征中的附加信息错误的引导了模型的分类,需要对样本进行调整以达到正确的分类;(4)“F-F”情况:在前r-1维和前r维特征上均分类错误(F),说明现有的特征无法提供有价值的附加信息使模型能够正确的分类;
得到分类结果为第3种“T-F”情况的样本集Qr;前r-1维特征已经能够正确分类,但是新加入特征反而不能正确分类,主要是由于新加的特征加入了误导性信息,使得分类结果出现错误;因而,在设定的取值范围进行取值,并填充缺失值,具体方法如下:
利用vr计算作物类型ki∈K在第r维特征上非缺失数据集的均值和标准差/>得到作物ki在第r维特征上数据集的合理取值范围F(ki):
其中,λ表示第r维特征中作物ki数据的λ倍标准差;
之后,对Qr中的每一个样本q,从其对应标签ki的取值范围F(ki)中先以最小值填充q的第r维特征,之后每次以设定的步长取值填充;每填充一个数值就利用/>对样本q进行分类,记录使用新的分类结果为“T-T”的分类概率及对应填充值,直到取值超出F(ki)的范围,最终获得样本q填充后分类结果为“T-T”情况的分类概率的集合{qp(z)},z为分类概率对应的填充值;取集合中的最大分类概率对应的填充值作为样本q在第r维上的最优填充值Zm:
Zm=argmax{qp(z)} (7)
在时间序列分类过程中,通过Softmax函数可以获得各个类别的概率,将各个类别最大的值作为估计结果;
Qr中所有样本采用取值范围取值填充方式填充了最优值后,得到一个新的无缺失数据集Sr(Q);
步骤4:回归器与分类器迭代;
利用步骤3得到的Sr(Q)训练回归器,得到迭代了1次的回归器模型再利用预测验证数据集的第r维缺失部分u′r,得到前r维特征无缺失的验证数据集S′r;
将Sr(Q)作为输入,Lr作为输出,训练分类器,得到迭代了1次的分类器模型将S′r输入/>中进行分类,得到分类结果;
采用上述方法填充数据集样本中的缺失区域,可以提高相同类型作物样本的相似性,使回归器预测结果与实际类型数值逐渐接近,实现分类精度的提高;
步骤5:动态分类;
重复步骤2至步骤4,进行第r+1维特征回归器与分类器的构建,直到完成对所有R维特征的回归器与分类器的建立;实现数据缺失部分的重建和农作物分类,完成农作物的动态识别。
2.如权利要求1所述的一种面向农作物分类的时间序列特征重建及动态识别方法,其特征在于:λ取值为1或2。
3.如权利要求1所述的一种面向农作物分类的时间序列特征重建及动态识别方法,其特征在于:对Qr中的每一个样本q,每次填充的设定的步长取值是0.01。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110399004.1A CN113159154B (zh) | 2021-04-12 | 2021-04-12 | 一种面向农作物分类的时间序列特征重建及动态识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110399004.1A CN113159154B (zh) | 2021-04-12 | 2021-04-12 | 一种面向农作物分类的时间序列特征重建及动态识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113159154A CN113159154A (zh) | 2021-07-23 |
CN113159154B true CN113159154B (zh) | 2024-03-29 |
Family
ID=76890639
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110399004.1A Active CN113159154B (zh) | 2021-04-12 | 2021-04-12 | 一种面向农作物分类的时间序列特征重建及动态识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113159154B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116610662B (zh) * | 2023-07-17 | 2023-10-03 | 金锐同创(北京)科技股份有限公司 | 缺失分类数据的填充方法、装置、计算机设备及介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110119717A (zh) * | 2019-05-15 | 2019-08-13 | 中国科学院遥感与数字地球研究所 | 一种基于时序ndvi与lst的农作物分类方法 |
CN110287869A (zh) * | 2019-06-25 | 2019-09-27 | 吉林大学 | 基于深度学习的高分辨率遥感影像农作物分类方法 |
CN111523525A (zh) * | 2020-07-02 | 2020-08-11 | 航天宏图信息技术股份有限公司 | 农作物分类识别方法、装置和电子设备 |
CN111598019A (zh) * | 2020-05-19 | 2020-08-28 | 华中农业大学 | 基于多源遥感数据的作物类型与种植模式识别方法 |
CN111798132A (zh) * | 2020-07-06 | 2020-10-20 | 北京师范大学 | 基于多源时序遥感深度协同下的耕地动态监测方法及*** |
-
2021
- 2021-04-12 CN CN202110399004.1A patent/CN113159154B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110119717A (zh) * | 2019-05-15 | 2019-08-13 | 中国科学院遥感与数字地球研究所 | 一种基于时序ndvi与lst的农作物分类方法 |
CN110287869A (zh) * | 2019-06-25 | 2019-09-27 | 吉林大学 | 基于深度学习的高分辨率遥感影像农作物分类方法 |
CN111598019A (zh) * | 2020-05-19 | 2020-08-28 | 华中农业大学 | 基于多源遥感数据的作物类型与种植模式识别方法 |
CN111523525A (zh) * | 2020-07-02 | 2020-08-11 | 航天宏图信息技术股份有限公司 | 农作物分类识别方法、装置和电子设备 |
CN111798132A (zh) * | 2020-07-06 | 2020-10-20 | 北京师范大学 | 基于多源时序遥感深度协同下的耕地动态监测方法及*** |
Non-Patent Citations (1)
Title |
---|
应用Sentinel-2A NDVI时间序列和面向对象决策树方法的农作物分类;杜保佳;张晶;王宗明;毛德华;张淼;吴炳方;;地球信息科学学报;20190605(05);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113159154A (zh) | 2021-07-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110321963B (zh) | 基于融合多尺度多维空谱特征的高光谱图像分类方法 | |
CN103679675B (zh) | 一种面向水质定量遥感应用的遥感影像融合方法 | |
HAO et al. | Early-season crop type mapping using 30-m reference time series | |
CN111639587B (zh) | 基于多尺度谱空卷积神经网络的高光谱图像分类方法 | |
CN103971115A (zh) | 一种基于NDVI和PanTex指数的高分辨率遥感影像新增建设用地图斑自动提取方法 | |
Wang et al. | Using GF-2 imagery and the conditional random field model for urban forest cover mapping | |
Yang et al. | Semantic segmentation based on temporal features: Learning of temporal–spatial information from time-series SAR images for paddy rice mapping | |
CN112115967B (zh) | 一种基于数据保护的图像增量学习方法 | |
Xun et al. | Mapping cotton cultivated area combining remote sensing with a fused representation-based classification algorithm | |
CN113936214B (zh) | 一种基于融合空天遥感影像的岩溶湿地植被群落分类方法 | |
CN113609889A (zh) | 基于敏感特征聚焦感知的高分辨遥感影像植被提取方法 | |
CN105608478A (zh) | 一种图像的特征提取与分类联合方法及*** | |
Qian et al. | Mapping regional cropping patterns by using GF-1 WFV sensor data | |
CN113837134A (zh) | 一种基于面向对象的深度学习模型和迁移学习的湿地植被识别方法 | |
Li et al. | Combination of supervised learning and unsupervised learning based on object association for land cover classification | |
CN113159154B (zh) | 一种面向农作物分类的时间序列特征重建及动态识别方法 | |
CA3225437A1 (en) | Systems and methods for categorizing image pixels | |
Mirpulatov et al. | Pseudo-labeling approach for land cover classification through remote sensing observations with noisy labels | |
Chen et al. | A superpixel-guided unsupervised fast semantic segmentation method of remote sensing images | |
CN116863341B (zh) | 基于时间序列卫星遥感影像的作物分类和识别方法和*** | |
CN112464172A (zh) | 生长参数主被动遥感反演方法及装置 | |
Baidar | Rice crop classification and yield estimation using multi-temporal sentinel-2 data: a case study of terai districts of Nepal | |
Zhao et al. | Improving object-oriented land use/cover classification from high resolution imagery by spectral similarity-based post-classification | |
CN116630610A (zh) | 基于语义分割模型和条件随机场的roi区域提取方法 | |
CN113420798A (zh) | 基于孪生光谱注意力一致性的高光谱图像分类 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |