CN112906648A - 一种地块中对象的分类方法、装置及电子设备 - Google Patents
一种地块中对象的分类方法、装置及电子设备 Download PDFInfo
- Publication number
- CN112906648A CN112906648A CN202110314424.5A CN202110314424A CN112906648A CN 112906648 A CN112906648 A CN 112906648A CN 202110314424 A CN202110314424 A CN 202110314424A CN 112906648 A CN112906648 A CN 112906648A
- Authority
- CN
- China
- Prior art keywords
- image
- sub
- block
- classification
- parcel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 84
- 238000005070 sampling Methods 0.000 claims abstract description 66
- 238000005520 cutting process Methods 0.000 claims abstract description 38
- 238000002372 labelling Methods 0.000 claims abstract description 22
- 238000004590 computer program Methods 0.000 claims abstract description 12
- 238000003860 storage Methods 0.000 claims abstract description 12
- 238000013145 classification model Methods 0.000 claims description 131
- 238000012549 training Methods 0.000 claims description 100
- 238000012545 processing Methods 0.000 claims description 36
- 230000015654 memory Effects 0.000 claims description 25
- 239000013598 vector Substances 0.000 claims description 16
- 238000013507 mapping Methods 0.000 claims description 7
- 238000000605 extraction Methods 0.000 description 16
- 241000209094 Oryza Species 0.000 description 15
- 235000007164 Oryza sativa Nutrition 0.000 description 15
- 235000009566 rice Nutrition 0.000 description 15
- 240000008042 Zea mays Species 0.000 description 14
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 14
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 14
- 235000005822 corn Nutrition 0.000 description 14
- 238000010586 diagram Methods 0.000 description 14
- 241000196324 Embryophyta Species 0.000 description 11
- 230000008569 process Effects 0.000 description 9
- 229920000742 Cotton Polymers 0.000 description 8
- 241000219146 Gossypium Species 0.000 description 8
- 238000012360 testing method Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 5
- 238000013135 deep learning Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000013467 fragmentation Methods 0.000 description 4
- 238000006062 fragmentation reaction Methods 0.000 description 4
- 238000003062 neural network model Methods 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 4
- 239000003086 colorant Substances 0.000 description 3
- 238000004040 coloring Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000011176 pooling Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 230000003628 erosive effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/13—Satellite images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Astronomy & Astrophysics (AREA)
- Remote Sensing (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本申请提供了一种地块中对象的分类方法、装置、电子设备、计算机可读存储介质及计算机程序产品;方法包括:获取地域图像;根据预标注信息确定所述地域图像中的感兴趣区域,从所述地域图像中裁剪出所述感兴趣区域的图像,以作为所述地块的图像;基于所述地块中的多个采样点,通过预设尺寸切割所述地块的图像,得到多个子块图像;基于各所述子块图像的图像特征获取相应的所述子块图像内对象的分类结果,并基于各所述子块图像内对象的分类结果,确定所述地块覆盖的对象类别。通过本申请,能够准确、快速的进行地块中对象的分类,得到地块覆盖的对象类别。
Description
技术领域
本申请涉及图像处理技术,尤其涉及一种地块中对象的分类方法、装置、电子设备、计算机可读存储介质及计算机程序产品。
背景技术
基于卫星遥感或无人机航拍技术拍摄地面图像,并进行图像处理分析,是地块研究方面的重点研究方向之一。
图像分类处理,是根据各自在图像信息中所反映的不同特征,把不同类别的目标区分开来的图像处理方法,是利用计算机对图像进行定量分析,把图像或图像中的每个像元或区域划归为若干个类别中的某一种,以代替人的视觉判读。
对于地块中对象的分类处理,已有技术提供的方式主要是像素级、基于规则或机器学习的方法,特征提取方法传统低效,精度不高,深度学习方法用于遥感图像中对象的分类时需要大量的人工数据标记,成本高昂,并且需要进行全图扫描采样并分类预测,准确率不高。
发明内容
本申请实施例提供一种地块中对象的分类方法、装置、电子设备、计算机可读存储介质及计算机程序产品,能够准确、快速的进行地块中对象的分类,得到地块覆盖的对象类别。
本申请实施例的技术方案是这样实现的:
本申请实施例提供一种地块中对象的分类方法,所述方法包括:
获取地域图像;
根据预标注信息确定所述地域图像中的感兴趣区域,从所述地域图像中裁剪出所述感兴趣区域的图像,以作为所述地块的图像;
基于所述地块中的多个采样点,通过预设尺寸切割所述地块的图像,得到多个子块图像;
基于各所述子块图像的图像特征获取相应的所述子块图像内对象的分类结果,并基于各所述子块图像内对象的分类结果,确定所述地块覆盖的对象类别。
本申请实施例提供一种地块中对象的分类装置,包括:
图像获取模块,用于获取地域图像;
图像裁剪模块,用于根据预标注信息确定所述地域图像中的感兴趣区域,从所述地域图像中裁剪出所述感兴趣区域的图像,以作为所述地块的图像;
图像切割模块,用于基于所述地块中的多个采样点,通过预设尺寸切割所述地块的图像,得到多个子块图像;
地块类别确定模块,用于基于各所述子块图像的图像特征获取相应的所述子块图像内对象的分类结果,并基于各所述子块图像内对象的分类结果,确定所述地块覆盖的对象类别。
在上述方案中,所述地块中对象的分类装置,还包括:信息获取模块,用于响应于标注操作,获取人工标注的预标注信息;或者获取基于历史矢量标注的预标注信息。
在上述方案中,所述图像切割模块,还用于针对每个地块执行以下处理:在所述地块中随机获取多个取样点;基于所述多个取样点,分别以预设尺寸切割所述地块的图像,得到与所述地块对应的多个子块图像;其中,所述预设尺寸为以所述取样点为中心的规则几何图形。
在上述方案中,地块类别确定模块,还用于针对所述每个子块图像执行以下处理:将从所述子块图像提取的图像特征映射为对应多个候选的对象类别的概率;将超出概率阈值的概率对应的对象类别,作为所述子块图像的分类结果。
在上述方案中,地块类别确定模块,还用于当至少两个候选的对象类别对应的概率超过概率阈值时,将所述至少两个超出概率阈值的概率对应的对象类别,作为所述子块图像的分类结果,或者,将最大概率对应的对象类别,作为所述子块图像的分类结果。
在上述方案中,所述基于各所述子块图像的图像特征获取相应的所述子块图像内对象的分类结果是通过至少一个分类模型实现的;地块类别确定模块,还用于通过同一个分类模型执行以下处理:基于从各所述子块图像提取的图像特征,分别对相应的所述子块图像内的对象进行分类处理,得到所述子块图像内对象的分类结果;或者,通过多个分类模型执行以下处理:基于各所述子块图像的图像特征,一对一地对所述子块图像内的对象进行分类处理,得到各所述子块图像内对象的分类结果。
在上述方案中,地块类别确定模块,还用于确定统计各所述子块图像中属于相同对象类别的子块图像的数量;将数量最多的子块图像对应的对象类别,确定为所述地块覆盖的对象类别。
在上述方案中,所述基于各所述子块图像的图像特征获取相应的所述子块图像内对象的分类结果是通过至少一个分类模型实现的,所述地块中对象的分类装置,还包括:分类模型训练模块,用于通过以下方式训练所述分类模型:初始化分类模型的模型参数;通过所述分类模型对训练样本集合中的子块图像样本进行类别预测,得到所述子块图像样本的预测对象类别;确定所述子块图像样本的预标注对象类别与所述预测对象类别的误差,基于所述误差在所述分类模型中进行反向传播,以更新所述分类模型的模型参数。
在上述方案中,当所述基于各所述子块图像的图像特征获取相应的所述子块图像内对象的分类结果是通过多个分类模型实现时,所述分类模型训练模块,还用于从所述训练样本集合中抽取训练样本子集,其中,每个分类模型的训练样本子集不同或不完全相同。
在上述方案中,所述分类模型训练模块,还用于基于多个预标注坐标点,在地域图像样本中确定每个预标注坐标点所在的地块;通过预设尺寸从所述地域图像样本中切割出所述每个预标注坐标点所在的地块的图像,得到多个子块图像样本;基于所述多个子块图像样本以及对应的标注对象类别,构建所述训练样本集合。
本申请实施例提供一种电子设备,包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令时,实现本申请实施例提供的地块中对象的分类方法。
本申请实施例提供一种计算机可读存储介质,存储有可执行指令,用于被处理器执行时,实现本申请实施例提供的地块中对象的分类方法。
本申请实施例提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现本申请实施例提供的地块中对象的分类方法。
本申请实施例具有以下有益效果:
基于地块图像以预设尺寸进行切割处理,得到与地块对应的多个有效的子块图像样本,提高样本的精度,根据对多个子块图像进行类别预测得到多个相应的分类结果,兼顾多个预测的分类结果确定地块覆盖的对象类别,提高了地块识别的准确率,相较于图像逐像素分割并分类的处理方式降低了处理难度,提升了识别精度。
附图说明
图1是本申请实施例提供的地块中对象的分类***的一个可选的结构示意图;
图2是本申请实施例提供的电子设备的一个可选的结构示意图;
图3A是本申请实施例提供的地块中对象的分类方法的一个可选的流程示意图;
图3B是本申请实施例提供的地块中对象的分类方法的一个可选的流程示意图;
图4是本申请实施例提供的分类模型的训练方法的一个可选的流程示意图;
图5是本申请实施例提供的分类模型的训练方法的一个可选的流程示意图;
图6A是本申请实施例提供的地域图像一个可选的示意图;
图6B是本申请实施例提供的切割后的地块图像的一个可选的示意图;
图7是本申请实施例提供的采样窗口的一个可选的示意图;
图8A是本申请实施例提供的基于一个分类模型进行分类处理的可选的示意图;
图8B是本申请实施例提供的基于多个分类模型进行分类处理的可选的示意图;
图9是本申请实施例提供的分类模型的训练方法的流程示意图;
图10是本申请实施例提供的地块中对象的分类方法的流程示意图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
如果申请文件中出现“第一/第二”的类似描述则增加以下的说明,在以下的描述中,所涉及的术语“第一\第二\第三”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
目前的遥感农作物识别模型受限于充足的训练样本,不易直接的进行语义分割,特征提取简单而精度低;而利用深度学习模型进行地块中对象的识别时,受限于真实的数据需要人工实地获取,定点任意,成本高,没有充足的数据量,并且直接开窗获取的训练样本图像碎片化严重,识别的准确率低。
基于此,本申请实施例提供地块中对象的分类方法、装置、电子设备、计算机可读存储介质及计算机程序产品,能够提升地块识别、地块中对象分类的精度和准确率。
首先对本申请实施例提供的地块中对象的分类***进行说明,参见图1,图1是本申请实施例提供的地块中对象的分类***100的一个可选的架构示意图,终端400通过网络300连接服务器200,网络300可以是广域网或者局域网,又或者是二者的组合,使用无线链路实现数据传输。在一些实施例中,终端400可以是笔记本电脑、平板电脑、台式计算机智能手机、专用消息设备、便携式游戏设备、智能音箱、智能手表等,但并不局限于此。服务器200可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式***,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。网络300可以是广域网或者局域网,又或者是二者的组合。终端400以及服务器200可以通过有线或无线通信方式进行直接或间接地连接,本申请实施例中不做限制。
终端400,用于获取地域遥感图像,并将地域遥感图像发送至服务器200。
服务器200,用于接收地域遥感图像,根据预标注信息确定所述地域图像中的感兴趣区域,从所述地域图像中裁剪出所述感兴趣区域的图像,以作为所述地块的图像;基于所述地块中的多个采样点,通过预设尺寸切割所述地块的图像,得到多个子块图像;基于各所述子块图像的图像特征获取相应的所述子块图像内对象的分类结果,并基于各所述子块图像内对象的分类结果,确定所述地块覆盖的对象类别,并得到遥感图像的地块分类图,将地块分类图返回至终端400。
在其他示例中,终端400可以获取地域遥感图像,并基于地域遥感图像实施本申请提供的地块中对象的分类方法,得到遥感图像的地块分类图,并通过在终端界面显示地块分类图。
参见图2,图2是本申请实施例提供的电子设备500的一个可选的结构示意图,在实际应用中,电子设备500可以实施为图1中的终端400或服务器200,以电子设备为图1所示的服务器200为例,对实施本申请实施例的地块中对象的分类方法的电子设备进行说明。图2所示的电子设备500包括:至少一个处理器510、存储器550、至少一个网络接口520和用户接口530。电子设备500中的各个组件通过总线***540耦合在一起。可以理解,总线***540用于实现这些组件之间的连接通信。总线***540除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图2中将各种总线都标为总线***540。
处理器510可以是集成电路芯片,具有信号的处理能力,例如通用处理器、数字信号处理器(DSP,Digital Signal Processor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其中,通用处理器可以是微处理器或者任何常规的处理器等。
存储器550可以是可移除的,不可移除的或其组合。示例性的硬件设备包括固态存储器,硬盘驱动器,光盘驱动器等。存储器550包括在物理位置上远离处理器510的一个或多个存储设备。
存储器550包括易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。非易失性存储器可以是只读存储器(ROM,Read Only Memory),易失性存储器可以是随机存取存储器(RAM,Random Access Memory)。本申请实施例描述的存储器550旨在包括任意适合类别的存储器。
在一些实施例中,存储器550能够存储数据以支持各种操作,这些数据的示例包括程序、模块和数据结构或者其子集或超集,下面示例性说明。
操作***551,包括用于处理各种基本***服务和执行硬件相关任务的***程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务;
网络通信模块552,用于经由一个或多个(有线或无线)网络接口520到达其他计算设备,示例性的网络接口520包括:蓝牙、无线相容性认证(WiFi)、和通用串行总线(USB,Universal Serial Bus)等;
在一些实施例中,本申请实施例提供的地块中对象的分类装置可以采用软件方式实现,图2示出了存储在存储器550中的地块中对象的分类装置555,其可以是程序和插件等形式的软件,包括以下软件模块:图像获取模块5551、图像裁剪模块5552、图像切割模块5553、地块类别确定模块5554,这些模块是逻辑上的,因此根据所实现的功能可以进行任意的组合或进一步拆分。将在下文中说明各个模块的功能。
在另一些实施例中,本申请实施例提供的地块中对象的分类装置可以采用硬件方式实现,作为示例,本申请实施例提供的地块中对象的分类装置可以是采用硬件译码处理器形式的处理器,其被编程以执行本申请实施例提供的地块中对象的分类方法,例如,硬件译码处理器形式的处理器可以采用一个或多个应用专用集成电路(ASIC,ApplicationSpecific Integrated Circuit)、DSP、可编程逻辑器件(PLD,Programmable LogicDevice)、复杂可编程逻辑器件(CPLD,Complex Programmable Logic Device)、现场可编程门阵列(FPGA,Field-Programmable Gate Array)或其他电子元件。
基于上述对本申请实施例的地块中对象的分类***和电子设备的说明,接下来对本申请实施例提供的地块中对象的分类方法进行说明。在一些实施例中,本申请实施例提供的地块中对象的分类方法可以由服务器单独实施,或由服务器及终端协同实施。
将结合本申请实施例提供的地块识别***的示例性应用和实施,说明本申请实施例提供的地块中对象的分类方法。
参见图3A,图3A是本申请实施例提供的地块中对象的分类方法的一个可选的流程示意图,将结合图3A示出的步骤进行说明。图3A示出的步骤可以由服务器(例如图1示出的服务器200)执行,下文不再重复说明。
在步骤101中,获取地域图像。
这里,地域图像可以是采用任意方式采集的,例如卫星遥感、无人机航拍。在一些实施例中,地域遥感图像可以面向县级、市级、省级甚至全国的农业区域,通过无人机定点航拍、卫星拍摄等方式等渠道进行采集。
在步骤102中,根据预标注信息确定所述地域图像中的感兴趣区域,从所述地域图像中裁剪出所述感兴趣区域的图像,以作为所述地块的图像。
在一些实施例中,步骤102之前,还可以执行:响应于标注操作,获取人工标注的预标注信息;或者获取基于历史矢量标注的预标注信息。这里,预标注信息为针对地域图像所标注的地块切割信息。矢量标注可以为对遥感图像基于点、线和面等绘制的矢量数据的标注信息,历史矢量标注是遥感图像中历史的标注信息。
在一些实施例中,参见图6A,图6A是本申请实施例提供的地域图像一个可选的示意图。在实际实施时,通过制作人工标注和微调地块的历史矢量标注的地块切割信息,确定感兴趣区域,并在遥感图像中对感兴趣区域的地块进行地块切割。
例如,人工标注可以使用开源的标注软件制作地块边缘分割标签,如labelme、ArcGIS等标注软件,利用上述标签对遥感图像进行分割处理,得到包括至少一个地块的遥感图像。这里,为了区分挨得很近的不同地块,进行人工标注时故意对边界留白,或者对标注的每一块地块做形态学腐蚀操作。
需要说明的是,遥感图像中包括感兴趣区域和一些其他区域。示例性地,感兴趣区域可以是种植植物、农作物的植物区域,非感兴趣区域可以包括少量的目的地办事区域、道路区域以及建筑区域等其他区域。其中,地块图像内的对象则可以为地块内所种植的植物及农作物等。
参见图6B,图6B是本申请实施例提供的地块切割后的地块图像的一个可选的示意图,其中,白色区域62为感兴趣的区域(也就是需要进行类别识别的区域),黑色区域61为其他区域。
在一些实施例中,将图6B示出的切割后的图像与图6A示出的地域图像进行掩膜处理,得到对应的地块的图像。
在实际实施时,面向一些县城、乡镇的地域图像采集和分类处理,由于地块在长时间内基本不会发生变化或地块级迁移,还可以通过历史矢量标注执行地块分割处理,历史矢量标注可以定时更新,微调后重新加载使用。
上述通过人工标注或历史矢量标注切割地块的方式,快速地分割出多个地块,以便于针对每个地块进行识别和分类,降低对地域图像进行逐像素识别的复杂度,减少随机取样的带来的图像过度碎片化、分布不集中的问题,提升地块分类的精度。
在步骤103中,基于所述地块中的多个采样点,通过预设尺寸切割所述地块的图像,得到多个子块图像。
在一些实施例中,步骤103可以通过以下方式实现:针对每个地块执行以下处理:在地块中随机获取多个取样点;基于多个取样点,分别以预设尺寸切割地块的图像,得到与地块对应的多个子块图像;其中,预设尺寸为以取样点为中心的规则几何图形。
在一些实施例中,可以通过预设规则确定随机点的数量;例如,确定随机点的个数为地块图像总像素的万分之五,若图像此时的尺寸为100×100,那么可以确定随机点的数量为5个。
在实际实施时,以预设尺寸构建采样窗口,由于地块一般成块状、方体,如果采样窗口过大,会引入其他类别信息或噪声,造成识别精度的下降;如果采样窗口过小,则不能包含充分的如地块边界等信息,因此,采样窗口尺寸的设置通常是在真实的地域遥感图像数据上经过大量的实验测评确定,一般来说,选择尽可能包裹地块的预设尺寸。例如,可以通过对遥感图像进行区域像素聚类处理取众数得到预设尺寸,也可以根据遥感图像的空间分辨率等图像参数设置,本申请实施例对此不加限定。
示例性的,参见图7,图7是本申请实施例提供的采样窗口的一个可选的示意图。针对每个地块中的取样点,生成一个固定尺寸的采样窗口,以固定尺寸(即预设尺寸)切割地块图像,得到与之对应的子块图像。其中,预设尺寸一般为以取样点为中心的规则几何图形,例如,规则几何图形可以为圆形、矩形、正方形等。
这里,固定尺寸可以用参数size表示,例如,固定尺寸size可以为圆形的半径值、矩形的长宽值或正方形的边长值等。参见图7,图7示出的采样窗口71是以取样点为中心,左上偏移size/2,右下偏移size/2构建的正方形采样窗口71,基于随机获取的每个取样点,分别利用预设尺寸的采样窗口71对地块图像进行切割,得到尺寸与采样窗口尺寸一致的多个子块图像。
在另一些实施例中,步骤103还可以通过以下方式实现:在每个地块中,通过几何图像处理方法获取每个地块的中心点,以上述中心点为中心,分别以预设尺寸切割地块的图像,得到与地块对应的多个子块图像。
例如,以取样点为中心,以预设尺寸为采样窗口大小,从不同方向上切割地块的图像,得到与地块对应的多个子块图像。
上述通过根据预设尺寸切割图像的方式,能够适应地块级图像的采样处理,相较于全图随机采样和预测,提升了图像识别的精度。
在步骤104中,基于各所述子块图像的图像特征获取相应的所述子块图像内对象的分类结果。
在一些实施例中,步骤104的方法可以通过至少一个分类模型实现,这里,分类模型可以为包括多个卷积层、池化层以及输出层的深度神经网络模型,例如,分类模型可以为残差网络模型ResNet、稠密连接网络模型DenseNet等。
在一些实施例中,参见图8A,图8A是本申请实施例提供的基于一个分类模型进行分类处理的可选的示意图。步骤104的方法可以通过同一个分类模型执行以下处理:基于从各所述子块图像提取的图像特征,分别对相应的所述子块图像内的对象进行分类处理,得到所述子块图像内对象的分类结果。
在实际实施时,利用同一个分类模型分别对子块图像1、子块图像2至子块图像n进行特征提取处理,基于从每个子块图像提取的图像特征对每个子块图像进行分类处理,分别得到子块图像1的分类结果、子块图像2的分类结果至子块图像n的分类结果。
在另一些实施例中,参见图8B,图8B是本申请实施例提供的基于多个分类模型进行分类处理的可选的示意图,每个分类模型可以是图8A示出的分类模型的结构。其中,每个分类模型对应一个子块图像。步骤103的方法可以通过多个分类模型执行以下处理:基于各所述子块图像的图像特征,一对一地对所述子块图像内的对象进行分类处理,得到各所述子块图像内对象的分类结果。
在实际实施时,利用分类模型1对子块图像1进行特征提取处理,基于从子块图像1提取的图像特征,对子块图像1进行分类处理,得到子块图像1的分类结果;利用分类模型2对子块图像2进行特征提取处理,基于从子块图像2提取的图像特征,对子块图像2进行分类处理,得到子块图像2的分类结果;依次利用n个分类模型分别对n个图像子块进行分类处理,得到相应的n个分类结果。
这里,多个分类模型是通过多个训练样本子集训练得到,其中,每个分类模型的训练样本子集不同或不完全相同。
通过多个分类模型一对一地对每个子块图像分别进行分类处理得到对应的预测类别,能够避免通过一个分类模型对子块图像识别的偏差导致的错误识别,保证了地块识别的稳定性。
参见图3B,图3B为本申请实施例提供的地块中对象的分类方法的流程示意图,步骤104中的方法可以通过步骤1041-1043实现,下面结合图3B示出的步骤1041-1043进行说明。
在步骤1041中,对每个子块图像进行特征提取,得到对应每个子块图像的图像特征。
在对子块图像进行特征提取之前,对子块图像进行辐射校正、几何矫正、滤波处理等操作,得到预处理后的子块图像。将预处理后的子块图像输入分类模型的卷积层进行特征提取,得到多个特征图,将对应的特征图输入池化层进行下采样处理,保留较强的图像特征,经过多次卷积和池化处理后得到子块图像对应的图像特征。
需要说明的是,图像特征用于指示图像子块的对象类别,子块图像的分类可以是二分类或者多分类,对于二分类,候选的对象类别的数目为两个,对于多分类,候选的对象类别的数目为多个。
在步骤1042中,将从每个子块图像提取的图像特征映射为对应多个候选的对象类别的概率;
在一些实施例中,通过分类模型的输出层对子块图像进行类别预测,这里,输出层可以是softmax层。本申请实施例提供的输出层具备多个softmax映射函数,将子块图像中提取的图像特征进行映射和归一化处理,得到对应多个候选对象类别的概率。
示例性的,子块图像的对象类别表征当前图像中包含的对象的类别。当对象为植物时,候选的对象类别可以为玉米、水稻、棉花,根据图像特征,对子块图像进行类别预测,将图像特征映射为属于玉米类别的第一概率值、属于水稻类别的第二概率以及属于棉花类别的第三概率。
在步骤1043中,将超出概率阈值的概率对应的对象类别,作为子块图像的分类结果。
需要说明的是,概率阈值表征概率的门限值,示例性的,可以将概率阈值设定为60%,对于概率超过60%对应的候选的对象类别,通常为该图像子块中大面积或全部覆盖的对象类别。
在一些实施例中,当至少两个候选的对象类别对应的概率超过概率阈值时,将至少两个超出概率阈值的概率对应的对象类别,作为子块图像的分类结果。
这里,子块图像中可以兼容至少两种类别的对象,将超过概率阈值的概率对应的对象类别作为当前子块图像的分类结果,即确定当前子块图像中包含哪种或哪几种对象,当对象为植物时,则为确定当前子块图像所对应的地块中种植了哪种或哪几种植物。
示例性的,承接上述示例,属于玉米类别的第一概率、属于水稻类别的第二概率以及属于棉花类别的第三概率中,第一概率、第二概率超过了概率阈值,可以将“玉米”和“水稻”作为图像子块的对象类别,即确定当前子块图像表征的区域种植了玉米和水稻两种农作物。
在另一些实施例中,当至少两个候选的对象类别对应的概率超过概率阈值时,确定概率最大的对象类别,将最大概率对应的对象类别,作为子块图像的分类结果。
这里,子块图像中仅种植同一类别的对象类别,将超过概率阈值的概率中概率值最大的对象类别,作为子块图像的分类结果,即确定当前图像子块中包含的对象最大可能是哪种类别。
示例性的,承接上述示例,属于玉米类别的第一概率、属于水稻类别的第二概率以及属于棉花类别的第三概率中,第一概率、第二概率超过了概率阈值,且第一概率的值最大,可以将“玉米”作为图像子块的对象类别,即确定当前子块图像表征的区域种植了玉米作物。
通过上述实施例,为每个地块中非单一类别植种植的情形提供了更完善的地块识别处理方式,保证了对地块中多种对象类别的精准识别。
在一些实施例中,如果对应多个候选的对象类别的概率均未超过概率阈值时,判定类别预测失败,确定当前图像子块中未准确识别出对象类别,可利用分类模型对当前图像子块重新识别,或基于当前类别预测失败的图像子块丰富分类模型的训练集,用以更新分类模型,提高分类模型的识别精度。
此时,若与真实结果相比,预测结果错误,可以基于当前识别失败的图像丰富分类模型的训练集,用以更新分类模型,提高分类模型的识别精度。
通过上述实施例,使分类模型能够就错误识别的图像进行充分学习,从而纠正分类模型之前的识别错误,提高了分类精度。
在步骤105中,基于各子块图像内对象的分类结果,确定地块覆盖的对象类别。
在一些实施例中,步骤105可以通过多数投票的方法实现;例如:确定多个子块图像中属于相同对象类别的子块图像的数量;将数量最多的子块图像对应对象类别,确定为地块覆盖的对象类别。
通过多数投票的方法,将地块级对象类别预测分散到多个样本子块图像的类别预测,并确定多个预测分类结果,确定数量最多的预测分类结果,减少分类处理的误差,提升地块识别的准确率和精度。
在一些实施例中,步骤105之后,根据预设规则针对不同的类别为各个地块进行不同的着色处理,得到地域遥感图像的地块分类图。其中,预设规则可以为不同对象类别和颜色的对应关系。
例如,针对每个地块的类别,为当前地块对应的图像区域的像素给出不同颜色的着色标注,以得到地块分类图。例如,将表征玉米农作物地块的图像区域着色为黄色、将表征水稻农作物地块的图像区域的着色为绿色、将表征棉花农作物地块的图像区域着色为红色,以此得到携带不同着色的地域遥感图像的地块分类图。
在另一些实施例中,预设规则可以包括不同对象类别和标签的对应关系。
例如,针对每个地块的类别,在当前地块对应的图像区域给出不同标签,以得到地块分类图。例如,在表征玉米农作物地块的图像区域展示“玉米”标签、在表征水稻农作物地块的图像区域展示“水稻”标签、将表征棉花农作物地块的图像区域展示“棉花”标签,以此得到携带标签的地域遥感图像的地块分类图。
上述实施例中,通过预标注信息对遥感地域图像进行分割处理得到地块的图像,将复杂的地域遥感图像简单化,针对地块级的图像,进行多点取样,以预设尺寸切割地块的图像,得到与地块对应的多个有效的子块图像样本,有效的提高图像样本的精度,根据预训练的分类模型对多个子块图像进行类别预测得到多个相应的分类结果,确定地块覆盖的对象类别,兼顾分类模型多次预测的效果,确定最优的识别结果,降低识别错误的概率,提高地块识别的准确率,从而提升分类的精度,提高地块中对象识别的应用价值。
参见图4,图4是本申请实施例提供的分类模型的训练方法的一个可选的流程示意图,图3A示出的步骤104的步骤是通过预训练的至少一个分类模型实现的,这里,分类模型可以是图8A、图8B示出的任意一个分类模型,下文不再重复说明。在获取分类模型之前,通过图4示出的步骤201-203训练上述分类模型,将结合步骤进行说明。
在步骤201中,初始化分类模型的模型参数;
在步骤202中,通过分类模型对训练样本集合中的子块图像样本进行类别预测,得到子块图像样本的预测对象类别;
这里,对子块图像样本进行类别预测,得到子块图像样本的预测对象类别,参照本申请实施例上文记载的分类处理的方式,再次不做赘述。
在步骤203中,确定子块图像样本的预标注对象类别与预测对象类别的误差,基于误差在分类模型中进行反向传播,以更新分类模型的模型参数。
这里,对反向传播进行说明,将图像特征输入到神经网络模型的输入层,经过隐藏层,最后达到输出层并输出预测对象类别,这是神经网络模型的前向传播过程,由于神经网络模型的输出结果与实际结果有差异,则计算输出结果与实际结果之间的差异,并将该差异从输出层向隐藏层反向传播,直至传播到输入层,在反向传播的过程中,根据误差调整模型参数的值;不断迭代上述过程,直至损失函数收敛。
参见图5,是本申请实施例提供的分类模型的训练方法的一个可选的流程示意图,图3A示出的步骤103的步骤是通过至少一个分类模型实现的,在获取分类模型之前,通过图5示出的步骤301-303构建训练样本集合用以训练至少一个分类模型:
在步骤301中,基于多个预标注坐标点,在地域图像样本中确定每个预标注坐标点所在的地块。
在一些实施例中,在获取地域图像样本之前,一般针对感兴趣区域进行实地考察和取样,例如,在实际的地块区域中获取采样点和当前采样点的属性(例如种植的农作物类型),并携带全球定位***GPS仪器定点拍照,以记录当前采样点属性和坐标位置作为预标注坐标点。
在一些实施例中,在地域图像样本中确定每个预标注坐标点所在的地块可以通过直接目视解译实现:通过人眼观测遥感图像数据,分辨坐标点所在的地块区域,根据人工添加的点信息标注作为约束,得到每个预标注坐标点所在的地块。
在另一些实施例中,在地域图像样本中确定每个预标注坐标点所在的地块还可以通过开源的标注工具或其他的聚类模型实现,本申请对此不加限定。
需要说明的是,由于采样点一般为地块内任意一点,在用方框取样获取训练样本时可能取得边缘,不足以代表地块内对象的特征,通过上述实施例的方法基于坐标点扩充地块,以针对每个地块进行采样识别,减少图像的碎片化,提升了后续采样的效率和图像识别的准确度。
在步骤302中,通过预设尺寸从地域图像样本中切割出每个预标注坐标点所在的地块的图像,得到多个子块图像样本。
这里,预设尺寸为本申请实施例上文中的固定尺寸,预设尺寸为以取样点为中心的规则几何图形。通过预设尺寸从地域图像样本中切割地块图像得到多个子块图像的处理参照本申请实施例上文的实施方式,在此不做赘述。
在步骤303中,基于多个子块图像样本以及对应的标注对象类别,构建训练样本集合。
在一些实施例中,将基于预标注坐标点扩充的相应地块的标注对象类别作为对应同一地块的多个子块图像样本对应的标注对象类别,以上述多个子块图像样本以及对应的预标注对象类别作为训练样本,构建训练样本集合,用以训练至少一个分类模型。
在一些实施例中,构建训练样本集合,训练多个分类模型用以实现本申请步骤104的方法,例如,从上述训练样本集合中抽取训练样本子集,以用于训练每个分类模型的,其中,每个分类模型的训练样本子集不同或不完全相同。
在一些实施例中,当步骤104是通过多个分类模型实现时,在训练分类模型之前,还可以执行:从训练样本集合中抽取训练样本子集,其中,每个分类模型的训练样本子集不同或不完全相同。
在实际实施时,可以通过样本放回抽取的方式构建多个训练样本集合用以训练多个分类模型。示例性的,在上述训练样本集合中,随机选取多个子训练样本,构建训练样本子集1,利用训练样本子集1,预训练分类模型1,将上述多个子训练样本放回训练样本集合,继续随机选取多个训练样本,构建训练样本子集2,预训练分类模型2;依次重复将样本放回再随机抽取训练样本,得到i个训练样本子集,预训练得到相应的i子分类模型;其中,i≥1,多个训练样本子集不完全相同。
在另一些实施例中,还可以通过样本无放回抽取的方式构建多个训练样本集合用以训练多个分类模型。示例性的,在上述训练样本集合中,随机选取多个子训练样本,构建训练样本子集1,预训练分类模型1;在剩余训练样本集合中,再随机选取多个子训练样本,构建训练样本子集2;预训练分类模型2;依次在剩余训练样本集合抽取训练样本,得到i个训练样本子集,预训练得到相应的i个子分类模型,其中,i≥1,多个训练样本子集完全不同。
需要说明的是,训练i个分类模型参照本申请实施例上文的分类模型训练方法,在此不做赘述。
这里,通过构建训练多个样本子集用以训练多个子分类模型,可能每一个模型的模型效果并不是最优的,但是综合考虑所有模型的输出结果,就会得到准确率较高的输出结果,减少使用一个分类模型进行特征提取和分类处理的误差,提升子块图像分类识别的准确性。
下面,将说明本申请实施例在一个实际的应用场景中的示例性应用。
以感兴趣区的农作物识别的场景为例,为了提高农作物识别的精度和效率,需要得到地域遥感图像的地块级图像,并基于地块级的图像分辨农作物的类型,以得到农作物分类图。
目前的遥感农作物识别模型主要是像素级、基于规则或机器学***行六面体分类法、支持向量机等,其特征提取方法传统低效,不适应于复杂地区的农作物识别,精度不高,碎片化严重。虽然深度学习在特征提取具备优势,但是真实的农作物数据需要人工实地获取,定点任意,成本高,没有充足的数据量,难以直接用于深度神经网络、语义分割模型的训练;虽然有一些利用深度学习进行农作物分类的尝试,但是由于地块分布不明晰,传统的采样方法(例如:直接开窗获取训练样本)获得的样本图像数据碎片化严重、传统的预测方法(例如滑窗中心小块全图预测)具有较低的准确率。
在利用遥感图像辨别农作物分布的实际应用中,遥感图像数量十分庞大,涉及的区域复杂,可能是国家级的、省级、市级的遥感图像等等,本申请实施例面向范围相较小一些的感兴趣区域进行农作物识别,例如,针对某个县城区域进行农作物识别。
由于感兴趣区(例如某个县城区域)农作物地块长时间内基本不会变化,可以直接手动标注分割地块,并在此后微调并重新加载使用,在手动分割农田地块的基础上,针对每个农田地块进行农作物种植类型的识别,得到农作物分类图。
图9是本申请实施例提出的分类模型的训练方法的流程示意图,本申请实施例提供的地块中对象的分类方法可以通过至少一个分类模型实现,参见图9,图9示出了上述分类模型的训练阶段的方法,结合下文的步骤401-步骤404进行说明。
步骤401:获取实地调查的坐标和农作物种植类型。
在实际实施时,实验人员对具体的农田区域实地考察,携带全球定位***GPS仪器定点拍照,记录多个采样点的坐标位置以及采样点的属性(农作物种植类型)。
步骤402:获取地域遥感图像,制作遥感图像地块级农田标注,以坐标所在位置扩充为整块农田。
在一些实施例中,坐标一般为农田内任意一点,传统的方框取样获取训练样本时可能取得农田地块边缘,覆盖非农田区域(例如道路、杂草等)或其他地块区域(例如种植不同类型农作物的农田地块),不足以代表农田地块作物的特征,因此,根据步骤401记录的采样点的坐标位置和作物类型,人工扩充农田地块,制作地块级农作物标注。
例如,通过人工观测遥感图像数据,分辨坐标点所在的农田地块区域,根据人工添加的点信息标注作为约束,得到每个预标注坐标点所在的农田地块,通常来说,考虑到农作物的生长需要,通常一个农田地块区域种植类型的农作物。
步骤403:基于每个农田地块以及标注的农作物类型,取农田地块中的N个随机点,切割出训练样本图像。
例如,在农田地块中随机获取N个取样点,将固定尺寸size作为预设尺寸,以每个取样点为中心,偏移左上size/2,右下size/2,作为采样窗口,在地块级遥感图像中裁剪出一个size大小的图片作为训练样本图像,例如,可以选取25*25*3的采样窗口进行图像切割,依次对每个取样点以size大小的采样窗口裁剪size大小的图像,得到相应的一个农田地块对应的N个训练样本图像。
需要说明的是,固定尺寸size的需要预先设定,根据大量实验数据和先验知识确定,一般要求盖住少量的地块外界,以使采样窗口尽可能的包裹整块农田。
步骤404:根据训练样本图像和对应的农作物类型标记,使用深度学习训练得到农作物分类模型(即分类模型),例如,农作物分类模型可以为残差网络模型ResNet、稠密连接网络模型DenseNet、或自定义的深度学习模型。
在一些实施例中,以农田地块对应的N个训练样本图像和标注的农作物类型构建训练样本集,将训练样本集输入农作物分类模型,通过所述农作物分类模型对训练样本集合中的子块图像样本进行类别预测,得到所述子块图像样本的预测植物类别,确定标注的农作物类型与预测的植物类别之间的误差,根据误差更新上述地块分类模型的模型参数。
图10是本申请实施例提出的地块中对象的分类方法的流程示意图,参见图10,基于本申请实施例训练的分类模型可以对遥感图像中的农作物地区进行分类处理,得到相应的农作物分类图,如图10示出的基于本申请实施例训练的分类模型进行地块识别的测试阶段,结合下文的步骤501-步骤506进行说明。
步骤501,获取测试图像数据。
需要说明的是,测试图像数据为地域遥感图像集,例如,通过无人机定点航拍、卫星拍摄等方式等渠道采集的A省B市C县的地域遥感图像集。
步骤502,感兴趣区农田地块分割。
例如,根据人工标注或历史矢量标注在地域遥感图像中分割种植农作物的地块,得到包括多个农田地块的图像。
需要说明的是,面向A省B市C县采集的遥感图像,由于上述地域的农作物地块是不常更新的,即农田地块(边界)不常变化,可以进行手动标注,或调取历史矢量标注加载使用,这里,历史矢量标注可以微调并重复加载使用,相对而言标注成本低,并且十分固定。
步骤503,取每个农田地块中的M个随机点,切割出测试样本图像。
例如,对于每个农田地块,随机获取M个取样点,以本申请实施例上文提供的固定尺寸size对农田地块的图像进行裁剪得到对应的M个样本图像(字块图像)。
步骤504,使用农作物分类模型对这M个样本图像进行农作物分类,得到M个分类结果。
在一些实施例中,使用农作物分类模型对样本图像进行特征提取处理,得到对应所述每个样本图像的图像特征;根据图像特征,对所述样本图像进行类别预测,将图像特征映射为对应多个候选农作物类别的概率,将超出概率阈值且概率值最大的概率对应的农作物类别,作为样本图像的分类结果,依次利用农作物分类模型对M个样本图像进行类别预测,得到M个分类结果。
需要说明的是,分类结果一般是取具有最大概率的类作为结果的,概率和加起来一般是100%。示例性的,若候选农作物的类别为“玉米”、“水稻”“其他”,对于一个农田地块,利用农作物分类模型分别对当前地块对应的M个样本图像进行特征提取和分类处理,得到预测类别为“玉米”的概率为20%,预测类别为“水稻”的概率为70%,预测类别为“其他”的概率为10%,由于预测类别为“水稻”的概率最大,可以判定,当前样本图像中的种植农作物类型为“水稻”。
步骤505,将M个分类结果进行多数投票,确定最终分类结果,并将结果赋值给相应地块。
在一些实施例中,确定M个分类结果中属于相同分类结果的数量,将数量最多的分类结果确定为M个图像样本对应的农田地块的分类结果,将分类结果赋值给当前地块。
示例性的,对于一个农田地块,若切割了50个样本图像,利用农作物分类模型分别对样本图像进行特征提取和分类处理,得到了40个预测为“水稻”“的分类结果,9个预测为“玉米”的分类结果,1个预测为“棉花”的分类结果,通过多数投票的方式,确定当前地块的分类结果为“水稻”。
步骤506,重复执行步骤503-步骤505,得到测试图像的农作物分类图。
例如,利用农作物分类模型分别对多个农田地块进行分类预测,得到每个地块的分类结果,根据预设规则针对不同的农作物类别为各个农田地块进行不同的着色或添加标签,得到地域遥感图像的农作物分类图。其中,预设规则可以为不同植物类别和颜色的对应关系或不同植物类别和标签的对应关系。
通过本申请上述实施例,在真实数据的农田地块中取多个样本训练农作物分类模型,进行农作物识别测试时通过感兴趣区人工标注或对农田地块历史矢量标注微调,分割出农田地块,并取每个地块进行多点开窗取样,利用农作物分类模型对多个样本进行分类预测,并对多个分类结果进行多数投票,将得到的结果赋值给每个地块,从而提升农作物分类的精度,提升农作物识别的应用价值。
下面继续说明本申请实施例提供的地块中对象的分类装置555的实施为软件模块的示例性结构,在一些实施例中,如图2所示,存储在存储器550的地块中对象的分类装置555中的软件模块可以包括:图像获取模块5551,用于获取地域图像;图像裁剪模块5552,用于根据预标注信息确定所述地域图像中的感兴趣区域,从所述地域图像中裁剪出所述感兴趣区域的图像,以作为所述地块的图像;图像切割模块5553,用于基于所述地块中的多个采样点,通过预设尺寸切割所述地块的图像,得到多个子块图像;地块类别确定模块5554,用于基于各所述子块图像的图像特征获取相应的所述子块图像内对象的分类结果,并基于各所述子块图像内对象的分类结果,确定所述地块覆盖的对象类别。
在上述方案中,所述地块中对象的分类装置,还包括:信息获取模块,用于响应于标注操作,获取人工标注的预标注信息;或者获取基于历史矢量标注的预标注信息。
在上述方案中,所述图像切割模块5553,还用于针对每个地块执行以下处理:在所述地块中随机获取多个取样点;基于所述多个取样点,分别以预设尺寸切割所述地块的图像,得到与所述地块对应的多个子块图像;其中,所述预设尺寸为以所述取样点为中心的规则几何图形。
在上述方案中,地块类别确定模块5554,还用于针对所述每个子块图像执行以下处理:将从所述子块图像提取的图像特征映射为对应多个候选的对象类别的概率;将超出概率阈值的概率对应的对象类别,作为所述子块图像的分类结果。
在上述方案中,地块类别确定模块5554,还用于当至少两个候选的对象类别对应的概率超过概率阈值时,将所述至少两个超出概率阈值的概率对应的对象类别,作为所述子块图像的分类结果,或者,将最大概率对应的对象类别,作为所述子块图像的分类结果。
在上述方案中,所述基于各所述子块图像的图像特征获取相应的所述子块图像内对象的分类结果是通过至少一个分类模型实现的;地块类别确定模块5554,还用于通过同一个分类模型执行以下处理:基于从各所述子块图像提取的图像特征,分别对相应的所述子块图像内的对象进行分类处理,得到所述子块图像内对象的分类结果;或者,通过多个分类模型执行以下处理:基于各所述子块图像的图像特征,一对一地对所述子块图像内的对象进行分类处理,得到各所述子块图像内对象的分类结果。
在上述方案中,地块类别确定模块5554,还用于确定统计各所述子块图像中属于相同对象类别的子块图像的数量;将数量最多的子块图像对应的对象类别,确定为所述地块覆盖的对象类别。
在上述方案中,所述基于各所述子块图像的图像特征获取相应的所述子块图像内对象的分类结果是通过至少一个分类模型实现的,所述地块中对象的分类装置,还包括:分类模型训练模块5554,用于通过以下方式训练所述分类模型:初始化分类模型的模型参数;通过所述分类模型对训练样本集合中的子块图像样本进行类别预测,得到所述子块图像样本的预测对象类别;确定所述子块图像样本的预标注对象类别与所述预测对象类别的误差,基于所述误差在所述分类模型中进行反向传播,以更新所述分类模型的模型参数。
在上述方案中,当所述基于各所述子块图像的图像特征获取相应的所述子块图像内对象的分类结果是通过多个分类模型实现时,所述分类模型训练模块5554,还用于从所述训练样本集合中抽取训练样本子集,其中,每个分类模型的训练样本子集不同或不完全相同。
在上述方案中,所述分类模型训练模块5554,还用于基于多个预标注坐标点,在地域图像样本中确定每个预标注坐标点所在的地块;通过预设尺寸从所述地域图像样本中切割出所述每个预标注坐标点所在的地块的图像,得到多个子块图像样本;基于所述多个子块图像样本以及对应的标注对象类别,构建所述训练样本集合。
需要说明的是,本申请实施例装置的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果,因此不做赘述。
本申请实施例提供了一种电子设备,包括:存储器,用于存储可执行指令;处理器,用于执行存储器中存储的可执行指令时,实现本申请实施例提供的地块中对象的分类方法。
本申请实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行本申请实施例上述的地块中对象的分类方法。
本申请实施例提供一种存储有可执行指令的计算机可读存储介质,其中存储有可执行指令,当可执行指令被处理器执行时,将引起处理器执行本申请实施例提供的方法,例如,如图3A、图3B等示出的地块中对象的分类方法。
在一些实施例中,计算机可读存储介质可以是FRAM、ROM、PROM、EPROM、EEPROM、闪存、磁表面存储器、光盘、或CD-ROM等存储器;也可以是包括上述存储器之一或任意组合的各种设备。
在一些实施例中,可执行指令可以采用程序、软件、软件模块、脚本或代码的形式,按任意形式的编程语言(包括编译或解释语言,或者声明性或过程性语言)来编写,并且其可按任意形式部署,包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。
作为示例,可执行指令可以但不一定对应于文件***中的文件,可以可被存储在保存其它程序或数据的文件的一部分,例如,存储在超文本标记语言(HTML,Hyper TextMarkup Language)文档中的一个或多个脚本中,存储在专用于所讨论的程序的单个文件中,或者,存储在多个协同文件(例如,存储一个或多个模块、子程序或代码部分的文件)中。
作为示例,可执行指令可被部署为在一个计算设备上执行,或者在位于一个地点的多个计算设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个计算设备上执行。
综上所述,通过本申请实施例,基于预标注信息对遥感地域图像进行分割处理得到地块的图像,将复杂的地域遥感图像简单化处理为地块级区域,针对地块级的图像,进行多点取样,以预设尺寸切割地块的图像,得到与地块对应的多个有效的子块图像样本,提高了图像样本的精度,根据预训练的分类模型对多个子块图像进行类别预测得到多个相应的分类结果,确定地块覆盖的对象类别,兼顾分类模型多次预测的效果,确定最优的识别结果,降低识别错误的概率,提高地块识别的准确率,从而提升地块中对象分类的精度,提高地块识别的应用价值。
以上所述,仅为本申请的实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和范围之内所作的任何修改、等同替换和改进等,均包含在本申请的保护范围之内。
Claims (14)
1.一种地块中对象的分类方法,其特征在于,所述方法包括:
获取地域图像;
根据预标注信息确定所述地域图像中的感兴趣区域,从所述地域图像中裁剪出所述感兴趣区域的图像,以作为所述地块的图像;
基于所述地块中的多个采样点,通过预设尺寸切割所述地块的图像,得到多个子块图像;
基于各所述子块图像的图像特征获取相应的所述子块图像内对象的分类结果,并基于各所述子块图像内对象的分类结果,确定所述地块覆盖的对象类别。
2.根据权利要求1所述的方法,其特征在于,在根据预标注信息确定所述地域图像中的感兴趣区域之前,所述方法还包括:
响应于标注操作,获取人工标注的预标注信息;或者
获取基于历史矢量标注的预标注信息。
3.根据权利要求1所述的方法,其特征在于,所述基于所述地块中的多个采样点,通过预设尺寸切割所述地块的图像,得到多个子块图像,包括:
针对每个地块执行以下处理:
在所述地块中随机获取多个取样点;
基于所述多个取样点,分别以预设尺寸切割所述地块的图像,得到与所述地块对应的多个子块图像;
其中,所述预设尺寸为以所述取样点为中心的规则几何图形。
4.根据权利要求1所述的方法,其特征在于,所述基于各所述子块图像的图像特征获取相应的所述子块图像内对象的分类结果,包括:
针对所述每个子块图像执行以下处理:
将从所述子块图像提取的图像特征映射为对应多个候选的对象类别的概率;
将超出概率阈值的概率对应的对象类别,作为所述子块图像的分类结果。
5.根据权利要求4所述的方法,其特征在于,所述将超出概率阈值的概率对应的对象类别,作为所述子块图像的分类结果,包括:
当至少两个候选的对象类别对应的概率超过概率阈值时,将所述至少两个超出概率阈值的概率对应的对象类别,作为所述子块图像的分类结果,或者,将最大概率对应的对象类别,作为所述子块图像的分类结果。
6.根据权利要求1所述的方法,其特征在于,
所述基于各所述子块图像的图像特征获取相应的所述子块图像内对象的分类结果是通过至少一个分类模型实现的;
所述基于各所述子块图像的图像特征获取各所述子块图像内对象的分类结果,包括:
通过同一个分类模型执行以下处理:基于从各所述子块图像提取的图像特征,分别对相应的所述子块图像内的对象进行分类处理,得到所述子块图像内对象的分类结果;
或者,通过多个分类模型执行以下处理:基于各所述子块图像的图像特征,一对一地对所述子块图像内的对象进行分类处理,得到各所述子块图像内对象的分类结果。
7.根据权利要求1所述的方法,其特征在于,所述基于各所述子块图像内对象的分类结果,确定所述地块覆盖的对象类别,包括:
确定统计各所述子块图像中属于相同对象类别的子块图像的数量;
将数量最多的子块图像对应的对象类别,确定为所述地块覆盖的对象类别。
8.根据权利要求1所述的方法,其特征在于,
所述基于各所述子块图像的图像特征获取相应的所述子块图像内对象的分类结果是通过至少一个分类模型实现的,在基于各所述子块图像的图像特征获取相应的所述子块图像内对象的分类结果之前,所述方法还包括:
通过以下方式训练所述分类模型:
初始化所述分类模型的模型参数;
通过所述分类模型对训练样本集合中的子块图像样本进行类别预测,得到所述子块图像样本的预测对象类别;
确定所述子块图像样本的预标注对象类别与所述预测对象类别的误差,基于所述误差在所述分类模型中进行反向传播,以更新所述分类模型的模型参数。
9.根据权利要求8所述的方法,其特征在于,当所述基于各所述子块图像的图像特征获取相应的所述子块图像内对象的分类结果是通过多个分类模型实现时,在训练所述分类模型之前,所述方法还包括:
从所述训练样本集合中抽取训练样本子集,其中,每个分类模型的训练样本子集不同或不完全相同。
10.根据权利要求8或9所述的方法,其特征在于,在训练所述分类模型之前,所述方法还包括:
基于多个预标注坐标点,在地域图像样本中确定每个预标注坐标点所在的地块;
通过预设尺寸从所述地域图像样本中切割出所述每个预标注坐标点所在的地块的图像,得到多个子块图像样本;
基于所述多个子块图像样本以及对应的标注对象类别,构建所述训练样本集合。
11.一种地块中对象的分类装置,其特征在于,包括:
图像获取模块,用于获取地域图像;
图像裁剪模块,用于根据预标注信息确定所述地域图像中的感兴趣区域,从所述地域图像中裁剪出所述感兴趣区域的图像,以作为所述地块的图像;
图像切割模块,用于基于所述地块中的多个采样点,通过预设尺寸切割所述地块的图像,得到多个子块图像;
地块类别确定模块,用于基于各所述子块图像的图像特征获取相应的所述子块图像内对象的分类结果,并基于各所述子块图像内对象的分类结果,确定所述地块覆盖的对象类别。
12.一种电子设备,其特征在于,包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令时,实现权利要求1至10任一项所述的地块中对象的分类方法。
13.一种计算机可读存储介质,其特征在于,存储有可执行指令,用于被处理器执行时,实现权利要求1至10任一项所述的地块中对象的分类方法。
14.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至10任一项所述的地块中对象的分类方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110314424.5A CN112906648A (zh) | 2021-03-24 | 2021-03-24 | 一种地块中对象的分类方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110314424.5A CN112906648A (zh) | 2021-03-24 | 2021-03-24 | 一种地块中对象的分类方法、装置及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112906648A true CN112906648A (zh) | 2021-06-04 |
Family
ID=76106225
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110314424.5A Pending CN112906648A (zh) | 2021-03-24 | 2021-03-24 | 一种地块中对象的分类方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112906648A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114155433A (zh) * | 2021-11-30 | 2022-03-08 | 北京新兴华安智慧科技有限公司 | 一种违法土地的检测方法、装置、电子设备及存储介质 |
CN116189000A (zh) * | 2022-11-11 | 2023-05-30 | 北京市测绘设计研究院 | 地块分析方法及装置 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102542293A (zh) * | 2011-12-27 | 2012-07-04 | 上海交通大学 | 一种针对高分辨率sar图像场景解译的一类提取分类方法 |
US20190073534A1 (en) * | 2015-11-08 | 2019-03-07 | Agrowing Ltd. | Method for aerial imagery acquisition and analysis |
US20190087942A1 (en) * | 2013-03-13 | 2019-03-21 | Kofax, Inc. | Content-Based Object Detection, 3D Reconstruction, and Data Extraction from Digital Images |
CN109583369A (zh) * | 2018-11-29 | 2019-04-05 | 北京邮电大学 | 一种基于目标区域分割网络的目标识别方法及装置 |
CN109859209A (zh) * | 2019-01-08 | 2019-06-07 | 平安科技(深圳)有限公司 | 遥感影像分割方法、装置及存储介质、服务器 |
CN110580507A (zh) * | 2019-09-02 | 2019-12-17 | 同济大学 | 一种城市肌理分类识别方法 |
CN111144168A (zh) * | 2018-11-02 | 2020-05-12 | 阿里巴巴集团控股有限公司 | 农作物生长周期的识别方法、设备以及*** |
CN111489370A (zh) * | 2020-03-29 | 2020-08-04 | 复旦大学 | 基于深度学习的遥感图像的分割方法 |
US20200250497A1 (en) * | 2017-11-01 | 2020-08-06 | Tencent Technology (Shenzhen) Company Limited | Image classification method, server, and computer-readable storage medium |
CN111898494A (zh) * | 2020-07-16 | 2020-11-06 | 大同煤矿集团有限责任公司 | 一种采矿扰动地块边界识别方法 |
CN112240869A (zh) * | 2020-11-16 | 2021-01-19 | 内蒙古自治区农牧业科学院 | 一种基于高分遥感影像的草原地块信息提取方法 |
-
2021
- 2021-03-24 CN CN202110314424.5A patent/CN112906648A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102542293A (zh) * | 2011-12-27 | 2012-07-04 | 上海交通大学 | 一种针对高分辨率sar图像场景解译的一类提取分类方法 |
US20190087942A1 (en) * | 2013-03-13 | 2019-03-21 | Kofax, Inc. | Content-Based Object Detection, 3D Reconstruction, and Data Extraction from Digital Images |
US20190073534A1 (en) * | 2015-11-08 | 2019-03-07 | Agrowing Ltd. | Method for aerial imagery acquisition and analysis |
US20200250497A1 (en) * | 2017-11-01 | 2020-08-06 | Tencent Technology (Shenzhen) Company Limited | Image classification method, server, and computer-readable storage medium |
CN111144168A (zh) * | 2018-11-02 | 2020-05-12 | 阿里巴巴集团控股有限公司 | 农作物生长周期的识别方法、设备以及*** |
CN109583369A (zh) * | 2018-11-29 | 2019-04-05 | 北京邮电大学 | 一种基于目标区域分割网络的目标识别方法及装置 |
CN109859209A (zh) * | 2019-01-08 | 2019-06-07 | 平安科技(深圳)有限公司 | 遥感影像分割方法、装置及存储介质、服务器 |
CN110580507A (zh) * | 2019-09-02 | 2019-12-17 | 同济大学 | 一种城市肌理分类识别方法 |
CN111489370A (zh) * | 2020-03-29 | 2020-08-04 | 复旦大学 | 基于深度学习的遥感图像的分割方法 |
CN111898494A (zh) * | 2020-07-16 | 2020-11-06 | 大同煤矿集团有限责任公司 | 一种采矿扰动地块边界识别方法 |
CN112240869A (zh) * | 2020-11-16 | 2021-01-19 | 内蒙古自治区农牧业科学院 | 一种基于高分遥感影像的草原地块信息提取方法 |
Non-Patent Citations (4)
Title |
---|
LIU SHUAISHI 等: "Facial Expression Recognition under Partial Occlusion Based on Weber Local Descriptor Histogram and Decision Fusion", IEEE, 15 September 2014 (2014-09-15), pages 4664 - 4668 * |
吴培昊;马浩然;: "基于高分一号影像的天津市宝坻区地表覆盖分类研究", 天津农业科学, no. 02, 1 February 2020 (2020-02-01), pages 33 - 37 * |
谢中华: "《MATLAB与数学建模》", 30 September 2019, 北京航空航天大学出版社, pages: 337 - 338 * |
陈伊哲;汤修映;彭彦昆;徐杨;李翠玲;: "农田地块图像分割技术研究", 农业机械学报, no. 1, 5 September 2010 (2010-09-05), pages 259 - 262 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114155433A (zh) * | 2021-11-30 | 2022-03-08 | 北京新兴华安智慧科技有限公司 | 一种违法土地的检测方法、装置、电子设备及存储介质 |
CN114155433B (zh) * | 2021-11-30 | 2022-07-19 | 北京新兴华安智慧科技有限公司 | 一种违法土地的检测方法、装置、电子设备及存储介质 |
CN116189000A (zh) * | 2022-11-11 | 2023-05-30 | 北京市测绘设计研究院 | 地块分析方法及装置 |
CN116189000B (zh) * | 2022-11-11 | 2023-11-14 | 北京市测绘设计研究院 | 地块分析方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110136170B (zh) | 一种基于卷积神经网络的遥感影像建筑物变化检测方法 | |
CN113011350A (zh) | 一种地域图像的识别处理方法、装置及电子设备 | |
CN106909886B (zh) | 一种基于深度学习的高精度交通标志检测方法及*** | |
CN111553200A (zh) | 一种图像检测识别方法及装置 | |
DE102022131673A1 (de) | Autonomes-fahrzeug-wahrnehmung-multimodale-sensordaten-management | |
CN112906648A (zh) | 一种地块中对象的分类方法、装置及电子设备 | |
CN109636868B (zh) | 基于WebGIS和深度学习的高精度影像地图在线构建方法及设备 | |
CN114359756A (zh) | 一种震后无人机遥感影像损毁房屋快速智能检测方法 | |
Michaelsen et al. | Stochastic reasoning for structural pattern recognition: An example from image-based UAV navigation | |
US20220237908A1 (en) | Flight mission learning using synthetic three-dimensional (3d) modeling and simulation | |
CN113033516A (zh) | 对象识别统计方法及装置、电子设备、存储介质 | |
CN111414951B (zh) | 用于图像的细分类方法及装置 | |
CN112084989A (zh) | 基于无人机与cnn的大范围松材线虫病枯立木智能检测方法 | |
CN110457706B (zh) | 兴趣点名称选择模型训练方法、使用方法、装置及存储介质 | |
CN109657728B (zh) | 样例生产方法及模型训练方法 | |
CN111414878A (zh) | 一种关于地块的社会属性分析、图像处理方法及装置 | |
CN107578003A (zh) | 一种基于地理标记图像的遥感图像迁移学习方法 | |
CN113505653B (zh) | 目标检测方法、装置、设备、介质及程序产品 | |
CN112836590B (zh) | 洪涝灾害监测方法、装置、电子设备及存储介质 | |
CN114396956A (zh) | 导航方法及装置、计算设备、存储介质和计算机程序产品 | |
CN115410173B (zh) | 多模态融合的高精地图要素识别方法、装置、设备及介质 | |
CN115294472A (zh) | 果实产量估计方法、模型训练方法、设备及存储介质 | |
CN114120287A (zh) | 数据处理方法、装置、计算机设备和存储介质 | |
CN110795977B (zh) | 交通信号识别方法、装置、存储介质及电子设备 | |
CN112069971A (zh) | 一种基于视频的高速公路标志标线识别方法及识别*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |