CN115272667B - 农田图像分割模型训练方法、装置、电子设备和介质 - Google Patents

农田图像分割模型训练方法、装置、电子设备和介质 Download PDF

Info

Publication number
CN115272667B
CN115272667B CN202210723621.7A CN202210723621A CN115272667B CN 115272667 B CN115272667 B CN 115272667B CN 202210723621 A CN202210723621 A CN 202210723621A CN 115272667 B CN115272667 B CN 115272667B
Authority
CN
China
Prior art keywords
image
initial
feature map
network
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210723621.7A
Other languages
English (en)
Other versions
CN115272667A (zh
Inventor
吴之祥
刘磊
刘璐瑶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhongke Xingrui Technology Beijing Co ltd
Original Assignee
Zhongke Xingrui Technology Beijing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhongke Xingrui Technology Beijing Co ltd filed Critical Zhongke Xingrui Technology Beijing Co ltd
Priority to CN202210723621.7A priority Critical patent/CN115272667B/zh
Publication of CN115272667A publication Critical patent/CN115272667A/zh
Application granted granted Critical
Publication of CN115272667B publication Critical patent/CN115272667B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/80Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
    • G06V10/806Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/188Vegetation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本公开的实施例公开了农田图像分割模型训练方法、装置、电子设备和介质。方法的一具体实施方式包括:获取目标农田边界矢量数据和目标遥感图像;生成坐标集;生成与坐标集相对应的目标图像,其中,目标图像的分辨率与目标遥感图像的分辨率相同;对目标图像和目标遥感图像进行图像切割,得到切割后图像子集和切割后遥感图像子集;将切割后图像子集中的切割后图像作为训练标签,切割后遥感图像子集中的切割后遥感图像作为训练数据,在二分类语义分割的技术框架下采用对抗学习的方式,对初始农田图像分割模型进行训练,得到训练后的农田图像分割模型。该实施方式使用训练后的农田图像分割模型,可以精准地实现对遥感图像中的农田信息进行识别。

Description

农田图像分割模型训练方法、装置、电子设备和介质
技术领域
本公开的实施例涉及计算机技术领域,具体涉及农田图像分割模型训练方法、装置、电子设备和介质。
背景技术
随着遥感技术的不断发展,针对农田的遥感图像的识别技术也成为遥感领域的重要技术。对于遥感图像中农田信息的识别,通常采用的方式为:将遥感图像输入至预先训练的卷积神经网络,得到遥感图像中的农田信息。
然而,当采用上述方式来识别遥感图像中农田信息,经常会存在如下技术问题:
第一,卷积神经网络的标签不够精准,使得使用训练后的卷积神经网络来识别农田信息不够精准。
第二,卷积神经网络的网络结构比较简单,不能全面的学习到目标遥感图像中的多层次农田特征信息。
发明内容
本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
本公开的一些实施例提出了农田图像分割模型训练方法、装置、电子设备和介质,来解决以上背景技术部分提到的技术问题中的一项或多项。
第一方面,本公开的一些实施例提供了一种农田图像分割模型训练方法,包括:获取目标农田边界矢量数据和目标遥感图像,其中,上述目标农田边界矢量数据包括:农田的矢量多边形,上述目标农田边界矢量数据表征上述目标遥感图像中农田的边界信息;生成坐标集,其中,上述坐标集中的坐标为上述矢量多边形中的顶点的坐标,上述坐标集中的坐标为上述目标遥感图像对应遥感坐标系下的坐标;生成与上述坐标集相对应的目标图像,其中,上述目标图像的分辨率与上述目标遥感图像的分辨率相同;对上述目标图像和上述目标遥感图像进行图像切割,得到切割后图像子集和切割后遥感图像子集;将上述切割后图像子集中的切割后图像作为训练标签,上述切割后遥感图像子集中的切割后遥感图像作为训练数据,对初始农田图像分割模型进行训练,得到训练后的农田图像分割模型。
第二方面,本公开的一些实施例提供了一种农田图像分割模型训练装置,包括:获取单元,被配置成获取目标农田边界矢量数据和目标遥感图像,其中,上述目标农田边界矢量数据包括:农田的矢量多边形,上述目标农田边界矢量数据表征上述目标遥感图像中农田的边界信息;第一生成单元,被配置成生成坐标集,其中,上述坐标集中的坐标为上述矢量多边形中的顶点的坐标,上述坐标集中的坐标为上述目标遥感图像对应遥感坐标系下的坐标;第二生成单元,被配置成生成与上述坐标集相对应的目标图像,其中,上述目标图像的分辨率与上述目标遥感图像的分辨率相同;切割单元,被配置成对上述目标图像和上述目标遥感图像进行图像切割,得到切割后图像子集和切割后遥感图像子集;训练单元,被配置成将上述切割后图像子集中的切割后图像作为训练标签,上述切割后遥感图像子集中的切割后遥感图像作为训练数据,对初始农田图像分割模型进行训练,得到训练后的农田图像分割模型。
第三方面,本公开的一些实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中任一实现方式描述的方法。
第四方面,本公开的一些实施例提供了一种计算机可读介质,其上存储有计算机程序,其中,程序被处理器执行时实现如第一方面中任一实现方式描述的方法。
本公开的上述各个实施例具有如下有益效果:通过本公开的一些实施例的农田图像分割模型训练方法使用训练后的农田图像分割模型,可以精准地实现对遥感图像中的农田信息进行识别。具体来说,造成生成识别遥感图像中农田信息不够精准地原因在于:卷积神经网络的标签不够精准,使得使用训练后的卷积神经网络来识别农田信息不够精准。基于此,本公开的一些实施例的农田图像分割模型训练方法,首先,获取目标农田边界矢量数据和目标遥感图像,以用于后续制作训练初始农田图像分割模型的标签。接着,生成坐标集,其中,上述坐标集中的坐标为上述矢量多边形中的顶点的坐标,上述坐标集中的坐标为上述目标遥感图像对应遥感坐标系下的坐标。在这里,通过生成坐标集,以将目标农田边界矢量数据转换到目标遥感图像的对应坐标系下,以便于后续初始农田图像分割模型学习目标遥感图像中的农田特征信息。接着,生成与上述坐标集相对应的目标图像,以便于后续初始农田图像分割模型学习目标遥感图像的农田特征信息。紧接着,对上述目标图像和上述目标遥感图像进行图像切割,得到切割后图像子集和切割后遥感图像子集。在这里,通过对目标图像和目标遥感图像进行图像分割,可以使得后续初始农田图像分割模型可以从目标遥感图像的局部细节来学习农田特征信息。最后,将上述切割后图像子集中的切割后图像作为训练标签,上述切割后遥感图像子集中的切割后遥感图像作为训练数据,对初始农田图像分割模型进行训练,可以得到识别遥感图像中农田信息更为精准的训练后的农田图像分割模型。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,元件和元素不一定按照比例绘制。
图1是根据本公开的一些实施例的图像分割方法的一个应用场景的示意图;
图2是根据本公开的图像分割方法的一些实施例的流程图;
图3是根据本公开的图像分割方法的另一些实施例的流程图;
图4是根据本公开的图像分割装置的一些实施例的结构示意图;
图5是适于用来实现本公开的一些实施例的电子设备的结构示意图
具体实施方式
下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例。相反,提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。
需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
下面将参考附图并结合实施例来详细说明本公开。
图1是根据本公开一些实施例的农田图像分割模型训练方法的一个应用场景的示意图。
在图1的应用场景中,首先,电子设备101可以获取目标农田边界矢量数据102和目标遥感图像103。其中,上述目标农田边界矢量数据102包括:农田的矢量多边形。上述目标农田边界矢量数据102表征上述目标遥感图像103中农田的边界信息。然后,电子设备101可以生成坐标集104。其中,上述坐标集104中的坐标为上述矢量多边形中的顶点的坐标。上述坐标集104中的坐标为上述目标遥感图像103对应遥感坐标系下的坐标。接着,电子设备101可以生成与上述坐标集104相对应的目标图像105。其中,上述目标图像105的分辨率与上述目标遥感图像103的分辨率相同;进而,电子设备101可以对上述目标图像105和上述目标遥感图像103进行图像切割,得到切割后图像子集106和切割后遥感图像子集107。最后,电子设备101可以将上述切割后图像子集106中的切割后图像作为训练标签,上述切割后遥感图像子集107中的切割后遥感图像作为训练数据,对初始农田图像分割模型108进行训练,得到训练后的农田图像分割模型109。
需要说明的是,上述电子设备101可以是硬件,也可以是软件。当电子设备为硬件时,可以实现成多个服务器或终端设备组成的分布式集群,也可以实现成单个服务器或单个终端设备。当电子设备体现为软件时,可以安装在上述所列举的硬件设备中。其可以实现成例如用来提供分布式服务的多个软件或软件模块,也可以实现成单个软件或软件模块。在此不做具体限定。
应该理解,图1中的电子设备的数目仅仅是示意性的。根据实现需要,可以具有任意数目的电子设备。
继续参考图2,示出了根据本公开的农田图像分割模型训练方法的一些实施例的流程200。该农田图像分割模型训练方法,包括以下步骤:
步骤201,获取目标农田边界矢量数据和目标遥感图像。
在一些实施例中,上述农田图像分割模型训练方法的执行主体(例如图1所示的电子设备101)可以通过有线连接方式或者无线连接方式来获取目标农田边界矢量数据和目标遥感图像。其中,上述目标农田边界矢量数据包括:农田的矢量多边形,上述目标农田边界矢量数据表征上述目标遥感图像中农田的边界信息。其中,上述目标农田边界矢量数据可以是与上述目标遥感图像对应的矢量图像。例如,上述目标农田边界矢量数据可以是shp矢量图像的形式。上述目标遥感图像可以是由相关遥感装置所拍摄的、包括农田信息的图像。农田的矢量多边形为目标遥感图像所包括的目标农田信息的农田轮廓信息。例如,上述矢量多边形可以是用其顶点的坐标序列描述的,用直线段顺次连接顶点所得到完整的多边形。例如,矢量多边形可以是正方形。
可选地,目标农田边界矢量数据可以包括多个矢量多边形。
步骤202,生成坐标集。
在一些实施例中,上述执行主体可以生成坐标集。其中,上述坐标集中的坐标为上述矢量多边形中的顶点的坐标,上述坐标集中的坐标为上述目标遥感图像对应遥感坐标系下的坐标。例如,上述坐标集中的坐标可以是epsg3857坐标。
可选地,针对目标农田边界矢量数据包括多个矢量多边形,所对应的坐标集也为多个。在此以一个坐标集为示例,来进行后续初始农田图像分割模型的训练。
作为示例,上述执行主体可以通过针对epsg3857坐标的生成方式来生成上述坐标集。
作为又一个示例,上述执行主体可以通过预设的公式集来生成坐标集。具体公式集如下:
其中,为目标遥感图像中左上角的像素点的经度坐标。/>为目标遥感图像中左上角的像素点的纬度坐标。/>为目标遥感图像中像素点对应的经度范围值。/>为目标遥感图像中像素点对应的纬度范围值。/>为第/>行第/>列像素点的起始经度。/>为第/>行第/>列像素点的结束经度。/>为第/>行第/>列像素点的起始纬度。/>为第/>行第/>列像素点的结束纬度。
作为示例,可以是目标农田边界矢量数据中的一个多边形。具体地,坐标转换可以是:/>,上述集合可以表征多边形/>的n个顶点。/>,/>分别表示顶点i的经度与维度坐标。若/>,/>,则该点对应坐标可以为/>
步骤203,生成与上述坐标集相对应的目标图像。
在一些实施例中,上述执行主体可以生成与上述坐标集相对应的目标图像。其中,上述目标图像的分辨率与上述目标遥感图像的分辨率相同。
作为示例,首先,上述执行主体可以将上述坐标集添加至初始图像,得到添加后的图像。接着,以添加后的图像中坐标集为基本单位(即,坐标集中的坐标作为后续目标图像的顶点),调用目标函数,来生成上述目标图像。其中,目标函数可以是opencv的cv2.polylines函数。在这里,针对目标农田边界矢量数据包括多个矢量多边形,可以将多个矢量多边形对应的多个坐标集依次输入至目标函数中,可以得到包括多个多边形的、与目标遥感图像的分辨率相同的目标图像。其中,上述初始图像可以是空白图像。
在一些实施例的一些可选的实现方式中,上述生成与上述坐标集相对应的目标图像,可以包括以下步骤:
第一步,上述执行主体可以将上述坐标集添加至初始图像,得到添加后的图像。其中,上述初始图像可以是空白图像。
第二步,上述执行主体可以将上述添加后的图像中的上述坐标集进行连线处理,得到连线后图像。
作为示例,对于上述添加后的图像中的每个坐标,上述执行主体可以确定与上述坐标距离之间距离的排名位于前两名的两个坐标,以及将上述坐标与上述两个坐标进行相连接。由此,上述执行主体可以得到连线后图像。
第三步,上述执行主体可以对上述连线后图像所包括的连线对应像素进行像素数值变换,得到变换后图像,作为上述目标图像。其中,连线对应像素的像素数值可以是预先设置的。例如,像素数值可以是“R:255,G:0,B:0”。R表征红色。G表征绿色。B表征蓝色。
步骤204,对上述目标图像和上述目标遥感图像进行图像切割,得到切割后图像子集和切割后遥感图像子集。
在一些实施例中,上述执行主体可以对上述目标图像和上述目标遥感图像进行图像切割,得到切割后图像子集和切割后遥感图像子集。其中,上述切割后图像子集所包括的切割后图像的图像数目与切割后遥感图像子集所包括的切割后遥感图像子集存在内容对应的关系。
作为示例,上述执行主体可以依据预先设置的切割比例,来对上述目标图像和上述目标遥感图像进行图像切割,得到切割后图像子集和切割后遥感图像子集。例如,切割比例可以是“20:30”。
步骤205,将上述切割后图像子集中的切割后图像作为训练标签,上述切割后遥感图像子集中的切割后遥感图像作为训练数据,对初始农田图像分割模型进行训练,得到训练后的农田图像分割模型。
在一些实施例中,上述执行主体可以将上述切割后图像子集中的切割后图像作为训练标签,上述切割后遥感图像子集中的切割后遥感图像作为训练数据,对初始农田图像分割模型进行训练,得到训练后的农田图像分割模型。其中,上述初始农田图像分割模型可以是参数未训练的农田图像分割模型。上述农田图像分割模型可以是对图像中的农田进行分割的模型。例如,农田图像分割模型可以是实例分割(DeepMask)模型。
本公开的上述各个实施例具有如下有益效果:通过本公开的一些实施例的农田图像分割模型训练方法使用训练后的农田图像分割模型,可以精准地实现对遥感图像中的农田信息进行识别。具体来说,造成生成识别遥感图像中农田信息不够精准地原因在于:卷积神经网络的标签不够精准,使得使用训练后的卷积神经网络来识别农田信息不够精准。基于此,本公开的一些实施例的农田图像分割模型训练方法,首先,获取目标农田边界矢量数据和目标遥感图像,以用于后续制作训练初始农田图像分割模型的标签。接着,生成坐标集,其中,上述坐标集中的坐标为上述矢量多边形中的顶点的坐标,上述坐标集中的坐标为上述目标遥感图像对应遥感坐标系下的坐标。在这里,通过生成坐标集,以将目标农田边界矢量数据转换到目标遥感图像的对应坐标系下,以便于后续初始农田图像分割模型学习目标遥感图像中的农田特征信息。接着,生成与上述坐标集相对应的目标图像,以便于后续初始农田图像分割模型学习目标遥感图像的农田特征信息。紧接着,对上述目标图像和上述目标遥感图像进行图像切割,得到切割后图像子集和切割后遥感图像子集。在这里,通过对目标图像和目标遥感图像进行图像分割,可以使得后续初始农田图像分割模型可以从目标遥感图像的局部细节来学习农田特征信息。最后,将上述切割后图像子集中的切割后图像作为训练标签,上述切割后遥感图像子集中的切割后遥感图像作为训练数据,对初始农田图像分割模型进行训练,可以得到识别遥感图像中农田信息更为精准地训练后的农田图像分割模型。
进一步参考图3,示出了根据本公开的农田图像分割模型训练方法的另一些实施例的流程300。该农田图像分割模型训练方法,包括以下步骤:
步骤301,获取目标农田边界矢量数据和目标遥感图像。
步骤302,生成坐标集。
步骤303,生成与上述坐标集相对应的目标图像。
步骤304,对上述目标图像和上述目标遥感图像进行图像切割,得到切割后图像子集和切割后遥感图像子集。
在一些实施例中,步骤301-304的具体实现及其所带来的技术效果,可以参考图2对应的实施例中的步骤201-204,在此不再赘述。
步骤305,对于上述切割后图像子集中的每个切割后图像,执行生成式与对抗式模型训练步骤:
步骤3051,将上述切割后图像输入至初始生成式与对抗式模型中的初始生成式模型,得到初始分割结果和上述初始分割结果对应的第一损失值。
在一些实施例中,执行主体(例如图1所示的电子设备101)可以将上述切割后图像输入至初始生成式与对抗式模型中的初始生成式模型,得到初始分割结果和上述初始分割结果对应的第一损失值。其中,上述初始生成式与对抗式模型可以是参数未训练的生成式与对抗式模型。上述初始分割结果可以是初始分割图片。
步骤3052,确定与上述切割后图像之间存在内容对应关系的切割后遥感图像。
在一些实施例中,上述执行主体可以确定与上述切割后图像之间存在内容对应关系的切割后遥感图像。
作为示例,上述执行主体可以通过各种查询方式来确定与上述切割后图像之间存在内容对应关系的切割后遥感图像。
步骤3053,将上述初始分割结果和上述切割后图像输入至上述初始生成式与对抗式模型中的初始对抗式模型,得到第一输出向量。
在一些实施例中,上述执行主体可以将上述初始分割结果和上述切割后遥感图像输入至上述初始生成式与对抗式模型中的初始对抗式模型,得到第一输出向量。其中,上述对抗式模型可以是判别模型。
作为示例,上述初始对抗式模型可以包括:多层初始卷积网络层。以及上述执行主体可以将上述初始分割结果和上述切割后图像输入至上述多层初始卷积网络层,得到第一输出向量。
步骤3054,将上述初始分割结果和上述切割后遥感图像输入至上述初始生成式与对抗式模型中的初始对抗式模型,得到第二输出向量。
在一些实施例中,上述执行主体可以将上述初始分割结果和上述切割后遥感图像输入至上述初始生成式与对抗式模型中的初始对抗式模型,得到第二输出向量。
作为示例,上述初始对抗式模型可以包括:多层初始卷积网络层。以及上述执行主体可以将上述初始分割结果和上述切割后遥感图像输入至上述多层初始卷积网络层,得到第一输出向量。
步骤3055,根据上述第一输出向量和上述第二输出向量,生成第二损失值。
在一些实施例中,上述执行主体可以根据上述第一输出向量和上述第二输出向量,生成第二损失值。
作为示例,上述执行主体可以确定第一输出向量和第二输出向量之间的余弦距离,作为第二损失值。
步骤3056,根据上述第一损失值和第二损失值,对上述初始农田图像分割模型进行训练,得到训练后的农田图像分割模型。
在一些实施例中,上述执行主体可以根据上述第一损失值和第二损失值,对上述初始农田图像分割模型进行训练,得到训练后的农田图像分割模型。
作为示例,响应于确定上述第一损失值与第二损失值之间的平均值大于或等于第一预定阈值,上述执行主体可以对上述初始农田图像分割模型进行训练,得到训练后的农田图像分割模型。响应于确定上述第一损失值与第二损失值之间的平均值小于预定阈值,上述执行主体可以将上述初始农田图像分割模型确定为训练后的农田图像分割模型。例如,第一预定阈值可以是0.4。
作为又一个示例,响应于确定第一损失值大于等于第二预定阈值和/或第二损失值大于等于第三预定阈值,上述执行主体可以对上述初始农田图像分割模型进行训练,得到训练后的农田图像分割模型。响应于确定上述第一损失值小于第二预定阈值、且第二损失值小于第三预定阈值,上述执行主体可以将上述初始农田图像分割模型确定为训练后的农田图像分割模型。例如,第二预定阈值可以是0.3。第三预定阈值可以是0.5。
在一些实施例的一些可选的实现方式中,上述根据上述第一输出向量和上述第二输出向量,生成第二损失值,可以包括以下步骤:
第一步,上述执行主体可以确定上述第一输出向量与预设全1矩阵之间的第一交叉熵损失值。
例如,预设全1矩阵可以是[[1,1,1],[1,1,1],[1,1,1]]。
第二步,上述执行主体可以确定上述第二输出向量与预设全0矩阵之间的第二交叉熵损失值。
例如,预设全0矩阵可以是[[0,0,0],[0,0,0],[0,0,0]]。
第三步,上述执行主体可以确定上述第一交叉熵损失值与上述第二交叉熵损失值之间的平均值,作为上述第二损失值。
在一些实施例的一些可选的实现方式中,上述将上述切割后图像输入至初始生成式与对抗式模型中的初始生成式模型,得到初始分割结果和上述初始分割结果对应的第一损失值,可以包括以下步骤:
第一步,上述执行主体可以将上述切割后图像输入至初始图像编码模型,上述初始图像编码模型包括多个串行连接的图像编码网络,得到多个图像编码网络的输出矩阵。例如,多个串行连接的图像编码网络可以是5个串行连接的图像编码网络。初始图像编码模型的第一图像编码网络的输出为第二图像编码网络的输入。初始图像编码模型的第二图像编码网络的输出为第三图像编码网络的输入。初始图像编码模型的第三图像编码网络的输出为第四图像编码网络的输入。初始图像编码模型的第四图像编码网络的输出为第五图像编码网络的输入。
第二步,上述执行主体可以将上述多个串行连接的图像编码网络中的最后一个图像编码网络对应的输出矩阵确定为初始图像解码模型的输入矩阵。例如,最后一个图像编码网络的输出为初始图像解码模型的输入矩阵。例如,多个串行连接的图像编码网络中的每个图像编码网络可以是卷积神经网络(Convolutional Neural Networks, CNN)。
第三步,上述执行主体可以将上述输出矩阵确定为候选矩阵。
第四步,上述执行主体可以对于上述初始图像解码模型中的多个串行连接的图像解码网络的每个图像解码网络,将图像解码网络确定为候选图像解码网络,以及执行以下初始分割结果生成步骤:
第一子步骤,上述执行主体可以确定与上述候选图像解码网络相对应的图像编码网络的输出矩阵,作为目标输出矩阵。其中,多个串行连接的图像解码网络与多个串行连接的图像编码网络的网络是一一对应的。即多个串行连接的图像解码网络的网络个数与多个串行连接的图像编码网络的网络个数相同。例如,多个串行连接的图像解码网络包括:第一图像解码网络,第二图像解码网络和第三图像解码网络。多个串行连接的图像编码网络包括:第一图像编码网络,第二图像编码网络和第三图像编码网络。具体地,第一图像编码网络的输出为第一图像解码模型的输入向量的组成部分。第二图像编码网络的输出为第二图像解码模型的输入向量的组成部分。第三图像编码网络的输出为第三图像解码模型的输入向量的组成部分。
第二子步骤,上述执行主体可以将目标输出矩阵与候选矩阵进行矩阵融合,得到融合矩阵。
作为示例,上述执行主体可以将输出矩阵与候选矩阵进行矩阵相加,得到相加后矩阵,作为融合矩阵。
作为又一个示例,上述执行主体可以将输出矩阵与候选矩阵进行矩阵拼接,得到拼接后矩阵,作为融合矩阵。
第三子步骤,上述执行主体可以将融合矩阵输入至上述候选图像解码网络,得到解码矩阵。
第四子步骤,响应于确定上述候选图像解码网络是多个串行连接的图像解码网络中的最后一个网络,上述执行主体可以将解码矩阵作为上述初始图像解码模型的输出矩阵,根据解码矩阵,生成初始分割结果。
第五步,响应于确定上述候选图像解码网络不是多个串行连接的图像解码网络中的最后一个网络,将解码矩阵作为候选矩阵,当前图像解码网络的下一个图像解码网络作为候选图像解码网络,上述执行主体可以继续执行上述初始分割结果生成步骤。
可选地,上述初始图像编码模型包括:第一初始图像编码网络、第二初始图像编码网络、第三初始图像编码网络、第四初始图像编码网络和第五初始图像编码网络;以及
上述将上述切割后图像输入至初始图像编码模型,上述初始图像编码模型包括多个串行连接的图像编码网络,得到多个图像编码网络的输出矩阵,可以包括以下步骤:
第一步,上述执行主体可以将上述切割后图像输入至第一初始图像编码网络,得到第一特征图。
可选地,首先,依据第一矩阵压缩比例,上述执行主体可以对切割后图像进行矩阵压缩,得到第一压缩图像。然后,依据第二矩阵压缩比例,上述执行主体可以对切割后图像进行矩阵压缩,得到第二压缩图像。接着,上述执行主体可以将第一压缩图像输入至普通卷积神经网络,得到输出特征图。最后,上述执行主体可以将输出特征图与第二压缩矩阵进行融合,得到融合特征图,作为第一特征图。
第二步,上述执行主体可以将上述第一特征图进行特征图压缩,得到第一压缩特征图。
第三步,上述执行主体可以将上述第一压缩特征图输入至第二初始图像编码网络所包括的普通卷积网络,得到第二特征图。其中,普通卷积网络为对特征图进行普通卷积的网络。
第四步,上述执行主体可以将上述第一特征图输入至第二初始图像编码网络所包括的空洞卷积网络,得到第三特征图。其中,普通卷积网络为对特征图进行空洞卷积(即,膨胀卷积)的网络。
第五步,上述执行主体可以将上述第二特征图与上述第三特征图进行特征图融合,得到第一融合特征图。
作为示例,上述执行主体可以将第二特征图与第三特征图进行通道拼接,得到拼接特征图,作为第一融合特征图。
作为又一个示例,上述执行主体可以将第二特征图与第三特征图进行对应元素求平均值,得到平均特征图,作为第一融合特征图。
第六步,上述执行主体可以将上述第一融合特征图输入至第三初始图像编码网络,得到第四特征图。
第七步,上述执行主体可以将上述第四特征图进行特征图压缩,得到第二压缩特征图。
第八步,上述执行主体可以将上述第二压缩特征图输入至第四初始图像编码网络所包括的普通卷积网络,得到第五特征图。
第九步,上述执行主体可以将上述第四特征图输入至第四初始图像编码网络所包括的空洞卷积网络,得到第六特征图。
第十步,上述执行主体可以将上述第五特征图与上述第六特征图进行特征图融合,得到第二融合特征图。
第十一步,上述执行主体可以将上述第二融合特征图输入至第五初始图像编码网络,得到第七特征图。
作为示例,首先,依据第三矩阵压缩比例,上述执行主体可以对第二融合特征图进行特征图压缩,得到第一压缩后特征图。然后,依据第四矩阵压缩比例,上述执行主体可以对第二融合特征图进行矩阵压缩,得到第二压缩后特征图。接着,上述执行主体可以将第一压缩后特征图输入至普通卷积神经网络,得到输出后特征图。最后,上述执行主体可以将输出后特征图与第二压缩后特征图进行融合,得到融合特征图,作为第七特征图。
可选地,上述初始图像编码模型包括:第一初始图像编码网络、第二初始图像编码网络、第三初始图像编码网络、第四初始图像编码网络和第五初始图像编码网络;以及
上述将上述切割后图像输入至初始图像编码模型,上述初始图像编码模型包括多个串行连接的图像编码网络,得到多个图像编码网络的输出矩阵,可以包括以下步骤:
第一步,上述执行主体可以将上述切割后图像输入至上述第一初始图像编码网络,得到第一输出矩阵。
第二步,上述执行主体可以将上述第一输出矩阵输入至上述第二初始图像编码网络,得到第二输出矩阵。
第三步,上述执行主体可以将上述第一输出矩阵和上述第二输出矩阵进行数据通道融合,得到第一融合矩阵。
第四步,上述执行主体可以将上述第一融合矩阵输入至上述第三初始图像编码网络,得到第三输出矩阵。
第五步,上述执行主体可以将上述第三输出矩阵和上述第一融合矩阵进行数据通道融合,得到第二融合矩阵。
第六步,上述执行主体可以将上述第二融合矩阵输入至上述第四初始图像编码网络,得到第四输出矩阵。
第七步,上述执行主体可以将上述第四输出矩阵和上述第二融合矩阵进行数据通道融合,得到第三融合矩阵。
第八步,上述执行主体可以将上述第三融合矩阵输入至上述第五初始图像编码网络,得到第五输出矩阵。
可选地,上述将上述第一融合特征图输入至第三初始图像编码网络,得到第四特征图,可以包括以下步骤:
第一步,依据第一特征图压缩比例,上述执行主体可以将上述第一融合特征图进行特征图压缩,得到第三压缩特征图。其中,第一特征图压缩比例可以是预先设置的。
第二步,依据第二特征图压缩比例,上述执行主体可以将上述第一融合特征图进行特征图压缩,得到第四压缩特征图。其中,第二特征图压缩比例可以是预先设置的。
第三步,上述执行主体可以将上述第三压缩特征图输入至第三初始图像编码网络所包括的普通卷积网络,得到第八特征图。
第四步,上述执行主体可以将上述第八特征图与上述第四压缩特征图进行特征图融合,得到第三融合特征图,作为上述第四特征图。
作为本公开的实施例的一个发明点,解决了背景技术提及的技术问题二“卷积神经网络的网络结构比较简单,不能全面的学习到目标遥感图像中的多层次农田特征信息”。基于此,本公开引入了通过引入普通卷积和空洞卷积,来多层次的获取特征图的特征信息,使得所得到的第七特征图包括更为全面的图像特征信息。除此之外,在图像编码过程中,对特征图不同层次的特征图压缩,在以此基础上的特征图编码和特征图融合,可以得到待编码特征图中多视野的特征信息。由此,所得到的第七特征图包括更为丰富的图像特征信息。
从图3中可以看出,与图2对应的一些实施例的描述相比,图3对应的一些实施例中的农田图像分割模型训练方法的流程300更加突出了对农田图像分割模型进行训练的具体步骤。由此,这些实施例描述的方案通过利用训练后的生成式与对抗式模型,可以更为精准地实现农田信息的识别。
进一步参考图4,作为对上述各图所示方法的实现,本公开提供了一种农田图像分割模型训练装置的一些实施例,这些装置实施例与图2所示的那些方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图4所示,一种农田图像分割模型训练装置400包括:获取单元401、第一生成单元402、第二生成单元403、切割单元404和训练单元405。其中,获取单元401,被配置成获取目标农田边界矢量数据和目标遥感图像,其中,上述目标农田边界矢量数据包括:农田的矢量多边形,上述农田边界矢量数据表征上述目标遥感图像中农田的边界信息;第一生成单元402,被配置成生成坐标集,其中,上述坐标集中的坐标为上述矢量多边形中的顶点的坐标,上述坐标集中的坐标为上述目标遥感图像对应遥感坐标系下的坐标;第二生成单元403,被配置成生成与上述坐标集相对应的目标图像,其中,上述目标图像的分辨率与上述目标遥感图像的分辨率相同;切割单元404,被配置成对上述目标图像和上述目标遥感图像进行图像切割,得到切割后图像子集和切割后遥感图像子集;训练单元405,被配置成将上述切割后图像子集中的切割后图像作为训练标签,上述切割后遥感图像子集中的切割后遥感图像作为训练数据,对初始农田图像分割模型进行训练,得到训练后的农田图像分割模型。
可以理解的是,该装置400中记载的诸单元与参考图2描述的方法中的各个步骤相对应。由此,上文针对方法描述的操作、特征以及产生的有益效果同样适用于装置400及其中包含的单元,在此不再赘述。
下面参考图5,其示出了适于用来实现本公开的一些实施例的电子设备(例如图1中的电子设备101)500的结构示意图。图5示出的电子设备仅仅是一个示例,不应对本公开的实施例的功能和使用范围带来任何限制。
如图5所示,电子设备500可以包括处理装置(例如中央处理器、图形处理器等)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储装置508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有电子设备500操作所需的各种程序和数据。处理装置501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
通常,以下装置可以连接至I/O接口505:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置506;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置507;包括例如磁带、硬盘等的存储装置508;以及通信装置509。通信装置509可以允许电子设备500与其他设备进行无线或有线通信以交换数据。虽然图5示出了具有各种装置的电子设备500,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。图5中示出的每个方框可以代表一个装置,也可以根据需要代表多个装置。
特别地,根据本公开的一些实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的一些实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的一些实施例中,该计算机程序可以通过通信装置509从网络上被下载和安装,或者从存储装置508被安装,或者从ROM 502被安装。在该计算机程序被处理装置501执行时,执行本公开的一些实施例的方法中限定的上述功能。
需要说明的是,本公开的一些实施例上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开的一些实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本公开的一些实施例中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
在一些实施方式中,客户端、服务器可以利用诸如HTTP(HyperText TransferProtocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“LAN”),广域网(“WAN”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:获取目标农田边界矢量数据和目标遥感图像,其中,上述目标农田边界矢量数据包括:农田的矢量多边形,上述目标农田边界矢量数据表征上述目标遥感图像中农田的边界信息;生成坐标集,其中,上述坐标集中的坐标为上述矢量多边形中的顶点的坐标,上述坐标集中的坐标为上述目标遥感图像对应遥感坐标系下的坐标;生成与上述坐标集相对应的目标图像,其中,上述目标图像的分辨率与上述目标遥感图像的分辨率相同;对上述目标图像和上述目标遥感图像进行图像切割,得到切割后图像子集和切割后遥感图像子集;将上述切割后图像子集中的切割后图像作为训练标签,上述切割后遥感图像子集中的切割后遥感图像作为训练数据,对初始农田图像分割模型进行训练,得到训练后的农田图像分割模型。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的一些实施例的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开的一些实施例中的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括获取单元、第一生成单元、第二生成单元、切割单元和训练单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,获取单元还可以被描述为“获取目标农田边界矢量数据和目标遥感图像的单元”。
本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、片上***(SOC)、复杂可编程逻辑设备(CPLD)等等。
以上描述仅为本公开的一些较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开的实施例中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开的实施例中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (8)

1.一种农田图像分割模型训练方法,包括:
获取目标农田边界矢量数据和目标遥感图像,其中,所述目标农田边界矢量数据包括:农田的矢量多边形,所述目标农田边界矢量数据表征所述目标遥感图像中农田的边界信息;
生成坐标集,其中,所述坐标集中的坐标为所述矢量多边形中的顶点的坐标,所述坐标集中的坐标为所述目标遥感图像对应遥感坐标系下的坐标;
生成与所述坐标集相对应的目标图像,其中,所述目标图像的分辨率与所述目标遥感图像的分辨率相同;
对所述目标图像和所述目标遥感图像进行图像切割,得到切割后图像子集和切割后遥感图像子集;
对于所述切割后图像子集中的每个切割后图像,执行生成式与对抗式模型训练步骤:
将所述切割后图像输入至初始图像编码模型,所述初始图像编码模型包括多个串行连接的图像编码网络,得到多个图像编码网络的输出矩阵;
将所述多个串行连接的图像编码网络中的最后一个图像编码网络对应的输出矩阵确定为初始图像解码模型的输入矩阵;
将所述输出矩阵确定为候选矩阵;
对于所述初始图像解码模型中的多个串行连接的图像解码网络的每个图像解码网络,将图像解码网络确定为候选图像解码网络,以及执行以下初始分割结果生成步骤:
确定与所述候选图像解码网络相对应的图像编码网络的输出矩阵,作为目标输出矩阵;
将目标输出矩阵与候选矩阵进行矩阵融合,得到融合矩阵;
将融合矩阵输入至所述候选图像解码网络,得到解码矩阵;
响应于确定所述候选图像解码网络是多个串行连接的图像解码网络中的最后一个网络,将解码矩阵作为所述初始图像解码模型的输出矩阵,根据解码矩阵,生成初始分割结果;
响应于确定所述候选图像解码网络不是多个串行连接的图像解码网络中的最后一个网络,将解码矩阵作为候选矩阵,当前图像解码网络的下一个图像解码网络作为候选图像解码网络,继续执行所述初始分割结果生成步骤;
确定与所述切割后图像之间存在内容对应关系的切割后遥感图像;
将所述初始分割结果和所述切割后图像输入至初始生成式与对抗式模型中的初始对抗式模型,得到第一输出向量;
将所述初始分割结果和所述切割后遥感图像输入至所述初始生成式与对抗式模型中的初始对抗式模型,得到第二输出向量;
根据所述第一输出向量和所述第二输出向量,生成第二损失值;
根据第一损失值和所述第二损失值,对初始农田图像分割模型进行训练,得到训练后的农田图像分割模型。
2.根据权利要求1所述的方法,其中,所述生成与所述坐标集相对应的目标图像,包括:
将所述坐标集添加至初始图像,得到添加后的图像;
将所述添加后图像中的所述坐标集进行连线处理,得到连线后图像;
对所述连线后图像所包括的连线对应的像素进行像素数值变换,得到变换后图像,作为所述目标图像。
3.根据权利要求1所述的方法,其中,所述根据所述第一输出向量和所述第二输出向量,生成第二损失值,包括:
确定所述第一输出向量与预设全1矩阵之间的第一交叉熵损失值;
确定所述第二输出向量与预设全0矩阵之间的第二交叉熵损失值;
确定所述第一交叉熵损失值与所述第二交叉熵损失值之间的平均值,作为所述第二损失值。
4.根据权利要求1所述的方法,其中,所述初始图像编码模型包括:第一初始图像编码网络、第二初始图像编码网络、第三初始图像编码网络、第四初始图像编码网络和第五初始图像编码网络;以及
所述将所述切割后图像输入至初始图像编码模型,所述初始图像编码模型包括多个串行连接的图像编码网络,得到多个图像编码网络的输出矩阵,包括:
将所述切割后图像输入至第一初始图像编码网络,得到第一特征图;
将所述第一特征图进行特征图压缩,得到第一压缩特征图;
将所述第一压缩特征图输入至第二初始图像编码网络所包括的普通卷积网络,得到第二特征图;
将所述第一特征图输入至第二初始图像编码网络所包括的空洞卷积网络,得到第三特征图;
将所述第二特征图与所述第三特征图进行特征图融合,得到第一融合特征图;
将所述第一融合特征图输入至第三初始图像编码网络,得到第四特征图;
将所述第四特征图进行特征图压缩,得到第二压缩特征图;
将所述第二压缩特征图输入至第四初始图像编码网络所包括的普通卷积网络,得到第五特征图;
将所述第四特征图输入至第四初始图像编码网络所包括的空洞卷积网络,得到第六特征图;
将所述第五特征图与所述第六特征图进行特征图融合,得到第二融合特征图;
将所述第二融合特征图输入至第五初始图像编码网络,得到第七特征图。
5.根据权利要求4所述的方法,其中,所述将所述第一融合特征图输入至第三初始图像编码网络,得到第四特征图,包括:
依据第一特征图压缩比例,将所述第一融合特征图进行特征图压缩,得到第三压缩特征图;
依据第二特征图压缩比例,将所述第一融合特征图进行特征图压缩,得到第四压缩特征图;
将所述第三压缩特征图输入至第三初始图像编码网络所包括的普通卷积网络,得到第八特征图;
将所述第八特征图与所述第四压缩特征图进行特征图融合,得到第三融合特征图,作为所述第四特征图。
6.一种农田图像分割模型训练装置,包括:
获取单元,被配置成获取目标农田边界矢量数据和目标遥感图像,其中,所述目标农田边界矢量数据包括:农田的矢量多边形,所述目标农田边界矢量数据表征所述目标遥感图像中农田的边界信息;
第一生成单元,被配置成生成坐标集,其中,所述坐标集中的坐标为所述矢量多边形中的顶点的坐标,所述坐标集中的坐标为所述目标遥感图像对应遥感坐标系下的坐标;
第二生成单元,被配置成生成与所述坐标集相对应的目标图像,其中,所述目标图像的分辨率与所述目标遥感图像的分辨率相同;
切割单元,被配置成对所述目标图像和所述目标遥感图像进行图像切割,得到切割后图像子集和切割后遥感图像子集;
训练单元,被配置成对于所述切割后图像子集中的每个切割后图像,执行生成式与对抗式模型训练步骤:将所述切割后图像输入至初始图像编码模型,所述初始图像编码模型包括多个串行连接的图像编码网络,得到多个图像编码网络的输出矩阵;将所述多个串行连接的图像编码网络中的最后一个图像编码网络对应的输出矩阵确定为初始图像解码模型的输入矩阵;将所述输出矩阵确定为候选矩阵;对于所述初始图像解码模型中的多个串行连接的图像解码网络的每个图像解码网络,将图像解码网络确定为候选图像解码网络,以及执行以下初始分割结果生成步骤:确定与所述候选图像解码网络相对应的图像编码网络的输出矩阵,作为目标输出矩阵;将目标输出矩阵与候选矩阵进行矩阵融合,得到融合矩阵;将融合矩阵输入至所述候选图像解码网络,得到解码矩阵;响应于确定所述候选图像解码网络是多个串行连接的图像解码网络中的最后一个网络,将解码矩阵作为所述初始图像解码模型的输出矩阵,根据解码矩阵,生成初始分割结果;响应于确定所述候选图像解码网络不是多个串行连接的图像解码网络中的最后一个网络,将解码矩阵作为候选矩阵,当前图像解码网络的下一个图像解码网络作为候选图像解码网络,继续执行所述初始分割结果生成步骤;确定与所述切割后图像之间存在内容对应关系的切割后遥感图像;将所述初始分割结果和所述切割后图像输入至初始生成式与对抗式模型中的初始对抗式模型,得到第一输出向量;将所述初始分割结果和所述切割后遥感图像输入至所述初始生成式与对抗式模型中的初始对抗式模型,得到第二输出向量;根据所述第一输出向量和所述第二输出向量,生成第二损失值;根据第一损失值和所述第二损失值,对初始农田图像分割模型进行训练,得到训练后的农田图像分割模型。
7.一种电子设备,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-5中任一所述的方法。
8.一种计算机可读介质,其上存储有计算机程序,其中,所述程序被处理器执行时实现如权利要求1-5中任一所述的方法。
CN202210723621.7A 2022-06-24 2022-06-24 农田图像分割模型训练方法、装置、电子设备和介质 Active CN115272667B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210723621.7A CN115272667B (zh) 2022-06-24 2022-06-24 农田图像分割模型训练方法、装置、电子设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210723621.7A CN115272667B (zh) 2022-06-24 2022-06-24 农田图像分割模型训练方法、装置、电子设备和介质

Publications (2)

Publication Number Publication Date
CN115272667A CN115272667A (zh) 2022-11-01
CN115272667B true CN115272667B (zh) 2023-08-29

Family

ID=83762297

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210723621.7A Active CN115272667B (zh) 2022-06-24 2022-06-24 农田图像分割模型训练方法、装置、电子设备和介质

Country Status (1)

Country Link
CN (1) CN115272667B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116309924B (zh) * 2023-05-25 2023-08-18 之江实验室 一种模型训练的方法、图像展示的方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105488536A (zh) * 2015-12-10 2016-04-13 中国科学院合肥物质科学研究院 一种基于多特征深度学习技术的农田害虫图像识别方法
CN110765916A (zh) * 2019-10-17 2020-02-07 北京中科原动力科技有限公司 一种基于语义和实例分割的农田苗垄识别方法及***
CN112084923A (zh) * 2020-09-01 2020-12-15 西安电子科技大学 一种遥感图像语义分割方法、存储介质及计算设备
WO2021110476A1 (en) * 2019-12-03 2021-06-10 Basf Se System and method for determining damage on crops
CN113808134A (zh) * 2021-11-19 2021-12-17 中科星睿科技(北京)有限公司 油罐布局信息生成方法、装置、电子设备、介质
CN114078213A (zh) * 2021-11-23 2022-02-22 航天宏图信息技术股份有限公司 一种基于生成对抗网络的农田轮廓检测方法和装置
CN114494283A (zh) * 2021-12-24 2022-05-13 南京信息工程大学 一种农田自动分割方法及***

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110969182A (zh) * 2019-05-17 2020-04-07 丰疆智能科技股份有限公司 基于农田图像的卷积神经网络构建方法及其***
CN111932555A (zh) * 2020-07-31 2020-11-13 商汤集团有限公司 一种图像处理方法及装置、计算机可读存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105488536A (zh) * 2015-12-10 2016-04-13 中国科学院合肥物质科学研究院 一种基于多特征深度学习技术的农田害虫图像识别方法
CN110765916A (zh) * 2019-10-17 2020-02-07 北京中科原动力科技有限公司 一种基于语义和实例分割的农田苗垄识别方法及***
WO2021110476A1 (en) * 2019-12-03 2021-06-10 Basf Se System and method for determining damage on crops
CN112084923A (zh) * 2020-09-01 2020-12-15 西安电子科技大学 一种遥感图像语义分割方法、存储介质及计算设备
CN113808134A (zh) * 2021-11-19 2021-12-17 中科星睿科技(北京)有限公司 油罐布局信息生成方法、装置、电子设备、介质
CN114078213A (zh) * 2021-11-23 2022-02-22 航天宏图信息技术股份有限公司 一种基于生成对抗网络的农田轮廓检测方法和装置
CN114494283A (zh) * 2021-12-24 2022-05-13 南京信息工程大学 一种农田自动分割方法及***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
生成对抗式网络及其医学影像应用研究综述;张颖麟等;《中国图象图形学报》;正文第687-699页 *

Also Published As

Publication number Publication date
CN115272667A (zh) 2022-11-01

Similar Documents

Publication Publication Date Title
CN109902659B (zh) 用于处理人体图像的方法和装置
EP3872764A1 (en) Method and apparatus for constructing map
CN115457531A (zh) 用于识别文本的方法和装置
CN110009059B (zh) 用于生成模型的方法和装置
CN109754464B (zh) 用于生成信息的方法和装置
CN114758337A (zh) 一种语义实例重建方法、装置、设备及介质
CN113421312A (zh) 一种对黑白视频的着色方法、装置、存储介质及终端
CN112950640A (zh) 视频人像分割方法、装置、电子设备及存储介质
CN112734910A (zh) 基于rgb单图实时人脸三维图像重建方法、装置及电子设备
CN115272667B (zh) 农田图像分割模型训练方法、装置、电子设备和介质
CN114693876A (zh) 数字人生成方法、装置、存储介质和电子设备
CN114004905A (zh) 人物风格形象图的生成方法、装置、设备及存储介质
CN113516697A (zh) 图像配准的方法、装置、电子设备及计算机可读存储介质
CN117894038A (zh) 一种图像中对象姿态生成方法和装置
CN110288691B (zh) 渲染图像的方法、装置、电子设备和计算机可读存储介质
CN112307243B (zh) 用于检索图像的方法和装置
CN109816791B (zh) 用于生成信息的方法和装置
CN115049730B (zh) 零件装配方法、装置、电子设备及存储介质
CN110674813A (zh) 汉字识别方法、装置、计算机可读介质及电子设备
CN115880526A (zh) 图像处理方法、装置、电子设备及存储介质
CN112070888B (zh) 图像生成方法、装置、设备和计算机可读介质
CN116883708A (zh) 图像分类方法、装置、电子设备及存储介质
CN117373024B (zh) 标注图像生成方法、装置、电子设备和计算机可读介质
CN113378808B (zh) 人物图像识别方法、装置、电子设备和计算机可读介质
CN115082574B (zh) 网络模型训练方法和脏器超声切面编码生成方法、装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant