CN113971757A - 图像分类方法、计算机终端及存储介质 - Google Patents

图像分类方法、计算机终端及存储介质 Download PDF

Info

Publication number
CN113971757A
CN113971757A CN202111131995.1A CN202111131995A CN113971757A CN 113971757 A CN113971757 A CN 113971757A CN 202111131995 A CN202111131995 A CN 202111131995A CN 113971757 A CN113971757 A CN 113971757A
Authority
CN
China
Prior art keywords
image
sample
target
preset
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111131995.1A
Other languages
English (en)
Inventor
李威
陈伟涛
王志斌
李�昊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Damo Institute Hangzhou Technology Co Ltd
Original Assignee
Alibaba Damo Institute Hangzhou Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Damo Institute Hangzhou Technology Co Ltd filed Critical Alibaba Damo Institute Hangzhou Technology Co Ltd
Priority to CN202111131995.1A priority Critical patent/CN113971757A/zh
Publication of CN113971757A publication Critical patent/CN113971757A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种图像分类方法、计算机终端及存储介质。其中,该方法包括:获取目标图像;利用图像分类模型对目标图像进行处理,得到目标图像对应的分类结果,其中,图像分类模型通过图像样本和目标样本对预训练模型进行调整得到,目标样本为预设样本集合中图像样本相对应的预设样本,预训练模型通过预设样本集合进行训练得到。本申请解决了相关技术中由于数据样本量少、图像分类模型的准确度较低,从而导致图像分类的准确度较低的技术问题。

Description

图像分类方法、计算机终端及存储介质
技术领域
本申请涉及模型训练领域,具体而言,涉及一种图像分类方法、计算机终端及存储介质。
背景技术
对施工项目的进展情况进行预测是城市规划中一项重要的任务,按照施工进展情况,通常将施工项目分为未动工、已动工和已建成三个类别。相较于实地现场调研,基于航拍图像预测施工项目的进展情况具有实施方便、人力成本低、实时性高的优点。具体来说,利用图像分类模型对航拍图像中的指定区域进行特征提取并进行分类,从而得到指定区域的施工进展情况。然而图像分类模型的训练需要大量的标注数据,较小的数据集会使得深度神经网络产生严重的过拟合问题,极易导致模型的泛化能力差,难以训练得到准确度较高的图像分类模型。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种图像分类方法、计算机终端及存储介质,以至少解决相关技术中由于数据样本量少、图像分类模型的准确度较低,从而导致图像分类的准确度较低的技术问题。
根据本申请实施例的一个方面,提供了一种图像分类方法,包括:获取目标图像;利用图像分类模型对目标图像进行处理,得到目标图像对应的分类结果,其中,图像分类模型通过图像样本和目标样本对预训练模型进行调整得到,目标样本为预设样本集合中图像样本相对应的预设样本,预训练模型通过预设样本集合进行训练得到。
根据本申请实施例的另一个方面,还提供了一种图像分类方法,包括:获取建筑物图像;利用图像分类模型对建筑物图像进行处理,得到建筑物图像包含的建筑物的分类结果,其中,图像分类模型通过图像样本和目标样本对预训练模型进行调整得到,目标样本为图斑分类样本集合中图像样本相对应的图斑分类样本,预训练模型图斑分类样本集合训练得到。
根据本申请实施例的另一个方面,还提供了一种图像分类方法,包括:云服务器接收客户端上传的目标图像;云服务器利用图像分类模型对目标图像进行处理,得到目标图像对应的分类结果,其中,图像分类模型通过图像样本和目标样本对预训练模型进行调整得到,目标样本为预设样本集合中图像样本相对应的预设样本,预训练模型通过预设样本集合进行训练得到;云服务器将分类结果反馈至客户端。
根据本申请实施例的另一个方面,还提供了一种图像分类装置,包括:第一获取模块,用于获取目标图像;第一处理模块,用于利用图像分类模型对目标图像进行处理,得到目标图像对应的分类结果,其中,图像分类模型通过图像样本和目标样本对预训练模型进行调整得到,目标样本为预设样本集合中图像样本相对应的预设样本,预训练模型通过预设样本集合进行训练得到。
根据本申请实施例的另一个方面,还提供了一种图像分类装置,包括:第三获取模块,用于获取建筑物图像;第三处理模块,用于利用图像分类模型对建筑物图像进行处理,得到建筑物图像包含的建筑物的分类结果,其中,图像分类模型通过图像样本和目标样本对预训练模型进行调整得到,目标样本为图斑分类样本集合中图像样本相对应的图斑分类样本,预训练模型图斑分类样本集合训练得到。
根据本申请实施例的另一个方面,还提供了一种图像分类装置,包括:第一上传模块,用于接收客户端上传的目标图像;第四处理模块,用于利用图像分类模型对目标图像进行处理,得到目标图像对应的分类结果,其中,图像分类模型通过图像样本和目标样本对预训练模型进行调整得到,目标样本为预设样本集合中图像样本相对应的预设样本,预训练模型通过预设样本集合进行训练得到;第一反馈模块,用于将图像分类模型反馈至客户端。
根据本申请实施例的另一个方面,还提供了一种计算机可读存储介质,计算机可读存储介质包括存储的程序,其中,在程序运行时控制计算机可读存储介质所在设备执行上述任意一个实施例中的图像分类方法。
根据本申请实施例的另一个方面,还提供了一种计算机终端,包括:处理器和存储器,处理器用于运行存储器中存储的程序,其中,程序运行时执行上述任意一个实施例中的图像分类方法。
在本申请实施例中,在获取到目标图像之后,利用图像分类模型对所述目标图像进行处理,得到所述目标图像对应的分类结果,实现提高图像分类模型精确度的目的。容易注意到的是,由于目标样本是基于目标图像从预设样本集合中得到的,其与目标图像之间的相似度较高,因此,目标样本可以作为训练图像分类模型的扩充数据,使得用于训练图像分类模型的数据量足够大,因此,训练得到的图像分类模型的准确度较高,可以达到提高目标图像的分类准确度,进而解决了相关技术中由于数据样本量少、图像分类模型的准确度较低,从而导致图像分类的准确度较低的技术问题。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的一种用于图像分类方法的计算机终端(或移动设备)的硬件结构框图。
图2是根据本申请实施例1的一种图像分类方法的流程图;
图3是根据本申请实施例的一种交互界面的示意图;
图4是根据本申请实施例的一种可选的交互界面的示意图;
图5是根据本申请实施例一种对进行残差网络改进的流程图;
图6是根据本申请实施例1的另一种图像分类方法的流程图;
图7是根据本申请实施例2的一种图像分类方法的流程图;
图8是根据本申请实施例3的一种图像分类方法的流程图;
图9是根据本申请实施例4的一种图像分类方法的流程图;
图10是根据本申请实施例5的一种图像分类装置的示意图;
图11是根据本申请实施例6的一种图像分类装置的示意图;
图12是根据本申请实施例7的一种图像分类装置的示意图;
图13是根据本申请实施例8的一种图像分类装置的示意图;
图14是根据本申请实施例9的一种图像分类方法的流程图;
图15是根据本申请实施例10的一种图像分类方法的流程图
图16是根据本申请实施例的一种计算机终端的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
首先,在对本申请实施例进行描述的过程中出现的部分名词或术语适用于如下解释:
图斑:可以是指单一地类地块、以及被土地权属界线或线状地物分割的单一地类地块。
蒙板:可以是将不同灰度色值转化为不同的透明度,并作用到它所在的图层,使图层不同部位透明度产生相应的变化,其中,蒙板的白色可以表示选区,蒙板的黑色可以表示非选区。
随着卫星和机载传感器的发展,遥感和航拍图像和视频数据的获取越来越便捷,这些数据在城市规划等方面都得到了广泛的应用。因此,分析遥感和航拍图像中的信息愈发重要。然而,对这些数据进行标注需要消耗大量的人力资源,这极大的提高了遥感数据的利用成本。另外,将遥感数据在运用到不同场景上时,由于不同的任务需求,对于数据的标注规则也不尽相同,这使得复用现有标注数据变得极为困难。
对施工项目的进展情况进行预测是城市规划中一项重要的任务,按照施工进展情况,通常将施工项目分为未动工、已动工和已建成三个类别。相较于实地现场调研,基于航拍图像预测施工项目的进展情况具有实施方便、人力成本低、实时性高的优点。具体来说,利用图像分类模型对航拍图像中的指定区域进行分类,从而得到指定区域的施工进展情况。
卷积神经网络(Convolutional Neural Networks,CNN)作为一种典型的深度学习模型,是一类包含卷积计算且具有深度结构的前馈神经网络。随着深度学习技术的不断进步,CNN在图像分类领域取得了巨大突破,利用CNN对航拍图像进行分类具有重要的学术研究价值。然而深度神经网络的训练需要大量的标注数据,较小的数据集会使得深度神经网络产生严重的过拟合问题,极易导致模型的泛化能力差。针对这个问题,小样本学习(FewShot Learning,FSL)问题被提出。小样本学习旨在仅利用较少的数据获得良好的泛化性能,因此小样本学习能够帮助减轻收集大规模监督数据或人工标注的困难,使得深度学习在工业环境下使用更加方便。
卷积神经网络在相同场景下抽取的特征信息大致相同,因此对于关注轮廓、颜色、形状等浅层特征的层参数可以复用。而仅仅只对深层和差异层进行梯度回传并更新参数,这种参数更新方法称为微调(finetune)。微调是小样本学习最常用的手段之一,一方面通过大批量数据训练模型得到具有良好特征提取能力的预训练模型,在数据量较小的分布相似场景上对预训练模型进行微调可以极大的提高模型的泛化能力,另一方面大规模数据集训练的时间、资源开销较大,微调便成为算法应用的重要环节之一。常见的微调方法通常包含一下几个步骤:(1)构建大规模数据集;(2)在大规模数据集上训练模型得到预训练模型;(3)构建分布与大规模数据集相似的小规模数据集;(4)利用预训练模型的参数作为初始化参数,冻结部分低层参数,使用较小的学习率在小样本数据集上进行训练,即微调。但是在两个分布差异较大的数据集间使用微调效果会显著下降。
施工项目的进展情况分类与常规的地物场景分类存在较大的分布差异,如何利用大规模的常规地物场景分类数据辅助小样本的施工项目进展分类,是一个很值得研究的内容。但是目前这方面的工作很少。
为了解决上述问题,本申请提供了一种图像分类方法,通过补充辅助数据,从而扩充用于训练模型的训练数据,进而达到采用大量训练数据对图像分类模型进行训练的目的。
实施例1
根据本申请实施例,还提供了一种图像分类方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。图1示出了一种用于实现图像分类方法的计算机终端(或移动设备)的硬件结构框图。如图1所示,计算机终端10(或移动设备10)可以包括一个或多个(图中采用102a、102b,……,102n来示出)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输装置106。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为BUS总线的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
应当注意到的是上述一个或多个处理器102和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算机终端10(或移动设备)中的其他元件中的任意一个内。如本申请实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。
存储器104可用于存储应用软件的软件程序以及模块,如本申请实施例中的图像分类方法对应的程序指令/数据存储装置,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的图像分类方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
显示器可以例如触摸屏式的液晶显示器(LCD),该液晶显示器可使得用户能够与计算机终端10(或移动设备)的用户界面进行交互。
图1示出的硬件结构框图,不仅可以作为上述计算机终端10(或移动设备)的示例性框图,还可以作为上述服务器的示例性框图,一种可选实施例中,上述的服务器可以是本地部署的服务器或云端服务器,经由数据网络连接或电子连接到一个或多个客户端。数据网络连接可以是局域网连接、广域网连接、因特网连接,或其他类型的数据网络连接。
上述运行环境下,本申请提供了如图2所示的图像分类方法。图2是根据本申请实施例1的一种图像分类方法的流程图。如图2所示,该方法可以包括如下步骤:
步骤S202,获取目标图像。
上述的目标图像可以是遥感图像,也可以是无人机拍摄的航拍图像,还可以是雷达图像,但不仅限于此。在施工项目的应用场景中,目标图像可以是未动工的施工图像、已动工的施工图像以及已建成的施工图像等建筑物图像;在农林业场景领域中,目标图像可以是未耕作的耕地图像、正在耕作的耕地图像以及耕作完成的耕地图像;在灾害应用场景中,目标图像可以是灾害前的城市图像、灾害中的城市图像、灾害后的城市图像。
在一种可选的实施例中,目标图像可以由卫星或者无人机拍摄,并通过网络传输给服务器,由服务器处理,同时可以将目标图像展示给用户,如图3所示,目标图像可以显示在图像采集区域内;在另一种可选的实施例中,目标图像可以由卫星或无人机拍摄,并由用户主动上传至服务器,由服务器处理,如图4所示,用户可以通过点击交互界面中的“上传图像”按钮,或将目标图像直接拖入虚线框的方式完成目标图像上传至服务器的目的,而且,用户上传的图像可以显示在图像采集区域内。此处的服务器可以是部署在本地的服务器,也可以是部署在云端的服务器。
步骤S204,利用图像分类模型对目标图像进行处理,得到目标图像对应的分类结果。
其中,图像分类模型通过图像样本和目标样本对预训练模型进行调整得到,目标样本为预设样本集合中图像样本相对应的预设样本,图像分类模型通过预设样本集合进行训练得到。
上述的图像分类模型可以为卷积神经网络(Convolutional Neural Networks,CNN),其中,卷积神经网络作为一种典型的深度学习模型,是一类包含卷积计算且具有深度结构的前馈神经网络。
在一种可选的实施例中,预设样本集合可以从之前所处理的各种类型的任务中提取。可选的,在遥感影像处理领域中包含有很多类型的任务,例如,变化检测、地物分类、建筑物提取等任务,适用于这些类型任务的样本通用性更高,其样本的标注量也更大。由此,可以提取上述任务中数据集的图像、其图像对应的蒙板信息以及图像对应的标签信息,从而构建大规模的数据集,由此作上述的预设样本集合。
上述的预设样本集合可以为大量的细粒度图斑分类样本。
在另一种可选的实施例中,可以利用图像分类模型提取目标图像的特征和预设样本集合中样本的特征,通过比较目标图像的特征和样本的特征之间的相似度,可以从预设样本集合中确定出相似度较高的特征对应的样本为目标样本。进一步地,可以将目标图像和目标样本进行混合,使用较小的学习率对特征提取模块进行修正,从而得到有较强实用性和鲁棒性的图像分类模型,由于是使用目标图像以及与目标图像相似度较大的目标样本对图像分类模型进行修正,因此,得到的图像分类模型对于目标图像的特征提取更具有针对性,其得到的结果更加的准确。
在另一种可选的实施例中,在服务器中通过图像分类模型在对目标图像和预设样本集合进行处理,确定预设样本集合中目标图像对应的目标样本之后,可以直接展示给用户查看,如图3所示,目标样本可以显示在结果反馈区域内;在另一种可选的实施例中,在服务器中通过图像分类模型对目标图像和预设样本集合进行处理,确定预设样本集合中目标图像对应的目标样本之后,可以通过网络将目标样本反馈给用户的客户端,由客户端展示给用户查看,如图4所示,目标样本可以显示在结果反馈区域内。进一步地,目标样本展示给用户之后,可以通过用户反馈来验证目标样本是否正确,如果用户认为目标样本不正确,可以从预设样本集合中选择目标样本进行反馈,如图3和图4所示,用户可以在结果反馈区域内反馈正确的目标样本,并将其上传至服务器,从而服务器可以根据用户反馈和目标图像对图像分类模型进行修正。
例如,以建筑物施工项目的施工过程为例进行说明,卫星、无人机或雷达采集到未动工的施工图像、已动工的施工图像或者已建成的施工图像之后,可以将各个阶段施工图像直接发送至服务器进行来确定目标样本,也可以传输给客户端,由用户进行选择,并上传需要确定目标样本的施工图像至服务器。服务器在获取到施工图像之后,可以利用预训练模型来对施工图像和预设样本集合进行处理,确定出与施工图像对应的目标样本,该目标样本与施工图像之间的相似度大于一定值,同时,可以利用施工图像和目标样本对预训练模型进行调整,得到图像分类模型,以便提高图像分类模型针对于施工图像特征提取的精确度。在得到目标样本之后,服务器可以直接将目标样本展示给用户查看,或者,服务器将目标样本下发至客户端,由客户端展示给用户查看,从而用户可以看到目标样本是否为与施工图像相似度较高的样本,并可以通过用户的反馈结果对图像分类模型进行优化,提升服务器的性能。
又例如,以农林业场景的耕作过程为例进行说明,卫星、无人机或雷达采集到未耕作的耕地图像、正在耕作的耕作图像或者耕作完成的耕作图像之后,可以将各个阶段的耕作图像直接发送至服务器进行来确定目标样本,也可以传输给客户端,由用户进行选择,并上传需要确定目标样本的耕作图像至服务器。服务器在获取到耕作图像之后,可以利用预训练模型来对耕作图像和预设样本集合进行处理,确定出与耕作图像对应的目标样本,该目标样本与耕作图像之间的相似度大于一定值,同时,可以利用耕作图像和目标样本对预训练模型进行调整,得到图像分类模型,以便提高图像分类模型针对于耕作图像特征提取的精确度。在得到目标样本之后,服务器可以直接将目标样本展示给用户查看,或者,服务器将目标样本下发至客户端,由客户端展示给用户查看,从而用户可以看到目标样本是否为与耕作图像相似度较高的样本,并可以通过用户的反馈结果对图像分类模型进行优化,提升服务器的性能。
又例如,以灾害应用场景的受灾场景为例进行说明,卫星、无人机或雷达采集到灾害前的城市图像、灾害中的城市图像或者灾害后的城市图像之后,可以将各个阶段的城市图像直接发送至服务器进行来确定目标样本,也可以传输给客户端,由用户进行选择,并上传需要确定目标样本的城市图像至服务器。服务器在获取到城市图像之后,可以利用预训练模型来对城市图像和预设样本集合进行处理,确定出与城市图像对应的目标样本,该目标样本与城市图像之间的相似度大于一定值,同时,可以利用城市图像和目标样本对预训练模型进行调整,得到图像分类模型,以便提高图像分类模型针对于城市图像特征提取的精确度。在得到目标样本之后,服务器可以直接将目标样本展示给用户查看,或者,服务器将目标样本下发至客户端,由客户端展示给用户查看,从而用户可以看到目标样本是否为与城市图像相似度较高的样本,并可以通过用户的反馈结果对图像分类模型进行优化,提升服务器的性能。
通过本申请上述实施例提供的方案,在获取到目标图像之后,利用图像分类模型对目标图像进行处理,得到目标图像对应的分类结果,实现提高图像分类模型精确度的目的。容易注意到的是,由于目标样本是基于目标图像从预设样本集合中得到的,其与目标图像之间的相似度较高,因此,目标样本可以作为训练图像分类模型的扩充数据,使得用于训练图像分类模型的数据量足够大,因此,训练得到的图像分类模型的准确度较高,可以达到提高目标图像的分类准确度,进而解决了相关技术中由于数据样本量少、图像分类模型的准确度较低,从而导致图像分类的准确度较低的技术问题。
本申请上述实施例中,该方法还包括:利用图像分类模型对目标图像和预设样本集合包含的多个预设样本进行处理,得到目标图像的第一特征,以及多个预设样本的第二特征;基于第一特征与多个第二特征的相似度,确定目标样本。
可选的,基于第一特征与多个第二特征的相似度,确定目标样本包括:获取第一特征和每个第二特征的相似度,得到多个相似度;确定相似度大于预设相似度的第二特征对应的预设样本为目标样本。
在一种可选的实施例中,为了获得与目标图像最相似的目标样本,可以以余弦相似度作为度量指标,通过计算目标图像的第一特征与多个预设样本的第二特征之间的余弦相似度,可以确定出目标样本。其余弦相似度的计算公式可以如下:
Figure BDA0003280800190000101
其中,dAB可以表示第一特征和第二特征之间的余弦相似度,A可以为第一特征,B可以为第二特征。
示例性的,可以设置需要补充的数据空集合,S={},根据上述得到的余弦相似度,对于目标图像xi,可以在预设样本集合中选取200和预设样本Si,给定其目标图像的状态标签为Ipi,加入到补充数据集合中,即S=S+Si,通过S对预训练模型进行修正,来提高图像分类模型的准确度。
本申请上述实施例中,该方法还包括:利用目标图像和目标样本对预训练模型的目标层的网络参数进行修正,其中,预训练模型中除目标层之外的其他层的网络参数保持不变。
上述的目标层可以为用于进行特征识别的全连接层,还可以是残差块。
在一种可选的实施例中,可以将目标图像和目标样本进行混合,得到混合后的训练数据,利用该训练数据对特征提取网络中的目标层进行训练,更新目标层的网络参数,从而达到对目标层的网络参数进行修正的目的,提高图像分类模型的准确度。
本申请上述实施例中,该方法还包括:获取预设样本集合,其中,预设样本集合包括:多个预设样本,每个预设样本对应的蒙板和类别标签,蒙板用于表征相应预设样本中的目标区域,类别标签为目标区域的类别标签;利用初始分类模型对多个预设样本和多个预设样本对应的蒙板进行特征提取,并对多个预设样本对应的融合特征进行预测处理,得到多个预设样本对应的类别识别结果,其中,融合特征通过将相应预设样本的第三特征和相应蒙版的第四特征进行融合得到,类别识别结果为目标区域的类别识别结果;基于述多个预设样本对应的类别识别结果和类别标签,得到初始分类模型的损失值;基于损失值与预设损失值的比对结果调整初始分类模型,得到预训练模型。
上述的蒙板可以是将不同灰度色值转化为不同的透明度,并作用到它所在的图层,使图层不同部位透明度产生相应的变化,其中,蒙板的白色可以表示选区,蒙板的黑色可以表示非选区。上述的蒙板可以为单通道蒙板。
在一种可选的实施例中,可以通过蒙板选取预设样本中与目标任务对应的图像,例如,目标任务可以为获取施工进度,则可以通过蒙板选取预设样本中与施工区域对应的图像,即,利用蒙板表示施工区域的信息。
在另一种可选的实施例中,可以结合蒙板通过初始分类模型对多个预设样本进行识别,可以得到多个预设样本对应的类别识别结果,通过比对类别识别结果和类别标签,计算得到初始分类模型的损失值,通过损失值可以确定初始分类模型是否具有较高的准确度,若损失值小于一定值(即上述的预设损失值),则说明初始分类模型具有较高的准确度,此时,不需要继续对初始分类模型进行训练,得到预训练模型;若损失值大于一定值,则说明初始分类模型具有较低的准确度,此时,需要继续对初始分类模型进行训练,调整初始分类模型的网络参数。
本申请上述实施例中,该方法还包括:利用图像分类模型中的前两个残差块对每个预设样本进行处理,得到每个预设样本的样本特征;利用图像分类模型中的卷积层对每个预设样本对应的蒙板进行处理,得到每个预设样本的蒙板特征;将样本特征和蒙板特征进行叠加,得到每个预设样本的第一图像特征;利用图像分类模型中的后两个残差块对第一图像特征进行处理,得到每个预设样本的第二图像特征;利用图像分类模型中的输出层对第二图像特征进行处理,得到每个预设样本的类别识别结果。
在一种可选的实施例中,为了使目标任务对应的信息能够融入到图像分类模型中,可以利用图像分类模型中的前两个残差块对每个预设样本进行处理,得到每个预设样本的特征,以便后期与目标任务对应的蒙板特征进行融合;然后利用图像分类模型中的卷积层对每个预设样本对应的蒙板进行处理,具体的,可以先根据预设样本的特征尺寸对其对应的蒙板进行调整,得到每个预设样本的蒙板特征;最后可以将样本特征与蒙板特征进行叠加,得到每个预设样本的第一图像特征,其中,第一图像特征为包含有目标任务信息的特征,可以利用图像分类模型中的后两个残差快对第一图像特征进行全局池化操作,使得一层全连接映射到类别空间中,使用分类器(softmax)得到每个类别特征对应的概率,即上述的类别识别结果。
上述的目标任务可以是获取施工区域信息,第一图像特征中可以包含有施工区域信息。
示例性的,为了将施工区域信息融合到特征提取网络中,可以在残差卷积神经网络(ResNeSt50)的基础上加入蒙板信息融合分支,首先使用最近邻方法将蒙版尺寸调与第二个残差块输出特征对齐,然后使用一次卷积操作将单通道的蒙板拓展至512维得到蒙板特征,最后将蒙板特征与样本特征相加,输入到后续网络。
如图5所示,可以在ResNeSt50的基础上进行改进。为了将施工区域信息融入到网络中,可以使用单通道的蒙板表示施工区域信息,使用最近邻差值将蒙板调整至与第二个残差块输出特征相同尺寸,然后使用一层卷积核大小为3*3的卷积操作将单通道的蒙板映射到512个通道,将得到的蒙板特征与样本特征相加,即可得到包含有区域信息的第二图像特征,将得到的第二图像特征送入后续操作,然后对第四个残差块得到的图像特征去全局池化操作,使用一层全连接映射到类别空间,使用softmax得到每个类别对应的概率,即上述的类别识别结果。
本申请上述实施例中,在利用图像分类模型对多个预设样本和多个预设样本对应的蒙板进行处理,得到多个预设样本对应的类别识别结果之前,该方法还包括:利用双线性插值算法将每个预设样本的尺寸调整为第一预设尺寸;利用最近邻差值算法将每个预设样本对应的蒙板的尺寸调整为第二预设尺寸,其中,第二预设尺寸与每个预设样本的样本特征的尺寸相同。
上述的第一预设尺寸和第二预设尺寸可以自行设置,例如,可以第一预设尺寸可以设置为600*600,第二预设尺寸可以设置为600*600。
在一种可选的实施例中,可以使用双线性插值将预设样本的尺寸调整为600*600,对应地,使用最近邻差值将蒙板尺寸同样调整为600*600,利用进行尺寸调整后的多个预设样本和尺寸调整后的蒙板对特征提取网络进行训练。
在另一种可选的实施例中,可以按照4:1的比例将预设样本划分为训练集以及测试集,其中,使用训练集对特征提取网络进行训练,使用测试集对特征提取网络进行测试。具体的,在使用训练集对特征提取网络进行训练的过程中,可以采用交叉熵损失函数对网络的参数进行调整,使得图像分类模型的参数在进行验证时可以使其分类的准确率较高,从而得到较优的图像分类模型。
示例性的,首先可以按照4:1的比例将预设样本划分为训练集和测试集,根据图像分类模型在测试集上的性能调整模型参数,以得到较优的图像分类模型。由于图斑分类数据和施工项目数据同属于遥感数据,因此在图斑分类数据上得到的图像分类模型在浅层特征上的提取能力能够很好的泛化到施工项目数据上。
本申请上述实施例中,获取预设样本集合包括:确定目标图像的目标尺寸;基于目标尺寸从数据集中筛选得到预设样本集合,其中,预设样本集合包含的多个预设样本的尺寸与目标尺寸相同。
在一种可选的实施例中,通过确定目标图像的目标尺寸,从数据集中筛选得到预设样本集合,可以使得到的预设样本集合与目标图像保持相似度,且可以减少后续计算特征相似度的数据量,进而通过预设样本集合对图像分类模型进行修正,使得到的图像分类模型具有更高的准确度。
由于数据集中具有足够的类别数量,因此在数据集中得到的图像分类模型所提取的特征包含有区分大部分地物类目的信息。可以使用图像分类模型的卷积和全局池化层提取数据集中与目标图像特征尺寸相同的特征对应的多个预设样本,即,预设样本集合,其中,预设样本集合中的预设样本与目标图像的映射为2048维的向量。
示例性的,可以将目标图像表示为P={p1,p2,…,pn},其中pi={Ipi,Mpi,lpi}包含图像数据Ipi、蒙板数据Mpi和类别标签lpi。使用图像分类模型F(*)对目标图像P和预设样本集合提取特征,即xi=F(pi),yj=F(aj),其中xi和yj均为2048维的向量。
本申请上述实施例中,该方法还包括:输出目标样本;接收目标样本的反馈结果,其中,反馈结果通过对目标样本进行修改得到;利用目标图像和反馈结果对图像分类模型进行修正。
在一种可选的实施例中,由于目标样本的选取结果会影响最终图像分类模型的准确度,为了确保图像分类模型的准确度,在一种可选的实施例中,服务器可以直接将目标样本展示给用户查看,也即,将目标样本展示在交互界面上,在另一种可选的实施例中,服务器可以通过网络将目标样本下发给客户端,由客户端展示给用户查看,也即,将目标样本展示在交互界面上。进一步地,目标样本可以由用户进行确认,如果用户确认无误,则可以直接基于该目标样本和目标图像对图像分类模型进行修正;如果用户确认有误,则用户可以在交互界面上对目标样本进行调整,得到相应的调整结果,并将调整结果反馈给服务器,则可以基于调整结果对目标样本和目标图像对图像分类模型进行修正,而且,可以根据调整结果对图像分类模型进行优化,提升服务器的性能。
本申请上述实施例中,该方法还包括:显示多个任务类型;接收多个任务类型中选中的目标任务类型;显示目标任务类型对应的预训练模型;接收图像样本,并采用图像样本和目标样本对预训练模型进行调整,得到目标任务类型对应的图像分类模型。
上述步骤中的多个任务类型分别对于不同应用场景,例如,地物分类任务、建筑物检测任务、建筑物提取任务、建筑物变化检测任务等,但不仅限于此。
作为一种可选的实施例,可以在交互界面上显示多个应用场景的任务类型,用户可以在交互界面上操作,从多个任务类型中选择一个任务类型作为目标任务类型,服务器可以基于用户的选择构建相应的模型,或者基于用户的选择查找相应的模型,并将其展示给用户查看,进而接收用户提供的图像样本,最后将图像样本和目标样本进行融合得到最终的训练样本,并通过训练样本对预训练模型的网络参数进行调整,得到目标任务类型对应的图像分类模型。
通过上述方案,实现对外提供特定场景下的模型构建的应用,用户可以选择使用的模型训练方式,并提供相应场景下的数据对模型进行训练,输出训练后的模型反馈给用户。
下面结合图6对本申请一种优选的实施例进行详细说明,该方法可以由计算机终端或者服务器进行执行。
步骤S601,引入样本量充足的细粒度图斑分类样本作为辅助数据。
上述的细粒度图斑分类样本可以为预设样本集合。
可选的,可以统计施工项目图斑的尺寸分布,在大规模的地物分类、变化检测和建筑物提取数据集中选取尺寸与之相似的图斑样本,对不同数据集间的同义类目进行合并,获得34个类别,组成辅助数据A={a1,a2,…,an},其中ai={Iai,Mai,lai}包含图像数据Iai、蒙板数据Mai和类别标签lai
步骤S602,搭建能够融合施工区域信息和图像信息的深度神经网络。
如图5所示,可以在ResNeSt的基础上进行改进。为了将施工区域信息融入图像分类网络,可以使用单通道的蒙板表示施工区域信息,使用最近邻差值将蒙板调整至与第二个残差块输出特征相同尺寸,然后使用一层卷积核大小为3*3的卷积操作将单通道的蒙板映射到512个通道,将得到的蒙板特征与图像特征相加,即可得到包含有区域信息的图像特征,将得到的特征送入后续操作。对第四个残差块得到的图像特征去全局池化操作,使用一层全连接映射到类别空间,使用softmax得到每个类别对应的概率。
步骤S603,使用辅助数据对网络进行预训练,得到预训练模型。
上述的预训练模型可以为图像分类模型。
可选的,可以使用步骤S601中的可细粒度图斑分类样本对步骤S602中搭建的深度神经网络进行预训练。首先使用双线性插值将图像尺寸调整为600*600,对应地,使用最近邻差值将蒙板尺寸同样调整为600*600,按照4:1的比例将辅助数据A划分为训练集和测试集。使用训练集对网络进行训练,采用交叉熵损失函数。调整模型的超参,以便模型在验证集上的分类准确率较高,进而得到预训练模型F(*)。
步骤S604,利用预训练模型提取施工项目样本和细粒度图斑分类样本的特征。
可选的,将施工项目数据表示为P={p1,p2,…,pn},其中pi={Ipi,Mpi,lpi}包含图像数据Ipi、蒙板数据Mpi和类别标签lpi。使用模型F(*)对施工项目数据P和图斑分类数据A提取特征,即xi=F(pi),yj=F(aj),其中xi和yj均为2048维的向量。
步骤S605,计算施工项目样本和细粒度图斑分类样本的特征之间的余弦相似度。
可选的,对于任意一对{xi,yj},其余弦相似度的计算方法为:
Figure BDA0003280800190000151
步骤S606,选取与施工项目样本最相似的细粒度图斑分类样本作为补充数据。
可选的,可以设置补充数据空集合,S={},根据步骤S505计算得到的余弦相似度D,对于每一个施工项目样本特征xi,我们在图斑分类数据中选取与其最相似的200个样本Si,给定其施工状态标签为Ipi,加入到补充数据集合中,即S=S+Si
步骤S607,利用施工项目样本和补充数据对预训练模型进行修正。
可选的,补充数据能够在扩充施工项目数据的同时保持近似的数据分布,因此可以将补充数据和原始施工项目数据混合,使用步骤S503得到的预训练模型来固定模型的前3个残差块,使用较小的学习率对第四个残差块和全连接层进行微调,最终得到具有较强实用性和鲁棒性的施工项目进展预测模型。
通过上述步骤,可以利用小样本学习中的微调方法,根据样本特征距离选取补充数据,克服数据分布存在差异的问题,并且利用施工项目的区域范围信息,提出了一种融合区域信息和图像信息的卷积神经网络结构,提高了在施工项目进展预测任务上的分类准确率。
本发明的效果可以通过以下实验进一步说明:
实验条件:本实验采用场景数据集,采用pytorch(深度学习框架),GPU(GraphicsProcessing Unit,图像处理芯片)配置为NVIDIA Tesla P100。
实验内容:本实验利用300个施工项目图斑数据和31,436个细粒度图斑分类数据。为了准确评估小样本情况下的模型分类精度,我们使用五折交叉验证的方法作为评价标准。即将300个施工项目图斑数据随机分为5等份,依次选取一个集合作为验证集,其余集合作为训练集,取五次模型的平均分类精度作为评价标准。
对比方法:为了验证所提方法的优越性,提供了以下四种对比方法:
方法1,直接使用施工项目图斑数据训练分类模型;
方法2,使用细粒度图斑分类数据预训练模型,仅使用施工项目图斑数据微调模型;
方法3,使用细粒度图斑分类数据预训练模型,直接使用细粒度图斑数据中与施工项目类目相匹配的数据作为补充数据,微调模型;
方法4,去除蒙板卷积,训练流程与本文所提方法一致。
实验结果:
可以采用五折交叉验证的平均分类精度(meanOA)作为评价指标,具体结果如下表1所示:
表1
Figure BDA0003280800190000161
由表可见,本申请上能够很好地应用到施工项目状态预测任务上,相较于对比方法有着更高的分类精度。
以上,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。
实施例2
根据本申请实施例,还提供一种图像分类方法,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图7是根据本申请实施例2的一种图像分类方法的流程图。如图7所示,该方法可以包括如下步骤:
步骤S702,获取建筑物图像。
步骤S704,利用图像分类模型对建筑物图像进行处理,得到建筑物图像包含的建筑物的分类结果。
其中,图像分类模型通过图像样本和目标样本对预训练模型进行调整得到,目标样本为图斑分类样本集合中图像样本相对应的图斑分类样本,预训练模型图斑分类样本集合训练得到。
本申请上述实施例中,该方法还包括:基于分类结果确定建筑物的标记方式;按照标记方式对建筑物进行标记,得到第一标记图像;显示第一标记图像。
上述步骤中的标记方式可以是图像中不同区域的颜色、线条等,但不仅限于此。
在一种可选的实施例中,为了方便用户查看建筑物的分类结果,可以根据不同类别的建筑物,采用不同区域划分方式进行标记,并展示给用户查看,例如,未施工类别的建筑物所在区域,可以采用绿色;完成施工类别的建筑物所在区域,可以用蓝色,但不仅限于此。
本申请上述实施例中,该方法还包括:基于分类结果对建筑物进行标记,得到第二标记图像;显示第二标记图像。
在一种可选的实施例中,为了方便用户确定不同建筑物的类别,可以在建筑物图像中建筑物的旁边,标记出分类结果。
本申请上述实施例中,该方法还包括:显示分类结果;接收分类结果对应的反馈信息,其中,反馈信息通过对分类结果进行修改得到;基于反馈信息对图像分类模型进行调整。
在一种可选的实施例中,对于分类结果,可以在交互界面中进行显示,从而用户可以查看到每个建筑物的分类结果,进一步地,用户可以对分类结果进行确认,如果用户发现分类结果错误,则可以在交互界面上对分类结果进行修改,并将反馈信息上传至服务器,由服务器根据用户的反馈进行模型优化,进一步提升图像分类模型的准确度。
本申请上述实施例中,该方法还包括:利用图像分类模型对建筑物图像和图斑分类样本集合包含的多个图斑分类样本进行处理,得到建筑物图像的第一特征,以及多个图斑分类样本的第二特征;基于第一特征与多个第二特征的相似度,确定目标样本。
可选的,基于第一特征与多个第二特征的相似度,确定目标样本包括:获取第一特征和每个第二特征的相似度,得到多个相似度;确定相似度大于预设相似度的第二特征对应的图斑分类样本为目标样本。
可选的,该方法还包括:利用建筑物图像和目标样本对预训练模型的目标层的网络参数进行修正,其中,预训练模型中除目标层之外的其他层的网络参数保持不变。
可选的,该方法还包括:获取图斑分类样本集合,其中,图斑分类样本集合包括:多个预设样本,每个预设样本对应的蒙板和类别标签,蒙板用于表征相应预设样本中的目标区域,类别标签为目标区域的类别标签;利用初始分类模型对多个预设样本和多个预设样本对应的蒙板进行特征提取,并对多个预设样本对应的融合特征进行预测处理,得到多个预设样本对应的类别识别结果,其中,融合特征通过将相应预设样本的第三特征和相应蒙版的第四特征进行融合得到,类别识别结果为目标区域的类别识别结果;基于多个预设样本对应的类别识别结果和类别标签,得到初始分类模型的损失值;基于损失值与预设损失值的比对结果调整初始分类模型,得到预训练模型。
可选的,该方法还包括:输出目标样本;接收目标样本的反馈结果,其中,反馈结果通过对目标样本进行修改得到;利用建筑物图像和反馈结果对图像分类模型进行修正。
本申请上述实施例中,该方法还包括:显示多个任务类型;接收多个任务类型中选中的目标任务类型;显示目标任务类型对应的预训练模型;接收图像样本,并采用图像样本和目标样本对预训练模型进行调整,得到目标任务类型对应的图像分类模型。
需要说明的是,本申请上述实施例中涉及到的优选实施方案与实施例1提供的方案以及应用场景、实施过程相同,但不仅限于实施例1所提供的方案。
实施例3
根据本申请实施例,还提供了一种图像分类方法,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图8是根据本申请实施例3的一种图像分类方法的流程图。如图8所示,该方法可以包括如下步骤:
步骤S802,云服务器接收客户端上传的目标图像。
步骤S804,云服务器利用图像分类模型对目标图像进行处理,得到目标图像对应的分类结果。
其中,图像分类模型通过图像样本和目标样本对预训练模型进行调整得到,目标样本为预设样本集合中图像样本相对应的预设样本,图像分类模型通过预设样本集合训练得到。
步骤S806,云服务器将分类结果反馈至客户端。
可选的,该方法还包括:云服务器利用图像分类模型对目标图像和预设样本集合包含的多个预设样本进行处理,得到目标图像的第一特征,以及多个预设样本的第二特征;云服务器基于第一特征与多个第二特征的相似度,确定目标样本。
可选的,云服务器基于第一特征与多个第二特征的相似度,确定目标样本包括:云服务器获取第一特征和每个第二特征的相似度,得到多个相似度;云服务器确定相似度大于预设相似度的第二特征对应的预设样本为目标样本。
可选的,该方法还包括:云服务器利用目标图像和目标样本对预训练模型的目标层的网络参数进行修正,其中,预训练模型中除目标层之外的其他层的网络参数保持不变。
可选的,该方法还包括:云服务器获取预设样本集合,其中,预设样本集合包括:多个预设样本,每个预设样本对应的蒙板和类别标签,蒙板用于表征相应预设样本中的目标区域,类别标签为目标区域的类别标签;云服务器利用初始分类模型对多个预设样本和多个预设样本对应的蒙板进行特征提取,并对多个预设样本对应的融合特征进行预测处理,得到多个预设样本对应的类别识别结果,其中,融合特征通过将相应预设样本的第三特征和相应蒙版的第四特征进行融合得到,类别识别结果为目标区域的类别识别结果;云服务器基于多个预设样本对应的类别识别结果和类别标签,得到初始分类模型的损失值;云服务器基于损失值与预设损失值的比对结果调整初始分类模型,得到预训练模型。
可选的,该方法还包括:云服务器输出多个任务类型;云服务器接收多个任务类型中选中的目标任务类型;云服务器输出目标任务类型对应的预训练模型;云服务器接收图像样本,并采用图像样本和目标样本对预训练模型进行调整,得到目标任务类型对应的图像分类模型。
需要说明的是,本申请上述实施例中涉及到的优选实施方案与实施例1提供的方案以及应用场景、实施过程相同,但不仅限于实施例1所提供的方案。
实施例4
根据本申请实施例,还提供了一种图像分类方法,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图9是根据本申请实施例4的一种图像分类方法的流程图。如图9所示,该方法可以包括如下步骤:
步骤S902,云服务器接收客户端上传的模型训练请求。
步骤S904,云服务器获取模型训练请求对应的目标图像。
步骤S906,云服务器利用预训练模型对目标图像和预设样本集合进行处理,确定预设样本集合中目标图像对应的目标样本。
其中,预训练模型通过预设样本集合训练得到。
步骤S908,云服务器利用目标图像和目标样本对预训练模型进行调整,得到图像分类模型。
步骤S910,云服务器将图像分类模型反馈至客户端。
可选的,云服务器利用图像分类模型对目标图像和预设样本集合进行处理,确定预设样本集合中目标图像对应的目标样本包括:云服务器利用图像分类模型对目标图像和预设样本集合包含的多个预设样本进行处理,得到目标图像的第一特征,以及多个预设样本的第二特征;云服务器基于第一特征与多个第二特征的相似度,确定目标样本。
可选的,云服务器基于第一特征与多个第二特征的相似度,确定目标样本包括:云服务器获取第一特征和每个第二特征的相似度,得到多个相似度;云服务器确定相似度大于预设相似度的第二特征对应的预设样本为目标样本。
可选的,该方法还包括:云服务器利用目标图像和目标样本对预训练模型的目标层的网络参数进行修正,其中,预训练模型中除目标层之外的其他层的网络参数保持不变。
可选的,该方法还包括:云服务器获取预设样本集合,其中,预设样本集合包括:多个预设样本,每个预设样本对应的蒙板和类别标签,蒙板用于表征相应预设样本中的目标区域,类别标签为目标区域的类别标签;云服务器利用初始分类模型对多个预设样本和多个预设样本对应的蒙板进行特征提取,并对多个预设样本对应的融合特征进行预测处理,得到多个预设样本对应的类别识别结果,其中,融合特征通过将相应预设样本的第三特征和相应蒙版的第四特征进行融合得到,类别识别结果为目标区域的类别识别结果;云服务器基于多个预设样本对应的类别识别结果和类别标签,得到初始分类模型的损失值;云服务器基于损失值与预设损失值的比对结果调整初始分类模型,得到预训练模型。
可选的,该方法还包括:云服务器输出多个任务类型;云服务器接收多个任务类型中选中的目标任务类型;云服务器输出目标任务类型对应的预训练模型;云服务器接收图像样本,并采用图像样本和目标样本对预训练模型进行调整,得到目标任务类型对应的图像分类模型。
需要说明的是,本申请上述实施例中涉及到的优选实施方案与实施例1提供的方案以及应用场景、实施过程相同,但不仅限于实施例1所提供的方案。
实施例5
根据本申请实施例,还提供了一种用于实施上述图像分类方法的图像分类装置,如图10所示,该装置1000包括:第一获取模块1002、第一处理模块1004。
其中,第一获取模块用于获取目标图像;第一处理模块用于用图像分类模型对目标图像进行处理,得到目标图像对应的分类结果,其中,图像分类模型通过图像样本和目标样本对预训练模型进行调整得到,目标样本为预设样本集合中图像样本相对应的预设样本,预训练模型通过预设样本集合进行训练得到。
此处需要说明的是,上述第一获取模块1002、第一处理模块1004对应于实施例1中的步骤S202至步骤S204,两个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例1提供的计算机终端10中。
本申请上述实施例中,该装置还包括:第一处理单元、第一确定单元。
其中,第一处理单元用于利用图像分类模型对目标图像和预设样本集合包含的多个预设样本进行处理,得到目标图像的第一特征,以及多个预设样本的第二特征;第一确定单元用于基于第一特征与多个第二特征的相似度,确定目标样本。
本申请上述实施例中,第一确定单元还用于获取第一特征和每个第二特征的相似度,得到多个相似度,并确定相似度大于预设相似度的第二特征对应的预设样本为目标样本。
本申请上述实施例中,该装置还包括:第一修正单元。
其中,第一修正单元用于利用目标图像和目标样本对预训练模型的目标层的网络参数进行修正,其中,预训练模型中除目标层之外的其他层的网络参数保持不变。
本申请上述实施例中,该装置还包括:第二获取模块、第二处理模块、损失模块、判断模块。
其中,第二获取模块用于获取预设样本集合,其中,预设样本集合包括:多个预设样本,每个预设样本对应的蒙板和类别标签,蒙板用于表征相应预设样本中的目标区域,类别标签为目标区域的类别标签;第二处理模块用于利用初始分类模型对多个预设样本和多个预设样本对应的蒙板进行特征提取,并对多个预设样本对应的融合特征进行预测处理,得到多个预设样本对应的类别识别结果,其中,融合特征通过将相应预设样本的第三特征和相应蒙版的第四特征进行融合得到,类别识别结果为目标区域的类别识别结果;损失模块用于基于述多个预设样本对应的类别识别结果和类别标签,得到初始分类模型的损失值;判断模块用于基于损失值与预设损失值的比对结果调整初始分类模型,得到预训练模型。
本申请上述实施例中,第二处理模块包括:第二处理单元、第三处理单元、叠加单元、第四处理单元、第五处理单元。
其中,第二处理单元用于利用图像分类模型中的前两个残差块对每个预设样本进行处理,得到每个预设样本的样本特征;第三处理单元用于利用图像分类模型中的卷积层对每个预设样本对应的蒙板进行处理,得到每个预设样本的蒙板特征;叠加单元用于将样本特征和蒙板特征进行叠加,得到每个预设样本的第一图像特征;第四处理单元用于利用图像分类模型中的后两个残差块对第一图像特征进行处理,得到每个预设样本的第二图像特征;第五处理单元用于利用图像分类模型中的输出层对第二图像特征进行处理,得到每个预设样本的类别识别结果。
本申请上述实施例中,该装置还包括:第一调整单元、第二调整单元。
其中,第一调整单元用于利用双线性插值算法将每个预设样本的尺寸调整为第一预设尺寸;第二调整单元用于利用最近邻差值算法将每个预设样本对应的蒙板的尺寸调整为第二预设尺寸,其中,第二预设尺寸与每个预设样本的样本特征的尺寸相同。
本申请上述实施例中,第二获取模块包括:第二确定单元、第一筛选单元。
其中,第二确定单元用于确定目标图像的目标尺寸;第一筛选单元用于基于目标尺寸从数据集中筛选得到预设样本集合,其中,预设样本集合包含的多个预设样本的尺寸与目标尺寸相同。
本申请上述实施例中,该装置还包括:第一输出模块、第一接收模块、第一修正模块。
其中,第一输出模块用于输出目标样本;第一接收模块用于接收目标样本的反馈结果,其中,反馈结果通过对目标样本进行修改得到;第一修正模块用于利用目标图像和反馈结果对图像分类模型进行修正。
本申请上述实施例中,该装置还包括:第一显示模块、第二接收模块、第二显示模块、第二修正模块。
其中,第一显示模块用于显示多个任务类型;第二接收模块用于接收多个任务类型中选中的目标任务类型;第二显示模块用于显示目标任务类型对应的预训练模型;第二修正模块用于接收图像样本,并采用图像样本和目标样本对预训练模型进行调整,得到目标任务类型对应的图像分类模型。
需要说明的是,本申请上述实施例中涉及到的优选实施方案与实施例1提供的方案以及应用场景、实施过程相同,但不仅限于实施例1所提供的方案。
实施例6
根据本申请实施例,还提供了一种用于实施上述图像分类方法的图像分类装置,如图11所示,该装置1100包括:第三获取模块1102、第三处理模块1104。
其中,第三获取模块用于获取建筑物图像;第三处理模块用于利用图像分类模型对建筑物图像进行处理,得到建筑物图像包含的建筑物的分类结果。
此处需要说明的是,上述第三获取模块1102、第三处理模块1104对应于实施例2中的步骤S702至步骤S704,两个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例2所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例1提供的计算机终端10中。
本申请上述实施例中,该装置还包括:第一确定模块、第一标记模块、第三显示模块。
其中,第一确定模块用于基于分类结果确定建筑物的标记方式;第一标记模块用于按照标记方式对建筑物进行标记,得到第一标记图像;第三显示模块用于显示第一标记图像。
本申请上述实施例中,该装置还包括:第二标记模块、第四显示模块。
其中,第二标记模块用于基于分类结果对建筑物进行标记,得到第二标记图像;第四显示模块,用于显示第二标记图像。
本申请上述实施例中,该装置还包括:第五显示模块、第三接收模块、第三修正模块。
第五显示模块,用于显示分类结果;第三接收模块用于接收分类结果对应的反馈信息,其中,反馈信息通过对分类结果进行修改得到;第三修正模块用于基于反馈信息对图像分类模型进行调整。
需要说明的是,本申请上述实施例中涉及到的优选实施方案与实施例1提供的方案以及应用场景、实施过程相同,但不仅限于实施例1所提供的方案。
实施例7
根据本申请实施例,还提供了一种用于实施上述图像分类方法的图像分类装置,如图12所示,该装置1200包括:第一上传模块1202、第四处理模块1204、第一反馈模块1206。
其中,第一上传模块用于接收客户端上传的目标图像;第四处理模块用于利用图像分类模型对目标图像进行处理,得到目标图像对应的分类结果,其中,图像分类模型通过图像样本和目标样本对预训练模型进行调整得到,目标样本为预设样本集合中图像样本相对应的预设样本,图像分类模型通过预设样本集合训练得到;第一反馈模块用于将图像分类模型反馈至客户端。
此处需要说明的是,上述第一上传模块1202、第四处理模块1204、第一反馈模块1206对应于实施例3中的步骤S802至步骤S806,三个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例3所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例1提供的计算机终端10中。
需要说明的是,本申请上述实施例中涉及到的优选实施方案与实施例1提供的方案以及应用场景、实施过程相同,但不仅限于实施例1所提供的方案。
实施例8
根据本申请实施例,还提供了一种用于实施上述图像分类方法的图像分类装置,如图13所示,该装置1300包括:第二上传模块1302、第四获取模块1304、第五处理模块1306、第四修正模块1308、第二反馈模块1310。
其中,第二上传模块用于云服务器接收客户端上传的模型训练请求;第四获取模块用于获取模型训练请求对应的目标图像;第五处理模块用于利用预训练模型对目标图像和预设样本集合进行处理,确定预设样本集合中目标图像对应的目标样本,其中,预训练模型通过预设样本集合训练得到;第四修正模块用于利用目标图像和目标样本对预训练模型进行调整,得到图像分类模型;第二反馈模块用于将图像分类模型反馈至客户端。
此处需要说明的是,上述第二上传模块1302、第四获取模块1304、第五处理模块1306、第四修正模块1308、第二反馈模块1310对应于实施例4中的步骤S902至步骤S910,五个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例4所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例1提供的计算机终端10中。
需要说明的是,本申请上述实施例中涉及到的优选实施方案与实施例1提供的方案以及应用场景、实施过程相同,但不仅限于实施例1所提供的方案。
实施例9
根据本申请实施例,还提供一种图像分类方法,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图14是根据本申请实施例9的一种图像分类方法的流程图。如图14所示,该方法可以包括如下步骤:
步骤S1402,获取自然资源图像。
步骤S1404,利用地物分类模型对自然资源图像进行处理,得到自然资源图像对应的地物类型。
其中,地物分类模型通过图像样本和目标样本对预训练模型进行调整得到,目标样本为预设样本集合中图像样本相对应的预设样本,预训练模型通过预设样本集合进行训练得到。
需要说明的是,本发明实施例可以但不限于适用于地物分类实际应用场景,用于采用地物分类模型对上述自然资源图像进行分析,获取自然资源图像对应的地物类型。例如,耕地、城市地域、水域、海域、矿产、森林植被、沙漠、热带雨林等等地物类型。
例如,还可以应用于如下技术领域:气象领域(例如,云层提取、气象预报、气象预警等);自然资源与生态环境领域(例如,气象预报、变化检测、生态红线变化检测、多分类变化检测、地物分类、大棚提取、路网提取、建筑物提取、建筑物变化检测(卫星、无人机)等;水利领域(例如,水域变化检测、大棚提取、水体提取(光学、雷达)、片林提取、网箱养殖提取、采砂场提取、临河房屋提取、拦河坝提取、光伏电厂提取等);农林业领域(例如,作物提取(小麦、水稻、土豆等)、无人机作物识别(玉米、烤烟、薏仁米等)、地块识别、长势监测(指数计算)、农业估产、病虫害监测、种植建议推送等;次生灾害领域(例如,灾害监测、灾害预警等);生活服务(出行、外卖、物流)领域(例如,出行路径规划、出行建议推送、人员调动、价格调整等);城市规划领域(例如,路网提取(卫星、无人机)、建筑物提取、建筑物变化检测(卫星、无人机)、消防等)。
本发明上述实施例中,该方法还包括:显示地物类型;接收地物类型对应的反馈信息,其中,反馈信息为对地物类型进行修改得到;基于反馈信息对地物分类模型进行调整。
需要说明的是,本申请上述实施例中涉及到的优选实施方案与实施例1提供的方案以及应用场景、实施过程相同,但不仅限于实施例1所提供的方案。
实施例10
根据本申请实施例,还提供一种图像分类方法,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图15是根据本申请实施例10的一种图像分类方法的流程图。如图15所示,该方法可以包括如下步骤:
步骤S1502,获取建筑物图像。
步骤S1504,利用变化检测模型对建筑物图像进行处理,得到建筑物图像是否发生变化的检测结果。
其中,变化检测模型通过图像样本和目标样本对预训练模型进行调整得到,目标样本为预设样本集合中图像样本相对应的预设样本,预训练模型通过预设样本集合进行训练得到。
需要说明的是,本发明实施例可以但不限于适用于地物分类实际应用场景,例如,建筑地物变化检测场景中,用于采用变化检测模型对上述建筑地物变化是否发生变化进行检测,得到建筑物图像是否发生变化的检测结果。例如,从存在建筑物到变为荒地,即表明该建筑物图像中的建筑物被拆迁,或者,从荒地变为存在该建筑物,即表明该建筑物图像中的建筑物为新建的建筑物。
需要说明的是,本申请上述实施例中涉及到的优选实施方案与实施例1提供的方案以及应用场景、实施过程相同,但不仅限于实施例1所提供的方案。
实施例11
本申请的实施例可以提供一种计算机终端,该计算机终端可以是计算机终端群中的任意一个计算机终端设备。可选地,在本实施例中,上述计算机终端也可以替换为移动终端等终端设备。
可选地,在本实施例中,上述计算机终端可以位于计算机网络的多个网络设备中的至少一个网络设备。
在本实施例中,上述计算机终端可以执行图像分类方法中以下步骤的程序代码:获取目标图像;利用图像分类模型对目标图像进行处理,得到目标图像对应的分类结果,其中,图像分类模型通过图像样本和目标样本对预训练模型进行调整得到,目标样本为预设样本集合中图像样本相对应的预设样本,预训练模型通过预设样本集合进行训练得到。
可选地,图16根据本申请实施例的一种计算机终端的结构框图。如图16所示,该计算机终端A可以包括:一个或多个(图中仅示出一个)处理器1602、以及存储器1604。
其中,存储器可用于存储软件程序以及模块,如本申请实施例中的图像分类方法和装置对应的程序指令/模块,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的图像分类方法。存储器可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至终端A。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:获取目标图像;利用图像分类模型对目标图像进行处理,得到目标图像对应的分类结果,其中,图像分类模型通过图像样本和目标样本对预训练模型进行调整得到,目标样本为预设样本集合中图像样本相对应的预设样本,预训练模型通过预设样本集合进行训练得到。
可选的,上述处理器还可以执行如下步骤的程序代码:利用图像分类模型对目标图像和预设样本集合包含的多个预设样本进行处理,得到目标图像的第一特征,以及多个预设样本的第二特征;基于第一特征与多个第二特征的相似度,确定目标样本。
可选的,上述处理器还可以执行如下步骤的程序代码:获取第一特征和每个第二特征的相似度,得到多个相似度;确定相似度大于预设相似度的第二特征对应的预设样本为目标样本。
可选的,上述处理器还可以执行如下步骤的程序代码:利用目标图像和目标样本对预训练模型的目标层的网络参数进行修正,其中,预训练模型中除目标层之外的其他层的网络参数保持不变。
可选的,上述处理器还可以执行如下步骤的程序代码:获取预设样本集合,其中,预设样本集合包括:多个预设样本,每个预设样本对应的蒙板和类别标签,蒙板用于表征相应预设样本中的目标区域,类别标签为目标区域的类别标签;利用初始分类模型对多个预设样本和多个预设样本对应的蒙板进行特征提取,并对多个预设样本对应的融合特征进行预测处理,得到多个预设样本对应的类别识别结果,其中,融合特征通过将相应预设样本的第三特征和相应蒙版的第四特征进行融合得到,类别识别结果为目标区域的类别识别结果;基于述多个预设样本对应的类别识别结果和类别标签,得到初始分类模型的损失值;基于损失值与预设损失值的比对结果调整初始分类模型,得到预训练模型。
可选的,上述处理器还可以执行如下步骤的程序代码:利用图像分类模型中的前两个残差块对每个预设样本进行处理,得到每个预设样本的样本特征;利用图像分类模型中的卷积层对每个预设样本对应的蒙板进行处理,得到每个预设样本的蒙板特征;将样本特征和蒙板特征进行叠加,得到每个预设样本的第一图像特征;利用图像分类模型中的后两个残差块对第一图像特征进行处理,得到每个预设样本的第二图像特征;利用图像分类模型中的输出层对第二图像特征进行处理,得到每个预设样本的类别识别结果。
可选的,上述处理器还可以执行如下步骤的程序代码:利用双线性插值算法将每个预设样本的尺寸调整为第一预设尺寸;利用最近邻差值算法将每个预设样本对应的蒙板的尺寸调整为第二预设尺寸,其中,第二预设尺寸与每个预设样本的样本特征的尺寸相同。
可选的,上述处理器还可以执行如下步骤的程序代码:确定目标图像的目标尺寸;基于目标尺寸从数据集中筛选得到预设样本集合,其中,预设样本集合包含的多个预设样本的尺寸与目标尺寸相同。
可选的,上述处理器还可以执行如下步骤的程序代码:输出目标样本;接收目标样本的反馈结果,其中,反馈结果通过对目标样本进行修改得到;利用目标图像和反馈结果对图像分类模型进行修正。
可选的,上述处理器还可以执行如下步骤的程序代码:显示多个任务类型;接收多个任务类型中选中的目标任务类型;显示目标任务类型对应的预训练模型;接收图像样本,并采用图像样本和目标样本对预训练模型进行调整,得到目标任务类型对应的图像分类模型。
处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:获取建筑物图像;利用图像分类模型对建筑物图像进行处理,得到建筑物图像包含的建筑物的分类结果,其中,图像分类模型通过图像样本和目标样本对预训练模型进行调整得到,目标样本为图斑分类样本集合中图像样本相对应的图斑分类样本,预训练模型图斑分类样本集合训练得到。
可选的,上述处理器还可以执行如下步骤的程序代码:基于分类结果确定建筑物的标记方式;按照标记方式对建筑物进行标记,得到第一标记图像;显示第一标记图像。
可选的,上述处理器还可以执行如下步骤的程序代码:基于分类结果对建筑物进行标记,得到第二标记图像;显示第二标记图像。
可选的,上述处理器还可以执行如下步骤的程序代码:显示分类结果;接收分类结果对应的反馈信息,其中,反馈信息通过对分类结果进行修改得到;基于反馈信息对图像分类模型进行调整。
处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:云服务器接收客户端上传的目标图像;云服务器利用图像分类模型对目标图像进行处理,得到目标图像对应的分类结果,其中,图像分类模型通过图像样本和目标样本对预训练模型进行调整得到,目标样本为预设样本集合中图像样本相对应的预设样本,图像分类模型通过预设样本集合训练得到;云服务器将分类结果反馈至客户端。
处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:云服务器接收客户端上传的模型训练请求;云服务器获取模型训练请求对应的目标图像;云服务器利用预训练模型对目标图像和预设样本集合进行处理,确定预设样本集合中目标图像对应的目标样本,其中,预训练模型通过预设样本集合训练得到;云服务器利用目标图像和目标样本对预训练模型进行调整,得到图像分类模型;云服务器将图像分类模型反馈至客户端。
本领域普通技术人员可以理解,图16所示的结构仅为示意,计算机终端也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(MobileInternet Devices,MID)、PAD等终端设备。图16其并不对上述电子装置的结构造成限定。例如,计算机终端A还可包括比图16中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图16所示不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(RandomAccess Memory,RAM)、磁盘或光盘等。
实施例12
本申请的实施例还提供了一种存储介质。可选地,在本实施例中,上述存储介质可以用于保存上述实施例所提供的图像分类方法所执行的程序代码。
可选地,在本实施例中,上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:获取目标图像;利用图像分类模型对目标图像进行处理,得到目标图像对应的分类结果,其中,图像分类模型通过图像样本和目标样本对预训练模型进行调整得到,目标样本为预设样本集合中图像样本相对应的预设样本,预训练模型通过预设样本集合进行训练得到。
可选的,上述存储介质还被设置为存储用于执行以下步骤的程序代码:利用图像分类模型对目标图像和预设样本集合包含的多个预设样本进行处理,得到目标图像的第一特征,以及多个预设样本的第二特征;基于第一特征与多个第二特征的相似度,确定目标样本。
可选的,上述存储介质还被设置为存储用于执行以下步骤的程序代码:利获取第一特征和每个第二特征的相似度,得到多个相似度;确定相似度大于预设相似度的第二特征对应的预设样本为目标样本。
可选的,上述存储介质还被设置为存储用于执行以下步骤的程序代码:利用目标图像和目标样本对预训练模型的目标层的网络参数进行修正,其中,预训练模型中除目标层之外的其他层的网络参数保持不变。
可选的,上述存储介质还被设置为存储用于执行以下步骤的程序代码:获取预设样本集合,其中,预设样本集合包括:多个预设样本,每个预设样本对应的蒙板和类别标签,蒙板用于表征相应预设样本中的目标区域,类别标签为目标区域的类别标签;利用初始分类模型对多个预设样本和多个预设样本对应的蒙板进行特征提取,并对多个预设样本对应的融合特征进行预测处理,得到多个预设样本对应的类别识别结果,其中,融合特征通过将相应预设样本的第三特征和相应蒙版的第四特征进行融合得到,类别识别结果为目标区域的类别识别结果;基于述多个预设样本对应的类别识别结果和类别标签,得到初始分类模型的损失值;基于损失值与预设损失值的比对结果调整初始分类模型,得到预训练模型。
可选的,上述存储介质还被设置为存储用于执行以下步骤的程序代码:利用图像分类模型中的前两个残差块对每个预设样本进行处理,得到每个预设样本的样本特征;利用图像分类模型中的卷积层对每个预设样本对应的蒙板进行处理,得到每个预设样本的蒙板特征;将样本特征和蒙板特征进行叠加,得到每个预设样本的第一图像特征;利用图像分类模型中的后两个残差块对第一图像特征进行处理,得到每个预设样本的第二图像特征;利用图像分类模型中的输出层对第二图像特征进行处理,得到每个预设样本的类别识别结果。
可选的,上述存储介质还被设置为存储用于执行以下步骤的程序代码:利用双线性插值算法将每个预设样本的尺寸调整为第一预设尺寸;利用最近邻差值算法将每个预设样本对应的蒙板的尺寸调整为第二预设尺寸,其中,第二预设尺寸与每个预设样本的样本特征的尺寸相同。
可选的,上述存储介质还被设置为存储用于执行以下步骤的程序代码:确定目标图像的目标尺寸;基于目标尺寸从数据集中筛选得到预设样本集合,其中,预设样本集合包含的多个预设样本的尺寸与目标尺寸相同。
可选的,上述存储介质还被设置为存储用于执行以下步骤的程序代码:输出目标样本;接收目标样本的反馈结果,其中,反馈结果通过对目标样本进行修改得到;利用目标图像和反馈结果对图像分类模型进行修正。
可选的,上述存储介质还被设置为存储用于执行以下步骤的程序代码:显示多个任务类型;接收多个任务类型中选中的目标任务类型;显示目标任务类型对应的预训练模型;接收图像样本,并采用图像样本和目标样本对预训练模型进行调整,得到目标任务类型对应的图像分类模型。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:获取建筑物图像;利用图像分类模型对建筑物图像进行处理,得到建筑物图像包含的建筑物的分类结果,其中,图像分类模型通过图像样本和目标样本对预训练模型进行调整得到,目标样本为图斑分类样本集合中图像样本相对应的图斑分类样本,预训练模型图斑分类样本集合训练得到。
可选的,上述存储介质还被设置为存储用于执行以下步骤的程序代码:基于分类结果确定建筑物的标记方式;按照标记方式对建筑物进行标记,得到第一标记图像;显示第一标记图像。
可选的,上述存储介质还被设置为存储用于执行以下步骤的程序代码:基于分类结果对建筑物进行标记,得到第二标记图像;显示第二标记图像。
可选的,上述存储介质还被设置为存储用于执行以下步骤的程序代码:显示分类结果;接收分类结果对应的反馈信息,其中,反馈信息通过对分类结果进行修改得到;基于反馈信息对图像分类模型进行调整。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:云服务器接收客户端上传的目标图像;云服务器利用图像分类模型对目标图像进行处理,得到目标图像对应的分类结果,其中,图像分类模型通过图像样本和目标样本对预训练模型进行调整得到,目标样本为预设样本集合中图像样本相对应的预设样本,图像分类模型通过预设样本集合训练得到;云服务器将分类结果反馈至客户端。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:云服务器接收客户端上传的模型训练请求;云服务器获取模型训练请求对应的目标图像;云服务器利用预训练模型对目标图像和预设样本集合进行处理,确定预设样本集合中目标图像对应的目标样本,其中,预训练模型通过预设样本集合训练得到;云服务器利用目标图像和目标样本对预训练模型进行调整,得到图像分类模型;云服务器将图像分类模型反馈至客户端。
需要说明的是,本申请上述实施例中所涉及的图像的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (13)

1.一种图像分类方法,其特征在于,包括:
获取目标图像;
利用图像分类模型对所述目标图像进行处理,得到所述目标图像对应的分类结果,其中,所述图像分类模型通过图像样本和目标样本对预训练模型进行调整得到,所述目标样本为预设样本集合中所述图像样本相对应的预设样本,所述预训练模型通过所述预设样本集合进行训练得到。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
利用所述图像分类模型对所述图像样本和所述预设样本集合包含的多个预设样本进行处理,得到所述图像样本的第一特征,以及所述多个预设样本的第二特征;
基于所述第一特征与多个第二特征的相似度,确定所述目标样本。
3.根据权利要求2所述的方法,其特征在于,基于所述第一特征与多个第二特征的相似度,确定所述目标样本包括:
获取所述第一特征和每个第二特征的相似度,得到多个相似度;
确定相似度大于预设相似度的第二特征对应的预设样本为所述目标样本。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
利用所述图像样本和所述目标样本对所述预训练模型的目标层的网络参数进行调整,其中,所述预训练模型中除所述目标层之外的其他层的网络参数保持不变。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述预设样本集合,其中,所述预设样本集合包括:多个预设样本,每个预设样本对应的蒙板和类别标签,所述蒙板用于表征相应预设样本中的目标区域,所述类别标签为所述目标区域的类别标签;
利用初始分类模型对所述多个预设样本和所述多个预设样本对应的蒙板进行特征提取,并对所述多个预设样本对应的融合特征进行预测处理,得到所述多个预设样本对应的类别识别结果,其中,所述融合特征通过将相应预设样本的第三特征和相应蒙版的第四特征进行融合得到,所述类别识别结果为所述目标区域的类别识别结果;
基于所述多个预设样本对应的类别识别结果和类别标签,得到所述初始分类模型的损失值;
基于所述损失值与预设损失值的比对结果调整所述初始分类模型,得到所述预训练模型。
6.根据权利要求1至5中任意一项所述的方法,其特征在于,所述方法还包括:
显示多个任务类型;
接收所述多个任务类型中选中的目标任务类型;
显示所述目标任务类型对应的所述预训练模型;
接收所述图像样本,并采用所述图像样本和所述目标样本对所述预训练模型进行调整,得到所述目标任务类型对应的所述图像分类模型。
7.一种图像分类方法,其特征在于,包括:
获取建筑物图像;
利用图像分类模型对所述建筑物图像进行处理,得到所述建筑物图像包含的建筑物的分类结果,其中,所述图像分类模型通过图像样本和目标样本对预训练模型进行调整得到,所述目标样本为图斑分类样本集合中所述图像样本相对应的图斑分类样本,所述预训练模型通过所述图斑分类样本集合训练得到。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
基于所述分类结果确定所述建筑物的标记方式;
按照所述标记方式对所述建筑物进行标记,得到第一标记图像;
显示所述第一标记图像。
9.根据权利要求8所述的方法,其特征在于,所述方法还包括:
基于所述分类结果对所述建筑物进行标记,得到第二标记图像;
显示所述第二标记图像。
10.根据权利要求7至9中任意一项所述的方法,其特征在于,所述方法还包括:
显示所述分类结果;
接收所述分类结果对应的反馈信息,其中,所述反馈信息通过对所述分类结果进行修改得到;
基于所述反馈信息对所述图像分类模型进行调整。
11.一种图像分类方法,其特征在于,包括:
云服务器接收客户端上传的目标图像;
所述云服务器利用图像分类模型对所述目标图像进行处理,得到所述目标图像对应的分类结果,其中,所述图像分类模型通过图像样本和目标样本对预训练模型进行调整得到,所述目标样本为预设样本集合中所述图像样本相对应的预设样本,所述预训练模型通过所述预设样本集合进行训练得到;
所述云服务器将所述分类结果反馈至所述客户端。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行权利要求1至11任意一项所述的图像分类方法。
13.一种计算机终端,其特征在于,包括:处理器和存储器,所述处理器用于运行所述存储器中存储的程序,其中,所述程序运行时执行权利要求1至9任意一项所述的图像分类方法。
CN202111131995.1A 2021-09-26 2021-09-26 图像分类方法、计算机终端及存储介质 Pending CN113971757A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111131995.1A CN113971757A (zh) 2021-09-26 2021-09-26 图像分类方法、计算机终端及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111131995.1A CN113971757A (zh) 2021-09-26 2021-09-26 图像分类方法、计算机终端及存储介质

Publications (1)

Publication Number Publication Date
CN113971757A true CN113971757A (zh) 2022-01-25

Family

ID=79586823

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111131995.1A Pending CN113971757A (zh) 2021-09-26 2021-09-26 图像分类方法、计算机终端及存储介质

Country Status (1)

Country Link
CN (1) CN113971757A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115346084A (zh) * 2022-08-15 2022-11-15 腾讯科技(深圳)有限公司 样本处理方法、装置、电子设备、存储介质及程序产品
CN115761529A (zh) * 2023-01-09 2023-03-07 阿里巴巴(中国)有限公司 图像处理方法和电子设备

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115346084A (zh) * 2022-08-15 2022-11-15 腾讯科技(深圳)有限公司 样本处理方法、装置、电子设备、存储介质及程序产品
CN115761529A (zh) * 2023-01-09 2023-03-07 阿里巴巴(中国)有限公司 图像处理方法和电子设备
CN115761529B (zh) * 2023-01-09 2023-05-30 阿里巴巴(中国)有限公司 图像处理方法和电子设备

Similar Documents

Publication Publication Date Title
AU2019238711B2 (en) Method and apparatus for acquiring boundary of area to be operated, and operation route planning method
US10909368B2 (en) Crop type classification in images
Kalantar et al. Drone-based land-cover mapping using a fuzzy unordered rule induction algorithm integrated into object-based image analysis
US10885331B2 (en) Crop boundary detection in images
CN109886207B (zh) 基于图像风格迁移的广域监测***及方法
Kawamura et al. Discriminating crops/weeds in an upland rice field from UAV images with the SLIC-RF algorithm
CN108351959A (zh) 基于变化检测的图像采集任务***
US20200250427A1 (en) Shadow and cloud masking for agriculture applications using convolutional neural networks
Rastogi et al. Automatic building footprint extraction from very high-resolution imagery using deep learning techniques
CN113971757A (zh) 图像分类方法、计算机终端及存储介质
CN110020635A (zh) 基于无人机影像与卫星影像的种植区农作物精细分类方法和***
Cai et al. Residual-capsule networks with threshold convolution for segmentation of wheat plantation rows in UAV images
CN113591804B (zh) 图像特征提取方法、计算机可读存储介质以及计算机终端
Song et al. Improving global land cover characterization through data fusion
Hernández-Hernández et al. A new portable application for automatic segmentation of plants in agriculture
CN115761529B (zh) 图像处理方法和电子设备
CN114140637B (zh) 图像分类方法、存储介质和电子设备
CN114998712A (zh) 图像识别方法、存储介质及电子设备
CN114511500A (zh) 图像处理方法、存储介质以及计算机终端
CN113470051B (zh) 图像分割方法、计算机终端及存储介质
CN114359599A (zh) 图像处理方法、存储介质及计算机终端
CN114708260A (zh) 图像检测方法
CN115690610A (zh) 一种基于图像匹配的无人机导航方法
Pourazar et al. A deep 2D/3D Feature-Level fusion for classification of UAV multispectral imagery in urban areas
Wijesingha Geometric quality assessment of multi-rotor unmanned aerial vehicle borne remote sensing products for precision agriculture

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination