CN110222641A

CN110222641A - 用于识别图像的方法和装置

Info

Publication number: CN110222641A
Application number: CN201910489384.0A
Authority: CN
Inventors: 聂磊; 肖慧慧; 刘明浩; 郭江亮; 李旭
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2019-06-06
Filing date: 2019-06-06
Publication date: 2019-09-10
Anticipated expiration: 2039-06-06
Also published as: CN110222641B

Abstract

本公开的实施例公开了云计算中用于识别图像的方法和装置。该方法的一具体实施方式包括：将目标遥感图像划分成子图，得到子图集合；将子图集合中各个子图分别输入预先训练的目标检测模型，得到各个子图对应的目标区域，存入目标区域集合，其中，目标检测模型基于各子图的多层特征图检测各子图的目标区域，多层特征图中的各层特征图所描述的子图的特征不同；基于目标区域集合中的各个目标区域，确定各个目标区域所呈现的目标的身份信息；以及在目标遥感图像上，在对应各个目标区域的坐标位置处，标示对应各个目标区域所呈现的目标的身份信息。该实施方式可以实现对遥感图像中的小目标进行检测与识别。

Description

用于识别图像的方法和装置

技术领域

本公开的实施例涉及计算机技术领域，具体涉及用于识别图像的方法和装置。

背景技术

随着各种越来越高空间、时间、光谱分辨率卫星发射升空，基于卫星的遥感图像开始被广泛应用到军事领域和民用领域。遥感图像通常尺寸很大，且受分辨率制约，遥感图像中所呈现的物体的图像的尺寸往往很小。

因此，相关技术中，需要从尺寸大的遥感图像中检测出相对尺寸小的目标物体所在区域，以及对目标物体所在区域呈现的目标物体进行识别。

发明内容

本公开的实施例提出了用于识别图像的方法和装置。

第一方面，本公开的实施例提供了一种用于识别图像的方法，该方法包括：将目标遥感图像划分成子图，得到子图集合；将子图集合中各个子图分别输入预先训练的目标检测模型，得到各个子图对应的目标区域，存入目标区域集合，其中，目标检测模型基于各子图的多层特征图检测各子图的目标区域，多层特征图中的各层特征图所描述的子图的特征不同；基于目标区域集合中的各个目标区域，确定各个目标区域所呈现的目标的身份信息；以及在目标遥感图像上，在对应各个目标区域的坐标位置处，标示对应各个目标区域所呈现的目标的身份信息。

在一些实施例中，预先训练的目标检测模型被配置成执行以下步骤：提取所输入的子图的预设数目个特征图，从所提取的预设数目个特征图中确定出尺寸最大的特征图，以及提取尺寸最大的特征图的尺寸；将预设数目个特征图中除尺寸最大的特征图外的特征图的尺寸调整为与尺寸最大的特征图的尺寸相同；对预设数目个相同尺寸的特征图进行卷积运算，得到新特征图，以及基于新特征图确定出所输入的子图的目标区域。

在一些实施例中，基于目标区域集合中的各个目标区域，确定各个目标区域所呈现的目标的身份信息包括：将目标区域集合中的各个目标区域分别输入预先训练的细粒度图像分类模型，得到各个目标区域所呈现的目标的身份信息。

在一些实施例中，将目标遥感图像划分成子图，得到子图集合包括：按照预设偏移顺序和偏移重叠量，将目标遥感图像划分为子图，得到子图集合，其中，子图的尺寸为预设参考尺寸。

在一些实施例中，方法还包括：获取遥感图像，对遥感图像进行图像预处理，得到目标遥感图像。

在一些实施例中，对遥感图像进行图像预处理，包括以下至少一项：从遥感图像中识别出预设参照物，获取预设参照物在遥感图像中的位置信息，以及基于位置信息，确定遥感图像在预设坐标系中的角度和位移，按照角度和位移，调整遥感图像；将遥感图像的分辨率提升为预设分辨率。

在一些实施例中，将遥感图像的分辨率提升为预设分辨率，包括：将遥感图像输入预先训练的分辨率调整模型，以得到具有预设分辨率的遥感图像，其中，分辨率调整模型为生成对抗网络模型。

在一些实施例中，预先训练的目标检测模型，通过如下方式训练得到：获取第一训练样本集合，其中，第一训练样本包括子图和子图的目标区域以及目标区域的旋转角度；将第一训练样本集合中的第一训练样本的子图作为输入，将与输入的子图对应的目标区域以及目标区域的旋转角度作为期望输出，训练得到目标检测模型。

在一些实施例中，预先训练的细粒度图像分类模型，通过如下方式训练得到：获取第二训练样本集合，其中，第二训练样本包括目标区域和目标区域所呈现的目标的身份信息，目标区域为遥感图像中所呈现的目标所在区域；将第二训练样本集合中的第二训练样本的目标区域作为输入，将与输入的目标区域对应的身份信息作为期望输出，训练得到细粒度图像分类模型。

第二方面，本公开的实施例提供了一种用于识别图像的装置，该装置包括：子图划分单元，被配置成将目标遥感图像划分成子图，得到子图集合；区域检测单元，被配置成将子图集合中各个子图分别输入预先训练的目标检测模型，得到各个子图对应的目标区域，存入目标区域集合，其中，目标检测模型基于各子图的多层特征图检测各子图的目标区域，多层特征图中的各层特征图所描述的子图的特征不同；区域识别单元，被配置成基于目标区域集合中的各个目标区域，确定各个目标区域所呈现的目标的身份信息；以及信息标示单元，被配置成在目标遥感图像上，在对应各个目标区域的坐标位置处，标示对应各个目标区域所呈现的目标的身份信息。

在一些实施例中，区域识别单元，被进一步配置成：将目标区域集合中的各个目标区域分别输入预先训练的细粒度图像分类模型，得到各个目标区域所呈现的目标的身份信息。

在一些实施例中，子图划分单元，被进一步配置成：按照预设偏移顺序和偏移重叠量，将目标遥感图像划分为子图，得到子图集合，其中，子图的尺寸为预设参考尺寸。

在一些实施例中，装置还包括：图像预处理单元，被配置成获取遥感图像，对遥感图像进行图像预处理，得到目标遥感图像。

第三方面，本公开的实施例提供了一种电子设备，该电子设备包括：一个或多个处理器；存储装置，其上存储有一个或多个程序；当该一个或多个程序被该一个或多个处理器执行，使得该一个或多个处理器实现如第一方面中任一实现方式描述的方法。

第四方面，本公开的实施例提供了一种计算机可读介质，其上存储有计算机程序，该程序被处理器执行时实现如第一方面中任一实现方式描述的方法。

本公开的实施例提供的用于识别图像的方法和装置，可以将目标遥感图像划分成子图，得到子图集合。然后，将子图集合中各个子图分别输入预先训练的目标检测模型，得到各个子图对应的目标区域，存入目标区域集合。其中，目标检测模型基于各子图的多层特征图检测各子图的目标区域，多层特征图中的各层特征图所描述的子图的特征不同。之后，基于目标区域集合中的各个目标区域，确定各个目标区域所呈现的目标的身份信息。以及最后，在目标遥感图像上，在对应各个目标区域的坐标位置处，标示对应各个目标区域所呈现的目标的身份信息。本公开的实施例提供的方法和装置，由于遥感图像中，不同目标所占的像素的数目差距很大，小目标在遥感图像中所占像素极少，对子图进行多次卷积运算后，最后得到的特征图中几乎没有保留该目标的特征信息，将导致无法对小目标进行检测与识别。因此，本公开通过目标检测模型，基于子图的多层特征图来检测子图的目标区域，可以实现对遥感图像中的小目标的检测与识别，有助于提高对子图中的目标区域的检测的准确率。另外，在遥感图像上的每个目标区域位置，标识该目标区域所呈现的目标的身份信息，有助于实现通过遥感图像将目标位置、目标身份，和整体目标分布情况进行直观地呈现。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本公开的其它特征、目的和优点将会变得更明显：

图1是本公开的一个实施例可以应用于其中的示例性***架构图；

图2是根据本公开的用于识别图像的方法的一个实施例的流程图；

图3是根据本公开的实施例的用于识别图像的方法的一个应用场景的示意图；

图4是根据本公开的用于识别图像的方法的又一个实施例的流程图；

图5是根据本公开的用于识别图像的装置的一个实施例的结构示意图；

图6是适于用来实现本公开的实施例的电子设备的结构示意图。

具体实施方式

下面结合附图和实施例对本公开作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释相关发明，而非对该发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与有关发明相关的部分。

需要说明的是，在不冲突的情况下，本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。本领域技术人员还将理解的是，虽然本文中可使用用语“第一”、“第二”等来描述各种训练样本等，但是这些训练样本不应被这些用语限制。这些用语仅用于将一个训练样本与其它训练样本区分开。

图1示出了可以应用本公开的实施例的用于识别图像的方法或用于识别图像的装置的示例性***架构100。

如图1所示，***架构100可以包括数据库服务器101，网络102和服务器103。网络102用以在数据库服务器101和服务器103之间提供通信链路的介质。网络102可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

数据库服务器101可以通过网络102与服务器103交互，以接收或发送消息等。数据库服务器101可以实现成提供各种数据存储服务的分布式服务器集群，也可以实现成单个服务器。例如，存储有遥感图像的服务器。数据库服务器101可以将所存储的遥感图像发送给服务器103。

服务器103可以通过网络102与数据库服务器101交互，以接收或发送消息等。服务器103可以是提供各种服务的服务器，例如，对数据库服务器101中的遥感图像进行目标检测与识别处理的服务器。服务器103可以将数据库服务器101中的目标遥感图像划分成子图，得到子图集合。然后，将子图集合中各个子图分别输入预先训练的目标检测模型，得到各个子图对应的目标区域，存入目标区域集合。其中，目标检测模型基于各子图的多层特征图检测各子图的目标区域，多层特征图中的各层特征图所描述的子图的特征不同。之后，基于目标区域集合中的各个目标区域，确定各个目标区域所呈现的目标的身份信息。以及最后，在目标遥感图像上，在对应各个目标区域的坐标位置处，标示对应各个目标区域所呈现的目标的身份信息。

需要说明的是，服务器可以是硬件，也可以是软件。当服务器为硬件时，可以实现成多个服务器组成的分布式服务器集群，也可以实现成单个服务器。当服务器为软件时，可以实现成多个软件或软件模块(例如用来提供分布式服务的多个软件或软件模块)，也可以实现成单个软件或软件模块。在此不做具体限定。

需要说明的是，本公开的实施例所提供的用于识别图像的方法一般由服务器103执行，相应地，用于识别图像的装置一般设置于服务器103中。需要指出的是，服务器103的本地也可以直接存储遥感图像。服务器103可以直接提取本地的遥感图像。此时，示例性***架构100可以不包括数据库服务器101和网络102。

应该理解，图1中的数据库服务器，网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的数据库服务器，网络和服务器。

继续参考图2，示出了根据本公开的用于识别图像的方法的一个实施例的流程200。该用于识别图像的方法，包括以下步骤：

步骤201，将目标遥感图像划分成子图，得到子图集合。

在本实施例中，用于识别图像的方法的执行主体(例如图1所示的服务器103)可以按照目标遥感图像的尺寸，将目标遥感图像切分成预设数目个尺寸相同的子图，以得到子图集合。上述执行主体也可以将上述目标遥感图像切分成多个尺寸与设定尺寸相同的子图。其中，上述预设数目和设定尺寸皆可以是技术人员预先设定的数据。

其中，上述目标遥感图像可以是各种遥感图像。作为示例，上述目标遥感图像可以是预处理之前的遥感图像，也可以是未经预处理的遥感图像。

在本实施例的一些可选的实现方式中，将目标遥感图像划分成子图，得到子图集合包括：按照预设偏移顺序和偏移重叠量，将目标遥感图像划分为子图，得到子图集合。其中，子图的尺寸为预设参考尺寸。

其中，上述预设偏移顺序可以是技术人员预先设定的顺序。作为示例，可以是从左到右从上到下，也可以是从右到左从上到下。

上述偏移重叠量通常为所检测目标类别所对应的最大真实尺寸与目标遥感图像的空间分辨率的比值。其中，上述空间分辨率通常是指遥感图像上能够识别的两个相邻地物的最小距离。举例来说，若遥感图像的空间分辨率为2米，则遥感图像上的每个像素点所对应的真实距离为2米。进一步地，举例来说，若遥感图像的空间分辨率为2米，所检测目标类别为飞机，飞机中真实尺寸最大有200米，则飞机这一目标类别所对应的最大真实尺寸为200米，此时，上述预设偏移量可以为100像素(100＝200÷2)。

上述预设参考尺寸可以是技术人员预先设定的图像尺寸。作为示例，上述预设参考尺寸可以是500×500。

本实现方式中，执行主体在对目标遥感图像进行划分过程中，可以通过偏移重叠量，使得先后得到的两个子图之间具有重叠区域。作为示例，若预设偏移顺序为从左到右从上到下，偏移重叠量为100，则在进行子图划分过程中，得到一个子图后，可以向右平移一段距离，使得所得到的子图与前一子图之间具有重叠区域。此时，所得到的子图与前一子图之间在从左到右方向上的像素的重叠量为100。

本实现方式中，由于现有技术中在对遥感图像进行划分时，很可能将一个目标切分成两块或者多块，破坏了目标的完整性而导致该目标无法被检测到，即，被漏检。因此，通过偏移重叠量，使得先后得到的两个子图之间具有重叠区域，可以保证所有的目标至少可以完整地被检测一次，实现避免目标由于被切分开而被漏检。

步骤202，将子图集合中各个子图分别输入预先训练的目标检测模型，得到各个子图对应的目标区域，存入目标区域集合。

其中，上述目标检测模型基于各子图的多层特征图检测各子图的目标区域，多层特征图中的各层特征图所描述的子图的特征不同。

上述子图的目标区域，通常是指子图中所呈现的目标所在图像区域。

在本实施例中，针对子图集合中的每个子图，执行主体可以通过如下方式获得该子图的目标区域：将该子图输入预先训练的目标检测模型，得到该子图对应的目标区域。

这里，目标检测模型可以采用训练得到的卷积核依次对所输入的子图进行卷积运算，每进行一次卷积运算，可以得到一个特征图，且每个特征图所描述的该子图的特征，与其他特征图所描述的该子图的特征不同。这样，可以从所得到的所有特征图中选择预设数目个特征图用于检测子图的目标区域。

在本实施例中，在得到每个子图的目标区域后，执行主体可以将所得到的目标区域存入目标区域集合。需要指出的是，上述目标区域集合在缺省情况下为空集。

步骤203，基于目标区域集合中的各个目标区域，确定各个目标区域所呈现的目标的身份信息。

其中，上述身份信息通常是用于表征目标的身份的信息。上述身份信息可以包括但不限于目标型号和目标类别。作为示例，上述身份信息可以为“C130运输机”，也可以为“C130-Transport Aircraft”，用于表征目标的身份为C130运输机。

在本实施例中，针对目标区域集合中的每个目标区域，执行主体可以通过如下方式获得该目标区域所呈现的目标的身份信息：首先，执行主体可以计算该目标区域与预先建立的预设目标区域-身份信息集合中的各个预设目标区域间的相似度，得到多个相似度值。然后，可以选择对应相似度值最大的预设目标区域所对应的身份信息。最后，将所选择的身份信息确定为该目标区域的身份信息。其中，上述预设目标区域-身份信息集合中，预先存储有多个相对应的预设目标区域与预设目标区域所呈现的目标的身份信息。

在本公开的实施例的一些可选的实现方式中，基于目标区域集合中的各个目标区域，确定各个目标区域所呈现的目标的身份信息包括：将目标区域集合中的各个目标区域分别输入预先训练的细粒度图像分类模型，得到各个目标区域所呈现的目标的身份信息。

本实现方式中，针对目标区域集合中的每个目标区域，执行主体还可以通过如下方式获得该目标区域所呈现的目标的身份信息：将该目标区域输入预先训练的细粒度图像分类模型，得到该目标区域所呈现的目标的身份信息。

其中，上述预先训练的细粒度图像分类模型，可以是基于训练样本，利用机器学习方法，对初始细粒度图像分类模型进行训练后得到的模型。其中，上述细粒度图像分类模型可以包括但不限于：双线性卷积神经网络模型(Bilinear Convolutional NeuralNetwork)。

本实现方式中，由于遥感图像通常尺寸很大，遥感图像中所呈现的目标在遥感图像中所占尺寸很小，导致不同的目标在遥感图像所体现的差异较小。又由于细粒度图像分类模型对差异小的类别通常可以表现出较好的分类效果，因此，采用预先训练的细粒度图像分类模型来获取目标区域所呈现的目标的身份信息，有助于进一步提高识别目标区域所呈现的目标的正确率。

步骤204，在目标遥感图像上，在对应各个目标区域的坐标位置处，标示对应各个目标区域所呈现的目标的身份信息。

在本实施例中，针对每个目标区域，执行主体可以在目标遥感图像上，在该目标区域的坐标位置处，标示该目标区域所呈现的目标的身份信息。这样，用户可以通过遥感图像，直观地获知目标位置、目标身份，和整体目标分布情况。

本实施例的方法，由于遥感图像中，不同目标所占的像素的数目差距很大，小目标在遥感图像中所占像素极少，对子图进行多次卷积运算后，最后得到的特征图中几乎没有保留该目标的特征信息，将导致无法对小目标进行检测与识别。因此，通过目标检测模型，基于子图的多层特征图来检测子图的目标区域，可以实现对遥感图像中的小目标的检测与识别，有助于提高对子图中的目标区域的检测的准确率。另外，在遥感图像上的每个目标区域位置，标识该目标区域所呈现的目标的身份信息，有助于实现通过遥感图像将目标位置、目标身份，和整体目标分布情况进行直观地呈现。

在本公开的各个实施例的可选的实现方式中，预先训练的目标检测模型，通过如下方式训练得到：

首先，获取第一训练样本集合。其中，第一训练样本包括子图和子图的目标区域以及目标区域的旋转角度。这里，上述第一训练样本通常是用于训练目标检测模型的训练样本。

然后，将第一训练样本集合中的第一训练样本的子图作为输入，将与输入的子图对应的目标区域以及目标区域的旋转角度作为期望输出，训练得到目标检测模型。

本实现方式中，由于遥感图像中往往存在目标聚集以及目标方向任意的问题，在对目标检测模型进行训练时，采用标注有目标区域的旋转角度的训练样本进行模型训练，有助于进一步提高对子图中的目标区域的检测的准确率。

在本公开的各个实施例的可选的实现方式中，预先训练的目标检测模型可以被配置成执行以下步骤：

第一步，提取所输入的子图的预设数目个特征图，从所提取的预设数目个特征图中确定出尺寸最大的特征图，以及提取尺寸最大的特征图的尺寸。

这里，目标检测模型可以采用训练得到的卷积核依次对所输入的子图进行卷积运算，每进行一次卷积运算，可以得到一个特征图。这里，可以预先设定所需提取的特征图的顺序号和所需提取的特征图的个数。作为示例，可以提取第一次、第三次、第五次得到的特征图，此时，预设数目为3。需要指出的是，上述预设数目可以是技术人员预先设定的数据值。在得到预设数目个特征图后，可以同时得到各特征图的尺寸。此时，可以通过尺寸比较，确定出尺寸最大的特征图。

第二步，将预设数目个特征图中除尺寸最大的特征图外的特征图的尺寸调整为与尺寸最大的特征图的尺寸相同。

这里，目标检测模型可以通过上采样的方式，对各特征图的尺寸进行调整，以使得各特征图最后具有相同的尺寸。

第三步，对预设数目个相同尺寸的特征图进行卷积运算，得到新特征图，以及基于新特征图确定出所输入的子图的目标区域。

这里，目标检测模型可以对上述尺寸相同的各特征图执行1×1卷积运算，以得到新特征图。之后，目标检测模型可以采用区域生成网络(Region Proposal Network，RPN)得到新特征图中的候选目标区域，以及采用边框回归(Bounding Box Regression)损失函数对所得到的候选目标区域进行修正，以得到准确的目标区域。

需要指出的是，所执行的卷积运算的次数与所得到的特征图所表达的内容相关联。执行卷积运算次数少，所得到的特征图所表达的特征越具体(如，图像边缘特征、图像灰度特征等)。执行卷积运算次数多，所得到的特征图所表达的特征越抽象(如，图像语义特征)。提取其中的多个特征图进行分析，可以得到关于遥感图像中的目标的更全面的信息。另外，由于目标在图像中所占的像素的数目越多，则执行卷积运算后所得到的特征图中所保留的该目标的特征信息越多，反之则越少。又由于遥感图像中，不同目标所占的像素的数目差距很大，小目标在遥感图像中所占像素极少，进行多次卷积运算后，在特征图中几乎没有保留该目标的特征信息，将导致无法对小目标进行检测与识别。因此，对多个特征图进行分析，可以实现对遥感图像中的小目标的检测与识别，有助于提高对子图中的目标区域的检测的准确率。

在本公开的各个实施例的可选的实现方式中，预先训练的细粒度图像分类模型，通过如下方式训练得到：

首先，获取第二训练样本集合。其中，第二训练样本包括目标区域和目标区域所呈现的目标的身份信息，目标区域为遥感图像中所呈现的目标所在区域。这里，上述第二训练样本通常是用于训练细粒度图像分类模型的训练样本。

然后，将第二训练样本集合中的第二训练样本的目标区域作为输入，将与输入的目标区域对应的身份信息作为期望输出，训练得到细粒度图像分类模型。

本实现方式中，在对细粒度图像分类模型进行训练时，采用标注有目标的身份信息的训练样本进行模型训练，训练后，有助于得到可以识别目标区域所呈现的目标的身份信息的细粒度图像分类模型。

继续参见图3，图3是根据本实施例的用于识别图像的方法的应用场景300的一个示意图。在图3的应用场景中，服务器301从数据库服务器302获取到遥感图像PO。服务器可以对所获取到的遥感图像PO进行预处理，这样，可以得到预处理后的遥感图像P。

在得到遥感图像P后，服务器301可以通过如下步骤对遥感图像P进行处理：

首先，服务器301可以将遥感图像P划分成子图，得到子图集合{PS1，PS2，PS3，PS4}。其中，PS1，PS2，PS3，PS4均为划分得到的子图。

然后，服务器301可以将PS1，PS2，PS3，PS4分别输入预先训练的目标检测模型。这样，可以识别出子图PS1中的目标区域R1和R2，识别出子图PS2中的目标区域为空，也即是不存在目标区域。识别出子图PS3中的目标区域为R3，以及识别出子图PS4中的目标区域为R4和R5。这样可以得到目标区域集合{R1，R2，R3，R4，R5}。

之后，服务器301可以采用用于识别目标区域所呈现的目标的身份信息的方法，确定目标区域R1对应的身份信息为X1，确定目标区域R2对应的身份信息为X2，确定目标区域R3对应的身份信息为X3，确定目标区域R4对应的身份信息为X4，以及确定目标区域R5对应的身份信息为X5。

最后，执行主体可以在遥感图像P上，在目标区域R1的坐标位置处，标识X1，在目标区域R2的坐标位置处，标识X2，在目标区域R3的坐标位置处，标识X3，在目标区域R4的坐标位置处，标识X4，以及在目标区域R5的坐标位置处，标识X5。

本公开的上述实施例提供的用于识别图像的方法，可以将目标遥感图像划分成子图，得到子图集合。然后，将子图集合中各个子图分别输入预先训练的目标检测模型，得到各个子图对应的目标区域，存入目标区域集合。其中，目标检测模型基于各子图的多层特征图检测各子图的目标区域，多层特征图中的各层特征图所描述的子图的特征不同。之后，基于目标区域集合中的各个目标区域，确定各个目标区域所呈现的目标的身份信息。以及最后，在目标遥感图像上，在对应各个目标区域的坐标位置处，标示对应各个目标区域所呈现的目标的身份信息。本公开的实施例提供的方法，由于遥感图像中，不同目标所占的像素的数目差距很大，小目标在遥感图像中所占像素极少，对子图进行多次卷积运算后，最后得到的特征图中几乎没有保留该目标的特征信息，将导致无法对小目标进行检测与识别。因此，通过目标检测模型，基于子图的多层特征图来检测子图的目标区域，可以实现对遥感图像中的小目标的检测与识别，有助于提高对子图中的目标区域的检测的准确率。另外，在遥感图像上的每个目标区域位置，标识该目标区域所呈现的目标的身份信息，有助于实现通过遥感图像将目标位置、目标身份，和整体目标分布情况进行直观地呈现。

进一步参考图4，其示出了用于识别图像的方法的又一个实施例的流程400。该用于识别图像的方法的流程400，包括以下步骤：

步骤401，获取遥感图像，对遥感图像进行图像预处理，得到目标遥感图像。

在本实施例中，执行主体可以通过有线连接方式或者无线连接方式，从通信连接的数据库服务器中获取到遥感图像。之后，执行主体可以采用预先设定的图像预处理步骤对所获取到的遥感图像进行图像预处理，以得到预处理后的目标遥感图像。上述预先设定的图像预处理步骤可以是技术人员预先设定的用于对遥感图像进行处理的各种步骤。作为示例，上述预先设定的图像预处理步骤可以为：将遥感图像裁剪至设定尺寸，如1000×1000。

本实施例中，由于遥感图像原本可能存在分辨率不够清晰等问题，对所得到的遥感图像进行预处理，有助于进一步提高对遥感图像中目标进行检测与识别的准确率。

在本实施例的一些可选的实现方式中，对遥感图像进行图像预处理，包括以下至少一项：

第一项：从遥感图像中识别出预设参照物，获取预设参照物在遥感图像中的位置信息，以及基于位置信息，确定遥感图像在预设坐标系中的角度和位移，按照角度和位移，调整遥感图像。

这里，上述执行主体可以先提取遥感图像的特征。作为示例，所提取的特征包括但不限于SIFT特征(Scale-invariant feature transform)，SURF特征(Speeded Up RobustFeatures)等。然后，基于所提取的特征和预先建立的特征-参照物映射关系，识别出遥感图像中的参照物，以及得到所识别出的参照物在遥感图像中的位置信息。这里，上述位置信息可以包括但不限于参照物在遥感图像中的图像坐标。之后，执行主体可以采用遥感图像中的预设参照物的位置信息，以及预设参照物在预设坐标系下的预设位置信息，得到上述位置信息与上述预设位置信息之间进行转换所需旋转的角度和位移。最后，执行主体可以采用所得到的角度和位移，对遥感图像中的各像素进行映射计算，实现调整遥感图像。

第二项：将遥感图像的分辨率提升为预设分辨率。

这里，上述执行主体可以采用图像插值算法对遥感图像进行处理，以实现将遥感图像的分辨率提升为预设分辨率。上述预设分辨率可以是技术人员预先设定的分辨率。其中，上述图像插值算法可以包括但不限于：最近邻插值(Nearest-neighbor)、双线性插值(Bilinear)、双立方插值(bicubic)等。

本实现方式中，由于在拍摄过程中，拍摄角度和拍摄位移的变化会导致先后得到的遥感图像存在或多或少的差别。为了便于对遥感图像进行分析处理，执行主体可以基于预设参照物调整遥感图像的角度和位移，也即是对遥感图像进行几何校正。这样，可以有助于进一步提高对遥感图像中目标进行检测与识别的准确率。另外，本实现方式中，提升遥感图像的分辨率，有助于进一步提高对遥感图像中目标进行检测与识别的准确率。

在本公开的各个实施例的可选的实现方式中，将遥感图像的分辨率提升为预设分辨率，包括：将遥感图像输入预先训练的分辨率调整模型，以得到具有预设分辨率的遥感图像。

其中，分辨率调整模型为生成对抗网络模型(Generative Adversarial Network，GAN)。通常，在GAN中可以包括生成器和判别器，其中，生成器合成越来越逼真的数据，试图欺骗竞争的判别器。实践中，初始的生成器和初始的判别器可以是各种神经网络模型。

本实现方式中，采用预先训练的GAN调整遥感图像的分辨率，生成器所生成的高分辨率图像与真实的高分辨率图像十分接近。所得到的高分辨率图像可以在提升分辨率的同时，保留分辨率调整前的遥感图像中的抽象特征，如，纹理特征等。有助于进一步提高对遥感图像中目标进行检测与识别的准确率。

步骤402，将目标遥感图像划分成子图，得到子图集合。

步骤403，将子图集合中各个子图分别输入预先训练的目标检测模型，得到各个子图对应的目标区域，存入目标区域集合。

其中，目标检测模型基于各子图的多层特征图检测各子图的目标区域，多层特征图中的各层特征图所描述的子图的特征不同。

步骤404，基于目标区域集合中的各个目标区域，确定各个目标区域所呈现的目标的身份信息。

步骤405，在目标遥感图像上，在对应各个目标区域的坐标位置处，标示对应各个目标区域所呈现的目标的身份信息。

在本实施例中，步骤402-405的具体操作与图2所示的实施例中步骤201-204的操作基本相同，在此不再赘述。

从图4中可以看出，与图2对应的实施例相比，本实施例中的用于识别图像的方法的流程400突出了对遥感图像进行图像预处理的步骤。由此，本实施例描述的方案可以通过采用预先设定的图像预处理步骤对遥感图像进行预处理，有助于进一步提高对遥感图像中目标进行检测与识别的准确率。

进一步参考图5，作为对上述各图所示方法的实现，本公开提供了一种用于识别图像的装置的一个实施例，该装置实施例与图2所示的方法实施例相对应，该装置具体可以应用于各种电子设备中。

如图5所示，本实施例的用于识别图像的装置500包括：子图划分单元501，被配置成将目标遥感图像划分成子图，得到子图集合；区域检测单元502，被配置成将子图集合中各个子图分别输入预先训练的目标检测模型，得到各个子图对应的目标区域，存入目标区域集合，其中，目标检测模型基于各子图的多层特征图检测各子图的目标区域，多层特征图中的各层特征图所描述的子图的特征不同；区域识别单元503，被配置成基于目标区域集合中的各个目标区域，确定各个目标区域所呈现的目标的身份信息；以及信息标示单元504，被配置成在目标遥感图像上，在对应各个目标区域的坐标位置处，标示对应各个目标区域所呈现的目标的身份信息。

在本实施例的一些可选的实现方式中，预先训练的目标检测模型被配置成执行以下步骤：首先，提取所输入的子图的预设数目个特征图，从所提取的预设数目个特征图中确定出尺寸最大的特征图，以及提取尺寸最大的特征图的尺寸。然后，将预设数目个特征图中除尺寸最大的特征图外的特征图的尺寸调整为与尺寸最大的特征图的尺寸相同。最后，对预设数目个相同尺寸的特征图进行卷积运算，得到新特征图，以及基于新特征图确定出所输入的子图的目标区域。

在本实施例的一些可选的实现方式中，区域识别单元503可以被进一步配置成：将目标区域集合中的各个目标区域分别输入预先训练的细粒度图像分类模型，得到各个目标区域所呈现的目标的身份信息。

在本实施例的一些可选的实现方式中，子图划分单元501可以被进一步配置成：按照预设偏移顺序和偏移重叠量，将目标遥感图像划分为子图，得到子图集合。其中，子图的尺寸为预设参考尺寸。

在本实施例的一些可选的实现方式中，该装置还可以包括图像预处理单元(图中未示出)。其中，图像预处理单元可以被配置成获取遥感图像，对遥感图像进行图像预处理，得到目标遥感图像。

在本实施例的一些可选的实现方式中，对遥感图像进行图像预处理，包括以下至少一项：从遥感图像中识别出预设参照物，获取预设参照物在遥感图像中的位置信息，以及基于位置信息，确定遥感图像在预设坐标系中的角度和位移，按照角度和位移，调整遥感图像。将遥感图像的分辨率提升为预设分辨率。

在本实施例的一些可选的实现方式中，将遥感图像的分辨率提升为预设分辨率，包括：将遥感图像输入预先训练的分辨率调整模型，以得到具有预设分辨率的遥感图像。其中，分辨率调整模型为生成对抗网络模型。

在本实施例的一些可选的实现方式中，预先训练的目标检测模型，通过如下方式训练得到：首先，获取第一训练样本集合。其中，第一训练样本包括子图和子图的目标区域以及目标区域的旋转角度。然后，将第一训练样本集合中的第一训练样本的子图作为输入，将与输入的子图对应的目标区域以及目标区域的旋转角度作为期望输出，训练得到目标检测模型。

在本实施例的一些可选的实现方式中，预先训练的细粒度图像分类模型，通过如下方式训练得到：首先，获取第二训练样本集合。其中，第二训练样本包括目标区域和目标区域所呈现的目标的身份信息，目标区域为遥感图像中所呈现的目标所在区域。然后，将第二训练样本集合中的第二训练样本的目标区域作为输入，将与输入的目标区域对应的身份信息作为期望输出，训练得到细粒度图像分类模型。

本公开的上述实施例提供的装置，子图划分单元501将目标遥感图像划分成子图，得到子图集合；区域检测单元502将子图集合中各个子图分别输入预先训练的目标检测模型，得到各个子图对应的目标区域，存入目标区域集合，其中，目标检测模型基于各子图的多层特征图检测各子图的目标区域，多层特征图中的各层特征图所描述的子图的特征不同；区域识别单元503基于目标区域集合中的各个目标区域，确定各个目标区域所呈现的目标的身份信息；以及信息标示单元504在目标遥感图像上，在对应各个目标区域的坐标位置处，标示对应各个目标区域所呈现的目标的身份信息。本实施例的装置，由于遥感图像中，不同目标所占的像素的数目差距很大，小目标在遥感图像中所占像素极少，对子图进行多次卷积运算后，最后得到的特征图中几乎没有保留该目标的特征信息，将导致无法对小目标进行检测与识别。因此，本公开通过目标检测模型，基于子图的多层特征图来检测子图的目标区域，可以实现对遥感图像中的小目标的检测与识别，有助于提高对子图中的目标区域的检测的准确率。另外，在遥感图像上的每个目标区域位置，标识该目标区域所呈现的目标的身份信息，有助于实现通过遥感图像将目标位置、目标身份，和整体目标分布情况进行直观地呈现。

下面参考图6，其示出了适于用来实现本公开的实施例的电子设备(例如图1中的服务器)600的结构示意图。图6示出的电子设备仅仅是一个示例，不应对本公开的实施例的功能和使用范围带来任何限制。

如图6所示，电子设备600可以包括处理装置(例如中央处理单元(CPU)、图形处理器等)601，其可以根据存储在只读存储器(ROM)602中的程序或者从存储装置608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中，还存储有电子设备600操作所需的各种程序和数据。处理装置601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。

通常，以下装置可以连接至I/O接口605：包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置606；包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置607；包括例如磁带、硬盘等的存储装置608；以及通信装置609。通信装置609可以允许电子设备600与其他设备进行无线或有线通信以交换数据。虽然图6示出了具有各种装置的电子设备600，但是应理解的是，并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。图6中示出的每个方框可以代表一个装置，也可以根据需要代表多个装置。

特别地，根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信装置609从网络上被下载和安装，或者从存储装置608被安装，或者从ROM 602被安装。在该计算机程序被处理装置601执行时，执行本公开的实施例的方法中限定的上述功能。需要说明的是，本公开的实施例的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开的实施例中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本公开的实施例中，计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读信号介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：电线、光缆、RF(射频)等等，或者上述的任意合适的组合。

上述计算机可读介质可以是上述电子设备中所包含的；也可以是单独存在，而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被该电子设备执行时，使得该电子设备：将目标遥感图像划分成子图，得到子图集合；将子图集合中各个子图分别输入预先训练的目标检测模型，得到各个子图对应的目标区域，存入目标区域集合，其中，目标检测模型基于各子图的多层特征图检测各子图的目标区域，多层特征图中的各层特征图所描述的子图的特征不同；基于目标区域集合中的各个目标区域，确定各个目标区域所呈现的目标的身份信息；以及在目标遥感图像上，在对应各个目标区域的坐标位置处，标示对应各个目标区域所呈现的目标的身份信息。

可以以一种或多种程序设计语言或其组合来编写用于执行本公开的实施例的操作的计算机程序代码，程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

附图中的流程图和框图，图示了按照本公开各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的***来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本公开的实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中，例如，可以描述为：一种处理器包括子图划分单元、区域检测单元、区域识别单元和信息标示单元。其中，这些单元的名称在某种情况下并不构成对该单元本身的限定，例如，子图划分单元还可以被描述为“将目标遥感图像划分成子图，得到子图集合的单元”。

以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本公开中所涉及的发明范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离上述发明构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims

1.一种用于识别图像的方法，包括：

将目标遥感图像划分成子图，得到子图集合；

将所述子图集合中各个子图分别输入预先训练的目标检测模型，得到各个子图对应的目标区域，存入目标区域集合，其中，所述目标检测模型基于各子图的多层特征图检测各子图的目标区域，所述多层特征图中的各层特征图所描述的子图的特征不同；

基于所述目标区域集合中的各个目标区域，确定各个目标区域所呈现的目标的身份信息；以及

在所述目标遥感图像上，在对应各个目标区域的坐标位置处，标示对应各个目标区域所呈现的目标的身份信息。

2.根据权利要求1所述的方法，其中，所述预先训练的目标检测模型被配置成执行以下步骤：

提取所输入的子图的预设数目个特征图，从所提取的预设数目个特征图中确定出尺寸最大的特征图，以及提取尺寸最大的特征图的尺寸；

将所述预设数目个特征图中除尺寸最大的特征图外的特征图的尺寸调整为与尺寸最大的特征图的尺寸相同；

对预设数目个相同尺寸的特征图进行卷积运算，得到新特征图，以及基于所述新特征图确定出所输入的子图的目标区域。

3.根据权利要求1所述的方法，其中，所述基于所述目标区域集合中的各个目标区域，确定各个目标区域所呈现的目标的身份信息包括：

将所述目标区域集合中的各个目标区域分别输入预先训练的细粒度图像分类模型，得到各个目标区域所呈现的目标的身份信息。

4.根据权利要求1所述的方法，其中，所述将目标遥感图像划分成子图，得到子图集合包括：

按照预设偏移顺序和偏移重叠量，将所述目标遥感图像划分为子图，得到所述子图集合，其中，所述子图的尺寸为预设参考尺寸。

5.根据权利要求1所述的方法，其中，所述方法还包括：

获取遥感图像，对所述遥感图像进行图像预处理，得到所述目标遥感图像。

6.根据权利要求5所述的方法，其中，所述对所述遥感图像进行图像预处理，包括以下至少一项：

从所述遥感图像中识别出预设参照物，获取所述预设参照物在所述遥感图像中的位置信息，以及基于所述位置信息，确定所述遥感图像在预设坐标系中的角度和位移，按照所述角度和位移，调整所述遥感图像；

将所述遥感图像的分辨率提升为预设分辨率。

7.根据权利要求6所述的方法，其中，所述将所述遥感图像的分辨率提升为预设分辨率，包括：

将所述遥感图像输入预先训练的分辨率调整模型，以得到具有预设分辨率的遥感图像，其中，所述分辨率调整模型为生成对抗网络模型。

8.根据权利要求1所述的方法，其中，所述预先训练的目标检测模型，通过如下方式训练得到：

获取第一训练样本集合，其中，第一训练样本包括子图和子图的目标区域以及目标区域的旋转角度；

将所述第一训练样本集合中的第一训练样本的子图作为输入，将与输入的子图对应的目标区域以及目标区域的旋转角度作为期望输出，训练得到所述目标检测模型。

9.根据权利要求3所述的方法，其中，所述预先训练的细粒度图像分类模型，通过如下方式训练得到：

获取第二训练样本集合，其中，第二训练样本包括目标区域和目标区域所呈现的目标的身份信息，所述目标区域为遥感图像中所呈现的目标所在区域；

将所述第二训练样本集合中的第二训练样本的目标区域作为输入，将与输入的目标区域对应的身份信息作为期望输出，训练得到所述细粒度图像分类模型。

10.一种用于识别图像的装置，包括：

子图划分单元，被配置成将目标遥感图像划分成子图，得到子图集合；

区域检测单元，被配置成将所述子图集合中各个子图分别输入预先训练的目标检测模型，得到各个子图对应的目标区域，存入目标区域集合，其中，所述目标检测模型基于各子图的多层特征图检测各子图的目标区域，所述多层特征图中的各层特征图所描述的子图的特征不同；

区域识别单元，被配置成基于所述目标区域集合中的各个目标区域，确定各个目标区域所呈现的目标的身份信息；以及

信息标示单元，被配置成在所述目标遥感图像上，在对应各个目标区域的坐标位置处，标示对应各个目标区域所呈现的目标的身份信息。

11.根据权利要求10所述的装置，其中，所述预先训练的目标检测模型被配置成执行以下步骤：

12.根据权利要求10所述的装置，其中，所述区域识别单元，被进一步配置成：

13.根据权利要求10所述的装置，其中，所述子图划分单元，被进一步配置成：

14.根据权利要求10所述的装置，其中，所述装置还包括：

图像预处理单元，被配置成获取遥感图像，对所述遥感图像进行图像预处理，得到所述目标遥感图像。

15.根据权利要求14所述的装置，其中，所述对所述遥感图像进行图像预处理，包括以下至少一项：

将所述遥感图像的分辨率提升为预设分辨率。

16.根据权利要求15所述的装置，其中，所述将所述遥感图像的分辨率提升为预设分辨率，包括：

17.根据权利要求10所述的装置，其中，所述预先训练的目标检测模型，通过如下方式训练得到：

18.根据权利要求12所述的装置，其中，所述预先训练的细粒度图像分类模型，通过如下方式训练得到：

19.一种电子设备，包括：

一个或多个处理器；

存储装置，其上存储有一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-9中任一所述的方法。

20.一种计算机可读介质，其上存储有计算机程序，其中，该程序被处理器执行时实现如权利要求1-9中任一所述的方法。