CN116152751A

CN116152751A - 一种图像处理的方法、装置、***及存储介质

Info

Publication number: CN116152751A
Application number: CN202211667755.8A
Authority: CN
Inventors: 马瑞峰; 曹斌
Original assignee: Neusoft Reach Automotive Technology Shenyang Co Ltd
Current assignee: Neusoft Reach Automotive Technology Shenyang Co Ltd
Priority date: 2022-12-23
Filing date: 2022-12-23
Publication date: 2023-05-23

Abstract

本申请公开了一种图片处理的方法、装置、***及存储介质，应用于汽车领域。所述方法包括：响应于接收的目标图片，确定目标图片的多个特征图以及每个特征图的权重系数。然后根据多个特征图中每个特征图的权重系数，确定图片信息丰富度。将图片信息丰富度较高的目标图片作为车辆识别模型的训练图片。如此，通过图片信息丰富度，从预先采集的海量图片中筛选出图片丰富度高的图片，进行模型训练，降低训练的图片数量，从而提高车辆识别模型的训练效果。

Description

一种图像处理的方法、装置、***及存储介质

技术领域

本申请涉及车辆识别领域，特别是涉及一种图片处理的方法、装置、***及存储介质。

背景技术

随着汽车技术的发展，车辆识别模型由于可以从复杂场景中识别出车辆，已成为检测交通堵塞、优化交通等的重要技术手段。

现有技术往往预先采集海量图片数据，再进行车辆识别模型训练。然而这些海量图片中可能包含图片信息丰富度较低的图片，比如图片中仅包含车辆类型一种图片信息，图片信息丰富度较低。将这些图片信息丰富度较低的图片输入车辆识别模型，对训练效果基本不起作用，且导致训练效率低。

发明内容

有鉴于此，本申请提供了一种图片处理的方法、装置、***及存储介质，旨在通过从预先采集的海量图片中筛选出信息丰富度较高的图片，训练车辆识别模型，提高模型训练效率。

第一方面，本申请提供了一种图片处理的方法，该方法包括：

响应于接收的目标图片，确定目标图片的多个特征图和每个特征图的权重系数；所述权重系数用于指示所述特征图对车辆识别模型的识别结果的影响程度；

根据所述多个特征图中所述每个特征图的权重系数，确定所述目标图片的图片信息丰富度；所述图片信息丰富度用于指示所述目标图片包含的图片信息丰富程度；

当所述图片信息丰富度小于预设阈值，删除所述目标图片。

可选的，所述根据所述多个特征图中所述每个特征图的权重系数，确定所述目标图片的图片信息丰富度，包括：

根据所述多个特征图中所述每个特征图的权重系数，确定权重分布；所述权重分布用于表示所述每个特征图的权重系数的分布；

根据所述权重分布，确定所述图片信息丰富度。

可选的，所述确定目标图片的多个特征图和每个特征图的权重系数，包括：

确定所述目标图片的多个特征图；

根据所述多个特征图，基于预设的权重获取函数，确定所述多个特征图中所述每个特征图的权重系数；

所述权重获取函数，与特征图对所述车辆识别模型的物体识别结果有关。

确定所述目标图片的多个特征图；

根据所述多个特征图，基于奇异值分解SVD，确定所述多个特征图中所述每个特征图的权重系数。

确定所述目标图片的多个特征图；

基于奇异值分解SVD，确定所述多个特征图中所述每个特征图的参考权重系数；

从所述多个特征图中筛选多个目标特征图；

根据预设的权重获取函数，确定所述多个目标特征图中每个目标特征图的目标权重系数；

利用所述每个目标特征图的目标权重系数替换对应的参考权重系数；所述每个特征图的权重系数为替换后对应的参考权重系数。

确定所述目标图片的多个特征图；

根据所述多个特征图，基于梯度，确定所述多个特征图中所述每个特征图的权重系数；

所述梯度，与特征图对所述车辆识别模型的物体识别结果的影响程度有关。

第二方面，本申请提供了一种图片处理的装置，所述装置包括：

响应单元，用于响应于接收的目标图片，确定目标图片的多个特征图和每个特征图的权重系数；所述权重系数用于指示所述特征图对车辆识别模型的识别结果的影响程度；

确定单元，用于根据所述多个特征图中所述每个特征图的权重系数，确定所述目标图片的图片信息丰富度；所述图片信息丰富度用于指示所述目标图片包含的图片信息丰富程度；

筛选单元，用于当所述图片信息丰富度大于预设阈值，将所述目标图片作为训练所述车辆识别模型的图片。

可选的，所述确定单元，具体用于：

根据所述权重分布，确定所述图片信息丰富度。

第三方面，本申请提供了一种车辆***，包括如第二方面的图片处理的装置。

第四方面，本申请提供了一种计算机存储介质，所述计算机存储介质中存储有代码，当所述代码被运行时，运行所述代码的设备实现前述第一方面任一项所述方法。

本申请公开了一种图片处理的方法、装置、***及存储介质。在执行所述方法时：首先响应于接收的目标图片，确定目标图片的多个特征图以及每个特征图的权重系数。然后根据多个特征图中每个特征图的权重系数，确定图片信息丰富度。将图片信息丰富度较高的目标图片作为车辆识别模型的训练图片。如此，通过图片信息丰富度，从预先采集的海量图片中筛选出图片丰富度高的图片，进行模型训练，降低训练的图片数量，从而提高车辆识别模型的训练效果。

附图说明

结合附图并参考以下具体实施方式，本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中，相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的，原件和元素不一定按照比例绘制。

图1为本申请实施例提供的一种图片处理的方法流程图；

图2为本申请实施例提供的一种低图片丰富度的图片示意图；

图3为本申请实施例提供的一种图片处理的装置结构示意图。

具体实施方式

本文使用的术语“包括”及其变形是开放性包括，即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”；术语“另一实施例”表示“至少一个另外的实施例”；术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。

需要注意，本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分，并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。

需要注意，本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的，本领域技术人员应当理解，除非在上下文另有明确指出，否则应该理解为“一个或多个”。

正如前文所述，目前在进行车辆识别模型训练时，采用的训练样本涉及的海量图片，可能涉及到图片信息丰富度较低的图片。这种图片输入车辆识别模型，对训练结果基本上作用不大，且会导致训练效率低。

基于此，本申请实施例提供了一种图片处理的方法，通过确定图片的多个特征图以及特征图的权重系数，根据权重系数，确定图片信息丰富度。其中，权重系数，表示特征图对模型训练结果的影响程度。最后根据图片信息丰富度，筛选出图片信息丰富度高的图片，作为训练样本，进行车辆识别模型的训练。如此，通过降低低效的训练图片数量，在保证识别模型训练的准确度前提下，提高识别模型的训练效率。

为了更好的说明本申请提供的图片处理的方法，下面结合附图说明，对本申请实施例提供的图片处理方法，进行详细完成的阐述。

参见图1，为本申请实施例提供的一种图片处理的方法流程图。该方法可以应用于检测车辆的检测***中，其执行主体为检测***中的检测服务器。该方法包括以下步骤：

S101：检测服务器接收海量图片数据。

检测***的检测服务器接收海量图片数据。其中海量图片可能包括图片丰富度低的图片。

示例性说明：参见图2，为本申请实施例提供的一种图片丰富度较低的图片示意图。该图中不包含车辆相关信息，属于图片丰富度较低的图片。

在本申请实施例中，海量图片中图片信息丰富度较低的图片，输入目标物识别模型，比如车辆识别模型，对训练结果基本上作用大，且会导致训练效率低。因此，应该从海量图片中删除图片丰富度较低的图片。

S102：确定与目标图片对应的多个特征图。

检测服务器接收到的海量图片，包括目标图片。在本申请实施例中，目标图片可以为海量图片中任一图片。

在本申请实施例中，首先需要确定与目标图片对应的多个特征图。其中特征图用于与目标图片的特征对应的图片。

在一种可能的实现方式中，将目标图片输入卷积神经网络中，通过卷积和池化等方式，确定与目标图片对应的特征图。其中卷积的卷积核有多少个，特征图个数就有多少个。

在一种可能的实现方式中，检测服务器将目标图片输入车辆识别模型中用于特征提取的主干网络，获取与目标图片对应的多个特征图。比如，可以为faster RCNN模型中的ResNet残差网络，确定与目标图片对应的多个特征图。其中，目标图片对应的特征图的个数由上述主干网络中最后一层的神经元个数确定。比如，最后一层神经元个数为1280个，则特征图个数为1280个。

在一种可能的实现方式中，可以将目标图片输入VGG系列版本的主干网络，比如VGG16的主干网络，提取与目标图片对应的多个特征图。

值得注意的是，本申请不对具体获取与目标图片对应的多个特征图进行限定，本领域技术人员对于获取方法可以根据需要自行调整。

S103：确定多个特征图中每个特征图的权重系数。

检测服务器对于获取的多个特征图，需要每个特征图的权重系数。其中，权重系数，用于表示特征图对车辆识别模型识别结果的影响力度。特征图对车辆识别模型影响力度越大，权重系数越大。

在一种可能的实现方式中，通过非扰动方式，获取每个特征图的权重系数。具体的，可以通过奇异值分解SVD，确定特征图的权重系数。下面针对SVD，进行详细介绍。

示例性说明：假设特征图的维度A为m×n。即A中由m个数据，n个特征。则A的SVD值为：

其中，λ₁，λ₂，……λ_k为矩阵A的特征值。p＝(p₁，p₂，……p_k)称为左奇异矩阵，维度是m×m，q＝(q₁ ^T，q₂ ^T，……q_k ^T)^T称为右奇异矩阵，维度是n×n，其中k≤m，且k≤n。

在本申请实施例中，可以将右奇异值矩阵的第一行近似当作特征激活图的权重。相对于其他方式，获取每个特征图的权重系数，具有更高的处理效率。

在一种可能的实现方式中，通过扰动方式，获取每个特征图的权重系数。具体的，预设权重获取函数，根据多个特征图和权重获取函数，确定所述多个特征图中每个特征图的权重系数。其中，权重获取函数，与特征图对所述目标物识别模型的物体识别有关。

具体的，可以通过识别结果的概率分布偏差，以及物体边界框的面积变化率，获取权重获取函数。比如，权重获取函数为：

λ(x,y)＝a₁x+a₂y (2)

其中，x为物体边界框的偏移率，比如IOU，y为识别结果的概率分布偏差，比如交叉熵。a₁和a₂为任一参数，根据需要可以自行调整。

示例性说明：将多个特征图中一个特征图的参数均设置为0，将与目标图片对应的多个特征图输入车辆识别模型的后续步骤中，获取的物体识别结果的概率分布偏差为1，物体边界框的面积变化率50％，假设a₁和a₂为0.3和0.5，则该特征图的权重系数为0.55。

在一种可能的实现方式中，还可以首先通过上述非扰动方式，获取多个特征图的参考权重系数，将多个特征图的参考权重系数依照预设顺序排列，比如权重依照由大到小顺序排列，或由小到大顺序排列等。然后通过扰动方式选取其中部分参考权重系数对应的目标特征图，重新计算扰动情况下的这一部分特征图的权重，剩余没有扰动的特征图继续将上一步非扰动方式获取的的权重作为所需的权重。如此，可以兼顾处理效率和准确度。

在一种可能的实现方式中，可以利用反向传播的方式，对多个特征图计算梯度，根据梯度大小，确定多个特征图中每个特征图的权重系。其中，梯度，与特征图对车辆识别模型的物体识别结果的影响程度有关。

在一种可能的实现方式中，基于IoU以及其衍生算法(比如GIOU)获取特征图的权重系数。

示例性说明：特征图人为扰动前，获取的边界框为A，将特征图人为扰动，即参数均设置为0，获取的边界框为B，则

其中，A∩B表示第一边界框和第二边界框的交集面积。A∪B为第一边界框和第二边界框的并集面积。相对于非扰动方法，扰动方式获取的特征图的权重系数具有更高的准确度。

在本申请实施例中，还可以根据其他方式获取与目标图片对应的多个特征图的权重系数，本领域技术人员可以根据需要自行调整。

S104：根据特征图的权重系数，确定目标图片的图片信息丰富度。

在本申请实施例中，根据与目标图片对应的多个特征图的权重系数，可以确定目标图片的图片信息丰富度。

其中，图片信息丰富度，用于表示图片中图片信息的丰富程度。图片信息越丰富，图片信息丰富度越大，图片信息丰富程度较小，图片信息丰富度越小。

在一种可能的实现方式中，可以根据特征图的权重系数，绘制与目标图片对应的多个特征图的权重系数的权重分布。其中，权重分布用于表示所述每个特征图的权重系数的分布。根据权重分布，确定图片信息丰富度。比如预设图片信息丰富度与权重分布均匀度的映射关系；其中，权重分布均匀度用于表示权重系数的离散情况。当权重分布均匀度较高时，即权重系数离散度较小，此时图片信息丰富度高。根据权重分布的均匀度，确定图片信息丰富度。

在一种可能的实现方式中，可以根据特征图的权重系数，计算目标图片的信息熵，根据信息熵，确定图片信息丰富度。

信息熵用于评价一段信息中信息量的多少，具体定义如下：

设有一个离散的随机变量X，它有m种可能情况，每种情况发生的概率为p_i，i＝1,2,3…,m，则它的信息熵H(X)为：

信息熵越高，表示其携带的信息越高，即图片信息丰富度越丰富。

S105：判断图片信息丰富度是否大于预设阈值。若是，执行S106。否则，执行S107。

检测服务器判断图片信息丰富度是否大于预设阈值。假设预设阈值为7.8，当获取的图片信息丰富度为7.73时，此时图片信息丰富度小于预设阈值。若获取的图片信息丰富度为7.95，此时图片信息丰富度大于预设阈值。

S106：将该目标图片作为训练识别模型的图片。

当图片信息丰富度大于预设阈值时，该目标图片的图片信息的丰富程度较高。将该图片加入训练样本集，以训练识别模型。

S107：删除目标图片。

当图片信息丰富度不大于预设阈值时，该目标图片的图片信息的丰富程度较低，删除该目标图片。

然后，检测服务器循环执行S101～S107的步骤，直至预先采集的海量图片中的图片均处理完成，获取训练样本集。此时训练样本集仅包含图片信息丰富程度较高的图片。

本申请公开了一种图片处理的方法，首先响应于接收的目标图片，确定目标图片的多个特征图以及每个特征图的权重系数。然后根据多个特征图中每个特征图的权重系数，确定图片信息丰富度。将图片信息丰富度较高的目标图片作为车辆识别模型的训练图片。如此，通过图片信息丰富度，从预先采集的海量图片中筛选出图片丰富度高的图片，进行模型训练，降低训练的图片数量，从而提高车辆识别模型的训练效果。

同时，本申请实施例还提供了一种图片处理的装置。参见图3，为本申请实施例提供的一种图片处理的装置300结构示意图。该装置包括：

响应单元301，用于响应于接收的目标图片，确定目标图片的多个特征图和每个特征图的权重系数；权重系数用于指示特征图对车辆识别模型的识别结果的影响程度。

确定单元302，用于根据多个特征图中每个特征图的权重系数，确定目标图片的图片信息丰富度；图片信息丰富度用于指示目标图片包含的图片信息丰富程度。

示例性说明：假设特征图的维度A为m×n。则A的SVD值为：

其中，λ₁，λ₂，……λ_k为矩阵A的特征值。其中，λ₁，λ₂，……λ_k为矩阵A的特征值。p＝(p₁，p₂，……p_k)称为左奇异矩阵，维度是m×m，q＝(q₁ ^T，q₂ ^T，……q_k ^T)^T称为右奇异矩阵，维度是n×n，其中k≤m，且k≤n。

在本申请实施例中，可以将右奇异值矩阵的第一行当作特征激活图的权重。相对于其他方式，获取每个特征图的权重系数，具有更高的处理效率。

在一种可能的实现方式中，通过扰动方式，获取每个特征图的权重系数。具体的，预设权重获取函数，根据多个特征图和权重获取函数，确定所述多个特征图中每个特征图的权重系数。其中，权重获取函数，与特征图对所述车辆识别模型的物体识别有关。

具体的，可以通过识别结果的准确率，以及物体边界框的面积变化率，获取权重获取函数。比如，权重获取函数为：

λ(x,y)＝a₁x+a₂y (6)

其中，x为物体边界框的面积变化率，y为识别结果的准确率。a₁和a₂为任一参数，根据需要可以自行调整。

示例性说明：将多个特征图中一个特征图的参数均设置为0，将与目标图片对应的多个特征图输入车辆识别模型的后续步骤中，获取的物体识别结果的准确率为100％，物体边界框的面积变化率50％，假设a₁和a₂为0.3和0.5，则该特征图的权重系数为0.55。

根据与目标图片对应的多个特征图的权重系数，可以确定目标图片的图片信息丰富度。

信息熵用于评价一段信息中信息量的多少，具体定义如下：

信息熵越高，表示其携带的信息越低，即图片信息丰富度越低。

筛选单元303，用于当图片信息丰富度大于预设阈值，将目标图片作为训练车辆识别模型的图片。

可选的，装置300还包括：

加入模块，用于当图片信息丰富度不小于预设阈值时，将目标图片加入训练样本库；训练样本库用于存放待训练的图片数据，以训练车辆识别模型。

本申请公开了一种图片处理的装置，响应单元301响应于接收的目标图片，确定目标图片的多个特征图以及每个特征图的权重系数。确定单元302，根据多个特征图中每个特征图的权重系数，确定图片信息丰富度。筛选单元303，将图片信息丰富度较高的目标图片作为车辆识别模型的训练图片。如此，通过图片信息丰富度，从预先采集的海量图片中筛选出图片丰富度高的图片，进行模型训练，降低训练的图片数量，从而提高车辆识别模型的训练效果。

本申请实施例还提供了一种车辆***，包括上述图片处理的装置。

本申请实施例还提供了对应的设备以及计算机可读存储介质，用于实现本申请实施例提供的方案。

其中，所述设备包括存储器和处理器，所述存储器用于存储指令或代码，所述处理器用于执行所述指令或代码，以使所述设备执行本申请任一实施例所述的一种图片处理的方法。

在实际应用中，所述计算机可读存储介质可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的***、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本实施例中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行***、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于无线、电线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述，仅为本申请的一种具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到的变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应该以权利要求的保护范围为准。

Claims

1.一种图片处理的方法，其特征在于，所述方法包括：

当所述图片信息丰富度小于预设阈值，删除所述目标图片。

2.根据权利要求1所述方法，其特征在于，所述根据所述多个特征图中所述每个特征图的权重系数，确定所述目标图片的图片信息丰富度，包括：

根据所述权重分布，确定所述图片信息丰富度。

3.根据权利要求1所述方法，其特征在于，所述确定目标图片的多个特征图和每个特征图的权重系数，包括：

确定所述目标图片的多个特征图；

4.根据权利要求1所述方法，其特征在于，所述确定目标图片的多个特征图和每个特征图的权重系数，包括：

确定所述目标图片的多个特征图；

所述权重获取函数，与特征图对所述车辆识别模型的物体识别结果的影响程度有关。

5.根据权利要求1任一项所述方法，其特征在于，所述确定目标图片的多个特征图和每个特征图的权重系数，包括：

确定所述目标图片的多个特征图；

从所述多个特征图中筛选多个目标特征图；

6.根据权利要求1所述方法，其特征在于，所述确定目标图片的多个特征图和每个特征图的权重系数，包括：

确定所述目标图片的多个特征图；

7.一种图片处理的装置，其特征在于，所述装置包括：

8.根据权利要求7所述装置，其特征在于，所述确定单元，具体用于：

根据所述权重分布，确定所述图片信息丰富度。

9.一种车辆***，包括如权利要求7或8任一项所述图片处理的装置。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有代码，当所述代码运行时，执行如权利要求1-6任意一项所述方法的步骤。