CN112613570B

CN112613570B - 一种图像检测方法、图像检测装置、设备及存储介质

Info

Publication number: CN112613570B
Application number: CN202011601355.8A
Authority: CN
Inventors: 黄德威
Original assignee: Shenzhen Intellifusion Technologies Co Ltd
Current assignee: Shenzhen Intellifusion Technologies Co Ltd
Priority date: 2020-12-29
Filing date: 2020-12-29
Publication date: 2024-06-11
Anticipated expiration: 2040-12-29
Also published as: CN112613570A

Abstract

本发明涉及图像处理技术领域，具体提供一种图像检测方法、图像检测装置、计算机设备以及可读存储介质，其中，图像检测方法包括：将缩放图像和填充图像进行拼接处理，以获取拼接图像；将拼接图像作为输入图像，输入至预设的目标检测模型，以获取目标对象的候选框、候选框位置的置信度和置信度对应的可靠程度；根据候选框位置的置信度和置信度对应的可靠程度，从候选框确定出目标对象的最终检测框。本发明一方面可以提高目标检测模型对拼接图像的可识别度，另一方面可以提高最终准确框的准确率，从而减少出现误检的问题。

Description

一种图像检测方法、图像检测装置、设备及存储介质

技术领域

本发明涉及图像处理技术领域，尤其涉及一种图像检测方法、图像检测装置、计算机设备及可读存储介质。

背景技术

现有技术中，神经网络模型的训练方式通常为：模型网络的一个分支输出检测框位置的置信度，模型网络的另一个分支输出检测框类别的置信度。在一个应用场景中，示例性地，当前假设检测框类别的置信度为A，检测框位置的置信度为B，则最终的置信度为AB。使用这种方式容易造成误检，因为若检测框分类的置信度A比较小，而检测框位置的置信度B比较大的情况下，则AB的结果可能比实际使用的设置的置信度阈值要小，从而出现最终检测框定位在非目标区域上，例如针对人脸检测而言，当前可能将背景当成人脸，从而出现造成误检的情况。

发明内容

本发明提供一种图像检测方法、图像检测装置、计算机设备及可读存储介质，用于解决传统的神经网络模型对被检测图像出现误检的问题。

本发明第一方面提供一种图像检测方法，该方法包括：

根据被检测图像获取缩放图像和填充图像；

将所述缩放图像和所述填充图像进行拼接处理，以获取拼接图像；

将所述拼接图像作为输入图像，输入至预设的目标检测模型，以获取目标对象的候选框、候选框位置的置信度和所述置信度对应的可靠程度；

根据所述候选框位置的置信度和所述置信度对应的可靠程度，从所述候选框确定出所述目标对象的最终检测框。

可选地，所述根据被检测图像获取缩放图像和填充图像，包括：

确定所述被检测图像的长宽比例是否符合所述目标检测模型的输入图像长宽比例；

若所述被检测图像的长宽比例为不符合所述输入图像长宽比例，则对所述被检测图像进行等比例缩放，以获取缩放图像；其中，所述等比例缩放的缩放倍数由所述被检测图像的长宽比例和所述输入图像长宽比例确定；

对所述缩放图像中的预设区域进行复制，以获取复制图像；

确定填充图像的长宽，将所述复制图像放大至所述填充图像的长宽，以获取所述填充图像。

可选地，所述对所述被检测图像进行等比例缩放，以获取缩放图像，包括：

将所述被检测图像的长度除以所述输入图像长度，以获取所述缩放倍数；

按照所述缩放倍数对所述被检测图像进行等比例缩放，以获取所述缩放图像。

可选地，所述确定填充图像的长宽，包括：

将所述输入图像长度作为所述填充图像的长度；

将所述输入图像宽度减去所述缩放图像的宽度，以确定所述填充图像的宽度。

可选地，所述将所述缩放图像和所述填充图像进行拼接处理，以获取拼接图像，包括：

获取所述缩放图像的预设区域与所述填充图像的权重比例；

根据所述权重比例对所述缩放图像和所述填充图像进行加权融合，以获取所述拼接图像。

可选地，所述获取所述缩放图像的预设区域与所述填充图像的权重比例，包括：

确定所述复制图像的宽度与所述填充图像的宽度的比值；

将所述复制图像的宽度与所述填充图像的宽度的比值作为所述权重比例。

可选地，所述目标检测模型为通过已标注训练图像进行训练得到，包括：

获取训练图像集和验证图像集，所述训练图像集包括所述已标注训练图像；

通过所述已标注训练图像对预设神经网络模型进行训练；

将所述验证图像集的验证图像输入至所述预设神经网络模型中，以获取所述预设神经网络模型输出的检测目标对应的检测框位置的置信度和所述检测框位置的置信度的可靠程度；

根据所述检测框位置的置信度和所述检测框位置的置信度的可靠程度，获取损失函数值；

根据所述损失函数值对所述预设神经网络模型的模型参数进行调整并继续训练，直至所述预设神经网络模型满足收敛条件时结束训练，以得到所述目标检测模型。

可选地，所述根据所述目标对象的候选框位置的置信度和所述置信度对应的可靠程度，从所述候选框确定出所述目标对象的最终检测框，包括：

在所述候选框中，确定是否存在候选框位置的置信度大于第一预设阈值，且所述置信度对应的可靠程度大于第二预设阈值的目标候选框；

若确定存在所述候选框位置的置信度大于所述第一预设阈值，且所述置信度对应的可靠程度大于所述第二预设阈值的目标候选框，则将所述目标候选框作为所述目标对象的最终检测框。

本发明第二方面提供一种图像检测装置，该图像检测装置包括：

获取模块，用于根据被检测图像获取缩放图像和填充图像；

拼接模块，用于将所述缩放图像和所述填充图像进行拼接处理，以获取拼接图像；

输入模块，用于将所述拼接图像作为输入图像，输入至预设的目标检测模型，以获取目标对象的候选框、候选框位置的置信度和所述置信度对应的可靠程度；

检测模块，用于根据所述候选框位置的置信度和所述置信度对应的可靠程度，从所述候选框确定出所述目标对象的最终检测框。

本发明第三方面提供一种计算机设备，包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序，其特征在于，处理器执行计算机程序时实现如本发明第一方面的图像检测方法。

本发明第四方面提供一种计算机可读存储介质，计算机可读存储介质存储有计算机程序，其特征在于，计算机程序被处理器执行时实现如本发明第一方面的图像检测方法。

本发明一方面并不直接使用固定像素的方式对缩放图像进行填充，可以使得拼接图像的待填充部分具有被检测图像的特征，不会像传统的方案消耗计算资源去分析直接填充的无用像素，如此可使得填充图像能提供有效的图像特征，可以提高目标检测模型对拼接图像的可识别度；另一方面通过对检测目标的标注框的检测框位置的置信度和置信度的可靠程度训练目标检测模型，可以使得将拼接图像输入目标检测模型后，目标检测模型可根据候选框位置的置信度和候选框位置的置信度的可靠程度确定出目标对象的最终检测框，从而提高最终准确框的准确率，减少出现误检的问题。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一实施例中图像检测方法的一应用环境示意图；

图2是本发明一实施例中图像检测方法步骤S10-S40的一流程示意图；

图3是本发明一实施例中被检测图像的一示意图；

图4是本发明一实施例中拼接图像的一示意图；

图5是本发明一实施例中现有技术被检测图像填充固定像素值的一示意图；

图6是本发明一实施例中拼接图像的另一示意图；

图7是本发明一实施例中现有技术模型训练方式的一示意图；

图8是本发明一实施例中模型训练方式的一示意图；

图9是本发明一实施例中图像检测装置的一架构示意图；

图10是本发明一实施例中计算机设备的一架构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

为了说明本发明的技术方案，下面通过具体实施例来进行说明。

实施例1

本发明实施例提供的图像检测方法，该图像检测方法可应用如图1所示的应用环境中。具体地，该图像检测方法应用在图像检测***中，该图像检测***可以包括如图1所示的客户端、服务器以及图像采集装置。

其中，客户端、服务器和图像采集装置通过网络进行通信，用于实现图像检测。具体地，客户端又称为用户端，是指与服务器相对应，为客户提供本地服务的程序，客户端可以安装在包括但不限于例如各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备上，客户端用于对图像检测的结果进行显示。图像采集装置用于实时采集图像或者实时采集视频，并用于将实时采集的图像或视频发送给服务器，以使服务器根据接收的被检测图像的长宽比例而对被检测图像进行调整。图像采集装置可以包括但不限于例如摄像机、云台、解码器和支架视频分配器等，具体并不限定。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现，并不限定。

在一个应用场景中，当前可以通过图像采集装置进行实时的视频或者图像采集，该采集的视频或者图像可以包括人，车辆或者其他类型物体，并不限定。具体地，图像采集装置可以设置在特定区域，该特定区域包括公共场所，示例性地，公共场所可以包括但不局限于例如学校、博物馆、十字路口、步行街、写字楼、车库、机场、医院、地铁站、车站、公交站台、超市、酒店或者娱乐场所等，通过不同场所的图像采集装置进行实时的视频或者图像采集，以使可以将不同场所的视频或者图像作为被检测图像。

本发明第一方面提供一种图像检测方法，在一个实施例中，如图2所示，图像检测方法包括步骤S10-S40：

S10：根据被检测图像获取缩放图像和填充图像。

当前，可以通过上述的图像采集装置进行实时的图像或者视频采集，以获取被检测图像。基于获取的被检测图像，可以根据被检测图像获取缩放图像和填充图像。

在一个实施例中，根据被检测图像获取缩放图像和填充图像，具体可以包括：

S101：确定被检测图像的长宽比例是否符合目标检测模型的输入图像长宽比例。

获取被检测图像后，可以确定被检测图像的长宽比例是否符合目标检测模型的输入图像长宽比例。

可以理解，图像采集装置采集的图像比例通常为16:9，而训练后的目标检测模型的输入图像所需长宽比例为1:1，例如，当前目标检测模型的输入图像所需长宽为416*416，也即目标检测模型的输入图像的长宽比例为1:1。可见，获取的被检测图像可能并不适用于直接输入目标检测模型进行训练或者预测，此时需确认被检测图像的长宽比例是否符合目标检测模型的输入图像长宽比例，若被检测图像的长宽比例为不符合目标检测模型的输入图像长宽比例，则需要对实时获取的被检测图像进行预处理。示例性地，如图3所示，当前被检测图像的长宽比例可以为1920*1080，可见，当前被检测图像的长宽比例为不符合目标检测模型的输入图像长宽比例。

S102：若被检测图像的长宽比例为不符合输入图像长宽比例，则对被检测图像进行等比例缩放，以获取缩放图像；其中，等比例缩放的缩放倍数由被检测图像的长宽比例和输入图像长宽比例确定。

该步骤中，基于步骤S101，若被检测图像的长宽比例为不符合目标检测模型的输入图像长宽比例，则需要对被检测图像进行预处理，以使被检测图像满足输入目标检测模型的图像要求。具体地，当被检测图像的长宽大于目标检测模型的输入图像长宽，则可以对被检测图像按照等比例进行缩放，以获取缩放图像。

示例性地，目标检测模型的输入图像长宽为416*416，基于被检测图像的长宽为1920*1080，也即被检测图像不符合目标检测模型的输入图像的长宽比例，且被检测图像的长宽大于目标检测模型的输入图像长宽，当前可以对被检测图像按照等比例进行缩放，以获取如图4所示字母A对应的缩放图像。

其中，等比例缩放的缩放倍数由被检测图像的长宽比例和目标检测模型的输入图像长宽比例确定，在一个实施例中，等比例缩放的缩放倍数具体通过以下方式实现：

S1021：将被检测图像的长度除以目标检测模型的输入图像长度，以获取缩放倍数。

示例性地，被检测图像的长度为1920，目标检测模型的输入图像长度为416，则将被检测图像的长度除以目标检测模型的输入图像长度，缩放倍数等于1920/416。

S1022：按照缩放倍数对被检测图像进行等比例缩放，以获取缩放图像。

当前，可以将1920/416作为缩放倍数，以使被检测图像的长度和宽度按照该缩放倍数进行缩放。

在确定等比例缩放的缩放倍数后，可以对被检测图像按照等比例进行缩放，以获取缩放图像，具体地，可以将被检测图像的长度和宽度(1920*1080)分别除以缩放倍数，以获取缩放图像，可以理解，当前的缩放图像的长宽约为416*234。

S103：对缩放图像中的预设区域进行复制，以获取复制图像。

可以理解，图像采集装置实时采集的图像，图像上边为远景区域，目标比较小。因此通常选取靠近图像上方的区域做裁剪。在一个实施例中，预设区域可以为缩放图像中的上三分之一所在的区域，或者为缩放图像中的上二分之一所在的区域等。

需要说明的是，在实际的应用中，具体可以根据实际场景进行设置，并不限定。

示例性地，当前可以对缩放图像(416*234)的上三分之一所在的区域进行复制，则可以获取复制图像，其中复制图像的长宽为416*78。或者，当前还可以对缩放图像(416*234)的上二分之一所在的区域进行复制，以获取复制图像，为避免累赘，此处便不展开描述。

S104：确定填充图像的长宽，将复制图像放大至填充图像的长宽，以获取填充图像。

在一个实施例中，具体地，可以根据目标检测模型的输入图像长宽和缩放图像的长宽确定填充图像的长宽，具体可以通过以下步骤：

S1041：将目标检测模型的输入图像长度作为填充图像的长度。

S1042：将目标检测模型的输入图像宽度减去缩放图像的宽度，以确定填充图像的宽度。

该步骤中，可以理解，基于对缩放图像的短边进行填充，可以将目标检测模型的输入图像长度作为填充图像的长度，并且将目标检测模型的输入图像宽度减去缩放图像的宽度，也即将416-234＝182，则可以确定填充图像的宽度为182。

可以理解，在确定填充图像的长度和填充图像的宽度后，可以确定填充图像的长宽比例。基于步骤S1041和步骤S1042，当前可以确定填充图像的长宽比例为416:182。

在确定填充图像的长宽后，进一步地，可以将复制图像放大至填充图像的长宽，以获取填充图像。具体地，基于目标检测模型的输入图像长宽为416*416，缩放图像的长宽为416*234，则可以确定填充图像的长宽为416*182。当前可以将复制图像放大至如图4所示字母B对应的填充图像，也即将416*78的缩放图像放大至416*182的填充图像。

该步骤中，为了对缩放图像进行填充，可以预先根据目标检测模型的输入图像长、目标检测模型的输入图像宽、缩放图像的长和缩放图像的宽确定填充图像的长宽，以使将复制图像按照填充图像的长宽进行放大，以使获取填充图像。

S20：将缩放图像和填充图像进行拼接处理，以获取拼接图像。

基于步骤S1022中对被检测图像进行等比例缩放，以获取缩放图像，以及步骤S104中获取的填充图像，可以将缩放图像和填充图像进行拼接处理，以获取拼接图像。

示例性地，缩放图像的长宽为416*234，填充图像的长宽为416*182，则拼接图像的长宽为416*416，也即当前的拼接图像符合输入目标检测模型的输入图像的比例要求。

针对上述步骤的过程，为了更好地说明，下面通过一个完整的实施例进行描述，在一个应用场景中，具体地，当前被检测图像的长宽比例为1920*1080，用于输入目标检测模型的输入图像长宽为416*416；首先对输入图像按照等比例进行缩放，以使将被检测图像长度缩放到输入图像的长度，以及使被检测图像的宽度缩放到输入图像的宽度，在将1920*1080的被检测图像按照等比例缩放为缩放图像后，则需要确定填充的长宽。基于目标检测模型的输入图像长宽为416*416以及缩放图像为416*234，当前可以确定填充图像为416*182；并对缩放图像的预设区域(例如缩放图像中的上三分之一所在的区域)进行复制，则可以得到416*78的复制图像，并将416*78进行放大到416*182，以获取填充图像；从而可以将缩放图像和填充图像进行拼接处理，以实现获取符合目标检测模型的输入图像长宽比例的拼接图像。

现有技术中，为了将不符合目标检测模型的输入图像长宽比例的被检测图像转换成符合比例的图像，一般的处理方式是将被检测图像较短的边进行固定像素值的填充，以使被检测图像的短边长度和长边长度相等。示例性地，如图5所示，以被检测图像的长宽为1920*1080，目标检测模型的输入图像长宽为416*416为例。常规的方式，是先将1920*1080的被检测图像进行等比例缩放，以获取416*234的缩放图像，而后再以像素值为0对缩放图像中空缺的部分进行填充，图5所示字母C1对应的区域表示像素值为0的图像，以使将缩放图像填充成为416*416，从而实现将1920*1080的被检测图像转换成416*416的输入图像。按照现有技术的方式，发明人发现，简单填充的像素不仅不能提供有效的信息，反而还增加了网络的运算。

为了解决这个技术问题，以实现充分利用这部分被浪费的运算，同时提升目标的检测性能。在本发明的实施例中，如图6所示，首先将1920*1080的被检测图像缩放到416*234，然后将图像的上三分之一进行复制，具体参见图6所示字母C2对应的区域，以获取416*78的复制图像，并将该复制图像进行放大成416*182的填充图像，具体参见图6所示字母C3对应的区域，以使将缩放图像和填充图像进行拼接处理时，可以使得将1920*1080的被检测图像转换成416*416的符合目标检测模型的输入图像。可以理解，通过本发明的这种方式不仅可以使拼接图像的填充部分具有复制图像的图像特征，还可以使得降低了填充图像的缩放倍率，即相当于提升填充图像的分辨率。

本发明实施例的图像检测方法，通过上述步骤的过程，通过当确定被检测图像的长宽比例为不符合目标检测模型的输入图像长宽比例后，对被检测图像进行等比例缩放，以获取缩放图像，并对缩放图像中的预设区域进行复制，以将复制图像放大至填充图像的长宽，并不直接使用固定像素的方式对缩放图像进行填充，可以使得拼接图像的待填充部分具有被检测图像的特征，如此可使得填充图像能提供有效的图像特征，从而可以实现将拼接图像输入目标检测模型时，可以提高目标检测模型对拼接图像的可识别度。

上述实施例中，如图4和图6所示，拼接图像包括缩放图像和填充图像，实际上包括了两次特征提取，这两部分的特征具有一定的相似，为了对应于不同的分辨下的图像特征，以及为了更好的利用这两份特征，以使两次特征的行程更好地互补，可以对着两部分特征进行加权融合，进一步地，在一个实施例中，也即步骤S20中，将缩放图像和填充图像进行拼接处理，以获取拼接图像，包括：

S201：获取缩放图像的预设区域与填充图像的权重比例。

在一个实施例中，权重比例可以通过以下方式进行获取：确定复制图像的宽度与填充图像的宽度的比值，将复制图像的宽度与填充图像的宽度的比值作为权重比例。

结合上述实施例，由于复制图像的宽度为78，填充图像的宽度为182，则复制图像的宽度除以填充图像的宽度的比值＝78:182≈1:2.3。在确定复制图像的宽度与填充图像的宽度的比值后，当前可以将1:2.3作为权重比例。

S202：根据权重比例对缩放图像和填充图像进行加权融合，以获取拼接图像。

其中，加权融合可以为线性融合和非线性融合，线性融合方式是基于加权系数对两张图像中的每个像素点进行线性加权融合，以得到拼接图像；而非线性融合方式是基于权重系数确定出两张图像的裁切比例，然后进行预设裁切方式的裁切，然后将裁切后的部分拼接在一起，以得到拼接图像，这里的预设裁切方式有多种，比如：垂直裁切、水平裁切、间隔垂直裁切、间隔水平裁切或局部区域裁切。示例性地，步骤S202可以采用非线性融合，在确定权重比例后，可以根据权重比例对416*182的缩放图像，和416*234的填充图像进行拼接处理，以获取416*416的图像，具体地，可以根据权重比例分别对“416*182的缩放图像”配重1份，并对“416*234的填充图像”配重2.3份，如此实现通过加权融合的方式获取拼接图像。

上述实施例中，可以理解，基于填充图像为复制图像放大获取，放大后填充图像具有更高的分辨率，加权融合时可以设置更大的权重。

上述实施例中，基于拼接图像上区域的两次特征提取具有一定的相似，对应于不同的分辨下的特征。通过对缩放图像和填充图像进行加权融合，可以使得融合的行程可以更好地互补，以实现拼接的图像更加精确，从而进一步提升目标检测模型对被检测图像的识别度，以提高目标检测模型对目标检测的准确性。

在一个实施例中，若被检测图像的长宽比例符合目标检测模型的输入图像长宽比例，方法还包括：

S105：确定被检测图像的长度是否等于目标检测模型的输入图像的长度，以及确定被检测图像的宽度是否等于目标检测模型的输入图像的宽度。

在一个应用场景中，若被检测图像的长宽比例符合目标检测模型的输入图像的长宽比例，进一步地，可以确定被检测图像的长度是否等于目标检测模型的输入图像的长度，以及确定被检测图像的宽度是否等于目标检测模型的输入图像的宽度。

S106：若被检测图像的长度不等于目标检测模型的输入图像的长度，且被检测图像的宽度不等于目标检测模型的输入图像的宽度，且被检测图像的长度和宽度均大于目标检测模型的输入图像的长度和宽度，则对被检测图像进行等比例缩放，以使被检测图像的长度等于目标检测模型的输入图像的长度，以及使被检测图像的宽度等于目标检测模型的输入图像的宽度；其中，等比例缩放的缩放倍数根据被检测图像的长宽和目标检测模型的输入图像的长宽确定。

示例性地，例如当前获取的被检测图像的长宽比例为1080*1080，则可以对当前的被检测图像进行等比例缩放，也即将1080*1080的被检测图像缩放成416*416的输入图像，具体的过程可以参照上述步骤S1022的实施例，为避免累赘，此处便不展开描述。

其中，等比例缩放的缩放倍数根据被检测图像的长宽和目标检测模型的输入图像的长度确定。具体可以参照上述步骤S1021的过程，为避免累赘，此处便不展开描述。

步骤S106中，需要说明的是，当前若确定被检测图像的长不等于目标检测模型的输入图像长，且被检测图像的宽不等于目标检测模型的输入图像宽，且被检测图像的长宽小于目标检测模型的输入图像长宽，则可以对被检测图像进行等比例放大，具体可以参见上述等比例缩放的过程，为避免累赘，此处便不展开描述。

上述的实施例中，通过步骤S105-S106，若被检测图像的长宽比例符合目标检测模型的输入图像的长宽比例，且被检测图像的长度不等于目标检测模型的输入图像的长度，且被检测图像的宽度不等于目标检测模型的输入图像的宽度，以及被检测图像的长宽大于目标检测模型的输入图像长宽，则对被检测图像进行等比例缩放，以使被检测图像的长度等于目标检测模型的输入图像的长度，以及使被检测图像的宽度等于目标检测模型的输入图像的宽度，也即通过对被检测图像进行统一处理的过程，可以提高目标检测模型对被检测图像的处理效率。

S30：将拼接图像作为输入图像，输入至预设的目标检测模型，以获取目标对象的候选框、候选框位置的置信度和置信度对应的可靠程度。

基于获取的拼接图像，可以将拼接图像作为输入图像，并将该输入图像输入至预设的目标检测模型，其中，预设的目标检测模型为通过已标注训练图像进行训练得到，在一个实施例中，目标检测模型的训练过程，具体包括步骤S01-步骤S04：

S01：获取训练图像集和验证图像集，训练图像集包括已标注训练图像；已标注训练图像的检测目标的标注框包括标注框参数，标注框参数包括检测框位置的置信度和检测框位置的置信度的可靠程度。

可理解，训练图像集为进行模型训练时用到的各训练图像的集合，验证图像集为验证训练的神经网络模型而用到的各验证图像的集合。训练图像集中各训练图像，以及验证图像集中的各验证图像均可以包括预设数量比例的正样本训练图像和负样本训练图像。

现有技术中，通常使用非极大值抑制NMS(Non-Maximum Suppression)的方式对输出的多个检测框进行去重，具体地，针对每一检测框，通过NMS的方式是将检测框位置的置信度与检测框类别的置信度相乘，并将相乘的结果作为对应每一检测框最终的置信度，从而排序删掉最终置信度低的检测框，以获取最终置信度较高对应的检测框。按照现在的处理方式，检测器针对其中一个检测框相应输出检测框位置的置信度，以及检测框类别的置信度。通常神经网络模型的训练方式，如图7所示，模型网络的一个分支输出检测框位置的置信度，模型网络的另一个分支输出检测框类别的置信度，示例性地，当前假设检测框类别的置信度为A，检测框位置的置信度为B，则最终的置信度为AB。使用这种方式容易造成误检，因为若检测框分类的置信度A比较小，而检测框位置的置信度B比较大的情况下，则AB的结果可能比实际使用的设置的置信度阈值要小，则例如针对人脸检测而言，当前可能将背景当成人脸，而出现造成误检的情况。

为了解决容易造成误检的问题，步骤S01中，对网络输出作了修改，具体地，如图8所示，也即将类别分支的检测框类别的置信度改成检测框位置的置信度的可靠程度。基于获取的训练图像集，可以先通过人工的方式对训练图像集中的每一训练图像进行标注，以使训练图像集的各训练图像中的检测目标存在对应标注框的标注框参数，其中，检测目标为需要检测的对象，通过标注框对检测目标进行标注，标注框参数用于描述该标注框。具体地，标注框参数可以包括标注框中检测框位置的置信度和检测框位置的置信度的可靠程度。

S02：通过已标注训练图像对预设神经网络模型进行训练。

具体地，可以根据实际情况预先构建神经网络模型，以获取预设神经网络模型，并通过已标注训练图形对预设神经网络模型进行训练。

S03：将验证图像集的验证图像输入至预设神经网络模型中，以获取预设神经网络模型输出的检测目标对应的检测框位置的置信度和检测框位置的置信度的可靠程度。

可以理解，检测框为预设神经网络模型针对训练图像中的检测目标的检测结果，检测框位置的置信度和检测框位置的置信度的可靠程度用于描述检测框。其中，检测框位置的置信度针对的是检测框，检测框位置的置信度的可靠程度针对的是置信度。以往的检测器，通常根据检测框的置信度做出判断，若置信度大于一定的阈值则会认为是目标。但网络给出的置信度并不一定可靠，因此需要对网络给出的置信度做一个预测，以判断针对检测框的置信度是否可靠，若不可靠则不采纳，以使可以根据检测框位置的置信度的可靠程度对网络输出的置信度做参考。

具体地，在通过已标注训练图像对预设神经网络模型进行训练后，进一步地，可以将验证图像集的各验证图像输入预设神经网络模型，由预设神经网络模型对各验证图像的检测目标进行检测，以输出针对验证图像中的检测目标的检测结果，该检测结果也即检测框位置的置信度和检测框位置的置信度的可靠程度。

S04：根据检测框位置的置信度和检测框位置的置信度的可靠程度，获取损失函数值。具体地，在一个实施例中，步骤S04，也即根据检测框位置的置信度和检测框位置的置信度的可靠程度获取损失函数值，具体地，可以通过以下公式实现：

loss＝-|p-σ|²((1-p)log(1-σ)+p logσ)

其中，p表示检测框位置的置信度，取值范围在0-1之间；σ表示检测框位置的置信度的可靠程度。

基于上述的公式，可以理解，当将检测框位置的置信度p以及检测框位置的置信度的可靠程度σ输入到该公式中，可以获取对应的损失函数值，以使根据对应的损失函数值对预设神经网络模型进行训练。

S05：根据损失函数值对预设神经网络模型的模型参数进行调整并继续训练，直至预设神经网络模型满足收敛条件时结束训练，以得到目标检测模型。

基于上述步骤S04获取的损失函数值，该步骤中，可以根据该损失函数值对预设神经网络模型中的模型参数进行调整，再对参数调整后的预设神经网络模型重复上述步骤继续训练，直至预设神经网络模型满足收敛条件时结束训练，例如可以当损失函数值越来越小，并小于预设阈值时；或者，具体还可以设定最大迭代次数，示例性地，当模型训练迭代次数超过最大迭代次数时，则终止训练，以得到目标检测模型，进一步地，在确定目标检测模型后，可以对输入的待检测图像进行目标检测。

上述的实施例中，通过步骤S01-S05将检测框位置的置信度和检测框位置的置信度的可靠程度当做一个整体，而不再单独训练检测框位置的置信度和检测框类别的置信度；并且，还通过将其中的检测框类别的置信度改成检测框位置的置信度的可靠程度，也即根据检测框位置的置信度和检测框位置的置信度的可靠程度获取损失函数值，以使根据损失函数值对目标检测模型进行训练的训练方式，如此可以使得而不会再出现检测框位置的置信度或者检测框类别的置信度其中一者很小，从而造成出现检测框置信度A和检测框置信度的可靠程度B的值很小的情况，以减少出现误检的情况。

S40：根据候选框位置的置信度和置信度对应的可靠程度，从候选框确定出目标对象的最终检测框。

在一个应用场景中，基于步骤S30将拼接图像作为输入图像，输入至目标检测模型进行检测时，相应会输出多个检测框，针对目标检测的后处理过程，如何筛选确定出准确度较高的候选框。

具体地，在获取到目标对象的候选框位置的置信度和候选框位置的置信度对应的可靠程度后，进一步地，可以根据预先预设的阈值，并将候选框位置的置信度和候选框位置的置信度的可靠程度与该预设的阈值进行对比，以确定出目标对象的最终检测框。

在一个实施例中，步骤S40中，也即，根据候选框位置的置信度和置信度对应的可靠程度，从候选框确定出目标对象的最终检测框，具体可以包括：

S401：在候选框中，确定是否存在候选框位置的置信度大于第一预设阈值，且置信度对应的可靠程度大于第二预设阈值的目标候选框。

进一步地，基于获取的候选框，当前的候选框包括多个，则需要选择其中满足预设阈值的部分候选框。

具体地，在候选框中，可以确定候选框中是否存在同时满足以下条件的目标候选框：候选框位置的置信度大于第一预设阈值，第一预设阈值可以为0.9，且候选框位置的置信度的可靠程度大于第二预设阈值，第一预设阈值可以为0.9。

S402：若确定存在候选框位置的置信度大于第一预设阈值，且置信度对应的可靠程度大于第二预设阈值的目标候选框，则将目标候选框作为目标对象的最终检测框。

若确定目标候选框的候选框位置的置信度大于0.9，且候选框位置的置信度的可靠程度大于0.9，则可以将该目标候选框作为目标对象的最终检测框。

现有技术中，检测器通常对候选框位置的置信度做出判断，若候选框位置的置信度大于一定阈值，则认为是当前候选框即为目标检测框。但网络给出的候选框位置的置信度并不一定可靠，因此需要对网络给出候选框位置的置信度做一个预测，以判断候选框位置的置信度是否可靠，如不可靠则不采纳。示例性地，若网络给出目标候选框位置的置信度为0.9，对于传统的检测网络，则认为当前目标候选框则为最终检测框。但网络对于候选框位置的置信度的可靠程度仅为0.1，可见当前的候选框位置的置信度的可靠程度小于第二预设阈值，也即当前候选框位置的置信度并不可靠。

上述的实施例中，通过将检测框位置的置信度和检测框位置的置信度的可靠程度当成整体进行训练，且通过将其中的检测框类别的置信度改成检测框位置的置信度的可靠程度。如此可以使得将被检测图像获取其他符合长宽比例的图像输入目标检测模型时，通过步骤S401和S402中可以对候选框位置的置信度的可靠程度做了预测，而不会再出现检测框位置的置信度或者检测框类别的置信度其中一者很小，从而造成出现检测框置信度A和检测框置信度的可靠程度B的值很小的情况，以减少出现误检的情况。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。

实施例2

在一个实施例中，本发明还提供一种图像检测装置，该图像检测装置实现的功能与上述实施例中图像检测方法的步骤一一对应。具体地，如图9所示，该图像检测装置可以包括获取模块10、拼接模块20、输入模块30和检测模块40。其中，各功能模块详细说明如下：

获取模块10，用于根据被检测图像获取缩放图像和填充图像；

拼接模块20，用于将所述缩放图像和所述填充图像进行拼接处理，以获取拼接图像；

输入模块30，用于将所述拼接图像作为输入图像，输入至预设的目标检测模型，以获取目标对象的候选框、候选框位置的置信度和所述置信度对应的可靠程度；

检测模块40，用于根据所述候选框位置的置信度和所述置信度对应的可靠程度，从所述候选框确定出所述目标对象的最终检测框。

在一个实施例中，获取模块10，还用于：

对所述缩放图像中的预设区域进行复制，以获取复制图像；

在一个实施例中，获取模块10，还用于：

将所述输入图像长度作为所述填充图像的长度；

在一个实施例中，获取模块10，还用于：

对所述缩放图像中的上三分之一所在的区域进行复制，以获取复制图像；

或者，对所述缩放图像中的上二分之一所在的区域进行复制，以获取复制图像。

在一个实施例中，获取模块10，还用于：

获取所述缩放图像的预设区域与所述填充图像的权重比例；

在一个实施例中，获取模块10，还用于：

确定所述复制图像的宽度与所述填充图像的宽度的比值；

在一个实施例中，输入模块30，还用于：

通过所述已标注训练图像对预设神经网络模型进行训练；

在一个实施例中，检测模块40，还用于：

关于图像检测装置的具体限定可以参见上文中对于图像检测方法的限定，在此不再赘述。上述图像检测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

实施例3

在一个实施例中，提供了一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现上述实施例图像检测方法中的步骤，或者，该计算机程序被处理器执行时实现上述实施例图像检测装置中各模块的功能，为避免重复，这里不再赘述。可以理解地，所述计算机可读存储介质可以包括：能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、电载波信号和电信信号等。

在一实施例中，提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现如下步骤：

根据被检测图像获取缩放图像和填充图像；

根据所述目标对象的候选框位置的置信度和所述置信度对应的可靠程度，从所述候选框确定出所述目标对象的最终检测框。

实施例4

在一个实施例中，如图10所示，提供一种计算机设备。具体地，该实施例的计算机设备60包括：处理器61、存储器62以及存储在存储器62中并可在处理器61上运行的计算机程序63。处理器61执行计算机程序63时实现上述实施例图像检测方法中的步骤，或者，处理器61执行计算机程序63时实现上述实施例图像检测装置中各模块的功能，为避免重复，这里不再赘述。

在一实施例中，提供了一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如下步骤：

根据被检测图像获取缩放图像和填充图像；

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本发明所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(SynchlinK)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块、子模块和单元完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。

以上所述实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围，均应包含在本发明的保护范围之内。

Claims

1.一种图像检测方法，其特征在于，所述方法包括：

确定被检测图像的长宽比例是否符合目标检测模型的输入图像长宽比例；

对所述缩放图像中的预设区域进行复制，以获取复制图像；

确定填充图像的长宽，将所述复制图像放大至所述填充图像的长宽，以获取所述填充图像；

将所述缩放图像和所述填充图像进行拼接处理，以获取拼接图像，其中，所述拼接图像为符合输入目标检测模型输入图像比例要求的图像；

将所述拼接图像作为输入图像，输入至预设的目标检测模型，以获取目标对象的候选框、候选框位置的置信度和所述置信度对应的可靠程度，其中，所述候选框位置的置信度和所述置信度对应的可靠程度用于描述检测框，其中，所述候选框位置的置信度针对的是检测框，所述置信度对应的可靠程度针对的是检测框置信度；

2.如权利要求1所述的图像检测方法，其特征在于，所述对所述被检测图像进行等比例缩放，以获取缩放图像，包括：

3.如权利要求1所述的图像检测方法，其特征在于，所述确定填充图像的长宽，包括：

将所述输入图像长度作为所述填充图像的长度；将所述输入图像宽度减去所述缩放图像的宽度，以确定所述填充图像的宽度。

4.如权利要求1所述的图像检测方法，其特征在于，所述将所述缩放图像和所述填充图像进行拼接处理，以获取拼接图像，包括：

获取所述缩放图像的预设区域与所述填充图像的权重比例；

5.如权利要求4所述的图像检测方法，其特征在于，所述获取所述缩放图像的预设区域与所述填充图像的权重比例，包括：

确定所述复制图像的宽度与所述填充图像的宽度的比值；

6.如权利要求1-5任一项所述的图像检测方法，其特征在于，所述目标检测模型为通过已标注训练图像进行训练得到，包括：

通过所述已标注训练图像对预设神经网络模型进行训练；

7.如权利要求1-5任一项所述的图像检测方法，其特征在于，所述根据所述候选框位置的置信度和所述置信度对应的可靠程度，从所述候选框确定出所述目标对象的最终检测框，包括：

8.一种图像检测装置，其特征在于，所述图像检测装置包括：

获取模块，用于根据被检测图像获取缩放图像和填充图像；

检测模块，用于根据所述候选框位置的置信度和所述置信度对应的可靠程度，从所述候选框确定出所述目标对象的最终检测框；

所述图像检测装置用于实现如权利要求1所述的方法。

9.一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1-5任一项所述的图像检测方法。

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-5任一项所述的图像检测方法。