CN111325105A

CN111325105A - 目标检测方法、装置、设备和存储介质

Info

Publication number: CN111325105A
Application number: CN202010073501.8A
Authority: CN
Inventors: 周康明; 陈�光
Original assignee: Shanghai Eye Control Technology Co Ltd
Current assignee: Shanghai Eye Control Technology Co Ltd
Priority date: 2020-01-22
Filing date: 2020-01-22
Publication date: 2020-06-23

Abstract

本申请涉及一种目标检测方法、装置、设备和存储介质，将检验场景图像输入主干网络的卷积层为深度分离卷积层的预设的检测模型中，得到指示检验场景图像中是否存在检验人员的检测结果，并在检测结果指示不存在检验人员，输出用于提示检验人员离开检验岗位的提醒信息，使得在监控检验人员是否在检验岗位上，可以通过预设的检测模型来自动监控，且通过预设的检测模型来监控检验人员是否在检验岗位上，可以有效的避免由于人为疏忽导致的漏检测的情况，能够有效的管理检验人员，进而保证了机动车安检工作的质量。

Description

目标检测方法、装置、设备和存储介质

技术领域

本申请涉及图像识别技术领域，特别是涉及了一种目标检测方法、装置、设备和存储介质。

背景技术

随着经济的快速发展和物质生活水平的提高，机动车在人们的日常生活中越来越普及，机动车给人们的日常出行带来许多的便利，而与此同时车辆的安全问题也越来越受到关注。

机动车必须按照相关规定定期进行安检，机动车定期安检能够帮助车主及时的发现机动车的问题，有效的避免可能存在的安全隐患。机动车的安检通常由检验人员在各检验岗位上进行相关操作完成。随着车辆保有量的逐年增加，机动车安检工作量急剧增长，需要对检验人员的工作状态进行管理，以保证机动车的安检工作质量。

然而，传统技术缺乏有效的管理检验人员的方案。

发明内容

基于此，有必要针对缺乏有效的管理检验人员的问题，提供了一种目标检测方法、装置、设备和存储介质。

第一方面，一种目标检测方法，该方法包括：

将检验场景图像输入预设的检测模型中，得到检验场景图像的检测结果；检测结果用于指示检验场景图像是否存在检验人员；预设的检测模型中主干网络的卷积层为深度分离卷积层；

若检测结果指示不存在检验人员，则输出用于提示检验人员离开检验岗位的提醒信息。

在其中一个实施例中，若检测结果指示存在检验人员，该方法还包括：

确定检验场景图像的检验场景；

根据检验场景确定是否进行人体特征检测；人体特征检测包括识别检验人员的身份特征、识别检验人员的着装特征和识别检验人员的行为特征中的至少一种。

在其中一个实施例中，上述预设的检测模型中的锚点检测框的尺寸包括1:1、1:2和1:3。

在其中一个实施例中，上述预设的检测模型中的卷积核的维度小于refinedet网络中的卷积核的维度。

在其中一个实施例中，上述预设的检测模型的训练过程包括：

通过ImageNet数据集对初始检测模型中的主干网络进行训练，得到预训练检测模型；

将检验场景样本图像集合中的各检验场景样本图像作为预训练检测模型的输入，将各检验场景样本图像对应的标注结果作为预训练检测模型的参考输出，采用随机梯度下降方法，对预训练检测模型进行训练，得到预设的检测模型；标注结果用于标注检验场景图像中的检验人员。

在其中一个实施例中，该方法还包括：

获取初始检验场景样本图像集合；

对初始检验场景样本图像集合进行样本扩增处理，得到检验场景样本图像集合；样本扩增处理包括：图像旋转、图像水平镜像、增加高斯噪声、增加图像色彩亮度和减小图像色彩亮度中的至少一种。

在其中一个实施例中，上述获取初始检验场景图像集合包括：

获取图像采集设备采集的多个检验场景图像；

根据用户输入的标注信息，对各个检验场景图像进行标注，得到初始检验场景样本图像集合。

第二方面，一种目标检测装置，该装置包括：

输入模块，用于将检验场景图像输入预设的检测模型中，得到检验场景图像的检测结果；检测结果用于指示检验场景图像是否存在检验人员；预设的检测模型中主干网络的卷积层为深度分离卷积层；

输出模块，用于若检测结果指示不存在检验人员，则输出用于提示检验人员离开检验岗位的提醒信息。

第三方面，一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述第一方面所述的方法步骤。

第四方面，一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述第一方面所述的方法步骤。

上述目标检测方法、装置、设备和存储介质，将检验场景图像输入主干网络的卷积层为深度分离卷积层的预设的检测模型中，得到指示检验场景图像中是否存在检验人员的检测结果，并在检测结果指示不存在检验人员，输出用于提示检验人员离开检验岗位的提醒信息，使得在监控检验人员是否在检验岗位上，可以通过预设的检测模型来自动监控，且通过预设的检测模型来监控检验人员是否在检验岗位上，可以有效的避免由于人为疏忽导致的漏检测的情况，能够有效的管理检验人员，进而保证了机动车安检工作的质量。同时，由于预设的检测模型中的主干网络的卷积层为深度分离卷积层，其中，深度分离卷积层在提取图像特征时，所需的计算量远远小于标准卷积层在提取图像特征的计算量，因此，采用本申请提供的预设的检测模型确定检验场景图像中是否存在检验人员时，所需的计算量较小，提高了确定检验场景图像中是否存在检验人员的效率。

附图说明

图1为一个实施例中目标检测方法的应用环境的示意图；

图2为一个实施例中目标检测方法的流程示意图；

图2a为一个实施例中卷积核的示意图；

图2b为一个实施例中卷积核的示意图；

图3为另一个实施例中目标检测方法的流程示意图；

图3a为一个实施例中锚点检测框的示意图；

图3b为一个实施例中锚点检测框的示意图；

图4为另一个实施例中目标检测方法的流程示意图；

图5为另一个实施例中目标检测方法的流程示意图；

图6为另一个实施例中目标检测方法的流程示意图；

图6a为一个实施例中标注框的示意图；

图7为一个实施例中提供的目标检测装置的结构示意图；

图8为另一个实施例中提供的目标检测装置的结构示意图；

图9为另一个实施例中提供的目标检测装置的结构示意图；

图10为另一个实施例中提供的目标检测装置的结构示意图；

图11为一个实施例中计算机设备的内部结构图。

具体实施方式

本申请提供的目标检测方法、装置、设备和存储介质，旨在解决传统技术缺乏有效的管理检验人员的问题。下面将通过实施例并结合附图具体地对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例中不再赘述。需要说明的是，本申请实施例提供的目标检测方法，其执行主体为目标检测终端，其中，其执行主体还可以是目标检测装置，其中该装置可以通过软件、硬件或者软硬件结合的方式实现成为目标检测终端的部分或者全部。

本实施例提供的目标检测方法，可以适用于如图1所示的应用环境中。其中，目标检测终端100可以通过无线或有线的方式，与图像采集设备200建立通讯连接。目标检测终端100可以但不限于为智能手机、平板电脑、笔记本电脑、台式电脑或个人数字助理等具有数据处理功能的电子设备，本实施例对目标检测终端100的具体形式不做限定，图像采集设备200可以但不限于摄像头、相机和带拍摄功能的电子设备。

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。

图2为一个实施例中目标检测方法的流程示意图。本实施例涉及的是如何自动的根据检验场景图像确定是否向用户发出提醒信息的具体过程。如图2所示，该方法包括以下步骤：

S101、将检验场景图像输入预设的检测模型中，得到检验场景图像的检测结果；检测结果用于指示检验场景图像是否存在检验人员；预设的检测模型中主干网络的卷积层为深度分离卷积层。

其中，检验场景图像可以是通过设置机动车安检场景中的图像采集设备采集的图像。在一些检验场景中，必须要求检验人员在该场景中，才能保证机动车安检的质量。预设的检测模型可以是神经网络模型，可以用于提取检验场景图像中特征，并根据预设的检测模型中的参数对所提取的特征进行计算，输出用于指示检验场景图像是否存在检验人员的检验结果。

上述预设的检测模型的主干网络的卷积层为深度分离卷积层。传统方法中，用于检测图像中的目标物的检测模型通常采用标准的refinedet网络，标准的refinedet网络中的主干网络通常为VGG16，其中的卷积层为标准卷积层，标准卷积核尺寸如图2a所示：为D_k×D_k×M×N，其中，D_K为卷积核的宽和高，M为卷积核的深度(相当于卷积核输入特征图的维度)，N为卷积核的数量(相当于卷积核输出特征图的维度)。以输入特征图尺寸为D_F×D_F×M和输出特征图尺寸D_F×D_F×N为例，其中，输入特征图的宽度和高度，与输出特征图的宽度和高度一致，均为D_F。通过标准卷积核提取图像特征所需的计算量为：D_k×D_k×M×N×D_F×D_F。本实施例中，当主干网络被替换为的MobileNetV2时，即主干网络的卷积层为深度分离卷积层时，也即是将标准的卷积核分为深度卷积和点卷积。例如，主干网络的卷积层可以如图2b所示的深度卷积和点卷积，深度卷积的尺寸为D_k×D_k×1×M，点卷积的尺寸为1×1×M×N。通过深度分离卷积层提取图像特征所需的计算量为：D_k×D_k×M×D_F×D_F+M×N×D_F×D_F。标准卷积和深度分离卷积计算量之比为：

也即是说，深度分离卷积的计算量与标准卷积核相比要小很多。

S102、若检测结果指示不存在检验人员，则输出用于提示检验人员离开检验岗位的提醒信息。

在上述实施例的基础上，当检测结果指示不存在检验人员，可以输出用于提示检验人员离开检验岗位的提醒信息。该提醒信息可以是文字信息，也可以语音信息，还可以是蜂鸣信息，本申请实施例对此不做限制。例如，通过短消息的方式发送给目标用户的终端设备上，提醒目标用户改检验场景中的检验人员脱岗；也可以通过检验场景中安装的蜂鸣报警器发出蜂鸣声音，提醒该检验场景中检验人员脱岗。当检验结果指示存在检验人员时，可以通过开放相关的权限，使得机动车的安检工作正常进行。

上述目标检测方法，将检验场景图像输入主干网络的卷积层为深度分离卷积层的预设的检测模型中，得到指示检验场景图像中是否存在检验人员的检测结果，并在检测结果指示不存在检验人员，输出用于提示检验人员离开检验岗位的提醒信息，使得在监控检验人员是否在检验岗位上，可以通过预设的检测模型来自动监控，且通过预设的检测模型来监控检验人员是否在检验岗位上，可以有效的避免由于人为疏忽导致的漏检测的情况，能够有效的管理检验人员，进而保证了机动车安检工作的质量。同时，由于预设的检测模型中的主干网络的卷积层为深度分离卷积层，其中，深度分离卷积层在提取图像特征时，所需的计算量远远小于标准卷积层在提取图像特征的计算量，因此，采用本申请提供的预设的检测模型确定检验场景图像中是否存在检验人员时，所需的计算量较小，提高了确定检验场景图像中是否存在检验人员的效率。

图3为另一个实施例中目标检测方法的流程示意图，若检测结果指示存在检验人员，还可以根据检验场景确定是否对检验场景图像进行进一步的检测，如图3所示，该方法还包括以下步骤：

S201、确定检验场景图像的检验场景。

S202、根据检验场景确定是否进行人体特征检测，人体特征检测包括识别检验人员的身份特征、识别检验人员的着装特征和识别检验人员的行为特征中的至少一种。

在机动车的安检过程中，需要对机动车进行多项检测，例如，检测机动车进行车辆的尾气排放是否超标；检测发动机、底盘、车身及其附属设备是否清洁、齐全、有效；漆面是否均匀美观，各主要总成是否更换，与初检记录是否相符的检测；检测车辆的制动性、转向操纵性、灯光、排气及其它安全性能是否符合"机动车安全运行技术条件"的要求；检测机动车是否经过改装、改型、改造；检测号牌、行驶证及车上喷印的号牌放大字样有无损坏、涂改字迹不清等情况，是否需要更换。每种不同的检验场景对检验人员的要求不同。例如当检测漆面是否均匀美观时，只需要该检验场景中有检验人员对机动车进行目检即可；当检验场景为检测机动车进行车辆的尾气排放是否超标，需要专业的检验人员来进行检测；当检验场景为检测发动机、底盘、车身及其附属设备是否清洁、齐全、有效，还需要确认检验人员是否运动到发动机、底盘、车身对应的位置来进行检查。因此，终端在确定检验场景图像中存在检验人员之后，还需要进一步的从检验场景图像中获取检验场景，以确定是否进行人体特征检测。在从检验场景图像中获取检验场景时，可以通过确定检验场景图像用于检测机动车的必要工具，确定检验场景图像的检验场景；也可以通过获取检验场景图像的图像采集设别的标识，进而根据采集该检验场景图像的图像采集设备，与检验场景的对应关系，确定检验场景图像的检验场景；本申请实施例对此不做限制。当确定了检验场景图像的检验场景时，可以根据检验场景进一步的确定是否进行包括识别检验人员的身份特征、识别检验人员的着装特征和识别检验人员的行为特征中的至少一种的人体特征检测。

上述目标检测方法，终端通过确定检验场景图像的检验场景，进而根据检验场景确定是否进行包括识别检验人员的身份特征、识别检验人员的着装特征和识别检验人员的行为特征中的至少一种人体特征检测，使得在确定检验场景图像中存在检验人员时，进一步地获取检验场景图像的检验场景，并根据检验场景，确定是否进一步地的对检验人员的身份特征、检验人员的着装特征和检验人员的行为特征中的至少一种进行识别，使得在对检验人员的管理，能够适应各种不同的检验场景，提高了对检验人员的管理的适应性。

可选地，上述预设的检测模型中的锚点检测框的尺寸包括1:1、1:2和1:3。

其中，预设的检测模型在对检验场景图像进行检测时，可以通过锚点检测框对检验场景图像进行划窗操作，得到多个待检测图像，确定多个待检测图像中是否包括检验人员。传统的方法采用标准的refinedet网络对检验场景图像进行检测时，所使用的锚点检测框的宽高比如图3a所示，包括1:1、1:2和2:1三种尺寸。其中，在检验场景图像中，人员通常是站立的，因此宽高比2:1的锚点检测框不能检测出检验人员。本申请中预设的检测模型中的锚点检测框的宽高比如图3b所示，包括1:1、1:2和1:3。与检验人员的尺寸更加匹配。

上述目标检测方法，预设的检测模型中的锚点检测框的尺寸包括1:1、1:2和1:3，是与人类的身形更加匹配的锚点检测框，避免了检测与人类的身形相差较大的目标，提高了根据锚点检测框检测出的检验人员效率。

其中，当检测模型使用标准的refinedet网络时，该网络能够分辨91类不同的检测类别。然而，本申请在检测检验场景图像中的检验结果时，不需要检测的太多的类别。因此通过减小预设的检测模型中卷积层的维度，减少在进行模型运算是所需的计算量。例如，将与P3、P4、P5和P6特征层相连的卷积核维度，由256减少到128，降低模型运算所需的计算量。

上述目标检测方法，预设的检测模型中的卷积核的维度小于refinedet网络中的卷积核的维度，使得在通过预设的检测模型确定检验场景图像中是否存在检验人员时，所需的计算量较少，减少模型运行时的显存占用，提高模型运行效率。

在通过预设的检测模型对检验场景图像进行检测之前，还可以先初始的检测模型进行训练，得到预设的检测模型。如图4所示，上述预设的检测模型的训练过程包括：

S301、通过ImageNet数据集对初始检测模型中的主干网络进行训练，得到预训练检测模型。

其中，ImageNet数据集是根据WordNet层次结构组织的图像数据集，是一个已有的用于进行神经网络模型训练的数据集。检测模型中通常可以包括主干网络和分类网络。在对初始检测模型进行训练时，可以先通过ImageNet数据集对初始检测模型中的主干网络进行训练，调整主干网络中的网络参数，分类网络中的参数保持不变，得到预训练检测模型。

S302、将检验场景样本图像集合中的各检验场景样本图像作为预训练检测模型的输入，将各检验场景样本图像对应的标注结果作为预训练检测模型的参考输出，采用随机梯度下降方法，对预训练检测模型进行训练，得到预设的检测模型标注结果用于标注检验场景图像中的检验人员。

在获取了预训练检测模型之后，可以将检验场景样本图像集合中的各个检验场景样本图像作为预训练检测模型的输入，将各检验场景样本图像对应的标注结果作为预训练检测模型的参考输出，采用随机梯度下降(Stochastic Gradient Descent,SGD)方法，对预训练检测模型进行训练，调整预训练检测模型的参数，得到预设的检测模型。其中，检验场景样本图像可以是图像采集设备针对检验场景采集的图像，也可以是对图像采集设别针对检验场景采集的图像进行预处理，得到的图像，本申请实施例对此不做限制。在通过随机梯度下降方法训练预训练检测模型时，动量参数momentum可以为0.9。

上述目标检测方法，通过ImageNet数据集对初始检测模型中的主干网络进行训练，得到预训练检测模型，将检验场景样本图像集合中的各检验场景样本图像作为预训练检测模型的输入，将各检验场景样本图像对应的标注结果作为预训练检测模型的参考输出，采用随机梯度下降方法，对预训练检测模型进行训练，得到预设的检测模型标注结果用于标注检验场景图像中的检验人员，使得检测检验场景图像的预设的检测模型，是通过训练的检测模型，是准确度更高的检测模型，提高了根据预设的检测模型确定的检测结果的准确性。同时，在对初始检测模型进行训练的过程中，先采用ImageNet数据集对初始检测模型中的主干网络进行训练，得到预训练检测模型，再预训练检测模型进行训练，得到预设的检测模型，加快了预设的检测模型的模型训练的收敛速度，提高了模型训练的效率。

在一个实施例中，终端可以对图像采集设别采集的检验场景样本图像进行样本扩增，以增大训练检测模型的样本数据。可选地，如图5所示，该方法还包括以下步骤：

S401、获取初始检验场景样本图像集合。

其中，初始检验场景样本图像集合中可以包括多个检验场景图像，各个检验场景图像对应的标注信息指示检验场景图像中是否存在检验人员。终端可以通过图6所示的实施例来获取初始检验场景样本图像集合。如图6所示，S401“获取初始检验场景样本图像集合”一种可能的实现方法包括以下步骤：

S501、获取图像采集设备采集的多个检验场景图像。

其中，图像采集设备采集的多个检验场景图像，可以是同一图像采集设备采集的多个检验场景图像，也可以是不同图像采集设备采集的多个检验场景图像，本申请实施例对此不做限制。

S502、根据用户输入的标注信息，对各个检验场景图像进行标注，得到初始检验场景样本图像集合。

其中，对各个检验场景图像进行标注，可以是在各个检验场景图像上确定检验人员所在区域的坐标信息。当获取到图像采集设备采集的多个检验场景图像时，可以通过接收用户输入的指示检验场景图像上检验人员所在区域的坐标信息的标注信息，对各个检验场景图像进行标注，得到初始检验场景样本图像。在接收用户输入的标注信息时，可以在检验场景图像上标注如图6a所示的标注框。

S402、对初始检验场景样本图像集合进行样本扩增处理，得到检验场景样本图像集合；样本扩增处理包括：图像旋转、图像水平镜像、增加高斯噪声、增加图像色彩亮度和减小图像色彩亮度中的至少一种。

在得到初始检验场景样本图像集合之后，可以对初始检验样本图像集合中各个初始检验样本图像进行图像旋转、图像水平镜像、增加高斯噪声、增加图像色彩亮度和减小图像色彩亮度中的至少一种，得到各个初始检验样本图像对应的检验场景样本，其中每个初始检验样本图像可以对应的至少一个检验场景样本图像，将各个初始检验样本图像和各个初始检验样本图像对应的检验场景样本图像作为检验场景样本图像集合。

上述目标检测方法，获取初始检验场景样本图像集合，对初始检验场景样本图像集合进行样本扩增处理，得到检验场景样本图像集合，其中样本扩增处理包括：图像旋转、图像水平镜像、增加高斯噪声、增加图像色彩亮度和减小图像色彩亮度中的至少一种。也即是说，在对初始检测模型进行训练的检验场景样本图像集合中的检验场景样本图像的数量，是经过样本扩增得到的数量更多的检验场景样本图像，使得训练得到预设的检测模型的鲁棒性更好。

应该理解的是，虽然图2-6的流程图中的各个步骤按照箭头的指示，依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图2-6中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

图7为一个实施例中提供的目标检测装置的结构示意图，如图7所示，该目标检测装置包括：输入模块10和输出模块20，其中：

输入模块10，用于将检验场景图像输入预设的检测模型中，得到检验场景图像的检测结果；检测结果用于指示检验场景图像是否存在检验人员；预设的检测模型中主干网络的卷积层为深度分离卷积层；

输出模块20，用于若检测结果指示不存在检验人员，则输出用于提示检验人员离开检验岗位的提醒信息。

本申请实施例提供的目标检测装置，可以执行上述方法实施例，其实现原理和技术效果类似，在此不再赘述。

图8为另一个实施例中提供的目标检测装置的结构示意图，在图7所示实施例的基础上，如图8所示，该目标检测装置还包括：检测模块30，其中：

检测模块30具体用于确定检验场景图像的检验场景；根据检验场景确定是否进行人体特征检测；人体特征检测包括识别检验人员的身份特征、识别检验人员的着装特征和识别检验人员的行为特征中的至少一种。

在一个实施例中，上述预设的检测模型中的锚点检测框的尺寸包括1:1、1:2和1:3。

在一个实施例中，上述预设的检测模型中的卷积核的维度小于refinedet网络中的卷积核的维度。

图9为另一个实施例中提供的目标检测装置的结构示意图，在图7或图8所示实施例的基础上，如图9所示，该目标检测装置还包括：训练模块40，其中：

训练模块40具体用于通过ImageNet数据集对初始检测模型中的主干网络进行训练，得到预训练检测模型；将检验场景样本图像集合中的各检验场景样本图像作为预训练检测模型的输入，将各检验场景样本图像对应的标注结果作为预训练检测模型的参考输出，采用随机梯度下降方法，对预训练检测模型进行训练，得到预设的检测模型；标注结果用于标注检验场景图像中的检验人员。

需要说明的是，图9是基于图8的基础上进行示出的，当然图9也可以基于图7的基础进行示出，这里仅是一种示例。

图10为另一个实施例中提供的目标检测装置的结构示意图，在图7-9任一项所示实施例的基础上，如图10所示，该目标检测装置还包括：扩增模块50，其中：

扩增模块50具体用于获取初始检验场景样本图像集合；对初始检验场景样本图像集合进行样本扩增处理，得到检验场景样本图像集合；样本扩增处理包括：图像旋转、图像水平镜像、增加高斯噪声、增加图像色彩亮度和减小图像色彩亮度中的至少一种。

在一个实施例中，扩增模块50具体用于获取图像采集设备采集的多个检验场景图像；根据用户输入的标注信息，对各个检验场景图像进行标注，得到初始检验场景样本图像集合。

需要说明的是，图10是基于图9的基础上进行示出的，当然图10也可以基于图7或图8的结构进行示出，这里仅是一种示例。

关于一种目标检测装置的具体限定可以参见上文中对目标检测方法的限定，在此不再赘述。上述目标检测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是终端设备，其内部结构图可以如图11所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***和计算机程序。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种目标检测方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏，该计算机设备的输入装置可以是显示屏上覆盖的触摸层，也可以是计算机设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解，图11中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种终端设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

在一个实施例中，处理器执行计算机程序时还实现以下步骤：确定检验场景图像的检验场景；根据检验场景确定是否进行人体特征检测；人体特征检测包括识别检验人员的身份特征、识别检验人员的着装特征和识别检验人员的行为特征中的至少一种。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：通过ImageNet数据集对初始检测模型中的主干网络进行训练，得到预训练检测模型；将检验场景样本图像集合中的各检验场景样本图像作为预训练检测模型的输入，将各检验场景样本图像对应的标注结果作为预训练检测模型的参考输出，采用随机梯度下降方法，对预训练检测模型进行训练，得到预设的检测模型；标注结果用于标注检验场景图像中的检验人员。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：获取初始检验场景样本图像集合；对初始检验场景样本图像集合进行样本扩增处理，得到检验场景样本图像集合；样本扩增处理包括：图像旋转、图像水平镜像、增加高斯噪声、增加图像色彩亮度和减小图像色彩亮度中的至少一种。

在一个实施例中，处理器执行计算机程序时还实现以下步骤：获取图像采集设备采集的多个检验场景图像；根据用户输入的标注信息，对各个检验场景图像进行标注，得到初始检验场景样本图像集合。

本实施例提供的终端设备，其实现原理和技术效果与上述方法实施例类似，在此不再赘述。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：

在一个实施例中，计算机程序被处理器执行时实现以下步骤：确定检验场景图像的检验场景；根据检验场景确定是否进行人体特征检测；人体特征检测包括识别检验人员的身份特征、识别检验人员的着装特征和识别检验人员的行为特征中的至少一种。

在一个实施例中，计算机程序被处理器执行时实现以下步骤：通过ImageNet数据集对初始检测模型中的主干网络进行训练，得到预训练检测模型；将检验场景样本图像集合中的各检验场景样本图像作为预训练检测模型的输入，将各检验场景样本图像对应的标注结果作为预训练检测模型的参考输出，采用随机梯度下降方法，对预训练检测模型进行训练，得到预设的检测模型；标注结果用于标注检验场景图像中的检验人员。

在一个实施例中，计算机程序被处理器执行时实现以下步骤：获取初始检验场景样本图像集合；对初始检验场景样本图像集合进行样本扩增处理，得到检验场景样本图像集合；样本扩增处理包括：图像旋转、图像水平镜像、增加高斯噪声、增加图像色彩亮度和减小图像色彩亮度中的至少一种。

在一个实施例中，计算机程序被处理器执行时实现以下步骤：获取图像采集设备采集的多个检验场景图像；根据用户输入的标注信息，对各个检验场景图像进行标注，得到初始检验场景样本图像集合。

本实施例提供的计算机可读存储介质，其实现原理和技术效果与上述方法实施例类似，在此不再赘述。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上所述实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种目标检测方法，其特征在于，所述方法包括：

将检验场景图像输入预设的检测模型中，得到所述检验场景图像的检测结果；所述检测结果用于指示所述检验场景图像是否存在检验人员；所述预设的检测模型中主干网络的卷积层为深度分离卷积层；

若所述检测结果指示不存在所述检验人员，则输出用于提示检验人员离开检验岗位的提醒信息。

2.根据权利要求1所述的方法，其特征在于，若所述检测结果指示存在所述检验人员，所述方法还包括：

确定所述检验场景图像的检验场景；

根据所述检验场景确定是否进行人体特征检测；所述人体特征检测包括识别所述检验人员的身份特征、识别所述检验人员的着装特征和识别所述检验人员的行为特征中的至少一种。

3.根据权利要求1或2所述的方法，其特征在于，所述预设的检测模型中的锚点检测框的尺寸包括1:1、1:2和1:3。

4.根据权利要求1或2所述的方法，其特征在于，所述预设的检测模型中的卷积核的维度小于refinedet网络中的卷积核的维度。

5.根据权利要求1或2所述的方法，其特征在于，所述预设的检测模型的训练过程包括：

将检验场景样本图像集合中的各检验场景样本图像作为所述预训练检测模型的输入，将各所述检验场景样本图像对应的标注结果作为所述预训练检测模型的参考输出，采用随机梯度下降方法，对所述预训练检测模型进行训练，得到所述预设的检测模型；所述标注结果用于标注所述检验场景图像中的检验人员。

6.根据权利要求5所述的方法，其特征在于，所述方法还包括：

获取初始检验场景样本图像集合；

对所述初始检验场景样本图像集合进行样本扩增处理，得到所述检验场景样本图像集合；所述样本扩增处理包括：图像旋转、图像水平镜像、增加高斯噪声、增加图像色彩亮度和减小图像色彩亮度中的至少一种。

7.根据权利要求6所述的方法，其特征在于，所述获取初始检验场景图像集合包括：

获取图像采集设备采集的多个检验场景图像；

根据用户输入的标注信息，对各个所述检验场景图像进行标注，得到所述初始检验场景样本图像集合。

8.一种目标检测装置，其特征在于，所述装置包括：

输入模块，用于将检验场景图像输入预设的检测模型中，得到所述检验场景图像的检测结果；所述检测结果用于指示所述检验场景图像是否存在检验人员；所述预设的检测模型中主干网络的卷积层为深度分离卷积层；

输出模块，用于若所述检测结果指示不存在所述检验人员，则输出用于提示检验人员离开检验岗位的提醒信息。

9.一种终端设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1-7中任一项所述方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1-7中任一项所述的方法的步骤。