CN110321851A

CN110321851A - 一种违禁物品检测方法、装置及设备

Info

Publication number: CN110321851A
Application number: CN201910603933.2A
Authority: CN
Inventors: 龚韬; 李东; 章云
Original assignee: Guangdong University of Technology
Current assignee: Guangdong University of Technology
Priority date: 2019-07-05
Filing date: 2019-07-05
Publication date: 2019-10-11

Abstract

本发明公开了一种违禁物品检测方法，由于通过具有多层卷积核的卷积神经网络提取的待识别图片的像素特征，能够消除掉待识别图片中背景特征的干扰，只留取目标物体的像素特征，如此一来，在将归一化后的第二像素特征图与第一像素特征图融合之后，可以加强各个目标物体的像素特征，以便提高各种违禁物品的识别准确率，自然也提高了小体积违禁物体的识别准确率，能够彻底地对违禁物品进行排查，消除了安全隐患。本发明还公开了一种违禁物品检测装置及设备，具有如上违禁物品检测方法相同的有益效果。

Description

一种违禁物品检测方法、装置及设备

技术领域

本发明涉及图片识别领域，特别是涉及一种违禁物品检测方法，本发明还涉及一种违禁物品检测装置及设备。

背景技术

违禁物品的检查可以极大的保证人口密度较大的场合(如地铁以及火车等交通枢纽)的群众的生命财产安全，现有技术中通常会对物品进行扫描(例如X光扫描)得到扫描图片，之后会利用分类器对图片中的物品进行分类并检测出违禁物品，但是现有技术中没有一种成熟的检测方法，经常会出现无法辨别出体积较小的违禁物品的现象，对于违禁物品的排查不够彻底，存在安全隐患。

因此，如何提供一种解决上述技术问题的方案是本领域技术人员目前需要解决的问题。

发明内容

本发明的目的是提供一种违禁物品检测方法，提高了小体积违禁物体的识别准确率，能够彻底地对违禁物品进行排查，消除了安全隐患；本发明的另一目的是提供一种违禁物品检测装置及设备，提高了小体积违禁物体的识别准确率，能够彻底地对违禁物品进行排查，消除了安全隐患。

为解决上述技术问题，本发明提供了一种违禁物品检测方法，包括：

提取待识别图片的像素特征，得到第一像素特征图；

通过具有多层卷积核的卷积神经网络提取所述待识别图片的像素特征，得到第二像素特征图；

将所述第一像素特征图与归一化后的所述第二像素特征图融合，得到第三像素特征图；

依据所述第三像素特征图进行违禁物品的识别。

优选地，所述通过具有多层卷积核的卷积神经网络提取所述待识别图片的像素特征，得到第二像素特征图具体为：

通过具有多层卷积核的卷积神经网络对所述待识别图片进行多次下采样操作；

对经过下采样后的所述待识别图片进行上采样操作；

通过两个1*1卷积核压缩经过上采样后的所述待识别图片的通道信息，得到第二像素特征图。

优选地，所述对经过下采样后的所述待识别图片进行上采样操作具体为：

采用双线性插值法对经过下采样后的所述待识别图片进行上采样操作。

优选地，所述将所述第一像素特征图与归一化后的所述第二像素特征图融合，得到第三像素特征图具体为：

将所述第一像素特征图以及经过归一化后的所述第二像素特征图进行矩阵点乘，得到增强的所述第一像素特征图；

将所述第一像素特征图以及增强的所述第一像素特征图相加，输出融合的第三像素特征图。

优选地，所述依据所述第三像素特征图进行违禁物品的识别具体为：

将所述第三像素特征图输入区域候选网络RPN网络，得到具有预设数目个候选区域的第四像素特征图；

将所述第四像素特征图依次输入到分类器以及回归器，得到对于所述待识别图片的检测结果。

优选地，所述归一化后的所述第二像素特征图具体为：

通过sigmoid函数将所述第二像素特征图中的像素值转换为0到1之间的概率值，得到的归一化后的所述第二像素特征图。

优选地，所述提取待识别图片的像素特征，得到第一像素特征图之前，该违禁物品检测方法还包括：

将待识别图片进行与i的数量相对应的预设类型的翻转处理，所述i的初始值为预设数值；

则所述依据所述第三像素特征图进行违禁物品的识别之后，该违禁物品检测方法还包括：

判断i是否等于预设数值；

若否，则将i的数值+1并返回步骤：

将待识别图片进行与i的数量相对应的预设类型的翻转处理；

若是，则将所有的对于不同翻转类型的所述待识别图片的违禁物品识别结果进行非极大值抑制，得到最终的违禁物品检测结果。

优选地，所述得到最终的违禁物品检测结果之后，该违禁物品检测方法还包括：

控制提示器提示最终的所述违禁物品检测结果。

为解决上述技术问题，本发明还提供了一种违禁物品检测装置，包括：

第一提取模块，用于提取待识别图片的像素特征，得到第一像素特征图；

第二提取模块，用于通过具有多层卷积核的卷积神经网络提取所述待识别图片的像素特征，得到第二像素特征图；

融合模块，用于将所述第一像素特征图与归一化后的所述第二像素特征图融合，得到第三像素特征图；

识别模块，用于依据所述第三像素特征图进行违禁物品的识别。

为解决上述技术问题，本发明还提供了一种违禁物品检测设备，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如上任一项所述违禁物品检测方法的步骤。

本发明提供了一种违禁物品检测方法，由于通过具有多层卷积核的卷积神经网络提取的待识别图片的像素特征，能够消除掉待识别图片中背景特征的干扰，只留取目标物体的像素特征，如此一来，在将归一化后的第二像素特征图与第一像素特征图融合之后，可以加强各个目标物体的像素特征，以便提高各种违禁物品的识别准确率，自然也提高了小体积违禁物体的识别准确率，能够彻底地对违禁物品进行排查，消除了安全隐患。

本发明还提供了一种违禁物品检测装置及设备，具有如上违禁物品检测方法相同的有益效果。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对现有技术和实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明提供的一种违禁物品检测方法的流程示意图；

图2为本发明提供的一种违禁物品检测装置的结构示意图；

图3为本发明提供的一种违禁物品检测设备的结构示意图。

具体实施方式

本发明的核心是提供一种违禁物品检测方法，提高了小体积违禁物体的识别准确率，能够彻底地对违禁物品进行排查，消除了安全隐患；本发明的另一核心是提供一种违禁物品检测装置及设备，提高了小体积违禁物体的识别准确率，能够彻底地对违禁物品进行排查，消除了安全隐患。

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参考图1，图1为本发明提供的一种违禁物品检测方法的流程示意图，包括：

步骤S1：提取待识别图片的像素特征，得到第一像素特征图；

具体的，待识别图片中存在目标物体，以及其余的背景区域，本步骤中提取待识别图片的像素特征的目的在于提取出目标物体的像素特征，以便后续步骤中利用具有目标物体像素特征的第一像素特征图进行违禁物品的识别。

其中，待识别图片可以为多种类型的图片，例如可以为地铁以及火车站安检机获得的X光图片等，本发明实施例在此不做限定。

具体的，本发明实施例中的违禁物品可以为多种，例如可以为地铁以及火车等交通工具禁止携带的危险物品，包括管制刀具等，本发明实施例在此不做限定。

具体的，本发明实施例可以选用以Resnet作为卷积特征提取器的Fasterrcnn检测器来进行，该模型可以利用Tensorflow框架来构建。

当然，还可以选用其他类型的检测器来进行本发明实施例中的特征提取等步骤，本发明实施例在此不做限定。

步骤S2：通过具有多层卷积核的卷积神经网络提取待识别图片的像素特征，得到第二像素特征图；

具体的，具有多层卷积核的卷积神经网络能够对待识别图片中的目标物体进行较深层次的像素特征的识别，并且剔除掉背景特征，从而提取出较为纯粹的目标物体的像素特征，并将其作为第二像素特征图。

其中，卷积核的层数可以根据实际需求进行自主设定，例如可以设置为5层等，本发明实施例在此不做限定。

其中，每层卷积核后面可以接一个平均池化操作，本发明实施例在此不做限定。

步骤S3：将第一像素特征图与归一化后的第二像素特征图融合，得到第三像素特征图；

具体的，归一化处理可以将第二像素特征图中目标物体的像素特征的像素值转换为0-1以内的概率值，即代表该像素值有多大的概率是某个物体，例如某个像素值有0.8的概率是水果刀等，本发明实施例在此不做限定。

其中，将归一化后的第二像素特征图与第一像素特征图融合，可以利用第二像素特征图中较为纯粹的目标物体的像素特征对第一像素特征图进行增强，以便后续步骤利用第三像素特征图更准确地识别出各个目标物体，即违禁物品。

步骤S4：依据第三像素特征图进行违禁物品的识别。

具体的，由于利用归一化后的第二像素特征图对第一像素特征图进行了目标物体像素特征的增强，从而得到了第三像素特征图，因此利用第三像素特征图能够更加准确地识别出各种目标物体，从而也能够更加准确地识别出小体积的违禁物品，降低了漏检率，排除了安全隐患。

在上述实施例的基础上：

作为一种优选的实施例，通过具有多层卷积核的卷积神经网络提取待识别图片的像素特征，得到第二像素特征图具体为：

通过具有多层卷积核的卷积神经网络对待识别图片进行多次下采样操作；

对经过下采样后的待识别图片进行上采样操作；

通过两个1*1卷积核压缩经过上采样后的待识别图片的通道信息，得到第二像素特征图。

具体的，通过具有多层卷积核的卷积神经网络对待识别图片进行多次下采样操作可以较深层次地对待识别图片中目标物体的像素特征进行挖掘提取。

具体的，上采样操作可以将经过下采样操作缩小后的图片进行放大，得到与第一像素特征图大小相同的第二像素特征图，便于后续的融合处理。

其中，在利用具有多层卷积核的卷积神经网络进行下采样的过程中，有可能导致第二像素特征图的通道信息较多，与第一像素特征图不一致，影响后续的融合过程，因此本发明实施例中可以通过两个1*1卷积核压缩经过上采样后的待识别图片的通道信息，使得第二像素特征图的通道信息与第一像素特征图保持一致，便于后续的融合过程。

作为一种优选的实施例，对经过下采样后的待识别图片进行上采样操作具体为：

采用双线性插值法对经过下采样后的待识别图片进行上采样操作。

具体的，双线性插值法可以快速准确地进行上采样操作。

当然，除了双线性插值法外，还可以采用其他的方法进行上采样操作，本发明实施例在此不做限定。

作为一种优选的实施例，将第一像素特征图与归一化后的第二像素特征图融合，得到第三像素特征图具体为：

将第一像素特征图以及经过归一化后的第二像素特征图进行矩阵点乘，得到增强的第一像素特征图；

将第一像素特征图以及增强的第一像素特征图相加，输出融合的第三像素特征图。

具体的，矩阵点乘之后，相当于利用第二像素特征图中的概率值对于第一像素特征图中的像素值进行了权重加成，例如第一像素特征图中的像素值A，在第二像素特征图中与像素值A对应的概率值为0.8，那么矩阵点乘的过程为A*0.8＝0.8A，增强后的第一像素特征图中的像素值A的像素值便由A变为了0.8A。

具体的，将增强的第一像素特征图与第一像素特征图相加，可以实现归一化后的第二像素特征图对于第一像素特征图的增强，以上述的像素值A为例，第三像素特征图中的像素值A的像素值便可以由第一像素特征图中的A变为1.8A，相当于可以深层次地挖掘各个像素值是否为违禁物品，提高了违禁物品的识别率。

作为一种优选的实施例，依据第三像素特征图进行违禁物品的识别具体为：

将第三像素特征图输入区域候选网络RPN网络，得到具有预设数目个候选区域的第四像素特征图；

将第四像素特征图依次输入到分类器以及回归器，得到对于待识别图片的检测结果。

具体的，RPN(Region proposal network，区域候选网络)网络可以起到对第三像素特征图进行分割的作用，可以将第三像素特征图分割为预设尺寸(例如7*7)的像素特征图，而分类器可以进行违禁物品的识别，回归器可以定位出违禁物品在待识别图像中的具***置坐标，位置坐标可以为多种类型，例如(x1，y1，x2，y2)，其中，(x1，y1)可以表示每个违禁物品在待识别图片内的左上角坐标，(x2，y2)可以表示右下角坐标。

具体的，将第三像素特征图依次输入RPN网络、分类器以及回归器的过程与现有技术中类似，可以起到输出违禁物品的识别结果的作用，本发明实施例在此不再赘述。

其中，所述预设数目可以自主设定，例如可以设置为2000等，本发明实施例在此不做限定。

作为一种优选的实施例，归一化后的第二像素特征图具体为：

通过sigmoid函数将第二像素特征图中的像素值转换为0到1之间的概率值，得到的归一化后的第二像素特征图。

具体的，通过sigmoid函数将第二像素特征图中的像素值转换为0到1之间的概率值具有速度快以及准确度高等优点。

当然，除了该方法外，还可以采用其他类型的方法进行归一化处理，本发明实施例在此不做限定。

作为一种优选的实施例，提取待识别图片的像素特征，得到第一像素特征图之前，该违禁物品检测方法还包括：

将待识别图片进行与i的数量相对应的预设类型的翻转处理，i的初始值为预设数值；

则依据第三像素特征图进行违禁物品的识别之后，该违禁物品检测方法还包括：

判断i是否等于预设数值；

若否，则将i的数值+1并返回步骤：

将待识别图片进行与i的数量相对应的预设类型的翻转处理；

若是，则将所有的对于不同翻转类型的待识别图片的违禁物品识别结果进行非极大值抑制，得到最终的违禁物品检测结果。

具体的，考虑到分类器对于不同翻转角度的待识别图片的处理结果很可能不同，例如某些图片中物体比较密集且重叠较为严重的情况下，不同翻转角度下，目标物体的位置坐标是不同的，影响了违禁物品的识别过程，本发明实施例中可以对待识别图片进行预设次数的翻转处理，且将每次翻转处理后的待识别图片都进行一次上述任一实施例中的违禁物品检测方法的流程，相当于得到了与翻转次数相同数目的识别结果，然后对于不同翻转类型的待识别图片的违禁物品识别结果进行非极大值抑制，利用非极大值抑制方法将所有的识别结果进行融合，相当于确定出对于同一像素点来说概率最高的目标物体的结果，例如对于位于不同翻转类型的待识别图片中的像素点B，识别为不同物体的概率不同，获取其中概率值最大的识别结果，将像素点B识别为电容电池。

其中，翻转类型可以为多种，例如可以为不翻转、水平翻转、竖直翻转以及逆时针旋转90°等，本发明实施例在此不做限定。

其中，预设数值可以进行自主设定，例如可以设置为i的初始值加3(其中，初始值可以自主设定，例如可以为0等)，相当于共有四种翻转类型，本发明实施例在此不做限定。

作为一种优选的实施例，得到最终的违禁物品检测结果之后，该违禁物品检测方法还包括：

控制提示器提示最终的违禁物品检测结果。

具体的，将违禁物品检测结果提示出来有利于工作人员迅速根据检测结果做出不同的应对措施，提高了工作效率，提示器的类型可以为多种，例如可以为文字提示或者语音提示等，本发明实施例在此不做限定。

具体的，本发明实施例提供的一种具体实施例可以为：

(1)、在带有英伟达NVIDIA图像处理器GTX1080Ti的计算机上，安装Ubuntu1604***，并安装配置好NVIDIA官方提供的CUDA(Compute Unified Device Architecture，统一计算设备架构)运行环境。

(2)、搭建tensorflow深度学***台，tensorflow是一个基于数据流编程的符号数学***，拥有多层级结构，可部署于各类服务器、PC(personal computer，个人计算机)终端和网页，并支持GPU(Graphics Processing Unit，图形处理器)和TPU(TensorProcessing Unit，张量处理单元)高性能数值计算，是一款优秀的主流深度学习框架，也是目前最受欢迎的深度学习框架之一。tensorflow环境的搭建步骤可以参照官方的安装指南。

(3)、收集预设张数(2000)张实际应用场景下X光安检机的过包图像作为该检测方法的数据集，尽量使每张图像中的物体随机分布，满足多尺度要求，也就是使违禁物品在每张图像中的分布有的稀疏，有的密集。

(4)、根据实际情况定义需要在X光图像中检测识别出的违禁物品类别，本发明中的类别定义共有四类，分别是管制刀具、打火机、电源电池、剪刀。标注出每张图像中的违禁物品的位置坐标，以矩形框坐标形式储存，将这些类别和坐标转换成COCO(Common Objectsin COntext)数据集的格式，用json格式文件保存。

(5)、利用tensorflow框架，实现Faster rcnn物体检测器算法，例如上述方法实施例中的步骤将不同翻转类型的待识别图片的的检测结果进行非极大值抑制，得到最后的检测结果。

(6)、利用(3)和(4)中提供好的X光图像集以及标注好的数据，以及(5)中实现的Faster rcnn算法，对此模型进行训练，为了加快训练过程，本发明中使用了2个GTX1080Ti图形处理器并行训练，2000张原始X光图像，预处理后变为6000张X光图像，训练耗时大约可以是7个小时。

(7)、将(5)中得到的直接用于违禁物品检测识别的Faster rcnn模型，部署在一套软件之中。将安检机的视频输出信号HDMI(High Definition Multimedia Interface，高清多媒体接口)接口接在图像采集卡上，通过图像采集卡SDK(Software Development Kit，软件开发工具包)获取安检机的最新图像画面，利用(6)中训练得到的Faster rcnn模型，检测从安检机截取出来的X光图像中是否存在违禁物品。并将检测到的违禁物品类型以及位置坐标用矩形框绘制出来，同时将模型的预测概率也绘制在图片上。在算法实际测检测部署中，类别概率可以选定一个阈值，当大于0.7时，则认为存在违禁物品目标，在现有检测技术中，某个待识别图片的左上角处的一堆电容电池目标无法有效检出，有时会被当成非违禁物品而忽略掉。通过本发明实施例中的方法可以将这部分特征增强后，使得后续的分类器和回归器更容易、更准确的将其分类和定位，从而有效提高了小体积物体违禁物品的检出效果。

请参考图2，图2为本发明提供的一种违禁物品检测装置的结构示意图，包括：

第一提取模块1，用于提取待识别图片的像素特征，得到第一像素特征图；

第二提取模块2，用于通过具有多层卷积核的卷积神经网络提取待识别图片的像素特征，得到第二像素特征图；

融合模块3，用于将第一像素特征图与归一化后的第二像素特征图融合，得到第三像素特征图；

识别模块4，用于依据第三像素特征图进行违禁物品的识别。

对于本发明实施例提供的违禁物品检测装置的介绍请参考前述的违禁物品检测方法的实施例，本发明实施例在此不再赘述。

请参考图3，图3为本发明提供的一种违禁物品检测设备的结构示意图，包括：

存储器5，用于存储计算机程序；

处理器6，用于执行计算机程序时实现如上任一项违禁物品检测方法的步骤。

对于本发明实施例提供的违禁物品检测设备的介绍请参考前述的违禁物品检测方法的实施例，本发明实施例在此不再赘述。

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

还需要说明的是，在本说明书中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者设备中还存在另外的相同要素。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其他实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种违禁物品检测方法，其特征在于，包括：

提取待识别图片的像素特征，得到第一像素特征图；

依据所述第三像素特征图进行违禁物品的识别。

2.根据权利要求1所述的违禁物品检测方法，其特征在于，所述通过具有多层卷积核的卷积神经网络提取所述待识别图片的像素特征，得到第二像素特征图具体为：

对经过下采样后的所述待识别图片进行上采样操作；

3.根据权利要求2所述的违禁物品检测方法，其特征在于，所述对经过下采样后的所述待识别图片进行上采样操作具体为：

4.根据权利要求3所述的违禁物品检测方法，其特征在于，所述将所述第一像素特征图与归一化后的所述第二像素特征图融合，得到第三像素特征图具体为：

5.根据权利要求1所述的违禁物品检测方法，其特征在于，所述依据所述第三像素特征图进行违禁物品的识别具体为：

6.根据权利要求1所述的违禁物品检测方法，其特征在于，所述归一化后的所述第二像素特征图具体为：

7.根据权利要求1至6任一项所述的违禁物品检测方法，其特征在于，所述提取待识别图片的像素特征，得到第一像素特征图之前，该违禁物品检测方法还包括：

判断i是否等于预设数值；

若否，则将i的数值+1并返回步骤：

将待识别图片进行与i的数量相对应的预设类型的翻转处理；

8.根据权利要求7所述的违禁物品检测方法，其特征在于，所述得到最终的违禁物品检测结果之后，该违禁物品检测方法还包括：

控制提示器提示最终的所述违禁物品检测结果。

9.一种违禁物品检测装置，包括：

10.一种违禁物品检测设备，其特征在于，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如权利要求1至8任一项所述违禁物品检测方法的步骤。