CN113807231A

CN113807231A - 基于unet下采样卷积神经网络的x光违禁物检测方法

Info

Publication number: CN113807231A
Application number: CN202111073404.XA
Authority: CN
Inventors: 刘静; 马玉婷
Original assignee: Xidian University
Current assignee: Xidian University
Priority date: 2021-09-14
Filing date: 2021-09-14
Publication date: 2021-12-17
Anticipated expiration: 2041-09-14
Also published as: CN113807231B

Abstract

本发明提出了一种基于UNET的下采样卷积神经网络的X光违禁物品检测方法，能够高效的将违禁物品检测出来。基于UNET网络实现的细粒度划分网络重复利用原有的低级特征和高级特征的弹性形变获得更优的特征提取，经过多次下采样后的低分辨率信息，可反映威胁目标和环境之间的潜在关系，有助于物体的类别判断；高分辨率信息，为分割提供更精细的特征，保证了特征的高效性和多样性，用来处理数据不平衡问题。在层次结构方面，建立了一种新的损失函数——分类损失函数，根据权重对数据进行重新分配和变形，以解决X射线安全检查中的数据覆盖问题，是一种非常实用的X光异常检测方法。

Description

基于UNET下采样卷积神经网络的X光违禁物检测方法

技术领域

本发明属于图像处理技术领域，更进一步涉及计算机视觉技术领域中的一种基于UNET的下采样卷积神经网络X光违禁物品检测方法，可用于对X光图像中的违禁物品进行检测。

背景技术

近年来，X光安全检测问题逐渐得到人们的重视，尤其是行李威胁检测已经成为全世界最关注的问题。仅2019年广州高铁站每天就平均检测40万人次，因此，积极寻找自动可靠的行李检查***，快速、自动和准确地识别X射线扫描图像中的违禁物品也就变的非常关键。X射线图像中被遮挡的违禁物体的识别可以看作是计算机视觉的一个目标检测问题，在行李检测中威胁对象出现的概率较小，被低严重低估，出现了类不平衡问题，这类检测有个统一的名称叫异常检测。

目前，在x射线行李图像的目标检测主要有两种方法：一种是传统视觉方法，一种是深度学习方法。传统视觉方法利用训练的手工特征，如X光行李图像中的单词(BoW。具有多个特征表示如DoG、DoG+SIFT、DoG+Harris)形成特征描述子进行特征提取，再利用支持向量机(SVM)进行分类和检测。但它的缺点是人工分析图片的特征，主观性较强且只在特定场景下适用，不利于泛化。深度学习方法一般方法为：采集大量图片，标注图片，把图片放进网络训练，查看训练结果，调节参数和网络结构，再次训练，得到最好的结果。

随着深度学习方法的深入研究，大量的卷积神经网络方法在X光安全检测中应用。Yanlu Wei在其发表的论文“Occluded Prohibited Items Detection:An X-ray SecurityInspection Benchmark and De-occlusion Attention Module”(arXiv preprintarXiv2004.08656,2020)中，公开了一种基于去遮挡注意力模块的X光违禁物品检测方法。该方法使用了一个去遮挡的注意力模块将目标和背景进一步区分，在注意生成中，通过“边缘引导”和“材料感知”生成两个特征图，并融合生成注意图，将注意图应用于输入图像，生成想要的精细特征图，细化后的特征映射用于SSD网络中。该方法使用了目标物品的边缘信息和材质信息，获得的图像特征的质量很高，且插件式设计灵活多用，但在威胁目标数量过少或数据集缺乏的情况下，边缘信息和材料信息远远不足，且当图片覆盖严重时，会对整体的精确度造成影响。

发明内容

本发明的目的在于针对上述现有技术存在的不足，提出一种基于UNET的下采样卷积神经网络的X光违禁物品检测方法。旨在提高因为威胁目标和数据集的缺乏以及图片覆盖严重情况下X光违禁物品的检测准确度。

本发明的技术思路是，首先构建X光违禁物品数据集，将其依输入到特征提取网络f_f-e、细粒度划分网络f_down-up、注意力网络f_attention和输出网络f_output，在细粒度划分网络f_down-up中利用UNET网络结构，减弱了威胁目标数量过少的影响，然后修改损失函数的算法，降低X光图像中的无用信息比重，将被检测目标图像更大权重的输入基于深度的卷积神经网络的检测器，最后用训练好的基于UNET的下采样卷积神经网络对待检测的X光图像进行检测。

为实现上述目的，本发明采取的技术方案包括如下步骤：

(1)获取训练样本集和测试样本集：

(1a)获取N幅包含不同类别违禁物品的X光图像M＝{m_i|1≤i≤N}，并对每幅X光图像m_i中的违禁物品类别及位置坐标进行标注，得到类别标签集

和位置坐标标签集

其中，N＞8000，m_i表示第i幅X光图像，

和

分别表示m_i所包含的违禁物品的类别标签和位置坐标标签，

表示第s类违禁物品，S表示违禁物品的类别数，S≥2，

和

分别表示

所围成的标记框中心的横坐标、标记框中心的纵坐标、标记框的宽和标记框的高；

(1b)将随机选取M中半数以上的违禁物品X光图像及其对应的类别标签和位置坐标标签组成训练样本集M_train＝{m_j|1≤j≤N_train}，N/2＜N_train≤N，将其余违禁物品X光图像及其对应的类别标签和位置坐标标签组成测试样本集M_test＝{m_l|1≤l≤N_test}，其中，m_j表示训练样本集中的第j幅X光图像，m_l表示训练样本集中的第l幅X光图像，N/2＜N_train≤N，N_test＝N-N_train；

(2)构建基于UNET的下采样卷积神经网络：

(2a)构建基于UNET的下采样卷积神经网络的结构：

构建包括顺次连接的特征提取网络f_f-e、基于UNET网络实现的细粒度划分网络f_down-up、注意力网络f_attention和输出网络f_output的下采样卷积神经网络，其中，特征提取网络f_f-e包括输入层、多个卷积模块和多个残差模块；细粒度划分网络f_down-up包含多个上采样连接模块、多个下采样连接模块、卷积模块和多个concat拼接层，构成“U”型结构；注意力网络f_attention包括多个卷积模块和一个融合模块；输出网络f_output包括两个卷积层，一个归一化层和一个激活函数层的神经网络；

(2b)定义基于UNET的下采样卷积神经网络的损失函数Loss：

Loss＝L_GHM-C+L_lc

其中，L_GHM-C表示分类损失函数，L_CE是交叉熵损失损失函数，P是构建的卷积神经网络的检测概率，P^*是X图像的标签，P^*的取值为0或1，GD(g)表示单位梯度模长g部分的样本个数，即梯度密度，δ_ε(g_d,g)表明了样本1～W中，梯度模长分布在

范围内的样本个数，l_ε(g)代表了

区间的长度；L_lc表示类别和定位损失函数，L_lc把X光图片划分成不同大小的网格,根据候选框和标记框的中心点坐标、及宽高信息和网格数构建函数，M代表候选框数量，M＝3，K代表网格数，

表示在q,m处的候选框有目标，

表示在q,m处的候选框没有目标，w表示候选框的宽度，h表示候选框的高度，x表示候选框中心的横坐标，y表示候选框中心的纵坐标，C表示候选框内存在违禁物品的置信度，

表示候选框内实际是存在违禁物品的,

表示违禁物品是属于第c类的概率，λ_coord为定位平衡参数，λ_noobj为类别平衡参数；

(3)对基于UNET的下采样卷积神经网络进行迭代训练：

(3a)初始化特征提取网络f_f-e的权重参数为

细粒度划分网络f_down-up的权重参数为

注意力网络f_attention的权重参数为

输出网络f_output的权重参数为

迭代次数为t，最大迭代次数为T≥50，并令t＝0；

(3b)将训练样本集M_train中的每个训练样本包括X光图像及其对应的类别标签和位置坐标标签作为特征提取网络f_f-e的输入，每幅图像m_j在特征提取网络中进行前向特征提取，得到图像m_j的第一高级特征

(3c)将图像m_j的第一高级特征

作为细粒度划分网络f_down-up的输入进行特征提取，在细粒度划分网络f_down-up中进行特征融合，得到图像m_j的第二高级特征

(3d)将图像m_j的第二高级特征

作为注意力网络f_attention的输入进行前向特征提取，得到图像m_j的注意力图

(3e)将图像m_j的注意力图

与图像m_j的第一高级特征

在融合模块中相乘，得到图像m_j的第三高级特征

(3f)将图像m_j的第三高级特征

作为输出网络f_output的输入进行前向特征提取，得到图像m_j的所包含违禁物品的预测位置坐标标签

置信度信息

和预测类别标签概率

(3g)基于UNET的下采样卷积神经网络的损失函数Loss＝L_GHM-C+L_lc，通过

计算分类损失函数L_GHM-C，以及类别和定位损失函数L_lc的函数值，并将L_GHM-C与L_lc相加得到Loss,再采用反向传播方法，通过Loss计算f_f-e、f_down-up、f_attention和f_output的网络权重参数梯度，然后采用梯度下降算法通过f_f-e、f_down-up、f_attention和f_output的网络权重参数梯度对f_f-e、f_down-up、f_attention和f_output的网络权重参数

θ_attention和θ_output进行更新；

(3h)判断t≥T是否成立，若是，得到训练好的基于UNET的下采样卷积神经网络，否则，令t＝t+1，并执行步骤(3b)；

(4)获取X光违禁物品图像识别结果：

(4a)将测试样本集M_test中的每个训练样本包括X光图像及其对应的类别标签和位置坐标标签作为训练好的基于UNET的下采样卷积神经网络的输入进行前向传播，得到违禁物品的预测位置坐标标签(x_l,y_l,w_l,h_l)，置信度信息C_l和类别标签概率p_l(c)；

(4b)将测试图像m_l预测的置信度信息

中大于0.5的结果所对应的预测位置坐标标签(x_l,y_l,w_l,h_l)和类别标签概率p_l(c)中最大值对应的违禁物品类别分别作为测试图像m_l违禁物品的位置预测结果和类别预测结果；

本发明与现有技术相比，具有以下优点：

本发明在对基于UNET的下采样卷积神经网络进行训练以及获取X光违禁物品的检测结果的过程中，基于UNET网络实现的细粒度划分网络重复利用原有的低级特征和高级特征的弹性形变获得更优的特征提取，增强数据特征多样性，丰富了边缘信息和材料信息，解决了数据集数据较少引发的威胁目标数量更少的这一类问题的X光图像检测效果；其次，引入的分类损失函数L_GHM-C，克服了现有技术中对于图片覆盖严重的问题虽然能通过设定颜色阈值、用边缘分离前后背景等操作提高检测效果，但不可避免的杂糅了无关信息进去，造成了干扰，有助于把严重覆盖的图片和非常简单的图片(背景很多的图片)看作离群点做权重调整后得到更优秀数据，从而提高了因为威胁目标和数据集的缺乏以及图片覆盖严重情况下X光违禁物品的检测准确度。

附图说明

图1为本发明的实现流程图；

图2为本发明和现有技术检测精度的仿真结果对比图。

具体实施方式

下面将结合附图和具体实施例，对本发明进行详细说明。

参照图1，本发明包括如下步骤：

步骤1)获取训练样本集和测试样本集：

步骤1a)获取N幅包含不同类别违禁物品的X光图像M＝{m_i|1≤i≤N}，并对每幅X光图像m_i中的违禁物品类别及位置坐标进行标注，得到类别标签集

和位置坐标标签集

其中，N＞8000，m_i表示第i幅X光图像，

和

分别表示m_i所包含的违禁物品的类别标签和位置坐标标签，

表示第s类违禁物品，S表示违禁物品的类别数，S≥2，

和

分别表示

所围成的标记框中心的横坐标、标记框中心的纵坐标、标记框的宽和标记框的高，本实例中N＝8885，S＝5；

(1b)将随机选取M中半数以上的违禁物品X光图像及其对应的类别标签和位置坐标标签组成训练样本集M_train＝{m_j|1≤j≤N_train}，N/2＜N_train≤N，将其余违禁物品X光图像及其对应的类别标签和位置坐标标签组成测试样本集M_test＝{m_l|1≤l≤N_test}，其中，m_j表示训练样本集中的第j张X光图像，m_l表示训练样本集中的第l张X光图像，N/2＜N_train≤N，N_test＝N-N_train,本实例中，N_train＝7109，N_test＝1776；

步骤2)构建基于UNET的下采样卷积神经网络：

步骤2a)构建基于UNET的下采样卷积神经网络的结构：

特征提取网络f_f-e，其结构依次为：输入层→第一卷积模块→第一卷积层→第一残差模块→第二卷积层→第二残差模块→第三残差模块→第三卷积层→第四残差模块→第五残差模块→第六残差模块→第七残差模块→第八残差模块→第九残差模块→第十残差模块→第十一残差模块→第四卷积层→第十二残差模块→第十三残差模块→第十四残差模块→第十五残差模块→第十六残差模块→第十七残差模块→第十八残差模块→第十九残差模块→第采用包含五个卷积模块和二十三个残差模块的卷积神经网络，其结构依次为：输入层→第一卷积模块→第一残差模块→第二卷积模块→第二残差模块→第三残差模块→第三卷积模块→第四残差模块→第五残差模块→第六残差模块→第七残差模块→第八残差模块→第九残差模块→第十残差模块→第十一残差模块→第四卷积模块→第十二残差模块→第十三残差模块→第十四残差模块→第十五残差模块→第十六残差模块→第十七残差模块→第十八残差模块→第十九残差模块→第五卷积模块→第二十残差模块→第二十一残差模块→第二十二残差模块→第二十三残差模块；

其中每个卷积模块包含一个卷积层，一个归一化层和一个激活函数层，每个残差模块包含两个卷积模块和一个shortcut拼接层；

设置特征提取网络f_f-e中每层的参数为，将第一、二、三、四、五卷积模块中的卷积层的卷积核大小设置为3×3，卷积步长设置为2，填充值为1；将第一、二、三、四、五、六、七、八、九、十、十一、十二、十三、十四、十五、十六、十七、十八、十九、二十、二十一、二十二、二十三残差模块中第一个卷积层的卷积核大小设置为1×1，卷积步长设置为1，填充值为0，第二个卷积层卷积核大小设置为3×3，卷积步长设置为1，填充值为1；所有归一化层都采用BatchNorm2d函数实现；所有激活函数层都采用Mish函数实现；

细粒度划分网络f_down-up整体呈“U”型结构，该网络左边结构包括包含七个卷积模块，两个下采样连接模块和一个SPP模块，该网络右边结构由两个上采样连接层模块组成，其整体结构依次为：第一卷积模块→第二卷积模块→第三卷积模块→第四卷积模块→SPP模块→第五卷积模块→第六卷积模块→第七卷积模块→第一下采样连接模块→第二下采样连接模块→第一上采样连接模块→第二上采样连接模块；

细粒度划分网络f_down-up的每层参数均设置为：其中每个卷积模块包含一个卷积层，一个归一化层和一个激活函数层，每个下采样连接模块包含两个卷积模块，一个下采样，五个卷积模块，每个上采样连接模块包含两个卷积模块，一个上采样，一个concat层，五个卷积模块，SPP模块包含三个最大池化层和concat层。

设置每个模块中每层的参数为：第一、二、四、五、七卷积模块中的卷积层的卷积核大小设置为1×1，卷积步长设置为1，填充值为0，归一化层采用BatchNorm2d函数实现，激活函数层除第一卷积模块用Mish函数，此外都采用LeakyReLU函数实现，其斜率均设置为0.2；第一、二下采样连接模块中的卷积层的卷积核大小设置为设置为1×1，卷积步长设置为1，填充值为0，归一化层采用BatchNorm2d函数实现，激活函数层采用LeakyReLU函数实现，其斜率均设置为0.2；第一、二上采样连接模块中的卷积层的卷积核大小设置为设置为1×1，卷积步长设置为1，填充值为0，归一化层采用BatchNorm2d函数实现，激活函数层采用LeakyReLU函数实现，其斜率均设置为0.2；

注意力网络f_attention采用包含五个卷积模块和一个融合模块的卷积神经网络，其结构依次为：第一卷积模块→第二卷积模块→第三卷积模块→第四卷积模块→第五卷积模块→第一融合模块；

所述注意力网络f_attention的卷积模块每层参数设置为：将第一至五卷积模块中的第一卷积层的卷积核大小设置为3×3，卷积步长设置为2，填充值为1；第一至五卷积模块中的第一归一化层采用BatchNorm2d函数；第一、二卷积模块中的第一激活函数采用LeakyReLU函数，其斜率均设置为0.2；第三、四、五卷积模块中的第一激活函数采用Mish函数；

所述注意力网络f_attention的融合模块由一个卷积层构成，卷积核大小设置为3×3，卷积步长设置为2，填充值为1；

输出网络f_output采用包含两个卷积层，一个归一化层和一个激活函数层的神经网络，其结构依次为：第一卷积层→第二卷积层→第一归一化层→第一激活函数层；

所述输出网络f_output的每层参数设置为：将第一卷积层的卷积核大小设置为3×3，卷积步长设置为2，填充值为1；将第二卷积层的卷积核大小设置为1×1，卷积步长设置为1，填充值为0；第一归一化层采用BatchNorm2d函数；第一激活函数层第一激活函数采用LeakyReLU函数。

步骤2b)为了减少数据集中威胁目标过少和数据遮挡严重带来的问题，损失函数由分类损失函数L_GHM-C和类别和定位损失函数L_lc两部分构成，总损失函数Loss定义为：

Loss＝L_GHM-C+L_lc

范围内的样本个数，l_ε(g)代表了

表示在q,m处的候选框有目标，

表示候选框内实际是存在违禁物品的,

表示违禁物品是属于第c类的概率，λ_coord为定位平衡参数，λ_noobj为类别平衡参数，本实例中，候选框的数量M为3，网格数量K为13，26，52，定位平衡参数λ_coord为5，类别平衡参数λ_noobj为0.5；

步骤3)对基于UNET的下采样卷积神经网络进行迭代训练：

步骤3a)初始化特征提取网络f_f-e的权重参数为

细粒度划分网络f_down-up的权重参数为

注意力网络f_attention的权重参数为

输出网络f_output的权重参数为

迭代次数为t，最大迭代次数为T≥50，并令t＝0；

步骤3b)将训练样本集M_train中的每个训练样本包括X光图像及其对应的类别标签和位置坐标标签作为特征提取网络f_f-e的输入，每幅图像m_j在特征提取网络中进行前向特征提取，得到图像m_j的第一高级特征

步骤3c)将图像m_j的第一高级特征

步骤3d)将图像m_j的第二高级特征

步骤3e)将图像m_j的注意力图

与图像m_j的第一高级特征

在融合模块中相乘，得到图像m_j的第三高级特征

步骤3f)将图像m_j的第三高级特征

置信度信息

和预测类别标签概率

步骤3g)基于UNET的下采样卷积神经网络的损失函数Loss＝L_GHM-C+L_lc，通过

θ_attention和θ_output进行更新；

步骤3h)判断t≥T是否成立，若是，得到训练好的基于UNET的下采样卷积神经网络，否则，令t＝t+1，并执行步骤(3b)；

(4)获取X光违禁物品图像识别结果：

(4b)将测试图像m_l预测的置信度信息

下面结合仿真实验对本发明的效果做进一步的说明：

1.仿真实验条件：

本发明的仿真实验的硬件平台为：处理器为Intel(R)Core i7-10700K CPU，主频为3.8GHz，内存为32GB、显卡为NVIDIA GeForce RTX 3090。

本发明的仿真实验的软件平台为：Ubuntu 18.04操作***，python 3.7.4，Pytorch1.7.0。

2.仿真内容及仿真结果分析：

本发明仿真实验中生成训练集和测试集时，使用了公开的标准数据集OccludedProhibited Items X-ray(OPIXray),该数据集包含五个分类，折叠刀，直刀，剪刀，美工刀，多功能刀，共8885张X光图像，本发明仿真实验中使用OPIXray中7109张图片作为训练集，1176张图片作为测试集。

本发明仿真实验是采用本发明和现有技术分别对测试集中的1176张图片中的违禁物品进行检测。

在仿真实验中，采用的现有技术是指：

Y.Wei等人在“Occluded prohibited items detection:An X-ray securityinspection benchmark and de-occlusion attention module.(Proceedings of the28th ACM International Conference on Multimedia.2020)”中提出的基于去遮挡注意力模块的X光违禁物品检测方法，简称DOAM方法，仿真实验中DOAM方法采用单阶段目标检测算法yolov4作为主体网络，嵌入DOAM模块进行仿真。

为了对本发明仿真结果的效果进行评估，本发明采用AP作为性能评价指标与现有技术进行对比，AP的定义为精度Precision和和召回率Recall所成曲线下的面积，精度Precision定义为TP/(TP+FP)，召回率Recall定义为TP/(TP+FN)，其中TP，FP，TN和FN分别代表真正类，假正类，真反类，和假反类，mAP定义为AP的平均值，对比结果如表1所示：

表1仿真实验中本发明和现有技术AP的对比表

从表1中可以看出本发明在OPIXray数据集上mAP为82.92％，高于两种现有技术方法，在折叠刀，直刀，剪刀，美工刀，多功能刀五个类别上的AP分别为87.90％，56.33％，97.82％，83.47％，89.06％，在折叠刀，直刀，剪刀，美工刀，多功能刀五个类别上均高于现有技术方法，由图2(a)和图2(c)所示，本发明能够精确的识别并定位违禁物品的位置和种类，证明本方法可以有效提高检测X光图像中的违禁物品的精度。且由图2(b)所示，本发明能在各类物品层叠遮挡的情况下准确识别定位违禁物品的位置和种类，证明本发明对遮挡严重场景下的X光图像能够达到很好的检测效果。

本发明方法构建的基于UNET的下采样卷积神经网络，在方法上，经过多次下采样后的低分辨率信息，提供威胁目标在整个图像中上下文语义信息，这个特征反映威胁目标和环境之间的潜在关系，有助于物体的类别判断。高分辨率信息，为分割提供更精细的特征，如梯度等，有效的将本来就不多的低级特征和其衍生出来的高级特征做了弹性形变和保留，保证了特征的高效性和多样性，用来处理数据不平衡问题。在层次结构方面，建立了一种新的损失函数，根据权重对数据进行重新分配和变形，以解决X射线安全检查中的数据覆盖问题，是一种非常实用的X光异常检测方法。

Claims

1.一种基于UNET的下采样卷积神经网络的X光违禁物品检测方法，其特征在于包括如下步骤：

(1)获取训练样本集和测试样本集：

和位置坐标标签集

其中，N＞8000，m_i表示第i幅X光图像，

和

分别表示m_i所包含的违禁物品的类别标签和位置坐标标签，

表示第s类违禁物品，S表示违禁物品的类别数，S≥2，

和

分别表示

(2)构建基于UNET的下采样卷积神经网络：

(2a)构建基于UNET的下采样卷积神经网络的结构：

构建包括顺次连接的特征提取网络f_f-e、基于UNET网络实现的细粒度划分网络f_down-up、注意力网络f_attention和输出网络f_output的下采样卷积神经网络，其中，特征提取网络f_f-e包括输入层、多个卷积模块和多个残差模块；细粒度划分网络f_down-up包含多个上采样连接模块、多个下采样连接模块、卷积模块和多个concat拼接层，构成“U”型结构；注意力网络f_attention包括多个卷积模块和一个融合模块；输出网络f_output采用包括两个卷积层、一个归一化层和一个激活函数层的神经网络；

(2b)定义基于UNET的下采样卷积神经网络的损失函数Loss：

Loss＝L_GHM-C+L_lc

其中，L_GHM-C表示分类损失函数，L_CE是交叉熵损失函数，P是构建的卷积神经网络的检测概率，P^*是X光图像的标签，P^*的取值为0或1，GD(g)表示单位梯度模长g部分的样本个数，即梯度密度，δ_ε(g_d,g)表明了样本1～W中，梯度模长分布在

范围内的样本个数，l_ε(g)代表了

区间的长度；L_lc表示类别和定位损失函数，L_lc把X光图像划分成不同大小的网格,根据候选框和标记框的中心点坐标、及宽高信息和网格数构建函数，M代表候选框数量，M＝3，K代表网格数，

表示在q,m处的候选框有目标，

表示候选框内实际是存在违禁物品的,

(3)对基于UNET的下采样卷积神经网络进行迭代训练：

(3a)初始化特征提取网络f_f-e的权重参数为

细粒度划分网络f_down-up的权重参数为

注意力网络f_attention的权重参数为

输出网络f_output的权重参数为

迭代次数为t，最大迭代次数为T≥50，并令t＝0；

(3c)将图像m_j的第一高级特征

(3d)将图像m_j的第二高级特征

(3e)将图像m_j的注意力图

与图像m_j的第一高级特征

在融合模块中相乘，得到图像m_j的第三高级特征

(3f)将图像m_j的第三高级特征

置信度信息

和预测类别标签概率

θ_attention和θ_output进行更新；

(4)获取X光违禁物品图像识别结果：

(4b)将测试图像m_l预测的置信度信息

中大于0.5的结果所对应的预测位置坐标标签(x_l,y_l,w_l,h_l)和类别标签概率p_l(c)中最大值对应的违禁物品类别分别作为测试图像m_l违禁物品的位置预测结果和类别预测结果。

2.根据权利要求1所述的基于UNET的下采样卷积神经网络X光违禁物品检测方法，其特征在于，步骤(2a)中所述的特征提取网络f_f-e、细粒度划分网络f_down-up、注意力网络f_attention和输出网络f_output，其中：

特征提取网络f_f-e采用包含五个卷积模块和二十三个残差模块的卷积神经网络，其结构依次为：输入层→第一卷积模块→第一残差模块→第二卷积模块→第二残差模块→第三残差模块→第三卷积模块→第四残差模块→第五残差模块→第六残差模块→第七残差模块→第八残差模块→第九残差模块→第十残差模块→第十一残差模块→第四卷积模块→第十二残差模块→第十三残差模块→第十四残差模块→第十五残差模块→第十六残差模块→第十七残差模块→第十八残差模块→第十九残差模块→第五卷积模块→第二十残差模块→第二十一残差模块→第二十二残差模块→第二十三残差模块；

细粒度划分网络f_down-up采用包含两个上采样连接模块，两个下采样连接层模块，一个SPP模块和七个卷积模块的卷积神经网络，其结构依次为：第一卷积模块→第二卷积模块→第三卷积模块→第四卷积模块→SPP模块→第五卷积模块→第六卷积模块→第七卷积模块→第一下采样连接模块→第二下采样连接模块→第一上采样连接模块→第二上采样连接模块；