CN113128340B

CN113128340B - 一种人员入侵检测方法及装置

Info

Publication number: CN113128340B
Application number: CN202110279138.XA
Authority: CN
Inventors: 李静; 王荣秋; 尚伟艺; 李朝辉
Original assignee: Guangzhou Huawei Mingtian Software Technology Co ltd
Current assignee: Guangzhou Huawei Mingtian Software Technology Co ltd
Priority date: 2021-03-16
Filing date: 2021-03-16
Publication date: 2022-09-02
Anticipated expiration: 2041-03-16
Also published as: CN113128340A

Abstract

一种人员入侵检测方法及其装置,通过4个步骤对区域内进行人员入侵检测。本发明能保持基于深度学习人员检测准确率，同时通过非移动目标排除从而能解决深度学习目标检测方法偶尔出现大量重复误告警问题。本发明通过缓存即时缓存图像序列和间隔缓存图像序列能大大降低缓存图片数量，从而能大节省存储空间。

Description

一种人员入侵检测方法及装置

技术领域

本发明涉及人员入侵检测技术领域，特别涉及一种人员入侵检测方法及装置。

背景技术

基于监控视频的人员入侵检测具有非常普遍的应用价值，可广泛应用于监狱的周界防范，电力电网的安全作业管控，以及其它各种违禁人员进入的场景。

人员入侵的检测方法主要有两类，一类是以vibe算法为代表的移动侦测检测方法，一类是以yolo为代表的深度学习目标检测方法。移动侦测检测方法存在检出率低、误告率高的不足，存在无法区分人员与其它动态物体的缺点。基于深度学习目标检测方法整体检出率较高，是目前的主流方法，但也存在一旦画面中出现与人员相类似的物体形态时，例如人员画像、衣物等，该方法会出现大量重复误告警的不足。

因此，针对现有技术不足，提供一种人员入侵检测方法及其装置以解决现有技术不足甚为必要。

发明内容

本发明其中一个的目的在于避免现有技术的不足之处而提供一种人员入侵检测方法。该人员入侵检测方法能避免大量重复误告警产生。

本发明的上述目的通过以下技术措施实现：

提供一种人员入侵检测方法,步骤包括：

步骤一、将实时获取监控的视频流得到连续图像序列,并根据预设时间间隔对连续图像序列中进行图像选取，得到识别图像；

步骤二、将步骤一得到的识别图像进行缓存得到即时缓存图像序列和间隔缓存图像序列；

步骤三、将步骤二得到的即时缓存图像序列中的当前图像输入至最优算法模型，得到目标信息；在步骤二得到的间隔缓存图像序列和即时缓存图像序列中选择的对比图像，根据目标信息和对比图像得到对比结果，对对比结果进行非移动目标排除得到人员入侵结果；

步骤四、根据步骤三得到人员入侵结果，判断是否存在人员入侵，当存在人员入侵则对应输出告警并返回步骤一，当非移动物体则返回步骤一。

优选的，上述步骤二包括有：

步骤2.1、将最新的识别图像定义为当前图像；

步骤2.2、将当前图像进行缓存，根据即时缓存图像序列更新方法得到即时缓存图像序列，根据间隔缓存图像序列更新方法得到间隔缓存图像序列；

步骤2.3、判断即时缓存图像序列和间隔缓存图像序列的图像数目是否饱满，当两者同时饱满时进入步骤三，否则返回步骤2.2。

优选的，上述即时缓存图像序列更新方法为将当前图像更新至缓存模块的即时缓存图像序列中，且即时缓存图像序列的存储长度为n，且n为正整数。

优选的，上述即时缓存图像序列更新方法具体为将连续多帧的识别图像按时间顺序从后向前排列，将当前图像作为即时缓存图像序列的末端图像并定义为A_n，与A_n相邻在前的第一帧图像定义为A_n-1，……，与A_n相邻在前的第i帧图像定义为A_n-i，与A_n相邻在前的第n-1帧图像定义为A₁，存在n≥i≥2，且n和i均为正整数，将位于A₁之后的识别图像删除。

优选的，上述间隔缓存图像序列更新方法为每间隔时间t₁分钟将当前图像作为间隔缓存图像序列的末端图像更新至间隔缓存图像序列，且间隔缓存图像序列的存储长度为m，且m为正整数。

将所述间隔缓存图像序列中最新更新的识别图像定义为B_m，与B_m相邻的前一次更新的图像定义为B_m-1，……，与B_m相邻的第j次前更新的图像定义为B_m-j，……，与B_m相邻的在第m-1次前更新的图像定义为B₁，存在m≥j≥2，且m和j均为正整数，t₁为正数，将位于B₁之后的识别图像删除。

优选的，上述步骤三包括有：

步骤3.1、将步骤二得到的即时缓存图像序列中A_n定义为目标图像，将目标图像输入至最优算法模型进行目标检测生成目标数据；

步骤3.2、判断目标数据是否存在人员，当没有存在人员时返回步骤一，当目标数存在人员时进入步骤3.3；

步骤3.3、将目标数据中的待处理目标人员的数量定义为s,分别对s个待处理目标人员P依次命名为P₁，……，P_n，……，P_s,其中s≥n≥1；

步骤3.4、令P_s＝P进入步骤3.5；

步骤3.5、在目标图像中截选与目标人员P对应的目标框坐标相同的区域，定义为目标框ROI区域；

步骤3.6、将即时缓存图像序列中A₁定义为第一对比图像，将间隔缓存图像序列中的B_m定义为第二对比图像，将间隔缓存图像序列中的B₁定义为第三对比图像；

步骤3.7、分别在第一对比图像、第二对比图像和第三对比图像中截取与目标人员P对应的目标框坐标相同的区域，对应得到第一对比ROI区域图片、第二对比ROI区域图片和第三对比ROI区域图片；

步骤3.8、将目标框ROI区域分别与第一对比ROI区域图片、第二对比ROI区域图片和第三对比ROI区域图片进行相似度值对比，得到对比结果；

步骤3.9、更新剩余待处理目标人员的数量，判断剩余目标人员数量是否大于0，如果是进入步骤3.10，否则进入步骤3.11；

步骤3.10、令P＝P_s-1并返回步骤3.5；

步骤3.11、根据对比结果进行非移动目标排除得到人员入侵结果进入步骤四。

优选的，上述步骤3.8具体为，分别计算目标框ROI区域与第一对比ROI区域图片、第二对比ROI区域图片和第三对比ROI区域图片的相似度，分别得到Ra、Rb和Rc，将相似度值Ra、Rb和Rc定义为对比结果。

优选的，上述步骤3.11具体为，将对比结果Ra与第一阈值R₁、Rb与第二阈值R₂，将Rc与第二阈值R₃进行对比，当存在Ra≥R₁、Rb≥R₂或者Rb≥R₃中存在两个或以上情况时则人员入侵结果为非移动物体进入步骤四，否则人员入侵结果为人员入侵进入步骤四。

优选的，上述最优算法模型通过如下步骤得到：

步骤A、收集多张人形素材图像；

步骤B、分别对步骤A得到的多张人形素材图像进行标注，得到多个目标框坐标信息；

步骤C、对步骤B得到的多个目标框坐标信息进行重聚类，得到重聚类分组数据；

步骤D、对darknet框架训练深度学习神经网络yolov4算法的训练参数进行训练，得到最优算法模型。

优选的，上述步骤B具体为，分别通过labelImg工具对步骤A得到的多张人形素材图像进行标注，得到多个目标框坐标信息。

优选的，上述步骤C具体为，对步骤B得到的多个目标框坐标信息进行kmeans重聚类，且K设置为6，得到重聚类人员宽高分组数据。

优选的，上述步骤一具体为，将获取监控的视频流，将视频流解码成连续图像序列,并根据预设时间间隔t₂秒,从连续图像序列中均匀抽取多帧图像得到识别图像，t₂为正数。

优选的，上述人形素材图像包含有数据集筛选图像和具有应用场景人形图像。

优选的，上述数据集筛选图像为对数据集中的具有人员图像进行高度筛选后的人形图像。

优选的，上述具有应用场景人形图像为以入侵应用场景为背景的人形图像。

优选的，上述入侵应用场景为监狱、广场或者城市道路中的至少一种。

优选的，上述高度筛选为对人员高度大于图像整体高度三分之一进行剔除。

优选的，上述n为10，m为12，t₁为4～6，t₂为0.2；R₁为0.95，R₂和R₃都为0.8。

优选的，上述训练参数为batch、subdivisions、max_batches、steps、scales、classes、filters和anchors，其中batch和subdivisions为训练服务器的一个批次训练图片数据参数，max_batches为训练终止条件参数，steps和scales为配套学习率，classes为类别数量，filters为卷积核的数量，anchor为步骤C的重聚类人员宽高分组数据。

优选的，上述最优算法模型的mAP值大于80％。

本发明另一个的目的在于避免现有技术的不足之处而提供一种采用人员入侵检测方法的装置。该采用人员入侵检测方法的装置能避免大量重复误告警产生。

本发明的上述目的通过以下技术措施实现：

提供一种采用人员入侵检测方法的装置,采用上述的人员入侵检测方法进行人员入侵检测。

本发明一种采用人员入侵检测方法的装置，设置有：

存储模块——存储训练最优算法模型的人形素材图像及对应的目标框坐标信息，及存储经过模型训练模块训练后的最优算法模型的参数；

模型训练模块——根据存储模块中的人形素材图像及对应的目标框坐标信息进行训练最优算法模型；

视频采集设备——实时获取区域内的视频；

视频处理模块——根据RTS视频协议或者RTMP视频协议在视频采集设备中获取实时视频流，并对视频流进行连续解码，得到识别图像；

缓存模块——将视处理模块的识别图像进行缓存，得到即时缓存图像序列和间隔缓存图像序列；

模型推断模块——根据最优算法模型获取目标图像的目标信息；

计算模块——将目标信息与对比图像进得对比，得到对比结果，并对对比结果进行非移动目标排除得到人员入侵结果。

本发明的一种人员入侵检测方法及其装置,通过4个步骤对区域内进行人员入侵检测。本发明能保持基于深度学习人员检测准确率，同时通过非移动目标排除从而能解决深度学习目标检测方法偶尔出现大量重复误告警问题。本发明通过缓存即时缓存图像序列和间隔缓存图像序列能大大降低缓存图片数量，从而能大节省存储空间。

附图说明

利用附图对本发明作进一步的说明，但附图中的内容不构成对本发明的任何限制。

图1为一种人员入侵检测方法的流程图。

具体实施方式

结合以下实施例对本发明的技术方案作进一步说明。

实施例1。

一种人员入侵检测方法,如图1所示，步骤包括：

步骤三、将步骤二得到的即时缓存图像序列中的目标图像输入至最优算法模型，得到目标信息；在步骤二得到的间隔缓存图像序列和即时缓存图像序列中选择的对比图像，根据目标信息和对比图像得到对比结果，对对比结果进行非移动目标排除得到人员入侵结果；

其中本发明的步骤二包括有：

步骤2.1、将最新的识别图像定义为当前图像；

其中即时缓存图像序列更新方法为将当前图像更新至缓存模块的即时缓存图像序列中，且即时缓存图像序列的存储长度为n，且n为正整数。

其中本发明的即时缓存图像序列更新方法具体为将连续多帧的识别图像按时间顺序从后向前排列，将当前图像作为即时缓存图像序列的末端图像并定义为A_n，与A_n相邻在前的第一帧图像定义为A_n-1，……，与A_n相邻在前的第i帧图像定义为A_n-i，与A_n相邻在前的第n-1帧图像定义为A₁，存在n≥i≥2，且n和i均为正整数，将位于A₁之后的识别图像删除。

本发明的间隔缓存图像序列更新方法为每间隔时间t₁分钟将当前图像作为间隔缓存图像序列的末端图像更新至间隔缓存图像序列，且间隔缓存图像序列的存储长度为m，且m为正整数。

需要说明的是，本发明的间隔缓存图像序列更新方法是每间隔时间t₁分钟更新一次间隔缓存图像序列，即***产生第一张当前图像时第一次更新间隔缓存图像序列，并开始计时，当计时时间达到t₁分钟时刻起产生的当前图像更新二次间隔缓存图像序列，并重新计时，如此反复更新。因此并非每张识别图像都需要更新间隔缓存图像序列，仅按照t₁间隔时间更新，其中t₁为预设时间间隔。

本发明的步骤三包括有：

步骤3.4、令P_s＝P进入步骤3.5；

其中相似度计算采用以下公式：

其中n为ROI区域图片的总数据量，xⁱ和yⁱ分别为两张ROI区域图片第i个数据的灰度值。

步骤3.10、令P＝P_s-1并返回步骤3.5；

其中步骤3.8具体为，分别计算目标框ROI区域与第一对比ROI区域图片、第二对比ROI区域图片和第三对比ROI区域图片的相似度，分别得到Ra、Rb和Rc，将相似度值Ra、Rb和Rc定义为对比结果。

其中步骤3.11具体为，将对比结果Ra与第一阈值R₁、Rb与第二阈值R₂，将Rc与第二阈值R₃进行对比，当存在Ra≥R₁、Rb≥R₂或者Rb≥R₃中存在两个或以上情况时则人员入侵结果为非移动物体进入步骤四，否则人员入侵结果为人员入侵进入步骤四。

本发明的最优算法模型通过如下步骤得到：

步骤A、收集多张人形素材图像；

其中步骤B具体为，分别通过labelImg工具对步骤A得到的多张人形素材图像进行标注，得到多个目标框坐标信息。

其中步骤C具体为，对步骤B得到的多个目标框坐标信息进行kmeans重聚类，且K设置为6，得到重聚类人员宽高分组数据。

其中步骤一具体为，将获取监控的视频流，将视频流解码成连续图像序列,并根据预设时间间隔t₂秒,从连续图像序列中均匀抽取多帧图像得到识别图像，t₂为正数。

人形素材图像包含有数据集筛选图像和具有应用场景人形图像。数据集筛选图像为对数据集中的具有人员图像进行高度筛选后的人形图像。

需要说明的是，本实施例的数据集为COCO，

其中具有应用场景人形图像为以入侵应用场景为背景的人形图像。入侵应用场景为监狱、广场或者城市道路中的至少一种；

高度筛选为对人员高度大于图像整体高度三分之一进行剔除。

本实施例具体的n为10，m为12，t₁为4～6，t₂为0.2；R₁为0.95，R₂和R₃都为0.8。

本发明的训练参数为batch、subdivisions、max_batches、steps、scales、classes、filters和anchors。

其中batch和subdivisions为训练服务器的一个批次训练图片数据参数，max_batches为训练终止条件参数，steps和scales为配套学习率。classes为类别数量，具体的当只检测人形是可以设置为1，当增加非人类别时可以设置为2。filters为卷积核的数量，可以用于表征从多个不同角度提取的特征数量。anchor为步骤C的重聚类人员宽高分组数据。

本发明的最优算法模型的mAP值大于80％。

需要说明的是，本发明采用的darknet框架训练深度学习神经网络yolov4算法为本领域技术公知常识，当输入人形素材图像、目标框坐标信息和训练参数输入进行darknet框架训练深度学习神经网络yolov4算法训练后，可以得到本发明的最优算法模型。因此在此不再一一累述darknet框架训练深度学习神经网络yolov4算法的具体设置与操作过程。对于本发明所采用kmean重聚类为公知的算法，本领域技术人员也应当知晓其参数及参数设置，当参数设置后再将本发明的目标框坐标信息采用kmeans重聚类后，可以得到本发明的重聚类人员宽高分组数据。因此在此不再一一累述kmeans重聚类的具体设置与操作过程。

该人员入侵检测方法能保持基于深度学习人员检测准确率，同时通过非移动目标排除从而能解决深度学习目标检测方法偶尔出现大量重复误告警问题。本发明通过缓存即时缓存图像序列和间隔缓存图像序列能大大降低缓存图片数量，从而能大节省存储空间。

实施例2。

一种人员入侵检测方法的实际应用：步骤包括：

步骤一、将获取监控的视频流，将视频流解码成连续图像序列,并根据预设时间间隔t₂秒,从连续图像序列中均匀抽取多帧图像得到识别图像，t₂为正数，且t₂为0.2.

步骤二包括有：

步骤2.1、将最新的识别图像定义为当前图像；

其中即时缓存图像序列更新方法为将当前图像更新至缓存模块的即时缓存图像序列中，且即时缓存图像序列的存储长度为n，且n为正整数。本实施例的n具体为10。即时缓存图像序列更新方法具体为将连续多帧的识别图像按时间顺序从后向前排列，将当前图像作为即时缓存图像序列的末端图像并定义为A_n，与A_n相邻在前的第一帧图像定义为A_n-1，……，与A_n相邻在前的第i帧图像定义为A_n-i，与A_n相邻在前的第n-1帧图像定义为A₁，存在n≥i≥2，且n和i均为正整数，将位于A₁之后的识别图像删除。

具体如下：设置即时缓存图像序列的图像数量为10张，用于缓存最近10张需要识别的图像，10张图张像中最早收到的一张图像为两秒前收到的图片，记为A₁；最近收到的一张图张为当前图片也就是需要识别的图像即为A₁₀.当0.2秒之后，新的一张图张输入时，删除A₁，并将原A₂记为A₁,原A₃记为A₂,依次类推，并将新输入图片记为A₁₀，如此循环操作。

其中间隔缓存图像序列更新方法为每间隔时间t₁分钟将当前图像作为间隔缓存图像序列的末端图像更新至间隔缓存图像序列，且间隔缓存图像序列的存储长度为m，且m为正整数，本实施例m具体为12。将间隔缓存图像序列中最新更新的识别图像定义为B_m，与B_m相邻的前一次更新的图像定义为B_m-1，……，与B_m相邻的第j次前更新的图像定义为B_m-j，……，与B_m相邻的在第m-1次前更新的图像定义为B₁，存在m≥j≥2，且m和j均为正整数，t₁为正数，将位于B₁之后的识别图像删除。

具体如下：设置间隔缓存图像序列的图像数量为12张，每五分钟缓存一张，其中缓存最早的图像约为一小时前的图像，该图像记为B₁,最新缓存图像记为B₁₂，表示当前时刻的图像，该图像序列每隔五分钟更新一次，即5分钟后删除B₁,将原B₂记为B₁,原B₃记为B₂,依次类推，并将新增图像记为B₁₂。

该即时缓存方法和间隔缓存方法的优势是一共只需缓存22张图像，即可解决长中短不同图像的缓存需求，相比全部一个小时全部图像90000张都缓存，可以节省99.97％的空间；相比每秒5张图像抽样一个小时总计18000张图像全缓存，也可以节省99.87％的空间。虽然间隔缓存方法的获取图像的时间准确性不足，即不能准确的获取刚好5分钟前的那张图像，但本发明来说，该点具备较强的鲁棒性，获取的是4分钟前还是6分钟前的图像，并无差异，从识别的准确概率来说是等价的。

步骤三包括有：

步骤3.1、将步骤二得到的即时缓存图像序列中A_n定义为目标图像，将目标图像输入至最优算法模型进行目标检测生成目标数据，其中目标数据具体为人员数量及目标框信息，目标框信息的相对坐标信息记为(topX,topY,w,h)，

步骤3.2、判断目标数据是否存在人员，当没有存在人员时返回步骤一，当目标数存在人员时进入步骤3.3，本实施例具体得到人员数量为2，其中1个为真人，1个为非真人，目标框坐标分别为(0.2088,0.0391,0.1809,0.4557)和(0.5074,0.1250,0.0897,0.3125)；

步骤3.3、将目标数据中的待处理目标人员的数量定义为s,分别对s个待处理目标人员P依次命名为P₁，……，P_n，……，P_s,其中s≥n≥1；例如本实施例的具有两个待处理目标人员，且待处理目标人员命名为P₁和P₂，P₁的目标框坐标(0.2088,0.0391,0.1809,0.4557)，P₂的目标框坐标(0.5074,0.1250,0.0897,0.3125)；

步骤3.4、令P₂＝P进入步骤3.5；

步骤3.5、在目标图像中截选与P对应的目标框信息坐标相同的区域，定义为目标框ROI区域，具体为在目标图像中截选(0.2088,0.0391,0.1809,0.4557)的区域，定义为目标框ROI区域；

步骤3.7、分对在A₁₀、A₁、B₁₂和B₁中截选(0.2088,0.0391,0.1809,0.4557)的区域对应得到第一对比ROI区域图片、第二对比ROI区域图片和第三对比ROI区域图片；

步骤3.8、分别计算目标框ROI区域与第一对比ROI区域图片、第二对比ROI区域图片和第三对比ROI区域图片的相似度，分别得到Ra、Rb和Rc，将相似度值Ra、Rb和Rc定义为对比结果；

步骤3.9、更新剩余待处理目标人员的数量，判断剩余目标人员数量是否大于0，如果是进入步骤3.10，否则进入步骤3.11，更新后剩余待处理目标人员的数量为1，则进入步骤3.10

步骤3.10、令P＝P_s-1并返回步骤3.5，也就是说将P＝P₁后，以目标框坐标(0.5074,0.1250,0.0897,0.3125)重复步骤3.8；

步骤3.11、将对比结果Ra与第一阈值R₁、Rb与第二阈值R₂，将Rc与第二阈值R₃进行对比，当存在Ra≥0.95、Rb≥0.8或者Rb≥0.8中存在两个或以上情况时则人员入侵结果为非移动物体进入步骤四，否则人员入侵结果为人员入侵进入步骤四；

本实施例具体的真人的目标框ROI区域对比结果分别为Ra＝0.417,Rb＝0.253,Rc＝0.247；其中非真人的目标框ROI区域对比结果分别Ra＝0.907,Rb＝0.969和Rc＝0.974，因此真人的目标框ROI区域的人员入侵结果为人员入侵。

需要说明的因为对于静止物体来说，其短时间内变化量极小，而对应移动物体来说，变化量也可能不是特别大，0.95的相似度能够很好的区分这两者情况，而中长时间看，0.8的区分度即可更好的区分静止与移动物体。基于上述预设参数，三个判断条件简化为：Ra≥0.95、Rb≥0.8、Rb≥0.8；本实施例最终判断规则为：当所述三个判断条件有两个以上满足时，则判定为非移动物体。一般情况下对于非移动物体来说，三个条件均能满足，但当环境出现变化，例如光线变化剧烈时，可能存在某一个条件未能满足的可能。

本发明的最优算法模型通过如下步骤得到：

步骤A、收集多张人形素材图像；

步骤B、分别通过labelImg工具对步骤A得到的多张人形素材图像进行标注，得到多个目标框坐标信息；

其中，人形素材图像包含有数据集筛选图像和具有应用场景人形图像。数据集筛选图像为对数据集中的具有人员图像进行高度筛选后的人形图像。高度筛选为对人员高度大于图像整体高度三分之一进行剔除。具有应用场景人形图像为以入侵应用场景为背景的人形图像。入侵应用场景为监狱、广场或者城市道路中的至少一种。

具体为抽取COCO数据集中4万多张有人员图像，对人员图像进行高度筛选，剔除人员高度高于图片高度三分之一的图片，最后保留图片约15000张；另外收集监狱、广场、城市道路采集的远景监控有人形图像10000张。汇总后得到符合本场景需求人形素材图像总计25000张作为样本库。

步骤C、对步骤B得到的多个目标框坐标信息进行kmeans重聚类，且K设置为6，得到重聚类人员宽高分组数据，对上述25000张人形素材图像的重聚类人员宽高分组数据具体为[10,27,19,57,49,67,31,114,61,160,86,268]；

训练参数为batch、subdivisions、max_batches、steps、scales、classes、filters和anchors，其中batch和subdivisions为训练服务器的显存设置参数，max_batches为训练终止条件参数，steps和scales为配套学习率，classes为类别数量，filters为卷积核的数量，anchor为步骤C的重聚类人员宽高分组数据。

本实施例具体的batch为32，subdivisions为8，max_batches为30000，steps为10000,20000，scales为.2,.1，classes为1，filters为18，anchors为10,27,19,57,49,67,31,114,61,160,86,268。

参数说明：

(1)batch及subdivisions根据训练服务器的显存进行设置，经实验验证batch及subdivisions的值设置对最优算法模型的影响不大；

(2)max_batches为总的训练终止条件，本实施例通过实验得到训练30000批次可以得到最优效果区域；

(3)steps和scales为配套使用的，本实施例设置每训练10000批次调整一次学习率，首次调整降低80％，再次调整再降低90％。

(4)classes和filters为根据检测类别计算，本模型仅检测一个类别：人形。

(5)anchors是基于Kmeans方法聚类而来的宽高信息对，从数据可知聚类后没有特别大的目标，这是因为摄像机中人员目标是远景的，图片中的人较小，与原始80类模型不同，这里都是人形，所以所有长宽中可以看到宽明显小于高。

基于上述参数设计，训练30000批次后，本实施例得到的最优算法模型的mAP值高达94％，其参数为本实施例最终采用模型参数。主要原因在于基于场景制作图片样本，并总结设置合适的训练参数。在现有技术与yolov4基础模型80个类别的mAP值只有65％左右，本实施例高达94％的分类mAP值，本实施例的mAP值是与训练的类别数量有较大关系，因此明显优于现有技术。

实施例3。

一种采用人员入侵检测方法的装置,采用如实施例1的人员入侵检测方法进行人员入侵检测。

设置有：

视频采集设备——实时获取区域内的视频；

该采用人员入侵检测方法的装置,能保持基于深度学习人员检测准确率，同时通过非移动目标排除从而能解决深度学习目标检测方法偶尔出现大量重复误告警问题。本发明通过缓存即时缓存图像序列和间隔缓存图像序列能大大降低缓存图片数量，从而能大节省存储空间。

最后应当说明的是，以上实施例仅用以说明本发明的技术方案而非对本发明保护范围的限制，尽管参照较佳实施例对本发明作了详细说明，本领域的普通技术人员应当理解，可以对本发明技术方案进行修改或者等同替换，而不脱离本发明技术方案的实质和范围。

Claims

1.一种人员入侵检测方法,其特征在于，步骤包括：

步骤三、将步骤二得到的即时缓存图像序列中的目标图像输入至最优算法模型，得到目标信息；在步骤二得到的间隔缓存图像序列和即时缓存图像序列中选择对比图像，根据目标信息和对比图像得到对比结果，对对比结果进行非移动目标排除得到人员入侵结果；

步骤四、根据步骤三得到人员入侵结果，判断是否存在人员入侵，当存在人员入侵则对应输出告警并返回步骤一，当非移动物体则返回步骤一；

所述即时缓存图像序列更新方法为将当前图像更新至缓存模块的即时缓存图像序列中，且即时缓存图像序列的存储长度为n，且n为正整数；

所述即时缓存图像序列更新方法具体为将连续多帧的识别图像按时间顺序从后向前排列，将当前图像作为即时缓存图像序列的末端图像并定义为A_n，与A_n相邻在前的第一帧图像定义为A_n-1，……，与A_n相邻在前的第i帧图像定义为A_n-i，与A_n相邻在前的第n-1帧图像定义为A₁，存在n≥i≥2，且n和i均为正整数，将位于A₁之后的识别图像删除；

所述间隔缓存图像序列更新方法为每间隔时间t₁分钟将当前图像作为间隔缓存图像序列的末端图像更新至间隔缓存图像序列，且间隔缓存图像序列的存储长度为m，且m为正整数；

将所述间隔缓存图像序列中最新更新的识别图像定义为B_m，与B_m相邻的前一次更新的图像定义为B_m-1，……，与B_m相邻的第j次前更新的图像定义为B_m-j，……，与B_m相邻的在第m-1次前更新的图像定义为B₁，存在m≥j≥2，且m和j均为正整数，t₁为正数，将位于B₁之后的识别图像删除；

所述步骤三包括有：

步骤3.4、令P_s＝P进入步骤3.5；

步骤3.10、令P＝P_s-1并返回步骤3.5；

步骤3.11、根据对比结果进行非移动目标排除得到人员入侵结果进入步骤；

所述步骤3.8具体为，分别计算目标框ROI区域与第一对比ROI区域图片、第二对比ROI区域图片和第三对比ROI区域图片的相似度，分别得到Ra、Rb和Rc，将相似度值Ra、Rb和Rc定义为对比结果；

所述步骤3.11具体为，将对比结果Ra与第一阈值R₁、Rb与第二阈值R₂，将Rc与第二阈值R₃进行对比，当存在Ra≥R₁、Rb≥R₂或者Rb≥R₃中存在两个或以上情况时则人员入侵结果为非移动物体进入步骤四，否则人员入侵结果为人员入侵进入步骤四。

2.根据权利要求1所述的人员入侵检测方法,其特征在于，所述步骤二包括有：

步骤2.1、将最新的识别图像定义为当前图像；

3.根据权利要求2所述的人员入侵检测方法,其特征在于，所述最优算法模型通过如下步骤得到：

步骤A、收集多张人形素材图像；

4.根据权利要求3所述的人员入侵检测方法,其特征在于：所述步骤B具体为，分别通过labelImg工具对步骤A得到的多张人形素材图像进行标注，得到多个目标框坐标信息；

所述步骤C具体为，对步骤B得到的多个目标框坐标信息进行kmeans重聚类，且K设置为6，得到重聚类人员宽高分组数据；

所述步骤一具体为，将获取监控的视频流，将视频流解码成连续图像序列,并根据预设时间间隔t₂秒,从连续图像序列中均匀抽取多帧图像得到识别图像，t₂为正数。

5.根据权利要求4所述的人员入侵检测方法,其特征在于：所述人形素材图像包含有数据集筛选图像和具有应用场景人形图像；

所述数据集筛选图像为对数据集中的具有人员图像进行高度筛选后的人形图像；

所述具有应用场景人形图像为以入侵应用场景为背景的人形图像；

所述入侵应用场景为监狱、广场或者城市道路中的至少一种；

所述高度筛选为对人员高度大于图像整体高度三分之一进行剔除；

所述n为10，m为12，t₁为4～6，t₂为0.2；R₁为0.95，R₂和R₃都为0.8；

所述训练参数为batch、subdivisions、max_batches、steps、scales、classes、filters和anchors，其中batch和subdivisions为训练服务器的一个批次训练图片数据参数，max_batches为训练终止条件参数，steps和scales为配套学习率，classes为类别数量，filters为卷积核的数量，anchor为步骤C的重聚类人员宽高分组数据；

所述最优算法模型的mAP值大于80％。

6.一种采用人员入侵检测方法的装置,其特征在于：采用权利要求1至5任意一项所述的人员入侵检测方法进行人员入侵检测；

设置有：

视频采集设备——实时获取区域内的视频；