CN112861696B - 一种异常行为识别方法、装置、电子设备及存储介质 - Google Patents

一种异常行为识别方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN112861696B
CN112861696B CN202110144089.9A CN202110144089A CN112861696B CN 112861696 B CN112861696 B CN 112861696B CN 202110144089 A CN202110144089 A CN 202110144089A CN 112861696 B CN112861696 B CN 112861696B
Authority
CN
China
Prior art keywords
human body
key points
body key
dimension reduction
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110144089.9A
Other languages
English (en)
Other versions
CN112861696A (zh
Inventor
李赞
张伟熙
董帅
邹昆
李文生
李悦乔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xi'an Baicheng Yigou Technology Co ltd
Xi'an Maisou Information Technology Co ltd
Original Assignee
University of Electronic Science and Technology of China Zhongshan Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China Zhongshan Institute filed Critical University of Electronic Science and Technology of China Zhongshan Institute
Priority to CN202110144089.9A priority Critical patent/CN112861696B/zh
Publication of CN112861696A publication Critical patent/CN112861696A/zh
Application granted granted Critical
Publication of CN112861696B publication Critical patent/CN112861696B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/20Movements or behaviour, e.g. gesture recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Psychiatry (AREA)
  • Social Psychology (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)

Abstract

本申请提供一种异常行为识别方法、装置、电子设备及存储介质,该方法包括:获得针对人体采集的视频流,并从视频流中提取出人体关键点;对人体关键点进行降维处理,获得降维后的特征值;使用训练后的单类支持向量机对降维后的特征值进行分类,获得分类结果。在上述的实现过程中,从视频流中提取出人体关键点,并使用单类支持向量机对人体关键点降维处理后的特征值进行分类,由于单类支持向量机是使用超球面对特征值进行分类的,更容易找到特征空间数据的球面边界,从而降低了正负样本不均衡所带来的影响,有效地提高了异常行为识别的正确率。

Description

一种异常行为识别方法、装置、电子设备及存储介质
技术领域
本申请涉及机器学习、视频处理和图像识别的技术领域,具体而言,涉及一种异常行为识别方法、装置、电子设备及存储介质。
背景技术
异常行为识别,是指从监控的视频流中识别出在高层语义理解中超出正常范围的人的行为活动,具体例如:老人在房间里是躺着休息、吃饭、睡觉和看电视等等行为活动,这些行为活动都是正常范围的行为活动;若老人在房间里跌倒,那么老人的行为就被认为是超出正常范围的异常行为,此时需要发出预警信息以便及时救治;若老人躺着睡觉或者休息,那么老人的行为就被认为是没有超出正常范围的正常行为,则无需预警。
目前,针对异常行为识别的方法大都是使用基于深度学习原理的网络模型来进行异常行为识别,此处的基于深度学习原理的网络模型包括:基于卷积神经网络(Convolutional Neural Networks,CNN)或者长短期记忆(Long Short Term Memory,LSTM)网络的行为检测网络模型等等。
在具体的实践过程中发现,上述的网络模型通常需要各个分类样本比较均衡,然而在数据的采集过程中,难以采集到与正样本数量相当的负样本,此处的负样本例如:老人摔倒的高清视频样本。在负样本占训练数据的比例过少的情况下,使用网络模型难以识别出异常行为,换句话说,在正负样本不均衡时,使用网络模型进行异常行为识别的正确率较低。
发明内容
本申请实施例的目的在于提供一种异常行为识别方法、装置、电子设备及存储介质,用于改善异常行为识别的正确率较低的问题。
本申请实施例提供了一种异常行为识别方法,包括:获得针对人体采集的视频流,并从视频流中提取出人体关键点,人体关键点表征人体的骨骼和关节;对人体关键点进行降维处理,获得降维后的特征值,特征值表征人体的动态特征;使用训练后的单类支持向量机对降维后的特征值进行分类,获得分类结果,分类结果表征视频流中的人体是否存在异常行为。在上述的实现过程中,从视频流中提取出人体关键点,并使用单类支持向量机对人体关键点降维处理后的特征值进行分类,由于单类支持向量机是使用超球面对特征值进行分类的,更容易找到特征空间数据的球面边界,从而降低了正负样本不均衡所带来的影响,有效地提高了异常行为识别的正确率。
可选地,在本申请实施例中,对人体关键点进行降维处理,包括:使用主成分分析算法或者动态模型分解算法对人体关键点进行降维处理。在上述的实现过程中,通过使用主成分分析算法或者动态模型分解算法对人体关键点进行降维处理,从而减少了获取特征值和特征向量的计算量,有效地提高了异常行为识别的速度。
可选地,在本申请实施例中,对人体关键点进行降维处理,包括:判断人体关键点的矩阵维度是否大于预设维度;若是,则使用奇异值分解对人体关键点进行降维处理。在上述的实现过程中,通过在人体关键点的矩阵维度是否大于预设维度时,才使用奇异值分解对人体关键点进行降维处理,从而减少获取特征值和特征向量的计算量的同时,增加了灵活性,针对矩阵维度较小的关键点数据可以直接计算,保证了对矩阵维度较小的关键点数据进行异常行为识别的准确率,同时也有效地提高了异常行为识别的速度。
可选地,在本申请实施例中,从视频流中提取出人体关键点,包括:从视频流中提取出视频图像;使用神经网络模型从视频图像提取出人体关键点。
可选地,在本申请实施例中,在使用神经网络模型从视频图像提取出人体关键点之前,还包括:获得多个样本视频和多个人体模型,人体模型中包括与样本视频对应的人体关键点;以多个样本视频为训练数据,以多个人体模型中的人体关键点为训练标签,对神经网络进行训练,获得神经网络模型。
可选地,在本申请实施例中,在使用训练后的单类支持向量机对降维后的特征值进行分类之前,还包括:获得样本视频对应的分类标签,并使用主成分分析算法或者动态模型分解算法对样本视频对应的人体关键点进行降维处理,获得样本视频对应的特征值;以样本视频对应的特征值为训练数据,以样本视频对应的分类标签为训练标签,对单类支持向量机进行训练,获得训练后的单类支持向量机。
可选地,在本申请实施例中,在获得分类结果之后,还包括:判断分类结果是否为视频流中的人体存在异常行为;若是,则生成并输出预警信号。在上述的实现过程中,通过在分类结果为视频流中的人体存在异常行为时,才生成并输出预警信号,从而有效地减少了在异常情况发生时,无法采取相应的救助措施的概率。
本申请实施例还提供了一种异常行为识别装置,包括:人体关键提取模块,用于获得针对人体采集的视频流,并从视频流中提取出人体关键点,人体关键点表征人体的骨骼和关节;降维特征获得模块,用于对人体关键点进行降维处理,获得降维后的特征值,特征值表征人体的动态特征;分类结果获得模块,用于使用训练后的单类支持向量机对降维后的特征值进行分类,获得分类结果,分类结果表征视频流中的人体是否存在异常行为。
可选地,在本申请实施例中,降维特征获得模块,包括:第一降维处理模块,用于使用主成分分析算法或者动态模型分解算法对人体关键点进行降维处理。
可选地,在本申请实施例中,降维特征获得模块,包括:矩阵维度判断模块,用于判断人体关键点的矩阵维度是否大于预设维度;第二降维处理模块,用于若人体关键点的矩阵维度大于预设维度,则使用奇异值分解对人体关键点进行降维处理。
可选地,在本申请实施例中,人体关键提取模块,包括:视频图像提取模块,用于从视频流中提取出视频图像;关键点提取模块,用于使用神经网络模型从视频图像提取出人体关键点。
可选地,在本申请实施例中,异常行为识别装置,还包括:视频模型获得模块,用于获得多个样本视频和多个人体模型,人体模型中包括与样本视频对应的人体关键点;网络模型获得模块,用于以多个样本视频为训练数据,以多个人体模型中的人体关键点为训练标签,对神经网络进行训练,获得神经网络模型。
可选地,在本申请实施例中,异常行为识别装置,还包括:特征值获得模块,用于获得样本视频对应的分类标签,并使用主成分分析算法或者动态模型分解算法对样本视频对应的人体关键点进行降维处理,获得样本视频对应的特征值;向量机训练模块,用于以样本视频对应的特征值为训练数据,以样本视频对应的分类标签为训练标签,对单类支持向量机进行训练,获得训练后的单类支持向量机。
可选地,在本申请实施例中,异常行为识别装置,还包括:分类结果判断模块,用于判断分类结果是否为视频流中的人体存在异常行为;信号生成输出模块,用于若分类结果是视频流中的人体存在异常行为,则生成并输出预警信号。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出的本申请实施例提供的异常行为识别方法的流程示意图;
图2示出的本申请实施例提供的视频处理过程的示意图;
图3示出的本申请实施例提供的训练神经网络模型和单类支持向量机的流程示意图;
图4示出的本申请实施例提供的异常行为识别装置的结构示意图;
图5示出的本申请实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整的描述。
在介绍本申请实施例提供的异常行为识别方法之前,先介绍本申请实施例中所涉及的一些概念:
视频流(Video Streaming),又可以称为视频流数据,是指以流媒体的方式进行传输的视频数据,具体例如:视频文件以视频流的方式在网络上传输,以使该视频文件能够被作为一个稳定和连续的流处理,终端设备上的浏览器或浏览器插件能够在整个视频文件被传输完成前显示多媒体数据。
目标检测网络,是指对图像中的目标对象进行检测的神经网络,即检测出图像中的目标对象,并给出目标对象在图像中的位置范围、分类和概率,位置范围具体可以为检测框的形式标注,分类是指目标对象的具体类别,概率是指检测框中的目标对象为具体类别的概率。
区域卷积神经网络(Region Convolutional Neural Network,RCNN),是第一个成功将深度学习应用到目标检测上的算法;RCNN基于卷积神经网络、线性回归和支持向量机等算法实现目标检测。
奇异值分解(Singular Value Decomposition,SVD),是指线性代数中一种重要的矩阵分解,奇异值分解在某些方面与对称矩阵或厄米矩阵基于特征向量的对角化类似,然而这两种矩阵分解尽管有其相关性,但还是有明显的不同,对称阵特征向量分解的基础是谱分析,而奇异值分解则是谱分析理论在任意矩阵上的推广。
支持向量机(Support Vector Machine,SVM),是指一种监督式的机器学***面,从而实现对样本进行分类或回归分析,那些在间隔区边缘的训练样本点即为支持向量。SVM在高维或无限维空间中构造超平面或超平面集合,SVM可以用于分类、回归或其他任务;直观来说,分类边界距离最近的训练数据点越远越好,因为这样可以缩小分类器的泛化误差。
需要说明的是,本申请实施例提供的异常行为识别方法可以被电子设备执行,这里的电子设备是指具有执行计算机程序功能的设备终端或者服务器;服务器是指通过网络提供计算服务的设备,服务器例如:x86服务器以及非x86服务器,非x86服务器包括:大型机、小型机和UNIX服务器。
在介绍本申请实施例提供的异常行为识别方法之前,先介绍该异常行为识别方法适用的应用场景,这里的应用场景包括但不限于:通过公共场所摄像头拍摄的视频来识别人群中是否有异常行为,例如:通过医院或者养老院中的监控拍摄的视频来识别老人们是否有摔倒或者跌落等等。
请参见图1示出的本申请实施例提供的异常行为识别方法的流程示意图;该异常行为识别方法的主要思路是,从视频流中提取出人体关键点,并使用单类支持向量机对人体关键点降维处理后的特征值进行分类,由于单类支持向量机是使用超球面对特征值进行分类的,更容易找到特征空间数据的球面边界,从而降低了正负样本不均衡所带来的影响,有效地提高了异常行为识别的正确率;上述的异常行为识别方法可以包括:
步骤S110:获得针对人体采集的视频流,并从视频流中提取出人体关键点。
人体关键点可以表征人体的骨骼和关节,此处的人体关键点例如:视频流的视频帧中标识出头、颈、肩、肘、手、臀、膝、脚等关键部位的点。
上述步骤S110中的获得针对人体采集的视频流的实施方式有很多种,包括但不限于:第一种获得方式,使用摄像机、录像机或彩色照相机等采集设备对目标对象进行拍摄,获得视频流数据;然后该采集设备向电子设备发送视频流数据,然后电子设备接收采集设备发送的视频流数据;第二种获得方式,从视频服务器的文件***、数据库或者移动存储设备中获取视频流数据。
上述步骤S110中的从视频流中提取出人体关键点的实施方式有很多种,包括但不限于如下几种:第一种实施方式,直接从视频流中提取出每个视频帧,并将视频帧作为视频图像,使用关键点检测神经网络从视频帧的完整视频图像中提取出人体关键点;其中,可以使用的关键点检测神经网络包括:OpenPose网络和级联金字塔网络(Cascaded PyramidNetwork,CPN)等等。第二种实施方式,先使用目标检测网络从视频流的每个视频帧中检测出包括人体区域的视频图像,其中,可以使用的目标检测网络包括:RCNN、fast RCNN和faster RCNN等网络;然后再使用关键点检测神经网络从人体区域的视频图像中提取出人体关键点;该实施方式具体例如:从视频流的每个视频帧中提取出包括人体区域的视频图像,再使用神经网络模型从视频图像提取出人体关键点;此处的神经网络模型可以采用深度神经网络(Deep Neural Network,DNN),该DNN具体可以包括:VGG16、VGG19、ResNet12、ResNet18、ResNet50、ResNet101、Wide ResNet-28-10网络、Inception v1、Inception v2或者Inception v3等等网络。
可以理解的是,在使用上述的神经网络模型之前,还需要训练该神经网络模型,由于该神经网络模型的具体训练与下面的单类支持向量机训练过程联系较为紧密,因此,该神经网络模型和单类支持向量机的训练方式将在后面详细地描述。
在步骤S110之后,执行步骤S120:对人体关键点进行降维处理,获得降维后的特征值,该特征值表征人体的动态特征。
请参见图2示出的本申请实施例提供的视频处理过程的示意图;在具体的实践过程中,可以使用算法运行软件工具包来实现图2中的视频处理过程,具体可以使用的算法运行软件工具包括:PyCharm软件、Anaconda软件、OpenCV程序库、开源的深度学习框架Pytorch和可视化工具等等,当然还可以使用python-sklearn库中的支持向量分类函数等等。上述步骤S120的实施方式有很多种,包括但不限于如下几种:
第一种实施方式,使用降维算法对人体关键点进行降维处理,可以使用的降维算法包括:主成分分析算法或者动态模型分解算法等等;该实施方式可以包括:
步骤S121:使用主成分分析(Principal Component Analysis,PCA)算法或者动态模型分解(Dynamic Mode Decomposition,DMD)算法对人体关键点进行降维处理,获得降维后的特征值。
上述步骤S121的实施方式例如:可以将从视频流中提取出的一系列连续的人体关键点看作是一个类似于或者接近于线性动力***的动态***;该动态***中的一系列连续的人体关键点是包含有频率信息的,PCA算法和DMD算法在本质上是相同的,都能够对线性动力***进行降维,然而,使用PCA算法是难以从一系列连续的人体关键点中提取出频率信息的,而使用DMD算法能够很好地提取出一系列连续的人体关键点中的频率信息;由于提取的特征值中包括频率信息,能够有效地提高对特征值分类的预测精确度,使用单类支持向量机对包括频率信息的特征值进行分类的准确率会更高。
下面对上述的DMD算法进行详细地介绍,DMD算法又被称为动态模式分解,是用来对线性***进行降维的一种算法,可以利用随时间增长、衰减和振荡的相干结构来求解或近似动力学***;可以将相干结构称为DMD模式。换句话说,DMD将动力学***转换为模式的叠加,每个模式的强度由特征值控制。假设人体关键点共有M个,对这M个特征点(即人体关键点)采样N次(即N个视频帧),可以得到一个尺寸为M×N的矩阵,这个M×N的矩阵可以理解为时间序列矩阵。该时间序列矩阵可以使用X表示,在X矩阵基础上构建两个子矩阵X (n-1)和Xn,并且这两个子矩阵的关系可以表示为Xn=AXn-1;其中,A是从时间tn-1到tn的变换系数。
第二种实施方式,在人体关键点的矩阵维度大于预设维度(例如:20、30或者50)时,才使用奇异值分解进行降维处理,该实施方式可以包括:
步骤S122:判断人体关键点的矩阵维度是否大于预设维度。
上述步骤S122的实施方式例如:上面提取出的人体关键点的数据可以使用矩阵的形式表示,如果人体关键点的矩阵维度非常大,那么计算人体关键点的数据矩阵的特征值和特征向量就会非常困难,其计算成本也会非常高。因此,可以先判断人体关键点的矩阵维度是否大于预设维度,如果人体关键点的矩阵维度是否大于预设维度,再对人体关键点进行降维处理,从而有效地减少获取特征值和特征向量的计算量。其中,上述的预设维度可以根据具体情况进行设置,例如将预设维度设置为20、30或者50等。
步骤S123:若人体关键点的矩阵维度大于预设维度,则使用奇异值分解对人体关键点进行降维处理,获得降维后的特征值。
上述步骤S123的实施方式例如:当人体关键点对应的时间序列矩阵X的矩阵维度非常大时,即人体关键点的矩阵维度大于预设维度,计算该矩阵的特征值和特征向量会十分困难,此时可以采用奇异值分解(SVD)对人体关键点进行降维处理,并且保留头r个序列,这样计算特征值和特征向量会变得非常迅速,从而获得降维后的特征值。上述过程使用公式可以表示为:
其中,是A矩阵的近似矩阵,特征值是特征向量的动态特性,实部代表增长率,虚部表示它的频率,/>矩阵和A矩阵的前r个序列的特征值和特征向量是相同的,但是这两个矩阵的尺寸大小有很大差异,所以计算速度得到大幅提升。
在步骤S120之后,执行步骤S130:使用训练后的单类支持向量机对降维后的特征值进行分类,获得分类结果,分类结果表征视频流中的人体是否存在异常行为。
上述步骤S130的实施方式例如:如果训练数据集只包括正样本数据(例如只包括老人躺着睡觉或者休息的视频),或者包括负样本数据的数量非常少(例如只有一两个老人摔倒或者跌倒的视频),此时可以使用单类支持向量机对降维后的特征值进行分类,获得分类结果。单类支持向量机能够找到特征空间数据的球面边界,使超球面的体积最小,使得异常数据的影响降到最小,从而有效提高对降维后的特征值进行分类的正确率。当然在具体的实践过程中,如果正样本数据和负样本数据的数量大于相等,也可以使用支持向量机对降维后的特征值进行分类,获得分类结果。
在上述的实现过程中,首先从视频流中提取出人体关键点,并对人体关键点进行降维处理,获得降维后的特征值,然后使用单类支持向量机对人体关键点降维处理后的特征值进行分类,获得表征视频流中的人体是否存在异常行为的分类结果。也就是说,由于单类支持向量机(One class SVM)是使用超球面对特征值进行分类的,使用单类支持向量机对人体关键点降维处理后的特征值进行分类,更容易找到特征空间数据的球面边界,从而降低了正负样本不均衡所带来的影响,有效地提高了异常行为识别的正确率。可以理解的是,在上述的异常行为识别方法中,通过使用动态模型分解(DMD)算法充分地提取了视频流的连续视频帧中体现时序信息和空间信息的人体关键点,再使用单类支持向量机将体现时序信息和空间信息的人体关键点进行分类,有效地结合了动态模型分解算法和单类支持向量机,从而进一步地提高了异常行为识别的正确率。
可选地,在本申请实施例中,在获得分类结果之后,还可以根据分类结果进行预警,该实施方式可以包括:判断分类结果是否为视频流中的人体存在异常行为;若分类结果是视频流中的人体存在异常行为,则生成并输出预警信号;具体例如:若分类结果为通过监控视频流中识别出老人在房间里跌倒,那么老人的行为就被认为是超出正常范围的异常行为,此时需要发出预警信息以便及时救治。在上述的实现过程中,通过在分类结果为视频流中的人体存在异常行为时,才生成并输出预警信号,从而有效地减少了在异常情况发生时,无法采取相应的救助措施的概率。
请参见图3示出的本申请实施例提供的训练神经网络模型和单类支持向量机的流程示意图;可选地,上面提到,在使用神经网络模型和单类支持向量机之前,还需要训练上述的神经网络模型和单类支持向量机,具体的训练方式可以包括:
步骤S210:获得多个样本视频和多个人体模型,人体模型中包括与样本视频对应的人体关键点。
上述步骤S210的实施方式包括:上述的多个样本视频和多个人体模型均是对神经网络进行训练的,因此,上述的多个样本视频和多个人体模型可以被称作训练数据集;该训练数据集可以采用现有的数据集,具体例如:使用的训练数据集是卡内基梅隆大学公开的数据集含有2235个视频序列,其子集含有664个视频序列分为8个动作类别,上述选取的数据集包含四种行为类型模式文件,其中,每个人体模型均包含29个关键点。当然,在具体的实施过程中,也可以人工采集样本视频,并使用程序提取样本视频中的人体关键点;其中,从样本视频中提取人体关键点的实施原理与上面步骤S110的实施原理类似,因此,这里不再说明其实施原理和实施方式,如有不清楚的地方,可以参考对步骤S110的描述。
步骤S220:以多个样本视频为训练数据,以多个人体模型中的人体关键点为训练标签,对神经网络进行训练,获得神经网络模型。
上述步骤S220的实施方式例如:使用神经网络预测样本视频中的人体关键点,获得预测关键点;然后计算预测关键点和人体关键点之间的损失值,再根据该损失值更新神经网络的网络权重参数,直到损失值小于预设比例或者训练批次(epoch)数量大于预设阈值时,即可获得训练后的神经网络模型。其中,上述的预设比例和预设阈值可以根据具体情况进行设置,例如设置为0.1、0.5、1或者10等等。
可选地,在本申请实施例中,在使用单类支持向量机之前,还需要训练单类支持向量机,该单类支持向量机的具体训练方式可以包括:
步骤S230:获得样本视频对应的分类标签,该分类标签表示该样本视频中的人体行为是否存在异常的类别。
其中,该步骤S230的实施原理和实施方式与步骤S210的实施原理和实施方式是类似的,因此,这里不再说明其实施原理和实施方式,如有不清楚的地方,可以参考对步骤S210的描述。
步骤S240:使用主成分分析算法或者动态模型分解算法对样本视频对应的人体关键点进行降维处理,获得样本视频对应的特征值。
其中,该步骤S240的实施原理和实施方式与步骤S121的实施原理和实施方式是类似的,因此,这里不再说明其实施原理和实施方式,如有不清楚的地方,可以参考对步骤S121的描述。
步骤S250:以样本视频对应的特征值为训练数据,以样本视频对应的分类标签为训练标签,对单类支持向量机进行训练,获得训练后的单类支持向量机。
上述步骤S250的实施方式例如:使用单类支持向量机计算特征值对应的预测类别,并计算预测类别与分类标签之间的损失值,再根据该损失值更新单类支持向量机的网络权重参数,直到损失值小于预设比例或者训练批次(epoch)数量大于预设阈值时,即可获得训练后的单类支持向量机;同上,上述的预设比例和预设阈值也可以根据具体情况进行设置。
请参见图4示出的本申请实施例提供的异常行为识别装置的结构示意图;本申请实施例提供了一种异常行为识别装置300,包括:
人体关键提取模块310,用于获得针对人体采集的视频流,并从视频流中提取出人体关键点,人体关键点表征人体的骨骼和关节。
降维特征获得模块320,用于对人体关键点进行降维处理,获得降维后的特征值,特征值表征人体的动态特征。
分类结果获得模块330,用于使用训练后的单类支持向量机对降维后的特征值进行分类,获得分类结果,分类结果表征视频流中的人体是否存在异常行为。
可选地,在本申请实施例中,降维特征获得模块,包括:
第一降维处理模块,用于使用主成分分析算法或者动态模型分解算法对人体关键点进行降维处理。
可选地,在本申请实施例中,降维特征获得模块,包括:
矩阵维度判断模块,用于判断人体关键点的矩阵维度是否大于预设维度。
第二降维处理模块,用于若人体关键点的矩阵维度大于预设维度,则使用奇异值分解对人体关键点进行降维处理。
可选地,在本申请实施例中,人体关键提取模块,包括:
视频图像提取模块,用于从视频流中提取出视频图像。
关键点提取模块,用于使用神经网络模型从视频图像提取出人体关键点。
可选地,在本申请实施例中,异常行为识别装置,还包括:
视频模型获得模块,用于获得多个样本视频和多个人体模型,人体模型中包括与样本视频对应的人体关键点。
网络模型获得模块,用于以多个样本视频为训练数据,以多个人体模型中的人体关键点为训练标签,对神经网络进行训练,获得神经网络模型。
可选地,在本申请实施例中,异常行为识别装置,还可以包括:
特征值获得模块,用于获得样本视频对应的分类标签,并使用主成分分析算法或者动态模型分解算法对样本视频对应的人体关键点进行降维处理,获得样本视频对应的特征值。
向量机训练模块,用于以样本视频对应的特征值为训练数据,以样本视频对应的分类标签为训练标签,对单类支持向量机进行训练,获得训练后的单类支持向量机。
可选地,在本申请实施例中,该异常行为识别装置,还可以包括:
分类结果判断模块,用于判断分类结果是否为视频流中的人体存在异常行为。
信号生成输出模块,用于若分类结果是视频流中的人体存在异常行为,则生成并输出预警信号。
应理解的是,该装置与上述的异常行为识别方法实施例对应,能够执行上述方法实施例涉及的各个步骤,该装置具体的功能可以参见上文中的描述,为避免重复,此处适当省略详细描述。
请参见图5示出的本申请实施例提供的电子设备的结构示意图。本申请实施例提供的一种电子设备400,包括:处理器410和存储器420,存储器420存储有处理器410可执行的机器可读指令,机器可读指令被处理器410执行时执行如上的方法。
本申请实施例还提供了一种存储介质430,该存储介质430上存储有计算机程序,该计算机程序被处理器410运行时执行如上的方法。
其中,存储介质430可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器,电可擦除可编程只读存储器,可擦除可编程只读存储器,可编程只读存储器,只读存储器,磁存储器,快闪存储器,磁盘或光盘。
以上的描述,仅为本申请实施例的可选实施方式,但本申请实施例的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请实施例揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请实施例的保护范围之内。

Claims (8)

1.一种异常行为识别方法,其特征在于,包括:
获得针对人体采集的视频流,并从所述视频流中提取出一系列连续的人体关键点,所述人体关键点表征人体的骨骼和关节,所述系列连续的人体关键点包含人体的骨骼和关节的频率信息;
对所述系列连续的人体关键点进行降维处理,获得降维后的特征值,所述特征值表征人体的动态特征;
使用训练后的单类支持向量机对所述降维后的特征值进行分类,获得分类结果,所述分类结果表征所述视频流中的人体是否存在异常行为;
其中,所述对所述系列连续的人体关键点进行降维处理,包括:使用动态模型分解算法从所述系列连续的人体关键点中采样得到所述人体关键点的矩阵;若所述人体关键点的矩阵维度大于预设维度,则使用奇异值分解对所述人体关键点进行降维处理,从而提取出频率信息,所述降维后的特征值包括所述频率信息。
2.根据权利要求1所述的方法,其特征在于,所述从所述视频流中提取出人体关键点,包括:
从所述视频流中提取出视频图像;
使用神经网络模型从所述视频图像提取出人体关键点。
3.根据权利要求2所述的方法,其特征在于,在所述使用神经网络模型从所述视频图像提取出人体关键点之前,还包括:
获得多个样本视频和多个人体模型,所述人体模型中包括与所述样本视频对应的人体关键点;
以所述多个样本视频为训练数据,以所述多个人体模型中的人体关键点为训练标签,对神经网络进行训练,获得所述神经网络模型。
4.根据权利要求3所述的方法,其特征在于,在所述使用训练后的单类支持向量机对所述降维后的特征值进行分类之前,还包括:
获得所述样本视频对应的分类标签,并使用动态模型分解算法对所述样本视频对应的人体关键点进行降维处理,获得所述样本视频对应的特征值;
以所述样本视频对应的特征值为训练数据,以所述样本视频对应的分类标签为训练标签,对单类支持向量机进行训练,获得所述训练后的单类支持向量机。
5.根据权利要求1-4任一所述的方法,其特征在于,在所述获得分类结果之后,还包括:
判断所述分类结果是否为所述视频流中的人体存在异常行为;
若是,则生成并输出预警信号。
6.一种异常行为识别装置,其特征在于,包括:
人体关键提取模块,用于获得针对人体采集的视频流,并从所述视频流中提取出一系列连续的人体关键点,所述人体关键点表征人体的骨骼和关节,所述系列连续的人体关键点包含人体的骨骼和关节的频率信息;
降维特征获得模块,用于对所述系列连续的人体关键点进行降维处理,获得降维后的特征值,所述特征值表征人体的动态特征;
分类结果获得模块,用于使用训练后的单类支持向量机对所述降维后的特征值进行分类,获得分类结果,所述分类结果表征所述视频流中的人体是否存在异常行为;
其中,所述对所述系列连续的人体关键点进行降维处理,包括:使用动态模型分解算法从所述系列连续的人体关键点中采样得到所述人体关键点的矩阵;若所述人体关键点的矩阵维度大于预设维度,则使用奇异值分解对所述人体关键点进行降维处理,从而提取出频率信息,所述降维后的特征值包括所述频率信息。
7.一种电子设备,其特征在于,包括:处理器和存储器,所述存储器存储有所述处理器可执行的机器可读指令,所述机器可读指令被所述处理器执行时执行如权利要求1至5任一所述的方法。
8.一种存储介质,其特征在于,该存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至5任一所述的方法。
CN202110144089.9A 2021-02-01 2021-02-01 一种异常行为识别方法、装置、电子设备及存储介质 Active CN112861696B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110144089.9A CN112861696B (zh) 2021-02-01 2021-02-01 一种异常行为识别方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110144089.9A CN112861696B (zh) 2021-02-01 2021-02-01 一种异常行为识别方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN112861696A CN112861696A (zh) 2021-05-28
CN112861696B true CN112861696B (zh) 2023-08-18

Family

ID=75986331

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110144089.9A Active CN112861696B (zh) 2021-02-01 2021-02-01 一种异常行为识别方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN112861696B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113435374A (zh) * 2021-07-05 2021-09-24 北京理工大学 一种基于dmd和yolov5的光电智能垃圾分拣方法
CN114419528B (zh) * 2022-04-01 2022-07-08 浙江口碑网络技术有限公司 异常识别方法、装置、计算机设备及计算机可读存储介质

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102302370A (zh) * 2011-06-30 2012-01-04 中国科学院计算技术研究所 一种跌倒检测方法和装置
CN102663413A (zh) * 2012-03-09 2012-09-12 中盾信安科技(江苏)有限公司 一种面向多姿态和跨年龄的人脸图像认证方法
CN104038738A (zh) * 2014-06-04 2014-09-10 东北大学 一种提取人体关节点坐标的智能监控***及方法
CN104866860A (zh) * 2015-03-20 2015-08-26 武汉工程大学 一种室内人体行为识别方法
CN106228129A (zh) * 2016-07-18 2016-12-14 中山大学 一种基于matv特征的人脸活体检测方法
CN106571014A (zh) * 2016-10-24 2017-04-19 上海伟赛智能科技有限公司 一种在视频中识别异常动作的方法和***
CN108416251A (zh) * 2018-01-08 2018-08-17 中国矿业大学 基于量子遗传算法优化的高效人体动作识别方法
CN109829412A (zh) * 2019-01-24 2019-05-31 三峡大学 基于动态模式分解分形特征的局部放电模式识别方法
CN110472573A (zh) * 2019-08-14 2019-11-19 北京思图场景数据科技服务有限公司 一种基于身体关键点的人体行为分析方法、设备以及计算机存储介质
CN110738163A (zh) * 2019-10-12 2020-01-31 中国矿业大学 一种矿井人员违规动作识别***
CN111027481A (zh) * 2019-12-10 2020-04-17 浩云科技股份有限公司 基于人体关键点检测的行为分析方法及装置
CN111079536A (zh) * 2019-11-18 2020-04-28 高新兴科技集团股份有限公司 基于人体关键点时序的行为分析方法、存储介质及设备
CN111325144A (zh) * 2020-02-19 2020-06-23 上海眼控科技股份有限公司 行为检测方法、装置、计算机设备和计算机可读存储介质
CN111814661A (zh) * 2020-07-07 2020-10-23 西安电子科技大学 基于残差-循环神经网络的人体行为识别方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9674406B2 (en) * 2014-08-15 2017-06-06 University Of Washington Using dynamic mode decomposition for real-time background/foreground separation in video
US20200349347A1 (en) * 2019-01-07 2020-11-05 Cherry Labs Inc. Systems and methods for monitoring and recognizing human activity

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102302370A (zh) * 2011-06-30 2012-01-04 中国科学院计算技术研究所 一种跌倒检测方法和装置
CN102663413A (zh) * 2012-03-09 2012-09-12 中盾信安科技(江苏)有限公司 一种面向多姿态和跨年龄的人脸图像认证方法
CN104038738A (zh) * 2014-06-04 2014-09-10 东北大学 一种提取人体关节点坐标的智能监控***及方法
CN104866860A (zh) * 2015-03-20 2015-08-26 武汉工程大学 一种室内人体行为识别方法
CN106228129A (zh) * 2016-07-18 2016-12-14 中山大学 一种基于matv特征的人脸活体检测方法
CN106571014A (zh) * 2016-10-24 2017-04-19 上海伟赛智能科技有限公司 一种在视频中识别异常动作的方法和***
CN108416251A (zh) * 2018-01-08 2018-08-17 中国矿业大学 基于量子遗传算法优化的高效人体动作识别方法
CN109829412A (zh) * 2019-01-24 2019-05-31 三峡大学 基于动态模式分解分形特征的局部放电模式识别方法
CN110472573A (zh) * 2019-08-14 2019-11-19 北京思图场景数据科技服务有限公司 一种基于身体关键点的人体行为分析方法、设备以及计算机存储介质
CN110738163A (zh) * 2019-10-12 2020-01-31 中国矿业大学 一种矿井人员违规动作识别***
CN111079536A (zh) * 2019-11-18 2020-04-28 高新兴科技集团股份有限公司 基于人体关键点时序的行为分析方法、存储介质及设备
CN111027481A (zh) * 2019-12-10 2020-04-17 浩云科技股份有限公司 基于人体关键点检测的行为分析方法及装置
CN111325144A (zh) * 2020-02-19 2020-06-23 上海眼控科技股份有限公司 行为检测方法、装置、计算机设备和计算机可读存储介质
CN111814661A (zh) * 2020-07-07 2020-10-23 西安电子科技大学 基于残差-循环神经网络的人体行为识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
采用动态模式分解分形特征的局部放电模式识别;徐艳春等;《电力***及其自动化学报》;第31卷(第12期);35-43 *

Also Published As

Publication number Publication date
CN112861696A (zh) 2021-05-28

Similar Documents

Publication Publication Date Title
US11354901B2 (en) Activity recognition method and system
US10402655B2 (en) System and method for visual event description and event analysis
CN108922622B (zh) 一种动物健康监测方法、装置及计算机可读存储介质
Passalis et al. Learning bag-of-features pooling for deep convolutional neural networks
CN110431560B (zh) 目标人物的搜索方法和装置、设备和介质
WO2018192570A1 (zh) 时域动作检测方法和***、电子设备、计算机存储介质
US8805018B2 (en) Method of detecting facial attributes
CN112836676B (zh) 一种异常行为检测方法、装置、电子设备及存储介质
Khan et al. Situation recognition using image moments and recurrent neural networks
CN112861696B (zh) 一种异常行为识别方法、装置、电子设备及存储介质
Dutta et al. Online detection of abnormal events using incremental coding length
CN116662817B (zh) 物联网设备的资产识别方法及***
Sismananda et al. Performance comparison of yolo-lite and yolov3 using raspberry pi and motioneyeos
CN112949456B (zh) 视频特征提取模型训练、视频特征提取方法和装置
CN113052091A (zh) 一种基于卷积神经网络的动作识别方法
Ramzan et al. Automatic Unusual Activities Recognition Using Deep Learning in Academia.
CN108596068B (zh) 一种动作识别的方法和装置
Baptista et al. Anticipating suspicious actions using a small dataset of action templates
Zhang et al. Automatic construction and extraction of sports moment feature variables using artificial intelligence
CN111401317B (zh) 视频分类方法、装置、设备及存储介质
CN112101476A (zh) 一种图片分类方法、装置、电子设备及存储介质
Jaiswal et al. HOG Ensembled Boosting Machine Learning Approach for Violent Video Classification
Wong et al. Multi-Camera Face Detection and Recognition in Unconstrained Environment
CN111444507B (zh) 加壳软件是否误报的判定方法、装置、设备及存储介质
Kukad et al. Autonomous anomaly detection system for crime monitoring and alert generation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20231129

Address after: Room 9810, 2nd Floor, Building 4, Free Trade Industrial Park, No. 2168 Zhenghe Fourth Road, Fengdong New City, Xi'an City, Shaanxi Province, 710000

Patentee after: Xi'an Baicheng Yigou Technology Co.,Ltd.

Address before: 710000, 6th Floor, F2-930, Building A2, Guorun City, Xixian Avenue, Fengdong New City, Xi'an City, Shaanxi Province

Patentee before: Xi'an Maisou Information Technology Co.,Ltd.

Effective date of registration: 20231129

Address after: 710000, 6th Floor, F2-930, Building A2, Guorun City, Xixian Avenue, Fengdong New City, Xi'an City, Shaanxi Province

Patentee after: Xi'an Maisou Information Technology Co.,Ltd.

Address before: 528400, Xueyuan Road, 1, Shiqi District, Guangdong, Zhongshan

Patentee before: University OF ELECTRONIC SCIENCE AND TECHNOLOGY OF CHINA, ZHONGSHAN INSTITUTE

TR01 Transfer of patent right