CN111709411A - 基于半监督学习的视频异常检测方法和装置 - Google Patents
基于半监督学习的视频异常检测方法和装置 Download PDFInfo
- Publication number
- CN111709411A CN111709411A CN202010842914.8A CN202010842914A CN111709411A CN 111709411 A CN111709411 A CN 111709411A CN 202010842914 A CN202010842914 A CN 202010842914A CN 111709411 A CN111709411 A CN 111709411A
- Authority
- CN
- China
- Prior art keywords
- video
- features
- obtaining
- vector
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 33
- 239000013598 vector Substances 0.000 claims abstract description 96
- 230000002159 abnormal effect Effects 0.000 claims abstract description 36
- 238000012549 training Methods 0.000 claims abstract description 31
- 238000013528 artificial neural network Methods 0.000 claims abstract description 29
- 238000012360 testing method Methods 0.000 claims abstract description 14
- 238000001914 filtration Methods 0.000 claims abstract description 11
- 238000004590 computer program Methods 0.000 claims description 15
- 230000006870 function Effects 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims description 6
- 238000012986 modification Methods 0.000 claims description 5
- 230000004048 modification Effects 0.000 claims description 5
- 230000011218 segmentation Effects 0.000 claims description 4
- 238000000034 method Methods 0.000 description 8
- 238000012544 monitoring process Methods 0.000 description 7
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种基于半监督学***均向量和重要性向量,并根据视频特征的平均向量获取滤波区分性很强特征的掩膜,以及根据视频特征的平均向量、掩膜和重要性向量获取神经网络的辍学层;根据辍学层和视频特征向量获得修饰后的特征,并根据修饰后的特征获取训练参数;在测试时,按相邻的包获得修饰后的特征输入全连接网络,计算得到每个包的得分,并根据得分判定相关位置是否发生异常。本发明能够隐藏视频特征中最有区分的部分来捕捉整体信息,并能突出区分性很强的信息区域来增强神经网络的识别能力。
Description
技术领域
本发明涉及视频检测技术领域,具体涉及一种基于半监督学习的视频异常检测方法、一种基于半监督学习的视频异常检测装置、一种计算机设备和一种计算机程序产品。
背景技术
在现代社会中,视频监控技术成为目前最重要的安防监控手段。然而,普通的监控视频处理方法需要管理人员对监控画面进行查看,当监控数据很大时,专人观察非常容易疲劳,易出现漏检现象。因此,判断视频是否有异常以及定位视频中异常的部分成为监控管理的迫切需求。
相关技术中将视频的一部分画面输入到C3D网络(3D卷积神经网络)等来获得这部分的视频特征,然后将这部分特征输入全链接网络计算异常得分,最后根据各部分的异常得分取最大值来预测视频中是否发生异常事件,同时根据各部分的得分来定位视频中发生异常的位置。
但是上述方案中异常得分的贡献主要由一些显著的局部特征所确定,而在有些视频中需要神经网络对视频全局的理解才能确定是否发生了异常,因此仅仅只考虑一些区分性很强的局部特征来判定可能不准确。
发明内容
本发明为解决上述技术问题,提供了一种基于半监督学习的视频异常检测方法,能够隐藏视频特征中最有区分的部分来捕捉整体信息,并能突出区分性很强的信息区域来增强神经网络的识别能力。
本发明采用的技术方案如下:
一种基于半监督学***均向量和重要性向量,并根据所述视频特征的平均向量获取滤波区分性很强特征的掩膜,以及根据所述视频特征的平均向量、所述掩膜和所述重要性向量获取神经网络的辍学层;根据所述辍学层和所述视频特征向量获得修饰后的特征,并根据所述修饰后的特征获取训练参数;在测试时,按相邻的包获得所述修饰后的特征输入全连接网络,计算得到每个包的得分,并根据所述得分判定相关位置是否发生异常。
根据本发明的一个实施例,通过下述公式计算获得所述重要性向量Fs:
根据本发明的一个实施例,通过下述公式计算获得所述神经网络的辍学层Fd:
根据本发明的一个实施例,通过下述训练模型获得训练参数,
根据本发明的一个实施例,全连接网络G的表达式为:
根据本发明的一个实施例,根据所述视频特征的平均向量获取滤波区分性很强特征的掩膜,包括:当所述视频特征的平均向量小于或等于其对应的最大元素与预设系数的乘积时,所述掩膜中相应位置的元素值为1;当所述视频特征的平均向量大于其对应的最大元素与预设系数的乘积时,所述掩膜中相应位置的元素值为0。
根据本发明的一个实施例,根据所述得分判定相关位置是否发生异常,包括:判断所述视频得分是否大于预设阈值;如果大于,则判断当前画面为异常画面,以确定视频中的异常位置。
本发明还提出了一种基于半监督学***均向量和重要性向量,并根据所述视频特征的平均向量获取滤波区分性很强特征的掩膜,以及根据所述视频特征的平均向量、所述掩膜和所述重要性向量获取神经网络的辍学层,并根据所述辍学层和所述视频特征向量获得修饰后的特征,并根据所述修饰后的特征获取训练参数;模型测试模块,用于在测试时,按相邻的包获得所述修饰后的特征输入全连接网络,计算得到每个包的得分,并根据所述得分判定相关位置是否发生异常。
本发明还提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现上述的基于半监督学习的视频异常检测方法。
本发明还提出了一种计算机程序产品,当所述计算机程序产品中的指令由处理器执行时,执行上述的基于半监督学习的视频异常检测方法。
本发明的有益效果:
本发明能够隐藏视频特征中最有区分的部分来捕捉整体信息,并能突出区分性很强的信息区域来增强神经网络的识别能力。
附图说明
图1为本发明实施例的基于半监督学习的视频异常检测方法的流程图;
图2为本发明实施例的基于半监督学习的视频异常检测的方框示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为根据本发明实施例的基于半监督学习的视频异常检测方法的流程图。如图1所示,本发明实施例的基于半监督学习的视频异常检测方法可包括以下步骤:
S1,将视频数据按顺序切分成u×v帧视频图像,其中,从头开始每相邻时序的v帧视频称为一个包,每个视频可分为u个包,u和v为正整数。
在本发明的一个实施例中,上述的方法还包括:判断视频大小与u×v帧之间的关系,其中,当视频大小不足u×v帧时,根据视频大小确定复制视频首尾帧的帧数;当视频大于u×v帧时,根据视频大小确定跳帧的频率。例如,当视频大小还差6帧达到u×v帧时,可复制视频的首尾各3帧。
需要说明的是,当视频的帧数不是v的整数倍时,复制剩余的帧数的最后一帧,以达到v帧,例如,视频的帧数为16帧,每5帧视频为一个包,剩余一帧视频,还差4帧视频可以构成一个包,那么,则复制4次最后一帧视频,和剩余的一帧一起构成一个包;又如,视频的帧数为18,每5帧视频为一个包,剩余3帧视频,还差2帧视频可以构成一个包,那么,则复制2次最后一帧,和剩余的3帧一起构成一个包。
在模型训练时,训练集标注的视频分为正常视频和异常视频,对于异常视频,由于是半监督的范式,故其异常画面的时序位置未知。
S2,分别对每个包进行特征提取,获得对应的视频特征,其中,每个视频有u个视频特征向量。
S3,根据视频特征获得视频特征的平均向量和重要性向量,并根据视频特征的平均向量获取滤波区分性很强特征的掩膜,以及根据视频特征的平均向量、掩膜和重要性向量获取神经网络的辍学层。
根据本发明的一个实施例,通过下述公式(1)计算获得视频特征的平均向量Fm:
进一步地,通过下述公式(2)计算获得重要性向量Fs:
在本发明的一个实施例中,根据视频特征的平均向量获取滤波区分性很强特征的掩膜,包括:当视频特征的平均向量小于或等于其对应的最大元素与预设系数的乘积时,掩膜中相应位置的元素值为1;当视频特征的平均向量大于其对应的最大元素与预设系数的乘积时,掩膜中相应位置的元素值为0。
进一步地,通过下述公式(3)计算获得神经网络的辍学层Fd:
S4,根据辍学层和视频特征向量获得修饰后的特征,并根据修饰后的特征获取训练参数。
在本发明的一个实施例中,将辍学层Fd与视频特征向量F1, F2, …,Fu分别点乘得
到修饰后的特征,,…,。并将修饰后的特征, ,…,输入全连接网络
G,得到G最后层输出值,并通过下述公式(4)训练模型获得训练参数,
S5,在测试时,按相邻的包所获得修饰后的特征输入全连接网络,计算得到每个包的得分,并根据得分判定相关位置是否发生异常。
在本发明的一个实施例中,全连接网络G的表达式为:
在测试视频是否异常,此时将不再使用训练时的辍学层,直接根据函数maxi(G(Fi))即可。
综上,先对视频进行标记,标记类型分为正常视频和异常视频,然后进行模型训练,首先对视频进行特征提取,并获得视频特征的平均向量和重要性向量,根据视频特征的平均向量获取掩膜,继而根据相应的公式获得辍学层,根据辍学层和特征向量获得修饰后的特征向量,将修饰后的特征向量输入至全连接网络中,得到对相应的u个特征通过全连接网络G后的最后得分取最大值,然后将该值输入到训练模型中,以获得训练参数,在计算视频的得分时,按照上述步骤获得修饰后的向量特征,并将修饰后的向量特征代入全连接网络的表达式中,即可得到最终的得分,在测试阶段,无需使用训练时的辍学层,直接将修饰后的向量特征代入到全连接网络中,即可获得最后得分。
根据本发明的一个实施例,根据得分判定相关位置是否发生异常,包括:判断得分是否大于预设阈值;如果大于,则判断当前画面为异常画面,以确定视频中的异常位置。
也就是说,对于视频中异常位置的定位可根据得分G(Fi)来判定,当其大于某一阈值时,判定为异常画面。
综上所述,本发明能够隐藏视频特征中最有区分的部分来捕捉整体信息,并能突出区分性很强的信息区域来增强神经网络的识别能力。
图2为根据本发明实施例的基于半监督学习的视频异常检测的方框示意图。如图2所示,本发明实施例的基于半监督学习的视频异常检测可包括:视频切分模块10、视频特征提取模块20、神经网络训练模块30和模型测试模块40。
其中,视频切分模块10用于将视频数据按顺序切分成u×v帧视频图像,其中,从头开始每相邻时序的v帧视频称为一个包,每个视频可分为u个包,u和v为正整数。视频特征提取模块20用于分别对每个包进行特征提取,获得对应的视频特征,其中,每个视频有u个视频特征向量。神经网络训练模块30用于根据视频特征获得视频特征的平均向量和重要性向量,并根据视频特征的平均向量获取滤波区分性很强特征的掩膜,以及根据视频特征的平均向量、掩膜和重要性向量获取神经网络的辍学层,并根据辍学层和视频特征向量获得修饰后的特征,并根据修饰后的特征获取训练参数。模型测试模块40用于在测试时,按相邻的包获得修饰后的特征输入全连接网络,计算得到每个包的得分,并根据得分判定相关位置是否发生异常。
根据本发明的一个实施例,神经网络训练模块30通过下述公式计算获得重要性向量Fs:
根据本发明的一个实施例,神经网络训练模块30通过下述公式计算获得神经网络的辍学层Fd:
根据本发明的一个实施例,神经网络训练模块30通过下述训练模型获得训练参数,
根据本发明的一个实施例,模型测试模块40全连接网络G的表达式为:
根据本发明的一个实施例,神经网络训练模块30根据视频特征的平均向量获取滤波区分性很强特征的掩膜,具体用于,当视频特征的平均向量小于或等于其对应的最大元素与预设系数的乘积时,掩膜中相应位置的元素值为1;当视频特征的平均向量大于其对应的最大元素与预设系数的乘积时,掩膜中相应位置的元素值为0。
根据本发明的一个实施例,模型测试模块40还用于:判断得分是否大于预设阈值;如果大于,则判断当前画面为异常画面,以确定视频中的异常位置。
需要说明的是,本发明实施例的基于半监督学习的视频异常检测装置中未披露的细节,请参照本发明实施例的基于半监督学习的视频异常检测方法中所披露的细节,具体这里不再赘述。
本发明能够隐藏视频特征中最有区分的部分来捕捉整体信息,并能突出区分性很强的信息区域来增强神经网络的识别能力。
对应上述实施例,本发明还提出一种计算机设备。
本发明实施例的计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行该计算机程序时,可实现上述的基于半监督学习的视频异常检测方法。
根据本发明实施例的计算机设备,处理器执行存储在存储器上的计算机程序时,能够隐藏视频特征中最有区分的部分来捕捉整体信息,并能突出区分性很强的信息区域来增强神经网络的识别能力。
对应上述实施例,本发明还提出一种非临时性计算机可读存储介质。
本发明实施例的非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时可实现根据本发明上述实施例所述的基于半监督学习的视频异常检测方法。
根据本发明实施例的非临时性计算机可读存储介质,处理器执行存储在其上的计算机程序时,能够隐藏视频特征中最有区分的部分来捕捉整体信息,并能突出区分性很强的信息区域来增强神经网络的识别能力。
对应上述实施例,本发明还提出一种计算机程序产品。
当本发明实施例的计算机程序产品中的指令由处理器执行时,可执行根据本发明上述实施例所述的基于半监督学习的视频异常检测方法。
根据本发明实施例的计算机程序产品,处理器执行其中的指令时,能够隐藏视频特征中最有区分的部分来捕捉整体信息,并能突出区分性很强的信息区域来增强神经网络的识别能力。
在本发明的描述中,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。“多个”的含义是两个或两个以上,除非另有明确具体的限定。
在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
在本发明中,除非另有明确的规定和限定,第一特征在第二特征“上”或“下”可以是第一和第二特征直接接触,或第一和第二特征通过中间媒介间接接触。而且,第一特征在第二特征“之上”、“上方”和“上面”可是第一特征在第二特征正上方或斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方,或仅仅表示第一特征水平高度小于第二特征。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必针对相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行***、装置或设备(如基于计算机的***、包括处理器的***或其他可以从指令执行***、装置或设备取指令并执行指令的***)使用,或结合这些指令执行***、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行***、装置或设备或结合这些指令执行***、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行***执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (10)
1.一种基于半监督学习的视频异常检测方法,其特征在于,包括以下步骤:
将视频数据按顺序切分成u×v帧视频图像,其中,从头开始每相邻时序的v帧视频称为一个包,每个视频可分为u个包,u和v为正整数;
分别对每个包进行特征提取,获得对应的视频特征,其中,每个视频有u个视频特征向量;
根据所述视频特征获得视频特征的平均向量和重要性向量,并根据所述视频特征的平均向量获取滤波区分性很强特征的掩膜,以及根据所述视频特征的平均向量、所述掩膜和所述重要性向量获取神经网络的辍学层;
根据所述辍学层和所述视频特征向量获得修饰后的特征,并根据所述修饰后的特征获取训练参数;
在测试时,按相邻的包获得所述修饰后的特征输入全连接网络,计算得到每个包的得分,并根据所述得分判定相关位置是否发生异常。
6.根据权利要求1所述的基于半监督学***均向量获取滤波区分性很强特征的掩膜,包括:
当所述视频特征的平均向量小于或等于其对应的最大元素与预设系数的乘积时,所述掩膜中相应位置的元素值为1;
当所述视频特征的平均向量大于其对应的最大元素与预设系数的乘积时,所述掩膜中相应位置的元素值为0。
7.根据权利要求1所述的基于半监督学习的视频异常检测方法,其特征在于,根据所述得分判定相关位置是否发生异常,包括:
判断所述得分是否大于预设阈值;
如果大于,则判断当前画面为异常画面,以确定视频中的异常位置。
8.一种基于半监督学习的视频异常检测装置,其特征在于,包括:
视频切分模块,用于将视频数据按顺序切分成u×v帧视频图像,其中,从头开始每相邻时序的v帧视频称为一个包,每个视频可分为u个包,u和v为正整数;
视频特征提取模块,用于分别对每个包进行特征提取,获得对应的视频特征,其中,每个视频有u个视频特征向量;
神经网络训练模块,用于根据所述视频特征获得视频特征的平均向量和重要性向量,并根据所述视频特征的平均向量获取滤波区分性很强特征的掩膜,以及根据所述视频特征的平均向量、所述掩膜和所述重要性向量获取神经网络的辍学层,并根据所述辍学层和所述视频特征向量获得修饰后的特征,并根据所述修饰后的特征获取训练参数;
模型测试模块,用于在测试时,按相邻的包获得所述修饰后的特征输入全连接网络,计算得到每个包的得分,并根据所述得分判定相关位置是否发生异常。
9.一种计算机设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现根据权利要求1-7中任一项所述的基于半监督学习的视频异常检测方法。
10.一种计算机程序产品,其特征在于,当所述计算机程序产品中的指令由处理器执行时,执行根据权利要求1-7中任一项所述的基于半监督学习的视频异常检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010842914.8A CN111709411B (zh) | 2020-08-20 | 2020-08-20 | 基于半监督学习的视频异常检测方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010842914.8A CN111709411B (zh) | 2020-08-20 | 2020-08-20 | 基于半监督学习的视频异常检测方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111709411A true CN111709411A (zh) | 2020-09-25 |
CN111709411B CN111709411B (zh) | 2020-11-10 |
Family
ID=72547386
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010842914.8A Active CN111709411B (zh) | 2020-08-20 | 2020-08-20 | 基于半监督学习的视频异常检测方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111709411B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019099226A1 (en) * | 2017-11-14 | 2019-05-23 | Google Llc | Weakly-supervised action localization by sparse temporal pooling network |
CN110502988A (zh) * | 2019-07-15 | 2019-11-26 | 武汉大学 | 视频中的组群定位与异常行为检测方法 |
CN110516536A (zh) * | 2019-07-12 | 2019-11-29 | 杭州电子科技大学 | 一种基于时序类别激活图互补的弱监督视频行为检测方法 |
US20200184647A1 (en) * | 2017-06-08 | 2020-06-11 | The United States Of America, As Represented By The Secretary Department Of Health And Human Service | Progressive and multi-path holistically nested networks for segmentation |
CN111291699A (zh) * | 2020-02-19 | 2020-06-16 | 山东大学 | 基于监控视频时序动作定位和异常检测的变电站人员行为识别方法 |
-
2020
- 2020-08-20 CN CN202010842914.8A patent/CN111709411B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200184647A1 (en) * | 2017-06-08 | 2020-06-11 | The United States Of America, As Represented By The Secretary Department Of Health And Human Service | Progressive and multi-path holistically nested networks for segmentation |
WO2019099226A1 (en) * | 2017-11-14 | 2019-05-23 | Google Llc | Weakly-supervised action localization by sparse temporal pooling network |
CN110516536A (zh) * | 2019-07-12 | 2019-11-29 | 杭州电子科技大学 | 一种基于时序类别激活图互补的弱监督视频行为检测方法 |
CN110502988A (zh) * | 2019-07-15 | 2019-11-26 | 武汉大学 | 视频中的组群定位与异常行为检测方法 |
CN111291699A (zh) * | 2020-02-19 | 2020-06-16 | 山东大学 | 基于监控视频时序动作定位和异常检测的变电站人员行为识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111709411B (zh) | 2020-11-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Khodabakhsh et al. | Fake face detection methods: Can they be generalized? | |
CN108810620B (zh) | 识别视频中的关键时间点的方法、装置、设备及存储介质 | |
CN110047095B (zh) | 基于目标检测的跟踪方法、装置及终端设备 | |
CN113361354B (zh) | 轨道部件巡检方法、装置、计算机设备和存储介质 | |
JP7006702B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
CN109543760A (zh) | 基于图像滤镜算法的对抗样本检测方法 | |
CN112528975A (zh) | 工业质检方法、装置和计算机可读存储介质 | |
CN112508950B (zh) | 异常检测方法和装置 | |
CN114120127A (zh) | 一种目标检测方法、装置及相关设备 | |
CN111179295A (zh) | 改进的二维Otsu阈值图像分割方法和*** | |
CN113781483B (zh) | 工业产品外观缺陷检测方法和装置 | |
CN110517234B (zh) | 特征骨异常检测方法及装置 | |
CN114219803B (zh) | 一种三阶段图像质量评估的检测方法与*** | |
CN113743378B (zh) | 一种基于视频的火情监测方法和装置 | |
JP6874864B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
CN116452966A (zh) | 一种水下图像的目标检测方法、装置、设备及存储介质 | |
CN113706837B (zh) | 一种发动机异常状态检测方法和装置 | |
CN111709411B (zh) | 基于半监督学习的视频异常检测方法和装置 | |
CN114187292B (zh) | 棉纺纸筒的异常检测方法、装置、设备及存储介质 | |
US20240013369A1 (en) | Image defect detecting system, generation method of image defect detecting system and non-transitory computer readable medium | |
CN115861315A (zh) | 缺陷检测方法和装置 | |
CN115249316A (zh) | 工业缺陷检测方法和装置 | |
CN117671548A (zh) | 异常分拣检测方法、装置、电子设备及存储介质 | |
US11120541B2 (en) | Determination device and determining method thereof | |
CN114005060A (zh) | 图像数据的确定方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20220107 Address after: 315000 No. 138-1, Zhongshan West Road, Fenghua District, Ningbo City, Zhejiang Province (self declaration) Patentee after: Shenlan industrial intelligent Innovation Research Institute (Ningbo) Co.,Ltd. Address before: 213000 No.103, building 4, Chuangyan port, Changzhou science and Education City, No.18, middle Changwu Road, Wujin District, Changzhou City, Jiangsu Province Patentee before: SHENLAN ARTIFICIAL INTELLIGENCE CHIP RESEARCH INSTITUTE (JIANGSU) Co.,Ltd. |