CN109829443B - 基于图像增强与3d卷积神经网络的视频行为识别方法 - Google Patents

基于图像增强与3d卷积神经网络的视频行为识别方法 Download PDF

Info

Publication number
CN109829443B
CN109829443B CN201910134439.6A CN201910134439A CN109829443B CN 109829443 B CN109829443 B CN 109829443B CN 201910134439 A CN201910134439 A CN 201910134439A CN 109829443 B CN109829443 B CN 109829443B
Authority
CN
China
Prior art keywords
picture
training
neural network
sequence
convolutional neural
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910134439.6A
Other languages
English (en)
Other versions
CN109829443A (zh
Inventor
黄江平
袁德森
袁书伟
黄啸锐
刘婉莹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chongqing University of Post and Telecommunications
Original Assignee
Chongqing University of Post and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chongqing University of Post and Telecommunications filed Critical Chongqing University of Post and Telecommunications
Priority to CN201910134439.6A priority Critical patent/CN109829443B/zh
Publication of CN109829443A publication Critical patent/CN109829443A/zh
Application granted granted Critical
Publication of CN109829443B publication Critical patent/CN109829443B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明属于图像处理技术领域,具体涉及基于图像增强和3D卷积神经网络的视频行为识别方法,包括将输入的原始视频序列切分成帧,对各个帧图片进行预处理,并将其分别划分至训练集与测试集;将训练集图片输入行为区域增强网络进行训练,获得相应的掩码处理后图片;使用掩码处理后的图片序列训练3D卷积神经网络;输入测试集图片,获得该分支网络的测试集分类概率;将训练集图片输入3D卷积神经网络进行训练;输入测试集图片,得到该分支网络的测试集分类概率;将两分支网络的分类概率进行支持向量机模型训练,并得到最终的测试集检测结果。本发明能够准确并实时识别出视频中人物的行为,且更加充分的利用图像信息,提高视频中行为识别的准确率。

Description

基于图像增强与3D卷积神经网络的视频行为识别方法
技术领域
本发明属于多媒体与计算机视觉技术领域,涉及一种基于图像增强与3D卷积神经网络的视频行为识别方法。
背景技术
行为识别是近年来计算机视觉和多媒体领域的研究热点和基石,在安防,人机交互,智能家居和虚拟现实等领域均有广泛的应用前景。在实际情况中,行为识别往往是以实时的视频或监控为载体,提供实时的人物行为的识别检测,这在给人们带来便捷的同时,也对识别的精确度和实时性速率提出了更高的要求。目前,行为识别的难点主要有两个:光流计算复杂导致实时性较差,行为识别的精确度有待提高。
目前,行为识别技术的主流方法有两种,分别是双流法和3D卷积神经网络方法。其中,双流法需要计算复杂的光流信息作为预先训练的数据样本,往往需要长达一天的计算时间和大量的硬盘存储空间,同时还需要提取视频的红R、绿G、蓝B的RGB信息。因此,双流法的计算需求导致不能达成实时性的识别需要。而3D卷积神经网络的方法在直接使用视频的RGB信息进行训练的前提下,往往效果会比双流法差一点。原始的视频所携带的RGB信息在未经处理的情况下,可能会导致无法采集行为识别所需要的部分显著性特征,一些行为实体的细粒度纹理信息不能很好的进行提取利用。
发明内容
有鉴于此,由于输入的视频同时具有时间和空间信息,经过神经网络和计算之后,特征会分别得到不同的增强。因此,同样的原始视频,在经过光流法提取后和直接使用原始视频进行训练的效果是不同的。因此,视频的细节信息和色彩信息对于行为识别技术是极为关键的特征。因而,申请人提供了一种基于图像增强与3D卷积神经网络的视频行为识别方法,图像增强过后的视频可以很好地描述人物实体行为特征,局部色彩特征信息是识别人物动作重要纹理特征;结合图像增强方法和3D卷积神经网络来达到高准确性,实时地实现行为识别。
为达到上述目的,本发明提供如下技术方案:
基于图像增强与3D卷积神经网络视频行为识别方法,包括以下步骤:
S1:将输入的原始视频序列切分成帧,对各个帧图片进行预处理,并将其分别划分至训练集与测试集;
S2:将训练集图片输入行为区域增强网络进行训练,获得相应的掩码处理后图片,从而得到人物行为信息增强的图像;
S3:使用掩码处理后的图片序列训练3D卷积神经网络;输入测试集图片,获得该分支网络的测试集分类概率;
S4:将训练集图片输入3D卷积神经网络进行训练;输入测试集图片,得到该分支网络的测试集分类概率;
S5:将所得到的两分支网络的分类概率进行支持向量机模型训练,并得到最终的测试集检测结果。
进一步的,步骤S1所述视频或图像预处理,具体包括:
将原始视频序列按照时间顺序切分成帧,即切分为时间上连续分布的图片序列;将切分好的图片序列调整为适合3D卷积神经网络训练的统一图片格式。
进一步的,步骤S2训练特征提取卷积神经网络,具体包括:
对图片序列中的人物行为区域进行掩码处理,增强图片中的行为动作信息;将图片序列当中的动作区域进行识别,并进行像素级标注处理,利用图像处理方法得到目标图片;将切分完成的原始视频帧图片序列输入行为区域增强网络进行训练,以最小化行为区域增强网络的损失函数为目标,进行像素级的分类和掩码处理,获得相应的掩码处理后图片,从而得到人物行为信息增强的图像。
所述行为区域增强网络的损失函数计算包括:
Loss=Lcls+Lseg
Figure BDA0001976519600000031
其中,Loss表示总损失函数,Lcls表示分类的损失函数,Lseg表示切分的损失函数,CE(θ)表示交叉熵损失函数,yi表示第i个训练集图片的标签,N表示训练集图像的总数;
Figure BDA0001976519600000032
表示估计值,即预测出的标签。
进一步的,步骤S3训练3D卷积神经网络,具体包括:
输入的掩码图片序列色彩空间为红R、绿G、蓝B,其中掩码部分的颜色为统一的颜色。将掩码图片序列按照输入格式统一标准化处理,并输入到3D卷积神经网络中,进行训练,获取该图片序列在时间序列上和空间序列的双重信息。通过3D卷积与3D池化,经过全连接层和Softmax层,搭建得到分类网络,从而得到各行为分类概率。
进一步的,训练另一支3D卷积神经网络,步骤S4具体包括:
将训练集图片直接输入进3D卷积神经网络并训练该卷积神经网络,依次经过3D卷积,3D池化,全连接层和Softmax层,得到其特征图和在时间序列上和空间序列的双重信息;输入测试集图片,得到测试集的分类概率;其中,该3D卷积神经网络中第I层卷积核表示为WI×HI×XI,XI为第I层中输入的图片序列数,WI×HI对应为第I层空间中的长宽大小。
进一步的,步骤S5具体包括:
步骤S5具体包括获取两分支神经网络的训练后测试集分类概率,总神经网络的两分支依次为经过图像增强的3D卷积神经网络和原始图片训练而得的3D卷积神经网络;将分类的概率进行支持向量机模型的训练;支持向量机模型通过各个分类概率与对应标签进行学习,得到最优权重,最终识别概率计算方式包括:
Figure BDA0001976519600000033
其中:P为样本的最终预测概率,
Figure BDA0001976519600000034
为第I个样本在第一分支上的概率,
Figure BDA0001976519600000035
为第I个样本在第二分支上的概率,w1和w2分别为训练支持向量机模型得到的最优权重;取输出概率最大的类别作为每个样本的最终识别结果。
可选的,所述最优权重的获取方式还包括根据权重融合获取最终概率,其中,权重融合的方法包括最大值融合,最小值融合和平均值融合。
通过上述方法,取输出概率最大的类别作为每个样本图像的最终识别结果。
本发明的有益效果在于:
1)本发明提出一种基于图像增强和3D卷积神经网络的视频行为识别算法,该方法能够准确并实时识别出视频中人物的行为。
2)本方法同时对原始视频的图像色彩特征进行增强并提取行为信息,更加充分的利用图像信息,提高视频中行为识别的准确率。
3)本发明通过采用支持向量机模型,对各个分类概率与对应标签进行学习,得到最优权重,从而获取最终的识别结果;该过程具有良好的鲁棒性。
附图说明
图1为本发明整体流程示意图;
图2为本发明中行为区域增强网络结构示意图;
图3为本发明中采用的3D卷积神经网络结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
如图1所示,本发明基于图像增强和3D卷积神经网络的视频行为识别方法具体包括以下步骤:
S1:将输入的原始视频序列切分成帧,对各个帧图片进行预处理,并将其分别划分至训练集与测试集;
S2:将训练集图片输入行为区域增强网络进行训练,获得相应的掩码处理后图片,从而得到人物行为信息增强的图像;
S3:使用掩码处理后的图片序列训练3D卷积神经网络;输入测试集图片,获得该分支网络的测试集分类概率;
S4:将训练集图片输入3D卷积神经网络进行训练;输入测试集图片,得到该分支网络的测试集分类概率;
S5:将所得到的两分支网络的分类概率进行支持向量机模型训练,并得到最终的测试集检测结果。
实施例1
本实施例将结合具体数据对本发明进行进一步的说明,本实施例使用的数据集共有133200段视频,包含共计101种动作,视频总时长达数十小时,每段视频的长度在10s左右。
S11:对所有输入的133200段视频进行切分成帧,按照输入规格进行图片格式预处理,并划分训练集与测试集;
所述预处理是指从133200段视频序列中按时间顺序对视频逐帧进行切分,并按照输入格式的长宽进行重新规范化处理,例如要求每一帧图片均为“jpg”格式,其长宽为128乘以171;裁剪出每一帧的图片。
S21:对将切分完成的原始视频帧图片序列输入行为区域增强网络进行训练,获得相应的掩码处理后图片,从而得到人物行为信息增强的图像;
图像掩码主要用于对图片或视频当中局部信息进行特殊化处理,可以实现对图像信息的局部增强或屏蔽。本发明中使用掩码信息来对视频中的人物实体动作进行局部的信息增强,并提取不规则的感兴趣区域。
进一步的,作为一种优选方式,本实施例中所采用的是二值掩码图,一种8位的单通道图像。其中,在掩码图片的编码中某个位置被编码为0,则在此位置的操作将会被屏蔽,被编码为1的部分则会被增强。
进一步的,本实施例中使用的行为区域增强网络模型如图2所示,共有14个卷积层,5个全连接层,1个上采样层以及6个池化层和1个反池化层。行为区域增强网络能很好的提取行为部分的特征,对于行为识别信息的细纹理特征有很好的辅助作用。
S31:使用处理后的掩码视频帧图片序列训练3D卷积神经网络,获得该分支网络的测试集分类概率;
输入的掩码图片序列色彩空间为红R、绿G、蓝B,其中掩码部分的颜色为统一的颜色。将掩码图片序列按照输入格式统一处理,并输入到3D卷积神经网络中,进行训练,获取图片序列在时间序列上和空间的双重信息。通过3D卷积与3D池化,经过全连接层和Softmax层,构建分类网络,从而得到各行为分类的概率。
作为一种可选方式,本实施例使用的3D卷积神经网络模型如图3所示,共有8个卷积层,6个池化层和1个全连接层以及Softmax层。该网络模型的输入为处理后的视频帧序列,输出为行为识别的分类概率。
S41:将切分完成的原始视频帧图片序列输入3D卷积神经网络进行训练,并得到该分支网络的测试集分类概率;
将原始的图片序列直接输入进3D卷积神经网络并训练该神经网络,依次经过卷积,池化,全连接层和Softmax层,得到特征图和时间空间信息,并得到测试集的分类概率。该3D卷积神经网络中第I层卷积核表示为WI×HI×XI,XI为第I层中输入的图片序列数,WI×HI对应为第I层空间中的长宽大小。此处的3D卷积神经网络模型具体结构见图3。
S51:将所得到的两分支网络的分类概率进行SVM模型训练,并得到最终的测试集检测结果。
获取两分支神经网络的训练后测试集分类概率,总神经网络的两分支依次为经过图像增强的3D卷积神经网络和原始训练集图片训练而得的3D卷积神经网络。将分类的概率进行SVM模型的训练或权重融合来获取最终概率,其中,权重融合的方法类似有最大融合,最小融合和平均值融合等。
本实施例中,通过采用SVM模型的训练,获得最终概率;SVM模型法通过分类概率与对应标签进行学习,得到最优权重,最终识别概率计算方式为:
Figure BDA0001976519600000071
其中:P为样本的最终预测概率,
Figure BDA0001976519600000072
为第I个样本在第一分支上的概率,
Figure BDA0001976519600000073
为第I个样本在第二分支上的概率,w1和w2分别为训练SVM模型得到的最优权重。通过上述方法,取输出概率最大的类别作为每个样本的最终识别结果。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:ROM、RAM、磁盘或光盘等。
以上所举实施例,对本发明的目的、技术方案和优点进行了进一步的详细说明,所应理解的是,以上所举实施例仅为本发明的优选实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内对本发明所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.基于图像增强和3D卷积神经网络的视频行为识别方法,其特征在于,包括以下步骤:
S1:将输入的原始视频序列切分成帧,对各个帧图片进行预处理,并将其分别划分至训练集与测试集;
S2:将训练集图片输入行为区域增强网络进行训练,获得相应的掩码处理后图片,从而得到人物行为信息增强的图像;
S3:使用掩码处理后的图片序列训练第一3D卷积神经网络;输入测试集图片,获得第一分支网络的测试集分类概率;
S4:将训练集图片输入第二3D卷积神经网络进行训练;输入测试集图片,得到该第二分支网络的测试集分类概率;
S5:将所得到的两分支网络的分类概率进行支持向量机模型训练,并得到最终的测试集检测结果。
2.根据权利要求1所述的基于图像增强和3D卷积神经网络的视频行为识别方法,其特征在于:步骤S1包括将原始视频序列按照时间顺序切分成帧,即切分为时间上连续分布的图片序列;将切分好的图片序列调整为适合3D卷积神经网络训练的统一图片格式。
3.根据权利要求1所述的基于图像增强和3D卷积神经网络的视频行为识别方法,其特征在于:步骤S2具体包括对图片序列中的人物行为区域进行掩码处理,增强图片中的行为动作信息;将图片序列当中的动作区域进行识别,并进行像素级标注处理,利用图像处理方法得到目标图片;将切分完成的原始视频帧图片序列输入行为区域增强网络进行训练,以最小化行为区域增强网络的损失函数为目标,进行像素级的分类和掩码处理,获得相应的掩码处理后图片,从而得到人物行为信息增强的图像。
4.根据权利要求3所述的基于图像增强和3D卷积神经网络的视频行为识别方法,其特征在于:所述行为区域增强网络的损失函数计算包括:
Loss=Lcls+Lseg
Figure FDA0002543237920000021
其中,Loss表示总损失函数,Lcls表示分类的损失函数,Lseg表示切分的损失函数,CE(θ)表示交叉熵损失函数,yi表示第i个训练集图片的标签,N表示训练集图像的总数;
Figure FDA0002543237920000022
表示估计值,即预测出的标签。
5.根据权利要求1所述的基于图像增强和3D卷积神经网络的视频行为识别方法,其特征在于:步骤S3具体包括输入的掩码图片序列色彩空间为红R、绿G、蓝B,其中掩码部分的颜色为统一的颜色;将掩码图片序列按照输入格式统一标准化处理,并输入到3D卷积神经网络中,进行训练,获取该图片序列在时间序列上和空间序列的双重信息;通过3D卷积与3D池化,经过全连接层和Softmax层,构建分类网络,从而得到各行为分类的概率。
6.根据权利要求1所述的基于图像增强和3D卷积神经网络的视频行为识别方法,其特征在于:步骤S4具体包括将训练集图片直接输入进3D卷积神经网络并训练该卷积神经网络,依次经过3D卷积,3D池化,全连接层和Softmax层,得到其特征图和在时间序列上和空间序列的双重信息;输入测试集图片,得到测试集的分类概率;其中,该3D卷积神经网络中第I层卷积核表示为WI×HI×XI,XI为第I层中输入的图片序列数,WI×HI对应为第I层空间中的长宽大小。
7.根据权利要求1所述的基于图像增强和3D卷积神经网络的视频行为识别方法,其特征在于:步骤S5具体包括获取两分支神经网络训练后的测试集分类概率,总神经网络的两分支依次为经过图像增强的3D卷积神经网络和原始图片训练而得的3D卷积神经网络;将分类的概率进行支持向量机模型的训练或根据权重融合来获取最终概率;所述权重融合的方法包括最大值融合,最小值融合和平均值融合;支持向量机模型法通过各个分类概率与对应标签进行学习,得到最优权重,最终识别概率计算方式包括为:
Figure FDA0002543237920000031
其中,P为样本的最终预测概率,
Figure FDA0002543237920000032
为第I个样本在第一分支上的概率,即使用掩码处理后的图片序列训练3D卷积神经网络分支;
Figure FDA0002543237920000033
为第I个样本在第二分支上的概率,即使用训练集图片训练3D卷积神经网络分支;w1和w2分别为训练支持向量机模型得到的最优权重;取输出概率最大的类别作为每个样本的最终识别结果。
CN201910134439.6A 2019-02-23 2019-02-23 基于图像增强与3d卷积神经网络的视频行为识别方法 Active CN109829443B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910134439.6A CN109829443B (zh) 2019-02-23 2019-02-23 基于图像增强与3d卷积神经网络的视频行为识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910134439.6A CN109829443B (zh) 2019-02-23 2019-02-23 基于图像增强与3d卷积神经网络的视频行为识别方法

Publications (2)

Publication Number Publication Date
CN109829443A CN109829443A (zh) 2019-05-31
CN109829443B true CN109829443B (zh) 2020-08-14

Family

ID=66864265

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910134439.6A Active CN109829443B (zh) 2019-02-23 2019-02-23 基于图像增强与3d卷积神经网络的视频行为识别方法

Country Status (1)

Country Link
CN (1) CN109829443B (zh)

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110152301B (zh) * 2019-06-18 2022-12-16 金陵科技学院 一种电子竞技游戏数据获取方法
CN110348322A (zh) * 2019-06-19 2019-10-18 西华师范大学 基于多特征融合的人脸活体检测方法及设备
CN112199564A (zh) * 2019-07-08 2021-01-08 Tcl集团股份有限公司 一种信息过滤方法、装置及终端设备
CN112507760B (zh) * 2019-09-16 2024-05-31 杭州海康威视数字技术股份有限公司 暴力分拣行为的检测方法、装置及设备
CN110991219B (zh) * 2019-10-11 2024-02-06 东南大学 一种基于双路3d卷积网络的行为识别方法
CN111047532B (zh) * 2019-12-06 2020-12-29 广东启迪图卫科技股份有限公司 一种基于3d卷积神经网络的低照度视频增强方法
CN111325140A (zh) * 2020-02-18 2020-06-23 南京航空航天大学 一种红外视频序列行为识别方法及装置
CN111339892B (zh) * 2020-02-21 2023-04-18 青岛联合创智科技有限公司 一种基于端到端3d卷积神经网络的泳池溺水检测方法
CN111310050B (zh) * 2020-02-27 2023-04-18 深圳大学 一种基于多层注意力的推荐方法
CN111476727B (zh) * 2020-03-26 2023-04-25 南京信息工程大学 一种面向换脸视频检测的视频运动增强方法
CN113536032A (zh) * 2020-04-10 2021-10-22 天津职业技术师范大学(中国职业培训指导教师进修中心) 一种视频序列信息挖掘***、方法及其应用
CN111553209B (zh) * 2020-04-15 2023-05-12 同济大学 一种基于卷积神经网络和时间序列图的司机行为识别方法
CN113627221A (zh) * 2020-05-09 2021-11-09 阿里巴巴集团控股有限公司 图像处理方法、装置、电子设备及计算机可读存储介质
CN113298248B (zh) * 2020-07-20 2024-06-18 阿里巴巴集团控股有限公司 一种针对神经网络模型的处理方法、装置以及电子设备
CN112115876A (zh) * 2020-09-21 2020-12-22 四川弘和通讯有限公司 一种基于3d卷积神经网络的水溶法实验过程识别方法
CN112966541B (zh) * 2020-09-23 2023-12-05 北京豆牛网络科技有限公司 果蔬自动验货方法、***、电子设备以及计算机可读介质
CN112132089A (zh) * 2020-09-28 2020-12-25 天津天地伟业智能安全防范科技有限公司 一种基于3d卷积和光流的挖掘机行为分析方法
CN116158088A (zh) * 2020-09-29 2023-05-23 华为技术有限公司 固态成像设备
CN112257643A (zh) * 2020-10-30 2021-01-22 天津天地伟业智能安全防范科技有限公司 一种基于视频流的抽烟行为和打电话行为识别方法
CN113033276B (zh) * 2020-12-01 2022-05-17 神思电子技术股份有限公司 一种基于转换模块的行为识别方法
CN112634147B (zh) * 2020-12-09 2024-03-29 上海健康医学院 自监督学习的pet图像降噪方法、***、装置及介质
CN112580523A (zh) * 2020-12-22 2021-03-30 平安国际智慧城市科技股份有限公司 行为识别方法、装置、设备及存储介质
CN112613428B (zh) * 2020-12-28 2024-03-22 易采天成(郑州)信息技术有限公司 基于平衡损失的Resnet-3D卷积牛视频目标检测方法
CN112699786B (zh) * 2020-12-29 2022-03-29 华南理工大学 一种基于空间增强模块的视频行为识别方法及***
CN112712126B (zh) * 2021-01-05 2024-03-19 南京大学 一种图片识别方法
CN112669452B (zh) * 2021-01-08 2022-07-29 天津大学 一种基于卷积神经网络多分支结构的物体定位方法
CN113095359B (zh) * 2021-03-05 2023-09-12 西安交通大学 一种射线图像标记信息检测方法及***
CN113627460B (zh) * 2021-06-18 2023-08-18 中国人民解放军军事科学院国防科技创新研究院 一种基于时间切片卷积神经网络的目标识别***与方法
CN113642429B (zh) * 2021-07-29 2023-07-14 海南大学 一种基于tpp-tccnn的海洋鱼类识别方法
CN113807194B (zh) * 2021-08-24 2023-10-10 哈尔滨工程大学 一种增强性电力传输线故障图像识别方法
CN114249244B (zh) * 2022-03-02 2022-07-05 聚时科技(江苏)有限公司 一种用于自动行车闭环控制的无标靶吊具定位方法
CN114973061B (zh) * 2022-04-24 2023-06-23 哈尔滨工程大学 基于深度学习方法的辅助抗沉决策模型生成方法及***
CN115242454B (zh) * 2022-06-27 2023-05-12 中国电子科技集团公司第三十研究所 一种实时视频数据完整性保护方法及***
CN116705252B (zh) * 2023-06-16 2024-05-31 脉得智能科技(无锡)有限公司 ***癌诊断模型的构建方法、图像分类方法、设备、介质
CN117038055B (zh) * 2023-07-05 2024-04-02 广州市妇女儿童医疗中心 一种基于多专家模型的疼痛评估方法、***、装置及介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108780519A (zh) * 2016-03-11 2018-11-09 奇跃公司 卷积神经网络中的结构学习
CN108986050A (zh) * 2018-07-20 2018-12-11 北京航空航天大学 一种基于多分支卷积神经网络的图像和视频增强方法
CN109242860A (zh) * 2018-08-21 2019-01-18 电子科技大学 基于深度学习及权重空间集成的脑肿瘤图像分割方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8886283B1 (en) * 2011-06-21 2014-11-11 Stc.Unm 3D and 4D magnetic susceptibility tomography based on complex MR images
CN105160310A (zh) * 2015-08-25 2015-12-16 西安电子科技大学 基于3d卷积神经网络的人体行为识别方法
CN108510535B (zh) * 2018-03-14 2020-04-24 大连理工大学 一种基于深度预测和增强子网络的高质量深度估计方法
CN109284720A (zh) * 2018-09-28 2019-01-29 大连民族大学 度量视频连续帧与其卷积特征图间差异在视频行为识别中的应用

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108780519A (zh) * 2016-03-11 2018-11-09 奇跃公司 卷积神经网络中的结构学习
CN108986050A (zh) * 2018-07-20 2018-12-11 北京航空航天大学 一种基于多分支卷积神经网络的图像和视频增强方法
CN109242860A (zh) * 2018-08-21 2019-01-18 电子科技大学 基于深度学习及权重空间集成的脑肿瘤图像分割方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Multi-view gait recogniton using 3D convolutional neural networks;Thomas Wolf et al.;《IEEE》;20160819;第4165-4169页 *

Also Published As

Publication number Publication date
CN109829443A (zh) 2019-05-31

Similar Documents

Publication Publication Date Title
CN109829443B (zh) 基于图像增强与3d卷积神经网络的视频行为识别方法
CN108537743B (zh) 一种基于生成对抗网络的面部图像增强方法
CN106682108B (zh) 一种基于多模态卷积神经网络的视频检索方法
Wang et al. Multi-scale dilated convolution of convolutional neural network for crowd counting
CN104050471B (zh) 一种自然场景文字检测方法及***
Lei et al. A universal framework for salient object detection
Jiang et al. Learning multi-level density maps for crowd counting
CN111639544A (zh) 基于多分支跨连接卷积神经网络的表情识别方法
CN111832443B (zh) 一种施工违规行为检测模型的构建方法及其应用
CN109815867A (zh) 一种人群密度估计和人流量统计方法
CN109993269B (zh) 基于注意力机制的单张图像人群计数方法
CN113536972B (zh) 一种基于目标域伪标签的自监督跨域人群计数方法
CN111582095B (zh) 一种轻量级行人异常行为快速检测方法
WO2019114145A1 (zh) 监控视频中人数检测方法及装置
CN111027377B (zh) 一种双流神经网络时序动作定位方法
CN111639564A (zh) 一种基于多注意力异构网络的视频行人重识别方法
CN110163286A (zh) 一种基于混合池化的领域自适应图像分类方法
Hu et al. Parallel spatial-temporal convolutional neural networks for anomaly detection and location in crowded scenes
CN114627269A (zh) 一种基于深度学***台
CN111476727B (zh) 一种面向换脸视频检测的视频运动增强方法
CN114463340B (zh) 一种边缘信息引导的敏捷型遥感图像语义分割方法
CN113221770A (zh) 基于多特征混合学习的跨域行人重识别方法及***
Zhu et al. A hybrid algorithm for automatic segmentation of slowly moving objects
CN109002808B (zh) 一种人体行为识别方法及***
Zhang et al. Dual attention residual group networks for single image deraining

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant