CN110363204A - 一种基于多任务特征学习的对象表示方法 - Google Patents

一种基于多任务特征学习的对象表示方法 Download PDF

Info

Publication number
CN110363204A
CN110363204A CN201910548683.7A CN201910548683A CN110363204A CN 110363204 A CN110363204 A CN 110363204A CN 201910548683 A CN201910548683 A CN 201910548683A CN 110363204 A CN110363204 A CN 110363204A
Authority
CN
China
Prior art keywords
network
feature
layer
fusion
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910548683.7A
Other languages
English (en)
Inventor
颜成钢
王廷宇
赵崇宇
万斌
孙垚棋
张继勇
张勇东
蒋云良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Dianzi University
Original Assignee
Hangzhou Dianzi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Dianzi University filed Critical Hangzhou Dianzi University
Priority to CN201910548683.7A priority Critical patent/CN110363204A/zh
Publication of CN110363204A publication Critical patent/CN110363204A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种基于多任务特征学习的对象表示方法。本发明的方法,在终端采用深度神经网络对特征进行提取,减少了传输视频的数据量,加快了传输速度,减少了存储空间占有量;在云端由计算机进行对象的分析和恢复,减少了人力成本的投入,同时提高了事件处理效率;且能够实现多个任务同时进行,联合优化的效果。本发明本发明采用人工智能神经网络方法,通过对原视频图像进行特征提取,减少传输数据量,再通过特征计算,实现智能分析,并且利用转置卷积技术,实现图像的还原,大大提高了事件的处理速度,并节省了资金。

Description

一种基于多任务特征学习的对象表示方法
技术领域
本发明涉及计算机图形学与多媒体领域,尤其涉及大数据下视频对象的传输和分析。
背景技术
近年来,随着我国经济的迅速发展,城市公共安全建设显得尤为重要,视频监控摄像头已经在全国范围内大规模部署,并且其规模仍在进一步飞速增长,智慧安检成为实现公共安全防范的一个重要手段。据统计,我国“平安城市”建设工程已在全国660多个城市建成了全世界上最大的涵盖我国主要街道、区、市、省和中央在内的五级安防监控网络。
尽管如此,我国主要人口密集的大城市在面临日益严峻的重大刑事犯罪、公共安全危险事件或者复杂民事纠纷时,由于存在的视频数据量巨大、数据类型繁多且价值密度低等问题,造成事件处理速度过慢等严重问题,难以满足公共安防的实时报警和快速响应的需求。故急需从“人工取证,低效传输”的小范围被动监控转型为“智能分析,高效编码”主动监控的根本性转变。
随着科技的发展,深度神经网络已经在对象检测、区域分割、超分辨率图像恢复和场景理解等领域取得了显著的成果,深度学习的方法,灵感来源于人脑的神经元和深层感知机制,通过多层卷积核自动生成更具判别力的图像区域特征描述,相比传统人为构建描述符提取特征,能得到更为全面的特征表示,现已在各个领域研究中,逐步替代了人为构建特征描述符。
因此,利用深度神经网络,设计一种基于多任务特征的对象表示,使大规模视频数据能够实现终端(摄像机)到云端(中心数据库)的快速传输以及智能分析显得尤为重要。
发明内容
本发明提出一种基于多任务特征学习的对象表示方法。该方法可以提高端云之间视频数据传输速度,并且实现视频的智能分析。
本发明的输入为所要分析的视频的显著前景对象,其由终端设备采集并经过处理传入云端,在云端对对象数据进行复原和分析等多任务操作。
传统方法对于多任务,一般采用分步处理的方式,首先将所有视频数据通过传统的视频编码方式传入云端数据库,后由人为进行观察和判断,这样既增加了人力成本,又增加了物力成本,且效率较低。相比于传统方法,本发明的方法,在终端采用深度神经网络对特征进行提取,减少了传输视频的数据量,加快了传输速度,减少了存储空间占有量;在云端由计算机进行对象的分析和恢复,减少了人力成本的投入,同时提高了事件处理效率;且能够实现多个任务同时进行,联合优化的效果。
本发明方法的网络主要由三个部分组成:
(1)首先是视频显著性对象特征提取网络,此网络又由两个子网络构成:一个浅层卷积网络,此网络在减少图像大小的同时,可以保证丰富的空间信息,更有利于图像在云端的重构;另一个为深层残差网络,此网络提取的高维度特征更有利于图像在云端的分析。
(2)其次是自监督转置卷积图像生成网络,由于图片对象在终端进行了特征提取等操作,使对象在主要特征存留的同时,局部细节特征损失严重,以不足以进行直观可视化,此网络采用上采样的手段为实现重要视频数据的可视化存档提供重要保障。
(3)最后是视频对象分析网络,此网络对输入视频中是显著性对象进行快速智能分析,以提高事件处理速度。
一种基于多任务的特征对象表示方法,该方法具体包括以下步骤:
步骤1:将提取好的视频显著性对象分别输入到对象特征提取网络的两个子网络,其中浅层卷积网络有三层,每层都对对象图片进行卷积、批归一化和激活处理;深层残差网络为resnet101网络,深层网络通过卷积、池化、激活的操作对视频显著性对象进行高维度特征提取;
步骤2:将步骤1中的深层残差网络中的16倍下采样和32倍下采样后的特征,分别采用空间金字塔池化或上采样的方式进行处理,获得深层特征,再将深层特征与步骤1中的浅层卷积网络进行特征融合,融合过程中,首先将特征进行合并,然后过一个卷积层对融合特征进行特征维度的压缩;
步骤3:将压缩后的融合特征进行时空结构化编码,并通过网络从终端设备传输到云端中心数据库中,此步骤在离线训练过程中不参与训练,当网络训练完成后,在实际上线使用过程中,才会正式使用;
步骤4:将步骤2中得到的压缩后的融合特征输入自监督转置卷积图像生成网络进行转置卷积处理,直至恢复成原图像大小,终端的特征提取造成恢复后的图像,局部细节特征损失严重,故再次采用原输入视频显著性对象进行自监督学习,实现像素级的图像重建;
步骤5:将步骤2中得到的压缩后的融合特征输入视频对象分析网络,在网络中对融合特征进一步进行卷积和全连接处理,使其变为一维特征,再对一维特征通过监督学习的方式进行训练,实现对象分类、目标重识别等任务;
步骤6:将前面分别训练好的三个网络再次联合训练,进行优化调参;所述的三个网络包括对象特征提取网络、自监督转置卷积图像生成网络、视频对象分析网络。
本发明的有益效果是:
针对现阶段公共安防视频数据量庞大,造成在处理事件时,采用传统“人工取证,低效传输”方式,既耗费人力物力,又难以进行高效处理等问题。本发明采用人工智能神经网络方法,通过对原视频图像进行特征提取,减少传输数据量,再通过特征计算,实现智能分析,并且利用转置卷积技术,实现图像的还原,大大提高了事件的处理速度,并节省了资金。
附图说明
图1是多任务特征学习的网络结构图;
具体实施方式
下面根据附图详细说明本发明,本发明的目的和效果将变得更加明显。
本发明提出基于多任务特征学习的对象表示方法,其整体网络流程图如图1所示,具体步骤如下:
步骤1:将提取好的视频显著性对象分别输入到对象特征提取网络的两个子网络,其中浅层卷积网络有三层,每层都对对象图片进行卷积、批归一化和激活处理,从而在减少数据量的同时获得丰富的空间信息;深层残差网络为resnet101网络,深层网络通过卷积、池化、激活等操作对视频对象进行高维度特征提取。假设输入的对象大小为512*512,浅层卷积网络的卷积核为3*3,padding为1,步长为2,经过第一个卷积层的输出为256*256*64,经过第二层后的输出为128*128*128,经过第三层后的输出为64*64*256;resnet101为已成熟的标准网络,网络结构不再赘述。
步骤2:将步骤1中的深层残差网络中的16倍下采样和32倍下采样后的特征分别采用空间金字塔池化或上采样的方式进行处理,再与步骤1中的浅层卷积网络进行特征融合,融合过程中,首先将左右两边特征进行合并,而后经过一个卷积层进行特征维度的压缩。同步骤一假设相同,当输入对象大小为512*512时,其16倍下采样和32倍下采样图像得到特征图大小分别为32*32和16*16,在特征融合时,特征图大小不同,故在此通过上采样的方式(若深度残差网络16倍下采样和32倍下采样得到特征图谱大于浅层卷积网络第三层的输出,则采用金字塔池化方式处理)将特征图扩展到64*64,后与浅层卷积网络的输出特征图进行叠加得到64*64*3076的特征图谱,再经过一个卷积层,将此特征图谱压缩到64*64*32后,进行步骤三的传输,此时的数据量比原来减少了6倍左右。
步骤3:将压缩后的特征进行时空结构化编码,并通过网络从终端设备传输到云端中心数据库中,此步骤在离线训练过程中不参与训练,当网络训练完成后,在实际上线使用过程中,才会正式使用。
步骤4:将步骤2中得到的特征输入自监督转置卷积图像生成网络进行转置卷积处理,直至恢复成原图像大小,终端的特征提取造成恢复后的图像,局部细节特征损失严重,故再次采用原输入视频显著性对象进行自监督学习,实现像素级的图像重建。自监督学习的网络损失函数设计为:
FL(pt)=-(1-pt)γlog(pt)
式中,pt为输出像素点预测为标签像素点的概率,当pt越大,说明输出与标签像素点越接近,而在前景对象重建的过程中,主要的是对象不同像素块之间的边界像素点的重建,称之为难重建像素,而在像素块之内的样本,称之为易重建像素;相比较普通的交叉熵损失函数,此网络损失函数为在其基础上加入(1-pt)γ的权重函数,γ为大于0的常数。此权重函数使易重建像素点在损失函数中所占比例缩小,而难重建点所占的比例增大,从而增强了网络的重建能力。
步骤5:将步骤2中得到的特征输入视频对象分析网络,在网络中对特征进一步进行卷积和全连接处理,使其变为一维特征,再对一维特征通过监督学习的方式进行训练,实现对象分类、目标重识别等任务。由于对事件进行处理,首先要对视频对象进行分类和寻找事发目标,故以分类和目标重识别为例进行说明,在网络中,将一维特征向量通过Softmax函数进行处理,处理过后的向量再分别输入到分类子网络和度量子网络。分类子网络采用交叉熵损失函数,结合目标对象输出的预测值与标签来训练网络,实现云端数据库中目标对象类与非目标对象类的分类;度量子网络则采用难样本采样三元组损失,其损失函数可表示为:
设目标对象为正样本,其余为负样本,m*k为训练批次中样本的总数量,α是人为设定的阈值参数,该损失函数计算a和batch中的每一张图片在特征空间的欧式距离,然后选出与a距离最远(最不像)的正样本p和距离最近的负样本n来计算三元组损失。通过尽可能尽可能减少损失函数误差值来达到重识别出数据库中的具体目标对象的目的。
步骤6:将前面分别训练好的重建网络和智能分析网络再次联合训练,进行优化调参,使网络能更好实现其任务。

Claims (4)

1.一种基于多任务特征学习的对象表示方法,其特征在于输入为所要分析的视频显著对象,其由终端设备采集并经过处理传入云端,在终端采用深度神经网络对特征进行提取;在云端对对象数据进行复原和分析;具体实现步骤如下:
步骤1:将提取好的视频显著性对象分别输入到对象特征提取网络的两个子网络,其中浅层卷积网络有三层,每层都对对象图片进行卷积、批归一化和激活处理;深层残差网络为resnet101网络,深层网络通过卷积、池化、激活的操作对视频显著性对象进行高维度特征提取;
步骤2:将步骤1中的深层残差网络中的16倍下采样和32倍下采样后的特征,分别采用空间金字塔池化或上采样的方式进行处理,获得深层特征,再将深层特征与步骤1中的浅层卷积网络进行特征融合,融合过程中,首先将特征进行合并,然后过一个卷积层对融合特征进行特征维度的压缩;
步骤3:将压缩后的融合特征进行时空结构化编码,并通过网络从终端设备传输到云端中心数据库中,此步骤在离线训练过程中不参与训练,当网络训练完成后,在实际上线使用过程中,才会正式使用;
步骤4:将步骤2中得到的压缩后的融合特征输入自监督转置卷积图像生成网络进行转置卷积处理,直至恢复成原图像大小,终端的特征提取造成恢复后的图像,局部细节特征损失严重,故再次采用原输入视频显著性对象进行自监督学习,实现像素级的图像重建;
步骤5:将步骤2中得到的压缩后的融合特征输入视频对象分析网络,在网络中对融合特征进一步进行卷积和全连接处理,使其变为一维特征,再对一维特征通过监督学习的方式进行训练,实现对象分类、目标重识别等任务;
步骤6:将前面分别训练好的三个网络再次联合训练,进行优化调参;所述的三个网络包括对象特征提取网络、自监督转置卷积图像生成网络、视频对象分析网络。
2.根据权利要求1所述的一种基于多任务特征学习的对象表示方法,其特征在于步骤1中输入的视频显著性对象大小为512*512,浅层卷积网络的卷积核为3*3,padding为1,步长为2,经过第一个卷积层的输出为256*256*64,经过第二层后的输出为128*128*128,经过第三层后的输出为64*64*256;resnet101为已成熟的标准网络,网络结构不再赘述。
3.根据权利要求1所述的一种基于多任务特征学习的对象表示方法,其特征在于自监督学习的网络损失函数设计为:
FL(pt)=-(1-pt)γlog(pt)
式中,pt为输出像素点预测为标签像素点的概率,当pt越大,说明输出与标签像素点越接近,而在前景对象重建的过程中,主要的是对象不同像素块之间的边界像素点的重建,称之为难重建像素,而在像素块之内的样本,称之为易重建像素;相比较普通的交叉熵损失函数,此网络损失函数为在其基础上加入(1-pt)γ的权重函数,γ为大于0的常数。
4.根据权利要求3所述的一种基于多任务特征学习的对象表示方法,其特征在于步骤5中具体实现如下:首先对视频对象进行分类和寻找事发目标,在网络中,将一维特征向量通过Softmax函数进行处理,处理过后的向量再分别输入到分类子网络和度量子网络;分类子网络采用交叉熵损失函数,结合目标对象输出的预测值与标签来训练网络,实现云端数据库中目标对象类与非目标对象类的分类;度量子网络则采用难样本采样三元组损失,其损失函数可表示为:
设目标对象为正样本,其余为负样本,m*k为训练批次中样本的总数量,α是人为设定的阈值参数,该损失函数计算a和batch中的每一张图片在特征空间的欧式距离,然后选出与a距离最远的正样本p和距离最近的负样本n来计算三元组损失。
CN201910548683.7A 2019-06-24 2019-06-24 一种基于多任务特征学习的对象表示方法 Pending CN110363204A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910548683.7A CN110363204A (zh) 2019-06-24 2019-06-24 一种基于多任务特征学习的对象表示方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910548683.7A CN110363204A (zh) 2019-06-24 2019-06-24 一种基于多任务特征学习的对象表示方法

Publications (1)

Publication Number Publication Date
CN110363204A true CN110363204A (zh) 2019-10-22

Family

ID=68216779

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910548683.7A Pending CN110363204A (zh) 2019-06-24 2019-06-24 一种基于多任务特征学习的对象表示方法

Country Status (1)

Country Link
CN (1) CN110363204A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110766096A (zh) * 2019-10-31 2020-02-07 北京金山云网络技术有限公司 视频分类方法、装置及电子设备
CN111461130A (zh) * 2020-04-10 2020-07-28 视研智能科技(广州)有限公司 一种高精度图像语义分割算法模型及分割方法
CN111510774A (zh) * 2020-04-21 2020-08-07 济南浪潮高新科技投资发展有限公司 一种结合边缘计算与深度学习的智能终端图像压缩算法
CN112330662A (zh) * 2020-11-25 2021-02-05 电子科技大学 一种基于多层级神经网络的医学图像分割***及方法
CN112348914A (zh) * 2020-11-12 2021-02-09 中国科学院合肥物质科学研究院 一种基于车联网的深度学习图像压缩感知算法及***
CN112381107A (zh) * 2021-01-13 2021-02-19 湖南苏科智能科技有限公司 基于深度学习的物品x光检测方法、装置和计算机设备
WO2021050007A1 (en) * 2019-09-11 2021-03-18 Nanyang Technological University Network-based visual analysis
CN112528059A (zh) * 2021-02-08 2021-03-19 南京理工大学 基于深度学习的交通目标图像检索方法、装置及可读介质
CN114863138A (zh) * 2022-07-08 2022-08-05 腾讯科技(深圳)有限公司 图像处理方法、装置、存储介质及设备
CN116740384A (zh) * 2023-06-15 2023-09-12 东莞市商斯迈智能科技有限公司 洗地机的智能控制方法及***

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107240066A (zh) * 2017-04-28 2017-10-10 天津大学 基于浅层和深层卷积神经网络的图像超分辨率重建算法
CN108764207A (zh) * 2018-06-07 2018-11-06 厦门大学 一种基于多任务卷积神经网络的人脸表情识别方法
CN109034268A (zh) * 2018-08-20 2018-12-18 北京林业大学 一种面向信息素诱捕器的红脂大小蠹检测器优化方法
CN109919097A (zh) * 2019-03-08 2019-06-21 中国科学院自动化研究所 基于多任务学习的人脸和关键点联合检测***、方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107240066A (zh) * 2017-04-28 2017-10-10 天津大学 基于浅层和深层卷积神经网络的图像超分辨率重建算法
CN108764207A (zh) * 2018-06-07 2018-11-06 厦门大学 一种基于多任务卷积神经网络的人脸表情识别方法
CN109034268A (zh) * 2018-08-20 2018-12-18 北京林业大学 一种面向信息素诱捕器的红脂大小蠹检测器优化方法
CN109919097A (zh) * 2019-03-08 2019-06-21 中国科学院自动化研究所 基于多任务学习的人脸和关键点联合检测***、方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
QIAN ZHANG等: "FRNET: FLATTENED RESIDUAL NETWORK FOR INFANT MRI SKULL STRIPPING", 《ARXIV》 *
XIAOLIANG WANG等: "Focal Loss Dense Detector for Vehicle Surveillance", 《ARXIV》 *
帅气的小王子: "CSDN :https://blog.csdn.net/u010333076/article/details/52291216", 《HYPERFACE: A DEEP MULTI-TASK LEARNING FRAMEWORK FOR FACE DETECTION, LANDMARK LOCALIZATION,,POSE ESTIMATION, AND GENDER RECOGNITION》 *
雷锋网: "基于深度学习的行人重识别研究综述(上)", 《搜狐:HTTPS://WWW.SOHU.COM/A/211707058_114877》 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021050007A1 (en) * 2019-09-11 2021-03-18 Nanyang Technological University Network-based visual analysis
CN110766096A (zh) * 2019-10-31 2020-02-07 北京金山云网络技术有限公司 视频分类方法、装置及电子设备
CN110766096B (zh) * 2019-10-31 2022-09-23 北京金山云网络技术有限公司 视频分类方法、装置及电子设备
CN111461130B (zh) * 2020-04-10 2021-02-09 视研智能科技(广州)有限公司 一种高精度图像语义分割算法模型及分割方法
CN111461130A (zh) * 2020-04-10 2020-07-28 视研智能科技(广州)有限公司 一种高精度图像语义分割算法模型及分割方法
CN111510774A (zh) * 2020-04-21 2020-08-07 济南浪潮高新科技投资发展有限公司 一种结合边缘计算与深度学习的智能终端图像压缩算法
CN112348914A (zh) * 2020-11-12 2021-02-09 中国科学院合肥物质科学研究院 一种基于车联网的深度学习图像压缩感知算法及***
CN112348914B (zh) * 2020-11-12 2023-08-18 中国科学院合肥物质科学研究院 一种基于车联网的深度学习图像压缩感知方法及***
CN112330662A (zh) * 2020-11-25 2021-02-05 电子科技大学 一种基于多层级神经网络的医学图像分割***及方法
CN112330662B (zh) * 2020-11-25 2022-04-12 电子科技大学 一种基于多层级神经网络的医学图像分割***及方法
CN112381107A (zh) * 2021-01-13 2021-02-19 湖南苏科智能科技有限公司 基于深度学习的物品x光检测方法、装置和计算机设备
CN112528059A (zh) * 2021-02-08 2021-03-19 南京理工大学 基于深度学习的交通目标图像检索方法、装置及可读介质
CN114863138A (zh) * 2022-07-08 2022-08-05 腾讯科技(深圳)有限公司 图像处理方法、装置、存储介质及设备
CN114863138B (zh) * 2022-07-08 2022-09-06 腾讯科技(深圳)有限公司 图像处理方法、装置、存储介质及设备
CN116740384A (zh) * 2023-06-15 2023-09-12 东莞市商斯迈智能科技有限公司 洗地机的智能控制方法及***
CN116740384B (zh) * 2023-06-15 2024-03-29 东莞市商斯迈智能科技有限公司 洗地机的智能控制方法及***

Similar Documents

Publication Publication Date Title
CN110363204A (zh) 一种基于多任务特征学习的对象表示方法
CN108537743B (zh) 一种基于生成对抗网络的面部图像增强方法
CN109389055B (zh) 基于混合卷积和注意力机制的视频分类方法
CN110503112B (zh) 一种增强特征学习的小目标检测及识别方法
CN112541503B (zh) 基于上下文注意力机制和信息融合的实时语义分割方法
CN109598269A (zh) 一种基于多分辨率输入与金字塔膨胀卷积的语义分割方法
CN108805015A (zh) 加权卷积自编码长短期记忆网络人群异常检测方法
Yang et al. Masked relation learning for deepfake detection
CN112699786B (zh) 一种基于空间增强模块的视频行为识别方法及***
CN111488805B (zh) 一种基于显著性特征提取的视频行为识别方法
CN114255474A (zh) 一种基于多尺度、多粒度行人重识别方法
Hongmeng et al. A detection method for deepfake hard compressed videos based on super-resolution reconstruction using CNN
Hu et al. Parallel spatial-temporal convolutional neural networks for anomaly detection and location in crowded scenes
CN112183240A (zh) 一种基于3d时间流和并行空间流的双流卷积行为识别方法
CN114627269A (zh) 一种基于深度学***台
CN116152226A (zh) 基于可融合的特征金字塔的换向器内侧图像缺陷检测方法
CN114913604A (zh) 一种基于两级池化s2e模块的姿态识别方法
CN114220169A (zh) 一种基于Yolo-TSM的轻量级实时监控异常行为检测方法
CN111539434B (zh) 基于相似度的红外弱小目标检测方法
CN113378962A (zh) 一种基于图注意力网络的服装属性识别方法与***
Özyurt et al. A new method for classification of images using convolutional neural network based on Dwt-Svd perceptual hash function
Zhang et al. Lightweight PM-YOLO network model for moving object recognition on the distribution network side
Li et al. A spectral clustering based filter-level pruning method for convolutional neural networks
CN113887371B (zh) 一种用于低分辨率人脸识别的数据增强方法
CN112541469B (zh) 基于自适应分类的人群计数方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20191022

RJ01 Rejection of invention patent application after publication