CN108154194B - 一种用基于张量的卷积网络提取高维特征的方法 - Google Patents

一种用基于张量的卷积网络提取高维特征的方法 Download PDF

Info

Publication number
CN108154194B
CN108154194B CN201810049756.3A CN201810049756A CN108154194B CN 108154194 B CN108154194 B CN 108154194B CN 201810049756 A CN201810049756 A CN 201810049756A CN 108154194 B CN108154194 B CN 108154194B
Authority
CN
China
Prior art keywords
dimensional
separation
convolution
tensor
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810049756.3A
Other languages
English (en)
Other versions
CN108154194A (zh
Inventor
施云惠
崔应炫
丁文鹏
尹宝才
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN201810049756.3A priority Critical patent/CN108154194B/zh
Publication of CN108154194A publication Critical patent/CN108154194A/zh
Application granted granted Critical
Publication of CN108154194B publication Critical patent/CN108154194B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种用基于张量的卷积网络提取高维特征的方法,可应用于多维信号的分类识别场景中。模型核心部分是分离-融合模块,而分离-融合模块则由可分离卷积组件和特征融合组件构成,其中,可分离卷积组件主要由多个可分离卷积层组成,特征融合组件主要由一个多维卷积核组成。那么,整个基于张量的N维卷积模型由多个N维分离-融合模块、池化层和全连接层组成,最后一个最大池化层输出的一组N阶张量通过向量化的操作转成一个向量输入到全连接层中,最终输出一个识别分类的概率向量。本发明所提的网络模型不仅和现有的优秀模型在识别精度上性能相当,并且模型的参数量比它们少很多。

Description

一种用基于张量的卷积网络提取高维特征的方法
技术领域
本发明涉及一种用基于张量的卷积网络提取高维特征的方法,尤其涉及一种基于维度可分离和特征融合的卷积方法,可应用于多维信号的分类识别场景中。
背景技术
深度学习作为机器学习的一个分支,近些年来发展非常迅猛,尤其是在2012年,Krizhevsky等人提出的AlexNet在大型图像数据库ImageNet的图像分类竞赛中以准确度超越第二名11%的巨大优势夺得了冠军,使得卷积神经网络重新成为了学术界的焦点,在此之后,不断有新的卷积神经网络模型被提出,比如Google的GoogLeNet、牛津大学的VGG(Visual Geometry Group)、微软亚洲研究院的ResNet等,这些网络刷新了AlexNet在ImageNet上创造的纪录。并且,卷积神经网络不断与一些传统算法相融合,加上迁移学习方法的引入,使得卷积神经网络的应用领域获得了快速的扩展。从最初较为简单的手写字符识别应用,逐渐扩展到一些更加复杂的领域,如:行人检测、行为识别、人体姿势识别等。这些新的卷积神经网络模型的层数在逐渐加深,网络模型对输入图像的high level特征提取的能力也不断提升,然而这带来了模型参数冗余繁多的问题,这又直接导致了空间复杂度过高、实时性不好的问题,有些学者针对这方面的问题做了一些有意义的研究工作,LeCun等人在2014年NIPS会议上发表了一篇文章,该文章对卷积神经网络的参数冗余性进行研究,提出了卷积神经网络存在一定的线性结构的观点,他们在训练出网络模型之后,又用奇异值分解、低秩逼近等方法通过将卷积核分解后重新训练,在损失少量精度的条件下,大为减少了模型网络的权值参数个数,从而较好地缩短了模型做预测时的实时响应时间,减少了网络模型的空间复杂度,使得将卷积神经网络模型应用于手机、网络等场合成为可能。之后,有学者用张量分解的方法,包括张量的CP分解、Tucker分解,对卷积核进行分解后重新训练,在减少网络模型的时间和空间复杂度方面也取得了较好的效果。
然而,以上的这些网络压缩模型都是服从模型监督的思路,也就是先训练出一个参数冗余的模型,在此基础上再用降维、分解等方法去减少模型参数,实际上就是用一个轻量级的模型去逼近一个冗余的模型,让后者来监督约束前者,需要训练两次,这样的方法应用在二维图像上是没有什么问题的。但随着视频编码、虚拟现实等技术的发展,对于三维、甚至更高维度的图像数据的使用,逐渐流行起来,而这些方法是不能直接应用在高维度的图像数据场景的,因为在高维图像数据上直接训练一个高维卷积神经网络会遇到以下几个问题,(1)要训练的参数量是相当庞大;(2)计算复杂度也非常高;(3)高维样本比较稀缺。这几个问题都加大了训练高维卷积神经网络的难度。因此,需要绕过模型监督的这种思路,从而设计一种针对高维数据,参数量少、计算复杂度低、并且只需训练一次就能得到最终模型的高维卷积网络结构,才是解决高维图像场景上的有效方法。
实际上,多维信号的每个维度对应的物理属性和维度方向分布特性不尽相同,数据内部存在复杂的相关性。而张量是表示高维多维数据的有效工具,理论上,将多维信号组织成张量形式,研究张量空间的建模,才可能揭示多维信号的每个维度对应的物理属性和维度方向分布特性及各个维度间复杂的相关性。本发明采用不同维度的分治和融合策略,提出一种基于张量的卷积神经网络模型,通过该神经网络模型,张量数据不同维度的非线性关系被充分挖掘出来,从而多维信号高维特征也能很好的被提取出来。
深度学习作为机器学习的一个分支,近些年来发展非常迅猛,尤其是在2012年,Krizhevsky等人提出的AlexNet在大型图像数据库ImageNet的图像分类竞赛中以准确度超越第二名11%的巨大优势夺得了冠军,使得卷积神经网络重新成为了学术界的焦点,在此之后,不断有新的卷积神经网络模型被提出,比如Google的GoogLeNet、牛津大学的VGG(Visual Geometry Group)、微软亚洲研究院的ResNet等,这些网络刷新了AlexNet在ImageNet上创造的纪录。并且,卷积神经网络不断与一些传统算法相融合,加上迁移学习方法的引入,使得卷积神经网络的应用领域获得了快速的扩展。从最初较为简单的手写字符识别应用,逐渐扩展到一些更加复杂的领域,如:行人检测、行为识别、人体姿势识别等。这些新的卷积神经网络模型的层数在逐渐加深,网络模型对输入图像的high level特征提取的能力也不断提升,然而这带来了模型参数冗余繁多的问题,这又直接导致了空间复杂度过高、实时性不好的问题,有些学者针对这方面的问题做了一些有意义的研究工作,LeCun等人在2014年NIPS会议上发表了一篇文章,该文章对卷积神经网络的参数冗余性进行研究,提出了卷积神经网络存在一定的线性结构的观点,他们在训练出网络模型之后,又用奇异值分解、低秩逼近等方法通过将卷积核分解后重新训练,在损失少量精度的条件下,大为减少了模型网络的权值参数个数,从而较好地缩短了模型做预测时的实时响应时间,减少了网络模型的空间复杂度,使得将卷积神经网络模型应用于手机、网络等场合成为可能。之后,有学者用张量分解的方法,包括张量的CP分解、Tucker分解,对卷积核进行分解后重新训练,在减少网络模型的时间和空间复杂度方面也取得了较好的效果。
然而,以上的这些网络压缩模型都是服从模型监督的思路,也就是先训练出一个参数冗余的模型,在此基础上再用降维、分解等方法去减少模型参数,实际上就是用一个轻量级的模型去逼近一个冗余的模型,让后者来监督约束前者,需要训练两次,这样的方法应用在二维图像上是没有什么问题的。但随着视频编码、虚拟现实等技术的发展,对于三维、甚至更高维度的图像数据的使用,逐渐流行起来,而这些方法是不能直接应用在高维度的图像数据场景的,因为在高维图像数据上直接训练一个高维卷积神经网络会遇到以下几个问题,(1)要训练的参数量是相当庞大;(2)计算复杂度也非常高;(3)高维样本比较稀缺。这几个问题都加大了训练高维卷积神经网络的难度。因此,需要绕过模型监督的这种思路,从而设计一种针对高维数据,参数量少、计算复杂度低、并且只需训练一次就能得到最终模型的高维卷积网络结构,才是解决高维图像场景上的有效方法。
实际上,多维信号的每个维度对应的物理属性和维度方向分布特性不尽相同,数据内部存在复杂的相关性。而张量是表示高维多维数据的有效工具,理论上,将多维信号组织成张量形式,研究张量空间的建模,才可能揭示多维信号的每个维度对应的物理属性和维度方向分布特性及各个维度间复杂的相关性。本发明采用不同维度的分治和融合策略,提出一种基于张量的卷积神经网络模型,通过该神经网络模型,张量数据不同维度的非线性关系被充分挖掘出来,从而多维信号高维特征也能很好的被提取出来。
发明内容
本发明提出一种通用的利用基于张量的多维卷积轻量化网络提取高维图像数据特征的方案,多维信号的分类识别都可适用于本方案。
本发明涉及一种用基于张量的卷积网络提取高维特征的方法,尤其涉及一种基于维度可分离和特征融合的卷积方法,可应用于多维信号的分类识别场景中。
本发明提出的基于张量的多维卷积模型核心部分是分离-融合模块(SFModule),而分离-融合模块则由可分离卷积组件(separablecomponent)和特征融合组件(fusedcomponent)构成,其中,可分离卷积组件主要由多个可分离卷积层组成,如图1所示,特征融合组件主要由一个多维卷积核组成,如图2所示。那么,整个基于张量的N维卷积模型由多个N维分离-融合模块、池化层和全连接层组成,如图4所示,能够处理N维信号。首先卷积层参数均采用Xavier方法来初始化,当输入N维信号时,在经过每个分离-融合模块时,N维信号先按张量展开操作(按mode展开)展开成N组二维矩阵,每组二维矩阵输入到一个可分离卷积层中,各自执行一系列的一维卷积操作,将所得到的每组二维特征矩阵通过张量折叠操作(unfolding)折叠成一组N阶特征张量,那么每个可分离卷积层输出一组N阶特征张量,每个分离模块就输出N组N阶特征张量,这些N阶张量按照通道数级联起来,输入到融合模块中,经过一个N维的且每个维度的大小为1的卷积核做卷积运算,最终这个分离-融合模块输出一组N阶张量,接着将它们输入到每个维度感受野为2的N维最大池化层中进行下采样,输出一组每个维度大小减半的一组N阶张量,接着这组N阶张量作为新的N维信号输入到下一个分离-融合模块和最大池化层中,经过若干个这样的操作(操作次数与网络模型中所设置的分离-融合模块的个数相同,一般我们设置3到5个分离-融合模块)之后,最后一个最大池化层输出的一组N阶张量通过向量化的操作转成一个向量输入到全连接层中,最终输出一个识别分类的概率向量。
对于不同维度的信号的处理,要相应的选用不同维度的模型,比如,对于四维的光场数据,要用基于张量的四维卷积模型。一般的,整个基于张量的多维卷积模型的参数都通过Xavier方法来初始化,利用批量梯度下降的方法来训练模型参数,当一个N维模型训练结束后,就可以对相应的N维信号进行识别分类。由于分离-融合模块用一系列的一维卷积操作来模拟N维卷积操作,因此,基于张量的多维卷积网络是一种具备处理任何维度的数据的、轻量级的网络。
下面以三维视频信号为例,这里要选用基于张量的三维卷积模型,设定模型有3个分离-融合模块和3个最大池化层以及一个全连接层,所输入的三维视频信号依次经过分离-融合模块1、最大池化层1、分离-融合模块2、最大池化层2、分离-融合模块3、最大池化层3,、全连接层,三维视频信号每经过一个分离-融合模块就得到一组分辨率减半的三维视频信号,这样,最大池化层3就输出一组分辨率为输入信号的1/8的三维视频信号,这些信号经过向量化之后,输入到全连接层,最终模型输出该三维视频信号的识别分类概率向量。
为了验证所提方案的有效性,将所发明的模型和现有的优秀分类识别模型分别在二维图像信号数据库和三维视频信号数据库上做了比较,其中在二维上采用的是Cifar10和Mnist这两个数据集,在三维上采用的KTH数据集。在这两个二维图像数据集上,本发明所提的网络模型不仅和现有的优秀模型在识别精度上性能相当,并且模型的参数量比它们少很多。在三维图像数据集上,本发明所提的模型也达到了出色的识别精度,相比于其他传统的三维卷积模型,本模型更加轻量化。
附图说明
图1可分离卷积层
图2融合组件
图3分离-融合模块
图4基于张量的多维卷积网络
图5:分离-融合模块(SFModule)算法流程图
具体实施方式
1输入的多维信号(N阶张量),依次经过若干个分离-融合模块以及与之对应的池化层,一般地,我们设置三个分离-融合模块,在每个分离-融合模块后面设置一个最大池化层;
2在每个分离-融合模块中,输入的张量数据先按张量展开的操作展开成N个矩阵,每个矩阵被可分离卷积组件提取特征形成N组特征矩阵,对这些矩阵分别通过张量折叠操作可以得到N个N阶张量,接着N阶张量被输入到特征融合模块中,通过融合映射进行特征融合,最后输出一个N阶张量;
3分离-融合模块输出的特征通过最大池化层进行下采样;
4输入数据在经过所有的分离-融合模块和池化层之后,进入全连接层,最后输出识别分类的概率向量。
为了验证所提方案的有效性,将所发明的模型和现有的优秀分类识别模型分别在二维图像信号数据库和三维视频信号数据库上做了比较,其中在二维上采用的是Cifar10和Mnist这两个数据集,在三维上采用的KTH数据集。
Figure BDA0001552012570000071
表1:Cifar10上比较的结果
Figure BDA0001552012570000072
表2:Mnist上比较的结果
在这两个二维图像数据集上,本发明所提的网络模型不仅和现有的优秀模型在识别精度上性能相当,并且模型的参数量比它们少很多。
Figure BDA0001552012570000073
表3:KTH上比较的结果
在三维图像数据集上,本发明所提的模型也达到了出色的识别精度,相比于其他传统的三维卷积模型,本模型更加轻量化。

Claims (1)

1.一种用基于张量的卷积网络提取高维特征的方法,建立基于张量的卷积网络:卷积网络核心部分是分离-融合模块,而分离-融合模块则由可分离卷积组件和特征融合组件构成,其中,可分离卷积组件包括多个可分离卷积层组成,特征融合组件包括一个多维卷积核;整个基于张量的N维卷积模型由多个N维分离-融合模块、池化层和全连接层组成;
首先卷积层参数初始化,当输入N维信号时,在经过每个分离-融合模块时,N维信号先按张量展开操作展开成N组二维矩阵,每组二维矩阵输入到一个可分离卷积层中,各自执行一系列的一维卷积操作,将所得到的每组二维特征矩阵通过张量折叠操作折叠成一组N阶特征张量,那么每个可分离卷积层输出一组N阶特征张量,每个分离模块就输出N组N阶特征张量,这些N阶张量按照通道数级联起来,输入到融合模块中,经过一个N维的且每个维度的大小为1的卷积核做卷积运算,最终这个分离-融合模块输出一组N阶张量,接着将它们输入到每个维度感受野为2的N维最大池化层中进行下采样,输出一组每个维度大小减半的N阶张量,接着这组N阶张量作为新的N维信号输入到下一个分离-融合模块和最大池化层中,经过若干个这样的操作之后,操作次数与网络模型中所设置的分离-融合模块的个数相同;最后一个最大池化层输出的一组N阶张量通过向量化的操作转成一个向量输入到全连接层中,最终输出一个识别分类的概率向量;
其特征在于:当处理三维视频信号时,这里要选用基于张量的三维卷积模型,设定模型有3个分离-融合模块和3个最大池化层以及一个全连接层,所输入的三维视频信号依次经过分离-融合模块1、最大池化层1、分离-融合模块2、最大池化层2、分离-融合模块3、最大池化层3、全连接层,三维视频信号每经过一个最大池化层 就得到一组分辨率减半的三维视频信号,这样,最大池化层3就输出一组分辨率为输入信号的1/8的三维视频信号,这些信号经过向量化之后,输入到全连接层,最终模型输出该三维视频信号的识别分类概率向量。
CN201810049756.3A 2018-01-18 2018-01-18 一种用基于张量的卷积网络提取高维特征的方法 Active CN108154194B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810049756.3A CN108154194B (zh) 2018-01-18 2018-01-18 一种用基于张量的卷积网络提取高维特征的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810049756.3A CN108154194B (zh) 2018-01-18 2018-01-18 一种用基于张量的卷积网络提取高维特征的方法

Publications (2)

Publication Number Publication Date
CN108154194A CN108154194A (zh) 2018-06-12
CN108154194B true CN108154194B (zh) 2021-04-30

Family

ID=62461918

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810049756.3A Active CN108154194B (zh) 2018-01-18 2018-01-18 一种用基于张量的卷积网络提取高维特征的方法

Country Status (1)

Country Link
CN (1) CN108154194B (zh)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109344698B (zh) * 2018-08-17 2021-09-03 西安电子科技大学 基于可分离卷积和硬阈值函数的高光谱波段选择方法
CN110858323B (zh) * 2018-08-23 2024-07-19 京东科技控股股份有限公司 基于卷积的图像处理方法、装置、介质及电子设备
CN109190758B (zh) * 2018-09-04 2021-06-15 地平线(上海)人工智能技术有限公司 用于展开卷积神经网络的张量数据的方法和装置
CN111126558B (zh) * 2018-10-31 2024-04-02 嘉楠明芯(北京)科技有限公司 一种卷积神经网络计算加速方法及装置、设备、介质
CN111160517B (zh) * 2018-11-07 2024-02-06 杭州海康威视数字技术股份有限公司 一种深度神经网络的卷积层量化方法及装置
TWI717655B (zh) 2018-11-09 2021-02-01 財團法人資訊工業策進會 適應多物件尺寸之特徵決定裝置及方法
CN109584244B (zh) * 2018-11-30 2023-05-23 无锡本希奥智能技术有限公司 一种基于序列学习的海马体分割方法
CN109508461A (zh) * 2018-12-29 2019-03-22 重庆猪八戒网络有限公司 基于中文自然语言处理的订单价格预测方法、终端及介质
CN109919013A (zh) * 2019-01-28 2019-06-21 浙江英索人工智能科技有限公司 视频图像中基于深度学习的人脸检测方法及装置
CN109978136B (zh) * 2019-03-05 2020-12-25 厦门美图之家科技有限公司 一种训练目标网络的方法、计算设备及存储介质
CN111832335B (zh) * 2019-04-15 2024-06-14 阿里巴巴集团控股有限公司 数据处理方法、装置及电子设备
CN110245787B (zh) * 2019-05-24 2023-11-17 创新先进技术有限公司 一种目标群体预测方法、装置及设备
CN110210439A (zh) * 2019-06-10 2019-09-06 西北工业大学 基于轻量化三维卷积网络的行为识别方法
CN110334800A (zh) * 2019-07-18 2019-10-15 南京风兴科技有限公司 一种用于视频识别的轻量级3d卷积网络***
CN112257857B (zh) * 2019-07-22 2024-06-04 中科寒武纪科技股份有限公司 张量处理方法及相关产品
CN110598677B (zh) * 2019-10-08 2021-01-26 电子科技大学 一种用于自动调制识别的时空多通道深度学习***
US11170300B2 (en) 2020-01-23 2021-11-09 UMNAI Limited Explainable neural net architecture for multidimensional data
CN112069883B (zh) * 2020-07-28 2024-03-29 浙江工业大学 一种融合一维二维卷积神经网络的深度学习信号分类方法
CN112052687B (zh) * 2020-09-02 2023-11-21 厦门市美亚柏科信息股份有限公司 基于深度可分离卷积的语义特征处理方法、装置及介质
CN113344200B (zh) * 2021-06-17 2024-05-28 阿波罗智联(北京)科技有限公司 用于训练可分离卷积网络的方法、路侧设备及云控平台
WO2023030507A1 (zh) * 2021-09-03 2023-03-09 寒武纪(西安)集成电路有限公司 编译优化方法、装置、计算机设备以及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105160310A (zh) * 2015-08-25 2015-12-16 西安电子科技大学 基于3d卷积神经网络的人体行为识别方法
JP6567381B2 (ja) * 2015-09-30 2019-08-28 株式会社東芝 演算装置、方法及びプログラム
CN105681628B (zh) * 2016-01-05 2018-12-07 西安交通大学 一种卷积网络运算单元及可重构卷积神经网络处理器和实现图像去噪处理的方法
US9836820B2 (en) * 2016-03-03 2017-12-05 Mitsubishi Electric Research Laboratories, Inc. Image upsampling using global and local constraints
CN107578091B (zh) * 2017-08-30 2021-02-05 电子科技大学 一种基于轻量级深度网络的行人车辆实时检测方法

Also Published As

Publication number Publication date
CN108154194A (zh) 2018-06-12

Similar Documents

Publication Publication Date Title
CN108154194B (zh) 一种用基于张量的卷积网络提取高维特征的方法
CN108596039B (zh) 一种基于3d卷积神经网络的双模态情感识别方法及***
CN110188239B (zh) 一种基于跨模态注意力机制的双流视频分类方法和装置
CN110929736B (zh) 多特征级联rgb-d显著性目标检测方法
CN104090972B (zh) 用于三维城市模型检索的图像特征提取和相似性度量方法
Wang et al. NAS-guided lightweight multiscale attention fusion network for hyperspectral image classification
CN108710906B (zh) 基于轻量级网络LightPointNet的实时点云模型分类方法
CN111046821B (zh) 一种视频行为识别方法、***及电子设备
CN112801015B (zh) 一种基于注意力机制的多模态人脸识别方法
CN108960288B (zh) 基于卷积神经网络的三维模型分类方法及***
CN105469050B (zh) 基于局部时空特征描述与金字塔词汇树的视频行为识别方法
CN111723600B (zh) 一种基于多任务学习的行人重识别特征描述子
CN106529586A (zh) 基于补充文本特征的图像分类方法
CN115966010A (zh) 一种基于注意力和多尺度特征融合的表情识别方法
CN114333002A (zh) 基于图深度学习和人脸三维重建的微表情识别方法
CN112906520A (zh) 一种基于姿态编码的动作识别方法及装置
Zhang et al. FCHP: Exploring the discriminative feature and feature correlation of feature maps for hierarchical DNN pruning and compression
Sen et al. Face recognition using deep convolutional network and one-shot learning
CN114863572A (zh) 一种多通道异构传感器的肌电手势识别方法
CN109558880B (zh) 一种基于视觉整体和局部特征融合的轮廓检测方法
Abed et al. Real-time color image classification based on deep learning network
CN113011506A (zh) 一种基于深度重分形频谱网络的纹理图像分类方法
CN116797640A (zh) 一种面向智能伴行巡视器的深度及3d关键点估计方法
Nimbarte et al. Biased face patching approach for age invariant face recognition using convolutional neural network
Li et al. Face recognition algorithm based on multiscale feature fusion network

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant