CN106570474A - 一种基于3d卷积神经网络的微表情识别方法 - Google Patents

一种基于3d卷积神经网络的微表情识别方法 Download PDF

Info

Publication number
CN106570474A
CN106570474A CN201610954555.9A CN201610954555A CN106570474A CN 106570474 A CN106570474 A CN 106570474A CN 201610954555 A CN201610954555 A CN 201610954555A CN 106570474 A CN106570474 A CN 106570474A
Authority
CN
China
Prior art keywords
characteristic pattern
layer
micro
convolutional layer
convolutional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610954555.9A
Other languages
English (en)
Other versions
CN106570474B (zh
Inventor
卢官明
杨成
闫静杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Post and Telecommunication University
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing Post and Telecommunication University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Post and Telecommunication University filed Critical Nanjing Post and Telecommunication University
Priority to CN201610954555.9A priority Critical patent/CN106570474B/zh
Publication of CN106570474A publication Critical patent/CN106570474A/zh
Application granted granted Critical
Publication of CN106570474B publication Critical patent/CN106570474B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/174Facial expression recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24137Distances to cluster centroïds
    • G06F18/2414Smoothing the distance, e.g. radial basis function networks [RBFN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种基于3D卷积神经网络的微表情识别方法,基于所构造出的3D卷积神经网络(3D‑CNN)模型,能够有效识别出高兴、厌恶、压抑、惊讶以及其他5类微表情,并且所设计微表情识别方法简单、高效,不需要对样本数据进行特征提取、特征降维、分类等一系列过程,大大减少了预处理的难度,而且通过感受野和权值共享,减少了神经网络需要训练的参数的个数,大大降低了算法的复杂度,不仅如此,所设计微表情识别方法中,通过下采样层的下采样操作,增强了网络的鲁棒性,能容忍图像一定程度的畸变。

Description

一种基于3D卷积神经网络的微表情识别方法
技术领域
本发明涉及一种基于3D卷积神经网络的微表情识别方法,属于图像处理与模式识别技术领域。
背景技术
微表情是一种特殊的面部表情,它反应了一个人内心真实的情感。人们用肉眼很难发现微表情,其持续时间很短、强度很弱,大约为1/25s-1/5s。也有研究人员认为其持续时间小于450ms。由于微表情所具有的这些特性,使其在测谎、临床诊断以及审讯等领域有着广泛的应用前景。
在早期,研究人员都是通过心理学的方式在研究微表情,并且都是注重于个体微表情的识别。微表情的第一个训练工具METT(Micro Expression Training Tool)就是由心理学家Ekman在2002年创建的,但是其识别峰值只在40%左右,这远远达不到商用的要求。
随着计算机技术的飞速发展,微表情不再使用早期心理学方法进行研究,更多的是采用计算机视觉、模式识别的方法。在国内,最早开始研究微表情的是中国科学院心理研究所的傅小兰团队。2011年其申请了中国国家自然科学基金委面上项目“面向自动谎言识别的微表情表达研究”,成为国内研究微表情的主力军,并且成功的创建了自发的微表情数据库CASME和CASMEII,为微表情识别研究做出了巨大贡献。2007年,赵国英等人将LBP扩展到了三维空间,提出动态纹理特征的算法LBP_TOP,LBP_TOP是在三个正交的平面上计算LBP值,并且统计出直方图,其具有高效的计算,可以很好的描述动态的纹理特征,从此以后,LBP_TOP算子被广泛的应用在微表情特征提取上,得到了较好的分类结果。
20世纪60年代,Hubel和Wiesel在研究猫脑皮层中用于局部敏感和方向选择的神经元时发现其独特的网络结构可以有效地降低反馈神经网络的复杂性,继而提出了卷积神经网络(Convolutional Neural Networks,CNN),但是由于其一系列的缺陷,很难得到较大发展。直到2006,加拿大多伦多大学Hinton教授提出了深度学习理论,通过多隐层的人工神经网络对样本进行自主学习,得到的特征数据对样本本身有着本质的刻画,有利于最终的分类。从此以后,深度学习得到了广泛的关注,几乎所有拥有大数据的高科技公司都成立了自己的深度学习项目,都想占领深度学习技术的制高点。2012年,在图像分类大赛ImageNet(图像识别目前最大的数据库)上,HINTON G E等人使用CNN最终取得了非常惊人的结果,其结果相对原来方法好了很多(前5个错误率由25%降低为17%)。由于CNN可以直接从原始图像数据中自主学习模式特征,避免了复杂的特征提取和数据重建过程,已成功应用于手写字符识别、人脸识别、人眼检测、车牌字符识别、交通信号识别等众多应用领域。
CNN虽然具有强大的功能,广泛的应用在模式识别、计算机视觉的各个领域,但是它仅仅局限于2D的输入,这使得其应用得到了极大的限制。
发明内容
本发明所要解决的技术问题是提供一种针对传统微表情识别存在复杂特征提取以及特征降维等问题,从空间和时间的维度提取特征,进行3D卷积,以捕捉从多个连续帧得到的运动信息,能够有效提高微表情识别性能的基于3D卷积神经网络的微表情识别方法。
本发明为了解决上述技术问题采用以下技术方案:本发明设计了一种基于3D卷积神经网络的微表情识别方法,包括如下步骤:
步骤001.针对待识别微表情图像序列中的各帧图像进行像素尺寸归一化处理;
步骤002.分别针对待识别微表情图像序列中的各帧图像,提取灰度通道特征图、水平方向梯度通道特征图、竖直方向梯度通道特征图、水平方向光流通道特征图、竖直方向光流通道特征图,即获得待识别微表情图像序列所对应的一个特征图组;
步骤003.采用预设N1个不同种类、彼此大小相同的3D卷积核,针对特征图组分别进行卷积操作,获得N1个特征图组,其中,3D卷积核对应于空间维和时间维;
步骤004.针对N1个特征图组中的各张特征图,分别采用第一预设水平方向与竖直方向等比例的采样窗口进行降维处理,更新N1个特征图组中各张特征图的像素尺寸;
步骤005.分别针对N1个特征图组,分别采用预设N2个不同种类、彼此大小相同的3D卷积核进行卷积操作,获得N1*N2个特征图组,其中,3D卷积核对应于空间维和时间维;
步骤006.针对N1*N2个特征图组中的各张特征图,分别采用第二预设水平方向与竖直方向等比例的采样窗口进行降维处理,更新N1*N2个特征图组中各张特征图的像素尺寸;
步骤007.分别针对N1*N2个特征图组,分别采用1个预设种类、大小与特征图像素尺寸相同的2D卷积核进行空间维的卷积操作,更新N1*N2个特征图组;
步骤008.获得N1*N2个特征图组所对应的各个特征向量;
步骤009.采用神经网络技术针对各个特征向量进行分类处理,其中,选取最大输出值所对应神经元,获得该神经元所对应的微表情分类,即为待识别微表情图像序列所对应的微表情识别结果。
作为本发明的一种优选技术方案:基于3D卷积神经网络模型实现所述微表情识别方法,3D卷积神经网络模型由输入端开始依次包括硬连线层H1(hardwired层)、卷积层C1、下采样层S1、卷积层C2、下采样层S2、卷积层C3、全连接层、分类层;执行完步骤001之后,采用3D卷积神经网络模型针对所述待识别微表情图像序列中的各帧图像进行操作,其中,由硬连线层H1(hardwired层)执行所述步骤002,卷积层C1执行所述步骤003,下采样层S1执行所述步骤004,卷积层C2执行所述步骤005,下采样层S2执行所述步骤006,卷积层C3执行所述步骤007,全连接层执行所述步骤008,分类层执行所述步骤009。
作为本发明的一种优选技术方案:采用预设模型训练方法针对所述3D卷积神经网络模型的模型参数进行训练,在执行完所述步骤001之后,采用训练后的3D卷积神经网络模型,针对所述待识别微表情图像序列中的各帧图像执行所述步骤002至步骤009。
作为本发明的一种优选技术方案:所述预设模型训练方法为随机diagonalLevenberg-Marquardt优化方法针对所述3D卷积神经网络模型的模型参数进行训练。
作为本发明的一种优选技术方案:所述卷积层C1按如下公式,执行所述步骤003,
其中,(x,y,z)C1,j表示卷积层C1第j个特征图上任意一个像素点的像素值,表示硬连线层H1(hardwired层)第j个特征图经卷积层C1进行3D卷积后的输出,表示卷积层C1针对第j个特征图进行卷积的3D卷积核,(P-1,Q-1,R-1)C1,j表示卷积层C1对应第j个特征图的3D卷积核的大小,bC1,j表示卷积层C1对应第j个特征图的加性偏置,f(·)表示激活函数,表示硬连线层H1(hardwired层)第j个特征图上任意一点;
所述卷积层C2按如下公式,执行所述步骤005,
其中,(x,y,z)C2,i表示卷积层C2第i个特征图上任意一个像素点的像素值,表示下采样层S1第i个特征图经卷积层C2进行3D卷积后的输出,表示卷积层C2针对第i个特征图进行卷积的3D卷积核,(P-1,Q-1,R-1)C2,i表示卷积层C2对应第i个特征图的3D卷积核的大小,bC2,i表示卷积层C2对应第i个特征图的加性偏置,f(·)表示激活函数,表示下采样层S1第i个特征图上任意一点。
作为本发明的一种优选技术方案:所述下采样层S1按如下公式,执行所述步骤004,
vS1,m=f(αS1,mdown1(vC1,m)+βS1,m)
其中,vS1,m表示下采样层S1针对卷积层C1第m个特征图进行降维处理所得的特征图(不是特征图,直接写输出就行),vC1,m表示卷积层C1的第m个特征图,down1(·)表示下采样层S1函数,αS1,m和βS1,m分别表示下采样层S1对应第m个特征图的乘性偏置和加性偏置,f(·)表示激活函数;
所述下采样层S2按如下公式,执行所述步骤006,
vS2,n=f(αS2,ndown2(vC2,n)+βS2,n)
其中,vS2,n表示下采样层S2针对卷积层C2第n个特征图进行下采样所得的特征图,vC2,n表示卷积层C2的第n个特征图,down2(·)表示下采样层S2函数,αS2,n和βS2,n分别表示下采样层S2对应第n个特征图的乘性偏置和加性偏置,f(·)表示激活函数。
作为本发明的一种优选技术方案:所述卷积层C3按如下公式,执行所述步骤007,
其中,(x,y)C3,k表示卷积层C3第k个特征图上任意一个像素点的像素值,表示下采样层S2第k个特征图经卷积层C3进行2D卷积后的输出,表示卷积层C3针对第k个特征图进行卷积的2D卷积核,(P-1,Q-1)C3,k表示卷积层C3对应第k个特征图的2D卷积核的大小,bC3,k表示卷积层C3对应第k个特征图的加性偏置,f(·)表示激活函数,表示下采样层S2第k个特征图上任意一点。
本发明所述一种基于3D卷积神经网络的微表情识别方法采用以上技术方案与现有技术相比,具有以下技术效果:本发明所设计基于3D卷积神经网络的微表情识别方法,基于所构造出的3D卷积神经网络(3D-CNN)模型,能够有效识别出高兴、厌恶、压抑、惊讶以及其他5类微表情,并且所设计微表情识别方法简单、高效,不需要对样本数据进行特征提取、特征降维、分类等一系列过程,大大减少了预处理的难度,而且通过感受野和权值共享,减少了神经网络需要训练的参数的个数,大大降低了算法的复杂度,不仅如此,所设计微表情识别方法中,通过下采样层的下采样操作,增强了网络的鲁棒性,能容忍图像一定程度的畸变。
附图说明
图1是本发明所设计基于3D卷积神经网络的微表情识别方法的示意图;
图2是本发明所设计基于3D卷积神经网络的微表情识别方法中3D卷积神经网络架构图。
具体实施方式
下面结合说明书附图对本发明的具体实施方式作进一步详细的说明。
如图1和图2所示,本发明设计一种基于3D卷积神经网络的微表情识别方法,在实际应用过程当中,基于3D卷积神经网络模型(3D-CNN)实现所述微表情识别方法,3D卷积神经网络模型(3D-CNN)由输入端开始依次包括硬连线层H1(hardwired层)、卷积层C1、下采样层S1、卷积层C2、下采样层S2、卷积层C3、全连接层、分类层(Softmax分类层);针对下面所设计的步骤001至步骤009,首先采用随机diagonal Levenberg-Marquardt优化方法针对所述3D卷积神经网络模型(3D-CNN)的模型参数进行训练,然后在执行完所述步骤001之后,采用训练后的3D卷积神经网络模型(3D-CNN),针对所述待识别微表情图像序列中的各帧图像执行所述步骤002至步骤009;其中,由硬连线层H1(hardwired层)执行所述步骤002,卷积层C1执行所述步骤003,下采样层S1执行所述步骤004,卷积层C2执行所述步骤005,下采样层S2执行所述步骤006,卷积层C3执行所述步骤007,全连接层执行所述步骤008,分类层(Softmax分类层)执行所述步骤009,实际应用中,具体包括如下步骤:
步骤001.针对待识别微表情图像序列中的各帧图像进行像素尺寸归一化处理。
步骤002.由硬连线层H1(hardwired层)分别针对待识别微表情图像序列中的各帧图像,提取灰度通道特征图、水平方向梯度通道特征图、竖直方向梯度通道特征图、水平方向光流通道特征图、竖直方向光流通道特征图,即获得待识别微表情图像序列所对应的一个特征图组。
步骤003.由卷积层C1采用预设N1个不同种类、彼此大小相同的3D卷积核,针对特征图组分别进行卷积操作,获得N1个特征图组,其中,3D卷积核对应于空间维和时间维。
上述卷积层C1按如下公式,执行所述步骤003:
其中,(x,y,z)C1,j表示卷积层C1第j个特征图上任意一个像素点的像素值,表示硬连线层H1(hardwired层)第j个特征图经卷积层C1进行3D卷积后的输出,表示卷积层C1针对第j个特征图进行卷积的3D卷积核,(P-1,Q-1,R-1)C1,j表示卷积层C1对应第j个特征图的3D卷积核的大小,bC1,j表示卷积层C1对应第j个特征图的加性偏置,f(·)表示激活函数,表示硬连线层H1(hardwired层)第j个特征图上任意一点。
步骤004.由下采样层S1针对N1个特征图组中的各张特征图,分别采用第一预设水平方向与竖直方向等比例的采样窗口进行降维处理,更新N1个特征图组中各张特征图的像素尺寸。
上述下采样层S1按如下公式,执行所述步骤004,
vS1,m=f(αS1,mdown1(vC1,m)+βS1,m)
其中,vS1,m表示下采样层S1针对卷积层C1第m个特征图进行降维处理所得的特征图(不是特征图,直接写输出就行),vC1,m表示卷积层C1的第m个特征图,down1(·)表示下采样层S1函数,αS1,m和βS1,m分别表示下采样层S1对应第m个特征图的乘性偏置和加性偏置,f(·)表示激活函数。
步骤005.由卷积层C2分别针对N1个特征图组,分别采用预设N2个不同种类、彼此大小相同的3D卷积核进行卷积操作,获得N1*N2个特征图组,其中,3D卷积核对应于空间维和时间维。
上述卷积层C2按如下公式,执行所述步骤005,
其中,(x,y,z)C2,i表示卷积层C2第i个特征图上任意一个像素点的像素值,表示下采样层S1第i个特征图经卷积层C2进行3D卷积后的输出,表示卷积层C2针对第i个特征图进行卷积的3D卷积核,(P-1,Q-1,R-1)C2,i表示卷积层C2对应第i个特征图的3D卷积核的大小,bC2,i表示卷积层C2对应第i个特征图的加性偏置,f(·)表示激活函数,表示下采样层S1第i个特征图上任意一点。
步骤006.由下采样层S2针对N1*N2个特征图组中的各张特征图,分别采用第二预设水平方向与竖直方向等比例的采样窗口进行降维处理,更新N1*N2个特征图组中各张特征图的像素尺寸。
上述下采样层S2按如下公式,执行所述步骤006,
vS2,n=f(αS2,ndown2(vC2,n)+βS2,n)
其中,vS2,n表示下采样层S2针对卷积层C2第n个特征图进行下采样所得的特征图,vC2,n表示卷积层C2的第n个特征图,down2(·)表示下采样层S2函数,αS2,n和βS2,n分别表示下采样层S2对应第n个特征图的乘性偏置和加性偏置,f(·)表示激活函数。
步骤007.由卷积层C3分别针对N1*N2个特征图组,分别采用1个预设种类、大小与特征图像素尺寸相同的2D卷积核进行空间维的卷积操作,更新N1*N2个特征图组。
上述卷积层C3按如下公式,执行所述步骤007,
其中,(x,y)C3,k表示卷积层C3第k个特征图上任意一个像素点的像素值,表示下采样层S2第k个特征图经卷积层C3进行2D卷积后的输出,表示卷积层C3针对第k个特征图进行卷积的2D卷积核,(P-1,Q-1)C3,k表示卷积层C3对应第k个特征图的2D卷积核的大小,bC3,k表示卷积层C3对应第k个特征图的加性偏置,f(·)表示激活函数,表示下采样层S2第k个特征图上任意一点。
步骤008.由全连接层获得N1*N2个特征图组所对应的各个特征向量。
步骤009.由分类层(Softmax分类层)采用神经网络技术针对各个特征向量进行分类处理,其中,选取最大输出值所对应神经元,获得该神经元所对应的微表情分类,即为待识别微表情图像序列所对应的微表情识别结果。
上述技术方案所设计基于3D卷积神经网络的微表情识别方法,基于所构造出的3D卷积神经网络(3D-CNN)模型,能够有效识别出高兴、厌恶、压抑、惊讶以及其他5类微表情,并且所设计微表情识别方法简单、高效,不需要对样本数据进行特征提取、特征降维、分类等一系列过程,大大减少了预处理的难度,而且通过感受野和权值共享,减少了神经网络需要训练的参数的个数,大大降低了算法的复杂度,不仅如此,所设计微表情识别方法中,通过下采样层的下采样操作,增强了网络的鲁棒性,能容忍图像一定程度的畸变。
如图2所示,将本发明所设计基于3D卷积神经网络的微表情识别方法,应用到实际应用过程当中,首先采用随机diagonal Levenberg-Marquardt优化方法针对所述3D卷积神经网络模型(3D-CNN)的模型参数进行训练,然后具体步骤执行如下:
步骤001.针对待识别微表情图像序列中的各帧图像进行像素尺寸归一化处理,使每一帧图像的大小都为60*40像素,且待识别微表情图像序列为7帧图像。
步骤002.由硬连线层H1(hardwired层)分别针对待识别微表情图像序列中的各帧图像,提取灰度通道特征图、水平方向梯度通道特征图、竖直方向梯度通道特征图、水平方向光流通道特征图、竖直方向光流通道特征图,即获得待识别微表情图像序列所对应的一个特征图组,且由于水平和竖直方向的光流信息需要连续两帧的图像计算,所以在硬连线层H1(hardwired层)特征图个数为7*3+6*2=33。
步骤003.由卷积层C1采用2个不同种类、彼此大小相同为7*7*3的3D卷积核(7*7是空间维,3是时间维),按公式针对特征图组分别进行卷积操作,获得2个特征图组,其中,各个特征图组包含的特征图个数为23=(7-3+1)*3+(6-3+1)*2,特征图大小为54x34=(60-7+1)*(40-7+1)。
步骤004.由下采样层S1针对2个特征图组中的各张特征图,按公式分别采用2*2的采样窗口进行降维处理,更新2个特征图组中各张特征图的像素尺寸,这样就会得到相同数目但是空间分辨率降低的特征图,下采样后特征图大小为27*17=(52/2)*(34/2)。
步骤005.由卷积层C2分别针对2个特征图组,分别采用预设3个不同种类、彼此大小相同为7*6*3的3D卷积核(7*6是空间维,3是时间维),按公式进行卷积操作,获得6个特征图组,其中,各个特征图组包含的特征图个数为13=(7-3+1)-3+1)*3+((6-3+1)-3+1)*2,特征图大小为21*12=(27-7+1)*(17-6+1)。
步骤006.由下采样层S2针对6个特征图组中的各张特征图,分别采用3*3的采样窗口,按公式进行降维处理,更新6个特征图组中各张特征图的像素尺寸,其中,下采样后特征图大小为7*4=(21/3)*(12/3),这样就会得到相同数目但空间分辨率降低的特征图。
步骤007.由卷积层C3分别针对6个特征图组,分别采用7*4的2D卷积核,按公式进行空间维的卷积操作,更新6个特征图组,如此,输出的特征图就被减小到1x1的大小。
步骤008.由全连接层获得6个特征图组所对应的各个特征向量,即最终得到一个128维的特征向量。
步骤009.由分类层(Softmax分类层)采用神经网络技术针对各个特征向量进行分类处理,分类层(Softmax分类层)中每一个神经元输出一个取值在0~1之间的数值,其反应了输入样本属于该类的概率,其中,选取最大输出值所对应神经元,获得该神经元所对应的微表情分类,即为待识别微表情图像序列所对应的微表情识别结果。
上面结合附图对本发明的实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。

Claims (7)

1.一种基于3D卷积神经网络的微表情识别方法,其特征在于,包括如下步骤:
步骤001.针对待识别微表情图像序列中的各帧图像进行像素尺寸归一化处理;
步骤002.分别针对待识别微表情图像序列中的各帧图像,提取灰度通道特征图、水平方向梯度通道特征图、竖直方向梯度通道特征图、水平方向光流通道特征图、竖直方向光流通道特征图,即获得待识别微表情图像序列所对应的一个特征图组;
步骤003.采用预设N1个不同种类、彼此大小相同的3D卷积核,针对特征图组分别进行卷积操作,获得N1个特征图组,其中,3D卷积核对应于空间维和时间维;
步骤004.针对N1个特征图组中的各张特征图,分别采用第一预设水平方向与竖直方向等比例的采样窗口进行降维处理,更新N1个特征图组中各张特征图的像素尺寸;
步骤005.分别针对N1个特征图组,分别采用预设N2个不同种类、彼此大小相同的3D卷积核进行卷积操作,获得N1*N2个特征图组,其中,3D卷积核对应于空间维和时间维;
步骤006.针对N1*N2个特征图组中的各张特征图,分别采用第二预设水平方向与竖直方向等比例的采样窗口进行降维处理,更新N1*N2个特征图组中各张特征图的像素尺寸;
步骤007.分别针对N1*N2个特征图组,分别采用1个预设种类、大小与特征图像素尺寸相同的2D卷积核进行空间维的卷积操作,更新N1*N2个特征图组;
步骤008.获得N1*N2个特征图组所对应的各个特征向量;
步骤009.采用神经网络技术针对各个特征向量进行分类处理,其中,选取最大输出值所对应神经元,获得该神经元所对应的微表情分类,即为待识别微表情图像序列所对应的微表情识别结果。
2.根据权利要求1所述一种基于3D卷积神经网络的微表情识别方法,其特征在于:基于3D卷积神经网络模型实现所述微表情识别方法,3D卷积神经网络模型由输入端开始依次包括硬连线层H1(hardwired层)、卷积层C1、下采样层S1、卷积层C2、下采样层S2、卷积层C3、全连接层、分类层;执行完步骤001之后,采用3D卷积神经网络模型针对所述待识别微表情图像序列中的各帧图像进行操作,其中,由硬连线层H1(hardwired层)执行所述步骤002,卷积层C1执行所述步骤003,下采样层S1执行所述步骤004,卷积层C2执行所述步骤005,下采样层S2执行所述步骤006,卷积层C3执行所述步骤007,全连接层执行所述步骤008,分类层执行所述步骤009。
3.根据权利要求2所述一种基于3D卷积神经网络的微表情识别方法,其特征在于:采用预设模型训练方法针对所述3D卷积神经网络模型的模型参数进行训练,在执行完所述步骤001之后,采用训练后的3D卷积神经网络模型,针对所述待识别微表情图像序列中的各帧图像执行所述步骤002至步骤009。
4.根据权利要求3所述一种基于3D卷积神经网络的微表情识别方法,其特征在于:所述预设模型训练方法为随机diagonal Levenberg-Marquardt优化方法针对所述3D卷积神经网络模型的模型参数进行训练。
5.根据权利要求2所述一种基于3D卷积神经网络的微表情识别方法,其特征在于:所述卷积层C1按如下公式,执行所述步骤003,
v C 1 , j ( x , y , z ) C 1 , j = f ( Σ p C 1 , j = 0 P C 1 , j - 1 Σ q C 1 , j = 0 Q C 1 , j - 1 Σ r C 1 , j = 0 R C 1 , j - 1 w C 1 , j ( p , q , r ) C 1 , j w H 1 ( x C 1 , j + p C 1 , j ) ( y C 1 , j + q C 1 , j ) ( z C 1 , j + r C 1 , j ) + b C 1 , j )
其中,(x,y,z)C1,j表示卷积层C1第j个特征图上任意一个像素点的像素值,表示硬连线层H1(hardwired层)第j个特征图经卷积层C1进行3D卷积后的输出,表示卷积层C1针对第j个特征图进行卷积的3D卷积核,(P-1,Q-1,R-1)C1,j表示卷积层C1对应第j个特征图的3D卷积核的大小,bC1,j表示卷积层C1对应第j个特征图的加性偏置,f(·)表示激活函数,表示硬连线层H1(hardwired层)第j个特征图上任意一点;
所述卷积层C2按如下公式,执行所述步骤005,
v C 2 , i ( x , y , z ) C 2 , i = f ( Σ p C 2 , i = 0 P C 2 , i - 1 Σ q C 2 , i = 0 Q C 2 , i - 1 Σ r C 2 , i = 0 R C 2 , i - 1 w C 2 , i ( p , q , r ) C 2 , i v S 1 ( x C 2 , i + p C 2 , i ) ( y C 2 , i + q C 2 , i ) ( z C 2 , i + r C 2 , i ) + b C 2 , i )
其中,(x,y,z)C2,i表示卷积层C2第i个特征图上任意一个像素点的像素值,表示下采样层S1第i个特征图经卷积层C2进行3D卷积后的输出,表示卷积层C2针对第i个特征图进行卷积的3D卷积核,(P-1,Q-1,R-1)C2,i表示卷积层C2对应第i个特征图的3D卷积核的大小,bC2,i表示卷积层C2对应第i个特征图的加性偏置,f(·)表示激活函数,表示下采样层S1第i个特征图上任意一点。
6.根据权利要求2所述一种基于3D卷积神经网络的微表情识别方法,其特征在于:所述下采样层S1按如下公式,执行所述步骤004,
vS1,m=f(αS1,mdown1(vC1,m)+βS1,m)
其中,vS1,m表示下采样层S1针对卷积层C1第m个特征图进行降维处理所得的特征图(不是特征图,直接写输出就行),vC1,m表示卷积层C1的第m个特征图,down1(·)表示下采样层S1函数,αS1,m和βS1,m分别表示下采样层S1对应第m个特征图的乘性偏置和加性偏置,f(·)表示激活函数;
所述下采样层S2按如下公式,执行所述步骤006,
vS2,n=f(αS2,ndown2(vC2,n)+βS2,n)
其中,vS2,n表示下采样层S2针对卷积层C2第n个特征图进行下采样所得的特征图,vC2,n表示卷积层C2的第n个特征图,down2(·)表示下采样层S2函数,αS2,n和βS2,n分别表示下采样层S2对应第n个特征图的乘性偏置和加性偏置,f(·)表示激活函数。
7.根据权利要求2所述一种基于3D卷积神经网络的微表情识别方法,其特征在于:所述卷积层C3按如下公式,执行所述步骤007,
v C 3 , k ( x , y ) C 3 , k = f ( Σ p C 3 , k = 0 P C 3 , k - 1 Σ q C 3 , k = 0 Q C 3 , k - 1 w C 3 , k ( p , q ) C 3 , k v S 2 ( x C 3 , k + p C 3 , k ) ( y C 3 , k + q C 3 , k i ) + b C 3 , k )
其中,(x,y)C3,k表示卷积层C3第k个特征图上任意一个像素点的像素值,表示下采样层S2第k个特征图经卷积层C3进行2D卷积后的输出,表示卷积层C3针对第k个特征图进行卷积的2D卷积核,(P-1,Q-1)C3,k表示卷积层C3对应第k个特征图的2D卷积核的大小,bC3,k表示卷积层C3对应第k个特征图的加性偏置,f(·)表示激活函数,表示下采样层S2第k个特征图上任意一点。
CN201610954555.9A 2016-10-27 2016-10-27 一种基于3d卷积神经网络的微表情识别方法 Active CN106570474B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610954555.9A CN106570474B (zh) 2016-10-27 2016-10-27 一种基于3d卷积神经网络的微表情识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610954555.9A CN106570474B (zh) 2016-10-27 2016-10-27 一种基于3d卷积神经网络的微表情识别方法

Publications (2)

Publication Number Publication Date
CN106570474A true CN106570474A (zh) 2017-04-19
CN106570474B CN106570474B (zh) 2019-06-28

Family

ID=58535272

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610954555.9A Active CN106570474B (zh) 2016-10-27 2016-10-27 一种基于3d卷积神经网络的微表情识别方法

Country Status (1)

Country Link
CN (1) CN106570474B (zh)

Cited By (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107242876A (zh) * 2017-04-20 2017-10-13 合肥工业大学 一种用于精神状态辅助诊断的计算机视觉方法
CN107273876A (zh) * 2017-07-18 2017-10-20 山东大学 一种基于深度学习的‘宏to微转换模型’的微表情自动识别方法
CN107291232A (zh) * 2017-06-20 2017-10-24 深圳市泽科科技有限公司 一种基于深度学习与大数据的体感游戏交互方法及***
CN107316004A (zh) * 2017-06-06 2017-11-03 西北工业大学 基于深度学习的空间目标识别方法
CN107316015A (zh) * 2017-06-19 2017-11-03 南京邮电大学 一种基于深度时空特征的高精度面部表情识别方法
CN107330393A (zh) * 2017-06-27 2017-11-07 南京邮电大学 一种基于视频分析的新生儿疼痛表情识别方法
CN107679526A (zh) * 2017-11-14 2018-02-09 北京科技大学 一种人脸微表情识别方法
CN107977634A (zh) * 2017-12-06 2018-05-01 北京飞搜科技有限公司 一种针对视频的表情识别方法、装置及设备
CN108062416A (zh) * 2018-01-04 2018-05-22 百度在线网络技术(北京)有限公司 用于在地图上生成标签的方法和装置
CN108319900A (zh) * 2018-01-16 2018-07-24 南京信息工程大学 一种基本表情分类方法
CN108388537A (zh) * 2018-03-06 2018-08-10 上海熠知电子科技有限公司 一种卷积神经网络加速装置和方法
CN108596069A (zh) * 2018-04-18 2018-09-28 南京邮电大学 基于深度3d残差网络的新生儿疼痛表情识别方法及***
CN108764207A (zh) * 2018-06-07 2018-11-06 厦门大学 一种基于多任务卷积神经网络的人脸表情识别方法
CN109034143A (zh) * 2018-11-01 2018-12-18 云南大学 基于视频放大和深度学习的人脸微表情识别方法
CN109215665A (zh) * 2018-07-20 2019-01-15 广东工业大学 一种基于3d卷积神经网络的声纹识别方法
CN109271930A (zh) * 2018-09-14 2019-01-25 广州杰赛科技股份有限公司 微表情识别方法、装置与存储介质
CN109389045A (zh) * 2018-09-10 2019-02-26 广州杰赛科技股份有限公司 基于混合时空卷积模型的微表情识别方法与装置
CN109559535A (zh) * 2018-11-22 2019-04-02 深圳市博远交通设施有限公司 一种一体化人脸识别的动态声光协调交通信号***
CN109784312A (zh) * 2019-02-18 2019-05-21 深圳锐取信息技术股份有限公司 教学管理方法及装置
CN109977925A (zh) * 2019-04-22 2019-07-05 北京字节跳动网络技术有限公司 表情确定方法、装置及电子设备
CN110059593A (zh) * 2019-04-01 2019-07-26 华侨大学 一种基于反馈卷积神经网络的面部表情识别方法
CN110188706A (zh) * 2019-06-03 2019-08-30 南京邮电大学 基于生成对抗网络的视频中人物表情的神经网络训练方法及检测方法
CN110287801A (zh) * 2019-05-29 2019-09-27 中国电子科技集团公司电子科学研究院 一种微表情识别算法
CN110532900A (zh) * 2019-08-09 2019-12-03 西安电子科技大学 基于U-Net和LS-CNN的人脸表情识别方法
WO2020103700A1 (zh) * 2018-11-21 2020-05-28 腾讯科技(深圳)有限公司 一种基于微表情的图像识别方法、装置以及相关设备
CN111767842A (zh) * 2020-06-29 2020-10-13 杭州电子科技大学 基于迁移学习和自编码器数据增强的微表情种类判别方法
CN111967344A (zh) * 2020-07-28 2020-11-20 南京信息工程大学 一种面向人脸伪造视频检测的精细化特征融合方法
CN112183333A (zh) * 2020-09-27 2021-01-05 苏州工业职业技术学院 基于微表情的人屏互动方法、***和装置
CN112580555A (zh) * 2020-12-25 2021-03-30 中国科学技术大学 一种自发微表情识别方法
CN112784804A (zh) * 2021-02-03 2021-05-11 杭州电子科技大学 基于神经网络敏感性分析的微表情识别方法
CN113033324A (zh) * 2021-03-03 2021-06-25 广东省地质环境监测总站 一种地质灾害前兆因子识别方法、装置,电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103020602A (zh) * 2012-10-12 2013-04-03 北京建筑工程学院 基于神经网络的人脸识别方法
CN103258204A (zh) * 2012-02-21 2013-08-21 中国科学院心理研究所 一种基于Gabor和EOH特征的自动微表情识别方法
US20160275341A1 (en) * 2015-03-18 2016-09-22 Adobe Systems Incorporated Facial Expression Capture for Character Animation

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103258204A (zh) * 2012-02-21 2013-08-21 中国科学院心理研究所 一种基于Gabor和EOH特征的自动微表情识别方法
CN103020602A (zh) * 2012-10-12 2013-04-03 北京建筑工程学院 基于神经网络的人脸识别方法
US20160275341A1 (en) * 2015-03-18 2016-09-22 Adobe Systems Incorporated Facial Expression Capture for Character Animation

Cited By (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107242876A (zh) * 2017-04-20 2017-10-13 合肥工业大学 一种用于精神状态辅助诊断的计算机视觉方法
CN107316004A (zh) * 2017-06-06 2017-11-03 西北工业大学 基于深度学习的空间目标识别方法
CN107316015A (zh) * 2017-06-19 2017-11-03 南京邮电大学 一种基于深度时空特征的高精度面部表情识别方法
CN107316015B (zh) * 2017-06-19 2020-06-30 南京邮电大学 一种基于深度时空特征的高精度面部表情识别方法
CN107291232A (zh) * 2017-06-20 2017-10-24 深圳市泽科科技有限公司 一种基于深度学习与大数据的体感游戏交互方法及***
CN107330393A (zh) * 2017-06-27 2017-11-07 南京邮电大学 一种基于视频分析的新生儿疼痛表情识别方法
CN107273876A (zh) * 2017-07-18 2017-10-20 山东大学 一种基于深度学习的‘宏to微转换模型’的微表情自动识别方法
CN107273876B (zh) * 2017-07-18 2019-09-10 山东大学 一种基于深度学习的‘宏to微转换模型’的微表情自动识别方法
CN107679526A (zh) * 2017-11-14 2018-02-09 北京科技大学 一种人脸微表情识别方法
CN107679526B (zh) * 2017-11-14 2020-06-12 北京科技大学 一种人脸微表情识别方法
CN107977634A (zh) * 2017-12-06 2018-05-01 北京飞搜科技有限公司 一种针对视频的表情识别方法、装置及设备
CN108062416A (zh) * 2018-01-04 2018-05-22 百度在线网络技术(北京)有限公司 用于在地图上生成标签的方法和装置
CN108062416B (zh) * 2018-01-04 2019-10-29 百度在线网络技术(北京)有限公司 用于在地图上生成标签的方法和装置
CN108319900A (zh) * 2018-01-16 2018-07-24 南京信息工程大学 一种基本表情分类方法
CN108388537A (zh) * 2018-03-06 2018-08-10 上海熠知电子科技有限公司 一种卷积神经网络加速装置和方法
US11989638B2 (en) 2018-03-06 2024-05-21 Thinkforce Electronic Technology Co., Ltd Convolutional neural network accelerating device and method with input data conversion
CN108596069A (zh) * 2018-04-18 2018-09-28 南京邮电大学 基于深度3d残差网络的新生儿疼痛表情识别方法及***
CN108764207A (zh) * 2018-06-07 2018-11-06 厦门大学 一种基于多任务卷积神经网络的人脸表情识别方法
CN108764207B (zh) * 2018-06-07 2021-10-19 厦门大学 一种基于多任务卷积神经网络的人脸表情识别方法
CN109215665A (zh) * 2018-07-20 2019-01-15 广东工业大学 一种基于3d卷积神经网络的声纹识别方法
CN109389045A (zh) * 2018-09-10 2019-02-26 广州杰赛科技股份有限公司 基于混合时空卷积模型的微表情识别方法与装置
CN109271930B (zh) * 2018-09-14 2020-11-13 广州杰赛科技股份有限公司 微表情识别方法、装置与存储介质
CN109271930A (zh) * 2018-09-14 2019-01-25 广州杰赛科技股份有限公司 微表情识别方法、装置与存储介质
CN109034143A (zh) * 2018-11-01 2018-12-18 云南大学 基于视频放大和深度学习的人脸微表情识别方法
WO2020103700A1 (zh) * 2018-11-21 2020-05-28 腾讯科技(深圳)有限公司 一种基于微表情的图像识别方法、装置以及相关设备
US12039454B2 (en) 2018-11-21 2024-07-16 Tencent Technology (Shenzhen) Company Limited Microexpression-based image recognition method and apparatus, and related device
CN109559535A (zh) * 2018-11-22 2019-04-02 深圳市博远交通设施有限公司 一种一体化人脸识别的动态声光协调交通信号***
CN109784312A (zh) * 2019-02-18 2019-05-21 深圳锐取信息技术股份有限公司 教学管理方法及装置
CN110059593A (zh) * 2019-04-01 2019-07-26 华侨大学 一种基于反馈卷积神经网络的面部表情识别方法
CN110059593B (zh) * 2019-04-01 2022-09-30 华侨大学 一种基于反馈卷积神经网络的面部表情识别方法
CN109977925A (zh) * 2019-04-22 2019-07-05 北京字节跳动网络技术有限公司 表情确定方法、装置及电子设备
CN109977925B (zh) * 2019-04-22 2020-11-27 北京字节跳动网络技术有限公司 表情确定方法、装置及电子设备
CN110287801A (zh) * 2019-05-29 2019-09-27 中国电子科技集团公司电子科学研究院 一种微表情识别算法
CN110188706A (zh) * 2019-06-03 2019-08-30 南京邮电大学 基于生成对抗网络的视频中人物表情的神经网络训练方法及检测方法
CN110188706B (zh) * 2019-06-03 2022-04-19 南京邮电大学 基于生成对抗网络的视频中人物表情的神经网络训练方法及检测方法
CN110532900A (zh) * 2019-08-09 2019-12-03 西安电子科技大学 基于U-Net和LS-CNN的人脸表情识别方法
CN110532900B (zh) * 2019-08-09 2021-07-27 西安电子科技大学 基于U-Net和LS-CNN的人脸表情识别方法
CN111767842A (zh) * 2020-06-29 2020-10-13 杭州电子科技大学 基于迁移学习和自编码器数据增强的微表情种类判别方法
CN111767842B (zh) * 2020-06-29 2024-02-06 杭州电子科技大学 基于迁移学习和自编码器数据增强的微表情种类判别方法
CN111967344B (zh) * 2020-07-28 2023-06-20 南京信息工程大学 一种面向人脸伪造视频检测的精细化特征融合方法
CN111967344A (zh) * 2020-07-28 2020-11-20 南京信息工程大学 一种面向人脸伪造视频检测的精细化特征融合方法
CN112183333B (zh) * 2020-09-27 2021-12-10 苏州工业职业技术学院 基于微表情的人屏互动方法、***和装置
CN112183333A (zh) * 2020-09-27 2021-01-05 苏州工业职业技术学院 基于微表情的人屏互动方法、***和装置
CN112580555B (zh) * 2020-12-25 2022-09-30 中国科学技术大学 一种自发微表情识别方法
CN112580555A (zh) * 2020-12-25 2021-03-30 中国科学技术大学 一种自发微表情识别方法
CN112784804B (zh) * 2021-02-03 2024-03-19 杭州电子科技大学 基于神经网络敏感性分析的微表情识别方法
CN112784804A (zh) * 2021-02-03 2021-05-11 杭州电子科技大学 基于神经网络敏感性分析的微表情识别方法
CN113033324A (zh) * 2021-03-03 2021-06-25 广东省地质环境监测总站 一种地质灾害前兆因子识别方法、装置,电子设备及存储介质
CN113033324B (zh) * 2021-03-03 2024-03-08 广东省地质环境监测总站 一种地质灾害前兆因子识别方法、装置,电子设备及存储介质

Also Published As

Publication number Publication date
CN106570474B (zh) 2019-06-28

Similar Documents

Publication Publication Date Title
CN106570474A (zh) 一种基于3d卷积神经网络的微表情识别方法
CN107844795B (zh) 基于主成分分析的卷积神经网络特征提取方法
CN107729819A (zh) 一种基于稀疏全卷积神经网络的人脸标注方法
CN107016406A (zh) 基于生成式对抗网络的病虫害图像生成方法
CN108961245A (zh) 基于双通道深度并行卷积网络的图像质量分类方法
CN108510012A (zh) 一种基于多尺度特征图的目标快速检测方法
CN108304826A (zh) 基于卷积神经网络的人脸表情识别方法
CN110348376A (zh) 一种基于神经网络的行人实时检测方法
CN108830252A (zh) 一种融合全局时空特征的卷积神经网络人体动作识别方法
CN107292813A (zh) 一种基于生成对抗网络的多姿态人脸生成方法
CN107633486A (zh) 基于三维全卷积神经网络的结构磁共振图像去噪方法
CN105894045A (zh) 一种基于空间金字塔池化的深度网络模型的车型识别方法
CN107749052A (zh) 基于深度学习神经网络的图像去雾方法及***
CN107945153A (zh) 一种基于深度学习的路面裂缝检测方法
CN105469100A (zh) 基于深度学习的皮肤活检图像病理特性识别方法
CN109359681A (zh) 一种基于改进全卷积神经网络的大田作物病虫害识别方法
CN103208097B (zh) 图像多方向形态结构分组的主分量分析协同滤波方法
CN108053398A (zh) 一种半监督特征学习的黑色素瘤自动检测方法
CN109753864A (zh) 一种基于caffe深度学习框架的人脸识别方法
CN108985252A (zh) 改进的脉冲深度神经网络的图像分类方法
CN107944428A (zh) 一种基于超像素集的室内场景语义标注方法
CN109508675A (zh) 一种针对复杂场景的行人检测方法
CN109359527B (zh) 基于神经网络的头发区域提取方法及***
CN107463954A (zh) 一种模糊异谱图像的模板匹配识别方法
CN110059593A (zh) 一种基于反馈卷积神经网络的面部表情识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: No. 66, New Model Road, Gulou District, Nanjing City, Jiangsu Province, 210000

Applicant after: Nanjing Post & Telecommunication Univ.

Address before: 210000 Wenyuan Road, Yadong New District, Nanjing City, Jiangsu Province

Applicant before: Nanjing Post & Telecommunication Univ.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20170419

Assignee: Nanjing causal Artificial Intelligence Research Institute Co., Ltd

Assignor: Nanjing Post & Telecommunication Univ.

Contract record no.: X2019320000168

Denomination of invention: Micro expression recognition method based on 3D convolution neural network

Granted publication date: 20190628

License type: Common License

Record date: 20191028

EE01 Entry into force of recordation of patent licensing contract