CN106845357A - 一种基于多通道网络的视频人脸检测和识别方法 - Google Patents

一种基于多通道网络的视频人脸检测和识别方法 Download PDF

Info

Publication number
CN106845357A
CN106845357A CN201611214990.4A CN201611214990A CN106845357A CN 106845357 A CN106845357 A CN 106845357A CN 201611214990 A CN201611214990 A CN 201611214990A CN 106845357 A CN106845357 A CN 106845357A
Authority
CN
China
Prior art keywords
face
image
video
attitude
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201611214990.4A
Other languages
English (en)
Other versions
CN106845357B (zh
Inventor
钱小鸿
车志聪
吴越
陈涛
李建元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yinjiang Technology Co.,Ltd.
Original Assignee
Enjoyor Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Enjoyor Co Ltd filed Critical Enjoyor Co Ltd
Priority to CN201611214990.4A priority Critical patent/CN106845357B/zh
Publication of CN106845357A publication Critical patent/CN106845357A/zh
Application granted granted Critical
Publication of CN106845357B publication Critical patent/CN106845357B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/165Detection; Localisation; Normalisation using facial parts and geometric relationships
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Geometry (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

一种基于多通道网络的视频人脸检测和识别方法,包括如下步骤:S1:视频预处理,给每一帧图像加上时间信息;S2:目标人脸检测和姿态系数计算;S3:人脸姿态纠正:对于S2中得到的m张人脸,进行姿态调整;S4:基于深度神经网络的人脸特征提取;S5人脸特征比对:对于输入的人脸,利用步骤S4得到特征向量后,再利用余弦距离来匹配输入人脸特征向量与特征库中向量的匹配度,与待识别人脸余弦距离大于设定阈值的类加入备选类中,如果待识别人脸的特征与所有类的中心特征的余弦距离均小于则视为数据库中未存储该人的信息,结束识别。本发明提供了一种准确率较高的基于多通道网络的视频人脸检测和识别方法。

Description

一种基于多通道网络的视频人脸检测和识别方法
技术领域
本发明涉及一种视频人脸检测识别领域,尤其是涉及一种基于深度学习的视频人脸识别方法。
背景技术
视频监控是安防***的一个重要组成部分。随着视频传感器技术以及相应配套技术的发展,从最开始的模拟监控***,之后的数字-模拟监控***,到现在开始应用的ip监控***,视频监控的应用范围越来越大,特别是公安***大量部署视频监控***以应用于治安管理以及疑犯追踪等领域。
快速发展的视频监控***产生了海量的监控视频数据,在治安管理及疑犯追踪领域对这些视频数据的一个主要的处理是通过一个人的一张或数张图片,找到该人出现过的视频文件以及相应的帧数。传统方式使用人力对这些视频数据进行查找、整理,主要的缺点在于查找效率低下,错误率高、需要反复排除,且花费时间长,随着视频监控***的不断发展以及监控视频数据的不断增加,传统的人人工查找的方法已经越来越不适用。
通过视频图像处理技术和模式识别技术自动地对收集到地视频信息进行处理、识别,已经在交通管理领域已经取得了十分成熟的应用。但是现有的基于图像处理的识别方法仅能够在理想环境下达到较高的识别准确率,在光线变化复杂、图像质量低下、待识别对象姿态变化时,漏检率和误检率便会迅速升高,所以对视频中人脸的自动识别、分析还不能达到实际应用的水平。
随着大数据和深度学习技术的发展,深度学习技术被应用于人脸检测***中,并取得较好的效果。现有的一些基于深度学习的视频人脸识别专利,如专利CN201511033733.6,将视频视作一组图片,并获取若干张质量较好的图片上的人脸进行识别,这种方法忽略了不同帧之间的联系,丢失了大量的信息,在视频质量变差时,使得最终识别的精确度严重下降。
专利CN201510471210.3提出一种基于深度神经网络的实时人脸识别方法,该方法通过深度神经网络提取人脸的特征向量,首先计算特征向量之间的汉明距离,然后选择处于阈值之下的人脸作为二次识别的对象,计算二次识别的特征向量的欧式距离,以欧式距离来判断待识别人脸属于人脸库中哪一个人脸,以提高人脸库规模较大时的运算效率。
从现有的方法来看,主要是提取视频图像中的某些帧的人脸信息,利用深度学习进行训练和检测识别,对于视频图像中各帧之间的时间-空间上联系还没有考虑,导致准确率较低。
发明内容
为了克服已有视频人脸检测和识别方法的准确率较低的不足,本发明提供了一种准确率较高的基于多通道网络的视频人脸检测和识别方法。
本发明解决其技术问题所采用的技术方案是:
一种基于多通道网络的视频人脸检测和识别方法,包括如下步骤:
S1:视频预处理
接收监控设备收集到的视频数据,并将其分解为一帧一帧的图像,给每一帧图像加上时间信息;
S2:目标人脸检测和姿态系数计算,过程如下:
提取视频图像中人脸位置以及对应的五官位置,计算视频图像中人脸以及标准姿态人脸五官的距离,计算姿态系数,整合姿态相近图像,将相邻帧间位置接近且姿态系数相差最小的人脸视为同一人脸族中的人脸;定义阈值φ,对于每一个人脸族,选取m张p<φ的人脸;如果在该人脸族中p<φ的人脸图像数为mp<φ张,则将该人脸族中姿态系p最小的一张人脸图像复制m-mp<φ份,与其他图像一同构成m张图像,输入到S3中;
S3:人脸姿态纠正:对于S2中得到的m张人脸,进行姿态调整;
S4:基于深度神经网络的人脸特征提取,过程如下:
S4.1人脸特征提取网络训练
在进行视频图像的人脸特征提取时,已预先利用人脸数据库进行特征模型训练,获取人脸数据库中每个人不同角度、不同光照下的M张图像,随机抽取其中m张图像,对这m张图像进行姿态矫正后,将其组合成w'×h'×3m的人脸图像,其中w'为训练图片的宽,h'为训练图片的高,3m为RGB3通道乘以图像数量m,对人脸数据库中每个人进行上述操作,并编上标签,输入到神经网络中训练;
S4.2视频人脸特征提取
通过S3中得到了m张w×h×3矫正后的人脸彩色图像,每个图像有3个通道,将不同图像以不同通道的形式融合在一起,即融合为一张有3×m个通道的人脸图像w×h×3m;
将得到的这张w×h×3m的人脸图像输入S4.1训练得到到人脸特征提取网络中,并最终得到一个代表该人脸的特征向量;
S5人脸特征比对
对于输入的人脸,利用步骤S4得到特征向量后,再利用余弦距离来匹配输入人脸特征向量与特征库中向量的匹配度,计算过程如下:
S5.1初步筛选
计算待识别人脸的特征与每个类的中心特征的余弦距离,计算方式如公式(10)所示,操作表示为向量的二范数,即向量的长度,cosθ即为向量与向量的余弦距离:
与待识别人脸余弦距离大于设定阈值的类加入备选类中,如果待识别人脸的特征与所有类的中心特征的余弦距离均小于则视为数据库中未存储该人的信息,结束识别。
进一步,所述步骤S5还包括以下步骤:
S5.2精确筛选
对于每一个备选类中的每一个人脸,计算它们的特征向量与待识别人脸的特征向量的余弦距离,选取其中余弦距离超过设定阈值ρ的人脸作为识别结果,并将识别结果所在的视频图像输出;如果每一个备选类中的每一个人脸与待识别人脸的余弦距离均小于ρ,则视为数据库中未存储该人的信息。
再进一步,所述步骤S1中,接收到的视频中的第一帧图像为图像1,然后按时间顺序设定视频中的第t帧图像为图像t,以It表示第t帧图像,以I表示同一视频的帧图像集合,完成对视频的预处理后,按时间从前到后的顺序将分解的图像传到人脸目标检测模块中。
更进一步,所述步骤S2中,目标人脸检测和姿态系数计算的过程如下:
S2.1提取视频图像中人脸位置以及对应的五官位置
对于每一帧图像It,利用哈尔特征找出该帧图像中存在的人脸以及对应的五官的坐标,分别记作F1(x1,y1),F2(x2,y2),F3(x3,y3),F4(x4,y4),F5(x5,y5);
S2.2计算视频图像中人脸以及标准姿态人脸五官的距离
令标准姿态图像I'中人脸五官的坐标为F1'(x'1,y'1),F2'(x'2,y'2),F3'(x'3,y'3),F4'(x'4,y'4),F5'(x'5,y'5),利用公式(1)和公式(2)计算视频图像It和标准姿态图像I'中人脸五官间相互距离:
其中,(xi,yi)、(xj,yj)表示待查找人脸中不同五官的坐标,(x'i,y'i)、(x'j,y'j)表示标准姿态图像中不同五官的坐标,dij表示待识别人脸五官间的相互距离,d'ij表示标准姿态图像中人脸五官间的相互距离;
S2.3计算姿态系数,整合姿态相近图像
定义人脸的姿态系数p,利用公式(3)计算姿态系数p:
其中,λ为缩放系数,用以避免待识别人脸图像与标准姿态图像尺度不一致时造成的误差,λ的值可由公式(4)计算得出,即λ取使得姿态系数最小的值;
所述步骤S3中,姿态调整的步骤如下:
S3.1计算人脸旋转向量
通过已知的标准人脸模型以及视频中五官特征点的坐标,使用POSIT算法得到图像中人脸的姿态信息,即人脸的旋转向量R,即
S3.2计算矫正图像和原图像的映射关系
通过人脸的旋转向量,得到矫正后人脸图像中某一像素点到原人脸图像中某一像素点的映射关系,在矫正后图像中以人脸中轴为y轴,以两眼的连线为x轴,构建坐标系,令(x,y)=f(x',y')为矫正后图像上一点(x',y')到原图像上一点(x,y)的映射,具体如下:
S3.3姿态矫正
rgb'(x,y)为矫正后图像上(x,y)处的rgb值,rgb(x,y)为原人脸图像上(x,y)处的rgb值,则利用公式(7)得到矫正后人脸图像中某一点(x,y)上的rgb值,设
其中,G为高斯概率矩阵,在实际操作过程中,因为不同人脸的实际三维模型和标准三维模型存在一定差别,所以矫正后图像上的某一点与原图像对应点的映射关系会存在一定误差,因而矫正后图像上某一点的rgb值由原图像上对应位置处附近9个点的rgb共同得出,即通过高斯概率矩阵G求得该点处rgb值的期望值,作为该点的rgb值;公式(7)中k是事先设定好比例值;
对同一人脸族中的每张人脸进行人脸姿态矫正后,得到m若干张大小为w×h×3的人脸图像,即一张拥有RGB3个通道的w×h像素的彩色图像。
所述步骤S4.1中,采用梯度下降算法训练神经网络,每输入batch张图片并计算损失后更新神经网络的权重,网络中全连接层3输出的512维向量表示输入的人脸是哪一人的概率,对其做softmax回归,得到相应的损失函数,即如公式(9)所示,其中,k表示输入图像所属的类别,zk表示全连接层3输出的512维向量中的第k个数值:
loss=∑-logf(zk) (10)
计算了损失函数后,通过前向推断计算和反向梯度计算,计算出神经网络中各层的更新值,对各层的权值进行更新;
预先对数据库中的人脸特征集进行聚类分析以建立空间索引,操作步骤如下:
S4.1.1对于人脸特征库中的特征使用聚类算法,将这些人脸特征聚为若干类;
S4.1.2对于每一类,计算类中所有人脸的特征向量的均值,记作该类的中心特征。
本发明利用监控视频的各帧之间的关联性,结合深度学习方法,能够在海量的视频文件中目标人脸出现过的视频文件以及所在的帧数。相较于其它方法,本发明通过收集同一个人在不同帧中的图像信息,加以综合考虑,能够最大程度地利用视频数据地信息,从而提高识别地准确率。
本发明的有益效果主要表现在:
1、以往的方法对视频中人脸进行检测时,都是单独地考虑不同帧中的图像,未能够有效地利用视频中的信息。本方法利用将不同图像视作不同通道的方法,将同一个人脸在不同帧中的图像融合为一张多通道的图像,并利用多层卷积网络隐式地提取综合提取这些图像的联合特征。一方面,能够最大程度的利用视频中的信息,提高了准确率;另一方面,多张图像同时输入到神经网络中,避免了多次输入造成的时间浪费;
2、由于需要将多张人脸图像融合为一张图像,必须要确保不同人脸图像中相同位置的特征大致保持一致,即在不同图像中,眼睛、鼻子等要大致处于同一个位置。否则特征提取网络会难以收敛。因而,在进行特征提取之前,必须对人脸图像进行姿态矫正。在本方法里的人脸姿态中,利用了人脸沿中轴线对称的特点,矫正后人脸上某一点的rgb值有其在原图对应位置的rgb值以及沿中轴线对称处对应点的rgb值综合得出。这样,很大程度上避免了一般人脸姿态矫正方法中的信息丢失的弊端,提高了最终识别的准确率;
3、对于视频中特定帧的选取必须要考虑到帧的质量,而帧图像中的人脸姿态是决定帧质量的一个主要因素,但实际过程中对每一帧图像中的每一个人脸都进行姿态估计的代价过大。所以本方法中定义了一种姿态系数来判断人脸的姿态,其能够较好地反映人脸的姿态,同时计算量小。因而能够快速准确地找出一个人脸族中质量较好地若干帧图像。
附图说明
图1是本发明的总体流程图。
图2是本发明实施例中采用的深度学习网络结构图。
具体实施方式
下面结合附图对本发明作进一步描述。
参照图1和图2,一种基于多通道网络的视频人脸检测和识别方法,所述的方法包括如下步骤:
S1:视频预处理
接收监控设备收集到的视频数据,并将其分解为一帧一帧的图像,给每一帧图像加上时间信息,具体为:接收到的视频中的第一帧图像为图像1,然后按时间顺序设定视频中的第t帧图像为图像t。在下面的叙述中,以It表示第t帧图像,以I表示同一视频的帧图像集合。完成对视频的预处理后,按时间从前到后的顺序将分解的图像传到人脸目标检测模块中。
S2:目标人脸检测和姿态系数计算
S2.1提取视频图像中人脸位置以及对应的五官位置
对于每一帧图像It,利用哈尔特征找出该帧图像中存在的人脸以及对应的五官(双眼、鼻尖以及嘴唇的两侧)的坐标,分别记作F1(x1,y1),F2(x2,y2),F3(x3,y3)。F4(x4,y4),F5(x5,y5)
S2.2计算视频图像中人脸以及标准姿态人脸五官的距离
令标准姿态图像I'中人脸五官(双眼、鼻尖以及嘴唇的两侧)的坐标为F1'(x'1,y'1),F2'(x'2,y'2),F3'(x'3,y'3)。F4'(x'4,y'4),F5'(x'5,y'5),利用公式(1)和公式(2)计算视频图像It和标准姿态图像I'中人脸五官间相互距离。
其中,(xi,yi)、(xj,yj)表示待查找人脸中不同五官的坐标,(x'i,y'i)、(x'j,y'j)表示标准姿态图像中不同五官的坐标,dij表示待识别人脸五官间的相互距离,d'ij表示标准姿态图像中人脸五官间的相互距离。
S2.3计算姿态系数,整合姿态相近图像。
定义人脸的姿态系数p,利用公式(3)计算姿态系数p,用于衡量待识别人脸的姿态与标准姿态的差异,p越小表示待识别人脸的姿态越标准,即将其作为人脸识别的图像的准确率越高;p越大表示待识别人脸的姿态更偏离标准姿态,即图像质量较差,将其作为人脸识别的图像的准确率越低:
其中,λ为缩放系数,用以避免待识别人脸图像与标准姿态图像尺度不一致时造成的误差,λ的值可由公式(4)计算得出,即λ取使得姿态系数最小的值。
计算所有检测到的人脸图像的姿态系数,将相邻帧间位置接近且姿态系数相差最小的人脸视为同一人脸族中的人脸。定义阈值φ,对于每一个人脸族,选取m张p<φ的人脸。如果在该人脸族中p<φ的人脸图像数为mp<φ张,则将该人脸族中姿态系p最小的一张人脸图像复制m-mp<φ份,与其他图像一同构成m张图像,输入到S3中。
S3:人脸姿态纠正
对于S2中得到的m张人脸,进行姿态调整,具体步骤如下:
S3.1计算人脸旋转向量
在监控视频中,出现的人一般离摄像头较远,即人脸上特征点离摄像头的距离要远大于它们之间距离,则可以通过已知的标准人脸模型以及视频中五官特征点的坐标,使用POSIT算法得到图像中人脸的姿态信息,即人脸的旋转向量R。即
S3.2计算矫正图像和原图像的映射关系
通过人脸的旋转向量,可以得到矫正后人脸图像中某一像素点到原人脸图像中某一像素点的映射关系,在矫正后图像中以人脸中轴为y轴,以两眼的连线为x轴,构建坐标系。令(x,y)=f(x',y')为矫正后图像上一点(x',y')到原图像上一点(x,y)的映射。具体如下:
S3.3姿态矫正
rgb'(x,y)为矫正后图像上(x,y)处的rgb值,rgb(x,y)为原人脸图像上(x,y)处的rgb值。则利用公式(7)得到矫正后人脸图像中某一点(x,y)上的rgb值。设
其中,G为高斯概率矩阵,在实际操作过程中,因为不同人脸的实际三维模型和标准三维模型存在一定差别,所以矫正后图像上的某一点与原图像对应点的映射关系会存在一定误差,因而矫正后图像上某一点的rgb值由原图像上对应位置处附近9个点的rgb共同得出,即通过高斯概率矩阵G求得该点处rgb值的期望值,作为该点的rgb值。
这里,矫正图像利用人脸对称的特性,矫正后的人脸图像信息综合考虑人脸地侧的信息,最大化地提取信息,避免了人脸旋转角度过大时姿态矫正后信息丢失的问题。公式(7)中k是事先设定好比例值,在0-0.5之间取值,k越小意味着更多地考虑单独一侧的图像信息,k越大意味者更多地综合考虑两侧的图像信息。
对同一人脸族中的每张人脸进行人脸姿态矫正后,得到m若干张大小为w×h×3的人脸图像,即一张拥有RGB3个通道的w×h像素的彩色图像。
S4基于深度神经网络的人脸特征提取
S4.1人脸特征提取网络训练
在进行视频图像的人脸特征提取时,已预先利用人脸数据库进行特征模型训练。训练方式如下:
获取人脸数据库中每个人不同角度、不同光照下的M张图像,随机抽取其中m张图像,对这m张图像进行姿态矫正后,将其组合成w'×h'×3m的人脸图像,其中w'为训练图片的宽,h'为训练图片的高,3m为RGB3通道乘以图像数量m。对人脸数据库中每个人进行上述操作,并编上标签,输入到神经网络中训练。
这种将不同图像视为不同通道融合后作为输入的神经网络我们将其称为多通道网络。
本发明采用梯度下降算法训练神经网络,batch设定为256,即每输入256张图片并计算损失后更新神经网络的权重。
上述网络中全连接层3输出的512维向量表示输入的人脸是哪一人的概率,对其做softmax回归,得到相应的损失函数,即如公式(9)所示,其中,k表示输入图像所属的类别,zk表示全连接层3输出的512维向量中的第k个数值。
loss=∑-logf(zk) (19)
计算了损失函数后,通过前向推断计算和反向梯度计算,计算出神经网络中各层的更新值,对各层的权值进行更新,以实现减少loss的目的,从而优化网络。
在实际应用中,考虑到数据库中已经存储的人脸的数目可能十分巨大,可以预先先对数据库中的人脸特征集进行聚类分析以建立空间索引,具体操作步骤如下:
S4.1.1对于人脸特征库中的特征使用聚类算法,如Kmeans,将这些人脸特征聚为若干类。
S4.1.2对于每一类,计算类中所有人脸的特征向量的均值,记作该类的中心特征。
S4.2视频人脸特征提取
通过S3中得到了m张w×h×3矫正后的人脸彩色图像,每个图像有3个通道,将不同图像以不同通道的形式融合在一起,即融合为一张有3×m个通道的人脸图像w×h×3m
将得到的这张w×h×3m的人脸图像输入S4.1训练得到到人脸特征提取网络中,并最终得到一个代表该人脸的特征向量。
S5人脸特征比对
对于输入的人脸,利用步骤S4得到特征向量后,再利用余弦距离来匹配输入人脸特征向量与特征库中向量的匹配度,计算过程如下:
S5.1初步筛选
计算待识别人脸的特征与每个类的中心特征的余弦距离,计算方式如公式(10)所示,操作表示为向量的二范数,即向量的长度(表示向量的长度,表示向量的长度),cosθ即为向量与向量的余弦距离:
与待识别人脸余弦距离大于设定阈值的类加入备选类中。如果待识别人脸的特征与所有类的中心特征的余弦距离均小于则视为数据库中未存储该人的信息,结束识别。
S5.2精确筛选
对于每一个备选类中的每一个人脸,计算它们的特征向量与待识别人脸的特征向量的余弦距离,选取其中余弦距离超过设定阈值ρ的人脸作为识别结果,并将识别结果所在的视频图像输出;如果每一个备选类中的每一个人脸与待识别人脸的余弦距离均小于ρ,则视为数据库中未存储该人的信息,结束识别。
至此,完成视频人脸的识别。

Claims (6)

1.一种基于多通道网络的视频人脸检测和识别方法,其特征在于:所述的方法包括如下步骤:
S1:视频预处理
接收监控设备收集到的视频数据,并将其分解为一帧一帧的图像,给每一帧图像加上时间信息;
S2:目标人脸检测和姿态系数计算,过程如下:
提取视频图像中人脸位置以及对应的五官位置,计算视频图像中人脸以及标准姿态人脸五官的距离,计算姿态系数,整合姿态相近图像,将相邻帧间位置接近且姿态系数相差最小的人脸视为同一人脸族中的人脸;定义阈值φ,对于每一个人脸族,选取m张p<φ的人脸;如果在该人脸族中p<φ的人脸图像数为mp<φ张,则将该人脸族中姿态系p最小的一张人脸图像复制m-mp<φ份,与其他图像一同构成m张图像,输入到S3中;
S3:人脸姿态纠正:对于S2中得到的m张人脸,进行姿态调整;
S4:基于深度神经网络的人脸特征提取,过程如下:
S4.1人脸特征提取网络训练
在进行视频图像的人脸特征提取时,已预先利用人脸数据库进行特征模型训练,获取人脸数据库中每个人不同角度、不同光照下的M张图像,随机抽取其中m张图像,对这m张图像进行姿态矫正后,将其组合成w'×h'×3m的人脸图像,其中w'为训练图片的宽,h'为训练图片的高,3m为RGB3通道乘以图像数量m,对人脸数据库中每个人进行上述操作,并编上标签,输入到神经网络中训练;
S4.2视频人脸特征提取
通过S3中得到了m张w×h×3矫正后的人脸彩色图像,每个图像有3个通道,将不同图像以不同通道的形式融合在一起,即融合为一张有3×m个通道的人脸图像w×h×3m;
将得到的这张w×h×3m的人脸图像输入S4.1训练得到到人脸特征提取网络中,并最终得到一个代表该人脸的特征向量;
S5人脸特征比对
对于输入的人脸,利用步骤S4得到特征向量后,再利用余弦距离来匹配输入人脸特征向量与特征库中向量的匹配度,计算过程如下:
S5.1初步筛选
计算待识别人脸的特征与每个类的中心特征的余弦距离,计算方式如公式(10)所示,操作表示为向量的二范数,即向量的长度,cosθ即为向量与向量的余弦距离:
c o s θ = X 1 → · X 2 → | | X 1 → | | · | | X 2 → | | - - - ( 1 )
与待识别人脸余弦距离大于设定阈值的类加入备选类中,如果待识别人脸的特征与所有类的中心特征的余弦距离均小于则视为数据库中未存储该人的信息,结束识别。
2.如权利要求1所述的一种基于多通道网络的视频人脸检测和识别方法,其特征在于:所述步骤S5还包括以下步骤:
S5.2精确筛选
对于每一个备选类中的每一个人脸,计算它们的特征向量与待识别人脸的特征向量的余弦距离,选取其中余弦距离超过设定阈值ρ的人脸作为识别结果,并将识别结果所在的视频图像输出;如果每一个备选类中的每一个人脸与待识别人脸的余弦距离均小于ρ,则视为数据库中未存储该人的信息。
3.如权利要求1或2所述的一种基于多通道网络的视频人脸检测和识别方法,其特征在于:所述步骤S1中,接收到的视频中的第一帧图像为图像1,然后按时间顺序设定视频中的第t帧图像为图像t,以It表示第t帧图像,以I表示同一视频的帧图像集合,完成对视频的预处理后,按时间从前到后的顺序将分解的图像传到人脸目标检测模块中。
4.如权利要求1或2所述的一种基于多通道网络的视频人脸检测和识别方法,其特征在于:所述步骤S2中,目标人脸检测和姿态系数计算的过程如下:
S2.1提取视频图像中人脸位置以及对应的五官位置
对于每一帧图像It,利用哈尔特征找出该帧图像中存在的人脸以及对应的五官的坐标,分别记作F1(x1,y1),F2(x2,y2),F3(x3,y3),F4(x4,y4),F5(x5,y5);
S2.2计算视频图像中人脸以及标准姿态人脸五官的距离
令标准姿态图像I'中人脸五官的坐标为F1'(x'1,y'1),F2'(x'2,y'2),F3'(x'3,y'3),F4'(x'4,y'4),F5'(x'5,y'5),利用公式(1)和公式(2)计算视频图像It和标准姿态图像I'中人脸五官间相互距离:
d i j = ( x i - x j ) 2 + ( y i - y j ) 2 - - - ( 2 )
d ′ i j = ( x ′ i - x ′ j ) 2 + ( y ′ i - y ′ j ) 2 - - - ( 3 )
其中,(xi,yi)、(xj,yj)表示待查找人脸中不同五官的坐标,(x'i,y'i)、(x'j,y'j)表示标准姿态图像中不同五官的坐标,dij表示待识别人脸五官间的相互距离,d'ij表示标准姿态图像中人脸五官间的相互距离;
S2.3计算姿态系数,整合姿态相近图像
定义人脸的姿态系数p,利用公式(3)计算姿态系数p:
p = Σ i Σ j > i ( λd i j - d ′ i j ) 2 Σ i Σ j > i d ′ i j 2 - - - ( 4 )
其中,λ为缩放系数,用以避免待识别人脸图像与标准姿态图像尺度不一致时造成的误差,λ的值可由公式(4)计算得出,即λ取使得姿态系数最小的值;
λ = Σ i Σ j > i d i j d ′ i j Σ i Σ j > i d i j 2 - - - ( 5 ) .
5.如权利要求4所述的一种基于多通道网络的视频人脸检测和识别方法,其特征在于:所述步骤S3中,姿态调整的步骤如下:
S3.1计算人脸旋转向量
通过已知的标准人脸模型以及视频中五官特征点的坐标,使用POSIT算法得到图像中人脸的姿态信息,即人脸的旋转向量R,即
R = R 11 R 12 R 13 R 21 R 22 R 23 R 31 R 32 R 33 = R 1 T R 2 T R 3 T - - - ( 6 )
S3.2计算矫正图像和原图像的映射关系
通过人脸的旋转向量,得到矫正后人脸图像中某一像素点到原人脸图像中某一像素点的映射关系,在矫正后图像中以人脸中轴为y轴,以两眼的连线为x轴,构建坐标系,令(x,y)=f(x',y')为矫正后图像上一点(x',y')到原图像上一点(x,y)的映射,具体如下:
f ( x ′ , y ′ ) = [ x ′ , y ′ , 0 ] × R 11 R 12 R 21 R 22 R 31 R 32 - - - ( 7 )
S3.3姿态矫正
rgb'(x,y)为矫正后图像上(x,y)处的rgb值,rgb(x,y)为原人脸图像上(x,y)处的rgb值,则利用公式(7)得到矫正后人脸图像中某一点(x,y)上的rgb值,设
rgb ′ ( x , y ) = Σ i = - 1 , 0 , 1 Σ j = - 1 , 0 , 1 ( 1 - k ) × r g b ( f ( x , y ) + [ i , j ] ) × G ( i , j ) + Σ i = - 1 , 0 , 1 Σ j = - 1 , 0 , 1 k × r g b ( f ( - x , y ) + [ i , j ] ) × G ( i , j ) - - - ( 8 )
G = 0.0947 0.1183 0.0947 0.1183 0.1477 0.1183 0.0947 0.1183 0.0947 - - - ( 9 )
其中,G为高斯概率矩阵,在实际操作过程中,因为不同人脸的实际三维模型和标准三维模型存在一定差别,所以矫正后图像上的某一点与原图像对应点的映射关系会存在一定误差,因而矫正后图像上某一点的rgb值由原图像上对应位置处附近9个点的rgb共同得出,即通过高斯概率矩阵G求得该点处rgb值的期望值,作为该点的rgb值;公式(7)中k是事先设定好比例值;
对同一人脸族中的每张人脸进行人脸姿态矫正后,得到m若干张大小为w×h×3的人脸图像,即一张拥有RGB3个通道的w×h像素的彩色图像。
6.如权利要求5所述的一种基于多通道网络的视频人脸检测和识别方法,其特征在于:所述步骤S4.1中,采用梯度下降算法训练神经网络,每输入batch张图片并计算损失后更新神经网络的权重,网络中全连接层3输出的512维向量表示输入的人脸是哪一人的概率,对其做softmax回归,得到相应的损失函数,即如公式(9)所示,其中,k表示输入图像所属的类别,zk表示全连接层3输出的512维向量中的第k个数值:
loss=∑-log f(zk) (10)
计算了损失函数后,通过前向推断计算和反向梯度计算,计算出神经网络中各层的更新值,对各层的权值进行更新;
预先对数据库中的人脸特征集进行聚类分析以建立空间索引,操作步骤如下:
S4.1.1对于人脸特征库中的特征使用聚类算法,将这些人脸特征聚为若干类;
S4.1.2对于每一类,计算类中所有人脸的特征向量的均值,记作该类的中心特征。
CN201611214990.4A 2016-12-26 2016-12-26 一种基于多通道网络的视频人脸检测和识别方法 Active CN106845357B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611214990.4A CN106845357B (zh) 2016-12-26 2016-12-26 一种基于多通道网络的视频人脸检测和识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611214990.4A CN106845357B (zh) 2016-12-26 2016-12-26 一种基于多通道网络的视频人脸检测和识别方法

Publications (2)

Publication Number Publication Date
CN106845357A true CN106845357A (zh) 2017-06-13
CN106845357B CN106845357B (zh) 2019-11-05

Family

ID=59137016

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611214990.4A Active CN106845357B (zh) 2016-12-26 2016-12-26 一种基于多通道网络的视频人脸检测和识别方法

Country Status (1)

Country Link
CN (1) CN106845357B (zh)

Cited By (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107392129A (zh) * 2017-07-13 2017-11-24 浙江捷尚视觉科技股份有限公司 基于Softmax的人脸检索方法和***
CN107481318A (zh) * 2017-08-09 2017-12-15 广东欧珀移动通信有限公司 用户头像的替换方法、装置和终端设备
CN107798308A (zh) * 2017-11-09 2018-03-13 石数字技术成都有限公司 一种基于短视频训练法的人脸识别方法
CN107818316A (zh) * 2017-11-24 2018-03-20 合肥博焱智能科技有限公司 一种批量人脸识别***
CN107944416A (zh) * 2017-12-06 2018-04-20 成都睿码科技有限责任公司 一种通过视频进行真人验证的方法
CN108108676A (zh) * 2017-12-12 2018-06-01 北京小米移动软件有限公司 人脸识别方法、卷积神经网络生成方法及装置
CN108171191A (zh) * 2018-01-05 2018-06-15 百度在线网络技术(北京)有限公司 用于检测人脸的方法和装置
CN108197574A (zh) * 2018-01-04 2018-06-22 张永刚 人物风格识别方法、终端及计算机可读存储介质
CN108256459A (zh) * 2018-01-10 2018-07-06 北京博睿视科技有限责任公司 基于多摄像机融合的安检门人脸识别和人脸自动建库算法
CN108427871A (zh) * 2018-01-30 2018-08-21 深圳奥比中光科技有限公司 3d人脸快速身份认证方法与装置
CN108460329A (zh) * 2018-01-15 2018-08-28 任俊芬 一种基于深度学习检测的人脸手势配合验证方法
CN108875602A (zh) * 2018-05-31 2018-11-23 珠海亿智电子科技有限公司 监控环境下基于深度学习的人脸识别方法
CN109145940A (zh) * 2018-07-02 2019-01-04 北京陌上花科技有限公司 图像识别方法和装置
CN109190561A (zh) * 2018-09-04 2019-01-11 四川长虹电器股份有限公司 一种视频播放中的人脸识别方法及***
CN109344764A (zh) * 2018-09-28 2019-02-15 大连民族大学 度量视频连续帧与其卷积特征图间差异的***及装置
CN109389588A (zh) * 2018-09-28 2019-02-26 大连民族大学 度量视频连续帧与其卷积特征图间差异的方法
CN109684913A (zh) * 2018-11-09 2019-04-26 长沙小钴科技有限公司 一种基于社区发现聚类的视频人脸标注方法和***
CN109800685A (zh) * 2018-12-29 2019-05-24 上海依图网络科技有限公司 一种视频中对象的确定方法及装置
CN109949276A (zh) * 2019-02-28 2019-06-28 华中科技大学 一种于改进SegNet分割网络的***检测方法
CN110276320A (zh) * 2019-06-26 2019-09-24 杭州创匠信息科技有限公司 基于人脸识别的门禁方法、装置、设备和存储介质
CN110555338A (zh) * 2018-05-30 2019-12-10 北京三星通信技术研究有限公司 对象识别方法和装置、神经网络生成方法和装置
CN110555342A (zh) * 2018-05-31 2019-12-10 杭州海康威视数字技术股份有限公司 一种图像识别方法、装置和图像设备
CN110648324A (zh) * 2019-09-29 2020-01-03 百度在线网络技术(北京)有限公司 车辆爆胎预警方法、装置以及计算机设备
CN110738103A (zh) * 2019-09-04 2020-01-31 北京奇艺世纪科技有限公司 活体检测方法、装置、计算机设备和存储介质
CN110751163A (zh) * 2018-07-24 2020-02-04 杭州海康威视数字技术股份有限公司 目标定位方法及其装置、计算机可读存储介质和电子设备
CN110874602A (zh) * 2018-08-30 2020-03-10 北京嘀嘀无限科技发展有限公司 一种图像识别方法及装置
CN111178129A (zh) * 2019-11-25 2020-05-19 浙江工商大学 一种基于人脸和姿态的多模态人员识别方法
CN111325712A (zh) * 2020-01-20 2020-06-23 北京百度网讯科技有限公司 用于检测图像有效性的方法及装置
CN111339973A (zh) * 2020-03-03 2020-06-26 北京华捷艾米科技有限公司 一种对象识别方法、装置、设备及存储介质
CN111681271A (zh) * 2020-08-11 2020-09-18 湖南大学 一种多通道多光谱相机配准方法、***及介质
CN111737525A (zh) * 2020-06-03 2020-10-02 西安交通大学 一种多视频节目匹配方法
CN111814760A (zh) * 2020-08-24 2020-10-23 湖南视觉伟业智能科技有限公司 人脸识别方法及***
CN112418322A (zh) * 2020-11-24 2021-02-26 苏州爱医斯坦智能科技有限公司 影像数据处理方法、装置、电子设备及存储介质
CN112525352A (zh) * 2020-11-24 2021-03-19 深圳市高巨创新科技开发有限公司 一种基于人脸识别的红外测温补偿方法及终端
CN112668362A (zh) * 2019-10-15 2021-04-16 浙江中正智能科技有限公司 一种动态优化类代理的人证比对模型训练方法
CN113269022A (zh) * 2021-03-24 2021-08-17 七台河市公安局 一种用于预测隐性特定人员的***及方法
CN113837040A (zh) * 2021-09-14 2021-12-24 天津市国瑞数码安全***股份有限公司 一种基于深度神经网络的视频人脸检测方法及***
WO2022252527A1 (zh) * 2021-05-31 2022-12-08 深圳市商汤科技有限公司 神经网络训练及人脸识别方法、装置、设备及存储介质
CN116311464A (zh) * 2023-03-24 2023-06-23 北京的卢铭视科技有限公司 模型训练方法、人脸识别方法、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102004899A (zh) * 2010-11-03 2011-04-06 无锡中星微电子有限公司 一种人脸认证***及方法
CN103049459A (zh) * 2011-10-17 2013-04-17 天津市亚安科技股份有限公司 一种基于特征识别的快速录像检索方法
CN105654055A (zh) * 2015-12-29 2016-06-08 广东顺德中山大学卡内基梅隆大学国际联合研究院 一种利用视频数据进行人脸识别训练的方法
CN106127170A (zh) * 2016-07-01 2016-11-16 重庆中科云丛科技有限公司 一种融合关键特征点的训练方法、识别方法及***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102004899A (zh) * 2010-11-03 2011-04-06 无锡中星微电子有限公司 一种人脸认证***及方法
CN103049459A (zh) * 2011-10-17 2013-04-17 天津市亚安科技股份有限公司 一种基于特征识别的快速录像检索方法
CN105654055A (zh) * 2015-12-29 2016-06-08 广东顺德中山大学卡内基梅隆大学国际联合研究院 一种利用视频数据进行人脸识别训练的方法
CN106127170A (zh) * 2016-07-01 2016-11-16 重庆中科云丛科技有限公司 一种融合关键特征点的训练方法、识别方法及***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ZHIMING LIU 等: "Fusion ofcolor,localspatialandglobalfrequencyinformation", 《PATTERN RECOGNITION》 *

Cited By (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107392129A (zh) * 2017-07-13 2017-11-24 浙江捷尚视觉科技股份有限公司 基于Softmax的人脸检索方法和***
CN107481318A (zh) * 2017-08-09 2017-12-15 广东欧珀移动通信有限公司 用户头像的替换方法、装置和终端设备
CN107798308A (zh) * 2017-11-09 2018-03-13 石数字技术成都有限公司 一种基于短视频训练法的人脸识别方法
CN107798308B (zh) * 2017-11-09 2020-09-22 一石数字技术成都有限公司 一种基于短视频训练法的人脸识别方法
CN107818316A (zh) * 2017-11-24 2018-03-20 合肥博焱智能科技有限公司 一种批量人脸识别***
CN107944416A (zh) * 2017-12-06 2018-04-20 成都睿码科技有限责任公司 一种通过视频进行真人验证的方法
CN108108676A (zh) * 2017-12-12 2018-06-01 北京小米移动软件有限公司 人脸识别方法、卷积神经网络生成方法及装置
CN108197574A (zh) * 2018-01-04 2018-06-22 张永刚 人物风格识别方法、终端及计算机可读存储介质
CN108197574B (zh) * 2018-01-04 2020-09-08 张永刚 人物风格识别方法、终端及计算机可读存储介质
CN108171191A (zh) * 2018-01-05 2018-06-15 百度在线网络技术(北京)有限公司 用于检测人脸的方法和装置
CN108256459B (zh) * 2018-01-10 2021-08-24 北京博睿视科技有限责任公司 基于多摄像机融合的安检门人脸识别和人脸自动建库算法
CN108256459A (zh) * 2018-01-10 2018-07-06 北京博睿视科技有限责任公司 基于多摄像机融合的安检门人脸识别和人脸自动建库算法
CN108460329A (zh) * 2018-01-15 2018-08-28 任俊芬 一种基于深度学习检测的人脸手势配合验证方法
CN108460329B (zh) * 2018-01-15 2022-02-11 任俊芬 一种基于深度学习检测的人脸手势配合验证方法
CN108427871A (zh) * 2018-01-30 2018-08-21 深圳奥比中光科技有限公司 3d人脸快速身份认证方法与装置
CN110555338A (zh) * 2018-05-30 2019-12-10 北京三星通信技术研究有限公司 对象识别方法和装置、神经网络生成方法和装置
CN110555342B (zh) * 2018-05-31 2022-08-26 杭州海康威视数字技术股份有限公司 一种图像识别方法、装置和图像设备
CN108875602A (zh) * 2018-05-31 2018-11-23 珠海亿智电子科技有限公司 监控环境下基于深度学习的人脸识别方法
CN110555342A (zh) * 2018-05-31 2019-12-10 杭州海康威视数字技术股份有限公司 一种图像识别方法、装置和图像设备
CN109145940A (zh) * 2018-07-02 2019-01-04 北京陌上花科技有限公司 图像识别方法和装置
CN110751163B (zh) * 2018-07-24 2023-05-26 杭州海康威视数字技术股份有限公司 目标定位方法及其装置、计算机可读存储介质和电子设备
CN110751163A (zh) * 2018-07-24 2020-02-04 杭州海康威视数字技术股份有限公司 目标定位方法及其装置、计算机可读存储介质和电子设备
CN110874602A (zh) * 2018-08-30 2020-03-10 北京嘀嘀无限科技发展有限公司 一种图像识别方法及装置
CN109190561B (zh) * 2018-09-04 2022-03-22 四川长虹电器股份有限公司 一种视频播放中的人脸识别方法及***
CN109190561A (zh) * 2018-09-04 2019-01-11 四川长虹电器股份有限公司 一种视频播放中的人脸识别方法及***
CN109389588A (zh) * 2018-09-28 2019-02-26 大连民族大学 度量视频连续帧与其卷积特征图间差异的方法
CN109344764A (zh) * 2018-09-28 2019-02-15 大连民族大学 度量视频连续帧与其卷积特征图间差异的***及装置
CN109684913A (zh) * 2018-11-09 2019-04-26 长沙小钴科技有限公司 一种基于社区发现聚类的视频人脸标注方法和***
CN109800685A (zh) * 2018-12-29 2019-05-24 上海依图网络科技有限公司 一种视频中对象的确定方法及装置
CN109949276A (zh) * 2019-02-28 2019-06-28 华中科技大学 一种于改进SegNet分割网络的***检测方法
CN110276320A (zh) * 2019-06-26 2019-09-24 杭州创匠信息科技有限公司 基于人脸识别的门禁方法、装置、设备和存储介质
CN110738103A (zh) * 2019-09-04 2020-01-31 北京奇艺世纪科技有限公司 活体检测方法、装置、计算机设备和存储介质
CN110648324A (zh) * 2019-09-29 2020-01-03 百度在线网络技术(北京)有限公司 车辆爆胎预警方法、装置以及计算机设备
CN112668362B (zh) * 2019-10-15 2023-06-16 浙江中正智能科技有限公司 一种动态优化类代理的人证比对模型训练方法
CN112668362A (zh) * 2019-10-15 2021-04-16 浙江中正智能科技有限公司 一种动态优化类代理的人证比对模型训练方法
CN111178129A (zh) * 2019-11-25 2020-05-19 浙江工商大学 一种基于人脸和姿态的多模态人员识别方法
CN111325712B (zh) * 2020-01-20 2024-01-23 北京百度网讯科技有限公司 用于检测图像有效性的方法及装置
CN111325712A (zh) * 2020-01-20 2020-06-23 北京百度网讯科技有限公司 用于检测图像有效性的方法及装置
CN111339973A (zh) * 2020-03-03 2020-06-26 北京华捷艾米科技有限公司 一种对象识别方法、装置、设备及存储介质
CN111737525A (zh) * 2020-06-03 2020-10-02 西安交通大学 一种多视频节目匹配方法
CN111737525B (zh) * 2020-06-03 2022-10-25 西安交通大学 一种多视频节目匹配方法
CN111681271A (zh) * 2020-08-11 2020-09-18 湖南大学 一种多通道多光谱相机配准方法、***及介质
CN111814760B (zh) * 2020-08-24 2021-06-01 湖南视觉伟业智能科技有限公司 人脸识别方法及***
CN111814760A (zh) * 2020-08-24 2020-10-23 湖南视觉伟业智能科技有限公司 人脸识别方法及***
CN112525352A (zh) * 2020-11-24 2021-03-19 深圳市高巨创新科技开发有限公司 一种基于人脸识别的红外测温补偿方法及终端
CN112418322A (zh) * 2020-11-24 2021-02-26 苏州爱医斯坦智能科技有限公司 影像数据处理方法、装置、电子设备及存储介质
CN113269022A (zh) * 2021-03-24 2021-08-17 七台河市公安局 一种用于预测隐性特定人员的***及方法
WO2022252527A1 (zh) * 2021-05-31 2022-12-08 深圳市商汤科技有限公司 神经网络训练及人脸识别方法、装置、设备及存储介质
CN113837040A (zh) * 2021-09-14 2021-12-24 天津市国瑞数码安全***股份有限公司 一种基于深度神经网络的视频人脸检测方法及***
CN116311464A (zh) * 2023-03-24 2023-06-23 北京的卢铭视科技有限公司 模型训练方法、人脸识别方法、电子设备及存储介质
CN116311464B (zh) * 2023-03-24 2023-12-12 北京的卢铭视科技有限公司 模型训练方法、人脸识别方法、电子设备及存储介质

Also Published As

Publication number Publication date
CN106845357B (zh) 2019-11-05

Similar Documents

Publication Publication Date Title
CN106845357A (zh) 一种基于多通道网络的视频人脸检测和识别方法
CN106683091B (zh) 一种基于深度卷积神经网络的目标分类及姿态检测方法
CN106778604B (zh) 基于匹配卷积神经网络的行人再识别方法
CN106033435B (zh) 物品识别方法和装置,室内地图生成方法和装置
CN104517102B (zh) 学生课堂注意力检测方法及***
CN104881637B (zh) 基于传感信息及目标追踪的多模信息***及其融合方法
CN103824070B (zh) 一种基于计算机视觉的快速行人检测方法
CN107330396A (zh) 一种基于多属性和多策略融合学习的行人再识别方法
CN107832672A (zh) 一种利用姿态信息设计多损失函数的行人重识别方法
CN107369183A (zh) 面向mar的基于图优化slam的跟踪注册方法及***
CN109271888A (zh) 基于步态的身份识别方法、装置、电子设备
CN109190508A (zh) 一种基于空间坐标系的多摄像头数据融合方法
CN109657609A (zh) 人脸识别方法及***
CN109559320A (zh) 基于空洞卷积深度神经网络实现视觉slam语义建图功能的方法及***
CN109816689A (zh) 一种多层卷积特征自适应融合的运动目标跟踪方法
CN109118479A (zh) 基于胶囊网络的绝缘子缺陷识别定位装置及方法
CN109800624A (zh) 一种基于行人重识别的多目标跟踪方法
CN109214280A (zh) 基于街景的店铺识别方法、装置、电子设备及存储介质
CN108229352B (zh) 一种基于深度学习的站立检测方法
CN109753946A (zh) 一种基于身体关键点监督的真实场景行人小目标检测网络及检测方法
CN110428449A (zh) 目标检测跟踪方法、装置、设备及存储介质
CN113221625A (zh) 一种利用深度学习的局部特征对齐行人重识别方法
CN109766873A (zh) 一种混合可变形卷积的行人再识别方法
CN110110694A (zh) 一种基于目标检测的视觉slam闭环检测方法
CN106054627A (zh) 基于手势识别的控制方法、装置及空调

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 310012 1st floor, building 1, 223 Yile Road, Hangzhou City, Zhejiang Province

Patentee after: Yinjiang Technology Co.,Ltd.

Address before: 310012 1st floor, building 1, 223 Yile Road, Hangzhou City, Zhejiang Province

Patentee before: ENJOYOR Co.,Ltd.