CN107122745B - 一种识别视频中人物轨迹的方法及装置 - Google Patents

一种识别视频中人物轨迹的方法及装置 Download PDF

Info

Publication number
CN107122745B
CN107122745B CN201710293791.5A CN201710293791A CN107122745B CN 107122745 B CN107122745 B CN 107122745B CN 201710293791 A CN201710293791 A CN 201710293791A CN 107122745 B CN107122745 B CN 107122745B
Authority
CN
China
Prior art keywords
face
tensor
data
video
color
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710293791.5A
Other languages
English (en)
Other versions
CN107122745A (zh
Inventor
徐佳宏
李益永
兰志才
曾勇
韩涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Ipanel TV Inc
Original Assignee
Shenzhen Ipanel TV Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Ipanel TV Inc filed Critical Shenzhen Ipanel TV Inc
Priority to CN201710293791.5A priority Critical patent/CN107122745B/zh
Publication of CN107122745A publication Critical patent/CN107122745A/zh
Application granted granted Critical
Publication of CN107122745B publication Critical patent/CN107122745B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/48Matching video sequences

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种识别视频中人物轨迹的方法及装置,该方法包括:将待识别视频中包含人脸图像的所有视频片段转换为多个包含人脸图像的彩色图片;获取彩色图片中的人脸位置数据,建立人脸四阶张量模型;进行张量计算,将所述多个人脸特征张量数据与基准人脸特征张量数据,进行范数计算求和;对所述彩色图片中对应的人脸进行分类,获得同一人脸对应的各个彩色图片,将所述同一人脸对应的各个彩色图片还原至所述待识别视频中,获得所述人脸在所述待识别视频中的人物轨迹。实现了适用范围广并且降低了成本和运算量的目的。

Description

一种识别视频中人物轨迹的方法及装置
技术领域
本发明涉及人脸识别技术领域,特别是涉及一种基于张量的人脸识别方法及装置。
背景技术
伴随着科技的发展,传统的个人身份验证手段比如口令、证件和IC卡等方式,由于与持有者的可分离性,致使伪造、盗用或破译等现象时有发生,已经不能满足现代社会经济活动和社会安全防范的需要。因此,生物特征识别技术应运而生,而在生物特征识别技术中由于人脸识别技术具有方便采集\ 易于被接受和不宜伪造的特点,使得人脸识别技术一直是生物特征识别技术中研究热点。
现有的人脸识别技术可以总结为:在检测到人脸并定位面部关键特征之后,主要的人脸区域被剪裁出来然后经过预处理之后,再通过识别算法完成人脸特征的提取,并与数据库中已知的人脸进行对比,来完成最终的人脸分类。但是,伴随着视频应用的增多,提取视频中信息变得越来越有价值,对应的检测视频中的某个人的轨迹也是一项有意义的工作,由于视频中会出现不同的人脸,需要将相同的人脸分为一类,不同的人脸分为不同的类来实现追踪某人在视频中的轨迹。由此可见,如果采用现有的人脸识别技术来研究视频中某人的轨迹,则需要建立库存的已知人脸与训练样本,而需要库存的已知人脸极大地降低了人脸识别技术的适用范围,需要大量训练样本虽然可以提高识别率但是却增加了成本,并且与库存的已知人脸进行对比也大大增+ 加了运算量。显然,依靠现有的人脸识别技术来实现这一目的是不合理的。
发明内容
针对于上述问题,本发明提供一种识别视频中人物轨迹的方法及装置,实现了适用范围广并且降低了成本和运算量的目的。
为了实现上述目的,根据本发明的第一方面,提供了一种识别视频中人物轨迹的方法,该方法包括:
将待识别视频中包含人脸图像的所有视频片段转换为多个包含人脸图像的彩色图片;
获取所述包含人脸图像的彩色图片中的人脸位置数据,根据所述人脸位置数据建立所述包含人脸图像的彩色图片的人脸四阶张量模型;
在所述人脸四阶张量模型中进行张量计算,获得所述各个包含人脸图像的彩色图片所对应的多个人脸特征张量数据;
将所述多个人脸特征张量数据与基准人脸特征张量数据,进行范数计算求和,其中,所述基准人脸特征张量数据为在所述多个人脸特征张量数据中选取的某个人脸张量特征数据;
根据所述待识别视频转换为彩色图片的样本数量设置采样阈值σ,依据
Figure DEST_PATH_GDA0001333847420000021
对所述彩色图片中对应的人脸进行分类,获得同一人脸对应的各个彩色图片,其中,S为范数计算求和结果,m为基准人脸特征张量数据对应的人脸位置宽度数据,n基准人脸特征张量数据对应的为人脸位置高度数据,r=3代表红黄蓝三种颜色;
将所述同一人脸对应的各个彩色图片还原至所述待识别视频中,记录所述人脸在所述待识别视频中出现的位置信息,获得所述人脸在所述待识别视频中的人物轨迹。
优选的,所述获取所述包含人脸图像的彩色图片中的人脸位置数据,根据所述人脸位置数据建立所述包含人脸图像的彩色图片的人脸四阶张量模型,包括:
将所述包含人脸图像的彩色图片转换成对应的黑白图片,并提取出所述黑白图片中人脸的位置数据,其中,所述位置数据包括初始坐标、宽度数据和高度数据;
根据所述黑白图片中人脸的位置数据,获取到所述黑白图片所对应的彩色图片的人脸位置数据;
根据所述彩色图片的人脸位置数据中的宽度数据m和高度数据n,建立所述彩色图片中的人脸三阶张量A[1:m,1:n,1:r],其中,r=3,代表红黄蓝三种颜色;
根据所述宽度数据m设置平移张量数据m/3,获得平移张量B[i:m*2/3+i, i:n-m*2/3+i*2,1:r],其中,i表示平移出的张量与原张量的关系系数,取值为1≦i≦m/3;
根据所述平移张量对所述人脸三阶张量进行平移化处理,获得所述人脸四阶张量模型C[1:m/3,1:m*2/3,1:n-m*2/3,1:r]。
优选的,所述在所述人脸四阶张量模型中进行张量计算,获得所述各个包含人脸图像的彩色图片所对应的多个人脸特征张量数据,包括:
建立所述人脸四阶张量模型的级数Ck的计算函数,其中,
Ck=0.75*Ck-1+0.25*Bk,式中,1≦k≦m/3;
根据所述平移张量B,计算获得所述平移张量Bk的值;
计算所述人脸特征张量数据C,其中,C=Ck,式中,k=m/3。
根据本发明的第二方面,提供了一种别视频中人物轨迹的装置,该装置包括:
转化模块,用于将待识别视频按照视频片段是否包含人脸图像,转化为多个包含人脸图像的彩色图片;
建立模块,用于获取所述包含人脸图像的彩色图片中的人脸位置数据,根据所述人脸位置数据建立所述包含人脸图像的彩色图片的人脸四阶张量模型;
第一计算模块,用于在所述人脸四阶张量模型中进行张量计算,获得所述各个包含人脸图像的彩色图片所对应的多个人脸特征张量数据;
第二计算模块,用于将所述多个人脸特征张量数据与基准人脸特征张量数据,进行范数计算求和,其中,所述基准人脸特征张量数据为在所述多个人脸特征张量数据中选取的某个人脸张量特征数据;
分类模块,用于根据所述待识别视频转换为彩色图片的样本数量设置采样阈值σ,依据
Figure DEST_PATH_GDA0001333847420000041
对所述彩色图片中对应的人脸进行分类,获得同一人脸对应的各个彩色图片,其中,S为范数计算求和结果,m为基准人脸特征张量数据对应的人脸位置宽度数据,n基准人脸特征张量数据对应的为人脸位置高度数据,r=3代表红黄蓝三种颜色;
轨迹识别模块,用于将所述同一人脸对应的各个彩色图片还原至所述待识别视频中,记录所述人脸在所述待识别视频中出现的位置信息,获得所述人脸在所述待识别视频中的人物轨迹。
优选的,所述建立模块包括:
第一提取单元,用于将所述包含人脸图像的彩色图片转换成对应的黑白图片,并提取出所述黑白图片中人脸的位置数据,其中,所述位置数据包括初始坐标、宽度数据和高度数据;
第二提取单元,用于根据所述黑白图片中人脸的位置数据,获取到所述黑白图片所对应的彩色图片的人脸位置数据;
第一建立单元,用于根据所述彩色图片的人脸位置数据中的宽度数据m 和高度数据n,建立所述彩色图片中的人脸三阶张量A[1:m,1:n,1:r],其中,r=3,代表红黄蓝三种颜色;
获取单元,用于根据所述宽度数据m设置平移张量数据m/3,获得平移张量B[i:m*2/3+i,i:n-m*2/3+i*2,1:r],其中,i表示平移出的张量与原张量的关系系数,取值为1≦i≦m/3;
第二建立单元,用于根据所述平移张量对所述人脸三阶张量进行平移化处理,获得所述人脸四阶张量模型C[1:m/3,1:m*2/3,1:n-m*2/3,1:r]。
优选的,所述第一计算模块包括:
函数建立单元,用于建立所述人脸四阶张量模型的级数Ck的计算函数,其中,
Ck=0.75*Ck-1+0.25*Bk,式中,1≦k≦m/3;
平移张量计算单元,用于根据所述平移张量B,计算获得所述平移张量 Bk的值;
数据计算单元,用于计算所述人脸特征张量数据C,其中,C=Ck,式中, k=m/3。
相较于现有技术,本发明将待识别视频中包含人脸图像的所有视频片段转换为多个包含人脸图像的彩色图片,根据彩色图片中的人脸位置数据建立了人脸张量四阶模型,由于是根据彩色图片中的人脸位置数据进行建立的,所以该人脸张量四阶模型包含了更多的人脸信息,进行人脸识别的过程将更加准确;在所述人脸四阶张量模型中进行张量计算,获得所述各个包含人脸图像的彩色图片所对应的多个人脸特征张量数据;将所述多个人脸特征张量数据与基准人脸特征张量数据,进行范数计算求和,然后设置采样阈值,对所述彩色图片中对应的人脸进行分类,获得同一人脸对应的各个彩色图片;将所述同一人脸对应的各个彩色图片还原至所述待识别视频中,记录所述人脸在所述待识别视频中出现的位置信息,获得所述人脸在所述待识别视频中的人物轨迹。在人脸识别过程中由于基于张量模型不需要训练参数就能识别同一个人的不同照片,可以有效地节省成本;同时使得识别视频中某人的轨迹是不需要此人的已知人脸,因此所述方法使用范围极广。综合来看,通过本发明实现了适用范围广并且降低了成本和运算量的目的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例一提供的一种识别视频中人物轨迹的方法的流程示意图;
图2为本发明实施例二对应的图1中所示S12步骤中的建立四阶张量模型的流程示意图;
图3为本发明实施例二对应的图1中所示S13步骤中的计算人脸特征张量数据的流程示意图;
图4为本发明实施例三提供的一种识别视频中人物轨迹的装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”和“第二”等是用于区别不同的对象,而不是用于描述特定的顺序。此外术语“包括”和“具有”以及他们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、***、产品或设备没有设定于已列出的步骤或单元,而是可包括没有列出的步骤或单元。
实施例一
参见图1为本发明实施例一提供的一种识别视频中人物轨迹的方法的流程示意图,该方法包括以下步骤:
S11、将待识别视频中包含人脸图像的所有视频片段转换为多个包含人脸图像的彩色图片;
具体的,为了识别视频中的人物轨迹,就要先获取到包含人物人脸的彩色图片。
S12、获取所述包含人脸图像的彩色图片中的人脸位置数据,根据所述人脸位置数据建立所述包含人脸图像的彩色图片的人脸四阶张量模型;
可以理解的是,由于是根据人脸彩色图片中的人脸位置数据建立的人脸四阶张量模型,不仅包含的人脸信息更全面而且减弱了人脸偏移带来的影响,可以有效地提高识别率。
S13、在所述人脸四阶张量模型中进行张量计算,获得所述各个包含人脸图像的彩色图片所对应的多个人脸特征张量数据;
S14、将所述多个人脸特征张量数据与基准人脸特征张量数据,进行范数计算求和,其中,所述基准人脸特征张量数据为在所述多个人脸特征张量数据中选取的某个人脸张量特征数据;
S15、根据所述待识别视频转换为彩色图片的样本数量设置采样阈值σ,依据
Figure DEST_PATH_GDA0001333847420000071
对所述彩色图片中对应的人脸进行分类,获得同一人脸对应的各个彩色图片,其中,S为范数计算求和结果,m为基准人脸特征张量数据对应的人脸位置宽度数据,n基准人脸特征张量数据对应的为人脸位置高度数据,r=3代表红黄蓝三种颜色;
S16、将所述同一人脸对应的各个彩色图片还原至所述待识别视频中,记录所述人脸在所述待识别视频中出现的位置信息,获得所述人脸在所述待识别视频中的人物轨迹。
具体的,记录所述人脸在所述待识别视频中出现的位置信息为:记录下相同的人在待识别视频中出现的帧数、位移和位置等信息。
通过本发明实施例一公开的技术方案,将待识别视频中包含人脸图像的所有视频片段转换为多个包含人脸图像的彩色图片,根据彩色图片中的人脸位置数据建立了人脸张量四阶模型,由于是根据彩色图片中的人脸位置数据进行建立的,所以该人脸张量四阶模型包含了更多的人脸信息,进行人脸识别的过程将更加准确;在所述人脸四阶张量模型中进行张量计算,获得所述各个包含人脸图像的彩色图片所对应的多个人脸特征张量数据;将所述多个人脸特征张量数据与基准人脸特征张量数据,进行范数计算求和,然后设置采样阈值,对所述彩色图片中对应的人脸进行分类,获得同一人脸对应的各个彩色图片;将所述同一人脸对应的各个彩色图片还原至所述待识别视频中,记录所述人脸在所述待识别视频中出现的位置信息,获得所述人脸在所述待识别视频中的人物轨迹。在人脸识别过程中由于基于张量模型不需要训练参数就能识别同一个人的不同照片,可以有效地节省成本;同时使得识别视频中某人的轨迹是不需要此人的已知人脸,因此所述方法使用范围极广。综合来看,通过本发明实现了适用范围广并且降低了成本和运算量的目的。
实施例二
参照本发明实施例一和图1中所描述的S11到S16步骤的具体过程,并参照图2为本发明实施例二对应的图1中所示S12步骤中的建立四阶张量模型的流程示意图,所述获取所述包含人脸图像的彩色图片中的人脸位置数据,根据所述人脸位置数据建立所述包含人脸图像的彩色图片的人脸四阶张量模型,包括:
S121、将所述包含人脸图像的彩色图片转换成对应的黑白图片,并提取出所述黑白图片中人脸的位置数据,其中,所述位置数据包括初始坐标、宽度数据和高度数据;
具体的,先将彩色图片转化为黑白图片来获取位置数据的主要目的是减少运算量,将彩色图片转换为黑白图片并检测出黑白图片中可能的人脸位置,通过检测皮肤、眼睛、嘴和鼻子等五官代表特征进一步确认是否为人脸,并记录相应的人脸位置数据。
S122、根据所述黑白图片中人脸的位置数据,获取到所述黑白图片所对应的彩色图片的人脸位置数据;
其中,所述彩色图片的人脸位置数据包括初始坐标、宽度数据和高度数据;
S123、根据所述彩色图片的人脸位置数据中的宽度数据m和高度数据n,建立所述彩色图片中的人脸三阶张量A[1:m,1:n,1:r],其中,r=3,代表红黄蓝三种颜色;
S124、根据所述宽度数据m设置平移张量数据m/3,获得平移张量B[i: m*2/3+i,i:n-m*2/3+i*2,1:r],其中,i表示平移出的张量与原张量的关系系数,取值为1≦i≦m/3;
具体的,由于视频中的人脸大部分不是正脸,或者存在偏移或者存在遮挡,因此需要进一步人脸平移化处理从而构造一个四阶张量。I表示平一出的张量跟原张量的关系,比如i=2标识平移出的第二个张量,该张量取原张量第一个指标的2到m*2/3+2行,第二指标的2到n-m*2/3+4行。
S125、根据所述平移张量对所述人脸三阶张量进行平移化处理,获得所述人脸四阶张量模型C[1:m/3,1:m*2/3,1:n-m*2/3,1:r]。
相应的参照图3为本发明实施例二对应的图1中所示S13步骤中的计算人脸特征张量数据的流程示意图,所述在所述人脸四阶张量模型中进行张量计算,获得所述各个包含人脸图像的彩色图片所对应的多个人脸特征张量数据,包括:
S131、建立所述人脸四阶张量模型的级数Ck的计算函数,其中, Ck=0.75*Ck-1+0.25*Bk,式中,1≦k≦m/3;
S132、根据所述平移张量B,计算获得所述平移张量Bk的值;
S133、计算所述人脸特征张量数据C,其中,C=Ck,式中,k=m/3。
具体的,由于人脸的RGB图中的每个数值均大于0小于255,所以四阶张量模型对应的张量C为正张量,而正张量的绝对值最大的特征值一定不为负数。若正张量中任意元素增大则最大特征值也随之严格增大,因而可以想到求解正张量C对应的最大特征值得如下算法是线性收敛的,求解算法如下:
||X0||=1
Xk=C Xk-1
Figure DEST_PATH_GDA0001333847420000091
上式中,k表示迭代次数,即第k次迭代。X0表示初始迭代值,取正向量,一般取全一向量然后单位化。Xk表示第k次的迭代向量,该向量收敛到特征向量;tk表示向量对应位置比值最大的那个数,该数线性收敛到特征值;
虽然正张量的特征值及特征向量的求解是线性收敛的,但是张量本身数据量较大,张量与向量做乘法计算量巨大,即使迭代次数不多运算量依然较大,为了提高相应的运算速度,在本发明实施例中优选数列级数的方法来代替张量特征值及特征向量求解,即:
Ck=0.75*Ck-1+0.25*Bk
C1=C(1),
Bi+1=C(i+1)
C1表示数列的第1项,是平移出的第1个张量B1;Ci表示数列的第i项,由表达式迭代得到;Bi+1就是平移出的第i+1个张量,于是人脸张量C更新为一系列可以体现人脸特征的新数据Ck
根据本发明实施例二公开的技术方案,首先将彩色图片转换为黑白图片,然后通过计算黑白图片中的人脸位置数据获得所述彩色图片的人脸位置数据,这样可以减少在人脸识别过程中的运算量;由于考虑到视频中的人脸大部分不是正脸,需要进行人脸的平移化处理从而建立人脸的四阶张量,并且用正张量特征值及特征向量来反映人脸的本质特征,通过设置级数的方法来求解人脸特征张量数据有效的降低了计算量,同时提高了识别效率。
实施例三
与本发明实施例一和实施例二所公开的识别视频中人物轨迹的方法相对应,本发明的实施例三还提供了一种识别视频中人物轨迹的装置,参见图4 为本发明实施例三提供的一种识别视频中人物轨迹的装置的结构示意图,该装置包括:
转化模块1,用于将待识别视频按照视频片段是否包含人脸图像,转化为多个包含人脸图像的彩色图片;
建立模块2,用于获取所述包含人脸图像的彩色图片中的人脸位置数据,根据所述人脸位置数据建立所述包含人脸图像的彩色图片的人脸四阶张量模型;
第一计算模块3,用于在所述人脸四阶张量模型中进行张量计算,获得所述各个包含人脸图像的彩色图片所对应的多个人脸特征张量数据;
第二计算模块4,用于将所述多个人脸特征张量数据与基准人脸特征张量数据,进行范数计算求和,其中,所述基准人脸特征张量数据为在所述多个人脸特征张量数据中选取的某个人脸张量特征数据;
分类模块5,用于根据所述待识别视频转换为彩色图片的样本数量设置采样阈值σ,依据
Figure DEST_PATH_GDA0001333847420000111
对所述彩色图片中对应的人脸进行分类,获得同一人脸对应的各个彩色图片,其中,S为范数计算求和结果,m为基准人脸特征张量数据对应的人脸位置宽度数据,n基准人脸特征张量数据对应的为人脸位置高度数据,r=3代表红黄蓝三种颜色;
轨迹识别模块6,用于将所述同一人脸对应的各个彩色图片还原至所述待识别视频中,记录所述人脸在所述待识别视频中出现的位置信息,获得所述人脸在所述待识别视频中的人物轨迹。
相应的,所述建立模块2包括:
第一提取单元21,用于将所述包含人脸图像的彩色图片转换成对应的黑白图片,并提取出所述黑白图片中人脸的位置数据,其中,所述位置数据包括初始坐标、宽度数据和高度数据;
第二提取单元22,用于根据所述黑白图片中人脸的位置数据,获取到所述黑白图片所对应的彩色图片的人脸位置数据;
第一建立单元23,用于根据所述彩色图片的人脸位置数据中的宽度数据 m和高度数据n,建立所述彩色图片中的人脸三阶张量A[1:m,1:n,1:r],其中,r=3,代表红黄蓝三种颜色;
获取单元24,用于根据所述宽度数据m设置平移张量数据m/3,获得平移张量B[i:m*2/3+i,i:n-m*2/3+i*2,1:r],其中,i表示平移出的张量与原张量的关系系数,取值为1≦i≦m/3;
第二建立单元25,用于根据所述平移张量对所述人脸三阶张量进行平移化处理,获得所述人脸四阶张量模型C[1:m/3,1:m*2/3,1:n-m*2/3,1:r]。
对应的,所述第一计算模块3包括:
函数建立单元31,用于建立所述人脸四阶张量模型的级数Ck的计算函数,其中,
Ck=0.75*Ck-1+0.25*Bk,式中,1≦k≦m/3;
平移张量计算单元32,用于根据所述平移张量B,计算获得所述平移张量Bk的值;
数据计算单元33,用于计算所述人脸特征张量数据C,其中,C=Ck,式中,k=m/3。
在本发明的实施例三中,在转化模块中将待识别视频中包含人脸图像的所有视频片段转换为多个包含人脸图像的彩色图片,然后通过建立模块根据彩色图片中的人脸位置数据建立了人脸张量四阶模型,由于是根据彩色图片中的人脸位置数据进行建立的,所以该人脸张量四阶模型包含了更多的人脸信息,进行人脸识别的过程将更加准确;在第一计算模块中进行张量计算,获得所述各个包含人脸图像的彩色图片所对应的多个人脸特征张量数据;在第二计算模块中将所述多个人脸特征张量数据与基准人脸特征张量数据,进行范数计算求和,然后通过分类模块设置采样阈值,对所述彩色图片中对应的人脸进行分类,获得同一人脸对应的各个彩色图片;最后在轨迹识别模块中将所述同一人脸对应的各个彩色图片还原至所述待识别视频中,记录所述人脸在所述待识别视频中出现的位置信息,获得所述人脸在所述待识别视频中的人物轨迹。在人脸识别过程中由于基于张量模型不需要训练参数就能识别同一个人的不同照片,可以有效地节省成本;同时使得识别视频中某人的轨迹是不需要此人的已知人脸,因此所述方法使用范围极广。综合来看,通过本发明实现了适用范围广并且降低了成本和运算量的目的。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (6)

1.一种识别视频中人物轨迹的方法,其特征在于,该方法包括:
将待识别视频中包含人脸图像的所有视频片段转换为多个包含人脸图像的彩色图片;
获取所述包含人脸图像的彩色图片中的人脸位置数据,根据所述人脸位置数据建立所述包含人脸图像的彩色图片的人脸四阶张量模型;
在所述人脸四阶张量模型中进行张量计算,获得所述各个包含人脸图像的彩色图片所对应的多个人脸特征张量数据;
将所述多个人脸特征张量数据与基准人脸特征张量数据,进行范数计算求和,其中,所述基准人脸特征张量数据为在所述多个人脸特征张量数据中选取的某个人脸张量特征数据;
根据所述待识别视频转换为彩色图片的样本数量设置采样阈值σ,依据
Figure FDA0002453721880000011
对所述彩色图片中对应的人脸进行分类,获得同一人脸对应的各个彩色图片,其中,S为范数计算求和结果,m为基准人脸特征张量数据对应的人脸位置宽度数据,n基准人脸特征张量数据对应的为人脸位置高度数据,r=3代表红黄蓝三种颜色;
将所述同一人脸对应的各个彩色图片还原至所述待识别视频中,记录所述人脸在所述待识别视频中出现的位置信息,获得所述人脸在所述待识别视频中的人物轨迹。
2.根据权利要求1所述的方法,其特征在于,所述获取所述包含人脸图像的彩色图片中的人脸位置数据,根据所述人脸位置数据建立所述包含人脸图像的彩色图片的人脸四阶张量模型,包括:
将所述包含人脸图像的彩色图片转换成对应的黑白图片,并提取出所述黑白图片中人脸的位置数据,其中,所述位置数据包括初始坐标、宽度数据和高度数据;
根据所述黑白图片中人脸的位置数据,获取到所述黑白图片所对应的彩色图片的人脸位置数据;
根据所述彩色图片的人脸位置数据中的宽度数据m和高度数据n,建立所述彩色图片中的人脸三阶张量A[1:m,1:n,1:r],其中,r=3,代表红黄蓝三种颜色;
根据所述宽度数据m设置平移张量数据m/3,获得平移张量B[i:m*2/3+i,i:n-m*2/3+i*2,1:r],其中,i表示平移出的张量与原张量的关系系数,取值为1≦i≦m/3;
根据所述平移张量对所述人脸三阶张量进行平移化处理,获得所述人脸四阶张量模型C[1:m/3,1:m*2/3,1:n-m*2/3,1:r]。
3.根据权利要求2所述的方法,其特征在于,所述在所述人脸四阶张量模型中进行张量计算,获得所述各个包含人脸图像的彩色图片所对应的多个人脸特征张量数据,包括:
建立所述人脸四阶张量模型的级数Ck的计算函数,其中,Ck=0.75*Ck-1+0.25*Bk,式中,1≦k≦m/3;
根据所述平移张量B,计算获得平移张量Bk的值;
计算所述人脸特征张量数据C,其中,C=Ck,式中,k=m/3。
4.一种识别视频中人物轨迹的装置,其特征在于,该装置包括:
转化模块,用于将待识别视频按照视频片段是否包含人脸图像,转化为多个包含人脸图像的彩色图片;
建立模块,用于获取所述包含人脸图像的彩色图片中的人脸位置数据,根据所述人脸位置数据建立所述包含人脸图像的彩色图片的人脸四阶张量模型;
第一计算模块,用于在所述人脸四阶张量模型中进行张量计算,获得所述各个包含人脸图像的彩色图片所对应的多个人脸特征张量数据;
第二计算模块,用于将所述多个人脸特征张量数据与基准人脸特征张量数据,进行范数计算求和,其中,所述基准人脸特征张量数据为在所述多个人脸特征张量数据中选取的某个人脸张量特征数据;
分类模块,用于根据所述待识别视频转换为彩色图片的样本数量设置采样阈值σ,依据
Figure FDA0002453721880000031
对所述彩色图片中对应的人脸进行分类,获得同一人脸对应的各个彩色图片,其中,S为范数计算求和结果,m为基准人脸特征张量数据对应的人脸位置宽度数据,n基准人脸特征张量数据对应的为人脸位置高度数据,r=3代表红黄蓝三种颜色;
轨迹识别模块,用于将所述同一人脸对应的各个彩色图片还原至所述待识别视频中,记录所述人脸在所述待识别视频中出现的位置信息,获得所述人脸在所述待识别视频中的人物轨迹。
5.根据权利要求4所述的装置,其特征在于,所述建立模块包括:
第一提取单元,用于将所述包含人脸图像的彩色图片转换成对应的黑白图片,并提取出所述黑白图片中人脸的位置数据,其中,所述位置数据包括初始坐标、宽度数据和高度数据;
第二提取单元,用于根据所述黑白图片中人脸的位置数据,获取到所述黑白图片所对应的彩色图片的人脸位置数据;
第一建立单元,用于根据所述彩色图片的人脸位置数据中的宽度数据m和高度数据n,建立所述彩色图片中的人脸三阶张量A[1:m,1:n,1:r],其中,r=3,代表红黄蓝三种颜色;
获取单元,用于根据所述宽度数据m设置平移张量数据m/3,获得平移张量B[i:m*2/3+i,i:n-m*2/3+i*2,1:r],其中,i表示平移出的张量与原张量的关系系数,取值为1≦i≦m/3;
第二建立单元,用于根据所述平移张量对所述人脸三阶张量进行平移化处理,获得所述人脸四阶张量模型C[1:m/3,1:m*2/3,1:n-m*2/3,1:r]。
6.根据权利要求5所述的装置,其特征在于,所述第一计算模块包括:
函数建立单元,用于建立所述人脸四阶张量模型的级数Ck的计算函数,其中,Ck=0.75*Ck-1+0.25*Bk,式中,1≦k≦m/3;
平移张量计算单元,用于根据所述平移张量B,计算获得平移张量Bk的值;
数据计算单元,用于计算所述人脸特征张量数据C,其中,C=Ck,式中,k=m/3。
CN201710293791.5A 2017-04-28 2017-04-28 一种识别视频中人物轨迹的方法及装置 Active CN107122745B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710293791.5A CN107122745B (zh) 2017-04-28 2017-04-28 一种识别视频中人物轨迹的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710293791.5A CN107122745B (zh) 2017-04-28 2017-04-28 一种识别视频中人物轨迹的方法及装置

Publications (2)

Publication Number Publication Date
CN107122745A CN107122745A (zh) 2017-09-01
CN107122745B true CN107122745B (zh) 2020-10-20

Family

ID=59725486

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710293791.5A Active CN107122745B (zh) 2017-04-28 2017-04-28 一种识别视频中人物轨迹的方法及装置

Country Status (1)

Country Link
CN (1) CN107122745B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108615007B (zh) * 2018-04-23 2019-07-19 深圳大学 基于特征张量的三维人脸识别方法、装置及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101436250A (zh) * 2008-11-19 2009-05-20 西安电子科技大学 基于非线性张量分解与视角流形的多视角人脸识别方法
CN104933428A (zh) * 2015-07-23 2015-09-23 苏州大学 一种基于张量描述的人脸识别方法及装置
CN105956603A (zh) * 2016-04-15 2016-09-21 天津大学 一种基于张量时域关联模型的视频序列分类方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7936906B2 (en) * 2007-06-15 2011-05-03 Microsoft Corporation Face recognition using discriminatively trained orthogonal tensor projections

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101436250A (zh) * 2008-11-19 2009-05-20 西安电子科技大学 基于非线性张量分解与视角流形的多视角人脸识别方法
CN104933428A (zh) * 2015-07-23 2015-09-23 苏州大学 一种基于张量描述的人脸识别方法及装置
CN105956603A (zh) * 2016-04-15 2016-09-21 天津大学 一种基于张量时域关联模型的视频序列分类方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Efficient face recognition using tensor subspace regression;Ziyu Guan et al;《NeuroComputing》;20100504;2744-2753 *
Face recognition and micro-expression recognition based on discriminant tensor subspace analysis plus extreme learning machine;Sujing Wang et al;《Neural Process Lett》;20130227;1-19 *
张量局部判别投影的人脸识别;李勇周等;《电子学报》;20081031(第10期);2070-2075 *
张量补全算法及其在人脸识别中的应用;史加荣等;《模式识别与人工智能》;20110430;第24卷(第2期);255-261 *

Also Published As

Publication number Publication date
CN107122745A (zh) 2017-09-01

Similar Documents

Publication Publication Date Title
CN107506700B (zh) 基于广义相似性度量学习的行人再识别方法
CN100423020C (zh) 一种基于结构主元分析的人脸识别方法
WO2023005161A1 (zh) 人脸图像相似度的计算方法、装置、设备及存储介质
CN109740572B (zh) 一种基于局部彩色纹理特征的人脸活体检测方法
CN103824059A (zh) 一种基于视频图像序列的人脸表情识别方法
JP2000003452A (ja) デジタル画像における顔面の検出方法、顔面検出装置、画像判定方法、画像判定装置およびコンピュ―タ可読な記録媒体
CN112381775A (zh) 一种图像篡改检测方法、终端设备及存储介质
CN111126240B (zh) 一种三通道特征融合人脸识别方法
CN103116763A (zh) 一种基于hsv 颜色空间统计特征的活体人脸检测方法
CN106934377B (zh) 一种改进的人脸检测***
Hassanat et al. Colour-based lips segmentation method using artificial neural networks
WO2011152843A1 (en) Clothing-based image clustering based on cluster ensemble sets
Atharifard et al. Robust component-based face detection using color feature
WO2011074014A2 (en) A system for lip corner detection using vision based approach
Huong et al. Static hand gesture recognition for vietnamese sign language (VSL) using principle components analysis
CN103839042A (zh) 人脸识别方法和人脸识别***
CN107392105B (zh) 一种基于反向协同显著区域特征的表情识别方法
Fernando et al. Novel approach to use HU moments with image processing techniques for real time sign language communication
Fernando et al. Low cost approach for real time sign language recognition
Deng et al. Attention-aware dual-stream network for multimodal face anti-spoofing
CN107122745B (zh) 一种识别视频中人物轨迹的方法及装置
Azad et al. Novel and tuneable method for skin detection based on hybrid color space and color statistical features
Nguyen et al. Hand posture recognition using Kernel Descriptor
Reddy et al. Comparison of HOG and fisherfaces based face recognition system using MATLAB
CN110781802B (zh) 一种基于信息论流形的人脸图像识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant