CN110543584B - 一种建立人脸索引的方法、装置、处理服务器及存储介质 - Google Patents

一种建立人脸索引的方法、装置、处理服务器及存储介质 Download PDF

Info

Publication number
CN110543584B
CN110543584B CN201810534101.5A CN201810534101A CN110543584B CN 110543584 B CN110543584 B CN 110543584B CN 201810534101 A CN201810534101 A CN 201810534101A CN 110543584 B CN110543584 B CN 110543584B
Authority
CN
China
Prior art keywords
video
face
cluster
features
face features
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810534101.5A
Other languages
English (en)
Other versions
CN110543584A (zh
Inventor
杨宇
谢金运
伍倡辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201810534101.5A priority Critical patent/CN110543584B/zh
Publication of CN110543584A publication Critical patent/CN110543584A/zh
Application granted granted Critical
Publication of CN110543584B publication Critical patent/CN110543584B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例提供一种建立人脸索引的方法、装置、处理服务器及存储介质,该方法包括:获取至少一条视频;分别确定各条视频相应的人脸特征,并确定各人脸特征在相应视频的视频信息;将同一人脸的人脸特征进行聚类处理,得到至少一个第一聚类,其中,一个第一聚类所聚集的人脸特征表示,所述至少一条视频中同一人脸的人脸特征;针对各第一聚类所聚集的各人脸特征,关联人脸特征在相应视频的视频信息,得到所述至少一条视频的人脸索引。本发明实施例可在无人脸信息标记的情况下,高效的建立人脸索引。

Description

一种建立人脸索引的方法、装置、处理服务器及存储介质
技术领域
本发明涉及数据处理技术领域,具体涉及一种建立人脸索引的方法、装置、处理服务器及存储介质。
背景技术
人脸索引表示的是视频中的人脸特征与视频信息的关联,通过为视频建立人脸索引,可为在视频中查询目标人物等场景时,高效的提供视频中与目标人物关联的视频信息(如视频中目标人物出现的视频时间点、视频进度等);基于人脸索引的特性,人脸索引在视频点播、安防等领域得到了广泛的应用。
目前人脸索引的建立过程一般需要用户提前进行人脸信息的标记;然而,视频中的人物往往众多,基于用户标记人脸信息的方式来建立人脸索引,将存在极为繁琐的用户标记人脸信息的工作,并且标记人脸信息的难度也极大,这无疑导致人脸索引的建立效率极低。
发明内容
有鉴于此,本发明实施例提供一种建立人脸索引的方法、装置、处理服务器及存储介质,以在无人脸信息标记的情况下,高效的建立人脸索引。
为实现上述目的,本发明实施例提供如下技术方案:
一种建立人脸索引的方法,包括:
获取至少一条视频;
分别确定各条视频相应的人脸特征,并确定各人脸特征在相应视频的视频信息;
将同一人脸的人脸特征进行聚类处理,得到至少一个第一聚类;其中,一个第一聚类所聚集的人脸特征表示,所述至少一条视频中同一人脸的人脸特征;
针对各第一聚类所聚集的各人脸特征,关联人脸特征在相应视频的视频信息,得到所述至少一条视频的人脸索引。
本发明实施例还提供一种建立人脸索引的装置,包括:
视频获取模块,用于获取至少一条视频;
人脸特征及视频信息确定模块,用于分别确定各条视频相应的人脸特征,并确定各人脸特征在相应视频的视频信息;
第一聚类得到模块,用于将同一人脸的人脸特征进行聚类处理,得到至少一个第一聚类;其中,一个第一聚类所聚集的人脸特征表示,所述至少一条视频中同一人脸的人脸特征;
人脸索引建立模块,用于针对各第一聚类所聚集的各人脸特征,关联人脸特征在相应视频的视频信息,得到所述至少一条视频的人脸索引。
本发明实施例还提供一种处理服务器,包括:至少一个存储器和至少一个处理芯片,所述存储器存储有程序,所述处理芯片调用所述程序,以实现上述所述的建立人脸索引的方法的步骤。
本发明实施例还提供一种存储介质,所述存储介质存储有适于处理芯片执行的程序,以实现上述所述的建立人脸索引的方法的步骤。
基于上述技术方案,本发明实施例提供的建立人脸索引的方法,可以对至少一条视频,进行同一人脸的人脸特征的聚类处理,得到适于所述至少一条视频相应的第一聚类;进而将各第一聚类所聚集的各人脸特征,进行人脸特征在相应视频的视频信息的关联,可在无人脸信息标记的情况下,实现高效的建立适于所述至少一条视频的人脸索引。
进一步,通过将所述至少一条视频中,同一人脸的人脸特征进行聚类,可以认为一个第一聚类中聚集的人脸特征表示的是同一人脸,可以减少人脸索引库中的人脸数量,可极大的减小人脸索引的数据冗余。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为传统的基于用户标记人脸信息,来建立人脸索引的示意图;
图2为本发明实施例提供的建立人脸索引的***的架构示意图;
图3为本发明实施例提供的建立人脸索引的方法的信令流程图;
图4为多条视频情况下,建立人脸索引的处理示例图;
图5为本发明实施例提供的建立人脸索引的方法的另一信令流程图;
图6为一条视频情况下,建立人脸索引的处理示例图;
图7为本发明实施例提供的将同一人脸的人脸特征进行聚类处理的方法流程图;
图8为本发明实施例提供的将同一人脸的人脸特征进行聚类处理的另一方法流程图;
图9为将人脸特征加入到聚类的示意图;
图10为删除次要人脸的人脸特征的聚类的示意图;
图11为本发明实施例提供的应用示例图;
图12为本发明实施例提供的建立人脸索引的装置的结构框图;
图13为本发明实施例提供的处理服务器的结构框图。
具体实施方式
图1为传统的基于用户标记人脸信息,来建立人脸索引的示意图,如图1所示,在建立人脸索引时,用户需要标记人物的基础信息(如人物名称、性别等)、人脸图像(如人物的正脸图像、侧脸图像等)等人脸信息,从而服务器将标记的人脸信息作为注册的输入,通过注册处理,确定出视频中与该人脸图像的人脸特征相应的视频信息,并关联该视频信息与该人物的基础信息和人脸特征,建立出该人物的人脸索引;
可以看出,传统建立人脸索引的方式,在视频(特别对于大规模视频数据)中的人物较多时,将存在极为繁琐的用户标记人脸信息的工作,并且标记人脸信息的难度也极大,存在人脸索引的建立效率极低的问题;
进一步,对于没有标记人脸信息但存在于视频中的人物,传统的建立人脸索引的方式是,将视频中没有标记人脸信息的人脸图像作为独立的输入来进行注册处理,这使得人脸索引的数据极为冗余。
为解决上述缺陷,本发明实施例提供一种在无人脸信息标记的情况下,进行高效的人脸索引建立的方案;下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图2为本发明实施例提供的建立人脸索引的***的一种可选架构示意图,如图2所示,该***可以包括:视频源10,处理服务器20,人脸索引库30。
其中,视频源10可以认为是视频的源头,视本发明实施例应用场景而定,可选的,视频可以是以流式数据表示,如视频流;
作为一种示例说明,对于直播场景而言,视频源可以是视频直播服务器,本发明实施例可对视频直播服务器输出的直播视频进行人脸索引建立;对于点播场景而言,视频源可以是点播视频库(点播库中记录有多个视频),点播视频库可以在用户点播视频时,提供用户所点播的视频,而在本发明实施例中,也可对点播视频库中记录的视频进行人脸索引的建立;当然,视频源还可以是电影视频库、电视视频库等,具体不再一一说明;显然,视频源可以是上述描述的视频源形式的至少一个(一个或多个)。
处理服务器20为对视频源10提供的视频建立人脸索引的服务设备,是本发明实施例建立人脸索引的主要处理设备;处理服务器可以由单一服务器实现,也可以由多台服务器组成的服务器群组实现。
人脸索引库30为记录本发明实施例建立的人脸索引的数据库。
作为一种***结构变形,人脸索引库也可以由处理服务器中的存储单元实现,如可由处理服务器中具备数据存储能力的存储设备,记录本发明实施例所建立的人脸索引。
为实现在无人脸信息标记的情况下,高效的建立人脸索引,本发明实施例建立人脸索引的核心流程可以如下:
处理服务器获取视频源发送的用于建立人脸索引的至少一条视频;针对所述至少一条视频,处理服务器可分别确定各条视频相应的人脸特征,并确定出各人脸特征在相应视频的视频信息(如各人脸特征在所属视频的视频时间点,和/或视频进度等);从而,处理服务器可将同一人脸的人脸特征进行聚类处理,得到至少一个第一聚类(为便于描述,本发明实施例可将所述至少一条视频中同一人脸的人脸特征的一个聚类,定义为一个第一聚类;即一个第一聚类所聚集的人脸特征可以表示,所述至少一条视频中同一人脸的人脸特征);进而,针对各第一聚类所聚集的各人脸特征,关联人脸特征在相应视频的视频信息,得到适于所述至少一条视频的人脸索引。
基于上述核心流程,处理服务器可在无人脸信息标记的情况下,对获取的至少一条视频进行同一人脸的人脸特征的聚类处理,得到至少一个第一聚类,从而对各第一聚类聚集的各人脸特征,进行人脸特征在相应视频的视频信息的关联,得到所述至少一条视频的人脸索引;实现在无人脸信息标记的情况下,高效的建立人脸索引。
基于上述核心流程,本发明实施例可对一条视频进行人脸索引的建立,也可对多条视频进行人脸索引的建立,下面将分别对这两种情况进行说明。
可选的,图3示出了在对多条视频建立人脸索引的情况下,本发明实施例提供的建立人脸索引的一种可选信令流程;值得注意的是,图3所示流程仅是本发明实施例在多条视频的情况下,建立人脸索引的一种可选流程,基于上述描述的核心流程,本发明实施例也可在多条视频的情况下,以其他方法流程进行人脸索引的建立;
参照图3,在基于多条视频进行人脸索引建立时,本发明实施例提供的流程可以包括:
步骤S10、视频源向处理服务器输入多条视频。
此处所指的多条视频可以是视频源所具有的多条视频,可以认为是本发明实施例用于建立人脸索引的多条视频,即本发明实施例可为该多条视频综合的建立人脸索引;
作为一种示例,视频源可以随机的向处理服务器输入多条视频,如视频源随机的将视频源具有的多条视频输入给处理服务器,这个过程中,处理服务器可对视频源输入的多条视频,综合的建立人脸索引;可选的,视频源也可以受指定(如受处理服务器指定,或者工作人员的指定),向处理服务器输入指定的多条视频;
可选的,在本发明实施例中,视频源所具有的每条视频可以具有唯一的标识(如视频ID);
可选的,视频源向处理服务器输入的任一条视频可以是流形式的(即视频流),相应的,视频源可以向处理服务器输入多条视频流;显然,视频以流形式存在仅是可选的,本发明实施例也可支持对其他形式的视频进行人脸索引建立,如处理服务器可从视频源获取完整的多条视频后,对该完整的多条视频进行人脸索引建立。
相应的,处理服务器可以获取到多条视频。
步骤S11、处理服务器分别确定各条视频相应的人脸特征,并确定各人脸特征在相应视频的视频信息。
处理服务器可对获取的各条视频,分别确定相应的人脸特征,并确定所确定的各人脸特征在相应视频的视频信息(如人脸特征在相应视频的视频时间点,和/或视频进度等);
作为一种示例,对于处理服务器获取的任一条视频,处理服务器可对视频中的关键视频帧提取人脸特征,以此对处理服务器获取的各条视频进行处理,确定出各条视频相应的人脸特征;同时,对于所确定的各条视频相应的人脸特征,确定各人脸特征相应的关键视频帧在相应视频的视频信息(如各人脸特征相应的关键视频帧,在所属视频的视频时间点和/或视频进度);
例如,对于处理服务器获取的某一条视频,处理服务器可提取该视频中的关键视频帧的人脸特征,并确定各人脸特征的关键视频帧在该视频的视频信息。
作为另一种示例,对于处理服务器获取的任一条视频,处理服务器可按照设定时间间隔,对视频进行截图,对各截图提取人脸特征,以此对处理服务器获取的各条视频进行处理,确定出各条视频相应的人脸特征;同时,确定各人脸特征相应的截图在相应视频的视频信息(如各人脸特征相应的截图,在相应视频中的视频时间点和/或视频进度);
例如,对于处理服务器获取的某一条视频,处理服务器可按照设定时间间隔,对该视频进行截图,提取各截图的人脸特征,并确定各人脸特征的截图在该视频的视频信息。
可选的,上述示出的两种确定各条视频相应的人脸特征的方式可以结合使用,也可以择一使用;当然,本发明实施例也可对获取的各条视频的各视频帧均进行人脸特征提取,确定出各条视频相应的人脸特征;同时,确定各人脸特征相应的视频帧在相应视频的视频信息。
可选的,人脸特征在相应视频的视频信息还可以包括:人脸特征相应的视频的标识(如视频ID)。
步骤S12、处理服务器分别针对各条视频相应的人脸特征,将同一人脸的人脸特征进行聚类处理,以分别得到各条视频相应的至少一个第二聚类。
在确定各条视频相应的人脸特征后,对于任一条视频,本发明实施例可将该视频中同一人脸的人脸特征聚为一类,得到该视频相应的第二聚类(即一个视频的一个第二聚类可以表示,该视频中同一人脸的人脸特征的一个聚类);以此对各条视频均进行处理,则可得到各条视频相应的第二聚类;
可以理解的是,一个第一聚类指的是处理服务器用于创建人脸索引的至少一条视频中,同一人脸的人脸特征的一个聚类;而第二聚类指的是处理服务器在获取多条视频的情况下,一条视频中同一人脸的人脸特征的一个聚类。
对于任一条视频,本发明实施例可分析该视频的人脸特征间的相似度,将该视频中相似度符合预定相似度要求的人脸特征聚为一类,实现对该视频中同一人脸的人脸特征的聚类处理;
可选的,预定相似度要求可以根据实际情况而定,本发明实施例并不限制,作为一种可选实现,人脸特征可以使用人脸特征向量表示(如使用高纬人脸特征向量表示人脸特征),人脸特征间的相似度可以使用人脸特征向量间的距离表示,可以设置表示同一人脸的人脸特征相应的预定向量距离,将人脸特征向量间的距离在预定向量距离内的人脸特征聚为一类。
进一步,一条视频中往往存在主要人脸和次要人脸,对于任一条视频,本发明实施例可确定该视频中各主要人脸的人脸特征的聚类(一条视频中主要人脸的数量可能是一个或多个),得到该视频相应的第二聚类;
相应的,在分别针对各条视频相应的人脸特征,将同一人脸的人脸特征进行聚类处理时,对于任一条视频,本发明实施例可在将该视频中同一人脸的人脸特征聚类后,将该视频的聚类中次要人脸相应的聚类进行删除,仅保留该视频的聚类中主要人脸相应的聚类,得到该视频相应的第二聚类;
作为一种可选实现,对于任一条视频,本发明实施例可将该视频中同一人脸的人脸特征聚类后,进一步将该视频的聚类中人脸特征出现次数小于次数阈值的聚类进行删除(即删除该视频的聚类中次要人脸的聚类),得到该视频相应的第二聚类。
步骤S13、处理服务器分别针对各条视频相应的各第二聚类所聚集的人脸特征,关联人脸特征在相应视频的视频信息,得到各条视频的聚类结果。
在分别针对各条视频,确定相应的第二聚类,得到各条视频相应的至少一个第二聚类后,本发明实施例可分别针对各条视频相应的各第二聚类所聚集的人脸特征,进行人脸特征在相应视频的视频信息的关联;如对于任一个第二聚类(一个第二聚类表示,一条视频中同一人脸的人脸特征的聚类),本发明实施例可对该第二聚类所聚集的各人脸特征,关联人脸特征在所属视频的视频时间点和/或视频进度;以此对每一条视频相应的第二聚类进行处理,可得到各条视频的聚类结果;
可以看出,一条视频的聚类结果可以至少包括:聚集该视频中同一人脸的人脸特征的至少一个第二聚类,及各第二聚类所聚集的各人脸特征在该视频的视频信息。
需要说明的是,步骤S12和步骤S13仅是本发明实施例获取各条视频的聚类结果的一种可选方式,本发明实施例也可使用其他方式获取各条视频的聚类结果。
步骤S14、处理服务器针对各条视频的聚类结果,将同一人脸的人脸特征进行聚类处理,得到所述多条视频相应的至少一个第一聚类。
在得到各条视频的聚类结果后,可以针对各条视频,分别明确同一人脸的人脸特征的第二聚类;在此基础上,可针对各条视频的第二聚类,将同一人脸的人脸特征进行聚类处理,确定出适于所述多条视频的同一人脸的人脸特征的聚类,得到所述多条视频相应的第一聚类(即所述至少一条视频为多条视频的情况下,该多条视频中同一人脸的人脸特征的聚类)。
步骤S15、针对各第一聚类所聚集的各人脸特征,关联人脸特征在相应视频的视频信息,得到所述至少一条视频的人脸索引。
在得到所述多条视频相应的第一聚类后,针对各第一聚类所聚集的各人脸特征,可将人脸特征在相应视频的视频信息进行关联,得到所述多条视频的人脸索引。
步骤S16、处理服务器将所述人脸索引写入人脸索引库。
本发明实施例提供的建立人脸索引的方法,可以在多条视频的情况下,分别针对各条视频,进行同一人脸的人脸特征的聚类处理,得到各条视频相应的第二聚类,通过将各条视频相应的各第二聚类所聚集的人脸特征,进行人脸特征在相应视频的视频信息的关联,可得到各条视频的聚类结果;从而可进一步将各条视频的聚类结果中,同一人脸的人脸特征再次进行聚类处理,得到适于所述多条视频相应的第一聚类;进而将各第一聚类所聚集的各人脸特征,进行人脸特征在相应视频的视频信息的关联,可在无人脸信息标记的情况下,实现高效的建立适于所述至少一条视频的人脸索引。
为便于理解,以多条视频为两条视频,且分为第一视频和第二视频为例进行说明,假设第一视频和第二视频存在相同的人物A,第一视频存在与第二视频不同的人物B,第二视频存在与第一视频不同的人物C(可选的,人物A和B可以是第一视频中主要人脸的人物,人物A和C可以是第二视频中主要人脸的人物),相应的处理示例可如图4所示:
处理服务器获取第一视频后,可对第一视频中的关键视频帧和/或,间隔设定时间间隔的截图提取人脸特征,并对同一人脸的人脸特征进行聚类处理,得到第一视频中人物A的人脸特征的第二聚类FA,使用[FA1,FA2,…,FAn]表示,及人物A的各人脸特征在第一视频相应的时间点TA,使用[TA1,TA2,…,TAn]表示;得到第一视频中人物B的人脸特征的第二聚类FB,使用[FB1,FB2,…,FBn]表示,及人物B的各人脸特征在第一视频相应的时间点TB,使用[TB1,TB2,…,TBn]表示;
并且,处理服务器获取第二视频后,可对第二视频中的关键视频帧和/或,间隔设定时间间隔的截图提取人脸特征,并对同一人脸的人脸特征进行聚类处理,得到第二视频中人物A的人脸特征的第二聚类FA’,使用[FA1’,FA2’,…,FAn’]表示,及人物A的各人脸特征在第二视频相应的时间点TA’,使用[TA1’,TA2’,…,TAn’]表示;得到第二视频中人物C的各人脸特征的第二聚类FC,使用[FC1,FC2,…,FCn]表示,及人物C的各人脸特征在第二视频相应的各时间点TC,使用[TC1,TC2,…,TCn]表示;
处理服务器将第一视频中人物A的各人脸特征聚为一类,人物B的各人脸特征聚为一类后,可针对第一视频中人物A的人脸特征的第二聚类的各人脸特征,关联在第一视频相应的各时间点,及所对应的第一视频的ID(第一视频的ID可使用VID1表示),得到第一视频中人物A的聚类结果,可使用[<FA1,VID1,TA1>,<FA2,VID1,TA2>…,<FAn,VID1,TAn>]表示;针对第一视频中人物B的人脸特征的第二聚类的各人脸特征,关联在第一视频相应的各时间点,及所对应的第一视频的ID,得到第一视频中人物B的聚类结果,可使用[<FB1,VID1,TB1>,<FB2,VID1,TB2>…,<FBn,VID1,TBn>]表示;
并且,处理服务器将第二视频中人物A的各人脸特征聚为一类,人物C的各人脸特征聚为一类后,可针对第二视频中人物A的人脸特征的第二聚类的各人脸特征,关联在第二视频相应的各时间点,及所对应的第二视频的ID(第二视频的ID可使用VID2表示),得到第二视频中人物A的聚类结果,可使用[<FA1’,VID2,TA1’>,<FA2’,VID2,TA2’>…,<FAn’,VID2,TAn’>]表示;针对第二视频中人物C的人脸特征的第二聚类的各人脸特征,关联在第二视频相应的各时间点,及所对应的第二视频的ID,得到第二视频中人物C的聚类结果,可使用[<FC1,VID2,TC1>,<FC2,VID2,TC2>…,<FCn,VID2,TCn>]表示;
处理服务器在得到第一视频中人物A的聚类结果、人物B的聚类结果,并且得到第二视频中人物A的聚类结果、人物C的聚类结果后,可将第一视频和第二视频中同一人脸的人脸特征进行聚类处理,即将第一视频中人物A的聚类结果中的人脸特征,和第二视频中人物A的聚类结果中的人脸特征进行聚类处理,从而得到适于第一视频和第二视频的人物A的第一聚类,使用[<FA1,FA2,…,FAn>,<FA1’,FA2’,…,FAn’>]表示;由于人物B和C为第一视频和第二视频中的不同人物,因此第一视频中人物B的第二聚类可以作为适于第一视频和第二视频的人物B的第一聚类,第二视频中人物C的第二聚类可以作为适于第一视频和第二视频的人物C的第一聚类;
进而,可将各第一聚类所聚集的各人脸特征,关联人脸特征在相应视频的视频信息,得到适于第一视频和第二视频的人脸索引;即得到的人脸索引可以表示为:[<FA1,VID1,TA1>,<FA2,VID1,TA2>…,<FAn,VID1,TAn>,<FA1’,VID2,TA1’>,<FA2’,VID2,TA2’>…,<FAn’,VID2,TAn’>],[<FB1,VID1,TB1>,<FB2,VID1,TB2>…,<FBn,VID1,TBn>],[<FC1,VID2,TC1>,<FC2,VID2,TC2>…,<FCn,VID2,TCn>]。
可选的,上述第一视频中人物A的人脸特征的第二聚类FA,也可以使用[FA1,FA2,…,FAn]的均值表示,上述第一视频中人物B的人脸特征的第二聚类FB,也可以使用[FB1,FB2,…,FBn]的均值表示,上述第二视频中人物A的人脸特征的第二聚类FA’,也可以使用[FA1’,FA2’,…,FAn’]的均值表示,上述第二视频中人物C的人脸特征的第二聚类FC,也可以使用[FC1,FC2,…,FCn]的均值表示。
上文示出了在多条视频情况下,建立人脸索引的方案;本发明实施例也可在一条视频的情况下,建立人脸索引;可选的,图5示出了本发明实施例提供的建立人脸索引的另一种可选信令流程;参照图5,在基于一条视频进行人脸索引建立时,本发明实施例提供的流程可以包括:
步骤S20、视频源向处理服务器输入视频。
此处所指的视频可以是视频源所具有的任意一条视频,可以认为是本发明实施例用于建立人脸索引的任意一条视频;
作为一种示例,视频源可以逐一或随机的向处理服务器输入视频,如视频源逐一或随机的将视频源具有的视频输入给处理服务器,则这个过程中,处理服务器可对视频源输入的任意一条视频,逐一的建立人脸索引;可选的,视频源也可以受指定(如受处理服务器指定,或者工作人员的指定),向处理服务器输入指定的视频;
可选的,在本发明实施例中,视频源所具有的每条视频可以具有唯一的标识(如视频ID);
可选的,视频也可以是以视频流形式存在。
相应的,处理服务器可以获取到视频。
步骤S21、处理服务器确定所述视频相应的人脸特征,并确定各人脸特征在所述视频相应的视频信息。
可选的,对于一条视频,确定视频相应的人脸特征的方式可以参照图3步骤S11所示。
步骤S22、处理服务器针对所述视频相应的各人脸特征,将同一人脸的人脸特征进行聚类处理,得到所述视频相应的第一聚类。
可选的,对于一条视频,将视频相应的人脸特征中,同一人脸的人脸特征进行聚类处理的过程可以参照图3步骤S12所示;
这里需要注意的是,在多条视频的情况下,每条视频的同一人脸的人脸特征的聚类称为第二聚类,而该多条视频中各第二聚类的同一人脸的人脸特征聚类可称为适于该多条视频的第一聚类(本发明实施例所指的第一聚类在多条视频情况下的一种形式);
而在一条视频的情况下,视频中同一人脸的人脸特征的聚类可认为是适于该条视频的第一聚类(本发明实施例所指的第一聚类在一条视频情况下的一种形式)。
步骤S23、处理服务器针对所述视频相应的各聚类的各人脸特征,关联人脸特征在所述视频的视频信息,建立出所述视频的人脸索引。
在将所述视频中同一人脸的人脸特征进行聚类处理,得到所述视频相应的各聚类后,本发明实施例可以对所述视频相应的各聚类的各人脸特征,关联人脸特征在所述视频的视频信息,得到所述视频相应的聚类结果;从而可在对一条视频建立人脸索引的情况下,将所述视频相应的聚类结果,作为所述视频的人脸特征。
可见,在本发明实施例中,一条视频相应的聚类结果可以包括:该视频中同一人脸的人脸特征的各聚类,及各聚类的各人脸特征在该视频相应的视频信息。
可选的,一个聚类的人脸特征在相应视频的视频信息可以至少包括:该聚类的各人脸特征在相应视频的时间点;作为一种替代方式,一个聚类的人脸特征在相应视频的视频信息可以包括:该聚类的各人脸特征在相应视频的视频进度;显然,一个聚类的人脸特征在相应视频的视频信息也可以包括:该聚类的各人脸特征在相应视频的时间点,和/或视频进度;
进一步,视频信息也可以包括:视频的标识,如视频的ID等。
作为一种假设示例,在一条视频的情况下,若以F表示人脸特征(如使用高纬人脸特征向量进行表示),T表示各人脸特征在视频中相应的时间点,若该视频存在一个主要人脸,则可得到该视频中主要人脸的人脸特征的第一聚类,使用[F11,F12,…,,F1n]表示;同时,可确定出该第一聚类的各人脸特征在视频相应的各时间点[T11,T12,…,T1n];对该第一聚类的各人脸特征,关联人脸特征在该视频相应的时间点后,在一条视频下,人脸索引的一种可选表示形式可以为:
[<F11,F12,…,,F1n>,<T11,T12,…,T1n>];其中,<F11,F12,…,,F1n>也可以使用人脸特征的均值表示;可选的,该人脸索引中还可以包括:该视频的标识;
当然,在一条视频中存在多个人脸(如多个主要人脸)时,上述人脸索引中,可以存在多个属于不同人脸的人脸特征的第一聚类,并在各第一聚类的各人脸特征关联在该视频相应的时间点。
步骤S24、处理服务器将所述人脸索引,写入人脸索引库。
在对一条视频进行人脸索引建立的情况下,在得到该视频相应的聚类结果后,本发明实施例可通过该视频相应的聚类结果,实现该视频中同一人脸的人脸特征的聚类,并关联出各聚类的人脸特征在该视频相应的视频信息,实现无人脸信息标记情况下,对该一条视频中至少一个相同人物的人脸特征与视频信息进行关联,达成该视频的人脸索引的建立。
并且通过将同一人脸的人脸特征进行聚类处理,可以认为同一聚类的人脸特征表示的是同一人脸,可以减少人脸索引库中的人脸数量,可极大的减小人脸索引的数据冗余。
为便于理解,在一条视频的情况下,相应处理过程可如图6所示,以人脸特征在该视频相应的视频点表示视频信息,参照图6,则将该视频中同一人脸的人脸特征进行聚类处理后,可得到多个聚类(即该视频相应的多个第一聚类);其中,聚类1可以是同一人脸的人脸特征<F11,F12,…,F1n>的聚类,并且将聚类1中各人脸特征在视频相应的视频时间点进行关联,可得到[<F11,T11>,<F12,T12>…,<F1n,T1n>],其中,<T 11,T12,…,T 1n>表示[F11,F12,…,F1n]在该视频分别相应的时间点;
聚类2可以是另一个人脸的人脸特征[F21,F22,…,,F2n]的聚类,将聚类2中各人脸特征在视频相应的视频时间点进行关联,可得到[<F21,T21>,<F22,T22>…,<F2n,T2n>],其中,<T21,T22,…,T2n>表示[F21,F22,…,F2n]在该视频分别相应的时间点。
上述描述了基于多条视频情况下的人脸索引建立,及一条视频情况下的人脸索引建立;综合来说,本发明实施例是针对需要建立人脸索引的至少一条视频,将同一人脸的人脸特征进行聚类处理,得到适于所述至少一条视频的第一聚类,并关联各第一聚类的人脸特征在相应视频的视频信息,建立出适于所述至少一条视频的人脸索引;指的注意的是,所述至少一条视频可以是多条视频(如上述图3所示的处理情况),也可以是一条视频(如上述图5所示的处理情况);
当然,除上述图3和图5所示处理情况外,本发明实施例也可在多条视频的情况下,将该多条视频中同一人脸的人脸特征进行聚类处理,而并不分别针对各条视频,将各条视频中同一人脸的人脸特征进行聚类处理。
可选的,在将视频的人脸特征中,相同的人脸特征进行聚类处理的实现过程中,本发明实施例可设置预定相似度要求,通过分析人脸特征间的相似度,将相似度符合预定相似度要求的人脸特征聚为一类,实现对视频的人脸特征中同一人脸的人脸特征的聚类处理。
可选的,本发明实施例也可按照视频的播放时间顺序(特别是视频为视频流的情况),从视频中提取人脸特征;此时,视频的人脸特征是按照播放时间顺序先后提取的,因此本发明实施例也可按照人脸特征的提取先后顺序,进行同一人脸的人脸特征的聚类处理,即对于先提取的人脸特征,本发明实施例可先执行聚类处理,对于后提取的人脸特征,本发明实施例可后执行聚类处理;
可选的,图7示出了本发明实施例提供的将同一人脸的人脸特征进行聚类处理的方法流程图,该方法可以适用于前文所述的任一将同一人脸的人脸特征进行聚类处理的阶段,如图3步骤S12、图3步骤S14、图5步骤S22等阶段;参照图7,该方法可以包括:
步骤S30、对于任一待聚类人脸特征,检测已得到的聚类中,是否存在与所述待聚类人脸特征的相似度符合预定相似度要求的目标聚类,若是,执行步骤S31,若否,执行步骤S32。
在本发明实施例中,人脸特征可以使用人脸特征向量表示;由于人脸特征是按照播放时间顺序从视频中先后提取的,因此对于提取到的一人脸特征,处理服务器可能在之前已将与该人脸特征相似的其他人脸特征进行过聚类,也可能没有进行过聚类;
可选的,本发明实施例可对于任一待聚类人脸特征(如当前从任一条视频中提取的人脸特征,或者,在多条视频情况下,任一条视频的第二聚类中的任一人脸特征),检测已得到的聚类中,是否存在与该待聚类人脸特征的相似度符合预定相似度要求的目标聚类,以判断与该待聚类人脸特征属于同一人脸的其他人脸特征是否已被聚类。
步骤S31、将所述待聚类人脸特征聚集到所述目标聚类。
在检测到已得到的聚类中,存在与该待聚类人脸特征的相似度符合预定相似度要求的目标聚类时,可认为与该待聚类人脸特征属于同一人脸的其他人脸特征已被聚类,可将该待聚类人脸特征聚集到该目标聚类。
步骤S32、设置新的聚类,将所述待聚类人脸特征聚集到该新的聚类。
在检测到已得到的聚类中,不存在与该待聚类人脸特征的相似度符合预定相似度要求的目标聚类时,可认为该待聚类人脸特征属于新的人脸,可将该待聚类人脸特征独立为一个聚类,即通过设置新的聚类,将该待聚类人脸特征聚集到该新的聚类中。
本发明实施例可通过人脸特征的人脸特征向量的距离,来表示人脸特征间的相似度;可选的,图8示出了本发明实施例提供的将同一人脸的人脸特征进行聚类处理的另一方法流程,图8所示流程可以认为是图7所示流程的一种细化,参照图8,该流程可以包括:
步骤S40、对于任一待聚类人脸特征,检测在所述待聚类人脸特征的人脸特征向量的预定向量距离内,是否存在已得到的聚类,若是,执行步骤S41,若否,执行步骤S43。
步骤S41、判断在该已得到的聚类中加入所述待聚类人脸特征后,该已得到的聚类相应的半径是否大于半径阈值,若否,执行步骤S42,若是,执行步骤S43。
步骤S42、确定所述已得到的聚类为目标聚类,将所述待聚类人脸特征聚集到所述目标聚类。
步骤S43、设置新的聚类,将所述待聚类人脸特征聚集到该新的聚类。
可以看出,若在待聚类人脸特征相应的人脸特征向量的预定向量距离内,存在已得到的聚类,并且在该已得到的聚类中加入所述待聚类人脸特征后,所述已得到的聚类的半径不大于半径阈值,则可确定所述已得到聚类为所述目标聚类,可将所述待聚类人脸特征聚集到所述目标聚类;
而若在待聚类人脸特征相应的人脸特征向量的预定向量距离内,不存在已得到的聚类,则可确定所述待聚类人脸特征属于新的人脸,可设置新的聚类,将所述待聚类人脸特征聚集到该新的聚类;
若在待聚类人脸特征相应的人脸特征向量的预定向量距离内,存在已得到的聚类,但在已得到的聚类中加入所述待聚类人脸特征后,所述已得到的聚类的半径大于半径阈值,则确定所述已得到的聚类所聚类的人脸特征,与所述待聚类人脸特征不属于同一人脸,可设置新的聚类,将所述待聚类人脸特征聚集到该新的聚类。
进一步,在将待聚类人脸特征聚集到一个聚类后(可能是已得到的目标聚类,也可能是新的聚类),可以更新所述待聚类人脸特征聚集到的聚类相应的半径及质心;进一步,还可对于每一聚类设置相应的视频信息列表(如视频时间点列表、视频进度列表等),从而在所述待聚类人脸特征聚类到某一聚类后,在所述待聚类人脸特征聚集到的聚类相应的视频信息列表中***,所述待聚类人脸特征在相应视频的视频信息。
相应的,在对于任一待聚类人脸特征,检测在所述待聚类人脸特征的人脸特征向量的预定向量距离内,是否存在已得到的聚类时,可判断距所述待聚类人脸特征的人脸特征向量的距离为ε的近邻里,是否存在已得到的聚类;
作为一种示例,以对一条视频中同一人脸的人脸特征进行聚类为例,则可按照该视频的视频帧顺序提取人脸特征,所提取的人脸特征成为待聚类人脸特征,可按照该视频的视频时间点<T1,T2,…,Tn>,提取到同一人脸的人脸特征<F1,F2,…,,Fn>;
对于提取到的任一人脸特征,可判断距该人脸特征的人脸特征向量的距离为ε的近邻里是否存在聚类;若存在聚类,则可尝试调整聚类,确认加入该人脸特征后,聚类的半径更新是否超过最大半径阈值:若超过最大半径阈值,则将此人脸特征置为新的聚类,在该聚类相应的视频时间点列表中***人脸特征在视频的视频时间点;否则,可在聚类中加入该人脸特征后,更新聚类的质心和半径,同时在该聚类相应的视频时间点列表,更新入该人脸特征在视频的视频时间点,相应的示意可如图9所示。
这里需要说明的是,聚类其实就是按照某个特定标准(如距离准则)把一个数据集分割成不同的类或簇,使得同一个簇内的数据的相似性尽可能大,同时不在同一个簇中的数据对象的差异性也尽可能地大。即聚类后同一类的数据尽可能聚集到一起,不同数据尽量分离;在上述描述的图9相应的示意中,可设置经验半径数值ε,以ε为半径形成一个圆,在圆内的数据就认为是相似的,而聚类相应的质心就是圆心,当某一聚类中聚集的数据发生改变时,该聚类相应的质心和半径则相应更新。
进一步需要说明的是,如果视频是以视频流形式输入到处理服务器,则处理服务器可通过建立视频索引链的方式,区分多条视频的视频流;可选的,处理服务器在获取到一个视频流时,可通过视频流的标识,判断该视频流的视频索引链是否存在,一个视频索引链可记录该视频中聚集的不同人脸的人脸特征的聚类(若在多条视频下,则是第二聚类的形式);若是,则可针对该视频流,按照视频帧顺序(视频播放时间顺序的一种形式)提取该视频流的人脸特征,并确定提取的人脸特征在该视频的视频索引链中相应的聚类(如图7或图8方式实现);
若否,则可以创建该视频流的视频索引链,按照视频帧顺序提取该视频流的人脸特征,并确定提取的人脸特征在所创建的该视频的视频索引链中相应的聚类(如图7或图8方式实现)。
可选的,视频索引链可以键值形式存在,如一个视频的视频索引链可以该视频的标识为主键,以该视频中同一人脸的人脸特征的各聚类为主键关联的值。
可选的,对于上述所述的将任一条视频中,同一人脸的人脸特征进行聚类处理,得到同一人脸特征的聚类的阶段(如图3所示步骤S12、图5所示步骤S22等阶段),本发明实施例可设置任一条视频相应的人脸特征的聚类,为视频中主要人脸的人脸特征的聚类;
可选的,对于任一条视频,在得到该视频中同一人脸的人脸特征的至少一个聚类后,可将该至少一个聚类中人脸特征出现次数小于次数阈值的聚类进行删除;
如在多条视频的情况下,得到各条视频相应的第二聚类的处理时,对于任一条视频,在得到该视频中同一人脸的人脸特征的至少一个聚类后,可将该至少一个聚类中人脸特征出现次数小于次数阈值的聚类进行删除,得到该视频相应的至少一个第二聚类;
如在一条视频的情况下,得到该视频相应的第一聚类的处理时,在得到该视频中同一人脸的人脸特征的至少一个聚类后,可将人脸特征出现次数小于次数阈值的聚类进行删除,得到该视频相应的至少一个第一聚类。
可选的,人脸特征在相应视频的视频信息可以包括:人脸特征在相应视频的视频时间点;可选的,对于任一条视频,本发明实施例可通过图10所示方法删除该视频的人脸特征的聚类中,次要人脸的人脸特征的聚类;参照图10,该方法可以包括:
步骤S50、对于任一条视频,在得到该视频中同一人脸的人脸特征的至少一个聚类后,确定该视频的各聚类的人脸特征相应的视频时间点分布。
为了区分主要人脸和次要人脸,在对任一条视频,将视频中同一人脸的人脸特征进行聚类后,可对每一聚类所聚集的人脸特征在相应视频的视频时间点,确定视频时间点分布,即确定出一条视频中,各聚类的人脸特征在该视频相应的视频时间点的分布。
步骤S51、删除视频时间点分布不处于至少一个设定时长间隔的聚类。
可选的,本发明实施例可设置至少一个设定时长间隔,如n个时长为t的时间间隔;从而可对任一条视频,判断该视频的各聚类的人脸特征相应的视频时间点分布,是否在多于该n个时长为t的时间间隔中,若否,则可确定该聚类的人脸特征属于视频中的次要人脸,可进行删除,若是,则可确定该聚类的人脸特征属于视频中的主要人脸,可进行保留。
上文从不同的角度描述了在无人脸信息标记的情况下,对一条或多条视频建立人脸索引的方案,通过将一条或多条视频中,同一人脸的人脸特征进行聚类处理,得到适于该一条或多条视频的第一聚类;并对各第一聚类聚集的各人脸特征,进行人脸特征在相应视频的视频信息的关联,可实现高效的人脸索引建立;进一步,通过各第一聚类,可对该一条或多条视频中同一人脸的人脸特征进行聚集,可以减少人脸索引库中的人脸数量,可极大的减小人脸索引的数据冗余。
在建立出人脸索引后,本发明实施例可支持用户在检索视频时,通过输入目标人物的人脸图像,来检索出具有该目标人物的人脸的视频;作为一种应用示例,本发明实施例的应用过程可如图11所示,参照图11,该过程可以包括:
步骤S60、终端向处理服务器发送视频检索请求,所述视频检索请求携带有目标人脸图像。
用户在需要搜索具有目标人物的视频时,可向终端输入目标人物的目标人脸图像,终端可相应的向处理服务器发送视频检索请求,并在视频检索请求中携带目标人脸图像;
作为一种示例,用户可在终端装载的视频客户端的页面,导入目标人脸图像,用户点击页面的搜索按钮后,终端可通过视频客户端向处理服务器发送携带目标人脸图像的视频检索请求。
步骤S61、处理服务器提取所述目标人脸图像的目标人脸特征。
处理服务器获取所述视频检索请求后,可解析得到所述视频检索请求中携带的目标人脸图像,并提取所述目标人脸图像的人脸特征(称为目标人脸特征)。
步骤S62、处理服务器从人脸索引中,确定所述目标人脸特征关联的相应视频的视频信息。
处理服务器在建立人脸索引后,基于人脸索引中各第一聚类所聚集的人脸特征,关联的人脸特征在相应视频的视频信息,处理服务器可确定所述目标人脸特征关联的相应视频的视频信息(包括目标人脸特征相应的各视频,及目标人脸特征在相应的各视频中的视频时间点等)。
可选的,作为一种实现,处理服务器可基于目标人脸特征,对人脸索引中的各第一聚类的质心进行k近邻查询,得到目标人脸特征所在的第一聚类,并确定目标人脸特征所在的第一聚类中聚集的各人脸特征相应的各视频的视频ID,及在各视频中的视频时间点。
步骤S63、处理服务器向终端发送所述视频信息。
处理服务器在确定所述目标人脸特征关联的相应视频的视频信息后,可输出所确定的视频信息,即向终端发送所述视频信息。
步骤S64、终端展示所述视频信息。
可选的,终端可在视频客户端的搜索结果页面,展示所述视频信息,如展示目标人脸特征所相应的视频,及在所相应的视频的视频时间点等。
上述给出的应用示例是以用户使用视频客户端进行视频检索进行说明,当然用户也可使用浏览器等浏览组件登录视频网站,通过视频网站进行视频检索。
下面对本发明实施例提供的建立人脸索引的装置进行介绍;下文描述的建立人脸索引的装置可以认为是,处理服务器为实现本发明实施例提供的建立人脸索引的方法所需设置的程序模块。下文描述的建立人脸索引的装置的内容,可与上文描述的建立人脸索引的方法的内容相互对应参照。
图12为本发明实施例提供的建立人脸索引的装置的结构框图,该装置可应用于处理服务器,参照图12,该装置可以包括:
视频获取模块100,用于获取至少一条视频;
人脸特征及视频信息确定模块200,用于分别确定各条视频相应的人脸特征,并确定各人脸特征在相应视频的视频信息;
第一聚类得到模块300,用于将同一人脸的人脸特征进行聚类处理,得到至少一个第一聚类;其中,一个第一聚类所聚集的人脸特征表示,所述至少一条视频中同一人脸的人脸特征;
人脸索引建立模块400,用于针对各第一聚类所聚集的各人脸特征,关联人脸特征在相应视频的视频信息,得到所述至少一条视频的人脸索引。
可选的,在多条视频的情况下,第一聚类得到模块300,用于将同一人脸的人脸特征进行聚类处理,得到至少一个第一聚类,具体包括:
获取各条视频的聚类结果,其中,一条视频的聚类结果至少包括:聚集该视频中同一人脸的人脸特征的至少一个第二聚类,及各第二聚类所聚集的各人脸特征在该视频的视频信息;
针对各条视频的聚类结果,将同一人脸的人脸特征进行聚类处理,得到所述多条视频相应的至少一个第一聚类。
可选的,在多条视频的情况下,第一聚类得到模块300,用于获取各条视频的聚类结果,具体包括:
分别针对各条视频相应的人脸特征,将同一人脸的人脸特征进行聚类处理,以分别得到各条视频相应的至少一个第二聚类;
分别针对各条视频相应的各第二聚类所聚集的人脸特征,关联人脸特征在相应视频的视频信息,得到各条视频的聚类结果。
可选的,在多条视频的情况下,第一聚类得到模块300,用于分别得到各条视频相应的至少一个第二聚类,具体包括:
对于任一条视频,在得到该视频中同一人脸的人脸特征的至少一个聚类后,将该至少一个聚类中人脸特征出现次数小于次数阈值的聚类进行删除,得到该视频相应的至少一个第二聚类。
可选的,所述人脸特征在相应视频的视频信息至少包括:人脸特征在相应视频的视频时间点;在多条视频的情况下,第一聚类得到模块300,用于对于任一条视频,在得到该视频中同一人脸的人脸特征的至少一个聚类后,将该至少一个聚类中人脸特征出现次数小于次数阈值的聚类进行删除,得到该视频相应的至少一个第二聚类,具体包括:
对于任一条视频,在得到该视频中同一人脸的人脸特征的至少一个聚类后,确定该视频的各聚类的人脸特征相应的视频时间点分布;
删除视频时间点分布不处于至少一个设定时长间隔的聚类,得到该视频相应的至少一个第二聚类。
可选的,在多条视频的情况下,第一聚类得到模块300,用于分别针对各条视频相应的人脸特征,将同一人脸的人脸特征进行聚类处理,具体包括:
若获取的任一条视频存在视频索引链,对于从该视频中提取的人脸特征,确定该人脸特征在该视频的视频索引链中相应的第二聚类;其中,一个视频索引链记录该视频中聚集的不同人脸的人脸特征的各第二聚类;
若获取的任一条视频不存在视频索引链,创建该视频相应的视频索引链,对于从该视频中提取的人脸特征,确定提取的人脸特征在所创建的该视频的视频索引链中相应的第二聚类。
可选的,对于任一待聚类人脸特征,执行所述将同一人脸的人脸特征进行聚类处理的过程,具体包括:
检测已得到的聚类中,是否存在与所述待聚类人脸特征的相似度符合预定相似度要求的目标聚类;
若存在所述目标聚类,将所述待聚类人脸特征聚集到所述目标聚类;
若不存在所述目标聚类,设置新的聚类,将所述待聚类人脸特征聚集到该新的聚类。
可选的,上述执行检测已得到的聚类中,是否存在与所述待聚类人脸特征的相似度符合预定相似度要求的目标聚类的过程,可以具体包括:
检测在所述待聚类人脸特征的人脸特征向量的预定向量距离内,是否存在已得到的聚类;
若存在已得到的聚类,且在已得到的聚类中加入所述待聚类人脸特征后,所述已得到的聚类相应的半径不大于半径阈值,则确定所述已得到聚类为所述目标聚类;
若不存在已得到的聚类,或,存在已得到的聚类,但在已得到的聚类中加入所述待聚类人脸特征后,所述已得到的聚类的半径大于半径阈值,则确定不存在所述目标聚类。
可选的,对于所述待聚类人脸特征,执行所述关联人脸特征在相应视频的视频信息的过程,可以具体包括:
在所述待聚类人脸特征聚集到的聚类相应的视频信息列表中***,所述待聚类人脸特征在相应视频的视频信息。
可选的,本发明实施例提供的建立人脸索引的装置还可以用于:更新所述待聚类人脸特征聚集到的聚类相应的半径及质心。
可选的,在本发明实施例中,人脸特征在相应视频的视频信息可以具体包括:
人脸特征在相应视频的视频时间点,和/或,视频进度,和/或,视频的标识。
可选的,本发明实施例提供的建立人脸索引的装置还可以用于:
获取视频检索请求,所述视频检索请求携带有目标人脸图像;
提取所述目标人脸图像的目标人脸特征;
从所述人脸索引中确定,所述目标人脸特征关联的相应视频的视频信息;
输出所确定的视频信息。
本发明实施例还提供一种处理服务器,该处理服务器可以装载上述的程序模块,以执行本发明实施例提供的建立人脸索引的方法;上述程序模块可通过程序形式实现,图13示出了本发明实施例提供的处理服务器的结构框图,参照图13,该处理服务器可以包括:
至少一个处理芯片1,至少一个通信接口2,至少一个存储器3和至少一个通信总线4;
在本发明实施例中,处理芯片1、通信接口2、存储器3、通信总线4的数量为至少一个,且处理芯片1、通信接口2、存储器3通过通信总线4完成相互间的通信;
处理芯片1可能是一个中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。
存储器3可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。
其中,存储器3存储有程序,处理芯片1调用存储器3所存储的程序,以实现上述所述的由处理服务器执行的建立人脸索引的方法的步骤。
该程序具体用于:
获取至少一条视频;
分别确定各条视频相应的人脸特征,并确定各人脸特征在相应视频的视频信息;
将同一人脸的人脸特征进行聚类处理,得到至少一个第一聚类;其中,一个第一聚类所聚集的人脸特征表示,所述至少一条视频中同一人脸的人脸特征;
针对各第一聚类所聚集的各人脸特征,关联人脸特征在相应视频的视频信息,得到所述至少一条视频的人脸索引。
可选的,本发明实施例还提供一种存储介质,该存储介质可存储有适于处理芯片执行的程序,以实现上述所述的由处理服务器执行的建立人脸索引的方法的步骤。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理芯片执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的核心思想或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (12)

1.一种建立人脸索引的方法,其特征在于,包括:
获取多条视频;
分别确定各条视频相应的人脸特征,并确定各人脸特征在相应视频的视频信息;
分别针对各条视频相应的人脸特征,将同一人脸的人脸特征进行聚类处理,以分别得到各条视频相应的至少一个第二聚类,具体包括:若获取的任一条视频存在视频索引链,对于从该视频中提取的人脸特征,确定该人脸特征在该视频的视频索引链中相应的第二聚类;其中,一个视频索引链记录该视频中聚集的不同人脸的人脸特征的各第二聚类,一个视频索引链以该视频的标识为主键,以该视频中同一人脸的人脸特征的各聚类为主键关联的值;若获取的任一条视频不存在视频索引链,创建该视频相应的视频索引链,对于从该视频中提取的人脸特征,确定提取的人脸特征在所创建的该视频的视频索引链中相应的第二聚类;
分别针对各条视频相应的各第二聚类所聚集的人脸特征,关联人脸特征在相应视频的视频信息,得到各条视频的聚类结果,其中,一条视频的聚类结果至少包括:聚集该视频中同一人脸的人脸特征的至少一个第二聚类,及各第二聚类所聚集的各人脸特征在该视频的视频信息;一条视频的一个第二聚类表示该视频中同一人脸的人脸特征的一个聚类;
针对各条视频的第二聚类,将同一人脸的人脸特征进行聚类处理,得到所述多条视频相应的至少一个第一聚类;其中,一个第一聚类所聚集的人脸特征表示,所述多条视频中同一人脸的人脸特征;
针对各第一聚类所聚集的各人脸特征,关联人脸特征在相应视频的视频信息,以在无人脸信息标记的情况下,得到所述多条视频的人脸索引,并将所述多条视频的人脸索引写入人脸索引库。
2.根据权利要求1所述的建立人脸索引的方法,其特征在于,所述分别得到各条视频相应的至少一个第二聚类包括:
对于任一条视频,在得到该视频中同一人脸的人脸特征的至少一个聚类后,将该至少一个聚类中人脸特征出现次数小于次数阈值的聚类进行删除,得到该视频相应的至少一个第二聚类。
3.根据权利要求1-2任一项所述的建立人脸索引的方法,其特征在于,对于任一待聚类人脸特征,执行所述将同一人脸的人脸特征进行聚类处理的过程包括:
检测已得到的聚类中,是否存在与所述待聚类人脸特征的相似度符合预定相似度要求的目标聚类;
若存在所述目标聚类,将所述待聚类人脸特征聚集到所述目标聚类;
若不存在所述目标聚类,设置新的聚类,将所述待聚类人脸特征聚集到该新的聚类。
4.根据权利要求3所述的建立人脸索引的方法,其特征在于,所述检测已得到的聚类中,是否存在与所述待聚类人脸特征的相似度符合预定相似度要求的目标聚类包括:
检测在所述待聚类人脸特征的人脸特征向量的预定向量距离内,是否存在已得到的聚类;
若存在已得到的聚类,且在已得到的聚类中加入所述待聚类人脸特征后,所述已得到的聚类相应的半径不大于半径阈值,则确定所述已得到的聚类为所述目标聚类;
若不存在已得到的聚类,或,存在已得到的聚类,但在已得到的聚类中加入所述待聚类人脸特征后,所述已得到的聚类的半径大于半径阈值,则确定不存在所述目标聚类。
5.根据权利要求3所述的建立人脸索引的方法,其特征在于,对于所述待聚类人脸特征,执行所述关联人脸特征在相应视频的视频信息的过程包括:
在所述待聚类人脸特征聚集到的聚类相应的视频信息列表中***,所述待聚类人脸特征在相应视频的视频信息。
6.根据权利要求3所述的建立人脸索引的方法,其特征在于,所述方法还包括:
更新所述待聚类人脸特征聚集到的聚类相应的半径及质心。
7.根据权利要求1所述的建立人脸索引的方法,其特征在于,所述人脸特征在相应视频的视频信息包括:
人脸特征在相应视频的视频时间点,和/或,视频进度,和/或,视频的标识。
8.根据权利要求2所述的建立人脸索引的方法,其特征在于,所述人脸特征在相应视频的视频信息至少包括:人脸特征在相应视频的视频时间点;
所述对于任一条视频,在得到该视频中同一人脸的人脸特征的至少一个聚类后,将该至少一个聚类中人脸特征出现次数小于次数阈值的聚类进行删除,得到该视频相应的至少一个第二聚类包括:
对于任一条视频,在得到该视频中同一人脸的人脸特征的至少一个聚类后,确定该视频的各聚类的人脸特征相应的视频时间点分布;
删除视频时间点分布不处于至少一个设定时长间隔的聚类,得到该视频相应的至少一个第二聚类。
9.根据权利要求1所述的建立人脸索引的方法,其特征在于,还包括:
获取视频检索请求,所述视频检索请求携带有目标人脸图像;
提取所述目标人脸图像的目标人脸特征;
从所述人脸索引中确定,所述目标人脸特征关联的相应视频的视频信息;
输出所确定的视频信息。
10.一种建立人脸索引的装置,其特征在于,包括:
视频获取模块,用于获取多条视频;
人脸特征及视频信息确定模块,用于分别确定各条视频相应的人脸特征,并确定各人脸特征在相应视频的视频信息;
第一聚类得到模块,用于分别针对各条视频相应的人脸特征,将同一人脸的人脸特征进行聚类处理,以分别得到各条视频相应的至少一个第二聚类,具体包括:若获取的任一条视频存在视频索引链,对于从该视频中提取的人脸特征,确定该人脸特征在该视频的视频索引链中相应的第二聚类;其中,一个视频索引链记录该视频中聚集的不同人脸的人脸特征的各第二聚类,一个视频索引链以该视频的标识为主键,以该视频中同一人脸的人脸特征的各聚类为主键关联的值;若获取的任一条视频不存在视频索引链,创建该视频相应的视频索引链,对于从该视频中提取的人脸特征,确定提取的人脸特征在所创建的该视频的视频索引链中相应的第二聚类;分别针对各条视频相应的各第二聚类所聚集的人脸特征,关联人脸特征在相应视频的视频信息,得到各条视频的聚类结果,其中,一条视频的聚类结果至少包括:聚集该视频中同一人脸的人脸特征的至少一个第二聚类,及各第二聚类所聚集的各人脸特征在该视频的视频信息;一条视频的一个第二聚类表示该视频中同一人脸的人脸特征的一个聚类;针对各条视频的第二聚类,将同一人脸的人脸特征进行聚类处理,得到所述多条视频相应的至少一个第一聚类;其中,一个第一聚类所聚集的人脸特征表示,所述多条视频中同一人脸的人脸特征;
人脸索引建立模块,用于针对各第一聚类所聚集的各人脸特征,关联人脸特征在相应视频的视频信息,以在无人脸信息标记的情况下,得到所述多条视频的人脸索引,并将所述多条视频的人脸索引写入人脸索引库。
11.一种处理服务器,其特征在于,包括:至少一个存储器和至少一个处理芯片,所述存储器存储有程序,所述处理芯片调用所述程序,以实现权利要求1-9任一项所述的建立人脸索引的方法的步骤。
12.一种存储介质,其特征在于,所述存储介质存储有适于处理芯片执行的程序,以实现权利要求1-9任一项所述的建立人脸索引的方法的步骤。
CN201810534101.5A 2018-05-29 2018-05-29 一种建立人脸索引的方法、装置、处理服务器及存储介质 Active CN110543584B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810534101.5A CN110543584B (zh) 2018-05-29 2018-05-29 一种建立人脸索引的方法、装置、处理服务器及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810534101.5A CN110543584B (zh) 2018-05-29 2018-05-29 一种建立人脸索引的方法、装置、处理服务器及存储介质

Publications (2)

Publication Number Publication Date
CN110543584A CN110543584A (zh) 2019-12-06
CN110543584B true CN110543584B (zh) 2023-05-05

Family

ID=68701656

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810534101.5A Active CN110543584B (zh) 2018-05-29 2018-05-29 一种建立人脸索引的方法、装置、处理服务器及存储介质

Country Status (1)

Country Link
CN (1) CN110543584B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113449543B (zh) * 2020-03-24 2022-09-27 百度在线网络技术(北京)有限公司 视频检测方法、装置、设备、以及存储介质
CN111414517B (zh) * 2020-03-26 2023-05-19 成都市喜爱科技有限公司 视频人脸解析方法、装置及服务器
CN113965772B (zh) * 2021-10-29 2024-05-10 北京百度网讯科技有限公司 直播视频处理方法、装置、电子设备和存储介质
CN116127133B (zh) * 2023-04-17 2023-08-08 湖南柚子树文化传媒有限公司 基于人工智能的文件查找方法、***、设备和介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101799827A (zh) * 2010-03-11 2010-08-11 浙江大学 基于层次化结构的视频素材库管理方法
CN101833569A (zh) * 2010-04-08 2010-09-15 中国科学院自动化研究所 一种对电影人脸图像进行自动标识的方法
CN103336795A (zh) * 2013-06-09 2013-10-02 华中科技大学 基于多特征的视频索引方法
CN103631786A (zh) * 2012-08-22 2014-03-12 腾讯科技(深圳)有限公司 一种视频文件的聚类方法和装置
CN105915930A (zh) * 2016-04-15 2016-08-31 北京网康科技有限公司 一种视频文件发送方法及装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8351661B2 (en) * 2009-12-02 2013-01-08 At&T Intellectual Property I, L.P. System and method to assign a digital image to a face cluster
CN103530652B (zh) * 2013-10-23 2016-09-14 北京中视广信科技有限公司 一种基于人脸聚类的视频编目方法、检索方法及其***
CN104133875B (zh) * 2014-07-24 2017-03-22 北京中视广信科技有限公司 一种基于人脸的视频标注方法和视频检索方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101799827A (zh) * 2010-03-11 2010-08-11 浙江大学 基于层次化结构的视频素材库管理方法
CN101833569A (zh) * 2010-04-08 2010-09-15 中国科学院自动化研究所 一种对电影人脸图像进行自动标识的方法
CN103631786A (zh) * 2012-08-22 2014-03-12 腾讯科技(深圳)有限公司 一种视频文件的聚类方法和装置
CN103336795A (zh) * 2013-06-09 2013-10-02 华中科技大学 基于多特征的视频索引方法
CN105915930A (zh) * 2016-04-15 2016-08-31 北京网康科技有限公司 一种视频文件发送方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Xiaochun Cao等.Constrained multi-view video face clustering .《IEEE Transactions on Image Processing 》.2015,第24卷(第11期),4381-4393. *
张博.基于移动视频的动态人脸识别技术的研究与实现.《中国优秀硕士学位论文全文数据库 信息科技辑》.2016,I138-1030. *

Also Published As

Publication number Publication date
CN110543584A (zh) 2019-12-06

Similar Documents

Publication Publication Date Title
CN110543584B (zh) 一种建立人脸索引的方法、装置、处理服务器及存储介质
CN106534344B (zh) 一种云平台视频处理***及其应用方法
US20210357624A1 (en) Information processing method and device, and storage medium
US20210357678A1 (en) Information processing method and apparatus, and storage medium
CN107092686B (zh) 一种基于云存储平台的文件管理方法及装置
CN109657107B (zh) 一种基于第三方应用的终端匹配方法和装置
CN109241223B (zh) 行为行踪识别方法及***
US8994311B1 (en) System, method, and computer program for segmenting a content stream
KR20110132884A (ko) 다중 동영상 색인 및 검색이 가능한 지능형 영상 정보 검색 장치 및 방법
CN109858354B (zh) 一种人脸身份库、轨迹表建立和人脸轨迹查询方法和***
US20150254342A1 (en) Video dna (vdna) method and system for multi-dimensional content matching
CN110851473A (zh) 一种数据处理方法、装置和***
JP5633647B2 (ja) 映像処理システム、映像処理方法、映像処理用データベースの作成方法とそのデータベース、映像処理装置およびその制御方法と制御プログラム
KR101954717B1 (ko) 고속분석 영상처리장치 및 그 장치의 구동방법
US20210312587A1 (en) Distributed image analysis method and system, and storage medium
WO2013097101A1 (zh) 分析视频文件的方法和装置
CN111435435B (zh) 一种同伴识别方法、装置、服务器及***
US20120147179A1 (en) Method and system for providing intelligent access monitoring, intelligent access monitoring apparatus
CN111177481A (zh) 用户标识映射方法及装置
KR102254037B1 (ko) 영상분석장치 및 그 장치의 구동방법
CN113473166A (zh) 一种数据存储***及方法
CN112148920A (zh) 数据管理方法
CN110876090B (zh) 视频摘要回放方法、装置、电子设备及可读存储介质
CN108540471B (zh) 移动应用网络流量聚类方法、计算机可读存储介质和终端
US9275140B2 (en) Method of optimizing the search for a scene on the basis of a stream of images archived in a video database

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant