CN114612967A - 一种人脸聚类的方法、装置、设备及存储介质 - Google Patents

一种人脸聚类的方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN114612967A
CN114612967A CN202210205730.XA CN202210205730A CN114612967A CN 114612967 A CN114612967 A CN 114612967A CN 202210205730 A CN202210205730 A CN 202210205730A CN 114612967 A CN114612967 A CN 114612967A
Authority
CN
China
Prior art keywords
face
representative
clustering
cluster
features
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210205730.XA
Other languages
English (en)
Other versions
CN114612967B (zh
Inventor
陈圣奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202210205730.XA priority Critical patent/CN114612967B/zh
Publication of CN114612967A publication Critical patent/CN114612967A/zh
Application granted granted Critical
Publication of CN114612967B publication Critical patent/CN114612967B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供了一种人脸聚类的方法、装置、设备以及存储介质,涉及数据图形处理技术领域,尤其涉及人工智能和人脸识别技术领域。具体实现方案为:首先,获取批量图像的代表性人脸特征,形成代表性人脸特征集;之后,使用结合了人脸特征在特征空间的邻域结构特性的聚类算法对所述代表性人脸特征集,进行微批量聚类,得到人脸分组;然后,将所得到的人脸分组合并到存量类簇的人脸分组中。如此,可实现不易偏移,更为鲁棒的增量人脸聚类。

Description

一种人脸聚类的方法、装置、设备及存储介质
技术领域
本公开涉及数据图形处理技术领域,尤其涉及人工智能和人脸识别技术领域。
背景技术
人脸聚类是智能相册产品基础的AI能力,通过增量人脸聚类可以实现将用户相册中不断新增的图像,持续地按照人脸进行智能分组,即将属于同一个人物的照片分到同一个分组内,实现自动创建并持续更新人物相册。
在上述应用场景中,期望人脸聚类在保证人脸聚类效果可接受的前提下,能够尽可能快速、低成本的处理用户间断性上传的照片,并自动按人脸分组。
发明内容
本公开提供了一种人脸聚类的方法、装置、设备以及存储介质。
根据本公开的一方面,提供了一种人脸聚类的方法,包括:获取批量图像的代表性人脸特征,形成代表性人脸特征集;使用第一聚类算法对代表性人脸特征集,进行微批量聚类,得到第一人脸分组,第一聚类算法结合了人脸特征在特征空间的邻域结构特性;获取第二人脸分组,第二人脸分组为存量类簇形成的人脸分组;根据第二聚类算法将第一人脸分组合并至第二人脸分组。
根据本公开的另一方面,提供了一种人脸聚类的装置,包括:代表性人脸特征集获取模块,用于获取批量图像的代表性人脸特征,形成代表性人脸特征集;微批量聚类模块,用于使用第一聚类算法对代表性人脸特征集,进行微批量聚类,得到第一人脸分组,第一聚类算法结合了人脸特征在特征空间的邻域结构特性;存量类簇获取模块,用于获取第二人脸分组,第二人脸分组为存量类簇形成的人脸分组;类簇合并模块,用于根据第二聚类算法将第一人脸分组合并至第二人脸分组。
根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述任一项人脸聚类的方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行上述任一项人脸聚类的方法。
根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现上述任一项人脸聚类的方法。
本公开提供了一种人脸聚类的方法、装置、设备以及存储介质。该方法使用代表性的人脸特征进行增量人脸聚类,在进行微批量聚类时,使用结合了人脸特征在特征空间的领域结构特性的聚类方法;之后,将微批量聚类得到的人脸分组合并至存量类簇的分组中,从而实现不易漂移且更为鲁棒的增量人脸聚类。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是增量人脸聚类流水线示意图;
图2是本公开第一实施例实现人脸聚类方法的流程示意图;
图3是本公开第二实施例实现人脸聚类的方法的流程示意图;
图4是本公开第三实施例实现人脸聚类的方法的流程示意图;
图5是本公开第四实施例实现人脸聚类的方法的流程示意图;
图6是用于实现本公开实施例人脸聚类方法的装置的结构示意图;
图7是用来实现本公开实施例的人脸聚类的方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
增量人脸聚类的方法主要用于间断性上传图像的场景,或待处理图像的规模超出单次全量聚类可处理规模等大规模人脸聚类的场景。
图1示出了增量人脸聚类流水线,如图1所示,主要分为以下三个部分:
1)提取人脸特征(Extract Face Features)
将增量图像输入到人脸特征提取模型,得到人脸信息,包括人脸特征表示、人脸框大小位置、人脸旋转角度等。具体包括:
人脸检测(Face Detection),从图像中检测人脸,输出检测到的人脸框信息等。
人脸对齐(Face Alignment),根据检测到的人脸框信息,进一步得到人脸关键点的位置信息并对人脸归一化。
特征抽取(Feature Extraction),根据输入的归一化的人脸,输出人脸特征,且同一人物的人脸特征之间相似度越高,不同人物的人脸特征之间的相似度越低。
2)划分微批量特征(Partition Mini-batch Features)
从汇集的增量图像或存量图像集中,按照某种划分窗口的规则切分出一个个小批量的图像集,对应一个个小批量人脸特征集,作为单次增量人脸聚类输入的特征集。其中,存量图像指在新增图像之前,已经存在的图像。
3)增量人脸聚类(Incremental Face Clustering)
根据输入的增量人脸特征,输出人脸特征所归属的新增人脸分组或同存量类簇合并后的存量人脸分组。其中,存量类簇指在新增图像之前,根据存量图像进行聚类得到的类簇。人脸分组指对应同一个类簇的图像分组,通常对应于一个根人物。
增量人脸聚类过程,具体包括:
微批聚类(Micro-Clustering),根据增量的小批量人脸特征集,进行局部人脸聚类,产出增量特征的人脸分组。
聚类合并(Cluster Merging),根据增量特征产出的人脸分组,同存量人脸分组进行合并,输出新增的人脸分组或合并后进入的存量人脸分组。
本公开人脸聚类的方法主要位于上述流水线的第3)部分:增量人脸聚类。
图2示出了本公开一实施例实现人脸聚类的方法的主要流程,参考图2,该方法包括:
操作S210,获取批量图像的代表性人脸特征,形成代表性人脸特征集;
其中,批量图像指包含人脸的一批图像,可以来自图像采集设备(例如,相机、摄像机)所拍摄的相片、照片、视频等。
代表性人脸特征指可以准确刻画人脸特点、较为典型且不易变化的人脸特征,例如,从正面证件照提取到的人脸特征。
非代表性人脸特征,与代表性人脸特征相比,是一些较为模糊、不是很准确且易于造成误识或发生变化的人脸特征,例如,从侧面生活照提取到的人脸特征,特别是从因光照、姿态、遮挡、表情以及拍摄分辨率等引起变化的人脸中所提取出的人脸特征表示。非代表性人脸特征,很可能会明显地偏离所属的目标人脸特征类簇中心,却相对靠近非目标人脸特征类簇中心,而导致可区分度下降,被误聚类到非目标人脸特征类簇。
目前,在进行增量人脸聚类时,通常不区分代表性人脸特征和非代表性人脸特征,也就不能区分在一个类簇中哪些是代表性人脸特征,哪些是非代表性人脸特征。如此,伴随着各种各样非代表性人脸特征持续不断地被聚类(或被误聚类)到各个类簇,会导致类簇的物理空间逐渐“漂移”,尤其是聚类中心(加权代表性人脸特征)明显地偏离所属的目标人脸特征类簇中心,却相对靠近非目标人脸特征类簇中心,而导致可区分度下降,产生“漂移”误差,从而无法保持一个人物人脸特征的稳定描述。进一步地,随着上述“漂移”误差的逐渐累积,那些模棱两可的非代表性人脸性特征,也被称为硬调负片(hard negatives),会越来容易被错误的聚入存量类簇中,导致相同召回水平下的聚类精度会越来越差;而如果为了保持聚类的精度不变,降低可能发生的误聚类,又只能牺牲召回,从而导致召回越来越低,整体聚类效果明显下降。
在本公开人脸聚类的方法中,会对使用的人脸特征进行筛选,过滤掉非代表性人脸特征,使用代表性人脸特征来进行增量聚类,从而尽可能减少“偏移”误差,使聚类的准确度更高。
操作S220,使用第一聚类算法对代表性人脸特征集,进行微批量聚类,得到第一人脸分组,第一聚类算法结合了人脸特征在特征空间的邻域结构特性;
其中,第一聚类算法是用于对代表性人脸特征集,进行微批量聚类所使用的聚类算法。
邻域是一个特殊的区间,以点a为中心点任何开区间称为点a的邻域,记作U(a)。点a的δ邻域:假设δ是一个正数,则开区间(a-δ,a+δ)称为点a的δ邻域,点a称为这个邻域的中心,δ称为这个邻域的半径。点a的δ邻域表示与点a的距离小于δ的一切点的全体。
人脸特征在特征空间的邻域结构特性,指使将人脸特征映射到特征空间转换为特征空间的点,根据这些点的空间位置,可形成某一点a的δ邻域,之后即可将属于该邻域内的点归为一个类簇。
使用结合了人脸特征在特征空间的邻域结构特性的第一聚类算法,指在进行聚类时,考虑到了人脸特征在特征空间中的点之间的邻域关系(是否属于同一邻域),并将该邻域关系作为聚类的依据之一的第一聚类算法。
由于结合了人脸特征在特征空间的邻域结构特性,使用第一聚类算法进行聚类所得到的类簇,具有类簇内相似度较高、类簇间相似度交底的特性,从而使聚类结果更为准确。
而使用第一聚类算法对代表性人脸特征集进行微批量聚类,所得到的人脸分组,还可避免非代表性人脸特征所带来的干扰,更易于根据人脸特征在特征空间的邻域结构特性,确定人脸特征在特征空间所形成的邻域,获得更为稳定的人脸分组。
第一人脸分组指使用第一聚类算法对批量图像所形成的代表性人脸特征集进行微批量聚类,所得到的人脸分组。第一人脸分组仅考虑批量图像,不考虑存量图像,也不考虑存量类簇。
操作S230,获取第二人脸分组,第二人脸分组为存量类簇形成的人脸分组;
操作S240,根据第二聚类算法将第一人脸分组合并至第二人脸分组。
第二聚类算法是将第一人脸分组合并至第二人脸分组中所使用的聚类算法,其往往和对代表性人脸特征集。
第二聚类算法所使用的聚类标准,通常与第一聚类算法所依据的聚类标准一致,如此,可确保整个聚类和人脸分组的一致性。
因此,在本公开人脸聚类的方法所采用的类簇合并算法,也会充分利用了人脸特征表示的邻域结构特性,并优先采用计算复杂度为O(1)水平的类簇合并方式。即使在最坏情况下,类簇合并的计算复杂度为O(MN)(其中,M、N分别为参与类簇合并的新增类簇数、存量类簇数),大幅降低类簇合并的整体耗时。
在本公开实施例中,使用了代表性人脸特征进行增量人脸聚类,并在进行聚类时,充分考虑到人脸特征的邻域结构特性,从而使聚类的准确性和鲁棒性得到进一步提升,尽可能减少传统增量人脸聚类方法随时间推移可能产生的偏移误差,并可以大幅简化合并类簇的过程和算法复杂度。
需要说明的是,图2所示的实施例仅为本公开人脸聚类的方法的一个基本实施例,实施者可在此基础上进行进一步细化和扩展。
图3示出了本公开另一实施例实现人脸聚类的方法的主要流程,参见图3,该实施例进行增量人脸识别的过程,主要包括:
操作S3010,获取批量图像中的一张图像;
操作S3020,对图像进行人脸特征提取,得到人脸特征;
在本公开实施例中,所提取到的人脸特征Si=<原图质量信息,原图人脸总数,人脸位置信息,人脸属性信息,人脸质量信息,人脸特征向量>。
操作S3030,对人脸特征进行质量评价,得到质量评价得分;
此处质量评价的规则主要基于人脸特征是否具有典型特点、是否不易改变、所采取的取景角度、分辨率、对比率等方面的质量因素所进行的,其目的主要用于判断该人脸特征是否为代表性人脸特征。
例如,如果是正面照则得5分,如果是侧面照则得1分;如果是证件照,则得5分,如果是生活照则得3分;如果人脸分辨率大于分辨率阈值得5分,如果小于等于分辨率阈值,则得2分等。
在本公开实施例中,使用人脸质量评估算法face_eval_al,并使用原图质量信息,原图人脸总数,人脸位置信息,人脸属性信息和人脸质量信息作为质量评估参数。
操作S3040,判断质量评价得分是否大于质量阈值,若是,则继续操作S350,若否,则舍弃人脸特征,返回到操作S310,获取批量图像的下一张图像;
此处,质量评价得分大于质量阈值,则代表该人脸特征为代表性人脸特征;相反,质量评价得分小于等于质量阈值,则代表该人脸特征为非代表性人脸特征。如此,可较为准确地获取到代表性人脸特征集。
之后分两路进行人脸增量聚类,其中:
第一路,根据与存量类簇之间的距离,对代表性人脸特征进行快速聚类,并输出聚类结果,具体包括:
S3050,获取存量人脸分组;
S3060,使用第三聚类算法对代表性人脸特征进行快速聚类,得到代表性人脸特征所属的人脸分组;
其中,第三聚类算法与进行微批量聚类所使用得第一聚类算法可以不同,其重点是快捷,准确度要求不高,目的在于能够快速给出一个聚类结果,减少显示延迟。
具体地,在本公开实施例中使用了以下算法对代表性人脸特征进行快速聚类:
计算代表性人脸特征与各存量类簇之间的距离;
根据与各存量类簇之间的距离,对代表性人脸特征进行聚类,得到代表性人脸特征所属的类簇。
实施者也可以使用任何其他适用的、可快速得到当前代表性人脸特征所属的类簇的聚类算法,作为第三聚类算法。
S3070,输出人脸分组;
此处输出的人脸分组,主要为了快速显示,并不将会该代表性人脸特征存储至该人脸分组中。
第二路,进行微批量聚类,并将微批量聚类所得到的分组合并至存量聚类,具体包括:
操作S3080,将人脸特征确定为代表性人脸特征,将代表性人脸特征加入到代表性人脸特征集;
操作S3090,使用改进后的DBSCAN算法,对代表性人脸特征集,进行微批量聚类;
在本公开实施例中,使用改进后的DBSCAN算法作为用于对代表性人脸特征集进行微批量聚类的第一聚类算法。
DBSCAN是一种基于邻域结构特性的聚类算法。其中,使用参数(ε,MinPts)用来描述邻域的样本分布紧密程度。其中,ε描述了某一样本的邻域距离阈值,MinPts描述了某一样本的距离为ε的邻域中样本个数的阈值。
在本公开实施例中,进一步DBSCAN(D0,D,eps,MinPts)算法进行了改进,其中,D0代表进行聚类时所选取的初始点,D代表人脸特征在特征空间中转换为的点。
在典型的DBSCAN中,是没有D0这一参数的,在选取进行聚类的初始点时,是从D中任选一点,如此就会因为选择的初始点不同而产生不同的聚类结果,造成聚类结果的不稳定性。
而本公开实施例则增加了D0这一参数,并增加了事先确定D0和ε的步骤。如此,可根据指定的规则选取具有代表性的点作为聚类的初始点,从而使聚类更准确也更稳定。
之后的步骤,则和典型的DBSCAN算法保持一致,依旧使用D的ε-邻域计算密度可达,并增加记录聚类过程中得出的孤立点、各个类簇的核心点和边界点,输出为孤立点集C.n、类簇核心点集Ci.c、类簇边界点集Ci.b。
S3100,获取存量人脸分组;
S3110,将微批量聚类得到的人脸分组,合并至存量人脸分组。
在图3所示的本公开实施例中,通过设置两路处理,一方面:可在第二路处理通过改进后的DBSCAN确保了聚类准确度和稳定性;另一方面,可通过第一路处理快速显示人脸特征所在的人脸分组,缩短了人脸聚类的响应延时,可大幅提高时效性和用户体验。
此外,本公开的另一实施例中,还可将第一路处理结果存至人脸分组中,第二路处理中,仅处理不能快速聚类的人脸特征。如此,可进一步节省算力,并避免出现人脸分组出现跳跃(即快速显示时在A组,后期再查看时,又跑到了B组)的情况。
图4示出了本公开另一实施例,使用上述改进后的DBSCAN算法,对代表性人脸特征集,进行微批量聚类的主要流程。
在本公开实施例中,会定义两个ε-邻域阈值,
Figure BDA0003530315290000091
作为人脸匹配对距离的最大似然估计值,ε作为最小化选择false positives和false negatives的贝叶斯风险的距离估计值,且
Figure BDA0003530315290000092
在本文中
Figure BDA0003530315290000093
称为高置信度阈值,ε称为低置信度阈值,应用于聚类算法时所产出的类簇相应的称之为高置信度下类簇和低置信度下类簇。
其中,
Figure BDA0003530315290000094
和ε都是可调节的,因此可以根据不同的应用场景,灵活调整人物的召回或精度水平。
此外,还可以据此设计交互式的人物聚类结果纠错机制,将低置信度下的人物召回数据筛选出来,让用户协助主动矫正,进一步优化聚类效果,弥补算法的不足之处。
在本实施例中,对代表性人脸特征集进行微批量聚类,得到第一人脸分组的过程,如图4所示,主要包括:
操作S410,根据代表性人脸特征集和第一聚类算法,计算高置信度下的各类簇的代表点和中心表征;
在本公开实施例中,通过以下计算高置信度下的各类簇的代表点和中心表征:
对代表性人脸特征候选集
Figure BDA0003530315290000101
执行前文所述操作S3090中改进后的DBSCAN算法,将参数设置为:
Figure BDA0003530315290000102
输出:
Figure BDA0003530315290000103
Figure BDA0003530315290000104
Figure BDA0003530315290000105
执行以下类簇代表点选取算法cluster_reps_alg,输出高置信度下类簇代表点集
Figure BDA0003530315290000106
和类簇中心表征
Figure BDA0003530315290000107
cluster_reps_alg包括三个参数:C,MaxRadius和MaxPtsCnt,其中输入参数C表示一个类簇且C.points表示类簇的点集、C.avg表示类簇中心点(默认值为空),MaxRadius为代表点距离类簇中心点的最大距离,MaxPtsCnt为在一个类簇中最多提取的代表点数,输出为提取的类簇代表点集C.reps,类簇代表点均值C.avg。
cluster_reps_alg(C,MaxRadius,MaxPtsCnt)输出高置信度下类簇代表点集
Figure BDA0003530315290000108
和类簇中心表征
Figure BDA0003530315290000109
的算法过程,可描述如下:
Figure BDA00035303152900001010
操作S420,根据代表性人脸特征集和第一聚类算法,计算低置信度下的各类簇的代表点和中心表征;
Figure BDA0003530315290000111
R=Φ,遍历Ci.c{i=1…n},对每一个集Ci.c,若在
Figure BDA0003530315290000112
中查找到与其交集点最多且交集点数量大于阈值β的
Figure BDA0003530315290000113
则使用下述公式更新Ci
Figure BDA0003530315290000114
Figure BDA0003530315290000115
Figure BDA0003530315290000116
操作S430,根据低置信度下的各类簇的代表点和中心表征,确定代表性人脸特征集中各代表性人脸特征所属的候选类簇;
操作S440,根据高置信度下的各类簇的代表点和中心表征,对各代表性人脸特征所属的候选类簇进行筛选,得到各代表性人脸特征所属的第二人脸分组。
在进行筛选时,可使用各代表性人脸特征所属的候选类簇与高置信度下的各类簇的代表点和中心表征计算得到的类簇作交集:如果交集中点的数量大于阈值,则保留该候选类簇;如果交集中点的数量小于等于阈值,则舍弃该候选类簇。
本公开实施例以低置信度下类簇为候选的聚类结果,并匹配高置信度下类簇以过滤掉不稳定的或“噪声”类簇,保持最终结果类簇代表点和代表性人脸特征的稳定,可以长期持续控制类簇合并的精度和召回水平,使得聚类过程更具鲁棒性。
在本公开实施例进行微批量聚类的过程中,时间复杂度为O(N2),采用预计算ε-邻域并存储,空间复杂度为O(N2)(其中,N为人脸特征数)。
图5示出了本公开另一实施例,根据第二聚类算法将微批量聚类得到的人脸分组合并至存量人脸分组的过程,如图5所示,主要包括:
操作S5010,获取第一人脸分组中的一个类簇;
如前所述,为了便于区分微批量聚类得到的人脸分组和已经完成聚类的存量人脸分组,本公开中将微批量聚类得到的人脸分组称为第一人脸分组,将存量人脸分组称为第二人脸分组;
操作S5020,计算类簇的高置信中心表征与第二人脸分组中各存量类簇的第一中心距离;
具体地,遍历第一阶段微批聚类产出的类簇集C,对类簇Ci,计算Ci.high.center同存量类簇集D中各类簇的中心距离。
操作S5030,判断第一中心距离是否满足第一聚类条件,若是,则继续操作S540,若否,则继续操作S550;
在本公开实施例中,采用以下条件作为第一聚类条件:
min{dist(Ci.high.center,Dj.high.center),j=1...n}<rhigh_center,其中,rhigh _center,为第一中心距离阈值。
采用高置信中心距离,可更为准确地聚类到存量类簇。
作S5040,将类簇合并至相应的存量人脸分组;
例如,将Ci同Dj合并。
操作S5050,计算类簇的低置信中心表征与第二人脸分组中各存量类簇的第二中心距离;
遍历类簇集C,对类簇Ci,计算Ci.low.center同存量类簇集D中各类簇的代表点距离,也就是第二中心距离。
操作S5060,判断第二中心距离是否满足第二聚类条件,若是,则继续操作S540,若否,则继续操作S570;
在本公开实施例中,采用以下条件作为第二聚类条件:
min{dist(Ci.low.center,Dj.low.center),j=1...n}<rlow_center,其中,rlow _center,为第二中心距离阈值。
如此,当高置信中心距离不符合条件的时候,可以考虑低置信中心距离,以便尽可能地聚类到存量类簇。
操作S5070,计算类簇的低置信中心表征与第二人脸分组中各存量类簇的代表点;
操作S5080,判断代表点是否满足第三聚类条件,若是,则继续操作S540,若否,则继续操作S5090;
在本公开实施例中,采用以下条件作为第三聚类条件:
min{dist_avg_linkage(Ci.high.reps,Dj.high.reps),j=1...n}<rhigh_reps,其中,rhigh_reps为各存量类簇的代表点之间的距离阈值。
如此,当高置信中心距离和低置信中心距离都不符合条件的时候,可以考虑高置信代表点之间距离,以便尽可能地聚类到存量类簇。
操作S5090,获取类簇的大小;
操作S5100,判断类簇大小是否大于尺寸阈值,若是,则继续操作S5110,若否,则继续操作S5120。
操作S5110,将类簇作为一个新的类簇,存储至第二人脸分组;
类簇大小超过阈值的时候,说明该类簇可能不属于任何存量类簇,而是一个新的类簇。
操作S5120,获取类簇的时间戳和过期时限;
类簇大小小于阈值的时候,则说明该类簇是无法聚类到任何存量类簇的噪音类簇或是因为大部分同类图像被分到下一批而无法达到类簇阈值,此时可进一步通过时间戳判断该类簇是否还有必要进入对下一批图像的聚类。
操作S5130,判断类簇是否超期,若是,则继续操作S5140,若否,则继续操作S5150;
操作S5140,删除类簇;
类簇过期,说明该类簇经过几轮聚类都无法聚类到存量类簇,大概率是噪音类簇,可进行删除。
操作S5150,该类簇放入缓存和下一批代表性人脸特征进行下一轮微批量聚类。
类簇未过期,说明该类簇还可能与后续图像形成的聚类进行合并,因此可放入缓存以便和下一批代表性人脸特征进行下一轮微批量聚类。如此,尽可能多地将分在不同批地图像进行合并。
之后,对满足条件被合并的聚类Ci和Dj,记录合并的类型和类簇间距值,设置Ci的父类簇为Dj且Ci的根人物类簇直接指向Dj的根人物类簇,若Dj的根人物类簇为空,则设置Ci的根人物类簇为Dj,每一个根人物类簇代表一个独一无二的人物。如果类簇Ci不能被合并到任一存量类簇,若类簇Ci大小大于阈值N,则将类簇Ci作为一个新的根人物类簇对待存储;否则对类簇Ci中每个人脸特征,根据其携带的过期时间戳判断是否过期决定删除,或再次放入特征缓存并更新其过期时间戳,进入下一轮次的微批聚类。
在本公开实施例中,上述类簇合并的过程,时间复杂度最小为O(1)、最大为O(MN),空间复杂度为O(MN)(其中,M、N分别为参与类簇合并的新增类簇数、存量类簇数)。
此外,在本公开实施例中,还会保留各类簇的代表点,以及该代表点所对应的图像。
如此,当人脸聚类的模型发生改变时,可根据所保留的代表点重构模型输入向量,而无须充分进行人工标注和特征提取过程,可大幅降低模型转换的成本。
本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
根据本公开的实施例,本公开还提供了一种人脸聚类的装置,如图6所示,该装置60包括:代表性人脸特征集获取模块601,用于获取批量图像的代表性人脸特征,形成代表性人脸特征集;微批量聚类模块602,用于使用第一聚类算法对代表性人脸特征集,进行微批量聚类,得到第一人脸分组,第一聚类算法结合了人脸特征在特征空间的邻域结构特性;存量类簇获取模块603,用于获取第二人脸分组,第二人脸分组为存量类簇形成的人脸分组;类簇合并模块604,用于根据第二聚类算法将第一人脸分组合并至第二人脸分组。
根据本公开的一实施例,代表性人脸特征集获取模块601包括:图像获取子模块,用于获取所述批量图像中的一张图像;人脸特征提取子模块,用于对所述图像进行人脸特征提取,得到人脸特征;质量评价子模块,用于对所述人脸特征进行质量评价,得到质量评价得分;代表性人脸特征集形成子模块,用于若所述质量评价得分大于质量阈值,则将所述人脸特征确定为代表性人脸特征,将所述代表性人脸特征,加入到所述代表性人脸特征集。
根据本公开的一实施例,代表性人脸特征集获取模块601还包括:人脸特征舍弃子模块,用于若所述质量评价得分小于等于质量阈值,则舍弃所述人脸特征。
根据本公开的一实施例,代表性人脸特征集获取模块601还包括:快速聚类子模块,用于使用第三聚类算法对所述代表性人脸特征进行快速聚类,得到所述代表性人脸特征所属的类簇。
根据本公开的一实施例,快速聚类子模块包括:类簇距离计算单元,用于计算所述代表性人脸特征与各存量类簇之间的距离;聚类单元,用于根据所述与各存量类簇之间的距离,对所述代表性人脸特征进行聚类,得到所述代表性人脸特征所属的第一人脸分组。
根据本公开的一实施例,所述微批量聚类模块602包括:高置信度计算子模块,用于根据所述代表性人脸特征集和第一聚类算法,计算高置信度下的各类簇的代表点和中心表征;低置信度计算子模块,用于根据所述代表性人脸特征集和第一聚类算法,计算低置信度下的各类簇的代表点和中心表征;候选人脸分组确定子模块,根据所述低置信度下的各类簇的代表点和中心表征,确定所述代表性人脸特征集中各代表性人脸特征所属的候选类簇;第二人脸分组确定子模块,根据所述高置信度下的各类簇的代表点和中心表征,对各代表性人脸特征所属的候选类簇进行筛选,得到各代表性人脸特征所属的第二人脸分组。
根据本公开的一实施例,所述类簇合并模块604包括:类簇获取子模块,用于获取第一人脸分组中的一个类簇;第一中心距离计算子模块,用于计算所述类簇的高置信中心表征与所述第二人脸分组中各存量类簇的第一中心距离;类簇合并子模块,用于若所述第一中心距离满足第一聚类条件,则将所述类簇合并至相应的存量类簇。
根据本公开的一实施例,所述类簇合并模块604,还包括:第二中心距离计算子模块,用于若所述第一中心距离不满足第一聚类条件,则计算所述类簇的低置信中心表征与所述第二人脸分组中各存量类簇的第二中心距离;类簇合并子模块,还用于若所述第二中心距离满足第二聚类条件,则将所述类簇合并至相应的存量类簇。
根据本公开的一实施例,所述类簇合并模块604,还包括:代表点计算子模块,用于若所述第二中心距离不满足第二聚类条件,则计算所述类簇的低置信中心表征与所述第二人脸分组中各存量类簇的代表点;类簇合并子模块,还用于若所述代表点满足第三聚类条件,则将所述类簇合并至相应的存量类簇。
根据本公开的一实施例,所述类簇合并模块604,还包括:类簇大小获取子模块,用于若所述代表点不满足第三聚类条件,则获取类簇的大小,若所述类簇的大小大于尺寸阈值,则将所述类簇作为一个新的类簇,添加至所述第二人脸分组。
根据本公开的一实施例,所述类簇合并模块604,还包括:类簇期限管理子模块,用于若所述类簇的大小小于等于尺寸阈值,则获取所述类簇的时间戳和过期时限,若所述类簇超期,则删除所述类簇。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图7示出了可以用来实施本公开的实施例的示例电子设备700的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图7所示,设备700包括计算单元701,其可以根据存储在只读存储器(ROM)702中的计算机程序或者从存储单元708加载到随机访问存储器(RAM)703中的计算机程序,来执行各种适当的动作和处理。在RAM 703中,还可存储设备700操作所需的各种程序和数据。计算单元701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。
设备700中的多个部件连接至I/O接口705,包括:输入单元706,例如键盘、鼠标等;输出单元707,例如各种类型的显示器、扬声器等;存储单元708,例如磁盘、光盘等;以及通信单元709,例如网卡、调制解调器、无线通信收发机等。通信单元709允许设备700通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元701可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元701的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元701执行上文所描述的各个方法和处理,例如本公开人脸聚类的方法。例如,在一些实施例中,本公开人脸聚类的方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元708。在一些实施例中,计算机程序的部分或者全部可以经由ROM 702和/或通信单元709而被载入和/或安装到设备700上。当计算机程序加载到RAM 703并由计算单元701执行时,可以执行上文描述的本公开人脸聚类的方法的一个或多个步骤。备选地,在其他实施例中,计算单元701可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行本公开人脸聚类的方法。
本文中以上描述的***和技术的各种实施方式可以在数字电子电路***、集成电路***、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上***的***(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程***上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储***、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储***、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的***和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的***和技术实施在包括后台部件的计算***(例如,作为数据服务器)、或者包括中间件部件的计算***(例如,应用服务器)、或者包括前端部件的计算***(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的***和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算***中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将***的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机***可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式***的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

Claims (20)

1.一种人脸聚类的方法,包括:
获取批量图像的代表性人脸特征,形成代表性人脸特征集;
使用第一聚类算法对所述代表性人脸特征集,进行微批量聚类,得到第一人脸分组,所述第一聚类算法结合了人脸特征在特征空间的邻域结构特性;
获取第二人脸分组,所述第二人脸分组为存量类簇形成的人脸分组;
根据第二聚类算法将所述第一人脸分组合并至所述第二人脸分组。
2.根据权利要求1所述的方法,其中,所述获取批量图像的代表性人脸特征,形成代表性人脸特征集,包括:
获取所述批量图像中的一张图像;
对所述图像进行人脸特征提取,得到人脸特征;
对所述人脸特征进行质量评价,得到质量评价得分;
若所述质量评价得分大于质量阈值,则将所述人脸特征确定为代表性人脸特征,将所述代表性人脸特征,加入到所述代表性人脸特征集。
3.根据权利要求2所述的方法,还包括:
若所述质量评价得分小于等于质量阈值,则舍弃所述人脸特征。
4.根据权利要求2所述的方法,还包括:
使用第三聚类算法对所述代表性人脸特征进行快速聚类,得到所述代表性人脸特征所属的类簇。
5.根据权利要求4所述的方法,其中,所述使用第三聚类算法对所述代表性人脸特征进行快速聚类,得到所述代表性人脸特征所属的第一人脸分组,包括:
计算所述代表性人脸特征与各存量类簇之间的距离;
根据所述与各存量类簇之间的距离,对所述代表性人脸特征进行聚类,得到所述代表性人脸特征所属的第一人脸分组。
6.根据权利要求1所述的方法,其中,所述使用第一聚类算法对所述代表性人脸特征集,进行微批量聚类,得到第一人脸分组,包括:
根据所述代表性人脸特征集和第一聚类算法,计算高置信度下的各类簇的代表点和中心表征;
根据所述代表性人脸特征集和第一聚类算法,计算低置信度下的各类簇的代表点和中心表征;
根据所述低置信度下的各类簇的代表点和中心表征,确定所述代表性人脸特征集中各代表性人脸特征所属的候选类簇;
根据所述高置信度下的各类簇的代表点和中心表征,对各代表性人脸特征所属的候选类簇进行筛选,得到各代表性人脸特征所属的第二人脸分组。
7.根据权利要求6所述的方法,还包括:
保存所述代表点和所述代表点所对应的图像。
8.根据权利要求1所述的方法,其中,所述第一聚类算法包括改进后的DBSCAN算法,所述DBSCAN算法增加了预先计算聚类初始点、邻域高置信度半径和邻域低置信度半径的步骤,并在聚类过程中以所述预先计算的聚类初始点作为起始点,进行聚类。
9.根据权利要求8所述的方法,其中,邻域高置信度半径和邻域低置信度半径为可调整的模型参数。
10.根据权利要求1所述的方法,其中,所述根据第二聚类算法将所述第一人脸分组合并至所述第二人脸分组,包括:
获取第一人脸分组中的一个类簇;
计算所述类簇的高置信中心表征与所述第二人脸分组中各存量类簇的第一中心距离;
若所述第一中心距离满足第一聚类条件,则将所述类簇合并至相应的存量类簇。
11.根据权利要求10所述的方法,还包括:
若所述第一中心距离不满足第一聚类条件,则计算所述类簇的低置信中心表征与所述第二人脸分组中各存量类簇的第二中心距离;
若所述第二中心距离满足第二聚类条件,则将所述类簇合并至相应的存量类簇。
12.根据权利要求11所述的方法,还包括:
若所述第二中心距离不满足第二聚类条件,则计算所述类簇的低置信中心表征与所述第二人脸分组中各存量类簇的代表点;
若所述代表点满足第三聚类条件,则将所述类簇合并至相应的存量类簇。
13.根据权利要求12所述的方法,还包括:
若所述代表点不满足第三聚类条件,则获取类簇的大小,若所述类簇的大小大于尺寸阈值,则将所述类簇作为一个新的类簇,添加至所述第二人脸分组。
14.根据权利要求13所述的方法,还包括:
若所述类簇的大小小于等于尺寸阈值,则获取所述类簇的时间戳和过期时限,若所述类簇超期,则删除所述类簇。
15.一种人脸聚类的装置,包括:
代表性人脸特征集获取模块,用于获取批量图像的代表性人脸特征,形成代表性人脸特征集;
微批量聚类模块,用于使用第一聚类算法对所述代表性人脸特征集,进行微批量聚类,得到第一人脸分组,所述第一聚类算法结合了人脸特征在特征空间的邻域结构特性;
存量类簇获取模块,用于获取第二人脸分组,所述第二人脸分组为存量类簇形成的人脸分组;
类簇合并模块,用于根据第二聚类算法将所述第一人脸分组合并至所述第二人脸分组。
16.根据权利要求15所述的装置,其中,代表性人脸特征集获取模块,包括:
图像获取子模块,用于获取所述批量图像中的一张图像;
人脸特征提取子模块,用于对所述图像进行人脸特征提取,得到人脸特征;
质量评价子模块,用于对所述人脸特征进行质量评价,得到质量评价得分;
代表性人脸特征集形成子模块,用于若所述质量评价得分大于质量阈值,则将所述人脸特征确定为代表性人脸特征,将所述代表性人脸特征,加入到所述代表性人脸特征集。
17.根据权利要求15所述的装置,其中,所述微批量聚类模块包括:
高置信度计算子模块,用于根据所述代表性人脸特征集和第一聚类算法,计算高置信度下的各类簇的代表点和中心表征;
低置信度计算子模块,用于根据所述代表性人脸特征集和第一聚类算法,计算低置信度下的各类簇的代表点和中心表征;
候选人脸分组确定子模块,根据所述低置信度下的各类簇的代表点和中心表征,确定所述代表性人脸特征集中各代表性人脸特征所属的候选类簇;
第二人脸分组确定子模块,根据所述高置信度下的各类簇的代表点和中心表征,对各代表性人脸特征所属的候选类簇进行筛选,得到各代表性人脸特征所属的第二人脸分组。
18.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-12中任一项所述的方法。
19.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-12中任一项所述的方法。
20.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-12中任一项所述的方法。
CN202210205730.XA 2022-03-03 2022-03-03 一种人脸聚类的方法、装置、设备及存储介质 Active CN114612967B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210205730.XA CN114612967B (zh) 2022-03-03 2022-03-03 一种人脸聚类的方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210205730.XA CN114612967B (zh) 2022-03-03 2022-03-03 一种人脸聚类的方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN114612967A true CN114612967A (zh) 2022-06-10
CN114612967B CN114612967B (zh) 2023-06-20

Family

ID=81861015

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210205730.XA Active CN114612967B (zh) 2022-03-03 2022-03-03 一种人脸聚类的方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN114612967B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115294636A (zh) * 2022-10-09 2022-11-04 山东海博科技信息***股份有限公司 一种基于自注意力机制的人脸聚类方法和装置

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105426878A (zh) * 2015-12-22 2016-03-23 小米科技有限责任公司 人脸聚类方法及装置
CN106503656A (zh) * 2016-10-24 2017-03-15 厦门美图之家科技有限公司 一种图像分类方法、装置和计算设备
CN108229674A (zh) * 2017-02-21 2018-06-29 北京市商汤科技开发有限公司 聚类用神经网络的训练方法和装置、聚类方法和装置
CN108846329A (zh) * 2018-05-23 2018-11-20 江南大学 一种基于波段选择和特征融合的高光谱人脸识别方法
CN109447186A (zh) * 2018-12-13 2019-03-08 深圳云天励飞技术有限公司 聚类方法及相关产品
CN109886239A (zh) * 2019-02-28 2019-06-14 北京旷视科技有限公司 人像聚类方法、装置及***
CN110458078A (zh) * 2019-08-05 2019-11-15 高新兴科技集团股份有限公司 一种人脸图像数据聚类方法、***及设备
CN110532867A (zh) * 2019-07-23 2019-12-03 浙江工业大学 一种基于黄金分割法的人脸图像聚类方法
US20200012886A1 (en) * 2018-07-06 2020-01-09 Capital One Services, Llc Systems and methods to improve data clustering using a meta-clustering model
CN110889433A (zh) * 2019-10-29 2020-03-17 平安科技(深圳)有限公司 人脸聚类方法、装置、计算机设备及存储介质
CN111291827A (zh) * 2020-02-28 2020-06-16 北京市商汤科技开发有限公司 图像聚类方法、装置、设备及存储介质
CN111753923A (zh) * 2020-07-02 2020-10-09 携程计算机技术(上海)有限公司 基于人脸的智能相册聚类方法、***、设备及存储介质
CN113743533A (zh) * 2021-09-17 2021-12-03 重庆紫光华山智安科技有限公司 一种图片聚类方法、装置及存储介质
US20220019764A1 (en) * 2020-07-17 2022-01-20 Beijing Baidu Netcom Science And Technology Co., Ltd. Method and device for classifying face image, electronic device and storage medium
CN114004987A (zh) * 2021-09-26 2022-02-01 浙江大华技术股份有限公司 人脸聚类方法、电子设备及存储介质

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105426878A (zh) * 2015-12-22 2016-03-23 小米科技有限责任公司 人脸聚类方法及装置
CN106503656A (zh) * 2016-10-24 2017-03-15 厦门美图之家科技有限公司 一种图像分类方法、装置和计算设备
CN108229674A (zh) * 2017-02-21 2018-06-29 北京市商汤科技开发有限公司 聚类用神经网络的训练方法和装置、聚类方法和装置
CN108846329A (zh) * 2018-05-23 2018-11-20 江南大学 一种基于波段选择和特征融合的高光谱人脸识别方法
US20200012886A1 (en) * 2018-07-06 2020-01-09 Capital One Services, Llc Systems and methods to improve data clustering using a meta-clustering model
CN109447186A (zh) * 2018-12-13 2019-03-08 深圳云天励飞技术有限公司 聚类方法及相关产品
CN109886239A (zh) * 2019-02-28 2019-06-14 北京旷视科技有限公司 人像聚类方法、装置及***
CN110532867A (zh) * 2019-07-23 2019-12-03 浙江工业大学 一种基于黄金分割法的人脸图像聚类方法
CN110458078A (zh) * 2019-08-05 2019-11-15 高新兴科技集团股份有限公司 一种人脸图像数据聚类方法、***及设备
CN110889433A (zh) * 2019-10-29 2020-03-17 平安科技(深圳)有限公司 人脸聚类方法、装置、计算机设备及存储介质
WO2021082426A1 (zh) * 2019-10-29 2021-05-06 平安科技(深圳)有限公司 人脸聚类方法、装置、计算机设备及存储介质
CN111291827A (zh) * 2020-02-28 2020-06-16 北京市商汤科技开发有限公司 图像聚类方法、装置、设备及存储介质
CN111753923A (zh) * 2020-07-02 2020-10-09 携程计算机技术(上海)有限公司 基于人脸的智能相册聚类方法、***、设备及存储介质
US20220019764A1 (en) * 2020-07-17 2022-01-20 Beijing Baidu Netcom Science And Technology Co., Ltd. Method and device for classifying face image, electronic device and storage medium
CN113743533A (zh) * 2021-09-17 2021-12-03 重庆紫光华山智安科技有限公司 一种图片聚类方法、装置及存储介质
CN114004987A (zh) * 2021-09-26 2022-02-01 浙江大华技术股份有限公司 人脸聚类方法、电子设备及存储介质

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
LEI YANG 等: "Learning to Cluster Faces via Confidence and Connectivity Estimation", 《ARXIV:2004.00445V2》 *
MING ZHAO 等: "Automatic Person Annotation of Family Photo Album", 《CIVR 2006》 *
RIAZ SHAKIR FARUKH: "基于 DBSCAN的人脸聚类", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
甘海涛: "半监督聚类与分类算法研究", 《中国博士学位论文全文数据库 信息科技辑》 *
田真真: "基于耦合度量的多尺度聚类挖掘方法", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
郑河荣等: "结合代表点和密度峰的增量动态聚类算法", 《浙江工业大学学报》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115294636A (zh) * 2022-10-09 2022-11-04 山东海博科技信息***股份有限公司 一种基于自注意力机制的人脸聚类方法和装置

Also Published As

Publication number Publication date
CN114612967B (zh) 2023-06-20

Similar Documents

Publication Publication Date Title
CN109583332B (zh) 人脸识别方法、人脸识别***、介质及电子设备
CN109086654B (zh) 手写模型训练方法、文本识别方法、装置、设备及介质
CN113222942A (zh) 多标签分类模型的训练方法和预测标签的方法
JP6897749B2 (ja) 学習方法、学習システム、および学習プログラム
CN108182421A (zh) 视频分割方法和装置
CN114724007A (zh) 训练分类模型、数据分类方法、装置、设备、介质及产品
CN114444619B (zh) 样本生成方法、训练方法、数据处理方法以及电子设备
CN114612743A (zh) 深度学习模型的训练方法、目标对象识别方法和装置
US20240135698A1 (en) Image classification method, model training method, device, storage medium, and computer program
CN115359308B (zh) 模型训练、难例识别方法、装置、设备、存储介质及程序
CN115796310A (zh) 信息推荐及模型训练方法、装置、设备和存储介质
CN114612967B (zh) 一种人脸聚类的方法、装置、设备及存储介质
CN113657249B (zh) 训练方法、预测方法、装置、电子设备以及存储介质
CN116824609B (zh) 文档版式检测方法、装置和电子设备
CN115294405B (zh) 农作物病害分类模型的构建方法、装置、设备及介质
CN115664814A (zh) 网络入侵检测方法、装置、电子设备及存储介质
CN113590774B (zh) 事件查询方法、装置以及存储介质
CN112966108B (zh) 检测数据和训练分类模型的方法、装置、设备和存储介质
CN113361402B (zh) 识别模型的训练方法、确定准确率的方法、装置和设备
CN112348049A (zh) 一种基于自动编码的图像识别模型训练方法及装置
CN113362304B (zh) 清晰度预测模型的训练方法和确定清晰等级的方法
CN117274778B (zh) 基于无监督和半监督的图像搜索模型训练方法和电子设备
CN115497633B (zh) 一种数据处理方法、装置、设备及存储介质
CN115471717B (zh) 模型的半监督训练、分类方法装置、设备、介质及产品
CN113409288B (zh) 一种图像清晰度的检测方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant