CN113221786A - 数据分类方法及装置、电子设备和存储介质 - Google Patents

数据分类方法及装置、电子设备和存储介质 Download PDF

Info

Publication number
CN113221786A
CN113221786A CN202110556441.XA CN202110556441A CN113221786A CN 113221786 A CN113221786 A CN 113221786A CN 202110556441 A CN202110556441 A CN 202110556441A CN 113221786 A CN113221786 A CN 113221786A
Authority
CN
China
Prior art keywords
image
face
image set
view
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110556441.XA
Other languages
English (en)
Inventor
张丹丹
王长春
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Sensetime Technology Co Ltd
Original Assignee
Shenzhen Sensetime Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Sensetime Technology Co Ltd filed Critical Shenzhen Sensetime Technology Co Ltd
Priority to CN202110556441.XA priority Critical patent/CN113221786A/zh
Publication of CN113221786A publication Critical patent/CN113221786A/zh
Priority to PCT/CN2021/126150 priority patent/WO2022242032A1/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)
  • Collating Specific Patterns (AREA)

Abstract

本公开实施例公开了一种数据分类方法及装置、电子设备和存储介质,方法包括:获取多个待分类视图,并提取多个待分类视图中每个视图包含的人脸图像,得到多个人脸图像;对多个人脸图像进行聚类,得到至少一个图像集合;其中,每个图像集合中的人脸图像对应同一人物,且每个图像集合中的每个人脸图像携带表征图像真伪的真伪检测结果。

Description

数据分类方法及装置、电子设备和存储介质
技术领域
本公开涉及计算机视觉技术领域,尤其涉及一种数据分类方法及装置、电子设备和存储介质。
背景技术
互联网上存在海量的图像和视频,用户可以根据实际需求,从中查找出需要的图像和视频进行归类。
目前,通常采用的图像和视频的归类方式为,利用包含特定人物的人像图像,采用图搜的方式从互联网上将包含该人物的所有图像和视频搜索出来,归为一类,数据分类的智能性较低,效果较差。
发明内容
本公开实施例期望提供一种数据分类方法及装置、电子设备和存储介质。
本公开实施例的技术方案是这样实现的:
本公开实施例提供了一种数据分类方法,所述方法包括:
获取多个待分类视图,并提取所述多个待分类视图中每个视图包含的人脸图像,得到多个人脸图像;
对所述多个人脸图像进行聚类,得到至少一个图像集合;其中,每个所述图像集合中的人脸图像对应同一人物,且每个所述图像集合中的每个人脸图像携带表征图像真伪的真伪检测结果。
在上述方法中,所述对所述多个人脸图像进行聚类,得到至少一个图像集合,包括:
对所述多个人脸图像中每个人脸图像进行深度伪造检测,得到与所述多个人脸图像一一对应的多个真伪检测结果;
对所述多个人脸图像中每个人脸图像进行特征提取,得到与所述多个人脸图像一一对应的多组人脸特征;
利用所述多组人脸特征,将所述多个人脸图像中对应同一人物的人脸图像划分至同一集合中,并在划分的每个集合中,包含的每个人脸图像上携带所述多个真伪检测结果中对应的真伪检测结果,得到所述至少一个图像集合。
在上述方法中,所述对所述多个人脸图像进行聚类,得到至少一个图像集合之后,所述方法还包括:获取与所述至少一个图像集合一一对应的至少一个类中心信息;
对所述至少一个图像集合中每个图像集合,利用所述至少一个类中心信息中对应的类中心信息与预设人像库进行撞库,确定出对应的标签信息。
在上述方法中,所述对所述至少一个图像集合中每个图像集合,利用所述至少一个类中心信息中对应的类中心信息与预设人像库进行撞库,确定出对应的标签信息,包括:
从所述预设人像库中,查找与第一类中心信息匹配的第一人脸图像;所述第一类中心信息为第一图像集合对应的类中心信息,所述第一图像集合为所述至少一个图像集合中任意一个图像集合;
在查找到所述第一人脸图像的情况下,将所述预设人像库中所述第一人脸图像对应的身份信息,确定为所述第一图像集合对应的标签信息。
在上述方法中,所述从所述预设人像库中,查找与第一类中心信息匹配的第一人脸图像之后,所述方法还包括:
在未查找到所述第一人脸图像的情况下,确定所述第一图像集合对应的标签信息为匿名身份。
在上述方法中,所述对所述多个人脸图像进行聚类,得到至少一个图像集合之后,所述方法还包括:
在所述至少一个图像集合的每个图像集合中,添加包含的每个人脸图像在所述多个待分类视图中所属的视图,得到至少一个视图集合。
在上述方法中,还包括发布人员档案库,所述发布人员档案库包括不同发布人员的身份信息和发布的视图,所述得到至少一个视图集合之后,所述方法还包括:
从所述发布人员档案库中,查找所述至少一个视图集合中每个视图的发布人员信息;
将所述至少一个视图集合中,每个视图与对应的发布人员的身份信息关联。
本公开实施例提供了一种数据分类装置,包括:
数据处理模块,用于获取多个待分类视图,并提取所述多个待分类视图中每个视图包含的人脸图像,得到多个人脸图像;
数据分类模块,用于对所述多个人脸图像进行聚类,得到至少一个图像集合;其中,每个所述图像集合中的人脸图像对应同一人物,且每个所述图像集合中的每个人脸图像携带表征图像真伪的真伪检测结果。
在上述装置中,所述数据分类模块,具体用于对所述多个人脸图像中每个人脸图像进行深度伪造检测,得到与所述多个人脸图像一一对应的多个真伪检测结果;对所述多个人脸图像中每个人脸图像进行特征提取,得到与所述多个人脸图像一一对应的多组人脸特征;利用所述多组人脸特征,将所述多个人脸图像中对应同一人物的人脸图像划分至同一集合中,并在划分的每个集合中,包含的每个人脸图像上携带多个真伪检测结果中对应的真伪检测结果,得到所述至少一个图像集合。
在上述装置中,所述数据分类模块,还用于获取与所述至少一个图像集合一一对应的至少一个类中心信息;对所述至少一个图像集合中每个图像集合,利用所述至少一个类中心信息中对应的类中心信息与预设人像库进行撞库,确定出对应的标签信息。
在上述装置中,所述数据分类模块,具体用于从所述预设人像库中,查找与第一类中心信息匹配的第一人脸图像;所述第一类中心信息为第一图像集合对应的类中心信息,所述第一图像集合为所述至少一个图像集合中任意一个图像集合;在查找到所述第一人脸图像的情况下,将所述预设人像库中所述第一人脸图像对应的身份信息,确定为所述第一图像集合对应的标签信息。
在上述装置中,所述数据分类模块,还用于在未查找到所述第一人脸图像的情况下,确定所述第一图像集合对应的标签信息为匿名身份。
在上述装置中,所述数据分类模块,还用于在所述至少一个图像集合的每个图像集合中,添加包含的每个人脸图像在所述多个待分类视图中所属的视图,得到至少一个视图集合。
在上述装置中,还包括发布人员档案库,所述发布人员档案库包括不同发布人员的身份信息和发布的视图,所述数据分类模块,还用于从所述发布人员档案库中,查找所述至少一个视图集合中每个视图的发布人员的身份信息;将所述至少一个视图集合中,每个视图与对应的发布人员的身份信息关联。
本公开实施例提供了一种电子设备,包括:处理器、存储器和通信总线;其中,
所述通信总线,用于实现所述处理器和所述存储器之间的连接通信;
所述处理器,用于执行所述存储器中存储的一个或多个程序,以实现上述数据分类方法。
本公开实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可以被一个或者多个处理器执行,以实现上述数据分类方法。
本公开实施例提供了一种数据分类方法及装置、电子设备和存储介质,方法包括:获取多个待分类视图,并提取多个待分类视图中每个视图包含的人脸图像,得到多个人脸图像;对多个人脸图像进行聚类,得到至少一个图像集合;其中,每个图像集合中的人脸图像对应同一人物,且每个图像集合中的每个人脸图像携带表征图像真伪的真伪检测结果。本公开实施例提供的技术方案,将所有的图像和视频以不同的人物为维度进行分类,并且,在划分的每个集合包括的每个人脸图像携带了表征图像真伪的信息,从而提高了数据分类的智能性和效果。
附图说明
图1为本公开实施例提供的一种数据分类方法的流程示意图一;
图2为本公开实施例提供的一种数据分类方法的流程示意图二;
图3为本公开实施例提供的一种示例性的数据分类过程的示意图;
图4为本公开实施例提供的一种数据分类装置的结构示意图;
图5为本公开实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述。
本公开实施例提供了一种数据分类方法,其执行主体可以是数据分类装置,例如,数据分类方法可以由终端设备或服务器或其它电子设备执行,其中,终端设备可以为用户设备(User Equipment,UE)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字处理(Personal Digital Assistant,PDA)、手持设备、计算设备、车载设备、可穿戴设备等。在一些可能的实现方式中,数据分类方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。
图1为本公开实施例提供的一种数据分类方法的流程示意图一。如图1所示,在本公开的实施例中,数据分类方法主要包括以下步骤:
S101、获取多个待分类视图,并提取多个待分类视图中每个视图包含的人脸图像,得到多个人脸图像。
在本公开的实施例中,数据分类装置可以获取多个待分类视图,从而提取每个待分类视图中包含的人脸图像,得到多个人脸图像。
需要说明的是,在本公开的实施例中,多个待分类视图可以是发布于各个互联网平台、社交媒体的图像和视频。具体的多个待分类视图的来源本公开实施例不作限定。
可以理解的是,在本公开的实施例中,数据分类装置可以对每个待分类视图进行人脸识别和提取,从而得到其中的人脸图像。此外,数据分类装置还可以从每个待分类视图中提取出时间戳等其它信息,本公开实施例不作限定。
S102、对多个人脸图像进行聚类,从而得到至少一个图像集合;其中,每个图像集合中的人脸图像对应同一人物,且每个图像集合中的每个人脸图像携带表征图像真伪的真伪检测结果。
在本公开的实施例中,数据分类装置在得到多个人脸图像之后,可以对多个人脸图像进行聚类,从而将对应同一人物的人脸图像划分至同一集合中,得到至少一个图像集合,并且,每个图像集合中的每个人脸图像携带表征图像真伪的真伪检测结果。
具体的,在本公开的实施例中,数据分类装置对多个人脸图像进行聚类,得到至少一个图像集合,包括:对多个人脸图像中每个人脸图像进行深度伪造检测,得到与多个人脸图像一一对应的多个真伪检测结果;对多个人脸图像中每个人脸图像进行特征提取,得到与多个人脸图像一一对应的多组人脸特征;利用多组人脸特征,将多个人脸图像中对应同一人物的人脸图像划分至同一集合中,并在划分的每个集合中,包含的每个人脸图像上携带多个真伪检测结果中对应的真伪检测结果,得到至少一个图像集合。
可以理解的是,在本公开的实施例中,数据分类装置可以采用特定的深度伪造检测算法对每个人脸图像进行深度伪造检测,从而得到每个人脸图像的真伪检测结果。对于任意一个人脸图像,如果真伪检测结果为伪造,即该人脸图像经过深度伪造,相应的,该人脸图像所属的待分类视图也就是伪造的,如果真伪结果为真实,即该人脸图像未经过深度伪造,相应的,该人脸图像所属的待分类视图也就是真实的。
需要说明的是,在本公开的实施例中,数据分类装置可以利用与多个人脸图像一一对应的多组人脸特征,将多个人脸图像中对应同一人物的人脸图像划分至同一图像集合中。数据分类装置可以利用特定的特征提取算法或模型,实现每个人脸图像中人脸特征的提取,从而通过比较人脸特征的相似度,确定不同人脸图像是否对应同一人物,以实现图像集合的划分,从而提高了数据分类的智能性。此外,由于数据分类装置还获得了每个人脸图像的真伪检测结果,从而可以在划分的每个集合中,每个人脸图像上携带相应的真伪检测结果,即图像集合中实际上不仅仅包括人脸图像,还携带了人脸图像的真伪信息,用户在后续查看图像时可以直接获知图像的真伪情况,提高了数据分类的效果。
需要说明的是,在本公开的实施例中,数据分类装置还可以将不同人脸图像的真伪检测结果,与对应的人脸图像所属的待分类视图进行关联。
可以理解的是,在本公开的实施例中,由于数据分类装置对每个待分类视图关联了其包含的人脸图像的真伪检测结果,因此,用户在后续查看任意一个待分类视图,都可以直接获知该视图是否是真实的。
图2为本公开实施例提供的一种数据分类方法的流程示意图二。如图2所示,在本公开的实施例中,数据分类装置在对多个人脸图像进行聚类,得到至少一个图像集合,即执行步骤S102之后,还可以执行以下步骤:
S201、获取与至少一个图像集合一一对应的至少一个类中心信息。
在本公开的实施例中,数据分类装置可以获取与至少一个图像集合一一对应的至少一个类中心信息。
需要说明的是,在本公开的实施例中,数据分类装置获取与至少一个图像集合一一对应的至少一个类中心信息,具体可以是获取每个图像集合包括的人脸图像的特定特征,或者,按照特定的规则,从每个图像集合中选取一个人脸图像,从而作为对应的类中心信息。例如,可以从每个视图集合中选取清晰度最高的人脸图像,也可以从每个视图集合中选取一个正面的人脸图像,作为对应的类中心信息。具体的类中心信息可以根据实际需求和应用场景设定,本公开实施例不作限定。
S202、对至少一个图像集合中每个图像集合,利用至少一个类中心信息中对应的类中心信息与预设人像库进行撞库,确定出对应的标签信息。
在本公开的实施例中,至少一个图像集合实际上与至少一个人物一一对应,数据分类装置可以利用每个图像集合对应的类中心信息与预设人像库进行撞库,以确定对应的标签信息,即身份信息。
具体的,在本公开的实施例中,数据分类装置对至少一个图像集合中每个图像集合,利用从至少一个类中心信息中对应的类中心信息与预设人像库进行撞库,确定出对应的标签信息,包括:从预设人像库中,查找与第一类中心信息匹配的第二人脸图像;第一类中心信息为第一图像集合对应的类中心信息,第一图像集合为至少一个图像集合中任意一个图像集合;在查找到第一人脸图像的情况下,将预设人像库中第一人脸图像对应的身份信息,确定为第一图像集合对应的标签信息。
具体的,在本公开的实施例中,数据分类装置从预设人脸库中,查找与第一类中心信息匹配的第一人脸图像之后,还可以执行以下步骤:在未查找到第一人脸图像的情况下,确定第一图像集合对应的标签信息为匿名身份。
需要说明的是,在本公开的实施例中,预设人像库中存储有大量的人脸图像,以及每个人脸图像对应的身份信息。
示例性的,在本公开的实施例中,对于至少一个图像集合中任意一个图像集合,即第一图像集合,数据分类装置可以从中选取出的一张人脸图像,作为第一类中心信息,数据分类装置可以将选取出的人脸图像与预设人像库中包括的人脸图像一一比对,从而查找匹配的第一人脸图像。如果未查找到第一人脸图像,则表示预设人像库中未包含与第一人脸图像对应的人物的人脸图像,即无法获知第一图像集合中人脸图像对应人物的身份,因此,确定第一图像集合对应的标签信息为匿名身份,如果查找到第一人脸图像,即可以直接获取第一人脸图像对应的身份信息,并将该身份信息作为第一图像集合的标签信息。
可以理解的是,在本公开的实施例中,数据分类装置确定出每个图像集合对应的标签信息,在用户查看任一图像集合时,实际上根据标签信息就可以直接获知该图像集合包括的全部人脸图像对应的人物的具体身份。
在本公开的实施例中,数据分类装置在对多个人脸图像进行聚类,得到至少一个图像集合,即执行步骤S102之后,还可以执行以下步骤:在至少一个图像集合的每个图像集合中,添加包含的每个人脸图像在多个待分类视图中所属的视图,得到至少一个视图集合。
可以理解的是,在本公开的实施例中,数据分类装置在得到至少一个图像集合之后,即可将在每个图像集合中,添加该图像集合包含的每个人脸图像所属的视图,得到至少一个视图集合,实现多个待分类视图的分类。
可以理解的是,在本公开的实施例中,至少一个图像集合中包含的人脸图像,是从待分类视图中提取的,因此,数据分类装置针对于每个图像集合,可以将该集合中包括的人脸图像所属的待分类视图,一并放入该集合,从而得到一个视图集合,并且,对于至少一个视图集合,同一视图集合中的视图对应同一人物,不同视图集合中的视图对应不同人物。一个视图集合中,不仅包括一个人物的人脸图像,还包括包含该人物的其它视频和图像。
示例性的,在本公开的实施例中,至少一个图像集合中包括图像集合A,在图像集合A中包括人脸图像a1、人脸图像a2、人脸图像a3和人脸图像a4,数据分类装置即可在多个待分类视图中,将人脸图像a1所属的视图A1、人脸图像a2所属的视图A2、人脸图像a3所属的视图A3,以及人脸图像a4所属的视图A4,添加至图像集合A中,添加后的图像集合A则可以确定为视图集合A。
可以理解的是,在本公开的实施例中,多个待分类视图中,有的视图中可能包含多个人物,也就包含多个人脸,数据分类装置在至少一个图像集合的每个图像集合中,添加包含的每个人脸图像在多个待分类视图中所属的视图时,实际上包含多个人物的视图也就分别被添加到了视图中不同人脸图像所在的图像集合中。
在本公开的实施例中,还包括发布人员档案库,发布人员档案库包括不同发布人员的身份信息和发布的视图,数据分类装置在得到至少一个视图集合之后,还可以执行以下步骤:从发布人员档案库中,查找至少一个视图集合中每个视图的发布人员的身份信息;将至少一个视图集合中,每个视图与对应的发布人员的身份信息关联。
可以理解的是,在本公开的实施例中,数据分类装置可以从发布人员档案库中,查找出每个视频和图像对应的发布人员的身份信息,从而将其对应关联,这样,便于进行图像和视频的分析和溯源。
图3为本公开实施例提供的一种示例性的数据分类过程的示意图。如图3所示,数据分类装置可以先获取到多个待分类视图的情况下,首先,针对每个视图进行人脸识别,从而提取出人脸图像,并进一步进行深度伪造检测,之后,可以对每个人脸图像进行特征提取,从而利用人脸特征对人脸图像进行聚类,并在得到的每个集合中,包含的每个人脸图像携带图像对应的真伪检测结果,得到的至少一个图像集合,从而进一步在每个图像集合中,添加包含的每个人脸图像在多个待分类视图中所属的视图,得到至少一个视图集合,最后,从每个视图集合中选取一个人脸图像作为类中心信息,与预设人像库进行撞库,从而得到对应视图集合的标签信息。需要说明的是,数据分类装置也可以在得到至少一个图像集合的情况下,从每个图像结合中选取一个人脸图像作为类中心信息进行撞库,从而确定图像集合的标签信息,实际上每个图像集合,与基于该图像集合构建的视图集合的标签信息实际上相同。此外,数据分类装置可以从发布人员档案库中查找每个视图集合中包含的视频和图像各自对应的发布人员的身份信息并进行关联。对于视图集合中的视频和图像也可以关联其中人脸图像对应的真伪检测结果,以表征其是否是真实的还是伪造的。
本公开实施例提供了一种数据分类方法,包括:获取多个待分类视图,并提取多个待分类视图中每个视图包含的人脸图像,得到多个人脸图像;对多个人脸图像进行聚类,得到至少一个图像集合;其中,每个图像集合中的人脸图像对应同一人物,且每个图像集合中的每个人脸图像携带表征图像真伪的真伪检测结果。本公开实施例提供的数据分类方法,将所有的图像和视频以不同的人物为维度进行分类,并且,在划分的每个集合包括的每个人脸图像携带了表征图像真伪的信息,从而提高了数据分类的智能性和效果。
本公开实施例提供了一种数据分类装置。图4为本公开实施例提供的一种数据分类装置的结构示意图。如图4所示,在本公开的实施例中,数据分类装置包括:
数据处理模块401,用于获取多个待分类视图,并提取所述多个待分类视图中每个视图包含的人脸图像,得到多个人脸图像;
数据分类模块402,用于对所述多个人脸图像进行聚类,得到至少一个图像集合;其中,每个所述图像集合中的人脸图像对应同一人物,且每个所述图像集合中的每个人脸图像携带表征图像真伪的真伪检测结果。
在本公开一实施例中,所述数据分类模块402,具体用于对所述多个人脸图像中每个人脸图像进行深度伪造检测,得到与所述多个人脸图像一一对应的多个真伪检测结果;对所述多个人脸图像中每个人脸图像进行特征提取,得到与所述多个人脸图像一一对应的多组人脸特征;利用所述多组人脸特征,将所述多个人脸图像中对应同一人物的人脸图像划分至同一集合中,并在划分的每个集合中,包含的每个人脸图像上携带多个真伪检测结果中对应的真伪检测结果,得到所述至少一个图像集合。
在本公开一实施例中,所述数据分类模块402,还用于获取与所述至少一个图像集合一一对应的至少一个类中心信息;对所述至少一个图像集合中每个图像集合,利用所述至少一个类中心信息中对应的类中心信息与预设人像库进行撞库,确定出对应的标签信息。
在本公开一实施例中,所述数据分类模块402,具体用于从所述预设人像库中,查找与第一类中心信息匹配的第二人脸图像;所述第一类中心信息为第一图像集合对应的类中心信息,所述第一图像集合为所述至少一个图像集合中任意一个图像集合;在查找到所述第一人脸图像的情况下,将所述预设人像库中所述第一人脸图像对应的身份信息,确定为所述第一图像集合对应的标签信息。
在本公开一实施例中,所述数据分类模块402,还用于在未查找到所述第一人脸图像的情况下,确定所述第一图像集合对应的标签信息为匿名身份。
在本公开一实施例中,所述数据分类模块402,还用于在所述至少一个图像集合的每个图像集合中,添加包含的每个人脸图像在所述多个待分类视图中所属的视图,得到至少一个视图集合。
在本公开一实施例中,还包括发布人员档案库,所述发布人员档案库包括不同发布人员的身份信息和发布的视图,所述数据分类模块402,还用于从所述发布人员档案库中,查找所述至少一个视图集合中每个视图的发布人员的身份信息;将所述至少一个视图集合中,每个视图与对应的发布人员的身份信息关联。
本公开实施例提供了一种数据分类装置,获取多个待分类视图,并提取多个待分类视图中每个视图包含的人脸图像,得到多个人脸图像;对多个人脸图像进行聚类,得到至少一个图像集合;其中,每个图像集合中的人脸图像对应同一人物,且每个图像集合中的每个人脸图像携带表征图像真伪的真伪检测结果。本公开实施例提供的数据分类装置,将所有的图像和视频以不同的人物为维度进行分类,并且,在划分的每个集合包括的每个人脸图像携带了表征图像真伪的信息,从而提高了数据分类的智能性和效果。
本公开实施例提供了一种电子设备。图5为本公开实施例提供的一种电子设备的结构示意图。如图5所示,电子设备包括:处理器501、存储器502和通信总线503;其中,
所述通信总线503,用于实现所述处理器501和所述存储器502之间的连接通信;
所述处理器501,用于执行所述存储器502中存储的一个或多个程序,以实现上述数据分类方法。
本公开实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可以被一个或者多个处理器执行,以实现上述数据分类方法。计算机可读存储介质可以是是易失性存储器(volatile memory),例如随机存取存储器(Random-Access Memory,RAM);或者非易失性存储器(non-volatilememory),例如只读存储器(Read-Only Memory,ROM),快闪存储器(flash memory),硬盘(Hard Disk Drive,HDD)或固态硬盘(Solid-State Drive,SSD);也可以是包括上述存储器之一或任意组合的各自设备,如移动电话、计算机、平板设备、个人数字助理等。
本领域内的技术人员应明白,本公开的实施例可提供为方法、***、或计算机程序产品。因此,本公开可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本公开是参照根据本公开实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程信号处理设备的处理器以产生一个机器,使得通过计算机或其他可编程信号处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程信号处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程信号处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述,仅为本公开的较佳实施例而已,并非用于限定本公开的保护范围。

Claims (10)

1.一种数据分类方法,其特征在于,所述方法包括:
获取多个待分类视图,并提取所述多个待分类视图中每个视图包含的人脸图像,得到多个人脸图像;
对所述多个人脸图像进行聚类,得到至少一个图像集合;其中,每个所述图像集合中的人脸图像对应同一人物,且每个所述图像集合中的每个人脸图像携带表征图像真伪的真伪检测结果。
2.根据权利要求1所述的方法,其特征在于,所述对所述多个人脸图像进行聚类,得到至少一个图像集合,包括:
对所述多个人脸图像中每个人脸图像进行深度伪造检测,得到与所述多个人脸图像一一对应的多个真伪检测结果;
对所述多个人脸图像中每个人脸图像进行特征提取,得到与所述多个人脸图像一一对应的多组人脸特征;
利用所述多组人脸特征,将所述多个人脸图像中对应同一人物的人脸图像划分至同一集合中,并在划分的每个集合中,包含的每个人脸图像上携带所述多个真伪检测结果中对应的真伪检测结果,得到所述至少一个图像集合。
3.根据权利要求1或2所述的方法,其特征在于,所述对所述多个人脸图像进行聚类,得到至少一个图像集合之后,所述方法还包括:
获取与所述至少一个图像集合一一对应的至少一个类中心信息;
对所述至少一个图像集合中每个图像集合,利用所述至少一个类中心信息中对应的类中心信息与预设人像库进行撞库,确定出对应的标签信息。
4.根据权利要求3所述的方法,其特征在于,所述对所述至少一个图像集合中每个图像集合,利用所述至少一个类中心信息中对应的类中心信息与预设人像库进行撞库,确定出对应的标签信息,包括:
从所述预设人像库中,查找与第一类中心信息匹配的第一人脸图像;所述第一类中心信息为第一图像集合对应的类中心信息,所述第一图像集合为所述至少一个图像集合中任意一个图像集合;
在查找到所述第一人脸图像的情况下,将所述预设人像库中所述第一人脸图像对应的身份信息,确定为所述第一图像集合对应的标签信息。
5.根据权利要求4所述的方法,其特征在于,所述从所述预设人像库中,查找与第一类中心信息匹配的第一人脸图像之后,所述方法还包括:
在未查找到所述第一人脸图像的情况下,确定所述第一图像集合对应的标签信息为匿名身份。
6.根据权利要求1所述的方法,其特征在于,所述对所述多个人脸图像进行聚类,得到至少一个图像集合之后,所述方法还包括:
在所述至少一个图像集合的每个图像集合中,添加包含的每个人脸图像在所述多个待分类视图中所属的视图,得到至少一个视图集合。
7.根据权利要求6所述的方法,其特征在于,还包括发布人员档案库,所述发布人员档案库包括不同发布人员的身份信息和发布的视图,所述得到至少一个视图集合之后,所述方法还包括:
从所述发布人员档案库中,查找所述至少一个视图集合中每个视图的发布人员的身份信息;
将所述至少一个视图集合中,每个视图与对应的发布人员的身份信息关联。
8.一种数据分类装置,其特征在于,包括:
数据处理模块,用于获取多个待分类视图,并提取所述多个待分类视图中每个视图包含的人脸图像,得到多个人脸图像;
数据分类模块,用于对所述多个人脸图像进行聚类,得到至少一个图像集合;其中,每个所述图像集合中的人脸图像对应同一人物,且每个所述图像集合中的每个人脸图像携带表征图像真伪的真伪检测结果。
9.一种电子设备,其特征在于,包括:处理器、存储器和通信总线;其中,
所述通信总线,用于实现所述处理器和所述存储器之间的连接通信;
所述处理器,用于执行所述存储器中存储的一个或多个程序,以实现权利要求1-7任一项所述的数据分类方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可以被一个或者多个处理器执行,以实现权利要求1-7任一项所述的数据分类方法。
CN202110556441.XA 2021-05-21 2021-05-21 数据分类方法及装置、电子设备和存储介质 Pending CN113221786A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202110556441.XA CN113221786A (zh) 2021-05-21 2021-05-21 数据分类方法及装置、电子设备和存储介质
PCT/CN2021/126150 WO2022242032A1 (zh) 2021-05-21 2021-10-25 数据分类方法及装置、电子设备、存储介质和计算机程序产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110556441.XA CN113221786A (zh) 2021-05-21 2021-05-21 数据分类方法及装置、电子设备和存储介质

Publications (1)

Publication Number Publication Date
CN113221786A true CN113221786A (zh) 2021-08-06

Family

ID=77093687

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110556441.XA Pending CN113221786A (zh) 2021-05-21 2021-05-21 数据分类方法及装置、电子设备和存储介质

Country Status (2)

Country Link
CN (1) CN113221786A (zh)
WO (1) WO2022242032A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022242032A1 (zh) * 2021-05-21 2022-11-24 深圳市商汤科技有限公司 数据分类方法及装置、电子设备、存储介质和计算机程序产品

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102096800A (zh) * 2009-12-14 2011-06-15 北京中星微电子有限公司 一种图像信息获取方法及装置
CN108229330A (zh) * 2017-12-07 2018-06-29 深圳市商汤科技有限公司 人脸融合识别方法及装置、电子设备和存储介质
CN108985134A (zh) * 2017-06-01 2018-12-11 重庆中科云丛科技有限公司 基于双目摄像机的人脸活体检测及刷脸交易方法及***
CN109344709A (zh) * 2018-08-29 2019-02-15 中国科学院信息工程研究所 一种人脸生成伪造图像的检测方法
CN110175555A (zh) * 2019-05-23 2019-08-27 厦门市美亚柏科信息股份有限公司 人脸图像聚类方法和装置
CN110210393A (zh) * 2019-05-31 2019-09-06 百度在线网络技术(北京)有限公司 人脸图像的检测方法和装置
CN110348272A (zh) * 2018-04-03 2019-10-18 北京京东尚科信息技术有限公司 动态人脸识别的方法、装置、***和介质
CN111625671A (zh) * 2020-05-25 2020-09-04 深圳市商汤科技有限公司 数据处理方法及装置、电子设备及存储介质
CN111738120A (zh) * 2020-06-12 2020-10-02 北京奇艺世纪科技有限公司 人物识别方法、装置、电子设备及存储介质
CN111783505A (zh) * 2019-05-10 2020-10-16 北京京东尚科信息技术有限公司 伪造人脸的识别方法、装置和计算机可读存储介质
CN112100427A (zh) * 2020-09-03 2020-12-18 Oppo广东移动通信有限公司 视频处理方法、装置、电子设备及存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111078922A (zh) * 2019-10-15 2020-04-28 深圳市商汤科技有限公司 一种信息处理方法及装置、存储介质
CN112766189B (zh) * 2021-01-25 2023-08-08 北京有竹居网络技术有限公司 深度伪造检测方法、装置、存储介质及电子设备
CN113221786A (zh) * 2021-05-21 2021-08-06 深圳市商汤科技有限公司 数据分类方法及装置、电子设备和存储介质

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102096800A (zh) * 2009-12-14 2011-06-15 北京中星微电子有限公司 一种图像信息获取方法及装置
CN108985134A (zh) * 2017-06-01 2018-12-11 重庆中科云丛科技有限公司 基于双目摄像机的人脸活体检测及刷脸交易方法及***
CN108229330A (zh) * 2017-12-07 2018-06-29 深圳市商汤科技有限公司 人脸融合识别方法及装置、电子设备和存储介质
CN110348272A (zh) * 2018-04-03 2019-10-18 北京京东尚科信息技术有限公司 动态人脸识别的方法、装置、***和介质
CN109344709A (zh) * 2018-08-29 2019-02-15 中国科学院信息工程研究所 一种人脸生成伪造图像的检测方法
CN111783505A (zh) * 2019-05-10 2020-10-16 北京京东尚科信息技术有限公司 伪造人脸的识别方法、装置和计算机可读存储介质
CN110175555A (zh) * 2019-05-23 2019-08-27 厦门市美亚柏科信息股份有限公司 人脸图像聚类方法和装置
CN110210393A (zh) * 2019-05-31 2019-09-06 百度在线网络技术(北京)有限公司 人脸图像的检测方法和装置
CN111625671A (zh) * 2020-05-25 2020-09-04 深圳市商汤科技有限公司 数据处理方法及装置、电子设备及存储介质
CN111738120A (zh) * 2020-06-12 2020-10-02 北京奇艺世纪科技有限公司 人物识别方法、装置、电子设备及存储介质
CN112100427A (zh) * 2020-09-03 2020-12-18 Oppo广东移动通信有限公司 视频处理方法、装置、电子设备及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022242032A1 (zh) * 2021-05-21 2022-11-24 深圳市商汤科技有限公司 数据分类方法及装置、电子设备、存储介质和计算机程序产品

Also Published As

Publication number Publication date
WO2022242032A1 (zh) 2022-11-24

Similar Documents

Publication Publication Date Title
CN106446816B (zh) 人脸识别方法及装置
US10733421B2 (en) Method for processing video, electronic device and storage medium
CN107657048B (zh) 用户识别方法及装置
Lubenko et al. Steganalysis with mismatched covers: Do simple classifiers help?
CN109871490B (zh) 媒体资源匹配方法、装置、存储介质和计算机设备
CN110889379B (zh) 表情包生成方法、装置及终端设备
CN111191067A (zh) 绘本识别方法、终端设备及计算机可读存储介质
CN110866491A (zh) 目标检索方法、装置、计算机可读存储介质和计算机设备
CN112818149A (zh) 一种基于时空轨迹数据的人脸聚类方法、装置及存储介质
CN107644106B (zh) 自动挖掘业务中间人的方法、终端设备及存储介质
CN112818995B (zh) 图像分类方法、装置、电子设备及存储介质
CN104750791A (zh) 一种图像检索方法及装置
CN112966652A (zh) 轨迹汇聚方法、装置、计算机设备及存储介质
CN110765760A (zh) 一种法律案件分配方法、装置、存储介质和服务器
Zhang et al. Person re-identification based on heterogeneous part-based deep network in camera networks
CN113962199B (zh) 文本识别方法、装置、设备、存储介质及程序产品
CN109783678B (zh) 一种图像搜索的方法及装置
CN113704623B (zh) 一种数据推荐方法、装置、设备及存储介质
CN113221786A (zh) 数据分类方法及装置、电子设备和存储介质
CN108804917B (zh) 一种文件检测方法、装置、电子设备及存储介质
CN111177450B (zh) 一种图像检索云识别方法、***及计算机可读存储介质
CN112257628A (zh) 一种户外比赛运动员的身份识别方法、装置及设备
CN115410281A (zh) 电子签名识别方法、装置、设备及存储介质
CN113221785A (zh) 图像识别方法及装置、电子设备及存储介质
CN113627542A (zh) 一种事件信息处理方法、服务器及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40051367

Country of ref document: HK

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210806