CN110929064B - 一种人脸辨识样本库及检索方法 - Google Patents

一种人脸辨识样本库及检索方法 Download PDF

Info

Publication number
CN110929064B
CN110929064B CN201911197084.1A CN201911197084A CN110929064B CN 110929064 B CN110929064 B CN 110929064B CN 201911197084 A CN201911197084 A CN 201911197084A CN 110929064 B CN110929064 B CN 110929064B
Authority
CN
China
Prior art keywords
layer
sample library
sub
sample
retrieval
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911197084.1A
Other languages
English (en)
Other versions
CN110929064A (zh
Inventor
***
倪英杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bank of Communications Co Ltd
Original Assignee
Bank of Communications Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bank of Communications Co Ltd filed Critical Bank of Communications Co Ltd
Priority to CN201911197084.1A priority Critical patent/CN110929064B/zh
Publication of CN110929064A publication Critical patent/CN110929064A/zh
Application granted granted Critical
Publication of CN110929064B publication Critical patent/CN110929064B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Library & Information Science (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种人脸辨识样本库及检索方法,其中,人脸辨识样本库包括自底向上的M层数据库,所述M层数据库中的第M层仅包含一个子样本库节点,其余每层分别包含多个子样本库节点,M层数据库中每层的子样本库节点分别对应地与其底下一层若干个子样本库节点相连接,每层的一个子样本库节点仅与其上一层的一个子样本库节点连接,每层的子样本库节点的样本数据均来自底下一层与该子样本库节点连接的子样本库节点。与现有技术相比,本发明通过分层模型,以构建各层子样本节点对应相连接的人脸辨识样本库,不仅能够有效增加样本库规模、避免单一样本库下各类客群相互独立,同时基于逐层检索机制,保证了现有人脸辨识算法的误识率和拒真率。

Description

一种人脸辨识样本库及检索方法
技术领域
本发明涉及数据处理技术领域,尤其是涉及一种人脸辨识样本库及检索方法。
背景技术
现阶段人脸识别技术主要分为两类,即1比1人脸验证和1比N人脸辨识。人脸验证是通过提取两张人脸的特征进行相似度对比,用于判断两个输入人脸是否属于同一人,适用于身份识别及相似脸查询等应用查询,人脸验证模式目前的发展较为成熟,已普遍应用于各行业的用户核身环节。
人脸辨识则是在大规模人脸数据库中找出与待检索人脸相似度最高的一个或多个人脸。需要预先创建待辨识人员的面部特征索引,之后在人脸数据库中进行检索匹配,可用于身份确认以及身份查询等应用场景,受限于现有技术水平,人脸辨识样本库数量只能达到十万或百万级,较难应用于用户规模达亿级的金融行业。
目前通常是通过客群分类缩小人脸辨识样本库的大小,以实现可以应用的规模,该方法具体是将所需的样本库归纳、抽象成多个不同客群,根据客群的不同,在有限的样本库规模下,建立更具针对性的人脸辨识场景。但这种方法会导致各类客群之间相互独立,无法通过有效的手段进行信息整合。在样本库数量级不变的前提下,虽可以保证不同客群的识别准确率,但各客群之间各自为政,无法有效地组织建立一套完整的人脸辨识样本库检索体系。
此外,区别于上述通过客群分类缩小样本库规模的方法,现有技术还利用分片技术,将一个大样本库切分为多个较小规模的库,采用分布式技术分别对这些小规模库进行单独的人脸辨识,再通过一定的策略对各切分后的样本库检索结果进行汇总加工,以得到最终结果。虽然样本库可以通过分片技术缩小数量级来降低由于样本数增长所带来的算法时间、空间复杂度增长的影响,但人脸检索最终结果是N次比对中的Top1(最相似人脸),此类方法无法规避样本库规模增长到算法本身瓶颈后所带来的识别性能上的下降。一旦到达算法瓶颈,无论如何调整分片模式和规模,均无法保证误识率和拒真率。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种人脸辨识样本库及检索方法,基于现有的人脸辨识算法,能够在保证误识率、拒真率等性能指标的情况下,尽可能扩展样本库规模、扩大样本可支持客群。
本发明的目的可以通过以下技术方案来实现:一种人脸辨识样本库,包括自底向上的M层数据库,所述M层数据库中的第M层仅包含一个子样本库节点,其余每层分别包含多个子样本库节点,所述M层数据库中每层的子样本库节点分别对应地与其底下一层的子样本库节点相连接,所述每层的子样本库节点的样本数据均来自底下一层与该子样本库节点连接的子样本库节点。
进一步地,所述子样本库节点的样本数量级均小于或等于N,其中,N为人脸辨识算法可支持的有效样本库数量级。
进一步地,所述M层数据库中每层的子样本库节点的个数小于其底下一层的子样本库节点的个数。
进一步地,所述子样本库节点中每一个样本数据具体为包含该子样本库节点标记以及用户标记的人脸图像。
进一步地,所述每层的子样本库节点分别具有其对应的样本数据获取规则,根据样本数据获取规则,每层的子样本库节点从底下一层与该子样本库节点连接的子样本库节点收集样本数据。
进一步地,所述每层的子样本库节点的样本数量级大于或等于底下一层与该子样本库节点连接的子样本库节点的样本数量级。
一种应用上述人脸辨识样本库的检索方法,包括以下步骤:
S1、针对具体的应用场景,构建包含检索顺序和检索规则的逐层检索机制,其中,逐层检索机制中的层级检索次数小于或等于M;
S2、根据逐层检索机制的检索顺序,基于检索规则,在人脸辨识样本库中依次进行检索,以完成人脸辨识的检索过程。
进一步地,所述检索顺序具体为:从第一层的第i个子样本库节点开始,往上一层的第j个子样本库节点递进,直至第M层的子样本库节点结束。
进一步地,所述检索规则具体为:若在当前层的子样本库节点中检索到对应的样本数据,则不再往上一层进行递进检索,此时结束检索过程;否则继续往上一层进行递进检索,直至在某一层的子样本库节点中检索到对应的样本数据,或者按照检索顺序完成了所有层的检索。
与现有技术相比,本发明通过分层模型,可在保证现有人脸辨识算法有效性的前提下,将可支持样本数量尽可能的扩大,具体为:若整个M层样本库的子样本库节点数为X,则M层样本库数量级最大可至N×X,以此有效地提升了人脸辨识样本库的规模,同时,每层的子样本库节点均对应地与底下一层的节点相连接,解决了单一样本库下各客群不成体系,各自为政的问题。
本发明采用逐层检索机制,使得单次人脸辨识最大可支持N×M的样本数量,实际能够完成最多M层的人脸辨识,且每次人脸辨识样本库的数量级保持N不变,故每个环节人脸辨识的误识率、拒真率等性能指标不会受到影响。
本发明通过合理的子样本库建设以及检索顺序排序,能够在保证总体误识率、拒真率的情况下,大大提升单次人脸辨识样本库的规模,即在增加可用样本库的前提下,有效避免由于算法本身瓶颈造成的性能指标的下降。
附图说明
图1为本发明的人脸辨识样本库模型示意图;
图2为本发明的人脸辨识检索方法流程示意图;
图3为实施例中人脸辨识样本库模型示意图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。
如图1所示,一种辨识样本库模型示意图,整个样本库自底向上分为M层,每层可建立多个子样本库节点,每个子样本库节点所包含的样本库数量级小于或等于N,其中,N为人脸辨识算法可支持的有效样本库数量级,并且自底向上的每一层所建立的子样本库节点均是其底下一层子样本库节点的抽象归纳,即每一层中的子样本库节点均分别对应地连接至底下一层的子样本库节点,此外,每层所含的子样本库节点数均小于其底下一层的子样本库节点数,位于顶部的第M层仅包含一个子样本库节点。
在完成上述样本库模型的构建之后,针对该分层模型,本发明还提出一种人脸辨识的检索方法,如图2所示,包括以下步骤:
S1、针对具体的应用场景,构建包含检索顺序的逐层检索机制,其中,逐层检索机制中的层级检索次数小于或等于M;
S2、根据逐层检索机制的检索顺序,在人脸辨识样本库中依次进行检索,以完成人脸辨识的检索过程。
在实际应用上述方法时,具体是根据应用场景,建立一个最多M层的逐层检索机制:如可按图1中“节点1”→“节点4”→“节点5”→“节点6”的顺序逐层进行人脸辨识,其中的逐层检索规则为:若当前层节点人脸辨识命中,则不再进行往上一层的人脸辨识,若当前层未命中,则继续进行往上一层的人脸辨识,直至命中或者完成全部层次的检索。
本实施例以银行VIP客户人脸辨识样本库建设为例,根据实际业务需要,建立网点、分行、总行三层样本库,网点中所有样本数据均为包含网点编号和客户相关信息标记的客户人脸图像,假设人脸辨识算法可支持的样本库有效数量级为10万,构建如图3所示的分层样本库。网点A1、A2、A3分别根据其实际场景,构建了针对性的人脸辨识子样本库,子样本库规模分别为10万、5万、5万。网点A1、A2、A3所构建的子样本库建库策略灵活独立,各子样本库之间可以存在重复样本,亦可有不同。分行层样本库一般是对所辖网点样本库的提炼和补充,如分行A子样本库规模为10万,这10万的样本可以均来自于网点A1、A2、A3,分行A子样本库具有其对应的样本数据获取规则,本实施例中,分行A的样本数据获取规则为用户资产大于或等于100万,因此,网点A1、A2和A3中用户资产大于或等于100万的样本数据会被收集到分行A子样本库,分行A子样本库的样本数据获取规则可灵活调整,当网点A1、A2和A3中符合分行A子样本库样本数据获取规则的样本数据量超过10万,则更新分行A子样本库样本数据获取规则,设置更为严格的样本数据获取规则,以保证分行A子样本库中样本数据量不超过10万。总行层同理,是对分行层子样本库的进一步归纳提炼。
图3所示的人脸辨识样本库可灵活部署至银行各类业务场景中。如网点A1既可以单独为该网点所辖的VIP客户建立A1人脸子样本库;网点B1则可根据实际情况,分别组合“网点B1”、“分行B”两个子样本库进行逐层人脸辨识;同理,网点C1亦可以组合“网点C1”,“分行C”,“总行”3个子样本库进行逐层人脸辨识。各层之间的调用顺序亦可自定义,如网点B1可以按“网点B1”→“分行B”的顺序进行人脸辨识:若在“网点B1”子样本库中检索出客户,则不再继续检索“分行B”子样本库,若未在“网点B1”中检索出客户,则可继续在“分行B”子样本库中检索,直至检索出客户或者完成所有层次子样本库的检索。
通过构建上述的分层样本库以及检索方法,打破了现有人脸辨识算法仅可支持10万级的样本库规模。此场景下,既能够保证人脸辨识算法的误识率、拒真率,同时使得一次性检索的样本库最大可扩展至30W数量级。

Claims (4)

1.一种人脸辨识样本库,其特征在于,包括自底向上的M层数据库,所述M层数据库中的第M层仅包含一个子样本库节点,其余每层分别包含多个子样本库节点,所述子样本库节点的样本数量级均小于或等于N,其中,N为人脸辨识算法可支持的有效样本库数量级;
所述M层数据库中每层的子样本库节点的个数小于其底下一层的子样本库节点的个数;
所述M层数据库中每层的子样本库节点分别对应地与其底下一层的子样本库节点相连接;
所述每层的子样本库节点的样本数据均来自底下一层与该子样本库节点连接的子样本库节点;
所述每层的子样本库节点的样本数量级大于或等于底下一层与该子样本库节点连接的子样本库节点的样本数量级。
2.一种应用权利要求1所述人脸辨识样本库的人脸辨识检索方法,包括以下步骤:
S1、针对具体的应用场景,构建包含检索顺序和检索规则的逐层检索机制,其中,逐层检索机制中的层级检索次数小于或等于M;
S2、根据逐层检索机制的检索顺序,基于检索规则,在人脸辨识样本库中依次进行检索,以完成人脸辨识的检索过程。
3.根据权利要求2所述的一种人脸辨识检索方法,其特征在于,所述检索顺序具体为:从第一层的第i个子样本库节点开始,往上一层的第j个子样本库节点递进,直至第M层的子样本库节点结束。
4.根据权利要求2所述的一种人脸辨识检索方法,其特征在于,所述检索规则具体为:若在当前层的子样本库节点中检索到对应的样本数据,则不再往上一层进行递进检索,此时结束检索过程;否则继续往上一层进行递进检索,直至在某一层的子样本库节点中检索到对应的样本数据,或者按照检索顺序完成了所有层的检索。
CN201911197084.1A 2019-11-29 2019-11-29 一种人脸辨识样本库及检索方法 Active CN110929064B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911197084.1A CN110929064B (zh) 2019-11-29 2019-11-29 一种人脸辨识样本库及检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911197084.1A CN110929064B (zh) 2019-11-29 2019-11-29 一种人脸辨识样本库及检索方法

Publications (2)

Publication Number Publication Date
CN110929064A CN110929064A (zh) 2020-03-27
CN110929064B true CN110929064B (zh) 2024-02-09

Family

ID=69846775

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911197084.1A Active CN110929064B (zh) 2019-11-29 2019-11-29 一种人脸辨识样本库及检索方法

Country Status (1)

Country Link
CN (1) CN110929064B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104778481A (zh) * 2014-12-19 2015-07-15 五邑大学 一种大规模人脸模式分析样本库的构建方法和装置
CN106778653A (zh) * 2016-12-27 2017-05-31 北京光年无限科技有限公司 面向智能机器人的基于人脸识别样本库的交互方法和装置
WO2017107957A1 (zh) * 2015-12-22 2017-06-29 中兴通讯股份有限公司 人脸图像的检索方法及装置
CN110210307A (zh) * 2019-04-30 2019-09-06 ***股份有限公司 人脸样本库部署方法、基于人脸识别业务处理方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104778481A (zh) * 2014-12-19 2015-07-15 五邑大学 一种大规模人脸模式分析样本库的构建方法和装置
WO2017107957A1 (zh) * 2015-12-22 2017-06-29 中兴通讯股份有限公司 人脸图像的检索方法及装置
CN106778653A (zh) * 2016-12-27 2017-05-31 北京光年无限科技有限公司 面向智能机器人的基于人脸识别样本库的交互方法和装置
CN110210307A (zh) * 2019-04-30 2019-09-06 ***股份有限公司 人脸样本库部署方法、基于人脸识别业务处理方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
刘小华 ; 周春光 ; 张利彪 ; 盛会鹏 ; 李江春 ; .海量人脸数据库的快速检索.吉林大学学报(工学版).2010,(01),全文. *

Also Published As

Publication number Publication date
CN110929064A (zh) 2020-03-27

Similar Documents

Publication Publication Date Title
CN106874432B (zh) 一种公共交通乘客出行时空轨迹提取方法
CN105631479B (zh) 基于非平衡学习的深度卷积网络图像标注方法及装置
CN112733866B (zh) 一种提高可控图像文本描述正确性的网络构建方法
CN107766511A (zh) 智能问答方法、终端及存储介质
CN108920720A (zh) 基于深度哈希和gpu加速的大规模图像检索方法
CN101398832A (zh) 利用人脸检测的图像搜索方法和***
JP5115741B2 (ja) 検索方法、類似度計算方法、類似度計算及び同一文書照合システムと、そのプログラム
CN112115716A (zh) 一种基于多维词向量下文本匹配的服务发现方法、***及设备
CN111652171B (zh) 一种基于双分支网络的面部表情识别模型的构建方法
CN106776849A (zh) 一种以图快速检索景点的方法及导游***
CN109992676B (zh) 一种跨媒体资源检索方法及检索***
WO2016057000A1 (en) Customs tariff code classification
CN107577786A (zh) 一种基于联合聚类的矩阵分解推荐方法
CN111428511A (zh) 一种事件检测方法和装置
CN108509545A (zh) 一种文章的评论处理方法及***
Nguyen et al. Towards an automatic plant identification system without dedicated dataset
CN115909455A (zh) 多尺度特征提取与注意力机制融合的表情识别方法
CN111310462A (zh) 用户属性的确定方法、装置、设备及存储介质
CN117709968A (zh) 人员分配方法、装置、计算机设备和存储介质
CN109471927A (zh) 一种知识库及其建立、问答方法及应用装置
CN110929064B (zh) 一种人脸辨识样本库及检索方法
CN113553326A (zh) 电子表格数据处理方法、装置、计算机设备和存储介质
CN113222109A (zh) 一种基于多源异构数据聚合技术的物联网边缘算法
CN110348877B (zh) 基于大数据的智能业务推荐算法、计算机可读存储介质
CN110874326A (zh) 测试用例生成方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant