CN111104846A - 数据检测方法、装置、计算机设备和存储介质 - Google Patents

数据检测方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN111104846A
CN111104846A CN201910984349.6A CN201910984349A CN111104846A CN 111104846 A CN111104846 A CN 111104846A CN 201910984349 A CN201910984349 A CN 201910984349A CN 111104846 A CN111104846 A CN 111104846A
Authority
CN
China
Prior art keywords
picture
certificate
preset
standard
specified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910984349.6A
Other languages
English (en)
Other versions
CN111104846B (zh
Inventor
黄锦伦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201910984349.6A priority Critical patent/CN111104846B/zh
Publication of CN111104846A publication Critical patent/CN111104846A/zh
Priority to JP2021513443A priority patent/JP7296452B2/ja
Priority to US17/264,311 priority patent/US11393248B2/en
Priority to SG11202100447PA priority patent/SG11202100447PA/en
Priority to PCT/CN2020/098819 priority patent/WO2021073150A1/zh
Application granted granted Critical
Publication of CN111104846B publication Critical patent/CN111104846B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/166Detection; Localisation; Normalisation using acquisition arrangements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/242Aligning, centring, orientation detection or correction of the image by image rotation, e.g. by 90 degrees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/762Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person
    • G06T2207/30201Face

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Image Analysis (AREA)
  • Collating Specific Patterns (AREA)

Abstract

本申请揭示了一种数据检测方法、装置、计算机设备和存储介质,所述方法包括:获取包括人脸头像的指定证件图片;将所述指定证件图片纠正为按预设的标准姿态放置,从而得到中间图片;将中间图片输入到预设的人脸特征点检测模型中进行计算,得到多个人脸特征点;计算出多个人脸特征点的聚类中心位置,并生成所述多个人脸特征点的最小外接矩形;从预设的数据库中调取标准证件图片;等比例缩放标准证件图片,从而得到缩放后图片;使所述缩放后图片中的参考中心位置与所述中间图片中的聚类中心位置重叠,从而获得所述中间图片中的重叠部分;将所述重叠部分记为所述指定证件图片的证件本体。从而提高了数据检测准确性。

Description

数据检测方法、装置、计算机设备和存储介质
技术领域
本申请涉及到计算机领域,特别是涉及到一种数据检测方法、装置、计算机设备和存储介质。
背景技术
证件图片分析在当今社会的生产生活中非常普遍,例如在办理某业务时,需要拍摄证件图片并上传该证件图片。若能准确地检测出证件图片(由于一般的拍摄的证件图片,取景范围会大于证件主体,因此证件主体一般不会填充满整个证件图片)中的证件主体,能够提高后续的对于证件图片的分析。传统的证件本体检测方法,一般是通过基于像素点检测,以得到证件本体的坐标(例如矩阵证件本体的四个顶点坐标),这种方式存在耗费计算资源多、并且对于模糊的证件的识别准确率低(由于证件模糊,其证件本体的边界不清晰,因此传统方法识别出的证件主体会有很大的偏差)的缺陷。
发明内容
本申请的主要目的为提供一种数据检测方法、装置、计算机设备和存储介质,旨在提高数据检测准确性。
为了实现上述发明目的,本申请提出一种数据检测方法,包括以下步骤:
获取包括人脸头像的指定证件图片,其中所述指定证件图片中的证件图像呈矩形状;
根据预设的姿态纠正方法,将所述指定证件图片纠正为按预设的标准姿态放置,从而得到中间图片;
将所述中间图片输入到预设的人脸特征点检测模型中进行计算,得到所述人脸特征点检测模型输出的多个人脸特征点;
采用预设的聚类算法,计算出所述多个人脸特征点的聚类中心位置,并生成所述多个人脸特征点的最小外接矩形,其中所述多个人脸特征点均在所述最小外接矩形的内部;
根据预设的证件类型获取方法,获取所述指定证件图片的指定证件类型,并从预设的数据库中调取标准证件图片,其中所述标准证件图片的类型为所述指定证件类型,所述标准证件图片上标有参考矩形和参考中心位置,所述标准证件图片中的证件图像填充满所述标准证件图片;
等比例缩放所述标准证件图片,以使所述参考矩形的面积与所述最小外接矩形的面积相等,从而得到缩放后图片;
采用平移的方式使所述缩放后图片和所述标准证件图片重叠,以使所述缩放后图片中的参考中心位置与所述中间图片中的聚类中心位置重叠,从而获得所述中间图片中的重叠部分;
将所述中间图片中的所述重叠部分记为所述指定证件图片的证件本体。
进一步地,所述根据预设的姿态纠正方法,将所述指定证件图片纠正为按预设的标准姿态放置,从而得到中间图片的步骤,包括:
采用预设的图像边缘检测方法,检测出所述指定证件图片中的多个边缘,并从所述多个边缘中获取指定边缘对,其中所述指定边缘对由两条互相平行且相等的指定边缘线段所构成;
判断所述指定边缘线段的长度是否满足:M=max(M1,M2,...,Mn),其中M为所述指定边缘线段的长度,M1,M2,...,Mn是所述多个边缘中的所有边缘线段的长度,所述多个边缘中共有n个边缘线段;
若所述指定边缘线段的长度满足:M=max(M1,M2,...,Mn),则将所述指定证件图片以指定姿态的形式放置,从而得到第一图片,其中所述指定姿态指所述指定边缘对平行于预设的参照直线;
将所述第一图片输入预设的图像姿态分类模型中进行计算,从而得到所述图像姿态分类模型输出的分类结果,其中所述分类结果包括所述标准姿态、相对于所述标准姿态逆时针旋转90度、相对于所述标准姿态逆时针旋转180度或相对于所述标准姿态逆时针旋转270度;
判断所述分类结果是否为所述标准姿态;
若所述分类结果不为所述标准姿态,则根据所述分类结果旋转所述第一图片,从而获取按预设的标准姿态放置的中间图片。
进一步地,所述图像姿态分类模型基于inception-v3分类模型训练而成,所述将所述第一图片输入预设的图像姿态分类模型中进行计算,从而得到所述图像姿态分类模型输出的分类结果,其中所述分类结果包括所述标准姿态、相对于所述标准姿态逆时针旋转90度、相对于所述标准姿态逆时针旋转180度或相对于所述标准姿态逆时针旋转270度的步骤S204之前,包括:
获取包括指定数量的训练样本的第一训练集,其中所述训练样本由预先设置为按标准姿态放置的证件图片构成;
将所述第一训练集中的所有证件图片逆时针旋转90度、逆时针旋转180度和逆时针旋转270度,从而对应得到第二训练集、第三训练集和第四训练集;
采用轮序训练的方式训练预设的inception-v3分类模型,从而得到所述图像姿态分类模型,其中所述轮序训练指在同一轮次训练时从第一训练集、第二训练集、第三训练集和第四训练集中各抽取相同数量的证件图片作为训练数据。
进一步地,所述人脸特征点检测模型基于神经网络模型训练而成,所述将所述中间图片输入到预设的人脸特征点检测模型中进行计算,得到所述人脸特征点检测模型输出的多个人脸特征点的步骤之前,包括:
获取预先收集的样本数据,并将所述样本数据分成训练数据和测试数据;其中,所述样本数据仅由按标准姿态放置的证件图片和所述按标准姿态放置的证件图片中标注的人脸特征点构成;
利用所述训练数据并采用随机梯度下降法训练预设的神经网络模型,从而得到暂时模型;
采用所述测试数据验证所述暂时模型,并判断是否验证通过;
若验证通过,则将所述暂时模型记为所述人脸特征点检测模型。
进一步地,所述采用预设的聚类算法,计算出所述多个人脸特征点的聚类中心位置的步骤,包括:
根据预设的对称点分类方法,将所述多个人脸特征点划分为对称特征点和非对称特征点,其中所有的对称特征点均相对于同一个对称轴对称,并且所述对称轴与所述证件图像的一条边平行;
采用预设的聚类算法,分别计算出第一聚类子中心和第二聚类子中心,其中所述第一聚类子中心是所有对称特征点的中心,所述第二聚类子中心是所有非对称特征点的中心;
将所述第一聚类子中心和所述第二聚类子中心的连线中点位置记为所述多个人脸特征点的聚类中心位置。
进一步地,所述根据预设的证件类型获取方法,获取所述指定证件图片的指定证件类型,并从预设的数据库中调取标准证件图片,其中所述标准证件图片的类型为所述指定证件类型,所述标准证件图片上标有参考矩形和参考中心位置的步骤之前,包括:
获取预先收集的按所述标准姿态放置的参考证件图片,所述参考证件图片的类型为所述指定证件类型;
将所述参考证件图片输入到预设的人脸特征点检测模型中进行计算,得到所述人脸特征点检测模型输出的多个参考人脸特征点;
采用预设的聚类算法,计算出所述多个参考人脸特征点的聚类中心位置,并标记为参考中心位置;
生成所述多个参考人脸特征点的最小外接矩形,并标记为参考矩形,其中所述多个参考人脸特征点均在所述参考矩形的内部;
将标有所述参考矩形和所述参考中心位置的所述参考证件图片记为所述标准证件图片。
进一步地,所述根据预设的证件类型获取方法,获取所述指定证件图片的指定证件类型的步骤,包括:
通过预设的文字识别技术,识别所述指定证件图片,从而得到文字文本;
根据公式:
Figure BDA0002236218420000041
计算出所述文字文本与预存的多个参考文本的相似程度值Sim,其中P为所述文字文本的词频向量,K为所述参考文本的词频向量,Pi为所述文字文本中第i个单词出现的次数,Ki为所述参考文本中第i个单词出现的次数;
获取指定参考文本,其中所述指定参考文本对应的相似程度值大于其他参考文本对应的相似程度值;
根据预设的指定证件图片-文字文本-指定参考文本-证件类型的对应关系,获取与所述指定证件图片对应的指定证件类型。
本申请提供一种数据检测装置,包括:
指定证件图片获取单元,用于获取包括人脸头像的指定证件图片,其中所述指定证件图片中的证件图像呈矩形状;
姿态纠正单元,用于根据预设的姿态纠正方法,将所述指定证件图片纠正为按预设的标准姿态放置,从而得到中间图片;
人脸特征点获取单元,用于将所述中间图片输入到预设的人脸特征点检测模型中进行计算,得到所述人脸特征点检测模型输出的多个人脸特征点;
聚类中心位置计算单元,用于采用预设的聚类算法,计算出所述多个人脸特征点的聚类中心位置,并生成所述多个人脸特征点的最小外接矩形,其中所述多个人脸特征点均在所述最小外接矩形的内部;
标准证件图片调取单元,用于根据预设的证件类型获取方法,获取所述指定证件图片的指定证件类型,并从预设的数据库中调取标准证件图片,其中所述标准证件图片的类型为所述指定证件类型,所述标准证件图片上标有参考矩形和参考中心位置,所述标准证件图片中的证件图像填充满所述标准证件图片;
缩放后图片获取单元,用于等比例缩放所述标准证件图片,以使所述参考矩形的面积与所述最小外接矩形的面积相等,从而得到缩放后图片;
重叠部分获取单元,用于采用平移的方式使所述缩放后图片和所述标准证件图片重叠,以使所述缩放后图片中的参考中心位置与所述中间图片中的聚类中心位置重叠,从而获得所述中间图片中的重叠部分;
证件本体标记单元,用于将所述中间图片中的所述重叠部分记为所述指定证件图片的证件本体。
本申请提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
本申请提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。
本申请的数据检测方法、装置、计算机设备和存储介质,获取包括人脸头像的指定证件图片;将所述指定证件图片纠正为按预设的标准姿态放置,从而得到中间图片;将所述中间图片输入到预设的人脸特征点检测模型中进行计算,得到多个人脸特征点;计算出所述多个人脸特征点的聚类中心位置,并生成所述多个人脸特征点的最小外接矩形;获取所述指定证件图片的指定证件类型,并从预设的数据库中调取标准证件图片;等比例缩放所述标准证件图片,以使所述参考矩形的面积与所述最小外接矩形的面积相等,从而得到缩放后图片;采用平移的方式使所述缩放后图片和所述标准证件图片重叠,以使所述缩放后图片中的参考中心位置与所述中间图片中的聚类中心位置重叠,从而获得所述中间图片中的重叠部分;将所述中间图片中的所述重叠部分记为所述指定证件图片的证件本体。从而提高了数据检测准确性。
附图说明
图1为本申请一实施例的数据检测方法的流程示意图;
图2为本申请一实施例的数据检测装置的结构示意框图;
图3为本申请一实施例的计算机设备的结构示意框图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
参照图1,本申请实施例提供一种数据检测方法,包括以下步骤:
S1、获取包括人脸头像的指定证件图片,其中所述指定证件图片中的证件图像呈矩形状;
S2、根据预设的姿态纠正方法,将所述指定证件图片纠正为按预设的标准姿态放置,从而得到中间图片;
S3、将所述中间图片输入到预设的人脸特征点检测模型中进行计算,得到所述人脸特征点检测模型输出的多个人脸特征点;
S4、采用预设的聚类算法,计算出所述多个人脸特征点的聚类中心位置,并生成所述多个人脸特征点的最小外接矩形,其中所述多个人脸特征点均在所述最小外接矩形的内部;
S5、根据预设的证件类型获取方法,获取所述指定证件图片的指定证件类型,并从预设的数据库中调取标准证件图片,其中所述标准证件图片的类型为所述指定证件类型,所述标准证件图片上标有参考矩形和参考中心位置,所述标准证件图片中的证件图像填充满所述标准证件图片;
S6、等比例缩放所述标准证件图片,以使所述参考矩形的面积与所述最小外接矩形的面积相等,从而得到缩放后图片;
S7、采用平移的方式使所述缩放后图片和所述标准证件图片重叠,以使所述缩放后图片中的参考中心位置与所述中间图片中的聚类中心位置重叠,从而获得所述中间图片中的重叠部分;
S8、将所述中间图片中的所述重叠部分记为所述指定证件图片的证件本体。
如上述步骤S1所述,获取包括人脸头像的指定证件图片,其中所述指定证件图片中的证件图像呈矩形状。常用的证件图片基本上都包括人脸,而本申请的数据检测方法是基于人脸检测而实现的,因此可用于包括人脸的证件图片,适用性广泛。
如上述步骤S2所述,根据预设的姿态纠正方法,将所述指定证件图片纠正为按预设的标准姿态放置,从而得到中间图片。由于指定证件图片可能以任意姿势放置,若不将其调整为标准姿态放置,会对后续的计算带来不利影响。因此根据预设的姿态纠正方法,将所述指定证件图片纠正为按预设的标准姿态放置,从而得到中间图片。其中所述标准姿态可为任意形式放置的姿态,优选为最适于观看或处理的姿态(即展现于屏幕中时,所述中间图片正面朝向面对于屏幕的阅读者)。其中姿态纠正方法例如为:采用预设的图像边缘检测方法,检测出所述指定证件图片中的多个边缘,并从所述多个边缘中获取指定边缘对,其中所述指定边缘对由两条互相平行且相等的指定边缘线段所构成;判断所述指定边缘线段的长度是否满足:M=max(M1,M2,...,Mn),其中M为所述指定边缘线段的长度,M1,M2,...,Mn是所述多个边缘中的所有边缘线段的长度,所述多个边缘中共有n个边缘线段;若所述指定边缘线段的长度满足:M=max(M1,M2,...,Mn),则将所述指定证件图片以指定姿态的形式放置,从而得到第一图片,其中所述指定姿态指所述指定边缘对平行于预设的参照直线;将所述第一图片输入预设的图像姿态分类模型中进行计算,从而得到所述图像姿态分类模型输出的分类结果,其中所述分类结果包括所述标准姿态、相对于所述标准姿态逆时针旋转90度、相对于所述标准姿态逆时针旋转180度或相对于所述标准姿态逆时针旋转270度;判断所述分类结果是否为所述标准姿态;若所述分类结果不为所述标准姿态,则根据所述分类结果旋转所述第一图片,从而获取按预设的标准姿态放置的中间图片。
如上述步骤S3所述,将所述中间图片输入到预设的人脸特征点检测模型中进行计算,得到所述人脸特征点检测模型输出的多个人脸特征点。其中所述人脸特征点检测模型用于检测出人脸中的特殊位置,例如对称的瞳仁等。所述人脸特征点检测模型的获取方法例如为:获取预先收集的样本数据,并将所述样本数据分成训练数据和测试数据;其中,所述样本数据仅由按标准姿态放置的证件图片和所述按标准姿态放置的证件图片中标注的人脸特征点构成;利用所述训练数据并采用随机梯度下降法训练预设的神经网络模型,从而得到暂时模型;采用所述测试数据验证所述暂时模型,并判断是否验证通过;若验证通过,则将所述暂时模型记为所述人脸特征点检测模型。
如上述步骤S4所述,采用预设的聚类算法,计算出所述多个人脸特征点的聚类中心位置,并生成所述多个人脸特征点的最小外接矩形,其中所述多个人脸特征点均在所述最小外接矩形的内部。其中所述聚类算法可为任意可行算法,例如为knn聚类算法等。进一步地,所述计算出所述多个人脸特征点的聚类中心位置的方式例如为:根据预设的对称点分类方法,将所述多个人脸特征点划分为对称特征点和非对称特征点,其中所有的对称特征点均相对于同一个对称轴对称,并且所述对称轴与所述证件图像的一条边平行;采用预设的聚类算法,分别计算出第一聚类子中心和第二聚类子中心,其中所述第一聚类子中心是所有对称特征点的中心,所述第二聚类子中心是所有非对称特征点的中心;将所述第一聚类子中心和所述第二聚类子中心的连线中点位置记为所述多个人脸特征点的聚类中心位置。从而提高获取聚类中心位置的效率。
如上述步骤S5所述,根据预设的证件类型获取方法,获取所述指定证件图片的指定证件类型,并从预设的数据库中调取标准证件图片,其中所述标准证件图片的类型为所述指定证件类型,所述标准证件图片上标有参考矩形和参考中心位置,所述标准证件图片中的证件图像填充满所述标准证件图片。其中所述参考矩形和参考中心位置分别与所述最小外接矩形和所述聚类中心位置对应,作为最终证件本体确定的依据。其中所述证件类型获取方法例如为:通过预设的文字识别技术,识别所述指定证件图片,从而得到文字文本;根据公式:
Figure BDA0002236218420000091
计算出所述文字文本与预存的参考文本的相似程度值Sim,其中P为所述文字文本的词频向量,K为所述参考文本的词频向量,Pi为所述文字文本中第i个单词出现的次数,Ki为所述参考文本中第i个单词出现的次数;判断所述相似程度值Sim是否大于预设的相似程度阈值;若所述相似程度值Sim大于预设的相似程度阈值,则根据预设的指定证件图片-文字文本-参考文本-证件类型的对应关系,获取与所述指定证件图片对应的指定证件类型。
如上述步骤S6所述,等比例缩放所述标准证件图片,以使所述参考矩形的面积与所述最小外接矩形的面积相等,从而得到缩放后图片。其中采用等比例缩放所述标准证件图片的方式,能够使所述标准证件图片的参考中心位置、参考矩形和证件图像的相对比例关系保持不变。再使所述参考矩形的面积与所述最小外接矩形的面积相等,得到缩放后图片,从而使缩放后图片相对于真实的证件图片的比例关系,与所述中间图片相对于真实的证件图片的比例关系相等。据此,再将所述缩放后图片和所述标准证件图片重叠,即可检测出证件本体。
如上述步骤S7所述,采用平移的方式使所述缩放后图片和所述标准证件图片重叠,以使所述缩放后图片中的参考中心位置与所述中间图片中的聚类中心位置重叠,从而获得所述中间图片中的重叠部分。其中采用平移的方式,目的在于防止比例关系再次变化,以影响后续的检测结果。由前述可知,缩放后图片相对于真实的证件图片的比例关系,与所述中间图片相对于真实的证件图片的比例关系相等。并且,所述标准证件图片中的证件图像填充满所述标准证件图片。因此所述中间图片中的重叠部分即为证件本体。
如上述步骤S8所述,将所述中间图片中的所述重叠部分记为所述指定证件图片的证件本体。进一步地,还可以执行切削操行,以去除所述中间图片中除所述证件本体之外的其他区域,从而免去了后续的图片处理操作中对所述其他区域的无意义处理,避免了算力浪费。
在一个实施方式中,所述根据预设的姿态纠正方法,将所述指定证件图片纠正为按预设的标准姿态放置,从而得到中间图片的步骤S2,包括:
S201、采用预设的图像边缘检测方法,检测出所述指定证件图片中的多个边缘,并从所述多个边缘中获取指定边缘对,其中所述指定边缘对由两条互相平行且相等的指定边缘线段所构成;
S202、判断所述指定边缘线段的长度是否满足:M=max(M1,M2,...,Mn),其中M为所述指定边缘线段的长度,M1,M2,...,Mn是所述多个边缘中的所有边缘线段的长度,所述多个边缘中共有n个边缘线段;
S203、若所述指定边缘线段的长度满足:M=max(M1,M2,...,Mn),则将所述指定证件图片以指定姿态的形式放置,从而得到第一图片,其中所述指定姿态指所述指定边缘对平行于预设的参照直线;
S204、将所述第一图片输入预设的图像姿态分类模型中进行计算,从而得到所述图像姿态分类模型输出的分类结果,其中所述分类结果包括所述标准姿态、相对于所述标准姿态逆时针旋转90度、相对于所述标准姿态逆时针旋转180度或相对于所述标准姿态逆时针旋转270度;
S205、判断所述分类结果是否为所述标准姿态;
S206、若所述分类结果不为所述标准姿态,则根据所述分类结果旋转所述第一图片,从而获取按预设的标准姿态放置的中间图片。
如上所述,实现了根据预设的姿态纠正方法,将所述指定证件图片纠正为按预设的标准姿态放置,从而得到中间图片。其中所述图像边缘检测方法例如对所述指定证件图片进行轮廓识别,从而得到轮廓,将轮廓线作为所述边缘。所述指定证件图片中最大的轮廓为矩形的证件图像,因此所述指定边缘对可能是所述证件图像的一对平行边,并且若所述指定边缘线段的长度满足:M=max(M1,M2,...,Mn),则可以确定所述指定边缘对是所述证件图像的最长的一对平行边,因此将所述指定证件图片以指定姿态的形式放置,从而得到第一图片,其中所述指定姿态指所述指定边缘对平行于预设的参照直线。再将所述第一图片输入预设的图像姿态分类模型中进行计算,从而得到所述图像姿态分类模型输出的分类结果,其中所述分类结果包括所述标准姿态、相对于所述标准姿态逆时针旋转90度、相对于所述标准姿态逆时针旋转180度或相对于所述标准姿态逆时针旋转270度;若所述分类结果不为所述标准姿态,则根据所述分类结果旋转所述第一图片,从而获取按预设的标准姿态放置的中间图片,从而使所述指定证件图片纠正为按预设的标准姿态放置。其中所述图像姿态分类模型可为任意可行模型,例如为神经网络模型、inception-v3(可译为开端模型-V3型)分类模型等。由于本申请识别出了指定边缘线段,并采用了图像姿态分类模型进行姿态识别,因此可以保证姿态纠正的准确性,保证获取的中间图片的确为标准姿态放置。
在一个实施方式中,所述图像姿态分类模型基于inception-v3分类模型训练而成,所述将所述第一图片输入预设的图像姿态分类模型中进行计算,从而得到所述图像姿态分类模型输出的分类结果,其中所述分类结果包括所述标准姿态、相对于所述标准姿态逆时针旋转90度、相对于所述标准姿态逆时针旋转180度或相对于所述标准姿态逆时针旋转270度的步骤S204之前,包括:
S2031、获取包括指定数量的训练样本的第一训练集,其中所述训练样本由预先设置为按标准姿态放置的证件图片构成;
S2032、将所述第一训练集中的所有证件图片逆时针旋转90度、逆时针旋转180度和逆时针旋转270度,从而对应得到第二训练集、第三训练集和第四训练集;
S2033、采用轮序训练的方式训练预设的inception-v3分类模型,从而得到所述图像姿态分类模型,其中所述轮序训练指在同一轮次训练时从第一训练集、第二训练集、第三训练集和第四训练集中各抽取相同数量的证件图片作为训练数据。
如上所述,实现了获取图像姿态分类模型。其中所述inception-v3分类模型是Inception系列分类模型中的一种,是一种深度神经网络模型,尤其适用于图像分类,是已成熟的分类模型,在此不再赘述。本申请采用构建第一训练集、第二训练集、第三训练集和第四训练集的方式,其中相邻训练集之间的图片的角度差为90,形成四个训练集,并且采用轮序训练的方式进行训练,可以保证均匀训练,以避免得到的图像姿态分类模型仅适用于特定姿态的分类,从而提高图像姿态分类模型的鲁棒性。
在一个实施方式中,所述人脸特征点检测模型基于神经网络模型训练而成,所述将所述中间图片输入到预设的人脸特征点检测模型中进行计算,得到所述人脸特征点检测模型输出的多个人脸特征点的步骤S3之前,包括:
S21、获取预先收集的样本数据,并将所述样本数据分成训练数据和测试数据;其中,所述样本数据仅由按标准姿态放置的证件图片和所述按标准姿态放置的证件图片中标注的人脸特征点构成;
S22、利用所述训练数据并采用随机梯度下降法训练预设的神经网络模型,从而得到暂时模型;
S23、采用所述测试数据验证所述暂时模型,并判断是否验证通过;
S24、若验证通过,则将所述暂时模型记为所述人脸特征点检测模型。
如上所述,实现了获取人脸特征点检测模型。本申请利用特殊的训练数据进行训练,所述特殊的训练数据为仅由按标准姿态放置的证件图片和所述按标准姿态放置的证件图片中标注的人脸特征点构成的数据。因为只采用了一种姿态的证件图片,其训练数据与训练效率都得到了改善,并且由前述可知所述中间图片是按标准姿态放置的,因此其识别结果的准确性仍然能够得到保证(因为训练得到的人脸特征点检测模型正好能识别按标准姿态放置的证件图片)。其中,神经网络模型例如为VGG-F模型、DPN131模型等。随机梯度下降法是随机取样一些训练数据,替代所有训练数据,从而更进一步地提高了训练效率。再验证所述暂时模型;若验证通过,则将所述暂时模型记为所述人脸特征点检测模型。从而在不降低识别准确度的前提下,提高了训练效率。
在一个实施方式中,所述采用预设的聚类算法,计算出所述多个人脸特征点的聚类中心位置的步骤S4,包括:
S401、根据预设的对称点分类方法,将所述多个人脸特征点划分为对称特征点和非对称特征点,其中所有的对称特征点均相对于同一个对称轴对称,并且所述对称轴与所述证件图像的一条边平行;
S402、采用预设的聚类算法,分别计算出第一聚类子中心和第二聚类子中心,其中所述第一聚类子中心是所有对称特征点的中心,所述第二聚类子中心是所有非对称特征点的中心;
S403、将所述第一聚类子中心和所述第二聚类子中心的连线中点位置记为所述多个人脸特征点的聚类中心位置。
如上所述,实现了采用预设的聚类算法,计算出所述多个人脸特征点的聚类中心位置。由于人脸是对称的,因此人脸特征点大多也是对称的。据此,根据预设的对称点分类方法,将所述多个人脸特征点划分为对称特征点和非对称特征点,其中所有的对称特征点均相对于同一个对称轴对称,并且所述对称轴与所述证件图像的一条边平行。其中所述对称轴实际上就是人脸的对称轴,即人的双眼、双鼻孔、嘴巴、耳朵的对称轴。其中所述聚类算法可为任意可行算法,例如为KNN聚类算法。由于将多个人脸特征点划分为两个类别,因此针对不同类别分别进行聚类计算,可以缩短计算时间。并且由于对称点的聚类计算,其最终的第一聚类子中心将位于对称轴上,因此更便于计算,进一步缩短了计算时间。再将所述第一聚类子中心和所述第二聚类子中心的连线中点位置记为所述多个人脸特征点的聚类中心位置。从而加快了计算速度。
在一个实施方式中,所述根据预设的证件类型获取方法,获取所述指定证件图片的指定证件类型,并从预设的数据库中调取标准证件图片,其中所述标准证件图片的类型为所述指定证件类型,所述标准证件图片上标有参考矩形和参考中心位置的步骤S5之前,包括:
S41、获取预先收集的按所述标准姿态放置的参考证件图片,所述参考证件图片的类型为所述指定证件类型;
S42、将所述参考证件图片输入到预设的人脸特征点检测模型中进行计算,得到所述人脸特征点检测模型输出的多个参考人脸特征点;
S43、采用预设的聚类算法,计算出所述多个参考人脸特征点的聚类中心位置,并标记为参考中心位置;
S44、生成所述多个参考人脸特征点的最小外接矩形,并标记为参考矩形,其中所述多个参考人脸特征点均在所述参考矩形的内部;
S45、将标有所述参考矩形和所述参考中心位置的所述参考证件图片记为所述标准证件图片。
如上所述,实现了获取标准证件图片。由于标准证件图片是用于与中间图片进行对比的,因此标准证件图片的获取方法需要尽量与所述中间图片相同。据此,获取预先收集的按所述标准姿态放置的参考证件图片,所述参考证件图片的类型为所述指定证件类型;将所述参考证件图片输入到预设的人脸特征点检测模型中进行计算,得到所述人脸特征点检测模型输出的多个参考人脸特征点;采用预设的聚类算法,计算出所述多个参考人脸特征点的聚类中心位置,并标记为参考中心位置;生成所述多个参考人脸特征点的最小外接矩形,并标记为参考矩形,其中所述多个参考人脸特征点均在所述参考矩形的内部。从而得到的标准证件图片能够用于与所述中间图片进行对比。由于获得的标准证件图片的类型、参考中心位置和参考矩形均与所述中间图片的类型、聚类中心位置和最小外接矩形分别对应,因此能够保证后续证件本体检测的准确性。
在一个实施方式中,所述根据预设的证件类型获取方法,获取所述指定证件图片的指定证件类型的步骤S5,包括:
S501、通过预设的文字识别技术,识别所述指定证件图片,从而得到文字文本;
S502、根据公式:
Figure BDA0002236218420000141
计算出所述文字文本与预存的多个参考文本的相似程度值Sim,其中P为所述文字文本的词频向量,K为所述参考文本的词频向量,Pi为所述文字文本中第i个单词出现的次数,Ki为所述参考文本中第i个单词出现的次数;
S503、获取指定参考文本,其中所述指定参考文本对应的相似程度值大于其他参考文本对应的相似程度值;
S504、根据预设的指定证件图片-文字文本-指定参考文本-证件类型的对应关系,获取与所述指定证件图片对应的指定证件类型。
如上所述,实现了根据预设的证件类型获取方法,获取所述指定证件图片的指定证件类型。不同类型的证件,其上面的制式文字也不同,例如驾驶证有驾驶字眼、身份证有身份证号字眼,而不同类型的证件,不可能具有完全相同的制式文字,因此可作为证件类型的判断依据。据此,本申请通过预设的文字识别技术,识别所述指定证件图片,从而得到文字文本;根据公式:
Figure BDA0002236218420000151
计算出所述文字文本与预存的多个参考文本的相似程度值Sim,其中P为所述文字文本的词频向量,K为所述参考文本的词频向量,Pi为所述文字文本中第i个单词出现的次数,Ki为所述参考文本中第i个单词出现的次数;获取指定参考文本,其中所述指定参考文本对应的相似程度值大于其他参考文本对应的相似程度值;根据预设的指定证件图片-文字文本-指定参考文本-证件类型的对应关系,获取与所述指定证件图片对应的指定证件类型。其中所述多个参考文本通过识别不同类型的空白证件而对应获得。其中,所述文字文本必然包括所有的制式文字,而特定类型的证件图片也包括相同的制式文字,反应在相似程度值Sim上,即所述指定参考文本(即相同类型的证件图片对应的参考文本)对应的相似程度值大于其他参考文本对应的相似程度值。其中,所述词频向量由单词出现次数作为分向量构成。由于基于词频向量的相似程度计算方法不需要调用词向量库以获取以应的词向量,因此计算速度得到了提高,从而能够快速获取所述指定证件类型。
本申请的数据检测方法,获取包括人脸头像的指定证件图片;将所述指定证件图片纠正为按预设的标准姿态放置,从而得到中间图片;将所述中间图片输入到预设的人脸特征点检测模型中进行计算,得到多个人脸特征点;计算出所述多个人脸特征点的聚类中心位置,并生成所述多个人脸特征点的最小外接矩形;获取所述指定证件图片的指定证件类型,并从预设的数据库中调取标准证件图片;等比例缩放所述标准证件图片,以使所述参考矩形的面积与所述最小外接矩形的面积相等,从而得到缩放后图片;采用平移的方式使所述缩放后图片和所述标准证件图片重叠,以使所述缩放后图片中的参考中心位置与所述中间图片中的聚类中心位置重叠,从而获得所述中间图片中的重叠部分;将所述中间图片中的所述重叠部分记为所述指定证件图片的证件本体。从而提高了数据检测准确性。
参照图2,本申请实施例提供一种数据检测装置,包括:
指定证件图片获取单元10,用于获取包括人脸头像的指定证件图片,其中所述指定证件图片中的证件图像呈矩形状;
姿态纠正单元20,用于根据预设的姿态纠正方法,将所述指定证件图片纠正为按预设的标准姿态放置,从而得到中间图片;
人脸特征点获取单元30,用于将所述中间图片输入到预设的人脸特征点检测模型中进行计算,得到所述人脸特征点检测模型输出的多个人脸特征点;
聚类中心位置计算单元40,用于采用预设的聚类算法,计算出所述多个人脸特征点的聚类中心位置,并生成所述多个人脸特征点的最小外接矩形,其中所述多个人脸特征点均在所述最小外接矩形的内部;
标准证件图片调取单元50,用于根据预设的证件类型获取方法,获取所述指定证件图片的指定证件类型,并从预设的数据库中调取标准证件图片,其中所述标准证件图片的类型为所述指定证件类型,所述标准证件图片上标有参考矩形和参考中心位置,所述标准证件图片中的证件图像填充满所述标准证件图片;
缩放后图片获取单元60,用于等比例缩放所述标准证件图片,以使所述参考矩形的面积与所述最小外接矩形的面积相等,从而得到缩放后图片;
重叠部分获取单元70,用于采用平移的方式使所述缩放后图片和所述标准证件图片重叠,以使所述缩放后图片中的参考中心位置与所述中间图片中的聚类中心位置重叠,从而获得所述中间图片中的重叠部分;
证件本体标记单元80,用于将所述中间图片中的所述重叠部分记为所述指定证件图片的证件本体。
其中上述单元分别用于执行的操作与前述实施方式的数据检测方法的步骤一一对应,在此不再赘述。
在一个实施方式中,所述姿态纠正单元20,包括:
边缘检测子单元,用于采用预设的图像边缘检测方法,检测出所述指定证件图片中的多个边缘,并从所述多个边缘中获取指定边缘对,其中所述指定边缘对由两条互相平行且相等的指定边缘线段所构成;
指定边缘线段判断子单元,用于判断所述指定边缘线段的长度是否满足:M=max(M1,M2,...,Mn),其中M为所述指定边缘线段的长度,M1,M2,...,Mn是所述多个边缘中的所有边缘线段的长度,所述多个边缘中共有n个边缘线段;
第一图片放置子单元,用于若所述指定边缘线段的长度满足:M=max(M1,M2,...,Mn),则将所述指定证件图片以指定姿态的形式放置,从而得到第一图片,其中所述指定姿态指所述指定边缘对平行于预设的参照直线;
分类结果获取子单元,用于将所述第一图片输入预设的图像姿态分类模型中进行计算,从而得到所述图像姿态分类模型输出的分类结果,其中所述分类结果包括所述标准姿态、相对于所述标准姿态逆时针旋转90度、相对于所述标准姿态逆时针旋转180度或相对于所述标准姿态逆时针旋转270度;
标准姿态判断子单元,用于判断所述分类结果是否为所述标准姿态;
第一图片旋转子单元,用于若所述分类结果不为所述标准姿态,则根据所述分类结果旋转所述第一图片,从而获取按预设的标准姿态放置的中间图片。
其中上述子单元分别用于执行的操作与前述实施方式的数据检测方法的步骤一一对应,在此不再赘述。
在一个实施方式中,所述图像姿态分类模型基于inception-v3分类模型训练而成,所述装置,包括:
第一训练集获取单元,用于获取包括指定数量的训练样本的第一训练集,其中所述训练样本由预先设置为按标准姿态放置的证件图片构成;
第一训练集旋转单元,用于将所述第一训练集中的所有证件图片逆时针旋转90度、逆时针旋转180度和逆时针旋转270度,从而对应得到第二训练集、第三训练集和第四训练集;
轮序训练单元,用于采用轮序训练的方式训练预设的inception-v3分类模型,从而得到所述图像姿态分类模型,其中所述轮序训练指在同一轮次训练时从第一训练集、第二训练集、第三训练集和第四训练集中各抽取相同数量的证件图片作为训练数据。
其中上述单元分别用于执行的操作与前述实施方式的数据检测方法的步骤一一对应,在此不再赘述。
在一个实施方式中,所述人脸特征点检测模型基于神经网络模型训练而成,所述装置,包括:
样本数据获取单元,用于获取预先收集的样本数据,并将所述样本数据分成训练数据和测试数据;其中,所述样本数据仅由按标准姿态放置的证件图片和所述按标准姿态放置的证件图片中标注的人脸特征点构成;
随机梯度下降训练单元,用于利用所述训练数据并采用随机梯度下降法训练预设的神经网络模型,从而得到暂时模型;
暂时模型验证单元,用于采用所述测试数据验证所述暂时模型,并判断是否验证通过;
人脸特征点检测模型标记单元,用于若验证通过,则将所述暂时模型记为所述人脸特征点检测模型。
其中上述单元分别用于执行的操作与前述实施方式的数据检测方法的步骤一一对应,在此不再赘述。
在一个实施方式中,所述聚类中心位置计算单元40,包括:
特征点划分子单元,用于根据预设的对称点分类方法,将所述多个人脸特征点划分为对称特征点和非对称特征点,其中所有的对称特征点均相对于同一个对称轴对称,并且所述对称轴与所述证件图像的一条边平行;
聚类计算子单元,用于采用预设的聚类算法,分别计算出第一聚类子中心和第二聚类子中心,其中所述第一聚类子中心是所有对称特征点的中心,所述第二聚类子中心是所有非对称特征点的中心;
聚类中心位置获取子单元,用于将所述第一聚类子中心和所述第二聚类子中心的连线中点位置记为所述多个人脸特征点的聚类中心位置。
其中上述子单元分别用于执行的操作与前述实施方式的数据检测方法的步骤一一对应,在此不再赘述。
在一个实施方式中,所述装置,包括:
参考证件图片获取单元,用于获取预先收集的按所述标准姿态放置的参考证件图片,所述参考证件图片的类型为所述指定证件类型;
参考人脸特征点获取单元,用于将所述参考证件图片输入到预设的人脸特征点检测模型中进行计算,得到所述人脸特征点检测模型输出的多个参考人脸特征点;
参考中心位置获取单元,用于采用预设的聚类算法,计算出所述多个参考人脸特征点的聚类中心位置,并标记为参考中心位置;
参考矩形获取单元,用于生成所述多个参考人脸特征点的最小外接矩形,并标记为参考矩形,其中所述多个参考人脸特征点均在所述参考矩形的内部;
标准证件图片标记单元,用于将标有所述参考矩形和所述参考中心位置的所述参考证件图片记为所述标准证件图片。
其中上述单元分别用于执行的操作与前述实施方式的数据检测方法的步骤一一对应,在此不再赘述。
在一个实施方式中,所述标准证件图片调取单元50,包括:
指定证件图片识别子单元,用于通过预设的文字识别技术,识别所述指定证件图片,从而得到文字文本;
相似程度值Sim计算子单元,用于根据公式:
Figure BDA0002236218420000191
计算出所述文字文本与预存的多个参考文本的相似程度值Sim,其中P为所述文字文本的词频向量,K为所述参考文本的词频向量,Pi为所述文字文本中第i个单词出现的次数,Ki为所述参考文本中第i个单词出现的次数;
指定参考文本获取子单元,用于获取指定参考文本,其中所述指定参考文本对应的相似程度值大于其他参考文本对应的相似程度值;
指定证件类型获取子单元,用于根据预设的指定证件图片-文字文本-指定参考文本-证件类型的对应关系,获取与所述指定证件图片对应的指定证件类型。
其中上述子单元分别用于执行的操作与前述实施方式的数据检测方法的步骤一一对应,在此不再赘述。
本申请的数据检测装置,获取包括人脸头像的指定证件图片;将所述指定证件图片纠正为按预设的标准姿态放置,从而得到中间图片;将所述中间图片输入到预设的人脸特征点检测模型中进行计算,得到多个人脸特征点;计算出所述多个人脸特征点的聚类中心位置,并生成所述多个人脸特征点的最小外接矩形;获取所述指定证件图片的指定证件类型,并从预设的数据库中调取标准证件图片;等比例缩放所述标准证件图片,以使所述参考矩形的面积与所述最小外接矩形的面积相等,从而得到缩放后图片;采用平移的方式使所述缩放后图片和所述标准证件图片重叠,以使所述缩放后图片中的参考中心位置与所述中间图片中的聚类中心位置重叠,从而获得所述中间图片中的重叠部分;将所述中间图片中的所述重叠部分记为所述指定证件图片的证件本体。从而提高了数据检测准确性。
参照图3,本发明实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于存储数据检测方法所用数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种数据检测方法。
上述处理器执行上述数据检测方法,其中所述方法包括的步骤分别与执行前述实施方式的数据检测方法的步骤一一对应,在此不再赘述。
本领域技术人员可以理解,图中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定。
本申请的计算机设备,获取包括人脸头像的指定证件图片;将所述指定证件图片纠正为按预设的标准姿态放置,从而得到中间图片;将所述中间图片输入到预设的人脸特征点检测模型中进行计算,得到多个人脸特征点;计算出所述多个人脸特征点的聚类中心位置,并生成所述多个人脸特征点的最小外接矩形;获取所述指定证件图片的指定证件类型,并从预设的数据库中调取标准证件图片;等比例缩放所述标准证件图片,以使所述参考矩形的面积与所述最小外接矩形的面积相等,从而得到缩放后图片;采用平移的方式使所述缩放后图片和所述标准证件图片重叠,以使所述缩放后图片中的参考中心位置与所述中间图片中的聚类中心位置重叠,从而获得所述中间图片中的重叠部分;将所述中间图片中的所述重叠部分记为所述指定证件图片的证件本体。从而提高了数据检测准确性。
本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现数据检测方法,其中所述方法包括的步骤分别与执行前述实施方式的数据检测方法的步骤一一对应,在此不再赘述。
本申请的计算机可读存储介质,获取包括人脸头像的指定证件图片;将所述指定证件图片纠正为按预设的标准姿态放置,从而得到中间图片;将所述中间图片输入到预设的人脸特征点检测模型中进行计算,得到多个人脸特征点;计算出所述多个人脸特征点的聚类中心位置,并生成所述多个人脸特征点的最小外接矩形;获取所述指定证件图片的指定证件类型,并从预设的数据库中调取标准证件图片;等比例缩放所述标准证件图片,以使所述参考矩形的面积与所述最小外接矩形的面积相等,从而得到缩放后图片;采用平移的方式使所述缩放后图片和所述标准证件图片重叠,以使所述缩放后图片中的参考中心位置与所述中间图片中的聚类中心位置重叠,从而获得所述中间图片中的重叠部分;将所述中间图片中的所述重叠部分记为所述指定证件图片的证件本体。从而提高了数据检测准确性。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (10)

1.一种数据检测方法,其特征在于,包括:
获取包括人脸头像的指定证件图片,其中所述指定证件图片中的证件图像呈矩形状;
根据预设的姿态纠正方法,将所述指定证件图片纠正为按预设的标准姿态放置,从而得到中间图片;
将所述中间图片输入到预设的人脸特征点检测模型中进行计算,得到所述人脸特征点检测模型输出的多个人脸特征点;
采用预设的聚类算法,计算出所述多个人脸特征点的聚类中心位置,并生成所述多个人脸特征点的最小外接矩形,其中所述多个人脸特征点均在所述最小外接矩形的内部;
根据预设的证件类型获取方法,获取所述指定证件图片的指定证件类型,并从预设的数据库中调取标准证件图片,其中所述标准证件图片的类型为所述指定证件类型,所述标准证件图片上标有参考矩形和参考中心位置,所述标准证件图片中的证件图像填充满所述标准证件图片;
等比例缩放所述标准证件图片,以使所述参考矩形的面积与所述最小外接矩形的面积相等,从而得到缩放后图片;
采用平移的方式使所述缩放后图片和所述标准证件图片重叠,以使所述缩放后图片中的参考中心位置与所述中间图片中的聚类中心位置重叠,从而获得所述中间图片中的重叠部分;
将所述中间图片中的所述重叠部分记为所述指定证件图片的证件本体。
2.根据权利要求1所述的数据检测方法,其特征在于,所述根据预设的姿态纠正方法,将所述指定证件图片纠正为按预设的标准姿态放置,从而得到中间图片的步骤,包括:
采用预设的图像边缘检测方法,检测出所述指定证件图片中的多个边缘,并从所述多个边缘中获取指定边缘对,其中所述指定边缘对由两条互相平行且相等的指定边缘线段所构成;
判断所述指定边缘线段的长度是否满足:M=max(M1,M2,...,Mn),其中M为所述指定边缘线段的长度,M1,M2,...,Mn是所述多个边缘中的所有边缘线段的长度,所述多个边缘中共有n个边缘线段;
若所述指定边缘线段的长度满足:M=max(M1,M2,...,Mn),则将所述指定证件图片以指定姿态的形式放置,从而得到第一图片,其中所述指定姿态指所述指定边缘对平行于预设的参照直线;
将所述第一图片输入预设的图像姿态分类模型中进行计算,从而得到所述图像姿态分类模型输出的分类结果,其中所述分类结果包括所述标准姿态、相对于所述标准姿态逆时针旋转90度、相对于所述标准姿态逆时针旋转180度或相对于所述标准姿态逆时针旋转270度;
判断所述分类结果是否为所述标准姿态;
若所述分类结果不为所述标准姿态,则根据所述分类结果旋转所述第一图片,从而获取按预设的标准姿态放置的中间图片。
3.根据权利要求2所述的数据检测方法,其特征在于,所述图像姿态分类模型基于inception-v3分类模型训练而成,所述将所述第一图片输入预设的图像姿态分类模型中进行计算,从而得到所述图像姿态分类模型输出的分类结果,其中所述分类结果包括所述标准姿态、相对于所述标准姿态逆时针旋转90度、相对于所述标准姿态逆时针旋转180度或相对于所述标准姿态逆时针旋转270度的步骤S204之前,包括:
获取包括指定数量的训练样本的第一训练集,其中所述训练样本由预先设置为按标准姿态放置的证件图片构成;
将所述第一训练集中的所有证件图片逆时针旋转90度、逆时针旋转180度和逆时针旋转270度,从而对应得到第二训练集、第三训练集和第四训练集;
采用轮序训练的方式训练预设的inception-v3分类模型,从而得到所述图像姿态分类模型,其中所述轮序训练指在同一轮次训练时从第一训练集、第二训练集、第三训练集和第四训练集中各抽取相同数量的证件图片作为训练数据。
4.根据权利要求1所述的数据检测方法,其特征在于,所述人脸特征点检测模型基于神经网络模型训练而成,所述将所述中间图片输入到预设的人脸特征点检测模型中进行计算,得到所述人脸特征点检测模型输出的多个人脸特征点的步骤之前,包括:
获取预先收集的样本数据,并将所述样本数据分成训练数据和测试数据;其中,所述样本数据仅由按标准姿态放置的证件图片和所述按标准姿态放置的证件图片中标注的人脸特征点构成;
利用所述训练数据并采用随机梯度下降法训练预设的神经网络模型,从而得到暂时模型;
采用所述测试数据验证所述暂时模型,并判断是否验证通过;
若验证通过,则将所述暂时模型记为所述人脸特征点检测模型。
5.根据权利要求1所述的数据检测方法,其特征在于,所述采用预设的聚类算法,计算出所述多个人脸特征点的聚类中心位置的步骤,包括:
根据预设的对称点分类方法,将所述多个人脸特征点划分为对称特征点和非对称特征点,其中所有的对称特征点均相对于同一个对称轴对称,并且所述对称轴与所述证件图像的一条边平行;
采用预设的聚类算法,分别计算出第一聚类子中心和第二聚类子中心,其中所述第一聚类子中心是所有对称特征点的中心,所述第二聚类子中心是所有非对称特征点的中心;
将所述第一聚类子中心和所述第二聚类子中心的连线中点位置记为所述多个人脸特征点的聚类中心位置。
6.根据权利要求1所述的数据检测方法,其特征在于,所述根据预设的证件类型获取方法,获取所述指定证件图片的指定证件类型,并从预设的数据库中调取标准证件图片,其中所述标准证件图片的类型为所述指定证件类型,所述标准证件图片上标有参考矩形和参考中心位置的步骤之前,包括:
获取预先收集的按所述标准姿态放置的参考证件图片,所述参考证件图片的类型为所述指定证件类型;
将所述参考证件图片输入到预设的人脸特征点检测模型中进行计算,得到所述人脸特征点检测模型输出的多个参考人脸特征点;
采用预设的聚类算法,计算出所述多个参考人脸特征点的聚类中心位置,并标记为参考中心位置;
生成所述多个参考人脸特征点的最小外接矩形,并标记为参考矩形,其中所述多个参考人脸特征点均在所述参考矩形的内部;
将标有所述参考矩形和所述参考中心位置的所述参考证件图片记为所述标准证件图片。
7.根据权利要求1所述的数据检测方法,其特征在于,所述根据预设的证件类型获取方法,获取所述指定证件图片的指定证件类型的步骤,包括:
通过预设的文字识别技术,识别所述指定证件图片,从而得到文字文本;
根据公式:
Figure FDA0002236218410000041
计算出所述文字文本与预存的多个参考文本的相似程度值Sim,其中P为所述文字文本的词频向量,K为所述参考文本的词频向量,Pi为所述文字文本中第i个单词出现的次数,Ki为所述参考文本中第i个单词出现的次数;
获取指定参考文本,其中所述指定参考文本对应的相似程度值大于其他参考文本对应的相似程度值;
根据预设的指定证件图片-文字文本-指定参考文本-证件类型的对应关系,获取与所述指定证件图片对应的指定证件类型。
8.一种数据检测装置,其特征在于,包括:
指定证件图片获取单元,用于获取包括人脸头像的指定证件图片,其中所述指定证件图片中的证件图像呈矩形状;
姿态纠正单元,用于根据预设的姿态纠正方法,将所述指定证件图片纠正为按预设的标准姿态放置,从而得到中间图片;
人脸特征点获取单元,用于将所述中间图片输入到预设的人脸特征点检测模型中进行计算,得到所述人脸特征点检测模型输出的多个人脸特征点;
聚类中心位置计算单元,用于采用预设的聚类算法,计算出所述多个人脸特征点的聚类中心位置,并生成所述多个人脸特征点的最小外接矩形,其中所述多个人脸特征点均在所述最小外接矩形的内部;
标准证件图片调取单元,用于根据预设的证件类型获取方法,获取所述指定证件图片的指定证件类型,并从预设的数据库中调取标准证件图片,其中所述标准证件图片的类型为所述指定证件类型,所述标准证件图片上标有参考矩形和参考中心位置,所述标准证件图片中的证件图像填充满所述标准证件图片;
缩放后图片获取单元,用于等比例缩放所述标准证件图片,以使所述参考矩形的面积与所述最小外接矩形的面积相等,从而得到缩放后图片;
重叠部分获取单元,用于采用平移的方式使所述缩放后图片和所述标准证件图片重叠,以使所述缩放后图片中的参考中心位置与所述中间图片中的聚类中心位置重叠,从而获得所述中间图片中的重叠部分;
证件本体标记单元,用于将所述中间图片中的所述重叠部分记为所述指定证件图片的证件本体。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN201910984349.6A 2019-10-16 2019-10-16 数据检测方法、装置、计算机设备和存储介质 Active CN111104846B (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN201910984349.6A CN111104846B (zh) 2019-10-16 2019-10-16 数据检测方法、装置、计算机设备和存储介质
JP2021513443A JP7296452B2 (ja) 2019-10-16 2020-06-29 データ検出方法、装置、コンピュータ機器及び記憶媒体
US17/264,311 US11393248B2 (en) 2019-10-16 2020-06-29 Data detection method and device, computer equipment and storage medium
SG11202100447PA SG11202100447PA (en) 2019-10-16 2020-06-29 Data detection method and device, computer equipment and storage medium
PCT/CN2020/098819 WO2021073150A1 (zh) 2019-10-16 2020-06-29 数据检测方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910984349.6A CN111104846B (zh) 2019-10-16 2019-10-16 数据检测方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN111104846A true CN111104846A (zh) 2020-05-05
CN111104846B CN111104846B (zh) 2022-08-30

Family

ID=70421465

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910984349.6A Active CN111104846B (zh) 2019-10-16 2019-10-16 数据检测方法、装置、计算机设备和存储介质

Country Status (5)

Country Link
US (1) US11393248B2 (zh)
JP (1) JP7296452B2 (zh)
CN (1) CN111104846B (zh)
SG (1) SG11202100447PA (zh)
WO (1) WO2021073150A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021073150A1 (zh) * 2019-10-16 2021-04-22 平安科技(深圳)有限公司 数据检测方法、装置、计算机设备和存储介质

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118197609B (zh) * 2024-05-17 2024-07-05 大连百首企家科技有限公司 一种基于人脸表情分析的麻醉镇痛效果评估方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004077356A1 (ja) * 2003-02-28 2004-09-10 Fujitsu Limited 画像結合装置、画像結合方法
JP2009086834A (ja) * 2007-09-28 2009-04-23 Dainippon Printing Co Ltd 人物顔面画像についての両眼位置検出方法および検出装置
CN108304761A (zh) * 2017-09-25 2018-07-20 腾讯科技(深圳)有限公司 文本检测方法、装置、存储介质和计算机设备
CN109086739A (zh) * 2018-08-23 2018-12-25 成都睿码科技有限责任公司 一种无人脸数据训练的人脸识别方法和***
CN109492643A (zh) * 2018-10-11 2019-03-19 平安科技(深圳)有限公司 基于ocr的证件识别方法、装置、计算机设备及存储介质
CN109583325A (zh) * 2018-11-12 2019-04-05 平安科技(深圳)有限公司 人脸样本图片标注方法、装置、计算机设备及存储介质

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005229181A (ja) 2004-02-10 2005-08-25 Konica Minolta Photo Imaging Inc 画像処理方法
JP4645301B2 (ja) * 2005-05-20 2011-03-09 富士通株式会社 顔形状変化情報抽出装置、顔画像登録装置および顔画像認証装置
JP4093273B2 (ja) * 2006-03-13 2008-06-04 オムロン株式会社 特徴点検出装置、特徴点検出方法および特徴点検出プログラム
JP4837602B2 (ja) 2007-03-12 2011-12-14 富士フイルム株式会社 画像トリミング装置および方法並びにプログラム
JP4947018B2 (ja) * 2008-09-12 2012-06-06 大日本印刷株式会社 顔画像の自動トリミング装置
ES2962576T3 (es) * 2013-03-06 2024-03-19 Koninklijke Philips Nv Aparato para determinar la región de escaneo
US9674505B2 (en) * 2014-12-09 2017-06-06 Intel Corporation Disparity search range determination for images from an image sensor array
US10074041B2 (en) 2015-04-17 2018-09-11 Nec Corporation Fine-grained image classification by exploring bipartite-graph labels
KR101626880B1 (ko) * 2015-11-06 2016-06-02 (주)코드원시스템 비대면 실명확인 온라인 신분증 식별 및 인식 시스템 및 방법
JP6697356B2 (ja) * 2016-09-13 2020-05-20 Kddi株式会社 所定対象のうちの特定対象における状態を識別する装置、プログラム及び方法
US10331942B2 (en) * 2017-05-31 2019-06-25 Facebook, Inc. Face liveness detection
CN107633207B (zh) * 2017-08-17 2018-10-12 平安科技(深圳)有限公司 Au特征识别方法、装置及存储介质
CN107679446B (zh) * 2017-08-17 2019-03-15 平安科技(深圳)有限公司 人脸姿态检测方法、装置及存储介质
CN108009528B (zh) * 2017-12-26 2020-04-07 广州广电运通金融电子股份有限公司 基于Triplet Loss的人脸认证方法、装置、计算机设备和存储介质
JP6973258B2 (ja) * 2018-04-13 2021-11-24 オムロン株式会社 画像解析装置、方法およびプログラム
CN110163211B (zh) * 2018-09-06 2023-02-28 腾讯科技(深圳)有限公司 一种图像识别方法、装置和存储介质
CN109376684B (zh) * 2018-11-13 2021-04-06 广州市百果园信息技术有限公司 一种人脸关键点检测方法、装置、计算机设备和存储介质
CN111191655B (zh) * 2018-11-14 2024-04-16 佳能株式会社 对象识别方法和装置
CN111444744A (zh) * 2018-12-29 2020-07-24 北京市商汤科技开发有限公司 活体检测方法、装置以及存储介质
CN109934766B (zh) * 2019-03-06 2021-11-30 北京市商汤科技开发有限公司 一种图像处理方法及装置
CN110135268A (zh) * 2019-04-17 2019-08-16 深圳和而泰家居在线网络科技有限公司 人脸比对方法、装置、计算机设备和存储介质
CN110245612A (zh) * 2019-06-14 2019-09-17 百度在线网络技术(北京)有限公司 人脸图像的检测方法和装置
CN111104846B (zh) * 2019-10-16 2022-08-30 平安科技(深圳)有限公司 数据检测方法、装置、计算机设备和存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004077356A1 (ja) * 2003-02-28 2004-09-10 Fujitsu Limited 画像結合装置、画像結合方法
JP2009086834A (ja) * 2007-09-28 2009-04-23 Dainippon Printing Co Ltd 人物顔面画像についての両眼位置検出方法および検出装置
CN108304761A (zh) * 2017-09-25 2018-07-20 腾讯科技(深圳)有限公司 文本检测方法、装置、存储介质和计算机设备
CN109086739A (zh) * 2018-08-23 2018-12-25 成都睿码科技有限责任公司 一种无人脸数据训练的人脸识别方法和***
CN109492643A (zh) * 2018-10-11 2019-03-19 平安科技(深圳)有限公司 基于ocr的证件识别方法、装置、计算机设备及存储介质
CN109583325A (zh) * 2018-11-12 2019-04-05 平安科技(深圳)有限公司 人脸样本图片标注方法、装置、计算机设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张洲等: "一种快速的证件照片人脸检测方法", 《电子技术与软件工程》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021073150A1 (zh) * 2019-10-16 2021-04-22 平安科技(深圳)有限公司 数据检测方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
SG11202100447PA (en) 2021-05-28
JP2022514136A (ja) 2022-02-10
US11393248B2 (en) 2022-07-19
WO2021073150A1 (zh) 2021-04-22
US20220114833A1 (en) 2022-04-14
CN111104846B (zh) 2022-08-30
JP7296452B2 (ja) 2023-06-22

Similar Documents

Publication Publication Date Title
CN111191567B (zh) 身份数据处理方法、装置、计算机设备和存储介质
CN111191539B (zh) 证件真伪验证方法、装置、计算机设备和存储介质
WO2019238063A1 (zh) 文本检测分析方法、装置及设备
WO2021212659A1 (zh) 视频数据处理方法、装置、计算机设备及存储介质
WO2019232866A1 (zh) 人眼模型训练方法、人眼识别方法、装置、设备及介质
CN110619274A (zh) 基于***和签名的身份验证方法、装置和计算机设备
CN105095827B (zh) 人脸表情识别装置和方法
CN109492643A (zh) 基于ocr的证件识别方法、装置、计算机设备及存储介质
CN112232117A (zh) 一种人脸识别方法、装置及存储介质
CN107133608A (zh) 基于活体检测和人脸验证的身份认证***
CN108985232A (zh) 人脸图像比对方法、装置、计算机设备及存储介质
CN108763897A (zh) 身份合法性的校验方法、终端设备及介质
CN109670440B (zh) 大熊猫脸的识别方法及装置
CN111104846B (zh) 数据检测方法、装置、计算机设备和存储介质
CN109993021A (zh) 人脸正脸检测方法、装置及电子设备
CN111126376B (zh) 基于面部特征点检测的图片纠正方法、装置和计算机设备
CN113298158A (zh) 数据检测方法、装置、设备及存储介质
Martinez et al. Parameterization of a forgery handwritten signature verification system using SVM
CN113128341A (zh) 一种基于卷积神经网络的狗脸识别方法
CN114359553B (zh) 一种基于物联网的签章定位方法、***及存储介质
CN112766275B (zh) ***文字识别方法、装置、计算机设备和存储介质
CN114399729A (zh) 监控对象移动识别方法、***、终端及存储介质
CN106980818B (zh) 一种用于人脸图像的个性化预处理方法、***及其终端
Miroslav et al. Basic on-line handwritten signature features for personal biometric authentication
CN104299000A (zh) 基于局部片段分布特征的笔迹识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant