CN111104846A

CN111104846A - 数据检测方法、装置、计算机设备和存储介质

Info

Publication number: CN111104846A
Application number: CN201910984349.6A
Authority: CN
Inventors: 黄锦伦
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2019-10-16
Filing date: 2019-10-16
Publication date: 2020-05-05
Anticipated expiration: 2039-10-16
Also published as: SG11202100447PA; JP2022514136A; US11393248B2; WO2021073150A1; US20220114833A1; CN111104846B; JP7296452B2

Abstract

本申请揭示了一种数据检测方法、装置、计算机设备和存储介质，所述方法包括：获取包括人脸头像的指定证件图片；将所述指定证件图片纠正为按预设的标准姿态放置，从而得到中间图片；将中间图片输入到预设的人脸特征点检测模型中进行计算，得到多个人脸特征点；计算出多个人脸特征点的聚类中心位置，并生成所述多个人脸特征点的最小外接矩形；从预设的数据库中调取标准证件图片；等比例缩放标准证件图片，从而得到缩放后图片；使所述缩放后图片中的参考中心位置与所述中间图片中的聚类中心位置重叠，从而获得所述中间图片中的重叠部分；将所述重叠部分记为所述指定证件图片的证件本体。从而提高了数据检测准确性。

Description

数据检测方法、装置、计算机设备和存储介质

技术领域

本申请涉及到计算机领域，特别是涉及到一种数据检测方法、装置、计算机设备和存储介质。

背景技术

证件图片分析在当今社会的生产生活中非常普遍，例如在办理某业务时，需要拍摄证件图片并上传该证件图片。若能准确地检测出证件图片(由于一般的拍摄的证件图片，取景范围会大于证件主体，因此证件主体一般不会填充满整个证件图片)中的证件主体，能够提高后续的对于证件图片的分析。传统的证件本体检测方法，一般是通过基于像素点检测，以得到证件本体的坐标(例如矩阵证件本体的四个顶点坐标)，这种方式存在耗费计算资源多、并且对于模糊的证件的识别准确率低(由于证件模糊，其证件本体的边界不清晰，因此传统方法识别出的证件主体会有很大的偏差)的缺陷。

发明内容

本申请的主要目的为提供一种数据检测方法、装置、计算机设备和存储介质，旨在提高数据检测准确性。

为了实现上述发明目的，本申请提出一种数据检测方法，包括以下步骤：

获取包括人脸头像的指定证件图片，其中所述指定证件图片中的证件图像呈矩形状；

根据预设的姿态纠正方法，将所述指定证件图片纠正为按预设的标准姿态放置，从而得到中间图片；

将所述中间图片输入到预设的人脸特征点检测模型中进行计算，得到所述人脸特征点检测模型输出的多个人脸特征点；

采用预设的聚类算法，计算出所述多个人脸特征点的聚类中心位置，并生成所述多个人脸特征点的最小外接矩形，其中所述多个人脸特征点均在所述最小外接矩形的内部；

根据预设的证件类型获取方法，获取所述指定证件图片的指定证件类型，并从预设的数据库中调取标准证件图片，其中所述标准证件图片的类型为所述指定证件类型，所述标准证件图片上标有参考矩形和参考中心位置，所述标准证件图片中的证件图像填充满所述标准证件图片；

等比例缩放所述标准证件图片，以使所述参考矩形的面积与所述最小外接矩形的面积相等，从而得到缩放后图片；

采用平移的方式使所述缩放后图片和所述标准证件图片重叠，以使所述缩放后图片中的参考中心位置与所述中间图片中的聚类中心位置重叠，从而获得所述中间图片中的重叠部分；

将所述中间图片中的所述重叠部分记为所述指定证件图片的证件本体。

进一步地，所述根据预设的姿态纠正方法，将所述指定证件图片纠正为按预设的标准姿态放置，从而得到中间图片的步骤，包括：

采用预设的图像边缘检测方法，检测出所述指定证件图片中的多个边缘，并从所述多个边缘中获取指定边缘对，其中所述指定边缘对由两条互相平行且相等的指定边缘线段所构成；

判断所述指定边缘线段的长度是否满足：M＝max(M1,M2,...,Mn)，其中M为所述指定边缘线段的长度，M1,M2,...,Mn是所述多个边缘中的所有边缘线段的长度，所述多个边缘中共有n个边缘线段；

若所述指定边缘线段的长度满足：M＝max(M1,M2,...,Mn)，则将所述指定证件图片以指定姿态的形式放置，从而得到第一图片，其中所述指定姿态指所述指定边缘对平行于预设的参照直线；

将所述第一图片输入预设的图像姿态分类模型中进行计算，从而得到所述图像姿态分类模型输出的分类结果，其中所述分类结果包括所述标准姿态、相对于所述标准姿态逆时针旋转90度、相对于所述标准姿态逆时针旋转180度或相对于所述标准姿态逆时针旋转270度；

判断所述分类结果是否为所述标准姿态；

若所述分类结果不为所述标准姿态，则根据所述分类结果旋转所述第一图片，从而获取按预设的标准姿态放置的中间图片。

进一步地，所述图像姿态分类模型基于inception-v3分类模型训练而成，所述将所述第一图片输入预设的图像姿态分类模型中进行计算，从而得到所述图像姿态分类模型输出的分类结果，其中所述分类结果包括所述标准姿态、相对于所述标准姿态逆时针旋转90度、相对于所述标准姿态逆时针旋转180度或相对于所述标准姿态逆时针旋转270度的步骤S204之前，包括：

获取包括指定数量的训练样本的第一训练集，其中所述训练样本由预先设置为按标准姿态放置的证件图片构成；

将所述第一训练集中的所有证件图片逆时针旋转90度、逆时针旋转180度和逆时针旋转270度，从而对应得到第二训练集、第三训练集和第四训练集；

采用轮序训练的方式训练预设的inception-v3分类模型，从而得到所述图像姿态分类模型，其中所述轮序训练指在同一轮次训练时从第一训练集、第二训练集、第三训练集和第四训练集中各抽取相同数量的证件图片作为训练数据。

进一步地，所述人脸特征点检测模型基于神经网络模型训练而成，所述将所述中间图片输入到预设的人脸特征点检测模型中进行计算，得到所述人脸特征点检测模型输出的多个人脸特征点的步骤之前，包括：

获取预先收集的样本数据，并将所述样本数据分成训练数据和测试数据；其中，所述样本数据仅由按标准姿态放置的证件图片和所述按标准姿态放置的证件图片中标注的人脸特征点构成；

利用所述训练数据并采用随机梯度下降法训练预设的神经网络模型，从而得到暂时模型；

采用所述测试数据验证所述暂时模型，并判断是否验证通过；

若验证通过，则将所述暂时模型记为所述人脸特征点检测模型。

进一步地，所述采用预设的聚类算法，计算出所述多个人脸特征点的聚类中心位置的步骤,包括：

根据预设的对称点分类方法，将所述多个人脸特征点划分为对称特征点和非对称特征点，其中所有的对称特征点均相对于同一个对称轴对称，并且所述对称轴与所述证件图像的一条边平行；

采用预设的聚类算法，分别计算出第一聚类子中心和第二聚类子中心，其中所述第一聚类子中心是所有对称特征点的中心，所述第二聚类子中心是所有非对称特征点的中心；

将所述第一聚类子中心和所述第二聚类子中心的连线中点位置记为所述多个人脸特征点的聚类中心位置。

进一步地，所述根据预设的证件类型获取方法，获取所述指定证件图片的指定证件类型，并从预设的数据库中调取标准证件图片，其中所述标准证件图片的类型为所述指定证件类型，所述标准证件图片上标有参考矩形和参考中心位置的步骤之前，包括：

获取预先收集的按所述标准姿态放置的参考证件图片，所述参考证件图片的类型为所述指定证件类型；

将所述参考证件图片输入到预设的人脸特征点检测模型中进行计算，得到所述人脸特征点检测模型输出的多个参考人脸特征点；

采用预设的聚类算法，计算出所述多个参考人脸特征点的聚类中心位置，并标记为参考中心位置；

生成所述多个参考人脸特征点的最小外接矩形，并标记为参考矩形，其中所述多个参考人脸特征点均在所述参考矩形的内部；

将标有所述参考矩形和所述参考中心位置的所述参考证件图片记为所述标准证件图片。

进一步地，所述根据预设的证件类型获取方法，获取所述指定证件图片的指定证件类型的步骤，包括：

通过预设的文字识别技术，识别所述指定证件图片，从而得到文字文本；

根据公式：

计算出所述文字文本与预存的多个参考文本的相似程度值Sim，其中P为所述文字文本的词频向量，K为所述参考文本的词频向量，Pi为所述文字文本中第i个单词出现的次数，Ki为所述参考文本中第i个单词出现的次数；

获取指定参考文本，其中所述指定参考文本对应的相似程度值大于其他参考文本对应的相似程度值；

根据预设的指定证件图片-文字文本-指定参考文本-证件类型的对应关系，获取与所述指定证件图片对应的指定证件类型。

本申请提供一种数据检测装置，包括：

指定证件图片获取单元，用于获取包括人脸头像的指定证件图片，其中所述指定证件图片中的证件图像呈矩形状；

姿态纠正单元，用于根据预设的姿态纠正方法，将所述指定证件图片纠正为按预设的标准姿态放置，从而得到中间图片；

人脸特征点获取单元，用于将所述中间图片输入到预设的人脸特征点检测模型中进行计算，得到所述人脸特征点检测模型输出的多个人脸特征点；

聚类中心位置计算单元，用于采用预设的聚类算法，计算出所述多个人脸特征点的聚类中心位置，并生成所述多个人脸特征点的最小外接矩形，其中所述多个人脸特征点均在所述最小外接矩形的内部；

标准证件图片调取单元，用于根据预设的证件类型获取方法，获取所述指定证件图片的指定证件类型，并从预设的数据库中调取标准证件图片，其中所述标准证件图片的类型为所述指定证件类型，所述标准证件图片上标有参考矩形和参考中心位置，所述标准证件图片中的证件图像填充满所述标准证件图片；

缩放后图片获取单元，用于等比例缩放所述标准证件图片，以使所述参考矩形的面积与所述最小外接矩形的面积相等，从而得到缩放后图片；

重叠部分获取单元，用于采用平移的方式使所述缩放后图片和所述标准证件图片重叠，以使所述缩放后图片中的参考中心位置与所述中间图片中的聚类中心位置重叠，从而获得所述中间图片中的重叠部分；

证件本体标记单元，用于将所述中间图片中的所述重叠部分记为所述指定证件图片的证件本体。

本申请提供一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。

本申请提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。

本申请的数据检测方法、装置、计算机设备和存储介质，获取包括人脸头像的指定证件图片；将所述指定证件图片纠正为按预设的标准姿态放置，从而得到中间图片；将所述中间图片输入到预设的人脸特征点检测模型中进行计算，得到多个人脸特征点；计算出所述多个人脸特征点的聚类中心位置，并生成所述多个人脸特征点的最小外接矩形；获取所述指定证件图片的指定证件类型，并从预设的数据库中调取标准证件图片；等比例缩放所述标准证件图片，以使所述参考矩形的面积与所述最小外接矩形的面积相等，从而得到缩放后图片；采用平移的方式使所述缩放后图片和所述标准证件图片重叠，以使所述缩放后图片中的参考中心位置与所述中间图片中的聚类中心位置重叠，从而获得所述中间图片中的重叠部分；将所述中间图片中的所述重叠部分记为所述指定证件图片的证件本体。从而提高了数据检测准确性。

附图说明

图1为本申请一实施例的数据检测方法的流程示意图；

图2为本申请一实施例的数据检测装置的结构示意框图；

图3为本申请一实施例的计算机设备的结构示意框图。

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

参照图1，本申请实施例提供一种数据检测方法，包括以下步骤：

S1、获取包括人脸头像的指定证件图片，其中所述指定证件图片中的证件图像呈矩形状；

S2、根据预设的姿态纠正方法，将所述指定证件图片纠正为按预设的标准姿态放置，从而得到中间图片；

S3、将所述中间图片输入到预设的人脸特征点检测模型中进行计算，得到所述人脸特征点检测模型输出的多个人脸特征点；

S4、采用预设的聚类算法，计算出所述多个人脸特征点的聚类中心位置，并生成所述多个人脸特征点的最小外接矩形，其中所述多个人脸特征点均在所述最小外接矩形的内部；

S5、根据预设的证件类型获取方法，获取所述指定证件图片的指定证件类型，并从预设的数据库中调取标准证件图片，其中所述标准证件图片的类型为所述指定证件类型，所述标准证件图片上标有参考矩形和参考中心位置，所述标准证件图片中的证件图像填充满所述标准证件图片；

S6、等比例缩放所述标准证件图片，以使所述参考矩形的面积与所述最小外接矩形的面积相等，从而得到缩放后图片；

S7、采用平移的方式使所述缩放后图片和所述标准证件图片重叠，以使所述缩放后图片中的参考中心位置与所述中间图片中的聚类中心位置重叠，从而获得所述中间图片中的重叠部分；

S8、将所述中间图片中的所述重叠部分记为所述指定证件图片的证件本体。

如上述步骤S1所述，获取包括人脸头像的指定证件图片，其中所述指定证件图片中的证件图像呈矩形状。常用的证件图片基本上都包括人脸，而本申请的数据检测方法是基于人脸检测而实现的，因此可用于包括人脸的证件图片，适用性广泛。

如上述步骤S2所述，根据预设的姿态纠正方法，将所述指定证件图片纠正为按预设的标准姿态放置，从而得到中间图片。由于指定证件图片可能以任意姿势放置，若不将其调整为标准姿态放置，会对后续的计算带来不利影响。因此根据预设的姿态纠正方法，将所述指定证件图片纠正为按预设的标准姿态放置，从而得到中间图片。其中所述标准姿态可为任意形式放置的姿态，优选为最适于观看或处理的姿态(即展现于屏幕中时，所述中间图片正面朝向面对于屏幕的阅读者)。其中姿态纠正方法例如为：采用预设的图像边缘检测方法，检测出所述指定证件图片中的多个边缘，并从所述多个边缘中获取指定边缘对，其中所述指定边缘对由两条互相平行且相等的指定边缘线段所构成；判断所述指定边缘线段的长度是否满足：M＝max(M1,M2,...,Mn)，其中M为所述指定边缘线段的长度，M1,M2,...,Mn是所述多个边缘中的所有边缘线段的长度，所述多个边缘中共有n个边缘线段；若所述指定边缘线段的长度满足：M＝max(M1,M2,...,Mn)，则将所述指定证件图片以指定姿态的形式放置，从而得到第一图片，其中所述指定姿态指所述指定边缘对平行于预设的参照直线；将所述第一图片输入预设的图像姿态分类模型中进行计算，从而得到所述图像姿态分类模型输出的分类结果，其中所述分类结果包括所述标准姿态、相对于所述标准姿态逆时针旋转90度、相对于所述标准姿态逆时针旋转180度或相对于所述标准姿态逆时针旋转270度；判断所述分类结果是否为所述标准姿态；若所述分类结果不为所述标准姿态，则根据所述分类结果旋转所述第一图片，从而获取按预设的标准姿态放置的中间图片。

如上述步骤S3所述，将所述中间图片输入到预设的人脸特征点检测模型中进行计算，得到所述人脸特征点检测模型输出的多个人脸特征点。其中所述人脸特征点检测模型用于检测出人脸中的特殊位置，例如对称的瞳仁等。所述人脸特征点检测模型的获取方法例如为：获取预先收集的样本数据，并将所述样本数据分成训练数据和测试数据；其中，所述样本数据仅由按标准姿态放置的证件图片和所述按标准姿态放置的证件图片中标注的人脸特征点构成；利用所述训练数据并采用随机梯度下降法训练预设的神经网络模型，从而得到暂时模型；采用所述测试数据验证所述暂时模型，并判断是否验证通过；若验证通过，则将所述暂时模型记为所述人脸特征点检测模型。

如上述步骤S4所述，采用预设的聚类算法，计算出所述多个人脸特征点的聚类中心位置，并生成所述多个人脸特征点的最小外接矩形，其中所述多个人脸特征点均在所述最小外接矩形的内部。其中所述聚类算法可为任意可行算法，例如为knn聚类算法等。进一步地，所述计算出所述多个人脸特征点的聚类中心位置的方式例如为：根据预设的对称点分类方法，将所述多个人脸特征点划分为对称特征点和非对称特征点，其中所有的对称特征点均相对于同一个对称轴对称，并且所述对称轴与所述证件图像的一条边平行；采用预设的聚类算法，分别计算出第一聚类子中心和第二聚类子中心，其中所述第一聚类子中心是所有对称特征点的中心，所述第二聚类子中心是所有非对称特征点的中心；将所述第一聚类子中心和所述第二聚类子中心的连线中点位置记为所述多个人脸特征点的聚类中心位置。从而提高获取聚类中心位置的效率。

如上述步骤S5所述，根据预设的证件类型获取方法，获取所述指定证件图片的指定证件类型，并从预设的数据库中调取标准证件图片，其中所述标准证件图片的类型为所述指定证件类型，所述标准证件图片上标有参考矩形和参考中心位置，所述标准证件图片中的证件图像填充满所述标准证件图片。其中所述参考矩形和参考中心位置分别与所述最小外接矩形和所述聚类中心位置对应，作为最终证件本体确定的依据。其中所述证件类型获取方法例如为：通过预设的文字识别技术，识别所述指定证件图片，从而得到文字文本；根据公式：

计算出所述文字文本与预存的参考文本的相似程度值Sim，其中P为所述文字文本的词频向量，K为所述参考文本的词频向量，Pi为所述文字文本中第i个单词出现的次数，Ki为所述参考文本中第i个单词出现的次数；判断所述相似程度值Sim是否大于预设的相似程度阈值；若所述相似程度值Sim大于预设的相似程度阈值，则根据预设的指定证件图片-文字文本-参考文本-证件类型的对应关系，获取与所述指定证件图片对应的指定证件类型。

如上述步骤S6所述，等比例缩放所述标准证件图片，以使所述参考矩形的面积与所述最小外接矩形的面积相等，从而得到缩放后图片。其中采用等比例缩放所述标准证件图片的方式，能够使所述标准证件图片的参考中心位置、参考矩形和证件图像的相对比例关系保持不变。再使所述参考矩形的面积与所述最小外接矩形的面积相等，得到缩放后图片，从而使缩放后图片相对于真实的证件图片的比例关系，与所述中间图片相对于真实的证件图片的比例关系相等。据此，再将所述缩放后图片和所述标准证件图片重叠，即可检测出证件本体。

如上述步骤S7所述，采用平移的方式使所述缩放后图片和所述标准证件图片重叠，以使所述缩放后图片中的参考中心位置与所述中间图片中的聚类中心位置重叠，从而获得所述中间图片中的重叠部分。其中采用平移的方式，目的在于防止比例关系再次变化，以影响后续的检测结果。由前述可知，缩放后图片相对于真实的证件图片的比例关系，与所述中间图片相对于真实的证件图片的比例关系相等。并且，所述标准证件图片中的证件图像填充满所述标准证件图片。因此所述中间图片中的重叠部分即为证件本体。

如上述步骤S8所述，将所述中间图片中的所述重叠部分记为所述指定证件图片的证件本体。进一步地，还可以执行切削操行，以去除所述中间图片中除所述证件本体之外的其他区域，从而免去了后续的图片处理操作中对所述其他区域的无意义处理，避免了算力浪费。

在一个实施方式中，所述根据预设的姿态纠正方法，将所述指定证件图片纠正为按预设的标准姿态放置，从而得到中间图片的步骤S2，包括：

S201、采用预设的图像边缘检测方法，检测出所述指定证件图片中的多个边缘，并从所述多个边缘中获取指定边缘对，其中所述指定边缘对由两条互相平行且相等的指定边缘线段所构成；

S202、判断所述指定边缘线段的长度是否满足：M＝max(M1,M2,...,Mn)，其中M为所述指定边缘线段的长度，M1,M2,...,Mn是所述多个边缘中的所有边缘线段的长度，所述多个边缘中共有n个边缘线段；

S203、若所述指定边缘线段的长度满足：M＝max(M1,M2,...,Mn)，则将所述指定证件图片以指定姿态的形式放置，从而得到第一图片，其中所述指定姿态指所述指定边缘对平行于预设的参照直线；

S204、将所述第一图片输入预设的图像姿态分类模型中进行计算，从而得到所述图像姿态分类模型输出的分类结果，其中所述分类结果包括所述标准姿态、相对于所述标准姿态逆时针旋转90度、相对于所述标准姿态逆时针旋转180度或相对于所述标准姿态逆时针旋转270度；

S205、判断所述分类结果是否为所述标准姿态；

S206、若所述分类结果不为所述标准姿态，则根据所述分类结果旋转所述第一图片，从而获取按预设的标准姿态放置的中间图片。

如上所述，实现了根据预设的姿态纠正方法，将所述指定证件图片纠正为按预设的标准姿态放置，从而得到中间图片。其中所述图像边缘检测方法例如对所述指定证件图片进行轮廓识别，从而得到轮廓，将轮廓线作为所述边缘。所述指定证件图片中最大的轮廓为矩形的证件图像，因此所述指定边缘对可能是所述证件图像的一对平行边，并且若所述指定边缘线段的长度满足：M＝max(M1,M2,...,Mn)，则可以确定所述指定边缘对是所述证件图像的最长的一对平行边，因此将所述指定证件图片以指定姿态的形式放置，从而得到第一图片，其中所述指定姿态指所述指定边缘对平行于预设的参照直线。再将所述第一图片输入预设的图像姿态分类模型中进行计算，从而得到所述图像姿态分类模型输出的分类结果，其中所述分类结果包括所述标准姿态、相对于所述标准姿态逆时针旋转90度、相对于所述标准姿态逆时针旋转180度或相对于所述标准姿态逆时针旋转270度；若所述分类结果不为所述标准姿态，则根据所述分类结果旋转所述第一图片，从而获取按预设的标准姿态放置的中间图片，从而使所述指定证件图片纠正为按预设的标准姿态放置。其中所述图像姿态分类模型可为任意可行模型，例如为神经网络模型、inception-v3(可译为开端模型-V3型)分类模型等。由于本申请识别出了指定边缘线段，并采用了图像姿态分类模型进行姿态识别，因此可以保证姿态纠正的准确性，保证获取的中间图片的确为标准姿态放置。

在一个实施方式中，所述图像姿态分类模型基于inception-v3分类模型训练而成，所述将所述第一图片输入预设的图像姿态分类模型中进行计算，从而得到所述图像姿态分类模型输出的分类结果，其中所述分类结果包括所述标准姿态、相对于所述标准姿态逆时针旋转90度、相对于所述标准姿态逆时针旋转180度或相对于所述标准姿态逆时针旋转270度的步骤S204之前，包括：

S2031、获取包括指定数量的训练样本的第一训练集，其中所述训练样本由预先设置为按标准姿态放置的证件图片构成；

S2032、将所述第一训练集中的所有证件图片逆时针旋转90度、逆时针旋转180度和逆时针旋转270度，从而对应得到第二训练集、第三训练集和第四训练集；

S2033、采用轮序训练的方式训练预设的inception-v3分类模型，从而得到所述图像姿态分类模型，其中所述轮序训练指在同一轮次训练时从第一训练集、第二训练集、第三训练集和第四训练集中各抽取相同数量的证件图片作为训练数据。

如上所述，实现了获取图像姿态分类模型。其中所述inception-v3分类模型是Inception系列分类模型中的一种，是一种深度神经网络模型，尤其适用于图像分类，是已成熟的分类模型，在此不再赘述。本申请采用构建第一训练集、第二训练集、第三训练集和第四训练集的方式，其中相邻训练集之间的图片的角度差为90，形成四个训练集，并且采用轮序训练的方式进行训练，可以保证均匀训练，以避免得到的图像姿态分类模型仅适用于特定姿态的分类，从而提高图像姿态分类模型的鲁棒性。

在一个实施方式中，所述人脸特征点检测模型基于神经网络模型训练而成，所述将所述中间图片输入到预设的人脸特征点检测模型中进行计算，得到所述人脸特征点检测模型输出的多个人脸特征点的步骤S3之前，包括：

S21、获取预先收集的样本数据，并将所述样本数据分成训练数据和测试数据；其中，所述样本数据仅由按标准姿态放置的证件图片和所述按标准姿态放置的证件图片中标注的人脸特征点构成；

S22、利用所述训练数据并采用随机梯度下降法训练预设的神经网络模型，从而得到暂时模型；

S23、采用所述测试数据验证所述暂时模型，并判断是否验证通过；

S24、若验证通过，则将所述暂时模型记为所述人脸特征点检测模型。

如上所述，实现了获取人脸特征点检测模型。本申请利用特殊的训练数据进行训练,所述特殊的训练数据为仅由按标准姿态放置的证件图片和所述按标准姿态放置的证件图片中标注的人脸特征点构成的数据。因为只采用了一种姿态的证件图片，其训练数据与训练效率都得到了改善，并且由前述可知所述中间图片是按标准姿态放置的，因此其识别结果的准确性仍然能够得到保证(因为训练得到的人脸特征点检测模型正好能识别按标准姿态放置的证件图片)。其中，神经网络模型例如为VGG-F模型、DPN131模型等。随机梯度下降法是随机取样一些训练数据，替代所有训练数据，从而更进一步地提高了训练效率。再验证所述暂时模型；若验证通过，则将所述暂时模型记为所述人脸特征点检测模型。从而在不降低识别准确度的前提下，提高了训练效率。

在一个实施方式中，所述采用预设的聚类算法，计算出所述多个人脸特征点的聚类中心位置的步骤S4,包括：

S401、根据预设的对称点分类方法，将所述多个人脸特征点划分为对称特征点和非对称特征点，其中所有的对称特征点均相对于同一个对称轴对称，并且所述对称轴与所述证件图像的一条边平行；

S402、采用预设的聚类算法，分别计算出第一聚类子中心和第二聚类子中心，其中所述第一聚类子中心是所有对称特征点的中心，所述第二聚类子中心是所有非对称特征点的中心；

S403、将所述第一聚类子中心和所述第二聚类子中心的连线中点位置记为所述多个人脸特征点的聚类中心位置。

如上所述，实现了采用预设的聚类算法，计算出所述多个人脸特征点的聚类中心位置。由于人脸是对称的，因此人脸特征点大多也是对称的。据此，根据预设的对称点分类方法，将所述多个人脸特征点划分为对称特征点和非对称特征点，其中所有的对称特征点均相对于同一个对称轴对称，并且所述对称轴与所述证件图像的一条边平行。其中所述对称轴实际上就是人脸的对称轴，即人的双眼、双鼻孔、嘴巴、耳朵的对称轴。其中所述聚类算法可为任意可行算法，例如为KNN聚类算法。由于将多个人脸特征点划分为两个类别，因此针对不同类别分别进行聚类计算，可以缩短计算时间。并且由于对称点的聚类计算，其最终的第一聚类子中心将位于对称轴上，因此更便于计算，进一步缩短了计算时间。再将所述第一聚类子中心和所述第二聚类子中心的连线中点位置记为所述多个人脸特征点的聚类中心位置。从而加快了计算速度。

在一个实施方式中，所述根据预设的证件类型获取方法，获取所述指定证件图片的指定证件类型，并从预设的数据库中调取标准证件图片，其中所述标准证件图片的类型为所述指定证件类型，所述标准证件图片上标有参考矩形和参考中心位置的步骤S5之前，包括：

S41、获取预先收集的按所述标准姿态放置的参考证件图片，所述参考证件图片的类型为所述指定证件类型；

S42、将所述参考证件图片输入到预设的人脸特征点检测模型中进行计算，得到所述人脸特征点检测模型输出的多个参考人脸特征点；

S43、采用预设的聚类算法，计算出所述多个参考人脸特征点的聚类中心位置，并标记为参考中心位置；

S44、生成所述多个参考人脸特征点的最小外接矩形，并标记为参考矩形，其中所述多个参考人脸特征点均在所述参考矩形的内部；

S45、将标有所述参考矩形和所述参考中心位置的所述参考证件图片记为所述标准证件图片。

如上所述，实现了获取标准证件图片。由于标准证件图片是用于与中间图片进行对比的，因此标准证件图片的获取方法需要尽量与所述中间图片相同。据此，获取预先收集的按所述标准姿态放置的参考证件图片，所述参考证件图片的类型为所述指定证件类型；将所述参考证件图片输入到预设的人脸特征点检测模型中进行计算，得到所述人脸特征点检测模型输出的多个参考人脸特征点；采用预设的聚类算法，计算出所述多个参考人脸特征点的聚类中心位置，并标记为参考中心位置；生成所述多个参考人脸特征点的最小外接矩形，并标记为参考矩形，其中所述多个参考人脸特征点均在所述参考矩形的内部。从而得到的标准证件图片能够用于与所述中间图片进行对比。由于获得的标准证件图片的类型、参考中心位置和参考矩形均与所述中间图片的类型、聚类中心位置和最小外接矩形分别对应，因此能够保证后续证件本体检测的准确性。

在一个实施方式中，所述根据预设的证件类型获取方法，获取所述指定证件图片的指定证件类型的步骤S5，包括：

S501、通过预设的文字识别技术，识别所述指定证件图片，从而得到文字文本；

S502、根据公式：

S503、获取指定参考文本，其中所述指定参考文本对应的相似程度值大于其他参考文本对应的相似程度值；

S504、根据预设的指定证件图片-文字文本-指定参考文本-证件类型的对应关系，获取与所述指定证件图片对应的指定证件类型。

如上所述，实现了根据预设的证件类型获取方法，获取所述指定证件图片的指定证件类型。不同类型的证件，其上面的制式文字也不同，例如驾驶证有驾驶字眼、身份证有身份证号字眼，而不同类型的证件，不可能具有完全相同的制式文字，因此可作为证件类型的判断依据。据此，本申请通过预设的文字识别技术，识别所述指定证件图片，从而得到文字文本；根据公式：

计算出所述文字文本与预存的多个参考文本的相似程度值Sim，其中P为所述文字文本的词频向量，K为所述参考文本的词频向量，Pi为所述文字文本中第i个单词出现的次数，Ki为所述参考文本中第i个单词出现的次数；获取指定参考文本，其中所述指定参考文本对应的相似程度值大于其他参考文本对应的相似程度值；根据预设的指定证件图片-文字文本-指定参考文本-证件类型的对应关系，获取与所述指定证件图片对应的指定证件类型。其中所述多个参考文本通过识别不同类型的空白证件而对应获得。其中，所述文字文本必然包括所有的制式文字，而特定类型的证件图片也包括相同的制式文字，反应在相似程度值Sim上，即所述指定参考文本(即相同类型的证件图片对应的参考文本)对应的相似程度值大于其他参考文本对应的相似程度值。其中，所述词频向量由单词出现次数作为分向量构成。由于基于词频向量的相似程度计算方法不需要调用词向量库以获取以应的词向量，因此计算速度得到了提高，从而能够快速获取所述指定证件类型。

本申请的数据检测方法，获取包括人脸头像的指定证件图片；将所述指定证件图片纠正为按预设的标准姿态放置，从而得到中间图片；将所述中间图片输入到预设的人脸特征点检测模型中进行计算，得到多个人脸特征点；计算出所述多个人脸特征点的聚类中心位置，并生成所述多个人脸特征点的最小外接矩形；获取所述指定证件图片的指定证件类型，并从预设的数据库中调取标准证件图片；等比例缩放所述标准证件图片，以使所述参考矩形的面积与所述最小外接矩形的面积相等，从而得到缩放后图片；采用平移的方式使所述缩放后图片和所述标准证件图片重叠，以使所述缩放后图片中的参考中心位置与所述中间图片中的聚类中心位置重叠，从而获得所述中间图片中的重叠部分；将所述中间图片中的所述重叠部分记为所述指定证件图片的证件本体。从而提高了数据检测准确性。

参照图2，本申请实施例提供一种数据检测装置，包括：

指定证件图片获取单元10，用于获取包括人脸头像的指定证件图片，其中所述指定证件图片中的证件图像呈矩形状；

姿态纠正单元20，用于根据预设的姿态纠正方法，将所述指定证件图片纠正为按预设的标准姿态放置，从而得到中间图片；

人脸特征点获取单元30，用于将所述中间图片输入到预设的人脸特征点检测模型中进行计算，得到所述人脸特征点检测模型输出的多个人脸特征点；

聚类中心位置计算单元40，用于采用预设的聚类算法，计算出所述多个人脸特征点的聚类中心位置，并生成所述多个人脸特征点的最小外接矩形，其中所述多个人脸特征点均在所述最小外接矩形的内部；

标准证件图片调取单元50，用于根据预设的证件类型获取方法，获取所述指定证件图片的指定证件类型，并从预设的数据库中调取标准证件图片，其中所述标准证件图片的类型为所述指定证件类型，所述标准证件图片上标有参考矩形和参考中心位置，所述标准证件图片中的证件图像填充满所述标准证件图片；

缩放后图片获取单元60，用于等比例缩放所述标准证件图片，以使所述参考矩形的面积与所述最小外接矩形的面积相等，从而得到缩放后图片；

重叠部分获取单元70，用于采用平移的方式使所述缩放后图片和所述标准证件图片重叠，以使所述缩放后图片中的参考中心位置与所述中间图片中的聚类中心位置重叠，从而获得所述中间图片中的重叠部分；

证件本体标记单元80，用于将所述中间图片中的所述重叠部分记为所述指定证件图片的证件本体。

其中上述单元分别用于执行的操作与前述实施方式的数据检测方法的步骤一一对应,在此不再赘述。

在一个实施方式中，所述姿态纠正单元20，包括：

边缘检测子单元，用于采用预设的图像边缘检测方法，检测出所述指定证件图片中的多个边缘，并从所述多个边缘中获取指定边缘对，其中所述指定边缘对由两条互相平行且相等的指定边缘线段所构成；

指定边缘线段判断子单元，用于判断所述指定边缘线段的长度是否满足：M＝max(M1,M2,...,Mn)，其中M为所述指定边缘线段的长度，M1,M2,...,Mn是所述多个边缘中的所有边缘线段的长度，所述多个边缘中共有n个边缘线段；

第一图片放置子单元，用于若所述指定边缘线段的长度满足：M＝max(M1,M2,...,Mn)，则将所述指定证件图片以指定姿态的形式放置，从而得到第一图片，其中所述指定姿态指所述指定边缘对平行于预设的参照直线；

分类结果获取子单元，用于将所述第一图片输入预设的图像姿态分类模型中进行计算，从而得到所述图像姿态分类模型输出的分类结果，其中所述分类结果包括所述标准姿态、相对于所述标准姿态逆时针旋转90度、相对于所述标准姿态逆时针旋转180度或相对于所述标准姿态逆时针旋转270度；

标准姿态判断子单元，用于判断所述分类结果是否为所述标准姿态；

第一图片旋转子单元，用于若所述分类结果不为所述标准姿态，则根据所述分类结果旋转所述第一图片，从而获取按预设的标准姿态放置的中间图片。

其中上述子单元分别用于执行的操作与前述实施方式的数据检测方法的步骤一一对应,在此不再赘述。

在一个实施方式中，所述图像姿态分类模型基于inception-v3分类模型训练而成，所述装置，包括：

第一训练集获取单元，用于获取包括指定数量的训练样本的第一训练集，其中所述训练样本由预先设置为按标准姿态放置的证件图片构成；

第一训练集旋转单元，用于将所述第一训练集中的所有证件图片逆时针旋转90度、逆时针旋转180度和逆时针旋转270度，从而对应得到第二训练集、第三训练集和第四训练集；

轮序训练单元，用于采用轮序训练的方式训练预设的inception-v3分类模型，从而得到所述图像姿态分类模型，其中所述轮序训练指在同一轮次训练时从第一训练集、第二训练集、第三训练集和第四训练集中各抽取相同数量的证件图片作为训练数据。

在一个实施方式中，所述人脸特征点检测模型基于神经网络模型训练而成，所述装置，包括：

样本数据获取单元，用于获取预先收集的样本数据，并将所述样本数据分成训练数据和测试数据；其中，所述样本数据仅由按标准姿态放置的证件图片和所述按标准姿态放置的证件图片中标注的人脸特征点构成；

随机梯度下降训练单元，用于利用所述训练数据并采用随机梯度下降法训练预设的神经网络模型，从而得到暂时模型；

暂时模型验证单元，用于采用所述测试数据验证所述暂时模型，并判断是否验证通过；

人脸特征点检测模型标记单元，用于若验证通过，则将所述暂时模型记为所述人脸特征点检测模型。

在一个实施方式中，所述聚类中心位置计算单元40,包括：

特征点划分子单元，用于根据预设的对称点分类方法，将所述多个人脸特征点划分为对称特征点和非对称特征点，其中所有的对称特征点均相对于同一个对称轴对称，并且所述对称轴与所述证件图像的一条边平行；

聚类计算子单元，用于采用预设的聚类算法，分别计算出第一聚类子中心和第二聚类子中心，其中所述第一聚类子中心是所有对称特征点的中心，所述第二聚类子中心是所有非对称特征点的中心；

聚类中心位置获取子单元，用于将所述第一聚类子中心和所述第二聚类子中心的连线中点位置记为所述多个人脸特征点的聚类中心位置。

在一个实施方式中，所述装置，包括：

参考证件图片获取单元，用于获取预先收集的按所述标准姿态放置的参考证件图片，所述参考证件图片的类型为所述指定证件类型；

参考人脸特征点获取单元，用于将所述参考证件图片输入到预设的人脸特征点检测模型中进行计算，得到所述人脸特征点检测模型输出的多个参考人脸特征点；

参考中心位置获取单元，用于采用预设的聚类算法，计算出所述多个参考人脸特征点的聚类中心位置，并标记为参考中心位置；

参考矩形获取单元，用于生成所述多个参考人脸特征点的最小外接矩形，并标记为参考矩形，其中所述多个参考人脸特征点均在所述参考矩形的内部；

标准证件图片标记单元，用于将标有所述参考矩形和所述参考中心位置的所述参考证件图片记为所述标准证件图片。

在一个实施方式中，所述标准证件图片调取单元50，包括：

指定证件图片识别子单元，用于通过预设的文字识别技术，识别所述指定证件图片，从而得到文字文本；

相似程度值Sim计算子单元，用于根据公式：

指定参考文本获取子单元，用于获取指定参考文本，其中所述指定参考文本对应的相似程度值大于其他参考文本对应的相似程度值；

指定证件类型获取子单元，用于根据预设的指定证件图片-文字文本-指定参考文本-证件类型的对应关系，获取与所述指定证件图片对应的指定证件类型。

本申请的数据检测装置，获取包括人脸头像的指定证件图片；将所述指定证件图片纠正为按预设的标准姿态放置，从而得到中间图片；将所述中间图片输入到预设的人脸特征点检测模型中进行计算，得到多个人脸特征点；计算出所述多个人脸特征点的聚类中心位置，并生成所述多个人脸特征点的最小外接矩形；获取所述指定证件图片的指定证件类型，并从预设的数据库中调取标准证件图片；等比例缩放所述标准证件图片，以使所述参考矩形的面积与所述最小外接矩形的面积相等，从而得到缩放后图片；采用平移的方式使所述缩放后图片和所述标准证件图片重叠，以使所述缩放后图片中的参考中心位置与所述中间图片中的聚类中心位置重叠，从而获得所述中间图片中的重叠部分；将所述中间图片中的所述重叠部分记为所述指定证件图片的证件本体。从而提高了数据检测准确性。

参照图3，本发明实施例中还提供一种计算机设备，该计算机设备可以是服务器，其内部结构可以如图所示。该计算机设备包括通过***总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于存储数据检测方法所用数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种数据检测方法。

上述处理器执行上述数据检测方法，其中所述方法包括的步骤分别与执行前述实施方式的数据检测方法的步骤一一对应,在此不再赘述。

本领域技术人员可以理解，图中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定。

本申请的计算机设备，获取包括人脸头像的指定证件图片；将所述指定证件图片纠正为按预设的标准姿态放置，从而得到中间图片；将所述中间图片输入到预设的人脸特征点检测模型中进行计算，得到多个人脸特征点；计算出所述多个人脸特征点的聚类中心位置，并生成所述多个人脸特征点的最小外接矩形；获取所述指定证件图片的指定证件类型，并从预设的数据库中调取标准证件图片；等比例缩放所述标准证件图片，以使所述参考矩形的面积与所述最小外接矩形的面积相等，从而得到缩放后图片；采用平移的方式使所述缩放后图片和所述标准证件图片重叠，以使所述缩放后图片中的参考中心位置与所述中间图片中的聚类中心位置重叠，从而获得所述中间图片中的重叠部分；将所述中间图片中的所述重叠部分记为所述指定证件图片的证件本体。从而提高了数据检测准确性。

本申请一实施例还提供一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现数据检测方法，其中所述方法包括的步骤分别与执行前述实施方式的数据检测方法的步骤一一对应,在此不再赘述。

本申请的计算机可读存储介质，获取包括人脸头像的指定证件图片；将所述指定证件图片纠正为按预设的标准姿态放置，从而得到中间图片；将所述中间图片输入到预设的人脸特征点检测模型中进行计算，得到多个人脸特征点；计算出所述多个人脸特征点的聚类中心位置，并生成所述多个人脸特征点的最小外接矩形；获取所述指定证件图片的指定证件类型，并从预设的数据库中调取标准证件图片；等比例缩放所述标准证件图片，以使所述参考矩形的面积与所述最小外接矩形的面积相等，从而得到缩放后图片；采用平移的方式使所述缩放后图片和所述标准证件图片重叠，以使所述缩放后图片中的参考中心位置与所述中间图片中的聚类中心位置重叠，从而获得所述中间图片中的重叠部分；将所述中间图片中的所述重叠部分记为所述指定证件图片的证件本体。从而提高了数据检测准确性。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

以上所述仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

Claims

1.一种数据检测方法，其特征在于，包括：

2.根据权利要求1所述的数据检测方法，其特征在于，所述根据预设的姿态纠正方法，将所述指定证件图片纠正为按预设的标准姿态放置，从而得到中间图片的步骤，包括：

判断所述分类结果是否为所述标准姿态；

3.根据权利要求2所述的数据检测方法，其特征在于，所述图像姿态分类模型基于inception-v3分类模型训练而成，所述将所述第一图片输入预设的图像姿态分类模型中进行计算，从而得到所述图像姿态分类模型输出的分类结果，其中所述分类结果包括所述标准姿态、相对于所述标准姿态逆时针旋转90度、相对于所述标准姿态逆时针旋转180度或相对于所述标准姿态逆时针旋转270度的步骤S204之前，包括：

4.根据权利要求1所述的数据检测方法，其特征在于，所述人脸特征点检测模型基于神经网络模型训练而成，所述将所述中间图片输入到预设的人脸特征点检测模型中进行计算，得到所述人脸特征点检测模型输出的多个人脸特征点的步骤之前，包括：

5.根据权利要求1所述的数据检测方法，其特征在于，所述采用预设的聚类算法，计算出所述多个人脸特征点的聚类中心位置的步骤,包括：

6.根据权利要求1所述的数据检测方法，其特征在于，所述根据预设的证件类型获取方法，获取所述指定证件图片的指定证件类型，并从预设的数据库中调取标准证件图片，其中所述标准证件图片的类型为所述指定证件类型，所述标准证件图片上标有参考矩形和参考中心位置的步骤之前，包括：

7.根据权利要求1所述的数据检测方法，其特征在于，所述根据预设的证件类型获取方法，获取所述指定证件图片的指定证件类型的步骤，包括：

根据公式：

8.一种数据检测装置，其特征在于，包括：

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。