CN112307937A

CN112307937A - 一种基于深度学习的身份证质检方法及***

Info

Publication number: CN112307937A
Application number: CN202011171318.8A
Authority: CN
Inventors: 范轲; 张磊; 林康; 谭则涛; 张汉林; 柯学
Original assignee: Gf Securities Co ltd
Current assignee: Gf Securities Co ltd
Priority date: 2020-10-28
Filing date: 2020-10-28
Publication date: 2021-02-02

Abstract

本发明提供一种基于深度学习的身份证质检方法及***，所述方法包括：获取包含身份证图像及背景图像的第一图像；对第一图像进行预处理，得到仅包含身份证图像的第二图像；将第二图像输入设定的反光质检模型进行反光质检，得到第三图像；将第三图像输入设定的模糊质检模型进行模糊质检，得到第四图像；其中，所述设定的模糊质检模型和反光质检模型均为根据SqueezeNet的基本结构得到。本发明解决传统图像处理技术对身份证质检时需调整多个指标阈值，难以在正负样本召回指标上达成均衡；以及用亮度、梯度、色偏来分离反光与非反光区域的传统图像处理方法，无法区分身份证关键区域(文字、头像)与非关键区域反光和无法识别类似反光的长城水印无法识别的问题。

Description

一种基于深度学习的身份证质检方法及***

技术领域

本发明涉及图像处理技术领域，特别是涉及一种基于深度学习的身份证质检方法及***。

背景技术

随着互联网金融发展，一方面证券投资群体不断扩大，证券公司中开户的数量出现明显增长；另一方面，非现场业务的扩大，客户很多情况无需再到证券营业部办理业务，可直接通过移动端或网站进行业务办理，网上开户就是一个典型的场景。在网上开户业务办理过程中，客户需提交身份证、开户声明视频等材料，证券公司需判断客户提交的身份证、视频等资料其质量是否合格，如证件是否反光、模糊、被遮挡，缺角、缺边，图像、视频是否存在反光、模糊、遮挡以及开户声明不符合要求等问题，审核通过后方可办理开户，不通过则需驳回材料重新提交。

目前证券公司多采用人工方式进行审核，具有较大的工作量，往往导致审核响应过慢；而审核响应过慢或过多的驳回，会导致客户开户意愿减弱，以致客户流失。如何提升开户审核的质量、效率、响应速度，成为提高开户成功率的关键。

针对身份证图片反光、模糊检测问题，传统图像处理技术对身份证质检时需调整多个指标阈值，难以在正负样本召回指标上达成均衡；此外，传统的图像处理技术更多用亮度、梯度、色偏等技术指标对图像质量进行评估，但因审核标准较难用上述指标量化，且身份证质检反光的定义为位于关键区域文字导致身份信息识别不清的情况下才能将图像判断为反光图像，不影响文字识别的图像一律判断为正常图像，除此之外二代身份证正面长城水印导致文字识别失败不能被判断为反光，因此用亮度来分离反光与非反光区域等传统图像处理方法在此条件下已不适用。

发明内容

本发明提供一种基于深度学习的身份证质检方法及***，解决传统图像处理技术对身份证质检时需调整多个指标阈值，难以在正负样本召回指标上达成均衡；以及用亮度、梯度、色偏来分离反光与非反光区域的传统图像处理方法，无法区分身份证关键区域，如文字、头像等与非关键区域反光和无法识别类似反光的长城水印无法识别的问题。

本发明一个实施例提供一种基于深度学习的身份证质检方法，包括：

获取第一图像；其中，所述第一图像包含身份证图像及背景图像；

对所述第一图像进行预处理，得到第二图像；其中，所述第二图像仅包含身份证图像；

将所述第二图像输入设定的反光质检模型进行反光质检，得到第三图像；其中，所述设定的反光质检模型为根据SqueezeNet的基本结构得到；

将所述第三图像输入设定的模糊质检模型进行模糊质检，得到第四图像；其中，所述设定的模糊质检模型为根据SqueezeNet的基本结构得到。

进一步地，所述设定的反光质检模型为根据SqueezeNet的基本结构得到，包括：

将标记为反光审核通过的身份证图像和标记为反光审核未通过的身份证图像分别作为反光正样本数据和反光负样本数据输入至反光质检模型；其中，所述反光正样本数据的数量和所述反光负样本数据的数量相同；

基于caffe深度学习框架根据所述反光正样本数据和反光负样本数据进行反光质检模型的训练。

进一步地，所述设定的模糊质检模型为根据SqueezeNet的基本结构得到，包括：

将标记为模糊审核通过的身份证图像和标记为模糊审核未通过的身份证图像分别作为模糊正样本数据和模糊负样本数据输入至模糊质检模型；其中，所述模糊正样本数据的数量和所述模糊负样本数据的数量相同；

基于caffe深度学习框架根据所述模糊正样本数据和模糊负样本数据进行模糊质检模型的训练。

进一步地，所述SqueezeNet的基本结构，包括：

将3*3卷积核更改为3*3-2空洞卷积核以增加特征信息数量；

将最后一个普通的最大池化层更改为空间金字塔池化结构层以合并末尾数层中不同尺度的特征信息；

连接最前与最后几层的特征图相连接，使得网络最后数层还能提供浅层的纹理细节特征，即文字笔画和边缘特征；

使用L1范数来约束权重，使得大部分权重变为0，提升模型使用速度；

对中部最大池化层的位置及卷积核个数进行调整，以使得最后连续数层卷积操作能保留更多特征信息。

进一步地，所述对所述第一图像进行预处理，得到第二图像，包括：

通过高斯模糊算法对所述第一图像进行处理，得到第一特征图像；

对所述第一特征图像进行灰度化及二值化处理，得到第二特征图像；

通过Isotropic Sobel算子处理所述第二特征图像，以分离身份证图像及背景图像，得到第二图像。

本发明一个实施例提供一种基于深度学习的身份证质检***，包括：

第一图像获取模块，用于获取第一图像；其中，所述第一图像包含身份证图像及背景图像；

第一图像预处理模块，用于对所述第一图像进行预处理，得到第二图像；其中，所述第二图像仅包含身份证图像；

反光质检模块，用于将所述第二图像输入设定的反光质检模型进行反光质检，得到第三图像；其中，所述设定的第一模型为根据SqueezeNet的基本结构得到；

模糊质检模块，用于将所述第三图像输入设定的模糊质检模型进行模糊质检，得到第四图像；其中，所述设定的模糊质检模型为根据SqueezeNet的基本结构得到。

进一步地，所述反光质检模块，包括：

反光样本输入模块，用于将标记为反光审核通过的身份证图像和标记为反光审核未通过的身份证图像分别作为反光正样本数据和反光负样本数据输入至反光质检模型；其中，所述反光正样本数据的数量和所述反光负样本数据的数量相同；

反光质检模型训练模块，用于基于caffe深度学习框架根据所述反光正样本数据和反光负样本数据进行反光质检模型的训练。

进一步地，所述模糊质检模块，包括：

模糊样本输入模块，用于将标记为模糊审核通过的身份证图像和标记为模糊审核未通过的身份证图像分别作为模糊正样本数据和模糊负样本数据输入至模糊质检模型；其中，所述模糊正样本数据的数量和所述模糊负样本数据的数量相同；

模糊质检模型训练模块，用于基于caffe深度学习框架根据所述模糊正样本数据和模糊负样本数据进行模糊质检模型的训练。

进一步地，所述第一图像预处理模块，包括：

高斯模糊算法处理子模块，用于通过高斯模糊算法对所述第一图像进行处理，得到第一特征图像；

灰度化及二值化处理子模块，用于对所述第一特征图像进行灰度化及二值化处理，得到第二特征图像；

分离图像子模块，用于通过Isotropic Sobel算子处理所述第二特征图像，以分离身份证图像及背景图像，得到第二图像。

本发明一实施例提供一种计算机可读存储介质，所述计算机可读存储介质包括存储的计算机程序，其中，在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行任意一项所述的基于深度学习的身份证质检方法。

与现有技术相比，本发明实施例的有益效果在于：

本发明一个实施例提供一种基于深度学习的身份证质检方法及***，所述方法包括：获取第一图像；其中，所述第一图像包含身份证图像及背景图像；对所述第一图像进行预处理，得到第二图像；其中，所述第二图像仅包含身份证图像；将所述第二图像输入设定的反光质检模型进行反光质检，得到第三图像；其中，所述设定的反光质检模型为根据SqueezeNet的基本结构得到；将所述第三图像输入设定的模糊质检模型进行模糊质检，得到第四图像；其中，所述设定的模糊质检模型为根据SqueezeNet的基本结构得到。本发明解决传统图像处理技术对身份证质检时需调整多个指标阈值，难以在正负样本召回指标上达成均衡；以及用亮度、梯度、色偏来分离反光与非反光区域的传统图像处理方法，无法区分身份证关键区域(文字、头像)与非关键区域反光和无法识别类似反光的长城水印无法识别的问题。

附图说明

为了更清楚地说明本发明的技术方案，下面将对实施方式中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明第一实施例提供的一种基于深度学习的身份证质检方法的流程图；

图2是本发明第二实施例提供的一种基于深度学习的身份证质检方法的流程图；

图3是本发明第三实施例提供的一种基于深度学习的身份证质检方法的流程图；

图4是本发明第四实施例提供的一种基于深度学习的身份证质检方法的流程图；

图5是本发明第五实施例提供的一种基于深度学习的身份证质检方法的流程图；

图6是本发明某一实施例提供提供的SqueezeNet的结构示意图；

图7是本发明某一实施例提供的空间金字塔池化的结构示意图；

图8是本发明第一实施例提供的一种基于深度学习的身份证质检***的装置图；

图9是本发明第二实施例提供的一种基于深度学习的身份证质检***的装置图；

图10是本发明第三实施例提供的一种基于深度学习的身份证质检***的装置图；

图11是本发明第四实施例提供的一种基于深度学习的身份证质检***的装置图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

应当理解，文中所使用的步骤编号仅是为了方便描述，不对作为对步骤执行先后顺序的限定。

应当理解，在本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。

术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

本专利提出了一种基于深度学习的证券开户身份证质检方法，运用计算机快速判断身份证图像是否反光、模糊等以反馈图像不合格信息，将正常图像供给身份证质检、公安校验、身份证图像存档等开户步骤，使开户业务复杂度降低且处理效率提高，减少开户流失率。

传统的图像处理技术都已经发展的很成熟了，针对上述身份证图片反光、模糊检测问题，传统的图像处理技术更多用亮度、梯度、色偏等技术指标对图像质量进行评估，但因审核标准较难用上述指标量化，且身份证质检反光的定义为位于关键区域文字导致身份信息识别不清的情况下才能将图像判断为反光图像，不影响文字识别的图像一律判断为正常图像，除此之外二代身份证正面长城水印导致文字识别失败不能被判断为反光，因此用亮度来分离反光与非反光区域等传统图像处理方法在此条件下已不适用。

基于计算机的统计学习方法、传统的机器学习技术早已在生活实践中有了广泛应用，近些年随着数据的积累和硬件性能的突破，深度学习开始表现出比传统机器学习算法更佳的效果，引领着人们再次开始了对深度学习及其应用的研究，又随着算法方面的不断发展创新，深度学习在越来越多的领域中得以应用，尤以图像处理、语音识别、NLP最为突出。通用图像检测、分类、OCR、人脸识别效果最好的模型大都是基于深度学习训练得出的；VGGNet、长短期记忆模型、前馈型序列记忆网络、双向循环神经网络等深度学习网络常常用于智能家居、移动端语音命令、内容监管上，极大地提升了产品性能。深度学习在图像领域的成功应用使我们看到通过深度学习技术实现开户材料智能审核的可能。

一方面人工审核方式，具有较大的工作量，往往导致审核响应过慢；而审核响应过慢或过多的驳回，会导致客户开户意愿减弱，以致客户流失；

另一方面，传统的图像处理技术多采用亮度、梯度、色偏等技术指标对图像质量进行评估，无法解决审核标准难以量化的问题；且用亮度来分离反光与非反光区域的传统图像处理方法，无法解决识别关键区域反光和类似反光的长城水印问题。

本发明提供了一种基于深度学习的证券开户身份证质检方法，运用计算机快速判断身份证图像是否反光、模糊以反馈图像不合格信息，将正常图像供给身份证质检、公安校验、身份证图像存档等开户步骤，使开户业务复杂度降低且处理效率提高，减少开户流失率。且后续通过对错分样本重新标注，并输入模型迭代学习，构建闭环，可以不断优化身份证质量检测模型效果，最终实现智能化替代重复人工的目标。

第一方面。

请参阅图1-4，本发明某一实施例提供的一种基于深度学习的身份证质检方法，包括：

S10、获取第一图像；其中，所述第一图像包含身份证图像及背景图像。

在某一具体的实施方式中，计算机获取第一图像，所述第一图像为用户通过拍摄装置拍摄的身份证照片，其中，所述身份证照片包括身份证图像及背景图像。

S20、对所述第一图像进行预处理，得到第二图像；其中，所述第二图像仅包含身份证图像。

请参阅图2，在某一具体实施例中，所述预处理包括：

S21、通过高斯模糊算法对所述第一图像进行处理，得到第一特征图像。

在某一具体实施方式中，高斯模糊，也叫高斯平滑，通常用它来减少图像噪声以及降低细节层次。这种模糊技术生成的图像，其视觉效果就像是经过一个半透明屏幕在观察图像，这与镜头焦外成像效果散景以及普通照明阴影中的效果都明显不同。通过高斯模糊算法对第一图像进行处理，得到模糊图像，即第一特征图像。

S22、对所述第一特征图像进行灰度化及二值化处理，得到第二特征图像。

在某一具体实施方式中，灰度是对图像亮度变化的一个量化，用于表示亮度的深浅，通常灰度量化为256个灰度级，即灰度的范围为0-255，该0-255的变化表示了亮度的从深到浅，对应图像中的颜色为从黑到白。图像的灰度范围还可以表示为0-1，0表示黑色，1表示白色，0-1之间的数值表示从深到浅的灰色。

在某一具体实施方式中，二值化就是让图像的像素点矩阵中的每个像素点的灰度值为0(黑色)或者255(白色)，也就是让整个图像呈现只有黑和白的效果。在灰度化的图像中灰度值的范围为0～255，在二值化后的图像中的灰度值范围是0或者255。

S23、通过Isotropic Sobel算子处理所述第二特征图像，以分离身份证图像及背景图像，得到第二图像。

在某一具体实施方式中，Isotropic Sobel算子主要用于边缘检测，在技术上它是以离散型的差分算子，用来运算图像亮度函数的梯度的近似值，Sobel算子是典型的基于一阶导数的边缘检测算子，由于该算子中引入了类似局部平均的运算，因此对噪声具有平滑作用，能很好的消除噪声的影响。

S30、将所述第二图像输入设定的反光质检模型进行反光质检，得到第三图像；其中，所述设定的反光质检模型为根据SqueezeNet的基本结构得到。

请参阅图3，在某一具体实施例中，步骤S30包括：

S31、将标记为反光审核通过的身份证图像和标记为反光审核未通过的身份证图像分别作为反光正样本数据和反光负样本数据输入至反光质检模型；其中，所述反光正样本数据的数量和所述反光负样本数据的数量相同。

S32基于caffe深度学习框架根据所述反光正样本数据和反光负样本数据进行反光质检模型的训练。

在某一具体实施例中，我们选择caffe深度学习框架进行模型的构建和训练。根据SqueezeNet论文中的SqueezeNet基本结构，于caffe中网络结构设定的prototxt文件中输入网络参数，于训练参数设定的prototxt文件中输入训练参数。最终调用训练文件和网络文件，训练最优模型(记为模型一)并获取参数信息。

模型初步结果提供了一定的分类准确性，但与业务上线目标仍有一定差距，且模型对正样本和负样本具有相近的分类准确率，而业务上线目标中，更看重正常样本的召回，因此进行如下优化。

S40、将所述第三图像输入设定的模糊质检模型进行模糊质检，得到第四图像；其中，所述设定的模糊质检模型为根据SqueezeNet的基本结构得到。

请参阅图4，在某一具体实施例中，步骤S40包括：

S41、将标记为模糊审核通过的身份证图像和标记为模糊审核未通过的身份证图像分别作为模糊正样本数据和模糊负样本数据输入至模糊质检模型；其中，所述模糊正样本数据的数量和所述模糊负样本数据的数量相同。

S42、基于caffe深度学习框架根据所述模糊正样本数据和模糊负样本数据进行模糊质检模型的训练。

在某一具体实施例中，所述SqueezeNet的基本结构，包括：

将3*3卷积核更改为3*3-2空洞卷积核以增加特征信息数量；

在某一具体实施例中，最初建立模型一时仅使用基本结构的SqueezeNet，只考虑到采用不同尺寸大小的卷积核且较深的网络层次以丰富特征，但对反光遮挡文字情况复杂、长城水印、识别速度未作充分的考虑，因而反光、模糊判断的准确率不高。所以我们决定调整网络结构改良模型一。具体包括：每个fire module中的一个3*3卷积核更改为3*3-2空洞卷积核以扩大感受野进而丰富特征信息；将最后一个普通的最大池化层更改为使用空间金字塔池化结构(SPP)，更好地合并末尾数层中不同尺度的特征信息；连接最前与最后几层的特征图相连接，使得网络最后数层还能提供浅层的纹理细节特征，即文字笔画和边缘特征；使用L1范数来约束权重，使得大部分权重变为0，提升模型使用速度；根据经验对中部最大池化层的位置及卷积核个数进行调整，更改为于conv1、fire3、fire5末尾使用最大池化层，使得最后连续数层卷积操作能保留更多特征信息。重新训练并验证模型效果。

模型结果相对最初版本有了较好提升，但仍未达到上线目标，经过对分类结果分析，发现虽然目前有真实的客户提交材料为样本，但由于样本量较大，并且是分批经过不同审核人员进行审核标注结果的，不同人员的图像审核标准、审核质量可能是存在差异的，因此考虑从样本方面进行优化。

本发明提供一种基于深度学习的身份证质检方法，解决识别身份证关键区域的文字反光和类似反光的长城水印无法识别的问题，提供较为准确的身份证质量检测模型，且后续通过对错分样本重新标注，并输入模型迭代学习，构建闭环，可以不断优化身份证质量检测模型效果，最终实现智能化替代重复人工的目标。

请参阅图5，本发明第一实施例提供的一种基于深度学习的身份证质检方法，包括：

身份证图片收集，该部分主要收集业务***中客户上传的身份证图片数据，关联对应的审核结果，区分为审核通过、反光、模糊三类。

在某一具体实施方式中，首先对历史开户审核记录进行分析，对于审核不通过记录，提取审核驳回原因并进行分类，然后随机抽样一定比例的审核通过记录用于后续反光、模糊质检模型训练，最后，分类整理相关身份证图片。

身份证图片预处理，该部分主要对身份证图片进行旋转、裁剪，去除因拍摄条件不通，导致的样本大小、背景等的不一致。

在某一具体实施方式中，因为客户拍摄身份证图片所使用的设备、拍摄方式、背景都各不相同，因此需要先对身份证图片的背景、大小等进行预先处理，主要是对原始身份证图片进行旋转、裁剪，输出统一的格式。

身份证图片标注，该部分首先基于历史审核结果对身份证图片进行标注，后续基于模型初步训练后的分类结果进行人工矫正。

在某一具体实施方式中，身份证图片是否合格没有清晰、严格的标准和规则，比如反光和模糊对文字识别的影响严重程度无法量化。虽然目前有真实样本及审核结果，但由于样本量大，并且是分批经过不同审核人员进行审核标注，不同人员的图像审核标准、审核质量可能是存在差异的。

为解决上述问题，在具体实施过程中，会首先基于历史审核结果对身份证图片进行标注，然后基于标注初步训练对应身份证反光、模糊质检模型，然后对模型分类结果与真实情况不一致的样本进行人工矫正。后续模型迭代过程中，可以根据模型效果跳转至该步进行再次核对标注。

身份证反光质检模型训练，该部分主要用于训练身份证反光质检模型，实现对身份证图片是否反光的判断，本质属于一个图片分类模型，模型结构基于SqueezeNet基本结构进行改良，使用审核通过和反光驳回样本进行训练，划分训练测试集进行训练和模型评估，最终输出指标满足预期的身份证反光质检模型。

在某一具体实施方式中，该部分主要用于训练身份证反光质检模型，实现对身份证图片是否反光的判断，本质属于一个图片分类模型，模型结构基于SqueezeNet基本结构进行改良，使用审核通过和反光驳回样本进行训练，划分训练测试集进行训练和模型评估，最终输出指标满足预期的身份证反光质检模型。

身份证图像反光判断的细节问题主要在于：

1、反光区域存在多种不确定的尺寸，网络需要引入不同尺度的感受野以获取反光异常；

2、由于身份证质检模型属于智能化开户业务中的一部分，需要对身份证图片进行实时检测，业务要求每张图像的反光判断应当在1S内，需要对网络结构进行压缩加速处理；

3、反光区域遮挡文字导致的对文字识别的影响界限是抽象的，不同反光的位置、大小、程度组合对文字识别影响不同，深度学习网络需要具备更高的层次融合能力；

4、身份证正面有类似于反光表现的长城水印，都具有高亮度影响文字识别的特性，网络需学习到长城水印的高层形态特征并区分水印和反光特征。

考虑上述问题，在具体实施过程中，我们首先基于SqueezeNet基本结构进行质检模型训练，对模型训练结果进行分析后，考虑用空洞卷积对SqueezeNet的fire module进行优化，空洞卷积是解决池化操作降低分辨率而丢失信息问题的一种卷积方法，它通过在卷积核元素间添加空洞(间隔)以扩大感受野，比如3*3的2-空洞卷积，原本size为3的卷积核在不改变参数量和计算量的情况下获得size为7(dilated rate为2)的感受野，此时可不再进行下采样。将SqueezeNet中的fire module中的一个3*3卷积替换为3*3-2空洞卷积能使得卷积层的感受野更丰富，拼接不同尺度的特征，更进一步丰富特征信息。

身份证模糊质检模型训练，该部分主要用于训练身份证模糊质检模型，实现对身份证图片是否模糊的判断，本质属于一个图片分类模型，模型结构基于SqueezeNet基本结构进行改良，使用审核通过和模糊驳回样本进行训练，划分训练测试集进行训练和模型评估，最终输出指标满足预期的身份证模糊质检模型。

在某一具体实施方式中，该部分主要用于训练身份证模糊质检模型，实现对身份证图片是否模糊的判断，本质属于一个图片分类模型，模型结构基于SqueezeNet基本结构进行改良，使用审核通过和模糊驳回样本进行训练，划分训练测试集进行训练和模型评估，最终输出指标满足预期的身份证模糊质检模型。

对于多标签的应用需求，有两种解决方案，第一种是训练多标签的深度学习网络；第二种是针对每个标签训练一个分类器，然后对多分类器的结果进行分数层或决策层的融合，得到最终的分类结果。

在实际项目中，我们采用了第二种方案，即针对光照、模糊分别训练网络，然后利用决策层融合的方法，得到分类结果。这样做的优点在于：

1)获取同一张身份证图像的光照、模糊标签会带来大量的标注工作。采用第二种方案可以节约大量的标注工作量。

2)随着业务的发展，我们计划添加更多的质检条目，例如关键文字信息是否遮挡，二代证是否是真实证件还是翻拍的图像。我们只要针对这些质检条目训练分类器，即可方便的扩展质检算法的功能。

身份证模糊模型训练的具体实施过程，及所使用的模型跟身份证反光模型训练相同。

身份证质检模型指标测试，该部分主要对模块4和模块5训练的身份证反光、模糊质检模型进行批量指标测试，判断模型是否达标，并可返回识别不一致结果给身份证图片标注模块进行人工校对。

在某一具体实施方式中，深度学习模型对图片进行分类，目前更多的是反应一个概率问题，不能做到百分之百的准确，不能像***功能开发那样去衡量，所以需提前涉及质检模型的落地方式并确定可以量化的验收标准。具体实时过程中通过如下两种方式验证：

1、对各类别抽样提取一批样本，进行总体指标评估；

2、对各类别确定边界样本，人工确定质检结果，对模型进行边界检测；

根据上述两种测试结果，判断模型是否达标，可选择调整身份证图片标注模块进行标注核对，或转至对应模型训练模块进行模型迭代训练。

在另一具体实施例中，本发明提出了一种基于深度学习的身份证质检模型，运用计算机快速判断身份证图像是否反光、模糊以反馈图像不合格信息，将正常图像供给身份证识别、公安校验、身份证图像存档等开户步骤，使开户业务复杂度降低且处理效率提高，减少开户流失率。

身份证质检模型的构造和难点

建立身份证质检模型的核心在于基于已有客户材料及审核结果，训练质检模型对客户网上开户时上传的身份证图像的质量进行判断。

这一核心有两大问题：一方面，身份证图像是否合格没有清晰、严格的标准和规则，比如反光和模糊对文字识别的影响严重程度无法量化，对此我们采用历史开户资料中审核人对材料是否合格的人工标注结果作为分类依据，运用神经网络自学习方法即深度学习对图像进行是否反光、模糊的分类。这又引发了另一方面的问题，虽然目前有真实的客户提交材料为样本，但由于样本量较大，并且是分批经过不同审核人员进行审核标注结果的，不同人员的图像审核标准、审核质量可能是存在差异的。对这一问题我们一方面根据实验结果不断优化算法，包括调参、引入相关处理方法或网络结构等，另一方面根据模型初步结果，对异常样本标签进行校正后再次训练模型，如此循环，最终达到评判标准的一致性。

技术理论

二代身份证质检的反光、模糊判断是一个非常具有挑战性的问题。考虑到用户可能在任意光照条件下进行身份证图像拍摄，以及二代身份证正面位于姓名与性别之间的长城水印拥有类似于反光的特性，用亮度来分离反光与非反光区域等传统图像处理方法在此条件下已不适用，且图片模糊同样存在标准无法量化的问题。于是，使用深度学习判断反光、模糊是一个更好的选择。二代身份证模糊判断与反光判断虽然是类似的，但在实际项目中，由于数据条件不具备和caffe不支持多标签这两个因素，我们最终采用了两个不同深度学习的网络分别训练光照、模糊分类。下面以反光模型为例进行介绍。

基于提取开户所需的客户身份资料的业务需求，模型对反光的定义为只有在遮盖关键区域文字导致身份信息识别不清的情况下才能将图像判断为反光图像，不影响文字识别的图像一律判断为正常图像，除此之外二代身份证正面长城水印导致文字识别失败不能被判断为反光。模糊图像定义为图像中全部或部分位置异常导致影响文字辨识的图像，轻度模糊而不影响文字识别的图像需判断为正常图片。

下面以反光模型为例，首先分析模型区别于普通证件图像识别的难点，再针对难点相应地选定深度学习的技术。

身份证图像反光判断的细节问题主要在于：

反光区域存在多种不确定的尺寸，网络需要引入不同尺度的感受野以获取反光异常。

由于身份证质检模型属于智能化开户业务中的一部分，业务要求每张图像的反光判断应当在100ms内，需要对网络结构进行压缩加速处理。

反光区域遮挡文字导致的对文字识别的影响界限是抽象的，不同反光的位置、大小、程度组合对文字识别影响不同，深度学习网络需要具备更高的层次融合能力。

身份证正面有类似于反光表现的长城水印，都具有高亮度影响文字识别的特性，网络需学习到长城水印的高层形态特征并区分水印和反光特征。

图像识别通常使用卷积神经网络(CNN)技术。神经网络(ANN)模型通常包括输入层、隐含层、输出层。而CNN的隐含层采用多层发挥不同作用的神经网络层，比如卷积层、激励层、池化层、全连接层等。卷积层使用卷积核对图像中的每一个特征进行局部提取，再对局部进行综合操作，最终获得全局信息，又尽可能地减少了参数的个数，类似于人眼视觉***将眼前画面整体摄入眼中反馈至大脑。激励层用于对卷积层的输出数据进行非线性变换。池化层进行下采样操作，将大量信息综合实现特征降维、压缩参数和数据的同时降低过拟合以提高模型的泛化能力，就像视觉***根据事物的远近不同及三维立体特征识别出整体画面中的一个个不同的独立个体。全连接层用于学习，根据上层的输出确定重要的分类特征及其概率，对结果特征进行识别分类，输出的分类结果和真实值比较再逆向返回以调整权重(卷积核上的参数)。

随着图像处理需求的增加，为了提高网络性能，网络层数被不断增加而导致网络结构复杂、参数较多，使得深度网络结构具有严重的效率问题，包括模型的存储问题和模型预测的速度问题。解决的办法分为轻量化模型、模型压缩两个方面。轻量化模型，即设计针对卷积方式的高效网络计算方式，达到减少网络参数的同时保持较好的网络性能的目的，比如SqueezeNet模型(来源于论文SqueezeNet:AlexNet-level accuracy with 50x fewerparameters and<0.5MB model size)。模型压缩方面，可以在训练好的模型上进行压缩，如L1剪枝约束权重等方法，使网络参数减少，从而解决存储问题和速度问题，或者将池化层等调优。

SqueezeNet区别于传统卷积神经网络卷积方式的关键在于它的普通卷积层用fire module替代，其中常规的fire module包含两层卷积层——squeeze层和expand层。squeeze层采用s1个1*1卷积核替代通常的3*3卷积核对上一层输出的特征映射进行卷积，且卷积核个数少于上一层特征映射数，达到降低特征的维数(压缩特征映射的通道数)的作用；expand层分别用e1个1*1和e3个3*3卷积核进行卷积，再把所得的特征映射依赖特征维数(通道数)进行连接，使得特征映射再融合、再表达，此时特征映射的分辨率是不变的，仅有特征映射维数发生了变化。每个fire module的3个超参数(卷积核个数)s1、e1、e3是逐渐增加的，且有4s1＝e1＝e3的关系，因此squeeze层还能对上一层网络减少输入通道数量。针对反光没有固定的形态和大小的问题，使用不同大小的卷积核能拼接不同尺寸的特征，极大地丰富了特征信息。

论文中提出的SqueezeNet以普通卷积层(conv1)为始，连续使用8个fire modules(fire2-9)，最终以普通卷积层(conv10)作结。

空洞卷积是解决池化操作降低分辨率而丢失信息问题的一种卷积方法，它通过在卷积核元素间添加空洞(间隔)以扩大感受野，比如3*3的2-空洞卷积，原本size为3的卷积核在不改变参数量和计算量的情况下获得size为7(dilated rate为2)的感受野，此时可不再进行下采样。将SqueezeNet中的fire module中的一个3*3卷积替换为3*3-2空洞卷积能使得卷积层的感受野更丰富，拼接不同尺度的特征，更进一步丰富特征信息。

空间金字塔池化(SPP，来源于论文Spatial

Pyramid Pooling in Deep Convolutional Networks for VisualRecognition)是用于对任意大小图片下采样生成相同大小图像进而将统一大小的图像输入到全连接层的方法。其中利用三种不同大小的刻度对一张输入的图像进行划分得到21(16+4+1)个块，每个块提取一个特征，获得一个21维特征向量，即将一张任意大小的图像转化为固定大小的特征。每种刻度是金字塔的一层，每层划分为对应window size(ws)为4、2、1的16、4、1个图片块，所以每层中每个图片块的大小为(w/ws,h/ws)，w和h为原图的图像大小。在神经网络的最后卷积层之后使用空间金字塔池化SPP结构代替最大池化操作，可以更好地合并不同尺度的特征信息。

L1正则化剪枝删除对模型影响较小的参数，使大部分权重变为0，使得模型在性能不变的情况下，压缩模型的参数个数，又能提高模型的计算速度满意业务要求。

考虑到反光对文字遮挡的复杂情况，深度学习需要学习到被遮挡文字的细节特征，因此网络的浅层特征应当被保留。所以我们连接了最后几层的特征图与前几层的特征图，以便在网络最后层还能提供浅层的纹理细节特征，文字笔画和边缘特征通常在浅层就被提取出来。

开发流程及效果：

1.图像输入及预处理

提取我司客户中近三年网上开户提交的身份证图样，区分为审核通过、审核驳回两种类型，基于驳回原因选择反光(或模糊)的图像为负样本，正常图像为正样本，按照正负样本比例为1:1随机选定最终样本，并随机划分为训练集、测试集、验证集。因拍摄条件不同，我们对样本的大小、背景等进行了预处理。

2.模型训练并验证

我们选择caffe深度学习框架进行模型的构建和训练。根据SqueezeNet论文中的SqueezeNet基本结构，于caffe中网络结构设定的prototxt文件中输入网络参数，于训练参数设定的prototxt文件中输入训练参数。最终调用训练文件和网络文件，训练最优模型(记为模型一)并获取参数信息。

3.模型改进

1)模型二

如图6-7，最初建立模型一时仅使用基本结构的SqueezeNet，只考虑到采用不同尺寸大小的卷积核且较深的网络层次以丰富特征，但对反光遮挡文字情况复杂、长城水印、识别速度未作充分的考虑，因而反光、模糊判断的准确率不高。所以我们决定调整网络结构改良模型一。具体包括：每个fire module中的一个3*3卷积核更改为3*3-2空洞卷积核以扩大感受野进而丰富特征信息；将最后一个普通的最大池化层更改为使用空间金字塔池化结构(SPP)，更好地合并末尾数层中不同尺度的特征信息；连接最前与最后几层的特征图相连接，使得网络最后数层还能提供浅层的纹理细节特征，即文字笔画和边缘特征；使用L1范数来约束权重，使得大部分权重变为0，提升模型使用速度；根据经验对中部最大池化层的位置及卷积核个数进行调整，更改为于conv1、fire3、fire5末尾使用最大池化层，使得最后连续数层卷积操作能保留更多特征信息。重新训练并验证模型效果。

2)模型三

模型二的结果显示，判断效果有限，存在较多错分的样例。因此我们从样本出发，发现错判原因可能是样本的因变量——是否反光/模糊的人工标注标准不一致，即前文提及的建模难点之一，导致样本中反光、模糊的判断边界不明确。

因此，保持模型二中的SqueezeNet网络结构不变，对样本进行处理。一方面对于错分样本，由业务人员重新核对矫正，另一方面，考虑合成多种高质量反光、模糊样本的方式以统一判断标准，同时提高样本的反光、模糊多样性。经过多次迭代训练，最终达成业务预期上线目标。

第二方面。

请参阅图8-11，发明某一实施例提供的一种基于深度学习的身份证质检***，包括：

第一图像获取模块10，用于获取第一图像；其中，所述第一图像包含身份证图像及背景图像。

第一图像预处理模块20，用于对所述第一图像进行预处理，得到第二图像；其中，所述第二图像仅包含身份证图像。

请参阅图7，在某一具体实施例中，所述第一图像预处理模块20包括：

高斯模糊算法处理子模块21，用于通过高斯模糊算法对所述第一图像进行处理，得到第一特征图像。

灰度化及二值化处理子模块22，用于对所述第一特征图像进行灰度化及二值化处理，得到第二特征图像。

分离图像子模块23，用于通过Isotropic Sobel算子处理所述第二特征图像，以分离身份证图像及背景图像，得到第二图像。

反光质检模块30，用于将所述第二图像输入设定的反光质检模型进行反光质检，得到第三图像；其中，所述设定的第一模型为根据SqueezeNet的基本结构得。

请参阅图8，在某一具体实施例中，所述反光质检模块30，包括：

反光样本输入模块31，用于将标记为反光审核通过的身份证图像和标记为反光审核未通过的身份证图像分别作为反光正样本数据和反光负样本数据输入至反光质检模型；其中，所述反光正样本数据的数量和所述反光负样本数据的数量相同。

反光质检模型训练模块32，用于基于caffe深度学习框架根据所述反光正样本数据和反光负样本数据进行反光质检模型的训练。

模糊质检模块40，用于将所述第三图像输入设定的模糊质检模型进行模糊质检，得到第四图像；其中，所述设定的模糊质检模型为根据SqueezeNet的基本结构得到。

请参阅图9，在某一具体实施例中，所述模糊质检模块40包括：

模糊样本输入模块41，用于将标记为模糊审核通过的身份证图像和标记为模糊审核未通过的身份证图像分别作为模糊正样本数据和模糊负样本数据输入至模糊质检模型；其中，所述模糊正样本数据的数量和所述模糊负样本数据的数量相同。

模糊质检模型训练模块42，用于基于caffe深度学习框架根据所述模糊正样本数据和模糊负样本数据进行模糊质检模型的训练。

以上所述是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也视为本发明的保护范围。

Claims

1.一种基于深度学习的身份证质检方法，其特征在于，包括：

2.如权利要求1所述的一种基于深度学习的身份证质检方法，其特征在于，所述设定的反光质检模型为根据SqueezeNet的基本结构得到，包括：

3.如权利要求1所述的一种基于深度学习的身份证质检方法，其特征在于，所述设定的模糊质检模型为根据SqueezeNet的基本结构得到，包括：

4.如权利要求2或3所述的一种基于深度学习的身份证质检方法，其特征在于，所述SqueezeNet的基本结构，包括：

将3*3卷积核更改为3*3-2空洞卷积核以增加特征信息数量；

5.如权利要求1所述的一种基于深度学习的身份证质检方法，其特征在于，所述对所述第一图像进行预处理，得到第二图像，包括：

6.一种基于深度学习的身份证质检***，其特征在于，包括：

7.如权利要求6所述的一种基于深度学习的身份证质检***，其特征在于，所述反光质检模块，包括：

8.如权利要求6所述的一种基于深度学习的身份证质检***，其特征在于，所述模糊质检模块，包括：

9.如权利要求6所述的一种基于深度学习的身份证质检***，其特征在于，所述第一图像预处理模块，包括：

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质包括存储的计算机程序，其中，在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如权利要求1至5中任意一项所述的基于深度学习的身份证质检方法。