CN112686247A - 一种身份证号码检测方法、装置、可读存储介质和终端 - Google Patents
一种身份证号码检测方法、装置、可读存储介质和终端 Download PDFInfo
- Publication number
- CN112686247A CN112686247A CN202011455531.1A CN202011455531A CN112686247A CN 112686247 A CN112686247 A CN 112686247A CN 202011455531 A CN202011455531 A CN 202011455531A CN 112686247 A CN112686247 A CN 112686247A
- Authority
- CN
- China
- Prior art keywords
- image
- area
- detection
- identity card
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 72
- 238000003860 storage Methods 0.000 title claims abstract description 17
- 238000000034 method Methods 0.000 claims abstract description 57
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 26
- 238000004891 communication Methods 0.000 claims abstract description 22
- 230000000877 morphologic effect Effects 0.000 claims abstract description 5
- 238000012545 processing Methods 0.000 claims description 16
- 238000003708 edge detection Methods 0.000 claims description 14
- 238000005520 cutting process Methods 0.000 claims description 12
- 230000008859 change Effects 0.000 claims description 7
- 238000007781 pre-processing Methods 0.000 claims description 7
- 238000013075 data extraction Methods 0.000 claims description 4
- 230000003044 adaptive effect Effects 0.000 claims description 3
- 150000001875 compounds Chemical class 0.000 claims description 3
- 239000000463 material Substances 0.000 claims description 3
- 238000004519 manufacturing process Methods 0.000 claims description 2
- 238000000605 extraction Methods 0.000 abstract description 5
- 238000012937 correction Methods 0.000 abstract description 2
- 238000010606 normalization Methods 0.000 abstract description 2
- 238000005516 engineering process Methods 0.000 description 11
- 238000012549 training Methods 0.000 description 7
- 238000013528 artificial neural network Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000010339 dilation Effects 0.000 description 5
- 238000003062 neural network model Methods 0.000 description 4
- 238000012015 optical character recognition Methods 0.000 description 4
- 238000010191 image analysis Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 208000003464 asthenopia Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000009417 prefabrication Methods 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/42—Document-oriented image-based pattern recognition based on the type of document
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
- Character Input (AREA)
Abstract
本发明提供了一种身份证号码检测方法、装置、可读存储介质和终端,方法首先应用目标检测检测算法定位身份证位置,提取检测框内图像,对图像进行尺寸归一化,选取适当尺度的掩模对图像进行形态学运算,使身份证号码区域实现联通,自适应选取阈值实现二值化,应用hough获取直线,选择图像主方向并进行旋转,提取长宽比符合要求的联通区域及为身份证号码区域。检测方案无需进行身份证的倾斜矫正,可以提高复杂拍摄场景下身份证信息提取,大大的提高识别率,在安保、金融等领域可得到广泛应用。
Description
技术领域
本发明涉及信息检测或智能视觉技术领域,具体涉及一种身份证号码检测方法、装置、可读存储介质和终端。
背景技术
随着人工智能的兴起,图像识别技术逐步应用于安全、军事、医疗、智能交通等领域,人脸识别和指纹识别等技术越来越多的使用到公共安全、金融和航空航天等安全领域。在军事领域,图像识别主要应用于目标的侦查和识别,通过自动化的图像识别技术来进行敌方目标的识别并进行打击;在医疗领域,通过图像识别技术可以进行各类医学图像分析和诊断,一方面可以大大降低医疗的成本,另一方面也有助于提高医疗质量和效率;在交通领域不仅可以进行车牌识别,同时也可以应用到前沿的自动驾驶领域,实现对道路、车辆和行人的清晰识别,提高生活的便利并且降低人们出行成本。
对于证件图像识别,其中身份证作为日常生活中最常用的证件,在安防、金融、企事业信息管理领域需要快速高效识别身份信息。早期的身份证的信息大多需要人工录入,效率十分低下,而且长时间的识别过程也会使人眼疲劳,所以人工录入已经不适应于当今计算机等领域飞速发展的现状。虽然已出现了自动识别或自动提取身份证信息的技术,然而对于复杂场景,如证件在视觉内未对准、光照不均、外光场干扰、杂物覆盖等,导致身份证轮廓与图像背景边界模糊,不利于身份证边界的精确提取,从而导致身份证号码检测效率降低或失败。为此也出现了一些解决方案如下。
传统方法:采用边缘检测算法,应用边缘检测算子定位证件边缘,应用边缘点直线拟合确定证件边缘直线与边缘直线交点信息从而确定证件偏转角度,对证件进行旋转,再应用图像处理方法检测证件号码位置,准确检测证件边缘点是该方法的核心步骤,而边缘检测算子对图像背景复杂程度要求较高,若图像背景前景区域梯度变化小,或背景区域存在大量边缘信息情况下,将导致证件边缘点检测失败,从而无法实现证件号码的检测。
深度学习方法:该方法在模型训练阶段应用大量标注数据对深度网络进行训练,拟合网络参数,实现OCR(Optical Character Recognition,光学字符识别)检测算法的建模,在模型预测阶段,将整张图像作为网络的输入,通过网络前向推理实现字符区域的检测。该方法为目前较为流行的字符检测方法,而对于证件号码检测任务,该方法存在如下缺陷(1)非证件区域图像也参加了网络推理过程,一方面浪费了计算资源,另一方面对于非证件区域存在做的字符存在误检测需要额外增加处理逻辑进行剔除;(2)该方案计算资源消耗较大,相比本提案训练和推理时间长;(3)因神经网络的不可解释行,该方法定位的字符区域边框存无法精确定位字符最小外接矩形框,甚至会切掉部分字符区域,即传统的证件图像光学识别(OCR)技术主要面向高清扫描的图像,该方法要求识别的图像拥有干净的背景、使用规范的印刷体并具有较高的分辨率。但是,自然场景中存在文本背景噪声大、文本分布不规范和自然光源影响等问题,OCR技术在实际自然场景中检测率并不理想,针对身份证等证件识别给后面步骤的字符识别带来压力。
综上,现有的身份证识别技术中,质检视频清晰度极差,环境极其复杂,质检要求多样,目前算法均是解决单一问题,如从高质量的图像中识别人脸和文字信息,难以直接转化为复杂的业务判断,因此,需要一种在非证件区域背景复杂或证件前景区域梯度变化小的复杂环境下,均可高效识别证件的检测技术。
发明内容
为了克服现有技术的不足,本发明的目的在于提供一种身份证号码检测方法、装置、可读存储介质和终端,其能解决上述问题。
设计原理:首先应用目标检测检测算法定位身份证位置,提取检测框内图像,对图像进行尺寸归一化,选取适当尺度的掩模对图像进行形态学运算,使身份证号码区域实现联通,自适应选取阈值实现二值化,应用hough获取直线,选择图像主方向并进行旋转,提取长宽比符合要求的联通区域及为身份证号码区域;其中,霍夫变换是一种特征检测(feature extraction),被广泛应用在图像分析(image analysis)、计算机视觉(computervision)以及数位影像处理(digital image processing)。霍夫变换是用来辨别找出物件中的特征,例如:线条。他的算法流程大致如下,给定一个物件、要辨别的形状的种类,算法会在参数空间(parameter space)中执行投票来决定物体的形状,而这是由累加空间(accumulator space)里的局部最大值(local maximum)来决定。而对于霍夫变换进行直线检测,其原理为直线的表示:对于平面中的一条直线,在hough变换中,考虑表示方式为:使用(r,theta)来表示一条直线。其中r为该直线到原点的距离,theta为该直线的垂线与x轴的夹角。也就是霍夫变换中表示一条直线的参数变成了(r,theta)。.判断多个点是否在同一直线上:当对象变成点时,一个点可以发射出无数条直线,根据霍夫变换的直线表达形式,假设这个点为i,则通过这个点的直线我们用(ri,thetai)表示。再假设一个点为j,则通过点j的一系列直线我们用(rj,thetaj)表示。两点决定一条直线,所以这两个点的直线必定有ri=rj,thetai=thetaj的时候。当是三个点,假设第三个点是k,则通过k点的一系列直线为(rk,thetak),如果三点在一条直线上,那必定有某个ri=rj=rk=r,thetai=thetaj=thetak=theta。通过霍夫变换检测直线时需要找到这样一样直线,假设有N个点,检测其中的直线,也就是要找到具体的r和theata。对于上面所说的每个点可以通过无数条直线,这里设为n条(通常n=180),则一起可以找到Nn个(r,theata),对这Nn个(r,theata),可以利用统计学,统计到在theta=某个值theta_i时,多个点的r近似相等于r_i。也就是说这多个点都在直线(r_i,theta_i)上。
本发明的目的采用以下技术方案实现:
一种身份证号码检测方法,方法包括:第一步:身份证检测,应用目标检测算法检测图像中身份证图像的位置,S=(a,b,c,d),其中S为身份所在区域,a为该区域左上点横坐标,b为该区域左上点纵坐标,c为该区域右下点横坐标,d为该区域右下点纵坐标;第二步:身份证区域尺寸规一划,根据第一步的检测的位置,将身份证图像裁剪出来,在不改变原有长宽比情况下,将长边规一划为固定尺寸,短边同比例规一划;设规一划后的图像长为L,宽为H,图像为R;第三步:身份证号码区域糊化,设计与第二步规一划尺寸对应的掩模,使用该掩模对图像进行形态学运算,达到文字区域图像联通糊化的目的;设置矩形掩模,对图像规一划化后的图像进行膨胀操作,其中掩模尺寸为待检测字符大小;得到膨胀操作后的矫正图像;第四步:边缘检测,应用canny检测得到边缘检测图像C;第五步:直线检测获取倾斜角度θ;第六步:图像旋转,应用第五步计算得到的倾斜角度对身份征图像进行旋转;第七步:对旋转图像膨胀和二值化;第八步:提取长宽比符合要求的联通区域即为身份证号码区域,二值化图像,先获取各行字符检测后选区域,再融合各行生产字符候选区域作为身份证号码区域。
优选的,在第一步中采用的目标检测算法包括yolo、ssd中的一种。
保留长度最长的直线,计算该直线的倾斜角度:
优选的,第六步中采用的旋转关系为:
优选的,在第七步中,旋转图像的膨胀和二值化方法如下:
膨胀方法为取大小为δ+1的滑动窗在图像R′上滑动,滑动窗内的最小像素极为膨胀方法的在位置的输出,实现方式如下,
膨胀后的图像记为:
S=[si,j]H×W…………………………………式6,
其中膨胀方法如下:
si,j=min(R′ij)………………………………式7,
其中如下R′ij为滑动窗在i,j像素位置取得的子图像
对膨胀后的图像S应用自适应阈值算法获得而二化图像TS。
优选的,第八步,提取长宽比符合要求的联通区域即为身份证号码区域,步骤如下,对图像进行行投影并进行行切割,获取联通行再对各行联通行进行列切割,获取联通区域,联通区域宽高比满足预制条件的及为身份证号码区域.
对图像TS=[tsij]进行行投影,计算行投影值HORi
对行投影进行切割获取联通行,确定各联通行的起始行和终止行,切割方法如下,逐行遍历HORi行投影值,若连续h行投影值的和大于固定阈值TH,则记录起始行,若没有出现终止行,则不记录新的起始行,若存在起始行,且连续h行投影值和小于固定阈值TH,则记录终止始行,起始行和终止行成对出现,记第m对起始行终止行为HSm,HEm:
对每一个联通行进行列投影,对第m个联通行进行列投影,
VERmj=∑itsi,j,i=HSm...HEm。
对联通行的列投影进列切割获取联通区域的起始列和终止列,切割方法如下,逐列遍历VERmj联通行列投影值,若连续w列联通行列投影值的和大于固定阈值TW,则记录起始列,若没有出现终止列,则不记录新的起始列,若存在起始列,且连续w列联通行列投影值的和小于固定阈值TW,则记录终止行,记第m个联通行的第nm对起始列终止列为
由起始行终止行起始列终止列可以获得联通区域
若满足
则该区域为身份证号码区域,其中T1,T2为预先设计的身份证号码的宽高比阈值。
本发明还提供了一种身份证号码检测装置,装置包括:获取单元,用于获取待处理的图像信息;预处理单元,用于对所获取的图像进行预处理,获得归一化后的图像R;深度处理单元,用于对预处理后的图像R中号码区域糊化,其中采用与待检测字符大小相同尺寸的矩形掩模对图像规一划化后的图像进行膨胀操作,得到膨胀操作后的矫正图像;再通过边缘检测、图像旋转、膨胀和二值化;数据提取单元,用于对检测出的身份证区域进行目标信息检测,提取长宽比符合要求的联通区域即为身份证号码区域,并对区域内获取各行字符检测后选区域并融合作为身份证号码区域,以此提取此区域内号码作为身份证号码。
本发明还提供了一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令运行时执行前述身份证号码检测方法的步骤。
本发明还提供了一种终端,包括存储器和处理器,所述存储器上储存有能够在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行前述身份证号码检测方法的步骤。
相比现有技术,本发明的有益效果在于:(1)相比传统方法,解决因证件边缘检测失败而导致的证件号码检测失败问题,无论非证件区域背景复杂或证件前景区域梯度变化小,均可有效实现深证好的检测,(2)相较基于深度学习的字符检测算法,提升了算法运算效率,节约运算资源,且无需人工设计非证件区域的处理逻辑。综上,本发明的身份证号码检测方法,无需进行身份证的倾斜矫正,可以提高复杂拍摄场景下身份证信息提取,大大的提高识别率,在安保、金融等领域可得到广泛应用。
附图说明
图1为本发明身份证号码检测方法流程图;
图2为身份证号码检测装置的结构模块示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
第一实施例
一种身份证号码检测方法,参见图1,方法包括:
第一步:身份证检测,应用目标检测算法检测图像中身份证图像的位置,S=(a,b,c,d),其中S为身份所在区域,a为该区域左上点横坐标,b为该区域左上点纵坐标,c为该区域右下点横坐标,d为该区域右下点纵坐标。
其中,在第一步中采用的目标检测算法包括yolo、ssd中的一种。
对于采用基于YOLO算法的深度神经网络模型对采集的的图像进行检测,得到对应的身份证区域,以在目标信息所占的区域过小时,可以防止直接从整个复杂场景图像中查找目标信息而造成的漏检。其中,所述基于YOLO算法的深度神经网络模型的训练过程,具体可以包括:
首先,获取含有身份证区域标注信息的复杂背景下的身份证图像,作为训练样本,并将所获取的样本划分为训练集、验证集和测试集。接着,对所获取的上述的含有身份证区域标注信息的复杂背景下的身份证图像进行预处理,以剔除不含有有效身份证区域样本,并将图像的尺寸缩放到预设的大小,如484*484等,并通过仿射变换、随机裁剪、模糊等操作对所获取的样本进行数据增强。
随后,构建深度神经网络模型的网络结构。在本发明一实施例中,所构建的深度神经网络模型的网络结构包含24个卷积层和2个全连接层。其中,对于24个卷积层,主要使用1*1卷积进行信道缩减(channel reduction),然后紧跟3*3卷积。对于卷积层和全连接层,采用Leaky ReLU激活函数max(x,0.1x),最后一层采用线性激活函数。
在网络前期通过卷积神经网络(Convolutional Neural Network,CNN)提取样本图像的特征,并在最后一层全连接(Fully connected,FC)输出一个539的向量,通过重塑(reshape)获得一个7*7*11的多维矩阵。其中,所述7*7*11的多维矩阵中,7*7个单元格中的每个单元格均可以用于预测目标区域,之后的11位中的前5*2位中“2”表示前景和背景,“5”分别表示预测区域的中心点cx和cy,宽w、高h和前景的置信度×c,11位中的最后1位表示目标类别置信度。
第二步:身份证区域尺寸规一划,根据第一步的检测的位置,将身份证图像裁剪出来,在不改变原有长宽比情况下,将长边规一划为固定尺寸,短边同比例规一划;设规一划后的图像长为L,宽为H,图像为R。
第三步:身份证号码区域糊化,设计与第二步规一划尺寸对应的掩模,使用该掩模对图像进行形态学运算,达到文字区域图像联通糊化的目的;设置矩形掩模,对图像规一划化后的图像进行膨胀操作,其中掩模尺寸为待检测字符大小;得到膨胀操作后的矫正图像。
第四步:边缘检测,应用canny检测得到边缘检测图像C。
第五步:直线检测获取倾斜角度θ。
保留长度最长的直线,计算该直线的倾斜角度:
第六步:图像旋转,应用第五步计算得到的倾斜角度对身份征图像进行旋转。第六步中采用的旋转关系为:
在第七步中,旋转图像的膨胀和二值化方法如下
膨胀方法为取大小为δ+1的滑动窗在图像R′上滑动,滑动窗内的最小像素极为膨胀方法的在位置的输出,实现方式如下,
膨胀后的图像记为:
S=[si,j]H×W…………………………………式6,
其中膨胀方法如下:
si,j=min(R′ij)………………………………式7,
其中如下R′ij为滑动窗在i,j像素位置取得的子图像为:
对膨胀后的图像S应用自适应阈值算法获得而二化图像TS。
第八步,提取长宽比符合要求的联通区域即为身份证号码区域,步骤如下,对图像进行行投影并进行行切割,获取联通行再对各行联通行进行列切割,获取联通区域,联通区域宽高比满足预制条件的及为身份证号码区域.
对图像TS=[tsij]进行行投影,计算行投影值HORi,
对行投影进行切割获取联通行,确定各联通行的起始行和终止行,切割方法如下,逐行遍历HORi行投影值,若连续h行投影值的和大于固定阈值TH,则记录起始行,若没有出现终止行,则不记录新的起始行,若存在起始行,且连续h行投影值和小于固定阈值TH,则记录终止始行,起始行和终止行成对出现,记第m对起始行终止行为HSm,HEm:
对每一个联通行进行列投影,对第m个联通行进行列投影:
VERmj=∑itsi,j,i=HSm...HEm。
对联通行的列投影进列切割获取联通区域的起始列和终止列,切割方法如下,逐列遍历VERmj联通行列投影值,若连续w列联通行列投影值的和大于固定阈值TW,则记录起始列,若没有出现终止列,则不记录新的起始列,若存在起始列,且连续w列联通行列投影值的和小于固定阈值TW,则记录终止行,记第m个联通行的第nm对起始列终止列为
本发明中采集的图像,是通过摄像头采集的图像,可以是一张静态图像(即:单独采集的图像),也可以是一张视频中图像(即从采集的视频中按照预设标准或随机选取的一张图像),均可用于本发明身份证的图像源,本发明实施例对于图像的来源、性质、大小等等所有属性均无限制。
本领域技术人员基于本公开实施例的记载可以知悉,除了神经网络外,在本公开实施例还可以利用例如但不限于:基于图像处理的字符检测算法(例如,基于直方图粗分割和奇异值特征的字符/号码检测算法,基于二进小波变换的字符/号码检测算法,等等),对采集图像进行字符检测。另外,除了神经网络外,在本公开实施例也可以利用例如但不限于:基于图像处理的证件检测算法(例如,边缘检测法,数学形态学法,基于纹理分析的定位方法,行检测和边缘统计法,遗传算法,霍夫(Hough)变换和轮廓线法,基于小波变换的方法,等等),等等,对采集图像进行证件检测。
本公开实施例中,通过神经网络对采集图像进行字符检测时,可以预先利用样本图像对神经网络进行训练,使得训练好的神经网络能够实现对图像中字符的有效检测。
第二实施例
本发明还提供了一种身份证号码检测装置,参见图2,装置包括:获取单元,用于获取待处理的图像信息;预处理单元,用于对所获取的图像进行预处理,获得归一化后的图像R;深度处理单元,用于对预处理后的图像R中号码区域糊化,其中采用与待检测字符大小相同尺寸的矩形掩模对图像规一划化后的图像进行膨胀操作,得到膨胀操作后的矫正图像;再通过边缘检测、图像旋转、膨胀和二值化;数据提取单元,用于对检测出的身份证区域进行目标信息检测,提取长宽比符合要求的联通区域即为身份证号码区域,并对区域内获取各行字符检测后选区域并融合作为身份证号码区域,以此提取此区域内号码作为身份证号码。
装置在硬件结构化中的表示如下。
获取单元-利用硬件设备,包括但不限于手机,IPAD,普通摄像头,CCD工业相机、扫描仪等,对身份证正面进行图像信息采集,注意采集到的图像应完全的包含身份证的四条边界,并且倾斜不超过正负20°,且人眼能分辨身份证号码。
预处理单元、深度处理单元和数据提取单元-利用存储在存储器中的算法、程序等,通过处理器对获得的图像进行相应的处理和数据提取。
输出装置,包括但不限于平板电脑、计算机、手机等的显示屏,将处理器提取的身份证号码输出并显示。
输入/输出接口、网接口,将采集装置、存储器、处理器、输出装置进行信号连接,包括电性连接和电讯连接。
第三实施例
本发明还提供了一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令运行时执行前述身份证号码检测方法的步骤。其中,所述的身份证号码检测方法请参见前述部分的详细介绍,此处不再赘述。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于计算机可读存储介质中,计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
第四实施例
本发明还提供了一种终端,包括存储器和处理器,所述存储器上储存有能够在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行前述身份证号码检测方法的步骤。其中,所述的身份证号码检测方法请参见前述部分的详细介绍,此处不再赘述。
上述方案解决了在复杂背景情况下,身份证轮廓与图像背景边界模糊,不利于身份证号码精确提取的问题。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个......”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、装置、***或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种身份证号码检测方法,其特征在于,方法包括:
第一步:身份证检测,应用目标检测算法检测图像中身份证图像的位置,S=(a,b,c,d),其中S为身份所在区域,a为该区域左上点横坐标,b为该区域左上点纵坐标,c为该区域右下点横坐标,d为该区域右下点纵坐标;
第二步:身份证区域尺寸规一划,根据第一步的检测的位置,将身份证图像裁剪出来,在不改变原有长宽比情况下,将长边规一划为固定尺寸,短边同比例规一划;设规一划后的图像长为L,宽为H,图像为R;
第三步:身份证号码区域糊化,设计与第二步规一划尺寸对应的掩模,使用该掩模对图像进行形态学运算,达到文字区域图像联通糊化的目的;设置矩形掩模,对图像规一划化后的图像进行膨胀操作,其中掩模尺寸为待检测字符大小;得到膨胀操作后的矫正图像;
第四步:边缘检测,应用canny检测得到边缘检测图像C;
第五步:直线检测获取倾斜角度θ;
第六步:图像旋转,应用第五步计算得到的倾斜角度对身份征图像进行旋转;
第七步:对旋转图像膨胀和二值化;
第八步:提取长宽比符合要求的联通区域即为身份证号码区域,二值化图像,先获取各行字符检测后选区域,再融合各行生产字符候选区域作为身份证号码区域。
2.根据权利要求1所述的身份证号码检测方法,其特征在于:
在第一步中采用的目标检测算法包括yolo、ssd中的一种。
6.根据权利要求1所述的身份证号码检测方法,其特征在于:
在第八步中,对二值化后的图像先逐行扫描文字区域起始点和结束点,记各起始点结束点中间的区域为字符连续区域,记录各行连续区域满足先验条件的区域作为各行字符检测候选区域。
8.一种身份证号码检测装置,其特征在于,包括:
获取单元,用于获取待处理的图像信息;
预处理单元,用于对所获取的图像进行预处理,获得归一化后的图像R;
深度处理单元,用于对预处理后的图像R中号码区域糊化,其中采用与待检测字符大小相同尺寸的矩形掩模对图像规一划化后的图像进行膨胀操作,得到膨胀操作后的矫正图像;再通过边缘检测、图像旋转、膨胀和二值化;
数据提取单元,用于对检测出的身份证区域进行目标信息检测,提取长宽比符合要求的联通区域即为身份证号码区域,并对区域内获取各行字符检测后选区域并融合作为身份证号码区域,以此提取此区域内号码作为身份证号码。
9.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,所述计算机指令运行时执行权利要求1至7任一项所述的身份证号码检测方法的步骤。
10.一种终端,其特征在于,包括存储器和处理器,所述存储器上储存有能够在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行权利要求1至7任一项所述的身份证号码检测方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011455531.1A CN112686247A (zh) | 2020-12-10 | 2020-12-10 | 一种身份证号码检测方法、装置、可读存储介质和终端 |
PCT/CN2020/140583 WO2022121021A1 (zh) | 2020-12-10 | 2020-12-29 | 一种身份证号码检测方法、装置、可读存储介质和终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011455531.1A CN112686247A (zh) | 2020-12-10 | 2020-12-10 | 一种身份证号码检测方法、装置、可读存储介质和终端 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112686247A true CN112686247A (zh) | 2021-04-20 |
Family
ID=75448938
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011455531.1A Pending CN112686247A (zh) | 2020-12-10 | 2020-12-10 | 一种身份证号码检测方法、装置、可读存储介质和终端 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN112686247A (zh) |
WO (1) | WO2022121021A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115804579B (zh) * | 2022-11-21 | 2024-01-26 | 江西长冈医疗科技有限公司 | 一种规范化血压测量的过程控制***及实现方法 |
CN117315664B (zh) * | 2023-09-18 | 2024-04-02 | 山东博昂信息科技有限公司 | 一种基于图像序列的废钢斗号码识别方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103729645A (zh) * | 2013-12-20 | 2014-04-16 | 湖北微模式科技发展有限公司 | 基于单目摄像头的二代证区域定位与提取的方法及装置 |
CN106446881A (zh) * | 2016-07-29 | 2017-02-22 | 北京交通大学 | 从医疗化验单图像中提取化验结果信息的方法 |
CN108446699A (zh) * | 2018-02-08 | 2018-08-24 | 东华大学 | 一种复杂场景下身份证图片信息识别*** |
CN108694393A (zh) * | 2018-05-30 | 2018-10-23 | 深圳市思迪信息技术股份有限公司 | 一种基于深度卷积的证件图像文本区域提取方法 |
CN109344727A (zh) * | 2018-09-07 | 2019-02-15 | 苏州创旅天下信息技术有限公司 | 身份证文本信息检测方法及装置、可读存储介质和终端 |
CN110781890A (zh) * | 2019-10-25 | 2020-02-11 | 上海德启信息科技有限公司 | 身份证识别方法、装置、电子设备及可读取存储介质 |
CN111898601A (zh) * | 2020-07-14 | 2020-11-06 | 浙江大华技术股份有限公司 | 一种身份证要素提取方法及装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000341501A (ja) * | 1999-03-23 | 2000-12-08 | Minolta Co Ltd | 画像処理装置および画像処理方法、ならびに画像処理プログラムを記録した記録媒体 |
CN104050450A (zh) * | 2014-06-16 | 2014-09-17 | 西安通瑞新材料开发有限公司 | 一种基于视频的车牌识别方法 |
CN106156712A (zh) * | 2015-04-23 | 2016-11-23 | 信帧电子技术(北京)有限公司 | 一种基于自然场景下的身份证号码识别方法与装置 |
CN104834929B (zh) * | 2015-04-28 | 2018-10-30 | 安徽清新互联信息科技有限公司 | 一种基于方差特征的车牌校正方法 |
-
2020
- 2020-12-10 CN CN202011455531.1A patent/CN112686247A/zh active Pending
- 2020-12-29 WO PCT/CN2020/140583 patent/WO2022121021A1/zh active Application Filing
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103729645A (zh) * | 2013-12-20 | 2014-04-16 | 湖北微模式科技发展有限公司 | 基于单目摄像头的二代证区域定位与提取的方法及装置 |
CN106446881A (zh) * | 2016-07-29 | 2017-02-22 | 北京交通大学 | 从医疗化验单图像中提取化验结果信息的方法 |
CN108446699A (zh) * | 2018-02-08 | 2018-08-24 | 东华大学 | 一种复杂场景下身份证图片信息识别*** |
CN108694393A (zh) * | 2018-05-30 | 2018-10-23 | 深圳市思迪信息技术股份有限公司 | 一种基于深度卷积的证件图像文本区域提取方法 |
CN109344727A (zh) * | 2018-09-07 | 2019-02-15 | 苏州创旅天下信息技术有限公司 | 身份证文本信息检测方法及装置、可读存储介质和终端 |
CN110781890A (zh) * | 2019-10-25 | 2020-02-11 | 上海德启信息科技有限公司 | 身份证识别方法、装置、电子设备及可读取存储介质 |
CN111898601A (zh) * | 2020-07-14 | 2020-11-06 | 浙江大华技术股份有限公司 | 一种身份证要素提取方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
WO2022121021A1 (zh) | 2022-06-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11830230B2 (en) | Living body detection method based on facial recognition, and electronic device and storage medium | |
CN110414507B (zh) | 车牌识别方法、装置、计算机设备和存储介质 | |
CN112686812B (zh) | 银行卡倾斜矫正检测方法、装置、可读存储介质和终端 | |
CN107609549B (zh) | 一种自然场景下证件图像的文本检测方法 | |
CN106709436B (zh) | 面向轨道交通全景监控的跨摄像头可疑行人目标跟踪*** | |
CN109583345B (zh) | 道路识别方法、装置、计算机装置及计算机可读存储介质 | |
CN113255659B (zh) | 一种基于MSAFF-Yolov3的车牌校正检测识别方法 | |
CN108108734B (zh) | 一种车牌识别方法及装置 | |
CN113052170B (zh) | 一种无约束场景下的小目标车牌识别方法 | |
CN110969164A (zh) | 基于深度学习端对端的低照度成像车牌识别方法及装置 | |
CN112784834A (zh) | 一种自然场景下的车牌自动识别方法 | |
CN114049499A (zh) | 用于连续轮廓的目标对象检测方法、设备及存储介质 | |
CN112686247A (zh) | 一种身份证号码检测方法、装置、可读存储介质和终端 | |
CN110689003A (zh) | 低照度成像车牌识别方法、***、计算机设备及存储介质 | |
KR20220049864A (ko) | 인식한 번호판의 각도에 기초하여 차량의 번호를 인식하는 방법 | |
CN116503622A (zh) | 基于计算机视觉图像的数据采集读取方法 | |
CN111105436B (zh) | 目标跟踪方法、计算机设备及存储介质 | |
Barodi et al. | An enhanced artificial intelligence-based approach applied to vehicular traffic signs detection and road safety enhancement | |
CN112686248B (zh) | 证件增减类别检测方法、装置、可读存储介质和终端 | |
CN111709377B (zh) | 特征提取方法、目标重识别方法、装置及电子设备 | |
CN110633705A (zh) | 一种低照度成像车牌识别方法及装置 | |
CN114445788A (zh) | 车辆停放检测方法、装置、终端设备和可读存储介质 | |
CN114387308A (zh) | 一种机器视觉特征跟踪*** | |
CN114037996A (zh) | 车牌识别模型训练方法、识别方法、装置、设备及介质 | |
CN110826564A (zh) | 一种复杂场景图像中的小目标语义分割方法及*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210420 |
|
RJ01 | Rejection of invention patent application after publication |