CN111914836A - 一种身份证信息提取方法、装置、设备和介质 - Google Patents

一种身份证信息提取方法、装置、设备和介质 Download PDF

Info

Publication number
CN111914836A
CN111914836A CN202010653020.4A CN202010653020A CN111914836A CN 111914836 A CN111914836 A CN 111914836A CN 202010653020 A CN202010653020 A CN 202010653020A CN 111914836 A CN111914836 A CN 111914836A
Authority
CN
China
Prior art keywords
identity card
region
card image
determining
sub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010653020.4A
Other languages
English (en)
Inventor
陈媛媛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Dahua Technology Co Ltd
Original Assignee
Zhejiang Dahua Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Dahua Technology Co Ltd filed Critical Zhejiang Dahua Technology Co Ltd
Priority to CN202010653020.4A priority Critical patent/CN111914836A/zh
Publication of CN111914836A publication Critical patent/CN111914836A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1475Inclination or skew detection or correction of characters or of image to be recognised
    • G06V30/1478Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Character Input (AREA)

Abstract

本发明公开了一种身份证信息提取方法、装置、设备和介质,由于本发明在确定身份证图像中身份证号码所在区域后,根据身份证号码所在区域中每个字符所在区域,确定包含每个字符所在区域的子区域,根据子区域的边框线与水平线的夹角,确定身份证图像的倾斜角度,根据倾斜角度实现对身份证图像倾斜矫正。从而在身份证图像的背景颜色与身份颜色接近或是身份证图像的图像质量不好时,也可以实现对身份证图像准确的倾斜矫正,从而提高了本发明中的身份证信息提取方法的鲁棒性和提取精度。

Description

一种身份证信息提取方法、装置、设备和介质
技术领域
本发明涉及图像识别技术领域,尤其涉及一种身份证信息提取方法、装置、设备和介质。
背景技术
身份证是中国国内居民的主要身份标识,在对身份证进行识别时,可以包括基于磁卡感应的身份证识别方法和基于图像处理的身份证识别方法。
在基于磁卡感应的身份证识别方法中,主要是通过磁卡感应的身份证阅读器,对身份证进行识别。该身份证阅读器通用性强、准确率高,但不利于携带,常用于公安、银行、民政等领域的办事大厅中。
在基于图像处理的身份证识别方法中,主要是通过手机、平板等带有摄像头的设备拍摄身份证图像,传入身份证识别***输出身份证要素的识别结果。该识别方法中无需携带额外的设备,随时随地均可使用,例如,银行的工作人员外出开户过程中,通过手机上的应用对新客户的身份证进行识别,将识别出的身份证信息进行快速录入。但该方法的缺点是在复杂场景的识别率较低。
在基于图像处理的身份证识别方法中,采用基于深度学习的方法对身份证图像进行处理时,通过输入的身份证图像中人脸的特征标志,得到人脸的位置和旋转角度,根据识别出的是左人脸,右人脸、上人脸、下人脸中的任一种,确定对应的向左旋转90度、-90度,180度,0度。根据人脸的位置信息,按比例将身份证图像中的身份证区域从整张图像中剥离出来。对剥离身份证区域后的剩余区域图像进行文本检测。由于旋转后的身份证图像可能仍是倾斜的图像,为了提高文本识别精度,还需要对剩余区域图像中的倾斜文本再次进行矫正。
现有技术中还公开了通过四个矫正模块,对身份证图像进行矫正处理,通过深度学习VGG16分类网络模块粗略确定身份证图像的是旋转0度、90度、180度、270度中的任一个角度,再通过排序滤波器确定身份证图像的倾斜角度,对身份证图像进行精确矫正。该方法通过排序滤波器对身份证图像进行精确矫正时,提取身份证图像的背景像素,通过像素的减法减去背景区域,最后图像只剩下身份证区域的文本像素,在[-15,15]度范围内每个整数度数取值,分别以此角度进行旋转,对旋转后的身份证区域的图像的像素矩阵以第二维度为轴求均值,得到一维的均值数组,对一维的均值数组求其方差得到最后的值,确定每个角度对应的方差值,方差最大时的角度就是身份证图像的倾斜角度。
由于在身份证有污损导致身份证图像的图像质量不好时,或者身份证的颜色与背景区域的颜色接近时,都会对影响通过排序滤波器确定的身份证区域的图像的像素矩阵,使得确定的每个角度对应的方差值不准确,最终导致得到的身份证图像的倾斜角度不准确,而根据不准确的倾斜角度矫正后的身份证图像,提取身份证信息时的提取精度也会下降,因此现有技术中的身份证信息提取方法的鲁棒性也不高。
发明内容
本发明实施例提供了一种身份证信息提取方法、装置、设备和介质,用以解决现有技术中的身份证信息提取方法的提取精度低和鲁棒性不高的问题。
本发明实施例提供了一种身份证信息提取方法,所述方法包括:
基于预先训练完成的深度学习网络模型,确定输入的身份证图像中身份证号码所在区域的信息;
根据所述身份证号码所在区域中每个字符所在区域,确定包含所述每个字符所在区域的子区域;
根据所述子区域的边框线与水平线的夹角,对所述身份证图像进行倾斜矫正,并根据倾斜矫正后的所述身份证图像中的每个文本区域的位置信息,对所述身份证图像进行旋转矫正,识别旋转矫正后的所述身份证图像中包含的身份证信息。
进一步地,所述根据所述身份证号码所在区域中每个字符所在区域,确定包含所述每个字符所在区域的子区域之前,所述方法还包括:
对所述身份证号码所在区域内像素点进行二值化处理,根据二值化处理后每个像素点的像素值,确定所述身份证号码所在区域内的每个连通域,将每个所述连通域,确定为每个字符所在区域。
进一步地,所述根据二值化处理后每个像素点的像素值,确定所述身份证号码所在区域内的每个连通域,包括:
根据二值化处理后的每个像素点的像素值,确定像素值为设定像素值的每个目标像素点;
针对每个目标像素点,确定所述目标像素点、及与所述目标像素点相邻的其他目标像素点构成的每个第一点集;
针对每个第一点集,若存在与该第一点集有相同目标像素点的其他第一点集,则基于存在相同目标像素点的其他第一点集对该第一点集进行更新,直到其他第一点集中与更新后的该第一点集不存在相同目标像素点;
针对更新后的每个第一点集,根据该更新后的第一点集中的目标像素点确定为所述身份证号码所在区域内的连通域。
进一步地,所述确定包含每个字符所在区域的子区域,包括:
根据所述身份证号码所在区域中每个字符所在区域的像素点,确定横坐标的最大值和最小值,以及纵坐标的最大值和最小值;
根据所述横坐标的最大值和最小值,以及纵坐标的最大值和最小值,确定所述身份证号码所在区域中的边界像素点,根据所述边界像素点确定包含每个字符所在区域的子区域。
进一步地,所述根据倾斜矫正后的所述身份证图像中的每个文本区域的位置信息,对所述身份证图像进行旋转矫正,包括:
根据检测得到的倾斜矫正后的所述身份证图像中的每个文本区域的位置信息,确定所述身份证图像中的所述子区域与所述每个文本区域的相对位置;
根据所述子区域与所述每个文本区域的相对位置,确定所述身份证图像的旋转角度,并对所述身份证图像进行旋转矫正。
进一步地,检测倾斜矫正后的所述身份证图像中的每个文本区域,包括:
基于预先训练完成的文本检测模型,检测得到倾斜矫正后的所述身份证图像中包含每种身份证信息的每个文本区域的信息。
进一步地,所述根据所述子区域与所述每个文本区域的相对位置,确定所述身份证图像的旋转角度,包括:
根据所述子区域,若确定所述身份证图像位于水平方向,确定纵坐标大于所述子区域的纵坐标的文本区域的数量与全部文本区域的数量的第一比值,判断所述第一比值是否大于第一设定阈值,若是,确定所述子区域位于所述文本区域的下方,若否,确定所述子区域位于所述文本区域的上方;
若确定所述身份证图像位于竖直方向,确定横坐标大于所述子区域的横坐标的文本区域的数量与全部文本区域的数量的第二比值,判断所述第二比值是否大于所述第二设定阈值,若是,确定所述子区域位于所述文本区域的左侧,若否,确定所述子区域位于所述文本区域的右侧;
根据确定的所述子区域位于所述文本区域的目标相对位置、及相对位置与旋转角度的对应关系,将所述目标相对位置对应的旋转角度确定为所述身份证图像的目标旋转角度。
进一步地,所述识别旋转矫正后的所述身份证图像中包含的身份证信息包括:
若在所述矫正后的身份证图像中识别到身份证信息中的民族信息,将民族信息对应的第一字符串,与保存的民族的文字数据库中的每个字符串进行匹配;
若在所述文字数据库中匹配到相似度大于第三设定阈值的第二字符串,则将识别的所述第一字符串作为所述身份证信息中的民族信息;
若在所述文字数据库中未匹配到相似度大于第三设定阈值的第二字符串,则所述文字数据库中与所述第一字符串相似度最高的第三字符串作为所述身份证信息中的民族信息。
进一步地,识别旋转矫正后的所述身份证图像中包含的身份证信息包括:
判断识别出的身份证信息的数量是否达到设定的数量阈值;
若否,根据预先保存的身份证信息中包含的每个字符串,确定在所述身份证图像中未被识别的目标字符串,将所述目标字符串拆分为多个字符,针对每个字符,在矫正后的身份证图像中识别包含该字符的字符串,将识别到的字符串作为包含该目标字符串的身份证信息。
相应地,本发明实施例提供了一种身份证信息提取装置,所述装置包括:
确定模块,用于基于预先训练完成的深度学习网络模型,确定输入的身份证图像中身份证号码所在区域的信息;根据所述身份证号码所在区域中每个字符所在区域,确定包含所述每个字符所在区域的子区域;
识别模块,用于根据所述子区域的边框线与水平线的夹角,对所述身份证图像进行倾斜矫正,并根据倾斜矫正后的所述身份证图像中的每个文本区域的位置信息,对所述身份证图像进行旋转矫正,识别旋转矫正后的所述身份证图像中包含的身份证信息。
进一步地,所述确定模块,还用于所述根据所述身份证号码所在区域中每个字符所在区域,确定包含所述每个字符所在区域的子区域之前,对所述身份证号码所在区域内像素点进行二值化处理,根据二值化处理后每个像素点的像素值,确定所述身份证号码所在区域内的每个连通域,将每个所述连通域,确定为每个字符所在区域。
进一步地,所述确定模块,具体用于根据二值化处理后的每个像素点的像素值,确定像素值为设定像素值的每个目标像素点;针对每个目标像素点,确定所述目标像素点、及与所述目标像素点相邻的其他目标像素点构成的每个第一点集;针对每个第一点集,若存在与该第一点集有相同目标像素点的其他第一点集,则基于存在相同目标像素点的其他第一点集对该第一点集进行更新,直到其他第一点集中与更新后的该第一点集不存在相同目标像素点;针对更新后的每个第一点集,根据该更新后的第一点集中的目标像素点确定为所述身份证号码所在区域内的连通域。
进一步地,所述确定模块,具体还用于根据所述身份证号码所在区域中每个字符所在区域的像素点,确定横坐标的最大值和最小值,以及纵坐标的最大值和最小值;根据所述横坐标的最大值和最小值,以及纵坐标的最大值和最小值,确定所述身份证号码所在区域中的边界像素点,根据所述边界像素点确定包含每个字符所在区域的子区域。
进一步地,所述识别模块,具体用于根据检测得到的倾斜矫正后的所述身份证图像中的每个文本区域的位置信息,确定所述身份证图像中的所述子区域与所述每个文本区域的相对位置;根据所述子区域与所述每个文本区域的相对位置,确定所述身份证图像的旋转角度,并对所述身份证图像进行旋转矫正。
进一步地,所述识别模块,具体用于基于预先训练完成的文本检测模型,检测得到倾斜矫正后的所述身份证图像中包含每种身份证信息的每个文本区域的信息。
进一步地,所述识别模块,具体用于根据所述子区域,若确定所述身份证图像位于水平方向,确定纵坐标大于所述子区域的纵坐标的文本区域的数量与全部文本区域的数量的第一比值,判断所述第一比值是否大于第一设定阈值,若是,确定所述子区域位于所述文本区域的下方,若否,确定所述子区域位于所述文本区域的上方;若确定所述身份证图像位于竖直方向,确定横坐标大于所述子区域的横坐标的文本区域的数量与全部文本区域的数量的第二比值,判断所述第二比值是否大于所述第二设定阈值,若是,确定所述子区域位于所述文本区域的左侧,若否,确定所述子区域位于所述文本区域的右侧;根据确定的所述子区域位于所述文本区域的目标相对位置、及相对位置与旋转角度的对应关系,将所述目标相对位置对应的旋转角度确定为所述身份证图像的目标旋转角度。
进一步地,所述识别模块,具体还用于若在所述矫正后的身份证图像中识别到身份证信息中的民族信息,将民族信息对应的第一字符串,与保存的民族的文字数据库中的每个字符串进行匹配;若在所述文字数据库中匹配到相似度大于第三设定阈值的第二字符串,则将识别的所述第一字符串作为所述身份证信息中的民族信息;若在所述文字数据库中未匹配到相似度大于第三设定阈值的第二字符串,则所述文字数据库中与所述第一字符串相似度最高的第三字符串作为所述身份证信息中的民族信息。
进一步地,所述识别模块,具体还用于判断识别出的身份证信息的数量是否达到设定的数量阈值;若否,根据预先保存的身份证信息中包含的每个字符串,确定在所述身份证图像中未被识别的目标字符串,将所述目标字符串拆分为多个字符,针对每个字符,在矫正后的身份证图像中识别包含该字符的字符串,将识别到的字符串作为包含该目标字符串的身份证信息。
相应地,本发明实施例提供了一种电子设备,所述电子设备包括处理器和存储器,所述存储器用于存储程序指令,所述处理器用于执行存储器中存储的计算机程序时实现上述身份证信息提取方法中任一所述方法的步骤。
相应地,本发明实施例提供了一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现上述身份证信息提取方法中任一所述方法的步骤。
由于本发明实施例在确定身份证图像中身份证号码所在区域后,根据身份证号码所在区域中每个字符所在区域,确定包含每个字符所在区域的子区域,根据子区域的边框线与水平线的夹角,确定身份证图像的倾斜角度,根据倾斜角度实现对身份证图像倾斜矫正。从而在身份证图像的背景颜色与身份颜色接近或是身份证图像的图像质量不好时,也可以实现对身份证图像准确的倾斜矫正,从而提高了本发明中的身份证信息提取方法的鲁棒性和提取精度。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种身份证信息提取方法的过程示意图;
图2为本发明实施例提供的一种处于预设方向时的身份证图像的示意图;
图3为本发明实施例提供的一种倾斜矫正后的身份证图像的示意图;
图4为本发明实施例提供的一种倾斜矫正后的身份证图像的示意图;
图5为本发明实施例提供的一种倾斜矫正后的身份证图像的示意图;
图6为本发明实施例提供的一种倾斜矫正后的身份证图像的示意图;
图7为本发明实施例提供的一种身份证信息提取方法的过程示意图;
图8为本发明实施例提供的一种身份证信息提取装置的结构示意图;
图9为本发明实施例提供的一种电子设备结构示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
为了提高身份证信息提取方法的鲁棒性和提取精度,本发明实施例提供了一种身份证信息提取方法、装置、设备和介质。
实施例1:
图1为本发明实施例提供的一种身份证信息提取方法的过程示意图,该过程包括以下步骤:
S101:基于预先训练完成的深度学习网络模型,确定输入的身份证图像中身份证号码所在区域的信息。
本发明实施例提供的身份证信息提取方法应用于具有图像采集功能的电子设备,例如可以是图像采集设备,或者智能手机、PC、服务器、平板电脑等。
在本发明实施例中,为了提取身份证图像中的身份证信息,首先需要获取身份证图像,该身份证图像可以是包含其他背景区域的身份证图像,也可以是只包含身份证区域的身份证图像。
电子设备获取到该身份证图像后,基于预先训练完成的深度学习网络模型,对该身份证图像进行处理,确定该身份证图像中身份证号码所在区域的信息。其中,该预先训练完成深度学习网络模型用于识别身份证图像中的身份证号码,并确定出身份证号码所在区域。
该深度学习网络模型可以是目标检测算法模型(Fast-CNN)、快速目标检测算法模型(Faster-CNN)、快速目标识别算法模型(YOLO)、目标检测***(YOLO 9000)中的任一种。较佳的,在本发明实施例中,该深度学习网络模型是裁剪版的快速目标识别算法模型(tiny-yolo2)。
S102:根据所述身份证号码所在区域中每个字符所在区域,确定包含所述每个字符所在区域的子区域。
在确定出该身份证图像中身份证号码所在区域的信息后,为了确定出该身份证图像的倾斜角度,还需要确定出该身份证图像中包含每个字符所在区域的子区域。
在本发明实施例中,可以采用现有技术中的数字分割的方法,确定身份证号码所在区域中每个字符所在区域。该数字分割的方法包括基于直方图的分割方法、基于聚类的分割方法、基于二值图像连通域标记的分割方法等。该确定出的每个字符所在区域可以是规则形状的区域,例如矩形区域,也可以是不规则形状的区域。具体的,本发明实施例对此不做限制。
根据确定的每个字符所在区域,该电子设备确定出包含每个字符所在区域的子区域。其中,该子区域包含在身份证号码所在区域内。因为身份证号码一般位于一个矩形区域内,因此该子区域为矩形区域。
S103:根据所述子区域的边框线与水平线的夹角,对所述身份证图像进行倾斜矫正。
为了确定出该身份证图像的倾斜角度,在本发明实施例中,确定该身份证号码所在的子区域与水平线的倾斜角度,将该子区域与水平线的倾斜角度,确定为该身份证图像的倾斜角度。
具体的,为了确定出该子区域与水平线的倾斜角度,首先确定出该子区域的任一边框线,根据该子区域的任一边框线与水平线的夹角,确定该子区域与水平线的倾斜角度。
确定出该子区域与水平线的倾斜角度后,将该倾斜角度确定为该身份证图像的倾斜角度,根据该身份证图像的倾斜角度,对该身份证图像进行倾斜矫正。其中,对该身份证图像进行倾斜矫正时,可以是通过顺时针旋转的方式进行倾斜矫正,也可以是通过逆时针旋转的方式进行倾斜矫正。
S104:并根据倾斜矫正后的所述身份证图像中的每个文本区域的位置信息,对所述身份证图像进行旋转矫正,识别旋转矫正后的所述身份证图像中包含的身份证信息。
由于在完成对身份证图像的倾斜矫正后,该倾斜矫正后的身份证图像可能是位于水平方向,也可能是位于竖直方向。而在识别身份证图像中包含的身份证信息时,需要该身份证图像位于预设方向。所以在识别身份证图像中包含的身份证信息之前还需要确定是否对该身份图像进行旋转矫正。其中,该预设方向是指该身份证图像位于水平方向,且身份证图像中的人脸区域图像位于该身份证图像的右侧。图2为本发明实施例提供的一种处于预设方向时的身份证图像的示意图。
在完成对身份证图像的倾斜矫正后,对倾斜矫正后的身份证图像进行检测确定出身份证图像中的每个文本区域,根据倾斜矫正后的身份证图像中的子区域和检测得到的每个文本区域的相对位置,确定是否对该身份证图像进行旋转矫正。
若该身份证图像位于预设方向时,确定不对该身份证图像进行旋转矫正。即该身份证图像的选择角度为0度。若在该身份证图像不位于预设方向时,根据身份证图像中的子区域和每个文本区域的相对位置,确定矫正后的身份证图像的旋转角度。其中,该旋转角度一般为90度或180度。
该文本区域是指身份证图像中的姓名、性别、民族、出生和地址等信息所在的区域。例如,在身份证图像中,民族:汉为一个文本区域。
在确定出该身份证图像的旋转角度后,对该身份证图像进行旋转矫正,其中,在进行旋转矫正时,根据确定的该旋转角度,对该身份证图像进行旋转矫正,其中,进行旋转矫正时的旋转方向是确定的,该旋转方向即为确定该旋转角度时的旋转方向。对旋转矫正后的该身份证图像进行识别,识别该身份证图像中包含的身份证信息。
具体的,在识别身份证图像中包含的身份证信息时,可以是采用现有技术中的识别器进行识别,也可以是采用现有技术中的其他方法进行识别,本发明实施例对此不做限制。
由于本发明中在确定身份证图像中身份证号码所在区域后,根据身份证号码所在区域中每个字符所在区域,确定包含每个字符所在区域的子区域,根据子区域的边框线与水平线的夹角,确定身份证图像的倾斜角度,从而在身份证图像的背景颜色与身份颜色接近或是身份证图像的图像质量不好时,也可以实现对身份证图像的准确的倾斜矫正,从而提高了本发明中的身份证信息提取方法的鲁棒性和提取精度。
实施例2:
为了确定出身份证号码所在区域中每个字符所在区域,在上述实施例的基础上,在本发明实施例中,所述根据所述身份证号码所在区域中每个字符所在区域,确定包含所述每个字符所在区域的子区域之前,所述方法还包括:
对所述身份证号码所在区域内像素点进行二值化处理,根据二值化处理后每个像素点的像素值,确定所述身份证号码所在区域内的每个连通域,将每个所述连通域,确定为每个字符所在区域。
在确定出该身份证图像中身份证号码所在区域的信息后,为了确定出包含身份证号码的每个字符所在区域。在本发明实施例中,对身份证号码所在区域内的像素点进行二值化处理。即将身份证号码所在区域内的像素点的像素值设置为0或255,使得身份证号码所在区域的图像呈现出明显的黑白效果。具体的,对像素点进行二值化处理的方法为现有技术,本发明实施例在此不做赘述。
根据二值化处理后的每个像素点的像素值,确定该身份证号码所在区域内的每个连通域。由于身份证号码所在区域内像素点二值化处理后,身份证号码中的每个字符所在区域的像素点的像素值被设置为255或0,除身份证号码外的其他区域的像素点的像素值被设置为0或255,因此,根据二值化处理后的每个像素点的像素值,可以确定出该身份证号码所在区域内的每个连通域。
将确定的每个连通域,确定为该身份号码所在区域中每个字符所在区域。其中每个字符所在区域包含对应的连通域中的每个像素点。其中,该连通域为不规则形状的区域。
实施例3:
为了确定出身份证号码所在区域内的每个连通域,在上述各实施例的基础上,在本发明实施例中,所述根据二值化处理后每个像素点的像素值,确定所述身份证号码所在区域内的每个连通域,包括:
根据二值化处理后的每个像素点的像素值,确定像素值为设定像素值的每个目标像素点;
针对每个目标像素点,确定所述目标像素点、及与所述目标像素点相邻的其他目标像素点构成的每个第一点集;
针对每个第一点集,若存在与该第一点集有相同目标像素点的其他第一点集,则基于存在相同目标像素点的其他第一点集对该第一点集进行更新,直到其他第一点集中与更新后的该第一点集不存在相同目标像素点;
针对更新后的每个第一点集,根据该更新后的第一点集中的目标像素点确定为所述身份证号码所在区域内的连通域。
在本发明实施例中,对身份证号码所在区域内的像素点进行二值化处理,在对像素点进行二值化处理后,像素点的像素值被设置为两种不同像素值。具体的,像素点的像素值被设置为0或255。
为了确定出身份证号码所在区域内的每个连通域,在本发明实施例中,由于对像素点进行二值化处理后,身份证号码所在区域中的每个字符上的像素点被设置为设定像素值。因此,首先根据二值化处理后的每个像素点的像素值,确定像素值为设定像素值的每个目标像素点。其中,为了更准确地确定出连通域,该设定像素值是255,或0,根据在进行二值化时采用的具体处理方式,选择不同的像素值作为设定像素值。
在确定出每个目标像素点后,为了确定出每个连通域,还需要确定出位于每个连通域的目标像素点。具体的,针对每个目标像素点,确定是否存在与该目标像素点相邻的其他的目标像素点。其中,该目标像素点与其他的目标像素点相邻可以是在四邻域内相邻,也可以是在八邻域内相邻。为了准确地确定出每个连通域,该目标像素点与其他的目标像素点相邻为八邻域内相邻。
针对每个目标像素点,在确定出与该目标像素点相邻的其他目标像素点后,将该目标像素点与相邻的其他目标像素点构成第一点集。在该目标像素点与其他的目标像素点相邻为八邻域内相邻时,该第一点集中最多存在九个目标像素点。
为了确定出身份证号码所在区域内的每个连通域,在确定出每个目标像素点的每个第一点集后,针对每个第一点集,判断其他的第一点集中是否存在与该第一点集中相同的目标像素点,若其他的第一点集中存在与该第一点集中相同的目标像素点时,基于该存在相同目标像素点的其他第一点集对该第一点集进行更新,将该存在相同目标像素点的其他第一点集中的除该相同目标像素点之外的其他目标像素点添加到该第一点集中。
例如,针对目标像素点a的第一点集中包含目标像素点a、b、c和d,其他第一点集中包含目标像素点c、e和f,确定该目标像素点a的第一点集和该其他第一点集中包含共同的目标像素点c,因此根据该其他第一点集对该目标像素点a的第一点集进行更新,更新后的该目标像素点a的第一点集中包含目标像素点a、b、c、d、e和f。
针对更新后的第一点集,循环判断其他的第一点集中是否存在与该更新后的第一点集中相同的目标像素点,并基于存在相同目标像素点的其他第一点集对该更新后的第一点集继续更新,直到其他第一点集中与更新后的该第一点集中不存在相同的目标像素点。
由于更新后的一个第一点集中的目标像素点位于一个连通域内,因此根据该更新后的第一点集中的目标像素点,确定身份证号码所在区域内的连通域,将更新后的第一点集中的目标像素点确定为一个连通域内的像素点。
实施例4:
为了确定出包含每个字符所在区域的子区域,在上述各实施例的基础上,在本发明实施例中,所述确定包含每个连通域的子区域,包括:
根据所述身份证号码所在区域中的每个字符所在区域的像素点,确定横坐标的最大值和最小值,以及纵坐标的最大值和最小值;
根据所述横坐标的最大值和最小值,以及纵坐标的最大值和最小值,确定所述身份证号码所在区域中的边界像素点,根据所述边界像素点确定包含每个字符所在区域的子区域。
为了确定出包含每个字符所在区域的子区域,预先设置子区域为矩形区域,因此可以通过确定该子区域的四个角的边界像素点,来确定出包含每个字符所在区域的子区域。
由于该子区域包含每个字符所在区域中的每个目标像素点,因此,该子区域的边界像素点的横坐标和纵坐标一定是字符所在区域中的所有目标像素点的横坐标和纵坐标的最大值和最小值。
因此,为了确定出该包含每个字符所在区域的子区域,根据该身份证号码所在区域内的每个字符所在区域内的每个像素点,确定出每个像素点的横坐标和纵坐标,根据每个像素点的横坐标和纵坐标,确定出横坐标的最大值和最小值,以及纵坐标的最大值和最小值。
根据确定的横坐标的最大值和最小值,以及纵坐标的最大值和最小值,可以确定出四个边界像素点的坐标值。具体的,根据横坐标的最大值、纵坐标的最大值,确定出第一个边界像素点;根据横坐标的最大值、纵坐标的最小值,确定出第二个边界像素点;根据横坐标的最小值、纵坐标的最大值,确定出第三个边界像素点;根据横坐标的最小值、纵坐标的最小值,确定出第四个边界像素点。
根据确定的四个边界像素点,确定包含每个字符所在区域的子区域。具体的,将四个边界像素点的连线构成的矩形区域,确定为包含每个字符所在区域的子区域。
实施例5:
为了实现对身份证图像的旋转矫正,在上述各实施例的基础上,在本发明实施例中,所述根据倾斜矫正后的所述身份证图像中的每个文本区域的位置信息,对所述身份证图像进行旋转矫正,包括:
根据检测得到的倾斜矫正后的所述身份证图像中的每个文本区域的位置信息,确定所述身份证图像中的所述子区域与所述每个文本区域的相对位置;
根据所述子区域与所述每个文本区域的相对位置,确定所述身份证图像的旋转角度,并对所述身份证图像进行旋转矫正。
在本发明实施例中,为了实现对身份证图像的旋转矫正,还需要确定出倾斜矫正后的该身份证图像中的每个文本区域的位置信息。具体的,在本发明实施例中,确定文本区域的位置信息可以采用现有技术中的基于颜色特征的文本区域定位算法、基于连通区域的文本区域定位算法、基于边缘的文本区域定位算法以及基于纹理特征的文本区域定位算法。
为了检测出身份证图像中的每个文本区域,在上述实施例的基础上,在本发明实施例中,检测倾斜矫正后的所述身份证图像中的每个文本区域,包括:
基于预先训练完成的文本检测模型,检测得到倾斜矫正后的所述身份证图像中包含每种身份证信息的每个文本区域的信息。
在本发明实施例中,为了实现检测出身份证图像中的每个文本区域,预先训练有文本检测模型,该文本检测模型可以实现对身份证图像中的每个文本区域的识别。模型输出了每个文本区域所在区域的信息。
将该倾斜矫正后的身份证图像输入到该训练完成的文本检测模型中,该文本检测模型对该倾斜矫正后的身份证图像进行处理,确定该身份证图像中包含每种身份证信息的每个文本区域的信息。具体的,确定出了每个文本区域的位置信息。
在本发明实施例中,该文本检测模型可以是现有的文本检测模型,也可以是通过大量的身份证样本图像对现有的神经网络模型进行训练得到的文本检测模型,具体的,本发明实施例对此不做限制。
图2为本发明实施例提供的一种身份证图像中每个文本区域的示意图,如图2所示,图中除身份证号码的矩形区域之外的其他的矩形区域,为该身份证图像中的文本区域。
在确定出倾斜矫正后的该身份证图像中的每个文本区域的位置信息后,根据已知的文本区域的位置信息以及包含身份证号码的子区域的位置信息,该电子设备还可以确定出子区域和每个文本区域的相对位置。
其中,在本发明实施例中,该子区域与文本区域的相对位置包括:子区域位于文本区域的下方、子区域位于文本区域的上方、子区域位于文本区域的左侧以及子区域位于文本区域的右侧。
为了实现对身份证图像的旋转矫正,该电子设备还预先保存有相对位置与旋转角度的对应关系,根据确定出的子区域位于文本区域的目标相对位置,该电子设备可以确定出该目标相对位置对应的旋转角度,将该旋转角度确定为身份证图像的旋转角度,并对身份证图像进行旋转矫正。
为了确定出倾斜矫正后的身份证图像的旋转角度,在上述各实施例的基础上,在本发明实施例中,所述根据倾斜矫正后的所述身份证图像中的所述子区域与检测得到的每个文本区域的相对位置,确定所述身份证图像的旋转角度,包括:
根据所述子区域,若确定所述身份证图像位于水平方向,确定纵坐标大于所述子区域的纵坐标的文本区域的数量与全部文本区域的数量的第一比值,判断所述第一比值是否大于第一设定阈值,若是,确定所述子区域位于所述文本区域的下方,若否,确定所述子区域位于所述文本区域的上方;
若确定所述身份证图像位于竖直方向,确定横坐标大于所述子区域的横坐标的文本区域的数量与全部文本区域的数量的第二比值,判断所述第二比值是否大于所述第二设定阈值,若是,确定所述子区域位于所述文本区域的左侧,若否,确定所述子区域位于所述文本区域的右侧;
根据确定的所述子区域位于所述文本区域的目标相对位置、及相对位置与旋转角度的对应关系,将所述目标相对位置对应的旋转角度确定为所述身份证图像的目标旋转角度。
在将身份证图像进行倾斜矫正后,倾斜矫正后的身份证图像可能是水平方向,也可能是竖直方向。为了准确地确定身份证图像的旋转角度,首先根据身份证图像的子区域,确定出该身份证图像位于的方向。
一般来说,身份证号码都较长,该包含身份证号码的子区域为矩形区域,根据该倾斜矫正后的身份证图像中该子区域的宽高比,可以确定该身份证图像处于水平方向,还是竖直方向。具体的,在该子区域的宽高比大于1时,确定该身份证图像位于水平方向,在该宽高比小于1时,确定该身份证图像位于竖直方向。
图3为本发明实施例提供的一种倾斜矫正后的身份证图像的示意图,图3中的身份证图像位于水平方向,并且该身份证图像中的人脸图像位于该身份证图像中的右侧,文本位于该身份证图像中的左侧,该身份证图像中身份证号码所在区域位于每个文本区域下方。
图4为本发明实施例提供的一种倾斜矫正后的身份证图像的示意图,图4中的身份证图像位于水平方向,并且该身份证图像中的人脸图像位于该身份证图像中的左侧,文本位于该身份证图像中的右侧,该身份证图像中身份证号码所在区域位于每个文本区域上方。
图5为本发明实施例提供的一种倾斜矫正后的身份证图像的示意图,图5中的身份证图像位于竖直方向,并且该身份证图像中的身份证号码所在区域位于该身份证图像的左侧,该身份证图像中身份证号码所在区域位于每个文本区域的左侧。
图6为本发明实施例提供的一种倾斜矫正后的身份证图像的示意图。图6中的身份证图像位于竖直方向,并且该身份证图像中的身份证号码所在区域位于该身份证图像的右侧,该身份证图像中身份证号码所在区域位于每个文本区域的右侧。
在本发明实施例中,倾斜矫正后的身份证图像的方向可以是如图3、图4、图5和图6中的身份证图像的方向中的任一种,根据图3、图4、图5和图6所示的身份证图像的示意图可知,为了使旋转矫正后的身份证图像位于如图2所示的预设方向,在本发明实施例中,根据身份证图像中的身份证号码所在区域与每个文本区域的相对位置,就可以确定出身份证图像的旋转角度。
例如,在该身份证图像位于水平方向时,为了确定出该身份证方向的旋转角度,首先确定出该身份证图像中的子区域与文本区域的相对位置。具体的,在该身份证图像位于水平方向时,确定该子区域的中心点的纵坐标和文本区域的中心点的纵坐标,根据该子区域的纵坐标和文本区域的纵坐标,确定出纵坐标大于子区域的纵坐标的文本区域的数量,并确定出该数量和全部文本区域的数量的第一比值。
根据该第一比值的大小,可以确定出在该身份证图像位于水平方向时,该子区域位于身份证号码所在区域的相对位置。具体的,判断该第一比值是否大于第一设定阈值,若是,则确定该子区域位于文本区域的下方,若否,确定该子区域位于文本区域的上方。如图3所示的示意图即为子区域位于文本区域的下方时的身份证图像的示意图,如图4所示的示意图即为子区域位于文本区域的上方时的身份证图像的示意图。
其中,该第一设定阈值是用于预先设置的,若用户希望提高确定相对位置的准确度,则可以将该第一设定阈值设置地较大一些。例如该第一设定阈值可以是5。若用户希望提高确定相对位置时的鲁棒性,即在检测的某些文本区域的中心点存在较大偏差时,也能确定出子区域位于文本区域的相对位置,则可以将该第一设定阈值设置地较小一些,例如该第一设定阈值可以是3。
在该身份证图像位于竖直方向时,为了确定出该身份证方向的旋转角度,首先确定出该身份证图像中的子区域位于文本区域的目标相对位置。具体的,在该身份证图像位于竖直方向时,确定该子区域的中心点的横坐标和文本区域的中心点的横坐标,根据该子区域的横坐标和文本区域的横坐标,确定出横坐标大于子区域的横坐标的文本区域的数量,并确定出该数量和全部文本区域的数量的第二比值。
根据该第二比值的大小,可以确定出在该身份证图像位于竖直方向时,该子区域位于身份证号码所在区域的相对位置。具体的,判断该第二比值是否大于第二设定阈值,若是,则确定该子区域位于文本区域的左侧,若否,确定该子区域位于文本区域的右侧。
如图5所示的示意图即为子区域位于文本区域的左侧时的身份证图像的示意图,图6所示的示意图即为子区域位于文本区域的右侧时的身份证图像的示意图。
在确定出该身份证图像中的该子区域位于文本区域的目标相对位置后,根据确定的该目标相对位置、及相对位置与旋转角度的对应关系,确定该目标相对位置对应的旋转角度为该身份证图像的目标旋转角度。
具体的,在确定该子区域位于文本区域的下方时,如图3所示的示意图,该子区域位于文本区域的下方对应的旋转角度为0度,因此确定该身份证图像的旋转角度为0度,即不对该身份证图像进行旋转;在该子区域位于文本区域的上方时,如图4所示的示意图,该子区域位于文本区域的上方对应的旋转角度为顺时针180度,因此确定该身份证图像的旋转角度为顺时针180度;在该子区域位于文本区域的左侧时,如图5所示的示意图,该子区域位于文本区域的左侧的旋转角度为逆时针90度,因此确定该身份证图像的旋转角度为逆时针90度;在该子区域位于文本区域的右侧时,如图6所示的示意图,该子区域位于文本区域的右侧的旋转角度为逆时针90度,因此确定该身份证图像的旋转角度为顺时针90度。
实施例6:
为了实现对识别出的民族信息的纠错,在上述各实施例的基础上,在本发明实施例中,所述识别旋转矫正后的所述身份证图像中包含的身份证信息包括:
若在所述矫正后的身份证图像中识别到身份证信息中的民族信息,将民族信息对应的第一字符串,与保存的民族的文字数据库中的每个字符串进行匹配;
若在所述文字数据库中匹配到相似度大于第三设定阈值的第二字符串,则将识别的所述第一字符串作为所述身份证信息中的民族信息;
若在所述文字数据库中未匹配到相似度大于第三设定阈值的第二字符串,则所述文字数据库中与所述第一字符串相似度最高的第三字符串作为所述身份证信息中的民族信息。
在本发明实施例中,在识别旋转矫正后的身份证图像中包含的身份证信息时,可以采用现有技术中的识别方法识别文本区域中的字符串,将识别到的字符串确定为该身份证图像中包含的身份证信息。
具体的,在识别身份证信息中的民族信息时,在确定的文本区域的字符串中,识别包含‘民族’字符串,将该字符串中除民族两个字符外的剩余字符串确定为该民族信息对应的第一字符串,将该第一字符串确定为该身份证信息中的民族信息。
在识别到身份证信息中的民族信息后,由于民族的文字较为复杂,在识别民族信息所在的文本区域中的字符时,该字符串可能被识别错误,因此在识别出民族信息对应的第一字符串后,还需要对该第一字符串进行纠错。
为了实现对该第一字符串的纠错,在本发明实施例中,预先保存有民族的文字数据库,该文字数据库中保存有各个民族对应的正确的字符串。
将该民族信息对应的第一字符串,与保存的民族的文字数据库中的每个字符串进行匹配,确定出该第一字符串与每个字符串的相似度。具体的,确定该第一字符串与每个字符串的相似度的方法为现有技术,例如可以是编辑距离方法确定。
为了确定该第一字符串与文字数据库中的字符串是否匹配成功,在本发明实施例中,预先设置有第三设定阈值,该第三设定阈值是根据需求预先设置的。
若在该文字数据库中匹配到相似度大于第三设定阈值的第二字符串时,则说明该第一字符串与文字数据库中民族信息对应的正确的字符串匹配成功,则将该第一字符串作为身份证信息中的民族信息。
若在该文字数据库中未匹配到相似度大于第三设定阈值的第二字符串时,则说明该第一字符串与文字数据库中民族信息对应的正确的字符串匹配不成功,该第一字符串不是该民族信息对应的正确字符串。根据该第一字符串与文字数据库中的每个字符串的相似度,确定出相似度最高的第三字符串,将该第三字符串作为该身份证信息中的民族信息。
为了识别出所有的身份证信息,在上述各实施例的基础上,在本发明实施例中,识别旋转矫正后的所述身份证图像中包含的身份证信息包括:
判断识别出的身份证信息的数量是否达到设定的数量阈值;
若否,根据预先保存的身份证信息中包含的每个字符串,确定在所述身份证图像中未被识别的目标字符串,将所述目标字符串拆分为多个字符,针对每个字符,在矫正后的身份证图像中识别包含该字符的字符串,将识别到的字符串作为包含该目标字符串的身份证信息。
身份证图像中包含的身份证信息的数量是确定的,在识别到旋转矫正后的身份证图像中包含的身份证信息后,为了确定是否识别出所有的身份证信息,首先确定识别出的身份证信息的数量,判断该数量是否达到设定的数量阈值。其中,该设定的数量阈值是指身份证应具有的身份证信息,在本发明实施例中,该身份证信息包括姓名信息、性别信息、民族信息、出生信息、地址信息和身份证号码信息共六种身份证信息,因此该设定的数量阈值为6。
若该识别出的身份证信息的数量未达到设定的数量阈值时,根据保存的身份证信息中包含的每个字符串,确定出在身份证图像中未被识别出的目标字符串。该保存的身份证信息中包含的每个字符串分别是‘姓名’、‘性别’‘民族’‘出生’、‘地址’和‘公民身份号码’。
为了提高识别出身份证信息的可能性,在本发明实施例中,将该目标字符串拆分为多个字符,针对每个字符,在矫正后的身份证图像中识别包含该字符的字符串,将识别到的字符串作为包含该目标字符串的身份证信息。在本发明实施例中,针对每个字符进行识别时,可能识别到一个字符串,也可能识别到多个字符串,若识别到多个字符串时,则先识别其他未被识别的目标字符串的身份证信息,将剩余的字符串作为该目标字符串的身份证信息。
例如,在该目标字符串为‘姓名’时,将该‘姓名’拆分为‘姓’和‘名’,针对‘姓’在该旋转矫正后的身份证图像中识别包含字符‘姓’的字符串,将识别到的字符串作为包含该目标字符串‘姓名’的身份证信息。
在本发明实施例中,为了识别出身份证信息中的地址信息,由于包含地址信息的文本区域不止一个,如图2所示,包含地址信息的文本区域有两个。
为了识别出完整的地址信息,在本发明实施例中,识别身份证信息中的地址信息时,在确定的文本区域的字符串中,识别包含地址两字的文本区域中的字符串,将该字符串中除地址两个字符外的剩余字符串确定为该地址信息对应的字符串。
在确定出该包含地址两字的字符串的文本区域后,根据该文本区域的中心点的纵坐标,以及该子区域的中心点的纵坐标,确定出纵坐标位于两者之间的文本区域,将该文本区域的字符串也确定为该地址信息对应的字符串,并将该两个字符串合并为一个字符串,具体是将该文本区域的字符串连接在该包含地址两字的文本区域的字符串之后。
在本发明实施例中,在确定出地址信息对应的字符串后,将字符串‘地址’作为主键key,将该地址信息对应的字符串作为该主键的value值,并且将该地址信息对应的字符串添加标签,在识别其他的身份证信息,不再识别添加了标签的字符串,从而可以提高身份证信息提取的效率。
实施例7:
图7为本发明实施例提供的一种身份证信息提取方法的过程示意图,如图7所示。
S701:输入身份证图像。
S702:倾斜矫正:基于预先训练完成的深度学***线的夹角,确定身份证图像的倾斜角度,对身份证图像进行倾斜矫正。
S703:文本检测:基于预先训练完成的文本检测模型,检测得到倾斜矫正后的身份证图像中包含每种身份证信息的每个文本区域的信息。
S704:文本方向检测:根据子区域,若确定身份证图像位于水平方向,确定纵坐标大于子区域的纵坐标的文本区域的数量与全部文本区域的数量的第一比值,判断第一比值是否大于第一设定阈值,若是,确定子区域位于文本区域的下方,若否,确定子区域位于文本区域的上方;若确定身份证图像位于竖直方向,确定横坐标大于所述子区域的横坐标的文本区域的数量与全部文本区域的数量的第二比值,判断第二比值是否大于所述第二设定阈值,若是,确定子区域位于所述文本区域的左侧,若否,确定子区域位于文本区域的右侧;根据确定的子区域位于文本区域的目标相对位置、及相对位置与旋转角度的对应关系,将目标相对位置对应的旋转角度确定为身份证图像的目标旋转角度。
S705:文本识别:识别旋转矫正后的所述身份证图像中包含的身份证信息,将识别出的每个文本区域的字符串确定为一种身份证信息。
S706:结构化分析:根据预先保存的身份证信息中包含的每个字符串,针对每个字符串,在每个文本区域的字符串中识别包含该字符串的文本区域的字符串,将该文本区域的字符串确定为该字符串的身份证信息。
S707:民族信息纠错:若在旋转矫正后的身份证图像中识别到身份证信息中的民族信息,将民族信息对应的第一字符串,与保存的民族的文字数据库中的每个字符串进行匹配;若在文字数据库中匹配到相似度大于第三设定阈值的第二字符串,则将识别的所述第一字符串作为所述身份证信息中的民族信息;若在文字数据库中未匹配到相似度大于第三设定阈值的第二字符串,则文字数据库中与所述第一字符串相似度最高的第三字符串作为所述身份证信息中的民族信息。
S708:输出识别的身份证信息。
实施例8:
在上述各实施例的基础上,图8为本发明实施例提供的一种身份证信息提取装置的结构示意图,所述装置包括:
确定模块801,用于基于预先训练完成的深度学习网络模型,确定输入的身份证图像中身份证号码所在区域的信息;根据所述身份证号码所在区域中每个字符所在区域,确定包含所述每个字符所在区域的子区域;
识别模块802,用于根据所述子区域的边框线与水平线的夹角,对所述身份证图像进行倾斜矫正,并根据倾斜矫正后的所述身份证图像中的每个文本区域的位置信息,对所述身份证图像进行旋转矫正,识别旋转矫正后的所述身份证图像中包含的身份证信息。
所述确定模块801,还用于所述根据所述身份证号码所在区域中每个字符所在区域,确定包含所述每个字符所在区域的子区域之前,对所述身份证号码所在区域内像素点进行二值化处理,根据二值化处理后每个像素点的像素值,确定所述身份证号码所在区域内的每个连通域,将每个所述连通域,确定为每个字符所在区域。
所述确定模块801,具体用于根据二值化处理后的每个像素点的像素值,确定像素值为设定像素值的每个目标像素点;针对每个目标像素点,确定所述目标像素点、及与所述目标像素点相邻的其他目标像素点构成的每个第一点集;针对每个第一点集,若存在与该第一点集有相同目标像素点的其他第一点集,则基于存在相同目标像素点的其他第一点集对该第一点集进行更新,直到其他第一点集中与更新后的该第一点集不存在相同目标像素点;针对更新后的每个第一点集,根据该更新后的第一点集中的目标像素点确定为所述身份证号码所在区域内的连通域。
所述确定模块801,具体还用于根据所述身份证号码所在区域中每个字符所在区域的像素点,确定横坐标的最大值和最小值,以及纵坐标的最大值和最小值;根据所述横坐标的最大值和最小值,以及纵坐标的最大值和最小值,确定所述身份证号码所在区域中的边界像素点,根据所述边界像素点确定包含每个字符所在区域的子区域。
所述识别模块802,具体用于根据检测得到的倾斜矫正后的所述身份证图像中的每个文本区域的位置信息,确定所述身份证图像中的所述子区域与所述每个文本区域的相对位置;根据所述子区域与所述每个文本区域的相对位置,确定所述身份证图像的旋转角度,并对所述身份证图像进行旋转矫正。
所述识别模块802,具体用于基于预先训练完成的文本检测模型,检测得到倾斜矫正后的所述身份证图像中包含每种身份证信息的每个文本区域的信息。
所述识别模块802,具体用于根据所述子区域,若确定所述身份证图像位于水平方向,确定纵坐标大于所述子区域的纵坐标的文本区域的数量与全部文本区域的数量的第一比值,判断所述第一比值是否大于第一设定阈值,若是,确定所述子区域位于所述文本区域的下方,若否,确定所述子区域位于所述文本区域的上方;若确定所述身份证图像位于竖直方向,确定横坐标大于所述子区域的横坐标的文本区域的数量与全部文本区域的数量的第二比值,判断所述第二比值是否大于所述第二设定阈值,若是,确定所述子区域位于所述文本区域的左侧,若否,确定所述子区域位于所述文本区域的右侧;根据确定的所述子区域位于所述文本区域的目标相对位置、及相对位置与旋转角度的对应关系,将所述目标相对位置对应的旋转角度确定为所述身份证图像的目标旋转角度。
所述识别模块802,具体还用于若在所述矫正后的身份证图像中识别到身份证信息中的民族信息,将民族信息对应的第一字符串,与保存的民族的文字数据库中的每个字符串进行匹配;若在所述文字数据库中匹配到相似度大于第三设定阈值的第二字符串,则将识别的所述第一字符串作为所述身份证信息中的民族信息;若在所述文字数据库中未匹配到相似度大于第三设定阈值的第二字符串,则所述文字数据库中与所述第一字符串相似度最高的第三字符串作为所述身份证信息中的民族信息。
所述识别模块802,具体还用于判断识别出的身份证信息的数量是否达到设定的数量阈值;若否,根据预先保存的身份证信息中包含的每个字符串,确定在所述身份证图像中未被识别的目标字符串,将所述目标字符串拆分为多个字符,针对每个字符,在矫正后的身份证图像中识别包含该字符的字符串,将识别到的字符串作为包含该目标字符串的身份证信息。
实施例9:
图9为本发明实施例提供的一种电子设备结构示意图,在上述各实施例的基础上,本发明实施例中还提供了一种电子设备,包括处理器901、通信接口902、存储器903和通信总线904,其中,处理器901,通信接口902,存储器903通过通信总线904完成相互间的通信;
所述存储器903中存储有计算机程序,当所述程序被所述处理器901执行时,使得所述处理器901执行如下步骤:
基于预先训练完成的深度学习网络模型,确定输入的身份证图像中身份证号码所在区域的信息;
根据所述身份证号码所在区域中每个字符所在区域,确定包含所述每个字符所在区域的子区域;
根据所述子区域的边框线与水平线的夹角,对所述身份证图像进行倾斜矫正,并根据倾斜矫正后的所述身份证图像中的每个文本区域的位置信息,对所述身份证图像进行旋转矫正,识别旋转矫正后的所述身份证图像中包含的身份证信息。
进一步地,所述处理器901具体用于所述根据所述身份证号码所在区域中每个字符所在区域,确定包含所述每个字符所在区域的子区域之前,所述方法还包括:
对所述身份证号码所在区域内像素点进行二值化处理,根据二值化处理后每个像素点的像素值,确定所述身份证号码所在区域内的每个连通域,将每个所述连通域,确定为每个字符所在区域。
进一步地,所述处理器901具体用于所述根据二值化处理后每个像素点的像素值,确定所述身份证号码所在区域内的每个连通域,包括:
根据二值化处理后的每个像素点的像素值,确定像素值为设定像素值的每个目标像素点;
针对每个目标像素点,确定所述目标像素点、及与所述目标像素点相邻的其他目标像素点构成的每个第一点集;
针对每个第一点集,若存在与该第一点集有相同目标像素点的其他第一点集,则基于存在相同目标像素点的其他第一点集对该第一点集进行更新,直到其他第一点集中与更新后的该第一点集不存在相同目标像素点;
针对更新后的每个第一点集,根据该更新后的第一点集中的目标像素点确定为所述身份证号码所在区域内的连通域。
进一步地,所述处理器901具体用于所述确定包含每个字符所在区域的子区域,包括:
根据所述身份证号码所在区域中每个字符所在区域的像素点,确定横坐标的最大值和最小值,以及纵坐标的最大值和最小值;
根据所述横坐标的最大值和最小值,以及纵坐标的最大值和最小值,确定所述身份证号码所在区域中的边界像素点,根据所述边界像素点确定包含每个字符所在区域的子区域。
进一步地,所述根据倾斜矫正后的所述身份证图像中的每个文本区域的位置信息,对所述身份证图像进行旋转矫正,包括:
根据检测得到的倾斜矫正后的所述身份证图像中的每个文本区域的位置信息,确定所述身份证图像中的所述子区域与所述每个文本区域的相对位置;
根据所述子区域与所述每个文本区域的相对位置,确定所述身份证图像的旋转角度,并对所述身份证图像进行旋转矫正。
进一步地,所述处理器901具体用于检测倾斜矫正后的所述身份证图像中的每个文本区域,包括:
基于预先训练完成的文本检测模型,检测得到倾斜矫正后的所述身份证图像中包含每种身份证信息的每个文本区域的信息。
进一步地,所述处理器901具体用于所述根据所述子区域与所述每个文本区域的相对位置,确定所述身份证图像的旋转角度,包括:
根据所述子区域,若确定所述身份证图像位于水平方向,确定纵坐标大于所述子区域的纵坐标的文本区域的数量与全部文本区域的数量的第一比值,判断所述第一比值是否大于第一设定阈值,若是,确定所述子区域位于所述文本区域的下方,若否,确定所述子区域位于所述文本区域的上方;
若确定所述身份证图像位于竖直方向,确定横坐标大于所述子区域的横坐标的文本区域的数量与全部文本区域的数量的第二比值,判断所述第二比值是否大于所述第二设定阈值,若是,确定所述子区域位于所述文本区域的左侧,若否,确定所述子区域位于所述文本区域的右侧;
根据确定的所述子区域位于所述文本区域的目标相对位置、及相对位置与旋转角度的对应关系,将所述目标相对位置对应的旋转角度确定为所述身份证图像的目标旋转角度。
进一步地,所述处理器901具体用于所述识别旋转矫正后的所述身份证图像中包含的身份证信息包括:
若在所述矫正后的身份证图像中识别到身份证信息中的民族信息,将民族信息对应的第一字符串,与保存的民族的文字数据库中的每个字符串进行匹配;
若在所述文字数据库中匹配到相似度大于第三设定阈值的第二字符串,则将识别的所述第一字符串作为所述身份证信息中的民族信息;
若在所述文字数据库中未匹配到相似度大于第三设定阈值的第二字符串,则所述文字数据库中与所述第一字符串相似度最高的第三字符串作为所述身份证信息中的民族信息。
进一步地,所述处理器901具体用于识别旋转矫正后的所述身份证图像中包含的身份证信息包括:
判断识别出的身份证信息的数量是否达到设定的数量阈值;
若否,根据预先保存的身份证信息中包含的每个字符串,确定在所述身份证图像中未被识别的目标字符串,将所述目标字符串拆分为多个字符,针对每个字符,在矫正后的身份证图像中识别包含该字符的字符串,将识别到的字符串作为包含该目标字符串的身份证信息。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口902用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选地,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述处理器可以是通用处理器,包括中央处理器、网络处理器(NetworkProcessor,NP)等;还可以是数字指令处理器(Digital Signal Processing,DSP)、专用集成电路、现场可编程门陈列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。
实施例10:
在上述各实施例的基础上,本发明实施例还提供了一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行如下步骤:
基于预先训练完成的深度学习网络模型,确定输入的身份证图像中身份证号码所在区域的信息;
根据所述身份证号码所在区域中每个字符所在区域,确定包含所述每个字符所在区域的子区域;
根据所述子区域的边框线与水平线的夹角,对所述身份证图像进行倾斜矫正,并根据倾斜矫正后的所述身份证图像中的每个文本区域的位置信息,对所述身份证图像进行旋转矫正,识别旋转矫正后的所述身份证图像中包含的身份证信息。
进一步地,所述根据所述身份证号码所在区域中每个字符所在区域,确定包含所述每个字符所在区域的子区域之前,所述方法还包括:
对所述身份证号码所在区域内像素点进行二值化处理,根据二值化处理后每个像素点的像素值,确定所述身份证号码所在区域内的每个连通域,将每个所述连通域,确定为每个字符所在区域。
所述根据二值化处理后每个像素点的像素值,确定所述身份证号码所在区域内的每个连通域,包括:
根据二值化处理后的每个像素点的像素值,确定像素值为设定像素值的每个目标像素点;
针对每个目标像素点,确定所述目标像素点、及与所述目标像素点相邻的其他目标像素点构成的每个第一点集;
针对每个第一点集,若存在与该第一点集有相同目标像素点的其他第一点集,则基于存在相同目标像素点的其他第一点集对该第一点集进行更新,直到其他第一点集中与更新后的该第一点集不存在相同目标像素点;
针对更新后的每个第一点集,根据该更新后的第一点集中的目标像素点确定为所述身份证号码所在区域内的连通域。
所述确定包含每个字符所在区域的子区域,包括:
根据所述身份证号码所在区域中每个字符所在区域的像素点,确定横坐标的最大值和最小值,以及纵坐标的最大值和最小值;
根据所述横坐标的最大值和最小值,以及纵坐标的最大值和最小值,确定所述身份证号码所在区域中的边界像素点,根据所述边界像素点确定包含每个字符所在区域的子区域。
进一步地,所述根据倾斜矫正后的所述身份证图像中的每个文本区域的位置信息,对所述身份证图像进行旋转矫正,包括:
根据检测得到的倾斜矫正后的所述身份证图像中的每个文本区域的位置信息,确定所述身份证图像中的所述子区域与所述每个文本区域的相对位置;
根据所述子区域与所述每个文本区域的相对位置,确定所述身份证图像的旋转角度,并对所述身份证图像进行旋转矫正。
检测倾斜矫正后的所述身份证图像中的每个文本区域,包括:
基于预先训练完成的文本检测模型,检测得到倾斜矫正后的所述身份证图像中包含每种身份证信息的每个文本区域的信息。
所述根据所述子区域与所述每个文本区域的相对位置,确定所述身份证图像的旋转角度,包括:
根据所述子区域,若确定所述身份证图像位于水平方向,确定纵坐标大于所述子区域的纵坐标的文本区域的数量与全部文本区域的数量的第一比值,判断所述第一比值是否大于第一设定阈值,若是,确定所述子区域位于所述文本区域的下方,若否,确定所述子区域位于所述文本区域的上方;
若确定所述身份证图像位于竖直方向,确定横坐标大于所述子区域的横坐标的文本区域的数量与全部文本区域的数量的第二比值,判断所述第二比值是否大于所述第二设定阈值,若是,确定所述子区域位于所述文本区域的左侧,若否,确定所述子区域位于所述文本区域的右侧;
根据确定的所述子区域位于所述文本区域的目标相对位置、及相对位置与旋转角度的对应关系,将所述目标相对位置对应的旋转角度确定为所述身份证图像的目标旋转角度。
所述识别旋转矫正后的所述身份证图像中包含的身份证信息包括:
若在所述矫正后的身份证图像中识别到身份证信息中的民族信息,将民族信息对应的第一字符串,与保存的民族的文字数据库中的每个字符串进行匹配;
若在所述文字数据库中匹配到相似度大于第三设定阈值的第二字符串,则将识别的所述第一字符串作为所述身份证信息中的民族信息;
若在所述文字数据库中未匹配到相似度大于第三设定阈值的第二字符串,则所述文字数据库中与所述第一字符串相似度最高的第三字符串作为所述身份证信息中的民族信息。
识别旋转矫正后的所述身份证图像中包含的身份证信息包括:
判断识别出的身份证信息的数量是否达到设定的数量阈值;
若否,根据预先保存的身份证信息中包含的每个字符串,确定在所述身份证图像中未被识别的目标字符串,将所述目标字符串拆分为多个字符,针对每个字符,在矫正后的身份证图像中识别包含该字符的字符串,将识别到的字符串作为包含该目标字符串的身份证信息。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (12)

1.一种身份证信息提取方法,其特征在于,所述方法包括:
基于预先训练完成的深度学习网络模型,确定输入的身份证图像中身份证号码所在区域的信息;
根据所述身份证号码所在区域中每个字符所在区域,确定包含所述每个字符所在区域的子区域;
根据所述子区域的边框线与水平线的夹角,对所述身份证图像进行倾斜矫正,并根据倾斜矫正后的所述身份证图像中的每个文本区域的位置信息,对所述身份证图像进行旋转矫正,识别旋转矫正后的所述身份证图像中包含的身份证信息。
2.根据权利要求1所述的方法,其特征在于,所述根据所述身份证号码所在区域中每个字符所在区域,确定包含所述每个字符所在区域的子区域之前,所述方法还包括:
对所述身份证号码所在区域内像素点进行二值化处理,根据二值化处理后每个像素点的像素值,确定所述身份证号码所在区域内的每个连通域,将每个所述连通域,确定为每个字符所在区域。
3.根据权利要求2所述的方法,其特征在于,所述根据二值化处理后每个像素点的像素值,确定所述身份证号码所在区域内的每个连通域,包括:
根据二值化处理后的每个像素点的像素值,确定像素值为设定像素值的每个目标像素点;
针对每个目标像素点,确定所述目标像素点、及与所述目标像素点相邻的其他目标像素点构成的每个第一点集;
针对每个第一点集,若存在与该第一点集有相同目标像素点的其他第一点集,则基于存在相同目标像素点的其他第一点集对该第一点集进行更新,直到其他第一点集中与更新后的该第一点集不存在相同目标像素点;
针对更新后的每个第一点集,根据该更新后的第一点集中的目标像素点确定为所述身份证号码所在区域内的连通域。
4.根据权利要求1或2所述的方法,其特征在于,所述确定包含每个字符所在区域的子区域,包括:
根据所述身份证号码所在区域中每个字符所在区域的像素点,确定横坐标的最大值和最小值,以及纵坐标的最大值和最小值;
根据所述横坐标的最大值和最小值,以及纵坐标的最大值和最小值,确定所述身份证号码所在区域中的边界像素点,根据所述边界像素点确定包含每个字符所在区域的子区域。
5.根据权利要求1所述的方法,其特征在于,所述根据倾斜矫正后的所述身份证图像中的每个文本区域的位置信息,对所述身份证图像进行旋转矫正,包括:
根据检测得到的倾斜矫正后的所述身份证图像中的每个文本区域的位置信息,确定所述身份证图像中的所述子区域与所述每个文本区域的相对位置;
根据所述子区域与所述每个文本区域的相对位置,确定所述身份证图像的旋转角度,并对所述身份证图像进行旋转矫正。
6.根据权利要求5所述的方法,其特征在于,检测倾斜矫正后的所述身份证图像中的每个文本区域,包括:
基于预先训练完成的文本检测模型,检测得到倾斜矫正后的所述身份证图像中包含每种身份证信息的每个文本区域的信息。
7.根据权利要求5所述的方法,其特征在于,所述根据所述子区域与所述每个文本区域的相对位置,确定所述身份证图像的旋转角度,包括:
根据所述子区域,若确定所述身份证图像位于水平方向,确定纵坐标大于所述子区域的纵坐标的文本区域的数量与全部文本区域的数量的第一比值,判断所述第一比值是否大于第一设定阈值,若是,确定所述子区域位于所述文本区域的下方,若否,确定所述子区域位于所述文本区域的上方;
若确定所述身份证图像位于竖直方向,确定横坐标大于所述子区域的横坐标的文本区域的数量与全部文本区域的数量的第二比值,判断所述第二比值是否大于所述第二设定阈值,若是,确定所述子区域位于所述文本区域的左侧,若否,确定所述子区域位于所述文本区域的右侧;
根据确定的所述子区域位于所述文本区域的目标相对位置、及相对位置与旋转角度的对应关系,将所述目标相对位置对应的旋转角度确定为所述身份证图像的目标旋转角度。
8.根据权利要求1所述的方法,其特征在于,所述识别旋转矫正后的所述身份证图像中包含的身份证信息包括:
若在所述矫正后的身份证图像中识别到身份证信息中的民族信息,将民族信息对应的第一字符串,与保存的民族的文字数据库中的每个字符串进行匹配;
若在所述文字数据库中匹配到相似度大于第三设定阈值的第二字符串,则将识别的所述第一字符串作为所述身份证信息中的民族信息;
若在所述文字数据库中未匹配到相似度大于第三设定阈值的第二字符串,则所述文字数据库中与所述第一字符串相似度最高的第三字符串作为所述身份证信息中的民族信息。
9.根据权利要求1所述的方法,其特征在于,识别旋转矫正后的所述身份证图像中包含的身份证信息包括:
判断识别出的身份证信息的数量是否达到设定的数量阈值;
若否,根据预先保存的身份证信息中包含的每个字符串,确定在所述身份证图像中未被识别的目标字符串,将所述目标字符串拆分为多个字符,针对每个字符,在矫正后的身份证图像中识别包含该字符的字符串,将识别到的字符串作为包含该目标字符串的身份证信息。
10.一种身份证信息提取装置,其特征在于,所述装置包括:
确定模块,用于基于预先训练完成的深度学习网络模型,确定输入的身份证图像中身份证号码所在区域的信息;根据所述身份证号码所在区域中每个字符所在区域,确定包含所述每个字符所在区域的子区域;
识别模块,用于根据所述子区域的边框线与水平线的夹角,对所述身份证图像进行倾斜矫正,并根据倾斜矫正后的所述身份证图像中的每个文本区域的位置信息,对所述身份证图像进行旋转矫正,识别旋转矫正后的所述身份证图像中包含的身份证信息。
11.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述存储器用于存储程序指令,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1-9中任一所述身份证信息提取方法的步骤。
12.一种计算机可读存储介质,其特征在于,其存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-9中任一所述身份证信息提取方法的步骤。
CN202010653020.4A 2020-07-08 2020-07-08 一种身份证信息提取方法、装置、设备和介质 Pending CN111914836A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010653020.4A CN111914836A (zh) 2020-07-08 2020-07-08 一种身份证信息提取方法、装置、设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010653020.4A CN111914836A (zh) 2020-07-08 2020-07-08 一种身份证信息提取方法、装置、设备和介质

Publications (1)

Publication Number Publication Date
CN111914836A true CN111914836A (zh) 2020-11-10

Family

ID=73227699

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010653020.4A Pending CN111914836A (zh) 2020-07-08 2020-07-08 一种身份证信息提取方法、装置、设备和介质

Country Status (1)

Country Link
CN (1) CN111914836A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112528776A (zh) * 2020-11-27 2021-03-19 京东数字科技控股股份有限公司 文本行校正方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040181671A1 (en) * 1998-11-19 2004-09-16 Brundage Trent J. Identification document and related methods
CN102955941A (zh) * 2011-08-31 2013-03-06 汉王科技股份有限公司 身份信息录入方法和装置
CN108268868A (zh) * 2017-07-28 2018-07-10 平安科技(深圳)有限公司 身份证图像的倾斜值获取方法及装置、终端、存储介质
CN109034165A (zh) * 2018-07-06 2018-12-18 北京中安未来科技有限公司 一种证件图像的裁切方法、装置、***及存储介质
CN111260569A (zh) * 2020-01-10 2020-06-09 百度在线网络技术(北京)有限公司 图像倾斜校正的方法、装置、电子设备和存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040181671A1 (en) * 1998-11-19 2004-09-16 Brundage Trent J. Identification document and related methods
CN102955941A (zh) * 2011-08-31 2013-03-06 汉王科技股份有限公司 身份信息录入方法和装置
CN108268868A (zh) * 2017-07-28 2018-07-10 平安科技(深圳)有限公司 身份证图像的倾斜值获取方法及装置、终端、存储介质
CN109034165A (zh) * 2018-07-06 2018-12-18 北京中安未来科技有限公司 一种证件图像的裁切方法、装置、***及存储介质
CN111260569A (zh) * 2020-01-10 2020-06-09 百度在线网络技术(北京)有限公司 图像倾斜校正的方法、装置、电子设备和存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112528776A (zh) * 2020-11-27 2021-03-19 京东数字科技控股股份有限公司 文本行校正方法和装置
CN112528776B (zh) * 2020-11-27 2024-04-09 京东科技控股股份有限公司 文本行校正方法和装置

Similar Documents

Publication Publication Date Title
CN109740606B (zh) 一种图像识别方法及装置
CN109658584B (zh) 一种票据信息识别方法及装置
CN109343920B (zh) 一种图像处理方法及其装置、设备和存储介质
CN111325104B (zh) 文本识别方法、装置及存储介质
US20200125830A1 (en) Object recognition
CN106326887B (zh) 一种光学字符识别结果的校验方法及装置
CN110675940A (zh) 病理图像标注方法、装置、计算机设备及存储介质
US11144752B1 (en) Physical document verification in uncontrolled environments
CN110503682B (zh) 矩形控件识别方法、装置、终端及存储介质
US9418446B2 (en) Method and apparatus for determining a building location based on a building image
CN111783770B (zh) 图像的矫正方法、装置和计算机可读存储介质
CN112613506A (zh) 图像中的文本识别方法、装置、计算机设备和存储介质
CN109389115B (zh) 文本识别方法、装置、存储介质和计算机设备
CN108830275B (zh) 点阵字符、点阵数字的识别方法及装置
CN110197179B (zh) 识别***的方法和装置、存储介质及电子设备
CN113903024A (zh) 一种手写票据数值信息识别方法、***、介质及装置
CN111639653A (zh) 一种误检图像确定方法、装置、设备和介质
CN112396050B (zh) 图像的处理方法、设备以及存储介质
CN114038004A (zh) 一种证件信息提取方法、装置、设备及存储介质
CN113221897B (zh) 图像矫正方法、图像文本识别方法、身份验证方法及装置
CN111222452A (zh) 一种人脸匹配方法、装置、电子设备及可读存储介质
CN105184294B (zh) 一种基于像素追踪的倾斜文字判断识别方法
CN113111880A (zh) 证件图像校正方法、装置、电子设备及存储介质
CN111914836A (zh) 一种身份证信息提取方法、装置、设备和介质
CN115439733A (zh) 图像处理方法、装置、终端设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination