CN112396058B - 一种文档图像的检测方法、装置、设备及存储介质 - Google Patents
一种文档图像的检测方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN112396058B CN112396058B CN202011255901.7A CN202011255901A CN112396058B CN 112396058 B CN112396058 B CN 112396058B CN 202011255901 A CN202011255901 A CN 202011255901A CN 112396058 B CN112396058 B CN 112396058B
- Authority
- CN
- China
- Prior art keywords
- image
- document image
- gold stamping
- document
- detection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 144
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 claims abstract description 90
- 239000010931 gold Substances 0.000 claims abstract description 90
- 229910052737 gold Inorganic materials 0.000 claims abstract description 90
- 238000000034 method Methods 0.000 claims abstract description 33
- 238000000605 extraction Methods 0.000 claims abstract description 24
- 238000012549 training Methods 0.000 claims description 56
- 238000003384 imaging method Methods 0.000 claims description 41
- 238000012795 verification Methods 0.000 claims description 27
- 238000007639 printing Methods 0.000 claims description 17
- 238000012545 processing Methods 0.000 claims description 8
- 238000007781 pre-processing Methods 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 6
- 238000013527 convolutional neural network Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 3
- 235000011293 Brassica napus Nutrition 0.000 description 2
- 240000008100 Brassica rapa Species 0.000 description 2
- 235000000540 Brassica rapa subsp rapa Nutrition 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000008014 freezing Effects 0.000 description 2
- 238000007710 freezing Methods 0.000 description 2
- 238000012797 qualification Methods 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/751—Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Multimedia (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种文档图像的检测方法、装置、设备及存储介质。该方法包括:获取待测文档图像;采用预设图像提取方法提取待测文档图像中的烫金区域图像;采用预设翻拍检测模型对烫金区域图像进行检测;根据检测结果确认待测文档图像的检测结果。通过采用由烫金区域图像训练出来的检测模型对待测文档图像的烫金区域的图像块进行检测,从而判断待测文档图像是否为翻拍文档图像,解决现有分类方法无法准确识别翻拍文档图像和原始文档图像的问题,实现仅对烫金区域图像进行检测就能快速识别待测文档图像是否为翻拍文档图像,检测区域小、检测速度快和检测精度高的效果。
Description
技术领域
本发明实施例涉及文档图像的检测技术,尤其涉及一种文档图像的检测方法、装置、设备及存储介质。
背景技术
现有针对文档图像的检测中,都是提取合法图像和伪造图像中的特定特征,如文字、***和手写签名等,基于提取的特征训练分类器,构建可以实现伪造检测的分类器。
但是无论是针对文档图像中的普通文字,或是特定的***图像和手写签名部分,这些利用文档图像中的特殊部分检测方法中均未考虑到文档翻拍这一实际问题,导致不能准确辨别文档翻拍图像。
发明内容
本发明提供一种文档图像的检测方法、装置、设备及存储介质,以实现快速、准确的检测待测文档图像是否为翻拍图像。
第一方面,本发明实施例提供了一种文档图像的检测方法,包括:
获取待测文档图像;
采用预设图像提取方法提取所述待测文档图像中的烫金区域图像;
采用预设翻拍检测模型对所述烫金区域图像进行检测;
根据检测结果确认所述待测文档图像的检测结果。
可选的,在所述获取待测文档图像之前,还包括:
建立文档图像数据库,所述文档图像数据库包括原始文档图像和翻拍文档图像;
将所述文档图像数据库中的图像进行处理得到训练数据集和验证数据集;
通过训练数据集对翻拍检测模型进行训练,当验证数据集验证结果满足结束条件时结束训练,保存模型参数,得到预设翻拍检测模型。
可选的,所述建立文档图像数据库包括:
采用成像***的采集设备获取原始文档图像和翻拍文档图像;
采用预设图像提取方法提取所述原始文档图像的烫金区域图像和所述翻拍文档图像的烫金区域图像;
将所述原始文档图像中的烫金区域图像和所述翻拍文档图像中的烫金区域图像作为文档图像数据库。
可选的,所述采用成像***包括第一成像***和第二成像***,所述采集设备包括第一采集设备和第二采集设备,所述采用成像***的采集设备获取所述原始文档图像和所述翻拍文档图像包括:
使用所述第一成像***的第一采集设备和所述第二成像***的第一采集设备对原始文档进行拍摄,获得两组原始文档图像;
将所述两组原始文档图像打印至实物载体上,得到两组打印图像;
使用所述第一成像***的第二采集设备和所述第二成像***的第二采集设备分别对所述两组打印图像进行拍摄,获得两组翻拍文档图像。
可选的,所述采用预设翻拍检测模型对所述烫金区域图像进行检测,包括:
将所述烫金区域图像进行预处理,得到预处理图像;
将所述预处理图像输入所述预设翻拍检测模型中进行检测。
可选的,所述原始文档图像和所述翻拍文档图像为TIFF格式;
所述预设翻拍检测模型可以为DenseNet121、DenseNet169、DenseNet201、ResNet34、ResNet50、ResNet101、ResNet152、ResNeXt50、ResNeXt101中任一个。
第二方面,本发明实施例还包括一种文档图像的检测装置,包括:
图像获取模块,用于获取待测文档图像;
图像提取模块,用于采用预设图像提取方法提取所述待测文档图像中的烫金区域图像;
图像检测模块,用于采用预设翻拍检测模型对所述烫金区域图像进行检测;
结果确认模块,用于根据检测结果确认所述待测文档图像的检测结果。
第三方面,本发明实施例包括一种文档图像的检测设备,所述文档图像的检测设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面中任一所述的文档图像的检测方法。
第四方面,本发明实施例包括一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面中任一所述的文档图像的检测方法。
本发明实施例通过采用由烫金区域图像训练出来的检测模型对待测文档图像的烫金区域的图像块进行检测,从而判断待测文档图像是否为翻拍文档图像,解决现有分类方法无法准确识别翻拍文档图像和原始文档图像的问题,实现仅对烫金区域图像进行检测就能快速识别待测文档图像是否为翻拍文档图像,检测区域小、检测速度快和检测精度高的效果。
附图说明
图1为本发明实施例一中提供的一种文档图像的检测方法的流程示意图;
图2A为本发明实施例二中提供的一种文档图像的检测方法的流程示意图;
图2B为本发明实施例二中提供的一种文档图像的检测方法的子流程示意图;
图2C为本发明实施例二中提供的另一种文档图像的检测方法的子流程示意图;
图3为本发明实施例三种提供的一种文档图像的检测装置的结构示意图;
图4为本发明实施例四中提供的一种文档图像的检测设备的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一中提供的一种文档图像的检测方法的流程示意图,本实施例可适用于对文档图像的烫金区域进行检测辨别是否为翻拍的情况,该方法可以由一种文档图像的检测装置来执行,如图1所示,具体包括如下步骤:
步骤1100、获取待测文档图像。
待测文档图像基于原始文档获得,可能为原始文档图像,也可能为原始文档的翻拍图像;待测文档图像可以是一张或者多张,待测文档图像为彩色图像,例如RGB格式图像、LAB格式图像、TIFF格式图像、JPG格式图像和PNG格式图像等。
步骤1200、采用预设图像提取方法提取待测文档图像中的烫金区域图像。
在一些资格审查和奖项评比中,需要对候选人以往获得的荣誉证书进行审核,而为了保证候选人递交的荣誉证书的真实有效性,避免出现身份信息和荣誉信息的冒用,需要对荣誉证书的图像进行检测判断。在本实施例中,待测文档图像为具有烫金区域图像的荣誉证书。待测文档图像为整个文档对应的图片,为了能在较少的工作量的情况下快速识别待测文档图像的类型,选择局部具有特定特征的区域进行识别判断,可以更快的进行识别;荣誉证书均具有烫金文字,因此选择对待测文档图像的烫金部分作为检测对象。
通过预设图像提取方法对获取的待测文档图像进行提取,截取每个待测文档图像其中的烫金区域图像作为后续判断的输入。
可选的,将烫金区域图像进行分割得到多个图像块。
由于每个待测文档图像的烫金区域不一定为同样大小,如果将不同待测文档图像的烫金区域图像缩放成同样尺寸的图像可能会影响检测的精度。
为了提高检测的精度,也为了获得与预设翻拍检测模型匹配的输入图像,需要将烫金区域图像进行分割,得到尺寸一致的多个图像块。
进一步的,每个图像块的像素尺寸与预设翻拍检测模型匹配。
步骤1300、采用预设翻拍检测模型对烫金区域图像进行检测。
预设翻拍检测模型由数据库中烫金区域图像训练得到,可以通过待测文档图像中的烫金区域图像准确识别图像类型,辨别出翻拍文档图像。将待测文档图像的烫金区域图像分割得到的多个图像块作为输入,经过预设翻拍检测模型进行检测,得到每个图像块的检测结果。
步骤1400、根据测结果确认待测文档图像的检测结果。
根据每个图像块的检测结果,即每个图像块为原始文档图像的概率,然后计算一张待测图像对应的每个图像块的检测结果的平均值作为此待测图像为原始文档图像的概率,将待测图像为原始文档图像的概率与预设阈值进行比较,大于预设阈值时,判定此待测图像为原始文档图像,小于预设阈值时,判定此待测图像为翻拍文档图像。
本发明实施例通过采用由烫金区域图像训练出来的检测模型对待测文档图像的烫金区域的图像块进行检测,从而判断待测文档图像是否为翻拍文档图像,解决现有分类方法无法准确识别翻拍文档图像和原始文档图像的问题,实现仅对烫金区域图像进行检测就能快速识别待测文档图像是否为翻拍文档图像,检测区域小、检测速度快和检测精度高的效果。
实施例二
图2A为本发明实施例二中提供的一种文档图像的检测方法的流程示意图,图2B为本发明实施例二中提供的一种文档图像的检测方法的子流程示意图,图2C为本发明实施例二中提供的另一种文档图像的检测方法的子流程示意图。
如图2A所示,一种文档图像的检测方法,具体包括如下步骤:
步骤2100、建立文档图像数据库,文档图像数据库包括原始文档图像和翻拍文档图像。
进一步的,文档图像数据库包含多张具有烫金区域图像的文档图像,其中可以包含具有烫金区域图像的原始文档图像和翻拍文档图像。
步骤2200、将文档图像数据库中的图像进行处理得到训练数据集和验证数据集。
对文档图像数据库中的原始文档图像和翻拍文档图像的烫金区域进行数据标注,并关联与之匹配的图像类型,例如“原始文档图像的烫金区域图像”和“翻拍文档图像的烫金区域图像”,形成训练数据集和验证数据集,其中,训练数据集和验证数据集均包含原始文档图像和翻拍文档图像,进一步的,训练数据集和验证数据集中的原始文档图像和翻拍文档图像数量可以不同,示例性的,训练数据集包含文档图像数据库中80%的原始文档图像和翻拍文档图像,验证数据集包含文档图像数据库中20%的原始文档图像和翻拍文档图像,在本实施例中不限于此比值。
步骤2300、通过训练数据集对翻拍检测模型进行训练,当验证数据集验证结果满足结束条件时结束训练,保存模型参数,得到预设翻拍检测模型。
在进行文档图像检测前,需要进行翻拍检测模型的训练,翻拍检测模型可以为DenseNet121、DenseNet169、DenseNet201、ResNet34、ResNet50、ResNet101、ResNet152、ResNeXt50、ResNeXt101中任一个。对模型进行训练,具体包括:
获取初始卷积神经网络(Convolutional Neural Networks,CNN),初始卷积神经网络是利用现有图像数据集进行训练得到的卷积神经网络;并且利用训练数据集对初始卷积神经网络进行微调训练,从而获得能够输出原始文档的训练图像的分类结果的目标卷积神经网络。
其中,卷积神经网络是人工神经网络的一种,其具有学习能力、局部感受野和权值共享等优点,能够极大地减小参数的训练,因此能够提高处理速度。
其中,微调训练(Fine-tune)是指迁移学习。对初始卷积神经网络进行微调训练包括冻结初始卷积神经网络的全连接层之前的初始目标权重,利用训练数据集重新训练全连接层的权重,以得到具有目标权重的全连接层。微调训练具体是指冻结初始卷积神经网络的全连接层之前的初始目标权重,利用训练数据集重新训练全连接层的权重,以得到目标权重。经过训练数据集重新训练后的全连接层具有目标权重,能够更好地进行图像特征的提取和分类。
进一步的,若训练图像为图像块,则可以利用多个图像块对初始卷积神经网络进行微调训练。
翻拍检测模型的训练还可以包括验证步骤,验证步骤可以:将验证数据集输入目标卷积神经网络获得检测结果;验证时当验证数据集的准确率不满足预设要求,则返回继续利用训练数据集训练目标卷积神经网络,重复验证步骤,直至验证准确率满足预设要求,保存模型参数,得到预设翻拍检测模型。
在本实施例中,仅需采用较少的数据量(烫金区域图像的图像块)对翻拍检测模型进行训练,且模型训练速度更快,效果更好。得到的预设翻拍检测模型可以准确根据文档图像中的烫金区域识别待测文档图像为原始文档图像或翻拍文档图像。
进一步的,如图2B所示,步骤2100包括以下步骤:
步骤2110、采用成像***的采集设备获取原始文档图像和翻拍文档图像。
图像数据库中的多张图像可以利用具有成像***的采集设备获得,即每张图像(例如原始文档图像或翻拍文档图像)可以是基于原始文档利用具有成像***的采集设备获得的。在本实施例中,每张图像以TIFF格式进行存储。
步骤2120、采用预设图像提取方法提取原始文档图像的烫金区域图像和翻拍文档图像的烫金区域图像。
通过预设的图像提取方法分别提取原始文档图像和翻拍文档图像中的烫金区域图像,对烫金区域图像进行进一步处理用以得到训练数据集和验证数据集。
步骤2130、将原始文档图像中的烫金区域图像和翻拍文档图像中的烫金区域图像作为文档图像数据库。
仅通过原始文档图像和翻拍文档图像中的烫金区域图像训练翻拍检测模型可以提高训练效率,因此将原始文档图像和翻拍文档图像中的烫金区域图像作为文档图像数据库。
进一步的,如图2C所示,步骤2110还包括以下步骤:
步骤2111、使用第一成像***的第一采集设备和第二成像***的第一采集设备对原始文档进行拍摄,获得两组原始文档图像。
其中,采用成像***包括第一成像***和第二成像***,采集设备包括第一采集设备和第二采集设备。
在翻拍检测模型训练完成后,需要进行跨库测试以保证翻拍检测模型具有良好的性能,因此需要建立两个文档图像数据库。
第一成像***的第一采集设备对原始文档进行拍摄,获得第一组原始文档图像;第二成像***的第一采集设备对原始文档进行拍摄,获得第二组原始文档图像;原始文档图像中含有首次拍摄中捕获的噪声。其中,第一采集设备可以分别选自手机、数码相机、摄像机或扫描仪中的一种。
步骤2112、将两组原始文档图像打印至实物载体上,得到两组打印图像。
将获得的第一组和第二组原始文档图像分别打印至实物载体上,得到第一组打印图像和第二组打印图像;打印图像中含有打印引入的噪声。
步骤2113、使用第一成像***的第二采集设备和第二成像***的第二采集设备分别对两组打印图像进行拍摄,获得两组翻拍文档图像。
使用第一成像***的第二采集设备对第一组打印图像进行拍摄获得第一组翻拍文档图像,使用第二成像***的第二采集设备对第二组打印图像进行拍摄获得第二组翻拍文档图像;翻拍文档图像中含有二次拍摄中捕获的噪声。其中,第二采集设备可以分别选自手机、数码相机、摄像机或扫描仪中的一种。在一些实施例中,第一采集设备与第二采集设备可以是同一种设备,例如,第一采集设备与第二采集设备均为手机。在另一些实施例中,第一采集设备与第二采集设备可以是同一种设备且设备型号相同,例如,第一采集设备与第二采集设备均为同一品牌手机。
将第一组原始文档图像和第一组翻拍文档图像作为第一文档图像数据库;第二组原始文档图像和第二组翻拍文档图像作为第二文档图像数据库;训练数据集和验证数据集由第一文档图像数据库和第二文档图像数据库中的图像分割得到的多个图像块组成。
进一步的,采用第一文档图像数据库对翻拍检测模型训练完成后,再到第二文档图像数据库上进行测试,或者采用第二文档图像数据库对翻拍检测模型训练完成后,再到第一文档图像数据库上进行测试,根据测试结果对翻拍检测模型进行微调,最终得到合适的翻拍检测模型结果。
步骤2400、获取待测文档图像。
步骤2500、采用预设图像提取方法提取待测文档图像中的烫金区域图像。
步骤2600、将烫金区域图像进行预处理,得到预处理图像。
为了与预设翻拍检测模型的输入要求进行匹配,将烫金区域图像进行预处理具体为将烫金区域图像进行分割,得到预处理图像即得到多个图像块;其中,图像块的尺寸与预设翻拍检测模型的输入图像的尺寸匹配。
步骤2700、将预处理图像输入预设翻拍检测模型中进行检测。
将多个预处理图像依次输入预设翻拍检测模型中进行检测,得到每一个预处理图像的检测结果。
步骤2800、根据检测结果确认待测文档图像的检测结果。
本发明实施例通过只采用文档中的烫金区域对深度神经网络模型进行训练和验证得到翻拍检测模型,对待测文档图像的烫金区域的图像块进行检测,从而判断待测文档图像是否为翻拍文档图像,解决翻拍检测时需要检测整个文档图像导致检测较慢和检测模型准确度较低的问题,实现仅采用较少图像部分(烫金区域图像)快速训练翻拍检测模型的效果,且依据训练的翻拍检测模型对待测文档图像进行检测,提高了翻拍文档图像的检测速度和检测精度高。
实施例三
图3为本发明实施例三种提供的一种文档图像的检测装置的结构示意图,如图3所示,一种文档图像的检测装置,包括:
图像获取模块3100,用于获取待测文档图像。
待测文档图像基于原始文档获得,可能为原始文档图像,也可能为原始文档的翻拍图像;待测文档图像可以是一张或者多张,待测文档图像为彩色图像,例如RGB格式图像、LAB格式图像、TIFF格式图像、JPG格式图像和PNG格式图像等。
图像提取模块3200,用于采用预设图像提取方法提取待测文档图像中的烫金区域图像。
在一些资格审查和奖项评比中,需要对候选人以往获得的荣誉证书进行审核,而为了保证候选人递交的荣誉证书的真实有效性,避免出现身份信息和荣誉信息的冒用,需要对荣誉证书的图像进行检测判断。在本实施例中,待测文档图像为具有烫金区域图像的荣誉证书。待测文档图像为整个文档对应的图片,为了能在较少的工作量的情况下快速识别待测文档图像的类型,选择局部具有特定特征的区域进行识别判断,可以更快的进行识别;荣誉证书均具有烫金文字,因此选择对待测文档图像的烫金部分作为检测对象。
通过预设图像提取方法对获取的待测文档图像进行提取,截取每个待测文档图像其中的烫金区域图像作为后续判断的输入。
可选的,文档图像的检测装置还包括图像分割模块,用于将烫金区域图像进行分割得到多个图像块。
由于每个待测文档图像的烫金区域不一定为同样大小,如果将不同待测文档图像的烫金区域图像缩放成同样尺寸的图像可能会影响检测的精度。
为了提高检测的精度,也为了获得与预设翻拍检测模型匹配的输入图像,需要将烫金区域图像进行分割,得到尺寸一致的多个图像块。
进一步的,每个图像块的像素尺寸与预设翻拍检测模型匹配。
图像检测模块3300,用于采用预设翻拍检测模型对烫金区域图像进行检测。
预设翻拍检测模型由数据库中烫金区域图像训练得到,可以通过待测文档图像中的烫金区域图像准确识别图像类型,辨别出翻拍文档图像。将处理得到的烫金区域图像的每个图像块输入预设翻拍检测模型中,得到每个图像块的检测结果。
结果确认模块3400,用于根据测结果确认待测文档图像的检测结果。
根据每个图像块的检测结果,即每个图像块为翻拍文档图像的概率,然后计算一张待测图像对应的每个图像块的检测结果的平均值作为此待测图像为原始文档图像的概率,将待测图像为原始文档图像的概率与预设阈值进行比较,大于预设阈值时,判定此待测图像为原始文档图像,小于预设阈值时,判定此待测图像为翻拍文档图像。
本发明实施例通过采用由烫金区域图像训练出来的检测模型对待测文档图像的烫金区域的图像块进行检测,从而判断待测文档图像是否为翻拍文档图像,解决现有分类方法无法准确识别翻拍文档图像和原始文档图像的问题,实现仅对烫金区域图像进行检测就能快速识别待测文档图像是否为翻拍文档图像,检测区域小、检测速度快和检测精度高的效果。
可选的,文档图像的检测装置还包括:
数据库建立模块,用于建立文档图像数据库,其中,文档图像数据库包括原始文档图像和翻拍文档图像。
训练数据生成模块,用于将文档图像数据库中的图像进行处理得到训练数据集和验证数据集。
图像模型训练模块,用于通过训练数据集对翻拍检测模型进行训练,当验证数据集验证结果满足结束条件时结束训练,保存模型参数,得到预设翻拍检测模型。
进一步的,数据库建立模块还包括:
图像获取单元,用于采用成像***的采集设备获取原始文档图像和翻拍文档图像;
图像提取单元,用于采用预设图像提取方法提取原始文档图像的烫金区域图像和翻拍文档图像的烫金区域图像;
数据库建立单元,用于将原始文档图像中的烫金区域图像和翻拍文档图像中的烫金区域图像作为文档图像数据库。
在上述实施例的基础上,成像***包括第一成像***和第二成像***,采集设备包括第一采集设备和第二采集设备。
进一步的,图像获取单元包括:
原始文档图像获取子单元,用于使用第一成像***的第一采集设备和第二成像***的第一采集设备对原始文档进行拍摄,获得两组原始文档图像;
打印图像获取子单元,用于将两组原始文档图像打印至实物载体上,得到两组打印图像;
翻拍图像获取子单元,用于使用第一成像***的第二采集设备和第二成像***的第二采集设备分别对两组打印图像进行拍摄,获得两组翻拍文档图像。
本发明实施例所提供的文档图像的检测装置可执行本发明任意实施例所提供的文档图像的检测方法,具备执行方法相应的功能模块和有益效果。
实施例四
图4为本发明实施例四中提供的一种文档图像的检测设备的结构示意图,如图4所示,该文档图像的检测设备包括处理器40、存储器41、输入装置42和输出装置43;设备中处理器40的数量可以是一个或多个,图4中以一个处理器40为例;设备中的处理器40、存储器41、输入装置42和输出装置43可以通过总线或其他方式连接,图4中以通过总线连接为例。
存储器41作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的文档图像的检测方法对应的程序指令/模块(例如,文档图像的检测装置中的图像获取模块3100、图像提取模块3200、图像检测模块3300和结果确认模块3400)。处理器40通过运行存储在存储器41中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述的文档图像的检测方法。
存储器41可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器41可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器41可进一步包括相对于处理器40远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置42可用于接收输入的数字或字符信息,以及产生与设备的用户设置以及功能控制有关的键信号输入。输出装置43可包括显示屏等显示设备。
实施例五
本发明实施例五中还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种文档图像的检测方法,该方法包括:
获取待测文档图像;
采用预设图像提取方法提取待测文档图像中的烫金区域图像;
采用预设翻拍检测模型对烫金区域图像进行检测;
根据检测结果确认待测文档图像的检测结果当然。
本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的文档图像的检测方法中的相关操作。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述文档图像的检测装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (7)
1.一种文档图像的检测方法,其特征在于,包括:
获取待测文档图像;
采用预设图像提取方法提取所述待测文档图像中的烫金区域图像;
采用预设翻拍检测模型对所述烫金区域图像进行检测;
根据检测结果确认所述待测文档图像的检测结果;
在所述获取待测文档图像之前,还包括:
建立文档图像数据库,所述文档图像数据库包括原始文档图像和翻拍文档图像;
将所述文档图像数据库中的图像进行处理得到训练数据集和验证数据集;
通过训练数据集对翻拍检测模型进行训练,当验证数据集验证结果满足结束条件时结束训练,保存模型参数,得到预设翻拍检测模型;
所述建立文档图像数据库包括:
采用成像***的采集设备获取原始文档图像和翻拍文档图像;
采用预设图像提取方法提取所述原始文档图像的烫金区域图像和所述翻拍文档图像的烫金区域图像;
将所述原始文档图像中的烫金区域图像和所述翻拍文档图像中的烫金区域图像作为文档图像数据库。
2.根据权利要求1所述的一种文档图像的检测方法,其特征在于,所述采用成像***包括第一成像***和第二成像***,所述采集设备包括第一采集设备和第二采集设备,所述采用成像***的采集设备获取所述原始文档图像和所述翻拍文档图像包括:
使用所述第一成像***的第一采集设备和所述第二成像***的第一采集设备对原始文档进行拍摄,获得两组原始文档图像;
将所述两组原始文档图像打印至实物载体上,得到两组打印图像;
使用所述第一成像***的第二采集设备和所述第二成像***的第二采集设备分别对所述两组打印图像进行拍摄,获得两组翻拍文档图像。
3.根据权利要求1所述的一种文档图像的检测方法,其特征在于,所述采用预设翻拍检测模型对所述烫金区域图像进行检测,包括:
将所述烫金区域图像进行预处理,得到预处理图像;
将所述预处理图像输入所述预设翻拍检测模型中进行检测。
4.根据权利要求1所述的一种文档图像的检测方法,其特征在于,
所述原始文档图像和所述翻拍文档图像为TIFF格式;
所述预设翻拍检测模型可以为DenseNet121、DenseNet169、DenseNet201、ResNet34、ResNet50、ResNet101、ResNet152、ResNeXt50、ResNeXt101中任一个。
5.一种文档图像的检测装置,其特征在于,包括:
图像获取模块,用于获取待测文档图像;
图像提取模块,用于采用预设图像提取方法提取所述待测文档图像中的烫金区域图像;
图像检测模块,用于采用预设翻拍检测模型对所述烫金区域图像进行检测;
结果确认模块,用于根据检测结果确认所述待测文档图像的检测结果;
文档图像的检测装置还包括:
数据库建立模块,用于建立文档图像数据库,其中,文档图像数据库包括原始文档图像和翻拍文档图像;
训练数据生成模块,用于将文档图像数据库中的图像进行处理得到训练数据集和验证数据集;
图像模型训练模块,用于通过训练数据集对翻拍检测模型进行训练,当验证数据集验证结果满足结束条件时结束训练,保存模型参数,得到预设翻拍检测模型;
数据库建立模块还包括:
图像获取单元,用于采用成像***的采集设备获取原始文档图像和翻拍文档图像;
图像提取单元,用于采用预设图像提取方法提取原始文档图像的烫金区域图像和翻拍文档图像的烫金区域图像;
数据库建立单元,用于将原始文档图像中的烫金区域图像和翻拍文档图像中的烫金区域图像作为文档图像数据库。
6.一种文档图像的检测设备,其特征在于,所述文档图像的检测设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-4中任一所述的文档图像的检测方法。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-4中任一所述的文档图像的检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011255901.7A CN112396058B (zh) | 2020-11-11 | 2020-11-11 | 一种文档图像的检测方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011255901.7A CN112396058B (zh) | 2020-11-11 | 2020-11-11 | 一种文档图像的检测方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112396058A CN112396058A (zh) | 2021-02-23 |
CN112396058B true CN112396058B (zh) | 2024-04-09 |
Family
ID=74600264
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011255901.7A Active CN112396058B (zh) | 2020-11-11 | 2020-11-11 | 一种文档图像的检测方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112396058B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1169567A (zh) * | 1996-06-24 | 1998-01-07 | 江华 | 一次性光学立体加密防伪标志 |
CN108460649A (zh) * | 2017-02-22 | 2018-08-28 | 阿里巴巴集团控股有限公司 | 一种图像识别方法及装置 |
CN109325933A (zh) * | 2017-07-28 | 2019-02-12 | 阿里巴巴集团控股有限公司 | 一种翻拍图像识别方法及装置 |
CN110717450A (zh) * | 2019-10-09 | 2020-01-21 | 深圳大学 | 自动识别原始文档的翻拍图像的训练方法和检测方法 |
CN111191568A (zh) * | 2019-12-26 | 2020-05-22 | 中国平安人寿保险股份有限公司 | 翻拍图像识别方法、装置、设备及介质 |
CN111241873A (zh) * | 2018-11-28 | 2020-06-05 | 马上消费金融股份有限公司 | 图像翻拍检测方法及其模型的训练方法、支付方法及装置 |
-
2020
- 2020-11-11 CN CN202011255901.7A patent/CN112396058B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1169567A (zh) * | 1996-06-24 | 1998-01-07 | 江华 | 一次性光学立体加密防伪标志 |
CN108460649A (zh) * | 2017-02-22 | 2018-08-28 | 阿里巴巴集团控股有限公司 | 一种图像识别方法及装置 |
CN109325933A (zh) * | 2017-07-28 | 2019-02-12 | 阿里巴巴集团控股有限公司 | 一种翻拍图像识别方法及装置 |
CN111241873A (zh) * | 2018-11-28 | 2020-06-05 | 马上消费金融股份有限公司 | 图像翻拍检测方法及其模型的训练方法、支付方法及装置 |
CN110717450A (zh) * | 2019-10-09 | 2020-01-21 | 深圳大学 | 自动识别原始文档的翻拍图像的训练方法和检测方法 |
CN111191568A (zh) * | 2019-12-26 | 2020-05-22 | 中国平安人寿保险股份有限公司 | 翻拍图像识别方法、装置、设备及介质 |
Non-Patent Citations (1)
Title |
---|
数字图像翻拍算法的研究与应用;张帆;中国优秀硕士学位论文全文数据库(信息科技辑);20190715;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112396058A (zh) | 2021-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111488756B (zh) | 基于面部识别的活体检测的方法、电子设备和存储介质 | |
CN110717450B (zh) | 自动识别原始文档的翻拍图像的训练方法和检测方法 | |
CN111191568B (zh) | 翻拍图像识别方法、装置、设备及介质 | |
US20230086552A1 (en) | Image processing method and apparatus, device, storage medium, and computer program product | |
WO2021042505A1 (zh) | 基于文字识别技术的笔记生成方法、装置和计算机设备 | |
CN112329786B (zh) | 一种翻拍图像检测方法、装置、设备及存储介质 | |
CN112528998B (zh) | 证件图像处理方法、装置、电子设备及可读存储介质 | |
CN112200136A (zh) | 证件真伪识别方法、装置、计算机可读介质及电子设备 | |
WO2021068142A1 (zh) | 自动识别原始文档的翻拍图像的训练方法和检测方法 | |
CN110942067A (zh) | 文本识别方法、装置、计算机设备和存储介质 | |
CN112115907A (zh) | 固定版面证件结构化信息提取方法、装置、设备及介质 | |
CN113111880A (zh) | 证件图像校正方法、装置、电子设备及存储介质 | |
Aliev et al. | Algorithm for choosing the best frame in a video stream in the task of identity document recognition | |
Liu et al. | Face liveness detection based on enhanced local binary patterns | |
CN107292255B (zh) | 基于特征矩阵相似度分析的手写数字识别方法 | |
CN112801923A (zh) | 文字处理方法、***、可读存储介质及计算机设备 | |
CN111259894B (zh) | 一种证件信息鉴别方法、装置及计算机设备 | |
CN112396058B (zh) | 一种文档图像的检测方法、装置、设备及存储介质 | |
CN115410191B (zh) | 文本图像识别方法、装置、设备和存储介质 | |
CN111881880A (zh) | 一种基于新型网络的票据文本识别方法 | |
CN114241493B (zh) | 扩增文档分析模型的训练数据的训练方法及训练装置 | |
WO2023071180A1 (zh) | 真伪识别方法、装置、电子设备以及存储介质 | |
CN113610090B (zh) | ***图像识别分类方法、装置、计算机设备和存储介质 | |
CN113159037B (zh) | 图片矫正方法、装置、计算机设备及存储介质 | |
CN114820476A (zh) | 基于合规性检测的身份证识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |