CN112287969A - 一种文字样本采集处理方法、自助终端设备及独立模块 - Google Patents

一种文字样本采集处理方法、自助终端设备及独立模块 Download PDF

Info

Publication number
CN112287969A
CN112287969A CN202011024128.3A CN202011024128A CN112287969A CN 112287969 A CN112287969 A CN 112287969A CN 202011024128 A CN202011024128 A CN 202011024128A CN 112287969 A CN112287969 A CN 112287969A
Authority
CN
China
Prior art keywords
processing
character
sample
collecting
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202011024128.3A
Other languages
English (en)
Inventor
胡焱
索春宝
牛鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Financial Information Technology Co Ltd
Original Assignee
Inspur Financial Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Financial Information Technology Co Ltd filed Critical Inspur Financial Information Technology Co Ltd
Priority to CN202011024128.3A priority Critical patent/CN112287969A/zh
Publication of CN112287969A publication Critical patent/CN112287969A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/63Scene text, e.g. street names
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

本发明公开了一种文字样本采集处理方法、自助终端设备及独立模块,包括如下步骤,准备不同字体、字号的文字样本;不同的光照条件下采集文字样本,并对文字进行分割;不同光照条件下对打印到纸上的文字样本进行拍摄,并对文字进行分割,分割成分辨率相同的文字块,每一个字符一张图,并对图像进行灰度处理;对不同光照条件下分割得到的灰度图样本进行处理;对不同光照条件下分割得到的灰度图样本进行高斯核处理;本发明通过增加样本字体、字号,采集样本的光照条件,以及对样本进行多种图像处理方式的在处理,增加样本的多样性,可以得到鲁棒性更高的字符识别模型,提高证件识别的准确率。

Description

一种文字样本采集处理方法、自助终端设备及独立模块
技术领域
本发明涉及一种文字样本采集处理方法、自助终端设备及独立 模块,具体的为一种证件识别模型深度学习训练文字样本采集处理 方法、自助终端设备及独立模块,属于自助终端设备技术领域。
背景技术
证件识别已经出现了很长时间,随着各种终端设备的发现,应 用场景在不断扩展,在门禁、金融、交通等领域,身份证、护照、 驾驶证等证件的识别应用越来越广泛。证件识别发展初期,字符的 识别采用的是基础的图像处理技术、特征匹配等,但在处理复杂场景下的字符识别时,传统方法有其局限性,深度学习技术的快速发 展为文字识别提供了新的发展机遇,利用深度学习进行字符识别的 模型训练,可有效提高字符识别的准确性,而且进行模型训练的字 符样本的多样性可使字符识别的鲁棒性更高;字符样本的采集很大程度上决定了模型识别的效果,一般字符样本主要采集与待识别证 件上的字符相同字体的样本,但这样存在以下问题:
1.待识别证件图像出现模糊、噪声等问题时识别错误;
待识别证件的图像采集绝大多数情况下都是不理想,证件图像 难免出现模糊、噪点、缺失等问题,模型进行识别时可能会识别错 误。
2.模型识别局限性较大;
只采集与待识别证件上的文字相同的字体的样本,训练得到的 模型只能识别单一字体的文字,遇到新的证件就需要更新训练数据 集,这样训练得到的模型识别局限性较大。
发明内容
针对上述存在的技术问题,本发明的目的是:提出了一种文字样 本采集处理方法、自助终端设备及独立模块,增加样本的多样性,可 以得到鲁棒性更高的字符识别模型,提高证件识别的准确率。
本发明的技术解决方案是这样实现的:一种文字样本采集处理方 法,包括如下步骤,
S100,准备不同字体、字号的文字样本;将不同字体、字号的文字 打印出来,同一字体、字号的文字设为一组;
S200,不同的光照条件下采集文字样本,并对文字进行分割;不同 光照条件下对打印到纸上的文字样本进行拍摄,并对文字进行分 割,分割成分辨率相同的文字块,每一个字符一张图,并对图像进 行灰度处理;
S300,对不同光照条件下分割得到的灰度图样本进行处理;对不同 光照条件下分割得到的灰度图样本进行高斯核处理。
优选的,在S100中,文字样本采集多种常用字体,并且每种字 体采集几种不同的字号。
优选的,在S300中,对灰度图样本进行高斯核3*5、5*5的模糊 处理,一次高斯核3*3、两次高斯核3*3的腐蚀处理,一次高斯核3*3 的膨胀处理,分别向左、向右平移一个像素的平移处理,分别向左、 向右平移两个像素的平移处理,随机替换20%、30%的黑点的残缺处 理,随机替换20%、30%的白点的噪点处理。
一种自助终端设备,所述自助终端设备执行所述的一种证件识别 模型深度学习训练文字样本采集处理方法。
一种具有OCR证件识别功能的独立模块,所述独立模块执行所述 的一种证件识别模型深度学习训练文字样本采集处理方法。
由于上述技术方案的运用,本发明与现有技术相比具有下列优 点:
本发明的一种文字样本采集处理方法、自助终端设备及独立模 块,通过增加样本字体、字号,采集样本的光照条件,以及对样本进 行多种图像处理方式的在处理,增加样本的多样性,可以得到鲁棒性 更高的字符识别模型,提高证件识别的准确率。
附图说明
下面结合附图对本发明技术方案作进一步说明:
附图1为本发明的一种文字样本采集处理方法的流程图。
具体实施方式
下面结合附图来说明本发明。
如附图1所示为本发明所述的一种文字样本采集处理方法,包括 如下步骤,
S100,准备不同字体、字号的文字样本;将不同字体、字号的文字 打印出来,同一字体、字号的文字设为一组;,文字样本采集多种 常用字体,并且每种字体采集几种不同的字号,不局限于只采集待 识别证件上的文字字体,针对汉字的训练采集黑体、宋体、楷体等十几种常用字体,并且每种字体采集几种不同的字号,例如证件上 常用的小四、五号、小五等字号;
S200,不同的光照条件下采集文字样本,并对文字进行分割;不同 光照条件下对打印到纸上的文字样本进行拍摄,并对文字进行分 割,分割成分辨率相同的文字块,每一个字符一张图,并对图像进 行灰度处理;
S300,对不同光照条件下分割得到的灰度图样本进行处理;对不同 光照条件下分割得到的灰度图样本进行高斯核处理;对灰度图样本 进行高斯核3*5、5*5的模糊处理,一次高斯核3*3、两次高斯核 3*3的腐蚀处理,一次高斯核3*3的膨胀处理,分别向左、向右平 移一个像素的平移处理,分别向左、向右平移两个像素的平移处理, 随机替换20%、30%的黑点的残缺处理,随机替换20%、30%的白点 的噪点处理。
一种自助终端设备,所述自助终端设备执行所述的一种证件识别 模型深度学习训练文字样本采集处理方法。
一种具有OCR证件识别功能的独立模块,所述独立模块执行所述 的一种证件识别模型深度学习训练文字样本采集处理方法。
本发明的一种文字样本采集处理方法、自助终端设备及独立模 块,通过增加样本字体、字号,采集样本的光照条件,以及对样本进 行多种图像处理方式的在处理,增加样本的多样性,可以得到鲁棒性 更高的字符识别模型,提高证件识别的准确率。
上述实施例只为说明本发明的技术构思及特点,其目的在于让熟 悉此项技术的人士能够了解本发明的内容并加以实施,并不能以此限 制本发明的保护范围,凡根据本发明精神实质所作的等效变化或修 饰,都应涵盖在本发明的保护范围内。

Claims (5)

1.一种文字样本采集处理方法,其特征在于:包括如下步骤,
S100,准备不同字体、字号的文字样本;将不同字体、字号的文字打印出来,同一字体、字号的文字设为一组;
S200,不同的光照条件下采集文字样本,并对文字进行分割;不同光照条件下对打印到纸上的文字样本进行拍摄,并对文字进行分割,分割成分辨率相同的文字块,每一个字符一张图,并对图像进行灰度处理;
S300,对不同光照条件下分割得到的灰度图样本进行处理;对不同光照条件下分割得到的灰度图样本进行高斯核处理。
2.如权利要求1所述的一种文字样本采集处理方法,其特征在于:在S100中,文字样本采集多种常用字体,并且每种字体采集几种不同的字号。
3.如权利要求1所述的一种文字样本采集处理方法,其特征在于:在S300中,对灰度图样本进行高斯核3*5、5*5的模糊处理,一次高斯核3*3、两次高斯核3*3的腐蚀处理,一次高斯核3*3的膨胀处理,分别向左、向右平移一个像素的平移处理,分别向左、向右平移两个像素的平移处理,随机替换20%、30%的黑点的残缺处理,随机替换20%、30%的白点的噪点处理。
4.一种自助终端设备,其特征在于:所述自助终端设备执行权利要求1-3中任一项所述的一种证件识别模型深度学习训练文字样本采集处理方法。
5.一种具有OCR证件识别功能的独立模块,其特征在于:所述独立模块执行权利要求1-3中任一项所述的一种证件识别模型深度学习训练文字样本采集处理方法。
CN202011024128.3A 2020-09-25 2020-09-25 一种文字样本采集处理方法、自助终端设备及独立模块 Withdrawn CN112287969A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011024128.3A CN112287969A (zh) 2020-09-25 2020-09-25 一种文字样本采集处理方法、自助终端设备及独立模块

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011024128.3A CN112287969A (zh) 2020-09-25 2020-09-25 一种文字样本采集处理方法、自助终端设备及独立模块

Publications (1)

Publication Number Publication Date
CN112287969A true CN112287969A (zh) 2021-01-29

Family

ID=74421363

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011024128.3A Withdrawn CN112287969A (zh) 2020-09-25 2020-09-25 一种文字样本采集处理方法、自助终端设备及独立模块

Country Status (1)

Country Link
CN (1) CN112287969A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108985324A (zh) * 2018-06-04 2018-12-11 平安科技(深圳)有限公司 手写字训练样本获取方法、装置、设备及介质
CN110414519A (zh) * 2019-06-27 2019-11-05 众安信息技术服务有限公司 一种图片文字的识别方法及其识别装置
CN111274762A (zh) * 2020-01-17 2020-06-12 昆明理工大学 一种基于藏经典文献中多样性字体的计算机表达方法
CN111291629A (zh) * 2020-01-17 2020-06-16 平安医疗健康管理股份有限公司 图像中文本的识别方法、装置、计算机设备及计算机存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108985324A (zh) * 2018-06-04 2018-12-11 平安科技(深圳)有限公司 手写字训练样本获取方法、装置、设备及介质
CN110414519A (zh) * 2019-06-27 2019-11-05 众安信息技术服务有限公司 一种图片文字的识别方法及其识别装置
CN111274762A (zh) * 2020-01-17 2020-06-12 昆明理工大学 一种基于藏经典文献中多样性字体的计算机表达方法
CN111291629A (zh) * 2020-01-17 2020-06-16 平安医疗健康管理股份有限公司 图像中文本的识别方法、装置、计算机设备及计算机存储介质

Similar Documents

Publication Publication Date Title
CN104463195B (zh) 基于模板匹配的印刷体数字识别方法
US10817741B2 (en) Word segmentation system, method and device
Ye et al. Stroke-model-based character extraction from gray-level document images
CN104361336A (zh) 一种水下视频图像的文字识别方法
CN116071763B (zh) 基于文字识别的教辅图书智能校编***
Sagheer et al. A new large Urdu database for off-line handwriting recognition
Tomai et al. Discriminatory power of handwritten words for writer recognition
CN113901952A (zh) 一种基于深度学习的印刷体与手写体分开文字识别方法
KR20010015046A (ko) 구조화된 배경 모델과 문자의 조합에 의한 배경위의 문자자동 인식 방법
Maloo et al. Gujarati script recognition: a review
Yokobayashi et al. Segmentation and recognition of characters in scene images using selective binarization in color space and gat correlation
Tripathy Reconstruction of oriya alphabets using Zernike moments
CN107292255B (zh) 基于特征矩阵相似度分析的手写数字识别方法
Herwanto et al. Zoning feature extraction for handwritten Javanese character recognition
Aravinda et al. Template matching method for Kannada handwritten recognition based on correlation analysis
Rodrigues et al. Cursive character recognition–a character segmentation method using projection profile-based technique
CN112287969A (zh) 一种文字样本采集处理方法、自助终端设备及独立模块
Kavitha et al. A robust script identification system for historical Indian document images
Qian et al. A digit recognition system for paper currency identification based on virtual instruments
Dey et al. Colored rubber stamp removal from document images
Rajput et al. Printed and handwritten kannada numeral recognition using crack codes and fourier descriptors plate
Padma et al. Script Identification from Trilingual Documents using Profile Based Features.
Höhn Detecting arbitrarily oriented text labels in early maps
Mei et al. A Chinese character segmentation algorithm for complicated printed documents
Cavalcanti et al. A heuristic binarization algorithm for documents with complex background

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20210129

WW01 Invention patent application withdrawn after publication