CN108319945A - 一种分离式ocr识别方法及其*** - Google Patents

一种分离式ocr识别方法及其*** Download PDF

Info

Publication number
CN108319945A
CN108319945A CN201810025349.9A CN201810025349A CN108319945A CN 108319945 A CN108319945 A CN 108319945A CN 201810025349 A CN201810025349 A CN 201810025349A CN 108319945 A CN108319945 A CN 108319945A
Authority
CN
China
Prior art keywords
word
watermark identifier
identifier
region
ocr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810025349.9A
Other languages
English (en)
Inventor
欧阳永中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Foshan University
Original Assignee
Foshan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Foshan University filed Critical Foshan University
Priority to CN201810025349.9A priority Critical patent/CN108319945A/zh
Publication of CN108319945A publication Critical patent/CN108319945A/zh
Priority to PCT/CN2018/124642 priority patent/WO2019137237A1/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/242Aligning, centring, orientation detection or correction of the image by image rotation, e.g. by 90 degrees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种分离式图像OCR识别方法及其***,包括以下步骤:建立坐标模型;获取图像的水印标识;标定坐标;提取包含水印标识部分的区域;图片去除含有水印标识部分的区域;对去除含有水印标识部分的区域执行OCR识别;根据水印标识部分区域对应坐标在待处理文字中***标识符;灰度处理;USM锐化处理;二值化处理;对含水印标识部分的区域执行OCR识别;将相应待***文字根据***标识符***到待处理文字。本发明采用文字分离的方式,将非水印部分的文字和水印部分的文字分别进行识别,其中通过提取水印部分的图片进行处理后再识别,最终分别将识别出的文字进行合并,本发明能有效提高对水印部分文字的识别准确性。

Description

一种分离式OCR识别方法及其***
技术领域
本发明涉及图像识别领域,特别是一种分离式OCR识别方法及其***。
背景技术
带水印的图片,就是在文字的上面添加上一层半透明的图像,这层图像不会影响读者对于文字的阅读。OCR文字识别,指利用OCR(Optical Character Recognition,光学字符识别)技术,将图片、照片上的文字内容,直接转换为可编辑文本的软件。软件可以把图片转换成可以编辑的文字。支持JPG、PNG、GIF、BMP、DOC等图片格式。但是目前的OCR识别方法均不能识别出带有水印图片上面的文字。
发明内容
为解决上述问题,本发明的目的在于提供一种能够识别出包括水印图像上文字的一种分离式OCR识别方法及其***。
本发明解决其问题所采用的技术方案是:
一种分离式图像OCR识别方法,包括以下步骤:
对图像进行坐标矫正,建立坐标模型;
获取图像的水印标识,在图像上标出包含有水印标识部分的区域;
标定水印标识部分区域对应坐标;
提取包含水印标识部分的区域;
图片去除含有水印标识部分的区域;
对去除含有水印标识部分的区域执行OCR识别,识别出待处理文字;
根据水印标识部分区域对应坐标在待处理文字中***标识符;
对含水印标识部分的区域进行灰度处理;
对含水印标识部分的区域进行USM锐化处理;
对含水印标识部分的区域进行二值化处理;
对含水印标识部分的区域执行OCR识别,识别出待***文字;
将相应待***文字根据***标识符***到待处理文字,形成最终识别文字。
进一步,所述灰度处理为对含水印标识部分的区域图像中每一像素的RGB值进行映射,映射到0至255的灰度值。
进一步,所述二值化处理包括以下步骤:
横向扫描含水印标识部分的区域图像,把两边为浅色、中间为深色的所有点的灰度值累加,累加的总灰度值为sum1,同时累计点数p1;
纵向扫描含水印标识部分的区域图像,把上下两边为浅色、中间为深色的所有点的灰度值累加,累加的总灰度值为sum2,同时累计点数p2;
二值化的阈值为(sum1+sum2)/(p1+P2),若当前像素灰度大于等于阈值,则输出黑色像素块,若当前像素灰度小于阈值,则输出白色像素块。
进一步,对OCR识别的文字进行自动矫正处理,包括以下步骤:
调用并运行word拼写检测与纠正插件;
输出OCR识别后的文字,进行自动纠正;
输出自动纠正后的文字。
一种分离式图像OCR识别***,包括:
纠正装置,对图像进行坐标矫正,建立坐标模型;
水印获取装置,获取图像的水印标识,在图像上标出包含有水印标识部分的区域;
坐标记录装置,标定水印标识部分区域对应坐标;
提取水印装置,提取包含水印标识部分的区域;
去除水印装置,图片去除含有水印标识部分的区域;
第一OCR识别装置,对去除含有水印标识部分的区域执行OCR识别,识别出待处理文字;
标识符***装置,根据水印标识部分区域对应坐标在待处理文字中***标识符;
灰度处理装置,对含水印标识部分的区域进行灰度处理;
锐化处理装置,对含水印标识部分的区域进行USM锐化处理;
二值化处理装置,对含水印标识部分的区域进行二值化处理;
第二OCR识别装置,对含水印标识部分的区域执行OCR识别,识别出待***文字;
文本合并装置,将相应待***文字根据***标识符***到待处理文字,形成最终识别文字。
本发明的有益效果是:本发明采用的一种分离式图像OCR识别方法及其***,包括以下步骤:对图像进行坐标矫正,建立坐标模型;获取图像的水印标识,在图像上标出包含有水印标识部分的区域;标定水印标识部分区域对应坐标;提取包含水印标识部分的区域;图片去除含有水印标识部分的区域;对去除含有水印标识部分的区域执行OCR识别,识别出待处理文字;根据水印标识部分区域对应坐标在待处理文字中***标识符;对含水印标识部分的区域进行灰度处理;对含水印标识部分的区域进行USM锐化处理;对含水印标识部分的区域进行二值化处理;对含水印标识部分的区域执行OCR识别,识别出待***文字;将相应待***文字根据***标识符***到待处理文字,形成最终识别文字。本发明采用文字分离的方式,将非水印部分的文字和水印部分的文字分别进行识别,其中通过提取水印部分的图片进行处理后再识别,最终分别将识别出的文字进行合并,本发明能有效提高对水印部分文字的识别准确性。
附图说明
下面结合附图和实例对本发明作进一步说明。
图1是本发明的方法流程图。
具体实施方式
参照图1,本发明的一种分离式图像OCR识别方法,包括以下步骤:
对图像进行坐标矫正,建立坐标模型;
获取图像的水印标识,在图像上标出包含有水印标识部分的区域;
标定水印标识部分区域对应坐标;
提取包含水印标识部分的区域;
图片去除含有水印标识部分的区域;
对去除含有水印标识部分的区域执行OCR识别,识别出待处理文字;
根据水印标识部分区域对应坐标在待处理文字中***标识符;
对含水印标识部分的区域进行灰度处理,这样得出来的图片就像黑白照片一样,这样就可以降低后面步骤的运算量,并且使得图片更加易于辨认。
对含水印标识部分的区域进行USM锐化处理;由于水印是半透明地覆盖在文字资料上,使得水印下文字的边缘变得模糊且难以辨认,因此要对图片锐化,这样会突出图片中的文字,有利于实现图片中文字与水印。
对含水印标识部分的区域进行二值化处理;
对含水印标识部分的区域执行OCR识别,识别出待***文字;
将相应待***文字根据***标识符***到待处理文字,形成最终识别文字。
进一步,所述灰度处理为对含水印标识部分的区域图像中每一像素的RGB值进行映射,映射到0至255的灰度值。
进一步,所述二值化处理包括以下步骤:
横向扫描含水印标识部分的区域图像,把两边为浅色、中间为深色的所有点的灰度值累加,累加的总灰度值为sum1,同时累计点数p1;
纵向扫描含水印标识部分的区域图像,把上下两边为浅色、中间为深色的所有点的灰度值累加,累加的总灰度值为sum2,同时累计点数p2;
二值化的阈值为(sum1+sum2)/(p1+P2),若当前像素灰度大于等于阈值,则输出黑色像素块,若当前像素灰度小于阈值,则输出白色像素块。
进一步,对OCR识别的文字进行自动矫正处理,包括以下步骤:
调用并运行word拼写检测与纠正插件;
输出OCR识别后的文字,进行自动纠正;
输出自动纠正后的文字。
一种分离式图像OCR识别***,包括:
纠正装置,对图像进行坐标矫正,建立坐标模型;
水印获取装置,获取图像的水印标识,在图像上标出包含有水印标识部分的区域;
坐标记录装置,标定水印标识部分区域对应坐标;
提取水印装置,提取包含水印标识部分的区域;
去除水印装置,图片去除含有水印标识部分的区域;
第一OCR识别装置,对去除含有水印标识部分的区域执行OCR识别,识别出待处理文字;
标识符***装置,根据水印标识部分区域对应坐标在待处理文字中***标识符;
灰度处理装置,对含水印标识部分的区域进行灰度处理;
锐化处理装置,对含水印标识部分的区域进行USM锐化处理;
二值化处理装置,对含水印标识部分的区域进行二值化处理;
第二OCR识别装置,对含水印标识部分的区域执行OCR识别,识别出待***文字;
文本合并装置,将相应待***文字根据***标识符***到待处理文字,形成最终识别文字。
以上所述,只是本发明的较佳实施例而已,本发明并不局限于上述实施方式,只要其以相同的手段达到本发明的技术效果,都应属于本发明的保护范围。

Claims (5)

1.一种分离式图像OCR识别方法,其特征在于,包括以下步骤:
对图像进行坐标矫正,建立坐标模型;
获取图像的水印标识,在图像上标出包含有水印标识部分的区域;
标定水印标识部分区域对应坐标;
提取包含水印标识部分的区域;
图片去除含有水印标识部分的区域;
对去除含有水印标识部分的区域执行OCR识别,识别出待处理文字;
根据水印标识部分区域对应坐标在待处理文字中***标识符;
对含水印标识部分的区域进行灰度处理;
对含水印标识部分的区域进行USM锐化处理;
对含水印标识部分的区域进行二值化处理;
对含水印标识部分的区域执行OCR识别,识别出待***文字;
将相应待***文字根据***标识符***到待处理文字,形成最终识别文字。
2.根据权利要求1所述的一种分离式图像OCR识别方法,其特征在于:
所述灰度处理为对含水印标识部分的区域图像中每一像素的RGB值进行映射,映射到0至255的灰度值。
3.根据权利要求2所述的一种分离式图像OCR识别方法,其特征在于:所述二值化处理包括以下步骤:
横向扫描含水印标识部分的区域图像,把两边为浅色、中间为深色的所有点的灰度值累加,累加的总灰度值为sum1,同时累计点数p1;
纵向扫描含水印标识部分的区域图像,把上下两边为浅色、中间为深色的所有点的灰度值累加,累加的总灰度值为sum2,同时累计点数p2;
二值化的阈值为(sum1+sum2)/(p1+P2),若当前像素灰度大于等于阈值,则输出黑色像素块,若当前像素灰度小于阈值,则输出白色像素块。
4.根据权利要求1所述的一种分离式图像OCR识别方法,其特征在于:对OCR识别的文字进行自动矫正处理,包括以下步骤:
调用并运行word拼写检测与纠正插件;
输出OCR识别后的文字,进行自动纠正;
输出自动纠正后的文字。
5.一种分离式图像OCR识别***,其特征在于,包括:
纠正装置,对图像进行坐标矫正,建立坐标模型;
水印获取装置,获取图像的水印标识,在图像上标出包含有水印标识部分的区域;
坐标记录装置,标定水印标识部分区域对应坐标;
提取水印装置,提取包含水印标识部分的区域;
去除水印装置,图片去除含有水印标识部分的区域;
第一OCR识别装置,对去除含有水印标识部分的区域执行OCR识别,识别出待处理文字;
标识符***装置,根据水印标识部分区域对应坐标在待处理文字中***标识符;
灰度处理装置,对含水印标识部分的区域进行灰度处理;
锐化处理装置,对含水印标识部分的区域进行USM锐化处理;
二值化处理装置,对含水印标识部分的区域进行二值化处理;
第二OCR识别装置,对含水印标识部分的区域执行OCR识别,识别出待***文字;
文本合并装置,将相应待***文字根据***标识符***到待处理文字,形成最终识别文字。
CN201810025349.9A 2018-01-09 2018-01-09 一种分离式ocr识别方法及其*** Pending CN108319945A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201810025349.9A CN108319945A (zh) 2018-01-09 2018-01-09 一种分离式ocr识别方法及其***
PCT/CN2018/124642 WO2019137237A1 (zh) 2018-01-09 2018-12-28 一种分离式ocr识别方法及其***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810025349.9A CN108319945A (zh) 2018-01-09 2018-01-09 一种分离式ocr识别方法及其***

Publications (1)

Publication Number Publication Date
CN108319945A true CN108319945A (zh) 2018-07-24

Family

ID=62893935

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810025349.9A Pending CN108319945A (zh) 2018-01-09 2018-01-09 一种分离式ocr识别方法及其***

Country Status (2)

Country Link
CN (1) CN108319945A (zh)
WO (1) WO2019137237A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019137237A1 (zh) * 2018-01-09 2019-07-18 佛山科学技术学院 一种分离式ocr识别方法及其***
CN111340677A (zh) * 2020-02-27 2020-06-26 北京百度网讯科技有限公司 视频水印检测方法、装置、电子设备、计算机可读介质
CN111476853A (zh) * 2020-03-17 2020-07-31 西安万像电子科技有限公司 文字图像的编解码方法、设备及***
CN114694154A (zh) * 2022-04-11 2022-07-01 平安国际智慧城市科技股份有限公司 文件解析方法、***及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1329323A (zh) * 2001-07-31 2002-01-02 郭根龙 证件自动扫描识别与管理方法及其***
CN102236782A (zh) * 2010-04-30 2011-11-09 陈斌 一种证书证件文字识别方法
EP2974260A1 (fr) * 2013-03-15 2016-01-20 Send Only Oked Documents (SOOD) Procèdé de tatouage de la partie textuelle d'un document
CN106446882A (zh) * 2016-08-31 2017-02-22 武汉颂大教育科技股份有限公司 一种基于8字码的智能留痕阅卷方法
CN106650736A (zh) * 2016-09-28 2017-05-10 浪潮软件集团有限公司 一种基于深度学习的汉字识别***的实现方法
CN106778752A (zh) * 2016-11-16 2017-05-31 广西大学 一种文字识别方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102567939A (zh) * 2010-12-27 2012-07-11 北大方正集团有限公司 一种图像中可见水印的分离方法及装置
CN104244112B (zh) * 2013-06-14 2018-12-07 腾讯科技(深圳)有限公司 一种多媒体处理方法、装置及服务器
CN103530843B (zh) * 2013-10-14 2016-08-10 杭州电子科技大学 一种基于颜色信息压缩的照片水印嵌入和移除方法
CN108319945A (zh) * 2018-01-09 2018-07-24 佛山科学技术学院 一种分离式ocr识别方法及其***

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1329323A (zh) * 2001-07-31 2002-01-02 郭根龙 证件自动扫描识别与管理方法及其***
CN102236782A (zh) * 2010-04-30 2011-11-09 陈斌 一种证书证件文字识别方法
EP2974260A1 (fr) * 2013-03-15 2016-01-20 Send Only Oked Documents (SOOD) Procèdé de tatouage de la partie textuelle d'un document
CN106446882A (zh) * 2016-08-31 2017-02-22 武汉颂大教育科技股份有限公司 一种基于8字码的智能留痕阅卷方法
CN106650736A (zh) * 2016-09-28 2017-05-10 浪潮软件集团有限公司 一种基于深度学习的汉字识别***的实现方法
CN106778752A (zh) * 2016-11-16 2017-05-31 广西大学 一种文字识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
骆剑峰等: "《改进水印图片里文字识别效果的新方法》", 《信息化纵横》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019137237A1 (zh) * 2018-01-09 2019-07-18 佛山科学技术学院 一种分离式ocr识别方法及其***
CN111340677A (zh) * 2020-02-27 2020-06-26 北京百度网讯科技有限公司 视频水印检测方法、装置、电子设备、计算机可读介质
CN111340677B (zh) * 2020-02-27 2023-10-27 北京百度网讯科技有限公司 视频水印检测方法、装置、电子设备、计算机可读介质
CN111476853A (zh) * 2020-03-17 2020-07-31 西安万像电子科技有限公司 文字图像的编解码方法、设备及***
CN111476853B (zh) * 2020-03-17 2024-05-24 西安万像电子科技有限公司 文字图像的编解码方法、设备及***
CN114694154A (zh) * 2022-04-11 2022-07-01 平安国际智慧城市科技股份有限公司 文件解析方法、***及存储介质

Also Published As

Publication number Publication date
WO2019137237A1 (zh) 2019-07-18

Similar Documents

Publication Publication Date Title
CN108319945A (zh) 一种分离式ocr识别方法及其***
CN108229460A (zh) 一种水印图像ocr识别方法及其***
JP4261005B2 (ja) 領域ベースのイメージ2値化システム
CN104239861A (zh) 卷曲文本图像预处理方法和彩票扫描识别方法
CN110276279B (zh) 一种基于图像分割的任意形状场景文本探测方法
CN114283156B (zh) 一种用于去除文档图像颜色及手写笔迹的方法及装置
CN110598566A (zh) 图像处理方法、装置、终端和计算机可读存储介质
CN112734729B (zh) 适用于夜间补光条件的水尺水位线图像检测方法、装置及存储介质
CN106934411A (zh) 基于模板匹配的电子阅卷方法
CN116704523B (zh) 一种用于出版印刷设备的文字排版图像识别***
US7903876B2 (en) Distortion correction of a captured image
CN114445843A (zh) 固定版式的卡证图像文字识别方法和装置
CN111445402B (zh) 一种图像去噪方法及装置
CN111340040B (zh) 一种纸张字符识别方法、装置、电子设备及存储介质
KR20150099116A (ko) Ocr를 이용한 컬러 문자 인식 방법 및 그 장치
CN107845080B (zh) 卡片图像增强方法
CN116050379A (zh) 文档对比方法及存储介质
CN115619813A (zh) Sem图像前景提取方法、装置、计算机设备及存储介质
CN114267035A (zh) 一种文档图像处理方法、***、电子设备及可读介质
CN109934215B (zh) 一种身份证识别方法
CN111583156A (zh) 文档图像底纹去除方法及***
CN105513010A (zh) 一种文档扫描处理设备及处理方法
JP3230368B2 (ja) 二値化処理方法
JP3890840B2 (ja) 画像処理装置、画像処理方法、及び画像処理プログラムを記録した、コンピュータ読み取り可能な記録媒体
CN117314951B (zh) 一种二维码识别预处理方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180724

RJ01 Rejection of invention patent application after publication