CN108319945A

CN108319945A - 一种分离式ocr识别方法及其***

Info

Publication number: CN108319945A
Application number: CN201810025349.9A
Authority: CN
Inventors: 欧阳永中
Original assignee: Foshan University
Current assignee: Foshan University
Priority date: 2018-01-09
Filing date: 2018-01-09
Publication date: 2018-07-24
Also published as: WO2019137237A1

Abstract

本发明公开了一种分离式图像OCR识别方法及其***，包括以下步骤：建立坐标模型；获取图像的水印标识；标定坐标；提取包含水印标识部分的区域；图片去除含有水印标识部分的区域；对去除含有水印标识部分的区域执行OCR识别；根据水印标识部分区域对应坐标在待处理文字中***标识符；灰度处理；USM锐化处理；二值化处理；对含水印标识部分的区域执行OCR识别；将相应待***文字根据***标识符***到待处理文字。本发明采用文字分离的方式，将非水印部分的文字和水印部分的文字分别进行识别，其中通过提取水印部分的图片进行处理后再识别，最终分别将识别出的文字进行合并，本发明能有效提高对水印部分文字的识别准确性。

Description

一种分离式OCR识别方法及其***

技术领域

本发明涉及图像识别领域，特别是一种分离式OCR识别方法及其***。

背景技术

带水印的图片，就是在文字的上面添加上一层半透明的图像，这层图像不会影响读者对于文字的阅读。OCR文字识别，指利用OCR(Optical Character Recognition，光学字符识别)技术，将图片、照片上的文字内容，直接转换为可编辑文本的软件。软件可以把图片转换成可以编辑的文字。支持JPG、PNG、GIF、BMP、DOC等图片格式。但是目前的OCR识别方法均不能识别出带有水印图片上面的文字。

发明内容

为解决上述问题，本发明的目的在于提供一种能够识别出包括水印图像上文字的一种分离式OCR识别方法及其***。

本发明解决其问题所采用的技术方案是：

一种分离式图像OCR识别方法，包括以下步骤：

对图像进行坐标矫正，建立坐标模型；

获取图像的水印标识，在图像上标出包含有水印标识部分的区域；

标定水印标识部分区域对应坐标；

提取包含水印标识部分的区域；

图片去除含有水印标识部分的区域；

对去除含有水印标识部分的区域执行OCR识别，识别出待处理文字；

根据水印标识部分区域对应坐标在待处理文字中***标识符；

对含水印标识部分的区域进行灰度处理；

对含水印标识部分的区域进行USM锐化处理；

对含水印标识部分的区域进行二值化处理；

对含水印标识部分的区域执行OCR识别，识别出待***文字；

将相应待***文字根据***标识符***到待处理文字，形成最终识别文字。

进一步，所述灰度处理为对含水印标识部分的区域图像中每一像素的RGB值进行映射，映射到0至255的灰度值。

进一步，所述二值化处理包括以下步骤：

横向扫描含水印标识部分的区域图像，把两边为浅色、中间为深色的所有点的灰度值累加，累加的总灰度值为sum1，同时累计点数p1；

纵向扫描含水印标识部分的区域图像，把上下两边为浅色、中间为深色的所有点的灰度值累加，累加的总灰度值为sum2，同时累计点数p2；

二值化的阈值为(sum1+sum2)/(p1+P2)，若当前像素灰度大于等于阈值，则输出黑色像素块，若当前像素灰度小于阈值，则输出白色像素块。

进一步，对OCR识别的文字进行自动矫正处理，包括以下步骤：

调用并运行word拼写检测与纠正插件；

输出OCR识别后的文字，进行自动纠正；

输出自动纠正后的文字。

一种分离式图像OCR识别***，包括：

纠正装置，对图像进行坐标矫正，建立坐标模型；

水印获取装置，获取图像的水印标识，在图像上标出包含有水印标识部分的区域；

坐标记录装置，标定水印标识部分区域对应坐标；

提取水印装置，提取包含水印标识部分的区域；

去除水印装置，图片去除含有水印标识部分的区域；

第一OCR识别装置，对去除含有水印标识部分的区域执行OCR识别，识别出待处理文字；

标识符***装置，根据水印标识部分区域对应坐标在待处理文字中***标识符；

灰度处理装置，对含水印标识部分的区域进行灰度处理；

锐化处理装置，对含水印标识部分的区域进行USM锐化处理；

二值化处理装置，对含水印标识部分的区域进行二值化处理；

第二OCR识别装置，对含水印标识部分的区域执行OCR识别，识别出待***文字；

文本合并装置，将相应待***文字根据***标识符***到待处理文字，形成最终识别文字。

本发明的有益效果是：本发明采用的一种分离式图像OCR识别方法及其***，包括以下步骤：对图像进行坐标矫正，建立坐标模型；获取图像的水印标识，在图像上标出包含有水印标识部分的区域；标定水印标识部分区域对应坐标；提取包含水印标识部分的区域；图片去除含有水印标识部分的区域；对去除含有水印标识部分的区域执行OCR识别，识别出待处理文字；根据水印标识部分区域对应坐标在待处理文字中***标识符；对含水印标识部分的区域进行灰度处理；对含水印标识部分的区域进行USM锐化处理；对含水印标识部分的区域进行二值化处理；对含水印标识部分的区域执行OCR识别，识别出待***文字；将相应待***文字根据***标识符***到待处理文字，形成最终识别文字。本发明采用文字分离的方式，将非水印部分的文字和水印部分的文字分别进行识别，其中通过提取水印部分的图片进行处理后再识别，最终分别将识别出的文字进行合并，本发明能有效提高对水印部分文字的识别准确性。

附图说明

下面结合附图和实例对本发明作进一步说明。

图1是本发明的方法流程图。

具体实施方式

参照图1，本发明的一种分离式图像OCR识别方法，包括以下步骤：

对图像进行坐标矫正，建立坐标模型；

标定水印标识部分区域对应坐标；

提取包含水印标识部分的区域；

图片去除含有水印标识部分的区域；

根据水印标识部分区域对应坐标在待处理文字中***标识符；

对含水印标识部分的区域进行灰度处理，这样得出来的图片就像黑白照片一样，这样就可以降低后面步骤的运算量，并且使得图片更加易于辨认。

对含水印标识部分的区域进行USM锐化处理；由于水印是半透明地覆盖在文字资料上，使得水印下文字的边缘变得模糊且难以辨认，因此要对图片锐化，这样会突出图片中的文字，有利于实现图片中文字与水印。

对含水印标识部分的区域进行二值化处理；

对含水印标识部分的区域执行OCR识别，识别出待***文字；

进一步，所述二值化处理包括以下步骤：

调用并运行word拼写检测与纠正插件；

输出OCR识别后的文字，进行自动纠正；

输出自动纠正后的文字。

一种分离式图像OCR识别***，包括：

纠正装置，对图像进行坐标矫正，建立坐标模型；

坐标记录装置，标定水印标识部分区域对应坐标；

提取水印装置，提取包含水印标识部分的区域；

去除水印装置，图片去除含有水印标识部分的区域；

灰度处理装置，对含水印标识部分的区域进行灰度处理；

锐化处理装置，对含水印标识部分的区域进行USM锐化处理；

以上所述，只是本发明的较佳实施例而已，本发明并不局限于上述实施方式，只要其以相同的手段达到本发明的技术效果，都应属于本发明的保护范围。

Claims

1.一种分离式图像OCR识别方法，其特征在于，包括以下步骤：

对图像进行坐标矫正，建立坐标模型；

标定水印标识部分区域对应坐标；

提取包含水印标识部分的区域；

图片去除含有水印标识部分的区域；

根据水印标识部分区域对应坐标在待处理文字中***标识符；

对含水印标识部分的区域进行灰度处理；

对含水印标识部分的区域进行USM锐化处理；

对含水印标识部分的区域进行二值化处理；

对含水印标识部分的区域执行OCR识别，识别出待***文字；

2.根据权利要求1所述的一种分离式图像OCR识别方法，其特征在于：

所述灰度处理为对含水印标识部分的区域图像中每一像素的RGB值进行映射，映射到0至255的灰度值。

3.根据权利要求2所述的一种分离式图像OCR识别方法，其特征在于：所述二值化处理包括以下步骤：

4.根据权利要求1所述的一种分离式图像OCR识别方法，其特征在于：对OCR识别的文字进行自动矫正处理，包括以下步骤：

调用并运行word拼写检测与纠正插件；

输出OCR识别后的文字，进行自动纠正；

输出自动纠正后的文字。

5.一种分离式图像OCR识别***，其特征在于，包括：

纠正装置，对图像进行坐标矫正，建立坐标模型；

坐标记录装置，标定水印标识部分区域对应坐标；

提取水印装置，提取包含水印标识部分的区域；

去除水印装置，图片去除含有水印标识部分的区域；

灰度处理装置，对含水印标识部分的区域进行灰度处理；

锐化处理装置，对含水印标识部分的区域进行USM锐化处理；