CN103617423B

CN103617423B - 基于色彩参数的图像拆分识别方法

Info

Publication number: CN103617423B
Application number: CN201310612649.4A
Authority: CN
Inventors: 王威扬; 宫连志
Original assignee: Qianjin Network Information Technology (shanghai) Co ltd
Current assignee: Qianjin Network Information Technology (Shanghai) Co.,Ltd.
Priority date: 2013-11-26
Filing date: 2013-11-26
Publication date: 2017-01-25
Anticipated expiration: 2033-11-26
Also published as: CN103617423A

Abstract

本发明提供了一种基于色彩参数的图像拆分识别方法，包括步骤：步骤1：对待识别图像进行基于色彩参数的分析，找到该色彩参数相应的波峰点；步骤2：根据所述波峰点将待识别图像拆分成多张拆分图像；步骤3：对每一张所述拆分图像进行识别，得到多组拆分图像的识别结果r；步骤4：将所述拆分图像识别结果r合并成待识别图像的识别结果R。本发明能够较好地对背景、纹理、倾斜等情况进行处理，从而提高识别率，可以将多色和有背景图片进行识别，得到较好的识别效果，尤其适用于具有复杂图像的名片和票据识别。

Description

基于色彩参数的图像拆分识别方法

技术领域

本发明涉及计算机科学与技术中的图形识别领域，具体地，涉及基于色彩参数的图像拆分识别方法，尤其是色阶色谱拆分的识别方法。

背景技术

在文字识别领域，OCR（Optical Character Recognition，光学字符识别）技术是应用较多的技术，并且应用已经相对广泛。传统的识别中，OCR图形处理会将图形进行矩形矫正和灰度变换（两个步骤的先后执行顺序可以对换），然后进行二值化，最后进入OCR核心并进行识别。

该识别过程针对普通的文本（例如简单的、色彩单一的名片）的识别，可以完成任务，能够将图片转化成文字。但是在识别杂色名片，有背景和底纹的名片，以及扫描后的票据的过程中，识别准确率较差，甚至很多时候无法识别出文字。

传统的OCR是通过对图片的灰度变换来获得要识别的图像，但是这类图像在识别的过程中，会因为背景、纹理、倾斜的情况，导致识别率的降低。尤其是在识别打印票据得时候，传统的识别方法往往由于复杂图像（包括：票据本身的背景纹理；由于打印得偏差导致打印文字会压到分割线；图章遮盖文字或形成花纹背景），导致在识别票据时难以基本有效的识别出内容。

因此有必要设计一种能够较好识别图像复杂文字的方法。

发明内容

针对现有技术中的缺陷，本发明的目的是提供一种基于色彩参数的图像拆分识别方法，从而解决杂色、有背景/底纹文字的识别问题，尤其是能够识别出具有复杂图像的名片和票据。

根据本发明提供的基于色彩参数的图像拆分识别方法，包括如下步骤：

步骤1：对待识别图像进行基于色彩参数的分析，找到该色彩参数相应的波峰点；

步骤2：根据所述波峰点将待识别图像拆分成多张拆分图像；

步骤3：对每一张所述拆分图像进行识别，得到多组拆分图像的识别结果r；

步骤4：将所述拆分图像识别结果r合并成待识别图像的识别结果R。

优选地，所述基于色彩参数的分析包括色阶分析，相应地：

所述步骤1包括步骤：对待识别图像进行色阶分析，找到色阶度图像中的色阶度波峰点；

所述步骤2包括步骤：根据不同的所述色阶度波峰点将待识别图像拆分成多张拆分图像。

优选地，所述基于色彩参数的分析包括色谱聚类分析，相应地：

所述步骤1包括步骤：对待识别图像进行色谱聚类分析，找到色谱聚类图像中的色谱聚类波峰点；

所述步骤2包括步骤：根据不同的所述色谱聚类波峰点将待识别图像拆分成多张拆分图像。

优选地，所述步骤4包括如下步骤：

将所述待识别图像的所有拆分图像识别结果r合并成待识别图像的识别结果R。

优选地，所述步骤1包括如下步骤：

步骤11：将待识别图像转化为数字记录；

步骤12：对待识别图像的数字记录进行傅里叶变换；

步骤13：对傅里叶变换的结果求导，得到极值点；

步骤14：根据极值点聚类，取得出现最多的色彩范围。

优选地，所述步骤2包括如下步骤：

步骤21：针对步骤14中取得的色彩范围，将所有数字记录分组；

步骤22：在每组记录中，针对所对应的色彩范围，在色彩范围内的数值保留，其他的变化为白色所对应的数值；

步骤23：将每组记录的数字重新转化为拆分图像。

优选地，所述步骤3包括如下步骤：

步骤31：将所拆分图像的图片名记录以后进行图形识别；

步骤32：得到每张图片对应的文本内容，每项文本内容包括项目名称、具体内容和可信度。

优选地，所述步骤4包括如下步骤：

步骤41：根据待识别图片的拆分记录，取得每一个拆分图片对应的文本内容；

步骤42：从每个拆分图像对应的文本内容中确定待整合内容；

步骤43：将待整合内容进行整合，得到对待识别图像识别的最终识别结果。

优选地，所述步骤42包括如下任一种或任多种步骤：

-针对只需要有一个文本内容的拆分图像，则从所述文本内容中选择一个可信信度最高的文本内容作为待整合内容；

-针对需要有多个文本内容的拆分图像，则从所述文本内容中选择可信度超过某一个阀值的文本内容作为待整合内容。

与现有技术相比，本发明具有如下的有益效果：

1、本发明在图像识别的过程中，能够较好地对背景、纹理、倾斜等情况进行处理，从而提高识别率。

2、能够有效识别出因文本自身的背景纹理、因打印得偏差导致打印文字会压到分割线、以及因图章遮盖文字和形成花纹背景等情况下的票据。

3、本发明在识别的过程中可以将多色和有背景图片进行识别，得到较好的识别效果，尤其适用于具有复杂图像的名片和票据识别。

附图说明

通过阅读参照以下附图对非限制性实施例所作的详细描述，本发明的其它特征、目的和优点将会变得更明显：

图1示出本发明的原理示意图。

具体实施方式

下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明，但不以任何形式限制本发明。应当指出的是，对本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进。这些都属于本发明的保护范围。

步骤2：根据所述波峰点将待识别图像拆分成多张拆分图像；

步骤4：将所述拆分图像识别结果r合并成待识别图像的识别结果R，优选地，将所述待识别图像的所有拆分图像识别结果r合并成待识别图像的识别结果R。

在优选例中，可以对待识别图像进行色阶分析以及色谱聚类分析，进行找到相应分析图像的波峰点，其中，色阶分析以及色谱聚类分析可以单独执行，任一种分析的执行均可以提高待识别图像的识别率。具体地：

所述基于色彩参数的分析包括色阶分析，相应地：所述步骤1包括步骤：对待识别图像进行色阶分析，找到色阶度图像中的色阶度波峰点；所述步骤2包括步骤：根据不同的所述色阶度波峰点将待识别图像拆分成多张拆分图像；

所述基于色彩参数的分析包括色谱聚类分析，相应地：所述步骤1包括步骤：对待识别图像进行色谱聚类分析，找到色谱聚类图像中的色谱聚类波峰点；所述步骤2包括步骤：根据不同的所述色谱聚类波峰点将待识别图像拆分成多张拆分图像。

进一步优选地，所述步骤1包括如下步骤：

步骤11：将待识别图像转化为数字记录。

步骤12：对待识别图像的数字记录进行傅里叶变换。

步骤13：对傅里叶变换的结果求导，得到极值点。

步骤14：根据极值点聚类，取得出现最多的色彩范围。

所述步骤2包括如下步骤：

步骤21：针对步骤14中取得的色彩范围，将所有数字记录分组。

步骤22：在每组记录中，针对所对应的色彩范围，在色彩范围内的数值保留，其他的变化为白色所对应的数值。

步骤23：将每组记录的数字重新转化为拆分图像。

所述步骤3包括如下步骤：

步骤31：将所拆分图像的图片名记录以后，送到OCR核心中进行图形识别。

步骤32：在OCR核心的输出端的到每张图片具有对应的文本内容，每项文本内容包括项目名称、具体内容和可信度。

所述步骤4包括如下步骤：

步骤41：根据待识别图片的拆分记录，取得每一个拆分图片对应的文本内容。

步骤42：针对只需要有一个文本内容的项目，则在识别结果中，选择一个可信信度最高的文本内容。

步骤43：针对可能需要有多个文本内容的项目，在识别的结果中，选择可信度超过某一个阀值的结果。

步骤44：将多个文本内容文档的结果整合，得到对原图像识别的最终结果。

更进一步具体地，对基于色阶（灰度）和色谱聚类的分析，能够分解出待识别图像所包含的大量的颜色和灰度级别；如果针对特定的票据，则可以固定分解的算法，无需再进行分析；然后将待识别图片分解成多张不同灰度或颜色的拆分图片；利用OCR模块将每一张拆分图片都进行识别，得到分解出得每一组图片；利用数据处理模块将所有的识别结果合并成一张图片的识别结果。

以上对本发明的具体实施例进行了描述。需要理解的是，本发明并不局限于上述特定实施方式，本领域技术人员可以在权利要求的范围内做出各种变形或修改，这并不影响本发明的实质内容。

Claims

1.一种基于色彩参数的图像拆分识别方法，其特征在于，包括如下步骤：

步骤2：根据所述波峰点将待识别图像拆分成多张拆分图像；

步骤4：将所述拆分图像识别结果r合并成待识别图像的识别结果R；

所述基于色彩参数的分析包括色阶分析，相应地：

2.根据权利要求1所述的基于色彩参数的图像拆分识别方法，其特征在于，所述步骤4包括如下步骤：

3.根据权利要求1所述的基于色彩参数的图像拆分识别方法，其特征在于，所述步骤1包括如下步骤：

步骤11：将待识别图像转化为数字记录；

步骤12：对待识别图像的数字记录进行傅里叶变换；

步骤13：对傅里叶变换的结果求导，得到极值点；

步骤14：根据极值点聚类，取得出现最多的色彩范围。

4.根据权利要求3所述的基于色彩参数的图像拆分识别方法，其特征在于，所述步骤2包括如下步骤：

步骤23：将每组记录的数字重新转化为拆分图像。

5.根据权利要求1所述的基于色彩参数的图像拆分识别方法，其特征在于，所述步骤3包括如下步骤：

步骤31：将所拆分图像的图片名记录以后进行图形识别；

6.根据权利要求5所述的基于色彩参数的图像拆分识别方法，其特征在于，所述步骤4包括如下步骤：

7.根据权利要求6所述的基于色彩参数的图像拆分识别方法，其特征在于，所述步骤42包括如下任一种或任多种步骤：

-针对只需要有一个文本内容的拆分图像，则从所述文本内容中选择一个可信度最高的文本内容作为待整合内容；