CN103617423B - 基于色彩参数的图像拆分识别方法 - Google Patents
基于色彩参数的图像拆分识别方法 Download PDFInfo
- Publication number
- CN103617423B CN103617423B CN201310612649.4A CN201310612649A CN103617423B CN 103617423 B CN103617423 B CN 103617423B CN 201310612649 A CN201310612649 A CN 201310612649A CN 103617423 B CN103617423 B CN 103617423B
- Authority
- CN
- China
- Prior art keywords
- content
- recognized
- recognition
- images
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Image Analysis (AREA)
- Character Input (AREA)
Abstract
本发明提供了一种基于色彩参数的图像拆分识别方法,包括步骤:步骤1:对待识别图像进行基于色彩参数的分析,找到该色彩参数相应的波峰点;步骤2:根据所述波峰点将待识别图像拆分成多张拆分图像;步骤3:对每一张所述拆分图像进行识别,得到多组拆分图像的识别结果r;步骤4:将所述拆分图像识别结果r合并成待识别图像的识别结果R。本发明能够较好地对背景、纹理、倾斜等情况进行处理,从而提高识别率,可以将多色和有背景图片进行识别,得到较好的识别效果,尤其适用于具有复杂图像的名片和票据识别。
Description
技术领域
本发明涉及计算机科学与技术中的图形识别领域,具体地,涉及基于色彩参数的图像拆分识别方法,尤其是色阶色谱拆分的识别方法。
背景技术
在文字识别领域,OCR(Optical Character Recognition,光学字符识别)技术是应用较多的技术,并且应用已经相对广泛。传统的识别中,OCR图形处理会将图形进行矩形矫正和灰度变换(两个步骤的先后执行顺序可以对换),然后进行二值化,最后进入OCR核心并进行识别。
该识别过程针对普通的文本(例如简单的、色彩单一的名片)的识别,可以完成任务,能够将图片转化成文字。但是在识别杂色名片,有背景和底纹的名片,以及扫描后的票据的过程中,识别准确率较差,甚至很多时候无法识别出文字。
传统的OCR是通过对图片的灰度变换来获得要识别的图像,但是这类图像在识别的过程中,会因为背景、纹理、倾斜的情况,导致识别率的降低。尤其是在识别打印票据得时候,传统的识别方法往往由于复杂图像(包括:票据本身的背景纹理;由于打印得偏差导致打印文字会压到分割线;图章遮盖文字或形成花纹背景),导致在识别票据时难以基本有效的识别出内容。
因此有必要设计一种能够较好识别图像复杂文字的方法。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种基于色彩参数的图像拆分识别方法,从而解决杂色、有背景/底纹文字的识别问题,尤其是能够识别出具有复杂图像的名片和票据。
根据本发明提供的基于色彩参数的图像拆分识别方法,包括如下步骤:
步骤1:对待识别图像进行基于色彩参数的分析,找到该色彩参数相应的波峰点;
步骤2:根据所述波峰点将待识别图像拆分成多张拆分图像;
步骤3:对每一张所述拆分图像进行识别,得到多组拆分图像的识别结果r;
步骤4:将所述拆分图像识别结果r合并成待识别图像的识别结果R。
优选地,所述基于色彩参数的分析包括色阶分析,相应地:
所述步骤1包括步骤:对待识别图像进行色阶分析,找到色阶度图像中的色阶度波峰点;
所述步骤2包括步骤:根据不同的所述色阶度波峰点将待识别图像拆分成多张拆分图像。
优选地,所述基于色彩参数的分析包括色谱聚类分析,相应地:
所述步骤1包括步骤:对待识别图像进行色谱聚类分析,找到色谱聚类图像中的色谱聚类波峰点;
所述步骤2包括步骤:根据不同的所述色谱聚类波峰点将待识别图像拆分成多张拆分图像。
优选地,所述步骤4包括如下步骤:
将所述待识别图像的所有拆分图像识别结果r合并成待识别图像的识别结果R。
优选地,所述步骤1包括如下步骤:
步骤11:将待识别图像转化为数字记录;
步骤12:对待识别图像的数字记录进行傅里叶变换;
步骤13:对傅里叶变换的结果求导,得到极值点;
步骤14:根据极值点聚类,取得出现最多的色彩范围。
优选地,所述步骤2包括如下步骤:
步骤21:针对步骤14中取得的色彩范围,将所有数字记录分组;
步骤22:在每组记录中,针对所对应的色彩范围,在色彩范围内的数值保留,其他的变化为白色所对应的数值;
步骤23:将每组记录的数字重新转化为拆分图像。
优选地,所述步骤3包括如下步骤:
步骤31:将所拆分图像的图片名记录以后进行图形识别;
步骤32:得到每张图片对应的文本内容,每项文本内容包括项目名称、具体内容和可信度。
优选地,所述步骤4包括如下步骤:
步骤41:根据待识别图片的拆分记录,取得每一个拆分图片对应的文本内容;
步骤42:从每个拆分图像对应的文本内容中确定待整合内容;
步骤43:将待整合内容进行整合,得到对待识别图像识别的最终识别结果。
优选地,所述步骤42包括如下任一种或任多种步骤:
-针对只需要有一个文本内容的拆分图像,则从所述文本内容中选择一个可信信度最高的文本内容作为待整合内容;
-针对需要有多个文本内容的拆分图像,则从所述文本内容中选择可信度超过某一个阀值的文本内容作为待整合内容。
与现有技术相比,本发明具有如下的有益效果:
1、本发明在图像识别的过程中,能够较好地对背景、纹理、倾斜等情况进行处理,从而提高识别率。
2、能够有效识别出因文本自身的背景纹理、因打印得偏差导致打印文字会压到分割线、以及因图章遮盖文字和形成花纹背景等情况下的票据。
3、本发明在识别的过程中可以将多色和有背景图片进行识别,得到较好的识别效果,尤其适用于具有复杂图像的名片和票据识别。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出本发明的原理示意图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进。这些都属于本发明的保护范围。
根据本发明提供的基于色彩参数的图像拆分识别方法,包括如下步骤:
步骤1:对待识别图像进行基于色彩参数的分析,找到该色彩参数相应的波峰点;
步骤2:根据所述波峰点将待识别图像拆分成多张拆分图像;
步骤3:对每一张所述拆分图像进行识别,得到多组拆分图像的识别结果r;
步骤4:将所述拆分图像识别结果r合并成待识别图像的识别结果R,优选地,将所述待识别图像的所有拆分图像识别结果r合并成待识别图像的识别结果R。
在优选例中,可以对待识别图像进行色阶分析以及色谱聚类分析,进行找到相应分析图像的波峰点,其中,色阶分析以及色谱聚类分析可以单独执行,任一种分析的执行均可以提高待识别图像的识别率。具体地:
所述基于色彩参数的分析包括色阶分析,相应地:所述步骤1包括步骤:对待识别图像进行色阶分析,找到色阶度图像中的色阶度波峰点;所述步骤2包括步骤:根据不同的所述色阶度波峰点将待识别图像拆分成多张拆分图像;
所述基于色彩参数的分析包括色谱聚类分析,相应地:所述步骤1包括步骤:对待识别图像进行色谱聚类分析,找到色谱聚类图像中的色谱聚类波峰点;所述步骤2包括步骤:根据不同的所述色谱聚类波峰点将待识别图像拆分成多张拆分图像。
进一步优选地,所述步骤1包括如下步骤:
步骤11:将待识别图像转化为数字记录。
步骤12:对待识别图像的数字记录进行傅里叶变换。
步骤13:对傅里叶变换的结果求导,得到极值点。
步骤14:根据极值点聚类,取得出现最多的色彩范围。
所述步骤2包括如下步骤:
步骤21:针对步骤14中取得的色彩范围,将所有数字记录分组。
步骤22:在每组记录中,针对所对应的色彩范围,在色彩范围内的数值保留,其他的变化为白色所对应的数值。
步骤23:将每组记录的数字重新转化为拆分图像。
所述步骤3包括如下步骤:
步骤31:将所拆分图像的图片名记录以后,送到OCR核心中进行图形识别。
步骤32:在OCR核心的输出端的到每张图片具有对应的文本内容,每项文本内容包括项目名称、具体内容和可信度。
所述步骤4包括如下步骤:
步骤41:根据待识别图片的拆分记录,取得每一个拆分图片对应的文本内容。
步骤42:针对只需要有一个文本内容的项目,则在识别结果中,选择一个可信信度最高的文本内容。
步骤43:针对可能需要有多个文本内容的项目,在识别的结果中,选择可信度超过某一个阀值的结果。
步骤44:将多个文本内容文档的结果整合,得到对原图像识别的最终结果。
更进一步具体地,对基于色阶(灰度)和色谱聚类的分析,能够分解出待识别图像所包含的大量的颜色和灰度级别;如果针对特定的票据,则可以固定分解的算法,无需再进行分析;然后将待识别图片分解成多张不同灰度或颜色的拆分图片;利用OCR模块将每一张拆分图片都进行识别,得到分解出得每一组图片;利用数据处理模块将所有的识别结果合并成一张图片的识别结果。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质内容。
Claims (7)
1.一种基于色彩参数的图像拆分识别方法,其特征在于,包括如下步骤:
步骤1:对待识别图像进行基于色彩参数的分析,找到该色彩参数相应的波峰点;
步骤2:根据所述波峰点将待识别图像拆分成多张拆分图像;
步骤3:对每一张所述拆分图像进行识别,得到多组拆分图像的识别结果r;
步骤4:将所述拆分图像识别结果r合并成待识别图像的识别结果R;
所述基于色彩参数的分析包括色阶分析,相应地:
所述步骤1包括步骤:对待识别图像进行色阶分析,找到色阶度图像中的色阶度波峰点;
所述步骤2包括步骤:根据不同的所述色阶度波峰点将待识别图像拆分成多张拆分图像。
2.根据权利要求1所述的基于色彩参数的图像拆分识别方法,其特征在于,所述步骤4包括如下步骤:
将所述待识别图像的所有拆分图像识别结果r合并成待识别图像的识别结果R。
3.根据权利要求1所述的基于色彩参数的图像拆分识别方法,其特征在于,所述步骤1包括如下步骤:
步骤11:将待识别图像转化为数字记录;
步骤12:对待识别图像的数字记录进行傅里叶变换;
步骤13:对傅里叶变换的结果求导,得到极值点;
步骤14:根据极值点聚类,取得出现最多的色彩范围。
4.根据权利要求3所述的基于色彩参数的图像拆分识别方法,其特征在于,所述步骤2包括如下步骤:
步骤21:针对步骤14中取得的色彩范围,将所有数字记录分组;
步骤22:在每组记录中,针对所对应的色彩范围,在色彩范围内的数值保留,其他的变化为白色所对应的数值;
步骤23:将每组记录的数字重新转化为拆分图像。
5.根据权利要求1所述的基于色彩参数的图像拆分识别方法,其特征在于,所述步骤3包括如下步骤:
步骤31:将所拆分图像的图片名记录以后进行图形识别;
步骤32:得到每张图片对应的文本内容,每项文本内容包括项目名称、具体内容和可信度。
6.根据权利要求5所述的基于色彩参数的图像拆分识别方法,其特征在于,所述步骤4包括如下步骤:
步骤41:根据待识别图片的拆分记录,取得每一个拆分图片对应的文本内容;
步骤42:从每个拆分图像对应的文本内容中确定待整合内容;
步骤43:将待整合内容进行整合,得到对待识别图像识别的最终识别结果。
7.根据权利要求6所述的基于色彩参数的图像拆分识别方法,其特征在于,所述步骤42包括如下任一种或任多种步骤:
-针对只需要有一个文本内容的拆分图像,则从所述文本内容中选择一个可信度最高的文本内容作为待整合内容;
-针对需要有多个文本内容的拆分图像,则从所述文本内容中选择可信度超过某一个阀值的文本内容作为待整合内容。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310612649.4A CN103617423B (zh) | 2013-11-26 | 2013-11-26 | 基于色彩参数的图像拆分识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310612649.4A CN103617423B (zh) | 2013-11-26 | 2013-11-26 | 基于色彩参数的图像拆分识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103617423A CN103617423A (zh) | 2014-03-05 |
CN103617423B true CN103617423B (zh) | 2017-01-25 |
Family
ID=50168126
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310612649.4A Active CN103617423B (zh) | 2013-11-26 | 2013-11-26 | 基于色彩参数的图像拆分识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103617423B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104268512B (zh) * | 2014-09-17 | 2018-04-27 | 清华大学 | 基于光学字符识别的图像中字符识别方法及装置 |
CN107092903A (zh) * | 2016-02-18 | 2017-08-25 | 阿里巴巴集团控股有限公司 | 信息识别方法及装置 |
CN110187816B (zh) * | 2019-05-22 | 2020-11-20 | 掌阅科技股份有限公司 | 漫画类型电子书的自动翻页方法、计算设备及存储介质 |
CN112215159B (zh) * | 2020-10-13 | 2021-05-07 | 苏州工业园区报关有限公司 | 一种基于ocr和人工智能技术的国际贸易单证拆分*** |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5134666A (en) * | 1990-08-15 | 1992-07-28 | Ricoh Company, Ltd. | Image separator for color image processing |
CN102122348A (zh) * | 2011-02-26 | 2011-07-13 | 王枚 | 一种实用的模糊车牌图像复原方法 |
CN102663411A (zh) * | 2012-02-29 | 2012-09-12 | 宁波大学 | 一种目标人体识别方法 |
CN103136845A (zh) * | 2013-01-23 | 2013-06-05 | 浙江大学 | 一种基于冠字号图像特征的人民币鉴伪方法 |
-
2013
- 2013-11-26 CN CN201310612649.4A patent/CN103617423B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5134666A (en) * | 1990-08-15 | 1992-07-28 | Ricoh Company, Ltd. | Image separator for color image processing |
CN102122348A (zh) * | 2011-02-26 | 2011-07-13 | 王枚 | 一种实用的模糊车牌图像复原方法 |
CN102663411A (zh) * | 2012-02-29 | 2012-09-12 | 宁波大学 | 一种目标人体识别方法 |
CN103136845A (zh) * | 2013-01-23 | 2013-06-05 | 浙江大学 | 一种基于冠字号图像特征的人民币鉴伪方法 |
Also Published As
Publication number | Publication date |
---|---|
CN103617423A (zh) | 2014-03-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11062163B2 (en) | Iterative recognition-guided thresholding and data extraction | |
US10846553B2 (en) | Recognizing typewritten and handwritten characters using end-to-end deep learning | |
US8494273B2 (en) | Adaptive optical character recognition on a document with distorted characters | |
US9811749B2 (en) | Detecting a label from an image | |
US10817741B2 (en) | Word segmentation system, method and device | |
Gebhardt et al. | Document authentication using printing technique features and unsupervised anomaly detection | |
US11151402B2 (en) | Method of character recognition in written document | |
CN111539409B (zh) | 一种基于高光谱遥感技术的古墓题记文字识别方法 | |
TW200842734A (en) | Image processing program and image processing device | |
CN103617423B (zh) | 基于色彩参数的图像拆分识别方法 | |
Demilew et al. | Ancient Geez script recognition using deep learning | |
CN107358184A (zh) | 文档文字的提取方法及提取装置 | |
CN113901952A (zh) | 一种基于深度学习的印刷体与手写体分开文字识别方法 | |
Brisinello et al. | Optical Character Recognition on images with colorful background | |
Bulatov et al. | Towards a unified framework for identity documents analysis and recognition | |
CN108877030B (zh) | 图像处理方法、装置、终端和计算机可读存储介质 | |
JP2022067086A (ja) | デジタル化された筆記の処理 | |
Karthik et al. | Segmentation and recognition of handwritten kannada text using relevance feedback and histogram of oriented gradients–a novel approach | |
CN115083024A (zh) | 基于区域划分的签名识别方法、装置、介质及设备 | |
CN106803269B (zh) | 对文档图像进行透视校正的方法和设备 | |
Liu et al. | A prototype system of courtesy amount recognition for Chinese Bank checks | |
JP2009200794A (ja) | 文書の改竄検出プログラム及び改竄検出装置 | |
Huang et al. | Chinese historic image threshold using adaptive K-means cluster and Bradley’s | |
WO2023032177A1 (ja) | オブジェクト除去システム、オブジェクト除去方法、及びオブジェクト除去プログラム | |
Murthy et al. | Nearest neighbor clustering based approach for line and character segmentation in epigraphical scripts |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C41 | Transfer of patent application or patent right or utility model | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20160608 Address after: 200120 Shanghai City, Pudong New Area China Mall (Shanghai) free trade zone lucky road No. 660 building 2307 unit Applicant after: Qianjin Network Information Technology (Shanghai) Co.,Ltd. Address before: 200336 Shanghai city Changning District Xianxia Road 579 Lane No. 38 building second room 106 Applicant before: Find forest network technology (Shanghai) Co., Ltd. |
|
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |