CN103281474B - 一种多功能一体化打印机扫描图像的图文分离方法 - Google Patents
一种多功能一体化打印机扫描图像的图文分离方法 Download PDFInfo
- Publication number
- CN103281474B CN103281474B CN201310159078.3A CN201310159078A CN103281474B CN 103281474 B CN103281474 B CN 103281474B CN 201310159078 A CN201310159078 A CN 201310159078A CN 103281474 B CN103281474 B CN 103281474B
- Authority
- CN
- China
- Prior art keywords
- image
- fritter
- pixel
- threshold value
- separated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Facsimile Image Signal Circuits (AREA)
- Image Analysis (AREA)
Abstract
本发明提出了一种多功能一体化打印机扫描图像的图文分离方法。现有的扫描图像的图文分离方法是基于连通域的分析算法和基于纹理特征的分割算法,前者在处理背景比较复杂或质量较差的图像时,很难抽取准确的连通域,后者在处理象形文字时无法达到理想效果。结合多功能一体化打印机的特征,本发明介绍了一种简单、省时,易于在硬件上实现的图文分离方法。本发明所述的方法结合图像中文字区域和图像区域的不同特征,利用两个分离阈值和图像小块的穿越次数进行图文分离。采用本发明所述技术方案,可以准确地将图像的图像区域和文字区域进行分离。
Description
技术领域
本发明属于数字图像处理领域,涉及一种多功能一体化打印机扫描图像的图文分离方法。
背景技术
多功能一体化打印机的一项功能是扫描图像,然后打印得到复制品。一幅图文并存的扫描图像,人们往往期望得到文字区域清晰,图像区域光滑的复制品。如果统一对图像进行增强处理或者光滑处理,很难得到这样的打印效果。相反,如果将图像中的文字区域和图像区域分开,对文字区域做增强处理,对图像区域做光滑处理,便可以达到人们期望的效果。此时,对多功能一体化打印机的扫描图像进行图文分离便成为了一个亟待解决的技术问题。
传统的图文分离算法可大致分为两大类,一种是基于连通域的分析算法,另一种是基于纹理特征的分割算法。前者充分利用了字符串的规则性,从而求得图文切分的阈值,此类算法的优点是简单直接、运算速度快,然而当图像的背景比较复杂或者质量较差时,此类算法很难抽取准确的连通域。另外,此类算法中所使用的规则和门限阈值是根据特定的图像集确定的,这种算法局限于具体的应用,缺乏鲁棒性,很难进行推广;后者则利用字符与图形具有不同的纹理这一特征进行图文分离,但是,基于纹理的图文分离算法大多针对以英文为代表的小字符集的字母文字,在处理中文等象形文字时很难得到理想的效果。另外,基于纹理特征的图文分离算法中如何选取有效和通用的纹理特征是一个难点,处理纹理的计算也比较复杂,导致运算速度较慢。
发明内容
为克服现有技术缺陷,本发明提出一种多功能一体化打印机扫描图像的图文分离方法。
本发明所采用的技术方案为:一种多功能一体化打印机扫描图像的图文分离方法,其特征在于,包括以下步骤:
步骤1:将扫描得到的原图像A转换到灰度模式,得到256级灰度的图像B;
步骤2:计算所述的图像B中每一灰度级的像素个数在总像素中的比得到灰度级的频率,以所述的灰度级为横坐标,所述的灰度级的频率为纵坐标,通过拟合的方法得到所述的图像B的灰度直方图曲线;
步骤3:在所述的图像B的灰度直方图曲线128级到256级的范围内寻找灰度级的频率最高的灰度级记为灰度级G,距离所述的灰度级G最近的波谷处对应的灰度级作为第一分离阈值T1,将T1-40作为第二分离阈值T2;
步骤4:将所述的图像B分为若干个小块,每个小块含有M×N个像素,每个小块的穿越数C初始为0,其中M≥1,N≥1;
步骤5:判断所述的小块中所有像素对所述的第一分离阈值T1、第二分离阈值T2是否穿越,统计所述的小块穿越数C;
步骤6:对所述的小块的穿越数C进行判断:
如果:0.2*M×N<C,则所述的小块为文字小块;
否则:所述的小块为图像小块;
步骤7:将所述的原图像A中所有文字小块中的像素存储在文字文件中,合并为文字文件;将所述的原图像A中所有图像小块的像素存储在图像文件中,合并为图像文件。
作为优选,所述的图像B分为若干个小块,每个小块含有16×16个像素。
作为优选,所述的小块中所有像素对所述的第一分离阈值T1、第二分离阈值T2是否穿越的判断方法为:取所述的小块中的某一像素,如果该像素与分离阈值T符合如下条件:
((xm,yn)-T)×((xm+1,yn)-T)<0或者((xm,yn)-T)×((xm,yn+1)-T)<0,
则该像素穿越分离阈值T,其中,(xm,yn)为所述的小块中第m行、第n列的灰度值;(xm+1,yn)为所述的小块中第m+1行、第n列的灰度值;(xm,yn+1)为所述的小块中第m行、第n+1列的灰度值。
其中,当像素位于所述的小块的下边界时,(xm+1,yn)不存在,只需判断该像素与分离阈值T是否符合如下条件:((xm,yn)-T)×((xm,yn+1)-T)<0,则该像素穿越分离阈值T;
其中,当像素位于所述的小块的右边界时,(xm,yn+1)不存在,只需判断该像素与分离阈值T是否符合如下条件:((xm,yn)-T)×((xm+1,yn)-T)<0,则该像素穿越分离阈值T;
其中,当(xm+1,yn),(xm,yn+1)均不存在时,则认为像素穿越分离阈值T。
作为优选,所述的小块穿越数C计算方法为:遍历所述的小块中所有的像素对所述的第一分离阈值T1、所述的第二分离阈值T2进行穿越判断,若遍历的像素对所述的第一分离阈值T1、所述的第二分离阈值T2都能够穿越,则所述的小块穿越数C加1。
作为优选,所述的拟合的方法为三次多项式拟合的方法。
作为优选,所述的将扫描得到的原图像A转换到灰度模式时,所采用的方法为0.2989*R+0.5870*G+0.1140*B,其中,R、G、B分别为所述的原图像A中像素的红、绿、蓝分量。
本发明根据扫描图像每一小块的穿越数这一特征对图像进行图文分离,可以准确地自动将图像的图像区域和文字区域进行分离;对处理得到的灰度图采用三次多项式拟合的方法得到其灰度直方图曲线。并且,计算图像小块穿越数时的第一分离阈值和第二分离阈值是不固定的,需要距离直方图曲线灰度级128到灰度级256范围内灰度级频率最高处灰度级最近的波谷处对应的灰度级确定。实施时,可以将此方法集成至扫描仪驱动中,使得用户可以对扫描图像进行自动处理。
本发明结合了多功能一体化打印机的特征,是一种简单、省时,易于在硬件上实现的图文分离方法。
附图说明
图1:本发明实施例的流程图。
具体实施方式
以下结合附图和具体实施方式对本发明的方案做进一步的阐述。
请见图1,本发明所采用的技术方案是:一种多功能一体化打印机扫描图像的图文分离方法,包括以下步骤:
步骤1:将扫描得到的原图像A转换到灰度模式,得到256级灰度的图像B;
具体实施例中,若扫描得到的原图像A不为灰度模式则需要将其转换为灰度模式,RGB图像转换到灰度模式所采用的方法为0.2989*R+0.5870*G+0.1140*B,其中,R、G、B分别为图像A中像素的红、绿、蓝分量;
步骤2:计算图像B中每一灰度级的像素个数在总像素中的比得到灰度级的频率,以灰度级为横坐标,灰度级的频率为纵坐标,通过拟合的方法得到图像B的灰度直方图曲线;
具体实施中,灰度直方图曲线的拟合采用的是三次多项式拟合的方法,三次多项式拟合为现有技术,本发明不予赘述。
步骤3:在图像B的灰度直方图曲线128级到256级的范围内寻找灰度级的频率最高的灰度级记为灰度级G,距离灰度级G最近的波谷处对应的灰度级作为第一分离阈值T1,将T1-40作为第二分离阈值T2。
步骤4:将图像B分为若干个小块,每个小块含有M×N个像素,每个小块的穿越数C初始为0,其中M≥1,N≥1;具体的实施中,每个小块中含有16×16个像素。
步骤5:判断小块中所有像素对第一分离阈值T1、第二分离阈值T2是否穿越,统计小块穿越数C;
其中判断穿越的方法为:取小块中的某一像素,如果该像素与分离阈值T符合如下条件:
((xm,yn)-T)×((xm+1,yn)-T)<0或者((xm,yn)-T)×((xm,yn+1)-T)<0,
则该像素穿越分离阈值T,其中,(xm,yn)为小块中第m行、第n列的灰度值;(xm+1,yn)为小块中第m+1行、第n列的灰度值;(xm,yn+1)为小块中第m行、第n+1列的灰度值;
其中,当像素位于所述的小块的下边界时,(xm+1,yn)不存在,只需判断该像素与分离阈值T是否符合如下条件:((xm,yn)-T)×((xm,yn+1)-T)<0,则该像素穿越分离阈值T;
其中,当像素位于所述的小块的右边界时,(xm,yn+1)不存在,只需判断该像素与分离阈值T是否符合如下条件:((xm,yn)-T)×((xm+1,yn)-T)<0,则该像素穿越分离阈值T;
其中,当(xm+1,yn),(xm,yn+1)均不存在时,则认为像素穿越分离阈值T。
其中,统计小块穿越数C的方法为:遍历小块中所有的像素对第一分离阈值T1、第二分离阈值T2进行穿越判断,若遍历的像素对第一分离阈值T1、第二分离阈值T2都能够穿越,则小块穿越数C加1。依次计算图像B中所有小块的穿越数直至遍历完图像B中的所有小块,得到每一个小块的穿越数C。
步骤6:对小块的穿越数C进行判断:
如果:0.2*M×N<C,则小块为文字小块;
否则:小块为图像小块;
具体的实施中,根据每一个小块的穿越数C,利用公式0.2*M×N<C进行判断,如果此公式成立,则将该小块标记为1,表示该遍历小块为文字,否则将该小块标记为-1,表示该遍历小块为图像。
步骤7:将原图像A中所有文字小块中的像素存储在文字文件中,合并为文字文件;将原图像A中所有图像小块的像素存储在图像文件中,合并为图像文件;
具体实施中,根据每一个小块的标记,如果该小块的标记为1,则将该小块对应的原图像A中的像素存储在文字文件中,如果该小块的标记为-1,则将该小块对应的原图像A中的像素存储在图像文件中。
本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。
Claims (5)
1.一种多功能一体化打印机扫描图像的图文分离方法,其特征在于,包括以下步骤:
步骤1:将扫描得到的原图像A转换到灰度模式,得到256级灰度的图像B;
步骤2:计算所述的图像B中每一灰度级的像素个数在总像素中的比得到灰度级的频率,以所述的灰度级为横坐标,所述的灰度级的频率为纵坐标,通过拟合的方法得到所述的图像B的灰度直方图曲线;
步骤3:在所述的图像B的灰度直方图曲线128级到256级的范围内寻找灰度级的频率最高的灰度级记为灰度级G,距离所述的灰度级G最近的波谷处对应的灰度级作为第一分离阈值T1,将T1-40作为第二分离阈值T2;
步骤4:将所述的图像B分为若干个小块,每个小块含有M×N个像素,每个小块的穿越数C初始为0,其中M≥1,N≥1;
步骤5:判断所述的小块中所有像素对所述的第一分离阈值T1、第二分离阈值T2是否穿越,统计所述的小块穿越数C;所述的小块穿越数C计算方法为:遍历所述的小块中所有的像素对所述的第一分离阈值T1、所述的第二分离阈值T2进行穿越判断,若遍历的像素对所述的第一分离阈值T1、所述的第二分离阈值T2都能够穿越,则所述的小块穿越数C加1;
步骤6:对所述的小块的穿越数C进行判断:
如果:0.2*M×N<C,则所述的小块为文字小块;
否则:所述的小块为图像小块;
步骤7:将所述的原图像A中所有文字小块中的像素存储在文字文件中,合并为文字文件;将所述的原图像A中所有图像小块的像素存储在图像文件中,合并为图像文件。
2.根据权利要求1所述的多功能一体化打印机扫描图像的图文分离方法,其特征在于:所述的图像B分为若干个小块,每个小块含有16×16个像素。
3.根据权利要求1所述的多功能一体化打印机扫描图像的图文分离方法,其特征在于:所述的小块中所有像素对所述的第一分离阈值T1、第二分离阈值T2是否穿越的判断方法为:取所述的小块中的某一像素,如果该像素与分离阈值T符合如下条件:
((xm,yn)-T)×((xm+1,yn)-T)<0或者((xm,yn)-T)×((xm,yn+1)-T)<0,
则该像素穿越分离阈值T,其中,(xm,yn)为所述的小块中第m行、第n列的灰度值;(xm+1,yn)为所述的小块中第m+1行、第n列的灰度值;(xm,yn+1)为所述的小块中第m行、第n+1列的灰度值;
其中,当像素位于所述的小块的下边界时,(xm+1,yn)不存在,只需判断该像素与分离阈值T是否符合如下条件:((xm,yn)-T)×((xm,yn+1)-T)<0,则该像素穿越分离阈值T;
其中,当像素位于所述的小块的右边界时,(xm,yn+1)不存在,只需判断该像素与分离阈值T是否符合如下条件:((xm,yn)-T)×((xm+1,yn)-T)<0,则该像素穿越分离阈值T;
其中,当(xm+1,yn),(xm,yn+1)均不存在时,则认为像素穿越分离阈值T。
4.根据权利要求1所述的多功能一体化打印机扫描图像的图文分离方法,其特征在于:所述的拟合的方法为三次多项式拟合的方法。
5.根据权利要求1所述的多功能一体化打印机扫描图像的图文分离方法,其特征在于:所述的将扫描得到的原图像A转换到灰度模式时,所采用的方法为0.2989*R+0.5870*G+0.1140*B,其中,R、G、B分别为所述的原图像A中像素的红、绿、蓝分量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310159078.3A CN103281474B (zh) | 2013-05-02 | 2013-05-02 | 一种多功能一体化打印机扫描图像的图文分离方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310159078.3A CN103281474B (zh) | 2013-05-02 | 2013-05-02 | 一种多功能一体化打印机扫描图像的图文分离方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103281474A CN103281474A (zh) | 2013-09-04 |
CN103281474B true CN103281474B (zh) | 2015-04-15 |
Family
ID=49063909
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310159078.3A Expired - Fee Related CN103281474B (zh) | 2013-05-02 | 2013-05-02 | 一种多功能一体化打印机扫描图像的图文分离方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103281474B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1588431A (zh) * | 2004-07-02 | 2005-03-02 | 清华大学 | 基于游程邻接图的复杂背景彩色图像中字符提取方法 |
CN101599125A (zh) * | 2009-06-11 | 2009-12-09 | 上海交通大学 | 复杂背景下图像处理的二值化方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8103104B2 (en) * | 2002-01-11 | 2012-01-24 | Hewlett-Packard Development Company, L.P. | Text extraction and its application to compound document image compression |
-
2013
- 2013-05-02 CN CN201310159078.3A patent/CN103281474B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1588431A (zh) * | 2004-07-02 | 2005-03-02 | 清华大学 | 基于游程邻接图的复杂背景彩色图像中字符提取方法 |
CN101599125A (zh) * | 2009-06-11 | 2009-12-09 | 上海交通大学 | 复杂背景下图像处理的二值化方法 |
Also Published As
Publication number | Publication date |
---|---|
CN103281474A (zh) | 2013-09-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8103104B2 (en) | Text extraction and its application to compound document image compression | |
CN101515325B (zh) | 基于字符切分和颜色聚类的数字视频中的字符提取方法 | |
CN104751142B (zh) | 一种基于笔划特征的自然场景文本检测方法 | |
CN107590447A (zh) | 一种文字标题识别方法及装置 | |
US20110243432A1 (en) | Determining the Scale of Images | |
JP2004320701A (ja) | 画像処理装置、画像処理プログラムおよび記憶媒体 | |
DE602005026862D1 (de) | Segmentierung eines digitalen bildes und herstellung einer kompakten repräsentation | |
CN104598907B (zh) | 一种基于笔画宽度图的图像中文字数据提取方法 | |
WO2022166865A1 (zh) | 一种文字图像的阴影消除方法、装置及电子设备 | |
CN106020120A (zh) | 基于ios***的利用图像生成G代码的方法 | |
CN101106716A (zh) | 一种分水岭图象分割处理方法 | |
CN104361335B (zh) | 一种基于扫描图像自动去除黑边的处理方法 | |
CN105701491A (zh) | 固定格式文档图像模版的制作方法及其应用 | |
CN109447117A (zh) | 双层车牌识别方法、装置、计算机设备及存储介质 | |
US20080310685A1 (en) | Methods and Systems for Refining Text Segmentation Results | |
CN101599172A (zh) | 非均匀光照的文本图像的亮度补偿分割方法 | |
US20120114230A1 (en) | Image processing apparatus, image processing method, and storage medium | |
US8223395B2 (en) | Methods and systems for refining text color in a digital image | |
CN110807747B (zh) | 一种基于前景蒙版的文档图像降噪方法 | |
CN103281474B (zh) | 一种多功能一体化打印机扫描图像的图文分离方法 | |
CN105160300B (zh) | 一种基于水平集分割的文本抽取方法 | |
CN1275191C (zh) | 用于扩展在图象中的字符区域的设备及方法 | |
CN104835121B (zh) | 基于无穷范数约束与最大熵原则的色调映射方法 | |
CN112837329B (zh) | 一种藏文古籍文档图像二值化方法及*** | |
CN112348103B (zh) | 图像块分类方法和装置及其超分辨重建方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20150415 Termination date: 20200502 |