CN111723804B - 图文分离装置、图文分离方法及计算机可读取记录介质 - Google Patents

图文分离装置、图文分离方法及计算机可读取记录介质 Download PDF

Info

Publication number
CN111723804B
CN111723804B CN201910202937.XA CN201910202937A CN111723804B CN 111723804 B CN111723804 B CN 111723804B CN 201910202937 A CN201910202937 A CN 201910202937A CN 111723804 B CN111723804 B CN 111723804B
Authority
CN
China
Prior art keywords
image
image block
complexity
picture
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910202937.XA
Other languages
English (en)
Other versions
CN111723804A (zh
Inventor
雷凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to CN201910202937.XA priority Critical patent/CN111723804B/zh
Publication of CN111723804A publication Critical patent/CN111723804A/zh
Application granted granted Critical
Publication of CN111723804B publication Critical patent/CN111723804B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种图文分离装置、图文分离方法及计算机可读取记录介质,用于将半色调图像作为待分离图像进行图文分离,本发明的图文分离装置包括:分块部,将待分离图像划分成多个图像块;灰度复杂度解析部,基于均值差分算法依次对各个图像块进行解析得到各个图像块的灰度复杂度;第一判定部,将大于复杂度阈值的灰度复杂度对应的图像块判定为构成图片区域的图片块,并将不大于复杂度阈值的灰度复杂度对应的图像块判定为构成文字区域的文字块;整体轮廓提取部,获得待分离图像的图像轮廓;以及第二判定部,依次判断各个图像轮廓经过的图像块中是否含有图片块,一旦图像轮廓经过的图像块中含有图片块,就将该图像轮廓经过的所有图像块判定为图片块。

Description

图文分离装置、图文分离方法及计算机可读取记录介质
技术领域
本发明属于图文分离技术领域,特别涉及一种图文分离装置、图文分离方法及计算机可读取记录介质。
背景技术
半色调图像用于通过多个像素点的大小或密度的改变,来模拟连续色调图像的颜色和明暗变化。在对半色调图像进行图文分离时,由于半色调图像的像素点的分布与半色调生成算法相关,不同的半色调生成算法可能产生不同的像素分布模式,因此,仅仅通过提取半色调图像的像素的颜色和形状特征,不能对该半色调图像进行图文分离。
通常情况下,对半色调图像的图文分离基于cross算法进行,具体为:将半色调图像分成多个图像块后对每个图像块进行二值化,然后比较各个图像块在水平和垂直方向的灰度变化数量,并将灰度变化数量大的图像块判定为图片块,灰度变化数量小的图像块作为文字块。但是,当半色调图像中含有文字形状的图形时,由于文字形状的图形的灰度变化量也较低,容易被误判为文字区域,导致图文分离不准确,从而影响后续的图像处理和分析过程。
发明内容
本发明是为了解决上述问题而进行的,目的在于提供一种能够对图文混合排版的比较复杂的半色调图像进行图文分离的图文分离装置、图文分离方法以及计算机可读取记录介质。
本发明为了实现上述目的,采用了以下技术方案:
本发明提供一种图文分离装置,用于将含有图片内容和文字内容的半色调图像作为待分离图像进行图文分离,从而得到该半色调图像中与图片内容对应的图片区域以及与文字内容相对应的文字区域,其特征在于,包括:分块部,将待分离图像划分成多个图像块;灰度复杂度解析部,基于均值差分算法依次对各个图像块进行解析得到各个图像块的灰度复杂度;第一判定部,基于图像块的灰度复杂度以及预定的复杂度阈值,将大于复杂度阈值的灰度复杂度对应的图像块判定为构成图片区域的图片块,并将不大于复杂度阈值的灰度复杂度对应的图像块判定为构成文字区域的文字块;整体轮廓提取部,对待分离图像进行整体轮廓提取获得待分离图像的图像轮廓;以及第二判定部,依次判断各个图像轮廓经过的图像块中是否含有图片块,一旦图像轮廓经过的图像块中含有图片块,就将该图像轮廓经过的所有图像块判定为图片块。
本发明还提供一种图文分离方法,用于将含有图片内容和文字内容的半色调图像作为待分离图像进行图文分离,从而得到该半色调图像中与图片内容对应的图片区域以及与文字内容相对应的文字区域,其特征在于,包括以下步骤:分块步骤,将待分离图像划分成多个图像块;灰度复杂度解析步骤,基于均值差分算法依次对各个图像块进行解析得到各个图像块的灰度复杂度;第一判定步骤,基于图像块的灰度复杂度以及预定的复杂度阈值,将大于复杂度阈值的灰度复杂度对应的图像块判定为构成图片区域的图片块,并将不大于复杂度阈值的灰度复杂度对应的图像块判定为构成文字区域的文字块;整体轮廓提取步骤,对待分离图像进行整体轮廓提取获得待分离图像的图像轮廓;以及第二判定步骤,依次判断各个图像轮廓经过的图像块中是否含有图片块,一旦图像轮廓经过的图像块中含有图片块,就将该图像轮廓经过的所有图像块判定为图片块。
本发明还提供一种计算机可读取的记录介质,用于记录计算机程序,其特征在于,该计算机程序用于让将含有图片内容和文字内容的半色调图像作为待分离图像进行图文分离,从而得到该半色调图像中与图片内容对应的图片区域以及与文字内容相对应的文字区域。图文分离装置执行如下步骤:分块步骤,将待分离图像划分成多个图像块;灰度复杂度解析步骤,基于均值差分算法依次对各个图像块进行解析得到各个图像块的灰度复杂度;第一判定步骤,基于图像块的灰度复杂度以及预定的复杂度阈值,将大于复杂度阈值的灰度复杂度对应的图像块判定为构成图片区域的图片块,并将不大于复杂度阈值的灰度复杂度对应的图像块判定为构成文字区域的文字块;整体轮廓提取步骤,对待分离图像进行整体轮廓提取获得待分离图像的图像轮廓;以及第二判定步骤,依次判断各个图像轮廓经过的图像块中是否含有图片块,一旦图像轮廓经过的图像块中含有图片块,就将该图像轮廓经过的所有图像块判定为图片块。
发明的作用与效果
根据本发明所涉及的图文分离装置、图文分离方法及计算机可读取记录介质,因为分块部将半色调图像划分成多个图像块,灰度复杂度解析部基于均值差分算法依次对各个图像块进行解析得到各个图像块的灰度复杂度,第一判定部将大于复杂度阈值的灰度复杂度对应的图像块判定为图片块,将不大于复杂度阈值的灰度复杂度对应的图像块判定为文字块,从而对各个图像块的属性进行了初步的判定。进一步,整体轮廓提取部提取获得半色调图像的图像轮廓,第二判定部依次判断各个图像轮廓经过的图像块中是否含有图片块,并在图像轮廓经过的图像块中含有图片块时,将该图像轮廓经过的所有图像块判定为图片块,从而将第一判定部误判为文字块的图像块(例如构成文字形状的图形的图像块)改判为图片块,因此能够使判定结果更加准确,进而让后续的图像处理和分析过程能够顺利进行。
附图说明
图1是本发明的实施例中图文分离装置的结构框图;
图2为本发明的实施例中半色调图像的示例图;
图3为本发明的实施例中构成待分离图像的所有图像块经过二值化处理后的示例图;
图4为本发明的实施例中半色调图像经由第一判定部判定后的判定结果示例图;
图5为本发明的实施例中半色调图像经由第二判定部判定后的判定结果示例图;以及
图6是本发明的实施例中图文分离装置的图文分离动作的流程图。
具体实施方式
为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,以下结合实施例及附图对本发明的图文分离装置作具体阐述。
作为第一种实施形态,本发明提供了一种图文分离装置,用于将含有图片内容和文字内容的半色调图像作为待分离图像进行图文分离,从而得到该半色调图像中与图片内容对应的图片区域以及与文字内容相对应的文字区域,其特征在于,包括:分块部,将待分离图像划分成多个图像块;灰度复杂度解析部,依次对各个图像块进行解析得到各个图像块的灰度复杂度;第一判定部,基于图像块的灰度复杂度以及预定的复杂度阈值,将大于复杂度阈值的灰度复杂度对应的图像块判定为构成图片区域的图片块,并将不大于复杂度阈值的灰度复杂度对应的图像块判定为构成文字区域的文字块;整体轮廓提取部,对待分离图像进行整体轮廓提取获得待分离图像的图像轮廓;以及第二判定部,依次判断各个图像轮廓经过的图像块中是否含有图片块,一旦图像轮廓经过的图像块中含有图片块,就将该图像轮廓经过的所有图像块判定为图片块。
另外,在第一种实施形态的图文分离装置中,还可以具有这样的特征:还包括:预处理部,用于对半色调图像进行预处理并将该预处理后的半色调图像作为待分离图像,其中,预处理为均值滤波处理。
另外,在第一种实施形态的图文分离装置中,还可以具有这样的特征:输出部以及控制部,其中,一旦第二判定部完成判定动作后,控制部就控制输出部将多个图片块形成的图片区域的区域信息、多个文字块形成的文字区域的区域信息作为分离结果输出。
另外,在第一种实施形态的图文分离装置中,还可以具有这样的特征:其中,整体轮廓提取部包括整体二值化单元以及整体轮廓识别单元,整体二值化单元对待分离图像进行二值化处理获得二值化图像,整体轮廓识别单元对二值化图像进行整体轮廓识别获得待分离图像的图像轮廓。
另外,在第一种实施形态的图文分离装置中,还可以具有这样的特征:其中,灰度复杂度解析部具有图像块二值化单元、图像块轮廓提取单元、图像块均值滤波单元以及灰度复杂度计算单元,图像块二值化单元依次对各个图像块进行二值化处理获得多个二值化图像块,图像块轮廓提取单元依次对各个二值化图像块进行图像块轮廓提取获得多个二值化图像块轮廓,图像块均值滤波单元依次对各个二值化图像块进行均值滤波处理得到多个处理后图像块,图像块轮廓提取单元依次对各个处理后图像块进行图像块轮廓提取获得多个处理后图像块轮廓,灰度复杂度计算单元根据各个图像块的二值化图像块轮廓上的像素点的灰度值和处理后图像块轮廓上的像素点的灰度值进行计算得到各个图像块的灰度复杂度。
另外,在第一种实施形态的图文分离装置中,还可以具有这样的特征:其中,灰度复杂度计算单元基于均值差分算法计算得到各个图像块的灰度复杂度,该均值差分算法为:依次计算图像块的二值化图像块轮廓上的各个像素点的灰度值与处理后图像块轮廓上的像素点的灰度值的差值的绝对值,再计算得到差值的绝对值的总和作为该图像块的灰度复杂度。
作为第二种实施形态,本发明还提供了一种图文分离方法,用于将含有图片内容和文字内容的半色调图像作为待分离图像进行图文分离,从而得到该半色调图像中与图片内容对应的图片区域以及与文字内容相对应的文字区域,其特征在于,包括以下步骤:分块步骤,将待分离图像划分成多个图像块;灰度复杂度解析步骤,依次对各个图像块进行解析得到各个图像块的灰度复杂度;第一判定步骤,基于图像块的灰度复杂度以及预定的复杂度阈值,将大于复杂度阈值的灰度复杂度对应的图像块判定为构成图片区域的图片块,并将不大于复杂度阈值的灰度复杂度对应的图像块判定为构成文字区域的文字块;整体轮廓提取步骤,对待分离图像进行整体轮廓提取获得待分离图像的图像轮廓;以及第二判定步骤,依次判断各个图像轮廓经过的图像块中是否含有图片块,一旦图像轮廓经过的图像块中含有图片块,就将该图像轮廓经过的所有图像块判定为图片块。
作为第三种实施形态,本发明还提供了一种计算机可读取的记录介质,用于记录计算机程序,其特征在于,该计算机程序用于让将含有图片内容和文字内容的半色调图像作为待分离图像进行图文分离,从而得到该半色调图像中与图片内容对应的图片区域以及与文字内容相对应的文字区域。图文分离装置执行如下步骤:分块步骤,将待分离图像划分成多个图像块;灰度复杂度解析步骤,依次对各个图像块进行解析得到各个图像块的灰度复杂度;第一判定步骤,基于图像块的灰度复杂度以及预定的复杂度阈值,将大于复杂度阈值的灰度复杂度对应的图像块判定为构成图片区域的图片块,并将不大于复杂度阈值的灰度复杂度对应的图像块判定为构成文字区域的文字块;整体轮廓提取步骤,对待分离图像进行整体轮廓提取获得待分离图像的图像轮廓;以及第二判定步骤,依次判断各个图像轮廓经过的图像块中是否含有图片块,一旦图像轮廓经过的图像块中含有图片块,就将该图像轮廓经过的所有图像块判定为图片块。
<实施例>
图1是本发明的实施例中图文分离装置的结构框图。
如图1所示,本实施例的图文分离装置100为安装有执行图文分离方法的计算机程序的计算机,用于对半色调图像进行图文分离从而得到与图片内容对应的图片区域以及与文字内容相对应的文字区域,包含预处理部10、分块部20、灰度复杂度解析部30、第一判定部40、整体轮廓提取部50、第二判定部60、输出部70、通信部80以及控制部90。
图2为本发明的实施例中半色调图像的示例图。
如图2所示,半色调图像由连续色调图像经半色调生成算法生成得到,其含有文字区域和图片区域。图2中,左侧部分为文字区域,右侧部分为图片区域。在文字区域中,文字内容叠加在图片背景上;图片区域具有背景和图案,并且图案中含有文字形状的图形。
预处理部10用于对半色调图像进行预处理并将该预处理后的半色调图像作为待分离图像。其中,预处理为均值滤波处理,用于弥补半色调图像中文字区域的空洞,减少半色调图像的颗粒噪音。
分块部20用于将待分离图像划分成多个固定尺寸的图像块。
灰度复杂度解析部30用于基于均值差分算法依次对各个图像块进行解析得到各个图像块的灰度复杂度,包括图像块二值化单元31、图像块均值滤波单元32、图像块轮廓提取单元33以及灰度复杂度计算单元34。
图像块二值化单元31用于依次对各个图像块进行二值化处理获得多个二值化图像块。获得二值化图像块的具体过程为:计算图像块的灰度值的平均值,再将该平均值作为该图像块的二值化阈值并根据该二值化阈值对该图像块进行二值化处理,得到二值化图像块。
图像块均值滤波单元32用于依次对各个二值化图像块进行均值滤波处理,得到多个处理后图像块。
图像块轮廓提取单元33用于对二值化图像块或处理后图像块进行图像块轮廓提取,获得对应的二值化图像块轮廓或处理后图像块轮廓,具体包括:依次对各个二值化图像块进行图像块轮廓提取获得多个二值化图像块轮廓;以及依次对各个处理后图像块进行图像块轮廓提取获得多个处理后图像块轮廓。其中,每个二值化图像块轮廓由该二值化图像块的黑白像素的交界处的像素点构成,每个处理后图像块轮廓由该处理后图像块轮廓的黑白像素的交界处的像素点构成。
灰度复杂度计算单元34用于基于均值差分算法,根据各个图像块的二值化图像块轮廓上的像素点的灰度值和处理后图像块轮廓上的像素点的灰度值进行计算,得到各个图像块的灰度复杂度。
其中,均值差分算法为:依次计算图像块的二值化图像块轮廓上的各个像素点的灰度值与处理后图像块轮廓上的像素点的灰度值的差值的绝对值,再计算得到差值的绝对值的总和作为该图像块的灰度复杂度。
图3为本发明的实施例中构成待分离图像的所有图像块经过二值化处理后的示例图。
图3中,(a)部分表示各个二值化图像块,(b)部分为文字区域中的多个二值化图像块,(c)部分为文字形状的图形中的多个二值化图像块。由图3可以看出,文字区域中的二值化图像块的灰度复杂度和背景中的二值化图像块的灰度复杂度明显不一致;同时,文字形状的图形中的二值化图像块的灰度复杂度与文字区域中的二值化图像块的灰度复杂度较接近。
第一判定部40用于基于图像块的灰度复杂度以及预定的复杂度阈值将各个图像块判定为图片块或文字块。
其中,图片块是属性为图片(对应于图片区域)的图像块,文字块是属性为文字(对应于文字区域)的图像块。第一判定部40的判定原理为:与构成文字区域的图像块的图像块轮廓相比,构成图片区域的图像块的图像块轮廓更不平滑且更长,因此灰度复杂度就更大。基于此原理,第一判定部40将大于复杂度阈值的灰度复杂度对应的图像块判定为构成图片区域的图片块,将不大于复杂度阈值的灰度复杂度对应的图像块判定为构成文字区域的文字块。
图4为本发明的实施例中半色调图像经由第一判定部判定后的判定结果示例图。图4中,(a)部分为本实施例中半色调图像被第一判定部40判定后的整体结果示意图,(b)部分为半色调图像中的文字区域的局部放大图,(c)部分为半色调图像中的文字形状的图形的局部放大图。
如图4所示,被第一判定部40判定为文字块的图像块和判定为图片块的图像块分别用不同的颜色示出。由图4可以看出,通过第一判定部对各个图像块判定后,构成文字区域的图像块被判定为文字块。同时,由于文字形状的图形中的二值化图像块的灰度复杂度与文字区域中的二值化图像块的灰度复杂度较接近,因此构成文字形状的图形的图像块也有一部分被误判为文字块。
整体轮廓提取部50用于对待分离图像进行整体轮廓提取获得待分离图像的图像轮廓,包括整体二值化单元51以及整体轮廓识别单元52。
整体二值化单元51用于将待分离图像的灰度值的平均值作为二值化阈值对该待分离图像进行二值化处理,获得二值化图像。
整体轮廓识别单元52用于对二值化图像进行整体轮廓识别获得待分离图像的图像轮廓,该图像轮廓由二值化图像的黑白像素点的交界处的像素点构成(即图4中的白色线条)。
第二判定部60用于依次判断各个图像轮廓经过的图像块中是否含有图片块,一旦图像轮廓经过的图像块中含有图片块,就将该图像轮廓经过的所有图像块判定为图片块,从而得到由图像块构成的图片区域和由文字块构成的文字区域。
图5为本发明的实施例中半色调图像经由第二判定部判定后的判定结果示例图。图5中,(a)部分为本实施例中半色调图像被第二判定部判定后的整体结果示意图,(b)部分为半色调图像的文字区域的局部放大图,(c)部分为半色调图像的文字形状的图形的局部放大图。图5中,白色线条为整体轮廓提取部50提取到的图像轮廓。
由图4(c)可以看出,在文字形状的图形中的图像轮廓经过的图像块上含有被第一判定部40判定为图片块的图像块。
由图5(c)可以看出,第二判定部60将文字形状的图形中的图像轮廓经过的所有图像块判定为图片块。
输出部70用于在第二判定部60完成判定动作后,将多个图片块形成的图片区域的区域信息(例如对应的区域位置坐标和尺寸等信息)以及多个文字块形成的文字区域的区域信息作为图文分离结果输出给后续的图像处理程序,从而让该图像处理程序进行下一步处理,例如半色调图像的文字识别、图文比对等处理。
通信部80用于进行图文分离装置100的各个构成部分之间的数据信息交换。
控制部90用于对图文分离装置100的各个构成部分的工作进行控制。
以下结合附图说明本实施例的图文分离装置100的工作过程。
本实施例的图文分离装置100在对半色调图像进行预处理并将该预处理后的半色调图像作为待分离图像后,将该待分离图像分成多个图像块,依次计算各个图像块的灰度复杂度,并通过判断每个图像块的灰度复杂度是否大于复杂度阈值对该图像块的属性进行第一次判定,再根据待分离图像的图像轮廓判断各个图像轮廓经过的图像块中是否含有图片块,并在图像轮廓经过的图像块中含有图片块时将该图像轮廓经过的所有图像块判定为图片块。
图6是本发明的实施例中图文分离装置的图文分离动作的流程图。
如图6所示,在本实施例中,图文分离装置100的图文分离动作的流程包含如下步骤:
步骤S1,预处理部10对半色调图像进行预处理并将该预处理后的半色调图像作为待分离图像,然后进入步骤S2。
步骤S2,分块部20将待分离图像划分成多个图像块,然后进入步骤S3。
步骤S3,图像块二值化单元31依次对各个图像块进行二值化处理获得多个二值化图像块,然后进入步骤S4。
步骤S4,图像块轮廓提取单元33依次对各个二值化图像块进行图像块轮廓提取获得多个二值化图像块轮廓,然后进入步骤S5。
步骤S5,图像块均值滤波单元32依次对各个二值化图像块进行均值滤波处理得到多个处理后图像块,然后进入步骤S6。
步骤S6,图像块轮廓提取单元33依次对各个处理后图像块进行图像块轮廓提取获得多个处理后图像块轮廓,然后进入步骤S7。
步骤S7,灰度复杂度计算单元34基于均值差分算法,根据各个图像块的二值化图像块轮廓上的像素点的灰度值和处理后图像块轮廓上的像素点的灰度值进行计算得到各个图像块的灰度复杂度,然后进入步骤S8。
步骤S8,第一判定部40基于图像块的灰度复杂度以及预定的复杂度阈值,将大于复杂度阈值的灰度复杂度对应的图像块判定为构成图片区域的图片块,并将不大于复杂度阈值的灰度复杂度对应的图像块判定为构成文字区域的文字块,然后进入步骤S9。
步骤S9,整体二值化单元51对待分离图像进行二值化处理获得二值化图像,然后进入步骤S10。
步骤S10,整体轮廓识别单元52对二值化图像进行整体轮廓识别获得待分离图像的图像轮廓,然后进入步骤S11。
步骤S11,第二判定部60依次判断各个图像轮廓经过的图像块中是否含有图片块,一旦图像轮廓经过的图像块中含有图片块,就将该图像轮廓经过的所有图像块判定为图片块,然后进入步骤S12。
步骤S12,输出部70将多个图片块形成的图片区域的区域信息以及多个文字块形成的文字区域的区域信息作为图文分离结果输出,然后进入结束状态。
实施例的作用与效果
根据本实施例所涉及的图文分离装置、图文分离方法及计算机可读取记录介质,因为分块部将半色调图像划分成多个图像块,灰度复杂度解析部基于均值差分算法依次对各个图像块进行解析得到各个图像块的灰度复杂度,第一判定部将大于复杂度阈值的灰度复杂度对应的图像块判定为图片块,将不大于复杂度阈值的灰度复杂度对应的图像块判定为文字块,从而对各个图像块的属性进行了初步的判定。进一步,整体轮廓提取部提取获得半色调图像的图像轮廓,第二判定部依次判断各个图像轮廓经过的图像块中是否含有图片块,并在图像轮廓经过的图像块中含有图片块时,将该图像轮廓经过的所有图像块判定为图片块,从而将第一判定部误判为文字块的图像块(例如构成文字形状的图形的图像块)改判为图片块,因此能够使判定结果更加准确,进而让后续的图像处理和分析过程能够顺利进行。
另外,因为预处理部能够对半色调图像进行均值滤波预处理并将该预处理后的半色调图像作为待分离图像,从而弥补了半色调图像中文字区域的空洞,减少了半色调图像的颗粒噪音,使得本实施例的图文分离结果更加准确。
进一步,因为输出部将多个图片块形成的图片区域的区域信息、多个文字块形成的文字区域的区域信息以及半色调图像输出,从而能够让后续的图文处理程序接受并进行图文处理动作。
另外,因为整体二值化单元对待分离图像进行二值化处理获得二值化图像,整体轮廓识别单元对二值化图像进行整体轮廓识别从而能够获得待分离图像的图像轮廓,进而让第二判定部根据该图像轮廓判断各个图像轮廓经过的图像块中是否含有图片块,并完成判定动作。
此外,因为图像块二值化单元依次对各个图像块进行二值化处理获得多个二值化图像块,图像块轮廓提取单元依次对各个二值化图像块进行图像块轮廓提取获得多个二值化图像块轮廓,图像块均值滤波单元依次对各个二值化图像块进行均值滤波处理得到多个处理后图像块,图像块轮廓提取单元依次对各个处理后图像块进行图像块轮廓提取获得多个处理后图像块轮廓,灰度复杂度计算单元基于均值差分算法,根据各个图像块的二值化图像块轮廓上的像素点的灰度值和处理后图像块轮廓上的像素点的灰度值进行计算,能够得到各个图像块的灰度复杂度,从而能够通过将各个图像块的灰度复杂度与复杂度阈值进行比较判定各个图像块的属性。
上述实施方式为本发明的优选案例,并不用来限制本发明的保护范围。
例如,在上述实施例中,图像分离装置对半色调图像进行预处理并将该预处理后的半色调图像作为待分离图像进行图文分离。在其他实施例中,如果半色调图像的颗粒噪音较小,图像分离装置可以直接将该半色调图像作为待处理图像,并对该待分离图像进行图文分离。
例如,在本发明中,输出部具有显示单元,例如显示器,用于显示半色调图像并在该半色调图像上以不同的颜色显示文字区域和图片区域。另外,还可以用与显示该两个区域的颜色不同的颜色显示图像轮廓,以便更清楚地显示文字区域中的文字内容和图片背景。

Claims (6)

1.一种图文分离装置,用于将含有图片内容和文字内容的半色调图像作为待分离图像进行图文分离,从而得到该半色调图像中与所述图片内容对应的图片区域以及与所述文字内容相对应的文字区域,其特征在于,包括:
分块部,将所述待分离图像划分成多个图像块;
灰度复杂度解析部,依次对各个所述图像块进行解析得到各个所述图像块的灰度复杂度;
第一判定部,基于所述图像块的灰度复杂度以及预定的复杂度阈值,将大于所述复杂度阈值的所述灰度复杂度对应的所述图像块判定为构成所述图片区域的图片块,并将不大于所述复杂度阈值的所述灰度复杂度对应的所述图像块判定为构成所述文字区域的文字块;
整体轮廓提取部,对所述待分离图像进行整体轮廓提取获得所述待分离图像的图像轮廓;以及
第二判定部,依次判断各个所述图像轮廓经过的所述图像块中是否含有所述图片块,一旦所述图像轮廓经过的所述图像块中含有所述图片块,就将该所述图像轮廓经过的所有所述图像块判定为所述图片块,
其中,所述灰度复杂度解析部具有图像块二值化单元、图像块轮廓提取单元、图像块均值滤波单元以及灰度复杂度计算单元,
所述图像块二值化单元依次对各个所述图像块进行二值化处理获得多个二值化图像块,
所述图像块轮廓提取单元依次对各个所述二值化图像块进行图像块轮廓提取获得多个二值化图像块轮廓,
所述图像块均值滤波单元依次对各个所述二值化图像块进行均值滤波处理得到多个处理后图像块,
所述图像块轮廓提取单元依次对各个所述处理后图像块进行图像块轮廓提取获得多个处理后图像块轮廓,
所述灰度复杂度计算单元根据各个所述图像块的所述二值化图像块轮廓上的像素点的灰度值和所述处理后图像块轮廓上的像素点的灰度值进行计算得到各个所述图像块的灰度复杂度,
所述灰度复杂度计算单元基于均值差分算法计算得到各个所述图像块的灰度复杂度,该均值差分算法为:依次计算所述图像块的所述二值化图像块轮廓上的各个像素点的灰度值与所述处理后图像块轮廓上的像素点的灰度值的差值的绝对值,再计算得到所述差值的所述绝对值的总和作为该图像块的灰度复杂度。
2.根据权利要求1所述的图文分离装置,其特征在于,还包括:
预处理部,用于对所述半色调图像进行预处理并将该预处理后的半色调图像作为所述待分离图像,
其中,所述预处理为均值滤波处理。
3.根据权利要求1所述的图文分离装置,其特征在于,还包括:
输出部以及控制部,
其中,一旦所述第二判定部完成判定动作后,所述控制部就控制所述输出部将多个所述图片块形成的所述图片区域的区域信息、多个所述文字块形成的所述文字区域的区域信息作为分离结果输出。
4.根据权利要求1所述的图文分离装置,其特征在于:
其中,所述整体轮廓提取部包括整体二值化单元以及整体轮廓识别单元,
所述整体二值化单元对所述待分离图像进行二值化处理获得二值化图像,
所述整体轮廓识别单元对所述二值化图像进行整体轮廓识别获得所述待分离图像的图像轮廓。
5.一种图文分离方法,用于将含有图片内容和文字内容的半色调图像作为待分离图像进行图文分离,从而得到该半色调图像中与所述图片内容对应的图片区域以及与所述文字内容相对应的文字区域,其特征在于,包括以下步骤:
分块步骤,将所述待分离图像划分成多个图像块;
灰度复杂度解析步骤,依次对各个所述图像块进行解析得到各个所述图像块的灰度复杂度;
第一判定步骤,基于所述图像块的灰度复杂度以及预定的复杂度阈值,将大于所述复杂度阈值的所述灰度复杂度对应的所述图像块判定为构成所述图片区域的图片块,并将不大于所述复杂度阈值的所述灰度复杂度对应的所述图像块判定为构成所述文字区域的文字块;
整体轮廓提取步骤,对所述待分离图像进行整体轮廓提取获得所述待分离图像的图像轮廓;以及
第二判定步骤,依次判断各个所述图像轮廓经过的所述图像块中是否含有所述图片块,一旦所述图像轮廓经过的所述图像块中含有所述图片块,就将该所述图像轮廓经过的所有所述图像块判定为所述图片块,
其中,所述灰度复杂度解析步骤包括图像块二值化子步骤、图像块轮廓提取子步骤、图像块均值滤波子步骤以及灰度复杂度计算子步骤,
所述图像块二值化子步骤中,依次对各个所述图像块进行二值化处理获得多个二值化图像块,
所述图像块轮廓提取子步骤中,依次对各个所述二值化图像块进行图像块轮廓提取获得多个二值化图像块轮廓,
所述图像块均值滤波子步骤中,依次对各个所述二值化图像块进行均值滤波处理得到多个处理后图像块,
所述图像块轮廓提取子步骤中,还依次对各个所述处理后图像块进行图像块轮廓提取获得多个处理后图像块轮廓,
所述灰度复杂度计算子步骤中,根据各个所述图像块的所述二值化图像块轮廓上的像素点的灰度值和所述处理后图像块轮廓上的像素点的灰度值进行计算得到各个所述图像块的灰度复杂度,
所述灰度复杂度计算子步骤中,基于均值差分算法计算得到各个所述图像块的灰度复杂度,该均值差分算法为:依次计算所述图像块的所述二值化图像块轮廓上的各个像素点的灰度值与所述处理后图像块轮廓上的像素点的灰度值的差值的绝对值,再计算得到所述差值的所述绝对值的总和作为该图像块的灰度复杂度。
6.一种计算机可读取的记录介质,用于记录计算机程序,其特征在于,该计算机程序用于让将含有图片内容和文字内容的半色调图像作为待分离图像进行图文分离从而得到该半色调图像中与所述图片内容对应的图片区域以及与所述文字内容相对应的文字区域的图文分离装置执行如下步骤:
分块步骤,将所述待分离图像划分成多个图像块;
灰度复杂度解析步骤,依次对各个所述图像块进行解析得到各个所述图像块的灰度复杂度;
第一判定步骤,基于所述图像块的灰度复杂度以及预定的复杂度阈值,将大于所述复杂度阈值的所述灰度复杂度对应的所述图像块判定为构成所述图片区域的图片块,并将不大于所述复杂度阈值的所述灰度复杂度对应的所述图像块判定为构成所述文字区域的文字块;
整体轮廓提取步骤,对所述待分离图像进行整体轮廓提取获得所述待分离图像的图像轮廓;以及
第二判定步骤,依次判断各个所述图像轮廓经过的所述图像块中是否含有所述图片块,一旦所述图像轮廓经过的所述图像块中含有所述图片块,就将该所述图像轮廓经过的所有所述图像块判定为所述图片块,
其中,所述灰度复杂度解析步骤包括图像块二值化子步骤、图像块轮廓提取子步骤、图像块均值滤波子步骤以及灰度复杂度计算子步骤,
所述图像块二值化子步骤中,依次对各个所述图像块进行二值化处理获得多个二值化图像块,
所述图像块轮廓提取子步骤中,依次对各个所述二值化图像块进行图像块轮廓提取获得多个二值化图像块轮廓,
所述图像块均值滤波子步骤中,依次对各个所述二值化图像块进行均值滤波处理得到多个处理后图像块,
所述图像块轮廓提取子步骤中,还依次对各个所述处理后图像块进行图像块轮廓提取获得多个处理后图像块轮廓,
所述灰度复杂度计算子步骤中,根据各个所述图像块的所述二值化图像块轮廓上的像素点的灰度值和所述处理后图像块轮廓上的像素点的灰度值进行计算得到各个所述图像块的灰度复杂度,
所述灰度复杂度计算子步骤中,基于均值差分算法计算得到各个所述图像块的灰度复杂度,该均值差分算法为:依次计算所述图像块的所述二值化图像块轮廓上的各个像素点的灰度值与所述处理后图像块轮廓上的像素点的灰度值的差值的绝对值,再计算得到所述差值的所述绝对值的总和作为该图像块的灰度复杂度。
CN201910202937.XA 2019-03-18 2019-03-18 图文分离装置、图文分离方法及计算机可读取记录介质 Active CN111723804B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910202937.XA CN111723804B (zh) 2019-03-18 2019-03-18 图文分离装置、图文分离方法及计算机可读取记录介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910202937.XA CN111723804B (zh) 2019-03-18 2019-03-18 图文分离装置、图文分离方法及计算机可读取记录介质

Publications (2)

Publication Number Publication Date
CN111723804A CN111723804A (zh) 2020-09-29
CN111723804B true CN111723804B (zh) 2024-05-17

Family

ID=72562837

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910202937.XA Active CN111723804B (zh) 2019-03-18 2019-03-18 图文分离装置、图文分离方法及计算机可读取记录介质

Country Status (1)

Country Link
CN (1) CN111723804B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63316566A (ja) * 1987-06-19 1988-12-23 Hitachi Ltd 画像入力装置
CN101751121A (zh) * 2008-12-12 2010-06-23 汉王科技股份有限公司 基于ocr的无线扫描输入装置和方法
CN101887520A (zh) * 2009-05-12 2010-11-17 华为终端有限公司 一种图像中的文字定位方法和装置
CN102663337A (zh) * 2012-03-16 2012-09-12 江南大学 简单工况背景下的Data Matrix二维条码快速识别方法
CN106407919A (zh) * 2016-09-05 2017-02-15 珠海赛纳打印科技股份有限公司 基于图像处理的文本分离方法及装置和图像形成设备
CN109064479A (zh) * 2018-07-19 2018-12-21 中国石油大学(华东) 一种基于邻近视频帧灰度动态特征的海天线检测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6226578B2 (ja) * 2013-06-13 2017-11-08 キヤノン株式会社 画像符号化装置、画像符号化方法及びプログラム

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63316566A (ja) * 1987-06-19 1988-12-23 Hitachi Ltd 画像入力装置
CN101751121A (zh) * 2008-12-12 2010-06-23 汉王科技股份有限公司 基于ocr的无线扫描输入装置和方法
CN101887520A (zh) * 2009-05-12 2010-11-17 华为终端有限公司 一种图像中的文字定位方法和装置
CN102663337A (zh) * 2012-03-16 2012-09-12 江南大学 简单工况背景下的Data Matrix二维条码快速识别方法
CN106407919A (zh) * 2016-09-05 2017-02-15 珠海赛纳打印科技股份有限公司 基于图像处理的文本分离方法及装置和图像形成设备
CN109064479A (zh) * 2018-07-19 2018-12-21 中国石油大学(华东) 一种基于邻近视频帧灰度动态特征的海天线检测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Hierarchical content classi cation and script determination for automatic document image processing;Zheru Chi et.al;《Pattern Recognition》;第2484-2500页 *
彩色扫描文档图像中图文分割算法;朱庆生 等;《计算机辅助设计与图形学学报》;第16卷(第4期);第476-480页 *

Also Published As

Publication number Publication date
CN111723804A (zh) 2020-09-29

Similar Documents

Publication Publication Date Title
CN109961049B (zh) 一种复杂场景下香烟品牌识别方法
US10803338B2 (en) Method and device for recognizing the character area in a image
CN101453575B (zh) 一种视频字幕信息提取方法
CN105528614B (zh) 一种漫画图像版面的识别方法和自动识别***
CN110232713B (zh) 一种图像目标定位修正方法及相关设备
CN109255350B (zh) 一种基于视频监控的新能源车牌检测方法
CN109840483B (zh) 一种滑坡裂缝检测与识别的方法及装置
US20100008576A1 (en) System and method for segmentation of an image into tuned multi-scaled regions
CN111259878A (zh) 一种检测文本的方法和设备
CN110866529A (zh) 字符识别方法、装置、电子设备及存储介质
CN104598907A (zh) 一种基于笔画宽度图的图像中文字数据提取方法
CN111461126A (zh) 文本行中的空格识别方法、装置、电子设备及存储介质
CN114419006A (zh) 一种随背景变化的灰度视频文字类水印去除方法及***
CN113158977B (zh) 改进FANnet生成网络的图像字符编辑方法
JPH05166002A (ja) ソース画像を分析する方法
CN117541546A (zh) 图像裁剪效果的确定方法和装置、存储介质及电子设备
CN111723804B (zh) 图文分离装置、图文分离方法及计算机可读取记录介质
CN114399617B (zh) 一种遮挡图案识别方法、装置、设备和介质
CN116030472A (zh) 文字坐标确定方法及装置
CN112861860B (zh) 一种基于上下边界提取的自然场景下文字检测方法
CN111083468B (zh) 一种基于图像梯度的短视频质量评价方法及***
CN112419208A (zh) 一种基于施工图审查矢量图纸编译方法及***
CN113011431A (zh) 一种基于MaskRCNN的汉字笔画分割提取方法及***
JP2004094427A (ja) 帳票画像処理装置及び該装置を実現するためのプログラム
CN111476800A (zh) 一种基于形态学操作的文字区域检测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant