CN107133929A - 基于背景估计和能量最小化的低质量文档图像二值化方法 - Google Patents

基于背景估计和能量最小化的低质量文档图像二值化方法 Download PDF

Info

Publication number
CN107133929A
CN107133929A CN201710289747.7A CN201710289747A CN107133929A CN 107133929 A CN107133929 A CN 107133929A CN 201710289747 A CN201710289747 A CN 201710289747A CN 107133929 A CN107133929 A CN 107133929A
Authority
CN
China
Prior art keywords
mrow
image
background
msub
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710289747.7A
Other languages
English (en)
Other versions
CN107133929B (zh
Inventor
熊炜
徐晶晶
李敏
熊子婕
王改华
刘敏
赵楠
王鑫睿
冯川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hubei University of Technology
Original Assignee
Hubei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hubei University of Technology filed Critical Hubei University of Technology
Priority to CN201710289747.7A priority Critical patent/CN107133929B/zh
Publication of CN107133929A publication Critical patent/CN107133929A/zh
Application granted granted Critical
Publication of CN107133929B publication Critical patent/CN107133929B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/90Dynamic range modification of images or parts thereof
    • G06T5/94Dynamic range modification of images or parts thereof based on local image properties, e.g. for local contrast enhancement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/60Analysis of geometric attributes
    • G06T7/62Analysis of geometric attributes of area, perimeter, diameter or volume
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20024Filtering details
    • G06T2207/20028Bilateral filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Geometry (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种基于背景估计和能量最小化的低质量文档图像二值化方法,首先对彩色文档图像进行灰度预处理、采用双边滤波对图像进行降噪处理、图像背景估计、背景减除与图像增强、构造能量函数、构造网络图、最后采用基于增广路径的图割算法实现能量函数的最小化。本发明显著提高了复杂背景下的文档图像二值化效果,能够适用于多种颜色书写、笔画渐变、墨迹浸润、页面有污渍或纹理、光照不均、对比度低等复杂背景的文档图像二值化处理。

Description

基于背景估计和能量最小化的低质量文档图像二值化方法
技术领域
本发明属于数字图像处理、模式识别与机器学习技术领域,特别是涉及一种基于背景估计和能量最小化的低质量文档图像二值化方法。
背景技术
文档分析与识别(DAR)技术已广泛应用于古籍数字化、版面分析与文字识别、视频字幕提取、文本信息检索等领域,主要包括图像的采集、二值化、歪斜校正、字符分割与识别等过程。图像二值化是其中一个关键预处理环节,它是将灰度图像转换成二进制图像,从而实现字符前景与文档背景的分离。二值化算法的效果直接影响整个DAR***的性能,因此近年来很多学者对此进行了研究,并提出了很多算法;然而,受图像对比度差、墨迹浸润、页面污渍或光照不均等因素的影响,使得低质量文档图像二值化仍是一个挑战。
二值化算法可粗略分为全局阈值法和局部阈值法。全局阈值法采用单一的阈值将文档图像分为字符(前景)与背景两大类,如Otsu算法利用图像的灰度直方图选择一个最优阈值,使得经阈值分割后的前景与背景像素的类间方差最大。全局阈值法对于前景和背景差别较大,即直方图具有显著双峰特征的图像具有较好的分割效果,但在处理低质量文档图像时,会丢失部分甚至全部前景细节。
局部阈值法(也称为自适应阈值法)则通过滑动窗口与文档图像的卷积,从而实现在图像不同部分设定不同阈值,如Niblack、Sauvola、Wolf等算法利用像素邻域内的灰度均值和方差来构建阈值分割曲面,其算法性能有赖于滑动窗口的尺寸及字符笔画的粗细等。针对不同质量的文档图像需动态调整窗口尺寸,以获得最佳的阈值处理结果;当图像对比度较低时,会产生大量噪声点或造成误判。
此外,国内外研究人员还提出了很多更为复杂的算法,如局部对比度法、背景估计与笔画边缘检测法、拉普拉斯能量法、卷积神经网络法等。然而,以上这些方法都不能很好地解决在低对比度、墨迹浸润、渐变光照、带污迹和纹理等复杂文档背景下的图像二值化。
发明内容
为了解决上述技术问题,本发明提出了一种基于背景估计和能量最小化的低质量文档图像二值化方法,显著提高了复杂背景下的文档图像二值化效果,能够适用于多种颜色书写、笔画渐变、墨迹浸润、页面有污渍或纹理、光照不均、对比度低等复杂背景的文档图像二值化处理。
本发明所采用的技术方案是:一种基于背景估计和能量最小化的低质量文档图像二值化方法,其特征在于,包括以下步骤:
步骤1:对彩色文档图像进行灰度预处理;
步骤2:采用双边滤波对图像进行降噪处理;
步骤3:图像背景估计,具体包括以下子步骤:
步骤3.1:针对步骤2处理后的图像,进行笔画宽度变换;
步骤3.2:计算模拟距离和成像高度;
步骤3.3:针对步骤2处理后的图像,通过两次形态学闭操作削弱文档图像中的暗特征;
步骤3.4:结合步骤3.2和步骤3.3的结果,进行图像降采样和升采样;
步骤4:背景减除与图像增强,具体包括以下子步骤:
步骤4.1:背景减除;
计算步骤2中的双边滤波图像与步骤3中的背景估计图像间的绝对差值,差值图像中灰度为零的像素点属于高置信背景像素点,并将其灰度值设为255;
步骤4.2:直方图均衡;
对背景减除图像中非零像素点进行取反,得到该点对应的灰度值,然后对整幅图像进行直方图均衡化,增大图像前景和背景的对比度;
步骤5:构造能量函数;
步骤6:构造网络图;
步骤7:采用基于增广路径的图割算法实现能量函数的最小化。
本发明与现有算法相比,其显著优点在于:
(1)本发明采用最小均值法对彩色文档图像进行灰度预处理,所得灰度图像具有彩色无关性,既能增大前景与背景像素间的对比度,又能减小前景像素间的灰度方差;
(2)本发明采用非线性双边滤波算法实现图像降噪处理,由于同时考虑了图像的空间邻近度和灰度相似性,从而达到了保边去噪的目的;
(3)本发明采用笔画宽度变换的方法来估计文档图像中的笔画宽度,其优势在于,笔画特征基本上是属于文字独有的特征(当然也不排除某些退化因素的干扰,需要后续操作加以剔除),对于不同语言的文本具有普适性;
(4)本发明基于视觉灵敏度测试模型,采用形态学闭操作实现图像背景估计,并对背景减除图像进行直方图均衡化,有效抑制了退化因素的影响,同时增强了图像的局部对比度;
(5)本发明基于最大流/最小割的组合优化算法实现文档图像二值化,该图割算法通用性强,可行性高,运行速度快(接近实时性能),并且适用于多种退化类型的低质量文档图像。
附图说明
图1:为本发明实施例的流程图;
图2:为本发明实施例的视力测试模型的角度分辨率示意图。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本发明,并不用于限定本发明。
本发明主要思想是:当目标图像离观察者距离较远时,能观测到的目标图像的细节(笔画)信息越来越少,但感知到的背景灰度和深度不受距离的影响,因此可以通过模拟远距离观测图像的场景,估计出图像的大致背景,再对剔除估计背景后的图像构造能量函数,采用图割算法实现图像二值化。
请见图1,本发明提供的一种基于背景估计和能量最小化的低质量文档图像二值化方法,包括以下步骤:
步骤1:最小均值灰度化;
本发明采用最小均值法对彩色文档图像f(x,y)进行灰度预处理,具体计算公式为:
其中,fi(x,y)分别为R、G、B彩色分量图像,fgray(x,y)为变换后的灰度图像。
所得灰度图像具有彩色无关性,即灰度图像中,前景与背景像素间具有较大的对比度,同时前景像素间的灰度差异性较小。
步骤2:双边滤波去噪;
本发明采用非线性双边滤波算法进行图像降噪处理,其输出像素值依赖于邻域S内像素值f(k,l)的加权组合,具体计算公式为:
其中,权重系数w(i,j,k,l)取决于定义域核和值域核的乘积,即 分别表示高斯距离方差和高斯灰度方差。
由于双边滤波器同时考虑了图像的空间邻近度和灰度相似性,可以达到保边去噪的目的。
步骤3:图像背景估计;
步骤3.1笔画宽度变换(SWT):采用Canny算子对双边滤波后的灰度图像进行边缘检测,并对每一个边缘像素点p按其梯度方向查找与之对应的另一个边缘像素点q,两点间的欧式距离||p-q||即为[p,q]路径上所有像素点的笔画宽度估计,除非该像素点已经被指定了一个更小的宽度值,则图像的笔画宽度SWE为所有非零像素点笔画宽度估计的数学期望,具体计算公式为:
其中,n为笔画宽度变换输出图像s(x,y)中非零值像素点总数。
步骤3.2计算模拟距离和成像高度:基于视觉灵敏度测试模型,人眼的最小分辨角(1′的角度)所能感知的即为最小图像,如图2所示。由于低质量文档图像的对比度通常都低于视力表上的二值图像,对应目标的最小视角也通常大于视力测试的最小视角,并且图像的笔画越粗,不能感知到笔画细节所需的观测距离就会越远,因此,本发明将文档图像的笔画宽度对应的分辨角假定为3′,并根据步骤3.1估计得到的笔画宽度确定模拟观测距离d0,具体计算公式为:
d0=SWE×cotθ,
其中,θ为观测分辨角,此处为3′视角。
由于人眼的晶状体类似于凸透镜,根据透镜成像规律和焦距方程,可得到在距离目标图像为d0时视网膜上的成像高度hi,具体计算公式为:
其中,f为人眼晶状体与视网膜间距,即透镜焦距(约17mm),h0为目标图像原始高度。
步骤3.3形态学闭操作:通过两次形态学闭操作削弱文档图像中的暗特征(字符笔画),两次闭操作均采用圆形结构元素。本发明将第一次结构元素的直径设置为图像的笔画宽度,第二次结构元素的直径则比图像的笔画宽度大12个像素。
步骤3.4图像降采样和升采样:距离目标图像为d0时观测到的图像高度为hi,因此,将形态学闭操作后的图像通过双线性降采样缩放到hi高度;然后采用双线性内插法将缩放后的图像恢复到原始尺寸大小,得到的图像即为估计的背景图像。在进行图像缩放时,保持图像宽高比不变。
步骤4:背景减除与图像增强;
步骤4.1背景减除:计算双边滤波图像与背景估计图像间的绝对差值,差值图像中灰度为零的像素点属于高置信背景像素点,并将其灰度值设为255(白色)。
步骤4.2直方图均衡:对背景减除图像中非零像素点进行取反,得到该点对应的灰度值,然后对整幅图像进行直方图均衡化,增大图像前景和背景的对比度。
步骤5:构造能量函数;
拉普拉斯能量函数的具体形式为:
其中,数据项表示给像素点赋予某个标签的代价,如是指给像素pij赋予标签0(1)的代价;边界项表示相邻像素不连续的代价,即将两相邻像素赋予不同标签时的代价。
图像的拉普拉斯变换可以反映图像灰度突变的地方,当图像中某像素点的拉普拉斯值符号为正时,对应的像素点一般位于灰度图的波谷处(暗);反之,当图像某像素点的拉普拉斯值符号为负时,对应的像素点就位于灰度图的波峰处(亮)。因此,本发明定义拉普拉斯能量函数的数据项具体表示为:
其中,表示像素pij处的拉普拉斯值;
边界项可分为水平方向的边界项和竖直方向的边界项本发明采用Canny边缘检测算子来确定边界项,位于边缘附近的像素不连续的可能性较大,可以直接将位于边缘两侧的像素间的不连续代价置为零,具体表示为:
其中,Eij表示像素点pij处的边缘检测结果,Iij表示像素pij处的灰度值,c为任意常数(>0)。
步骤6:构造网络图;
图像的每个像素点pij构成了网络图的中间节点,另外附加两个终端节点s和t。连接中间节点的边称为nlink,其权值由能量函数的边界项确定;连接中间节点与终端节点的边称为tlink,其权值由能量函数的数据项确定。边(pij,s)的权值为边(pij,t)的权值为边(pij,pi+1,j)的权值为边(pij,pi,j+1)的权值为
步骤7:采用基于增广路径的图割算法实现能量函数的最小化;
基于网络图建立两颗搜索树S和T,树的根节点分别位于源点s和汇点t,将搜索树的节点分为两类:主动节点和被动节点,主动节点可以由非饱和边将自由节点扩展为主动节点,实现树的生长。
步骤7.1生长阶段:两棵树不断生长,直到两棵树的主动节点相遇便找到了一条从源点到汇点的路径;
步骤7.2增广阶段:对步骤7.1获得的路径进行增广,增广会形成至少一条饱和边,连接该边的子节点就变成了孤立节点,树S和T则被拆分为多颗子树;
步骤7.3收养阶段:为每一个孤立节点寻找父节点,如果没有满足条件的父节点,将其变为自由节点,直至所有的孤立节点都被处理。
重复执行上面三个步骤,直至两棵树不再生长,被饱和边分开,便求出了图的最小割即能量函数的最小值,从而实现了图像的最终二值化。
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。

Claims (10)

1.一种基于背景估计和能量最小化的低质量文档图像二值化方法,其特征在于,包括以下步骤:
步骤1:对彩色文档图像进行灰度预处理;
步骤2:采用双边滤波对图像进行降噪处理;
步骤3:图像背景估计,具体包括以下子步骤:
步骤3.1:针对步骤2处理后的图像,进行笔画宽度变换;
步骤3.2:计算模拟距离和成像高度;
步骤3.3:针对步骤2处理后的图像,通过两次形态学闭操作削弱文档图像中的暗特征;
步骤3.4:结合步骤3.2和步骤3.3的结果,进行图像降采样和升采样;
步骤4:背景减除与图像增强,具体包括以下子步骤:
步骤4.1:背景减除;
计算步骤2中的双边滤波图像与步骤3中的背景估计图像间的绝对差值,差值图像中灰度为零的像素点属于高置信背景像素点,并将其灰度值设为255;
步骤4.2:直方图均衡;
对背景减除图像中非零像素点进行取反,得到该点对应的灰度值,然后对整幅图像进行直方图均衡化,增大图像前景和背景的对比度;
步骤5:构造能量函数;
步骤6:构造网络图;
步骤7:采用基于增广路径的图割算法实现能量函数的最小化。
2.根据权利要求1所述的基于背景估计和能量最小化的低质量文档图像二值化方法,其特征在于:步骤1中采用最小均值法对彩色文档图像f(x,y)进行灰度预处理,其中预处理公式为:
<mrow> <msub> <mi>f</mi> <mrow> <mi>g</mi> <mi>r</mi> <mi>a</mi> <mi>y</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> <mo>&amp;lsqb;</mo> <munder> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> </mrow> <mi>i</mi> </munder> <mrow> <mo>(</mo> <msub> <mi>f</mi> <mi>i</mi> </msub> <mo>(</mo> <mrow> <mi>x</mi> <mo>,</mo> <mi>y</mi> </mrow> <mo>)</mo> <mo>)</mo> </mrow> <mo>+</mo> <mfrac> <mn>1</mn> <mn>3</mn> </mfrac> <munder> <mo>&amp;Sigma;</mo> <mi>i</mi> </munder> <msub> <mi>f</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> <mo>&amp;rsqb;</mo> <mo>,</mo> </mrow>
其中,fi(x,y)分别为R、G、B彩色分量图像,fgray(x,y)为变换后的灰度图像。
3.根据权利要求1所述的基于背景估计和能量最小化的低质量文档图像二值化方法,其特征在于:步骤2中采用非线性双边滤波算法进行图像降噪处理,其输出像素值依赖于邻域S内像素值f(k,l)的加权组合,具体计算公式为:
<mrow> <mover> <mi>f</mi> <mo>^</mo> </mover> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <munder> <mo>&amp;Sigma;</mo> <mrow> <mo>(</mo> <mi>k</mi> <mo>,</mo> <mi>l</mi> <mo>)</mo> <mo>&amp;Element;</mo> <mi>S</mi> </mrow> </munder> <mi>f</mi> <mrow> <mo>(</mo> <mi>k</mi> <mo>,</mo> <mi>l</mi> <mo>)</mo> </mrow> <mi>w</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>,</mo> <mi>k</mi> <mo>,</mo> <mi>l</mi> <mo>)</mo> </mrow> </mrow> <mrow> <munder> <mo>&amp;Sigma;</mo> <mrow> <mo>(</mo> <mi>k</mi> <mo>,</mo> <mi>l</mi> <mo>)</mo> <mo>&amp;Element;</mo> <mi>S</mi> </mrow> </munder> <mi>w</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>,</mo> <mi>k</mi> <mo>,</mo> <mi>l</mi> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>,</mo> </mrow>
其中,权重系数w(i,j,k,l)取决于定义域核和值域核的乘积,即 分别表示高斯距离方差和高斯灰度方差。
4.根据权利要求1所述的基于背景估计和能量最小化的低质量文档图像二值化方法,其特征在于:步骤3.1中采用Canny算子对双边滤波后的灰度图像进行边缘检测,并对每一个边缘像素点p按其梯度方向查找与之对应的另一个边缘像素点q,两点间的欧式距离||p-q||即为[p,q]路径上所有像素点的笔画宽度估计,除非该像素点已经被指定了一个更小的宽度值,则图像的笔画宽度SWE为所有非零像素点笔画宽度估计的数学期望,具体计算公式为:
<mrow> <mi>S</mi> <mi>W</mi> <mi>E</mi> <mo>=</mo> <mfrac> <mn>1</mn> <mi>n</mi> </mfrac> <munder> <mo>&amp;Sigma;</mo> <mrow> <mi>s</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> <mo>&amp;NotEqual;</mo> <mn>0</mn> </mrow> </munder> <mi>s</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> <mo>,</mo> </mrow>
其中,n为笔画宽度变换输出图像s(x,y)中非零值像素点总数。
5.根据权利要求1所述的基于背景估计和能量最小化的低质量文档图像二值化方法,其特征在于:步骤3.2中,并根据步骤3.1估计得到的笔画宽度SWE确定模拟观测距离d0,具体计算公式为:
d0=SWE×cotθ,
其中,θ为观测分辨角;
根据透镜成像规律和焦距方程,得到在距离目标图像为d0时视网膜上的成像高度hi,具体计算公式为:
<mrow> <msub> <mi>h</mi> <mi>i</mi> </msub> <mo>=</mo> <mfrac> <mi>f</mi> <mrow> <msub> <mi>d</mi> <mn>0</mn> </msub> <mo>-</mo> <mi>f</mi> </mrow> </mfrac> <msub> <mi>h</mi> <mn>0</mn> </msub> <mo>,</mo> </mrow>
其中,f为人眼晶状体与视网膜间距,即透镜焦距,h0为目标图像原始高度。
6.根据权利要求1所述的基于背景估计和能量最小化的低质量文档图像二值化方法,其特征在于:步骤3.3中,两次闭操作均采用圆形结构元素;第一次结构元素的直径设置为图像的笔画宽度,第二次结构元素的直径则比图像的笔画宽度大12个像素。
7.根据权利要求1所述的基于背景估计和能量最小化的低质量文档图像二值化方法,其特征在于:步骤3.4中,距离目标图像为d0时观测到的图像高度为hi,因此,将形态学闭操作后的图像通过双线性降采样缩放到hi高度;然后采用双线性内插法将缩放后的图像恢复到原始尺寸大小,得到的图像即为估计的背景图像;在进行图像缩放时,保持图像宽高比不变。
8.根据权利要求1所述的基于背景估计和能量最小化的低质量文档图像二值化方法,其特征在于:步骤5中,拉普拉斯能量函数的具体形式为:
<mrow> <msubsup> <mi>L</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> <mn>0</mn> </msubsup> <mo>=</mo> <mo>-</mo> <msup> <mo>&amp;dtri;</mo> <mn>2</mn> </msup> <msub> <mi>I</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>+</mo> <mi>&amp;phi;</mi> <mo>;</mo> </mrow>
<mrow> <msubsup> <mi>L</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> <mn>1</mn> </msubsup> <mo>=</mo> <msup> <mo>&amp;dtri;</mo> <mn>2</mn> </msup> <msub> <mi>I</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>+</mo> <mi>&amp;phi;</mi> <mo>;</mo> </mrow>
其中,数据项表示给像素点赋予某个标签的代价,是指给像素pij赋予标签0/1的代价;表示像素pij处的拉普拉斯值;边界项表示相邻像素不连续的代价,即将两相邻像素赋予不同标签时的代价;边界项分为水平方向的边界项和竖直方向的边界项Eij表示像素点pij处的边缘检测结果,Iij表示像素pij处的灰度值,c为任意常数,其c>0。
9.根据权利要求8所述的基于背景估计和能量最小化的低质量文档图像二值化方法,其特征在于,步骤6的具体实现过程是:图像的每个像素点pij构成了网络图的中间节点,另外附加两个终端节点s和t;连接中间节点的边称为nlink,其权值由能量函数的边界项确定;连接中间节点与终端节点的边称为tlink,其权值由能量函数的数据项确定;边(pij,s)的权值为边(pij,t)的权值为边(pij,pi+1,j)的权值为边(pij,pi,j+1)的权值为
10.根据权利要求1-9任意一项所述的基于背景估计和能量最小化的低质量文档图像二值化方法,其特征在于,步骤7的具体实现过程是:基于网络图建立两颗搜索树S和T,树的根节点分别位于源点s和汇点t,将搜索树的节点分为两类:主动节点和被动节点,主动节点可以由非饱和边将自由节点扩展为主动节点,实现树的生长;
步骤7.1:生长阶段;
两棵树不断生长,直到两棵树的主动节点相遇便找到了一条从源点到汇点的路径;
步骤7.2、增广阶段;
对步骤7.1获得的路径进行增广,增广会形成至少一条饱和边,连接该边的子节点就变成了孤立节点,树S和T则被拆分为多颗子树;
步骤7.3:收养阶段;
为每一个孤立节点寻找父节点,如果没有满足条件的父节点,将其变为自由节点,直至所有的孤立节点都被处理;
步骤7.4:重复执行上面三个步骤,直至两棵树不再生长,被饱和边分开,便求出了图的最小割即能量函数的最小值,从而实现了图像的最终二值化。
CN201710289747.7A 2017-04-27 2017-04-27 基于背景估计和能量最小化的低质量文档图像二值化方法 Expired - Fee Related CN107133929B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710289747.7A CN107133929B (zh) 2017-04-27 2017-04-27 基于背景估计和能量最小化的低质量文档图像二值化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710289747.7A CN107133929B (zh) 2017-04-27 2017-04-27 基于背景估计和能量最小化的低质量文档图像二值化方法

Publications (2)

Publication Number Publication Date
CN107133929A true CN107133929A (zh) 2017-09-05
CN107133929B CN107133929B (zh) 2019-06-11

Family

ID=59716294

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710289747.7A Expired - Fee Related CN107133929B (zh) 2017-04-27 2017-04-27 基于背景估计和能量最小化的低质量文档图像二值化方法

Country Status (1)

Country Link
CN (1) CN107133929B (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107705300A (zh) * 2017-09-28 2018-02-16 成都大熊智能科技有限责任公司 一种基于形态学变换实现空白页检测的方法
CN108830186A (zh) * 2018-05-28 2018-11-16 腾讯科技(深圳)有限公司 文本图像的内容提取方法、装置、设备及存储介质
CN109918482A (zh) * 2019-03-14 2019-06-21 西安航空学院 一种大学生创新创业计划评价分析***
CN111583157A (zh) * 2020-05-13 2020-08-25 杭州睿琪软件有限公司 图像处理方法、***及计算机可读存储介质
CN111681175A (zh) * 2020-05-09 2020-09-18 浙江大学 一种扫描灰度文档图像的预处理方法
CN111754416A (zh) * 2019-03-29 2020-10-09 通用电气精准医疗有限责任公司 用于磁共振图像中背景噪音降低的***和方法
CN112488107A (zh) * 2020-12-04 2021-03-12 北京华录新媒信息技术有限公司 一种视频字幕的处理方法及处理装置
CN112836541A (zh) * 2021-02-03 2021-05-25 华中师范大学 一种香烟32位条码的自动采集及识别方法及装置
CN112837329A (zh) * 2021-03-01 2021-05-25 西北民族大学 一种藏文古籍文档图像二值化方法及***
CN113129246A (zh) * 2021-04-19 2021-07-16 厦门喵宝科技有限公司 一种文档图片的处理方法、装置及电子设备
CN114283156A (zh) * 2021-12-02 2022-04-05 珠海移科智能科技有限公司 一种用于去除文档图像颜色及手写笔迹的方法及装置
CN117436058A (zh) * 2023-10-10 2024-01-23 国网湖北省电力有限公司 一种电力信息安全防护***

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106295648A (zh) * 2016-07-29 2017-01-04 湖北工业大学 一种基于多光谱成像技术的低质量文档图像二值化方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106295648A (zh) * 2016-07-29 2017-01-04 湖北工业大学 一种基于多光谱成像技术的低质量文档图像二值化方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
NICHOLAS R. HOWE等: "A Laplacian Energy for Document Binarization", 《2011 INTERNATIONAL CONFERENCE ON DOCUMENT ANALYSIS AND RECOGNITION》 *
RAFAEL G. MESQUITA等: "Parameter tuning for document image binarization using a racing", 《EXPERT SYSTEMS WITH APPLICATIONS》 *
熊炜等: "低质量文档图像二值化算法研究", 《计算机应用与软件》 *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107705300A (zh) * 2017-09-28 2018-02-16 成都大熊智能科技有限责任公司 一种基于形态学变换实现空白页检测的方法
CN108830186A (zh) * 2018-05-28 2018-11-16 腾讯科技(深圳)有限公司 文本图像的内容提取方法、装置、设备及存储介质
CN109918482A (zh) * 2019-03-14 2019-06-21 西安航空学院 一种大学生创新创业计划评价分析***
CN111754416A (zh) * 2019-03-29 2020-10-09 通用电气精准医疗有限责任公司 用于磁共振图像中背景噪音降低的***和方法
CN111681175A (zh) * 2020-05-09 2020-09-18 浙江大学 一种扫描灰度文档图像的预处理方法
CN111583157A (zh) * 2020-05-13 2020-08-25 杭州睿琪软件有限公司 图像处理方法、***及计算机可读存储介质
CN112488107A (zh) * 2020-12-04 2021-03-12 北京华录新媒信息技术有限公司 一种视频字幕的处理方法及处理装置
CN112836541A (zh) * 2021-02-03 2021-05-25 华中师范大学 一种香烟32位条码的自动采集及识别方法及装置
CN112836541B (zh) * 2021-02-03 2022-06-03 华中师范大学 一种香烟32位条码的自动采集及识别方法及装置
CN112837329A (zh) * 2021-03-01 2021-05-25 西北民族大学 一种藏文古籍文档图像二值化方法及***
CN112837329B (zh) * 2021-03-01 2022-07-19 西北民族大学 一种藏文古籍文档图像二值化方法及***
CN113129246A (zh) * 2021-04-19 2021-07-16 厦门喵宝科技有限公司 一种文档图片的处理方法、装置及电子设备
CN114283156A (zh) * 2021-12-02 2022-04-05 珠海移科智能科技有限公司 一种用于去除文档图像颜色及手写笔迹的方法及装置
CN114283156B (zh) * 2021-12-02 2024-03-05 珠海移科智能科技有限公司 一种用于去除文档图像颜色及手写笔迹的方法及装置
CN117436058A (zh) * 2023-10-10 2024-01-23 国网湖北省电力有限公司 一种电力信息安全防护***

Also Published As

Publication number Publication date
CN107133929B (zh) 2019-06-11

Similar Documents

Publication Publication Date Title
CN107133929A (zh) 基于背景估计和能量最小化的低质量文档图像二值化方法
CN109299274B (zh) 一种基于全卷积神经网络的自然场景文本检测方法
CN108665481B (zh) 多层深度特征融合的自适应抗遮挡红外目标跟踪方法
CN107680054B (zh) 雾霾环境下多源图像融合方法
CN112819772B (zh) 一种高精度快速图形检测识别方法
CN103455991B (zh) 一种多聚焦图像融合方法
CN103440476A (zh) 一种人脸视频中瞳孔的定位方法
CN104050471A (zh) 一种自然场景文字检测方法及***
CN111310760A (zh) 结合局部先验特征和深度卷积特征的甲骨刻辞文字检测方法
CN111626292B (zh) 一种基于深度学习技术的楼宇指示标识的文字识别方法
CN109977899B (zh) 一种物品识别的训练、推理以及增加新种类的方法和***
CN107610144A (zh) 一种改进的基于最大类间方差法的红外图像分割算法
CN115272306B (zh) 利用梯度运算的太阳能电池板栅线增强方法
CN111553346A (zh) 一种基于字符区域感知的场景文本检测方法
Liu et al. Texture filtering based physically plausible image dehazing
CN115409831A (zh) 基于最优背景估计的星点质心提取方法及***
Wang et al. Straight lane line detection based on the Otsu-Canny algorithm
Liu et al. Implementation System of Human Eye Tracking Algorithm Based on FPGA.
CN113627481A (zh) 一种面向智慧园林的多模型组合的无人机垃圾分类方法
Zhang et al. Dehazing with improved heterogeneous atmosphere light estimation and a nonlinear color attenuation prior model
CN109410227B (zh) 一种基于gvf模型的土地利用图斑轮廓提取算法
CN110598702A (zh) 一种船舰目标检测数据集的制备方法、***、设备及介质
CN107480648B (zh) 一种自然场景文字检测的方法
CN114529715A (zh) 一种基于边缘提取的图像识别方法及***
Krishna et al. Digital image processing techniques in character recognition-a survey

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20190611

CF01 Termination of patent right due to non-payment of annual fee