CN102842119A - 一种基于抠像和边缘增强的快速文本图像超分辨率方法 - Google Patents

一种基于抠像和边缘增强的快速文本图像超分辨率方法 Download PDF

Info

Publication number
CN102842119A
CN102842119A CN2012102944808A CN201210294480A CN102842119A CN 102842119 A CN102842119 A CN 102842119A CN 2012102944808 A CN2012102944808 A CN 2012102944808A CN 201210294480 A CN201210294480 A CN 201210294480A CN 102842119 A CN102842119 A CN 102842119A
Authority
CN
China
Prior art keywords
text image
resolution
foreground
image
super
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012102944808A
Other languages
English (en)
Inventor
李树涛
康旭东
孙斌
孙俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan University
Fujitsu Ltd
Original Assignee
Hunan University
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan University, Fujitsu Ltd filed Critical Hunan University
Priority to CN2012102944808A priority Critical patent/CN102842119A/zh
Publication of CN102842119A publication Critical patent/CN102842119A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Editing Of Facsimile Originals (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种基于抠像技术与边缘增强的快速文本图像超分辨率方法。它包括以下步骤:采用基于引导滤波的抠像技术将低分辨率文本图像分为前景色、背景色及前景透明度三个组成部分;分别使用快速插值方法与基于边缘增强的插值方法对低分辨率文本图像的前景色及背景色部分和前景透明度部分进行超分辨率;利用超分辨率后的前景色、背景色及前景透明度部分重构出高分辨率文本图像。本发明能够快速有效的提高超分辨率后的文本图像质量,改善文本图像的视觉效果,能解决低分辨率文本图像或视频在高分辨率电子设备上的显示和打印等问题,具有非常重要的实际应用价值。

Description

一种基于抠像和边缘增强的快速文本图像超分辨率方法
技术领域
本发明涉及一种文本图像超分辨率方法,更具体的说是一种基于抠像与边缘增强的文本图像超分辨率方法。
背景技术
文本图像超分辨率是图像超分辨率研究的一个分支,图像超分辨率方法一般来说可以分为三类:基于样本学习的方法、基于重构的方法和基于插值的方法。基于样本学习的方法通过学习高分辨率图像块/参数和低分辨率图像块/参数之间的对应关系来解决超分辨率问题,这类方法需要消耗相当长的时间来进行样本训练,而且样本图像的选取对超分结果的影响很大。基于重构的方法通过最小化原始低分辨率图像与由高分辨率图像下采样构成的低分辨率图像之间的误差来迭代出最终的高分辨率图像,这种方法不需要进行训练,但不能保证算法收敛的最终高分辨率图像具有理想视觉效果[3]。相比这些方法,图像插值方法如双线性插值和双三次插值简单快速,因此获得更加广泛的应用。但是简单的插值方法会造成图像边缘模糊和边缘锯齿。因此,最近出现了一些基于边缘的插值方法[4-5],这类方法在进行插值的过程中,尽量保证图像边缘的清晰和连续,因此能一定程度上解决图像边缘的模糊和锯齿问题。但是,与简单的插值方法相比,这类方法的计算消耗过高,很难满足一些实际应用需求,比如低分辨率文本图像或视频在高分辨率显示器上显示的等。Q. Shan等人提出基于迭代的上采样和去模糊的快速超分辨率方法[6],但是这种方法容易在去模糊过程中丢失图像纹理或在图像边缘处出现人造痕迹,并且该算法的快速实现需建立在GPU加速的基础上。
发明内容
为解决文本图像超分辨率方法速度和效果上存在的上述问题,本发明提供了一种基于抠像和边缘增强的快速文本图像超分辨率方法。本发明提出的算法速度快而且能在放大文本图像的同时有效保证文本图像边缘的清晰度。
本发明解决上述问题的技术方案包括以下步骤:
1)对低分辨率文本图像进行二值化,得到低分辨率文本图像的二值图像。
2)用低分辨率文本图像及其二值图像作为输入,采用基于引导滤波的抠像算法得到文本图像的前景透明度图像;
3)根据原文本图像和步骤2)得到的前景透明度图像估计前景色和背景色;
4)对低分辨率文本图像的前景色以及背景色部分采用插值算法进行超分辨率处理;
5)对低分辨率文本图像的前景透明度部分采用边缘增强插值算法进行超分辨率处理;
6)将经过超分辨率处理后的前景色、背景色以及前景透明度组合得到最终的高分辨率文本图像;
上述的基于抠像与边缘增强的快速文本图像超分辨率方法中,所述的步骤1)采用大津法来选取文本图像二值化的阈值。
上述的基于抠像与边缘增强的快速文本图像超分辨率方法中,所述的步骤2)中将低分辨率文本图像作为引导文本图像,对低分辨率文本图像的二值化图像进行引导滤波从而得到抠像结果,即低分辨率文本图像的前景透明度。
上述的基于抠像与边缘增强的快速文本图像超分辨率方法中,所述的步骤3)中利用引导滤波算法对局部线性模型的解,前景透明度作为引导,把原图像为输入,得到前景色和背景色。
上述的基于抠像与边缘增强的快速文本图像超分辨率方法中,所述的步骤3)中采用图像形态学处理中的膨胀腐蚀算法得到前景色和背景色。
上述的基于抠像与边缘增强的快速文本图像超分辨率方法中,所述的步骤4)中采用先插值再进行边缘增强与先进行边缘增强再插值相结合的文本图像插值方法。
上述的基于抠像与边缘增强的快速文本图像超分辨率方法中,所述的步骤5)中采用双三次插值方法。
上述的基于抠像与边缘增强的快速文本图像超分辨率方法,所述的步骤5)中采用双线性插值方法。
上述的基于抠像与边缘增强的快速文本图像超分辨率方法中,所述步骤5)中采用最近邻插值方法。
由于采用上述技术方案,本发明的技术效果在于:本发明采用基于抠像技术和边缘增强的文本图像超分辨率方法有效提高了放大后文本图像的清晰度,同时算法的速度很快,因此,可以用于解决低分率文本图像或视频在高分辨率显示器和打印机上的显示和打印等问题,对文本图像的后续处理及其在电子设备上的应用具有重要理论意义和应用价值。
附图说明
图1为本发明的流程图。
图2为不同超分辨率方法的文本图像超分辨率结果比较。
具体实施方式
参见图1,图1 为本发明的流程图。输入为低分辨率的灰度或彩色文本图像,输出为高分辨率的灰度或彩色文本图像。本发明具体实施步骤如下:
1.采用基于引导滤波的抠像技术将低分辨率文本图像分为低分辨率前景色FL、低分辨率背景色BL以及低分辨率前景透明度QL三个部分。其具体步骤为:
1) 对低分辨率文本图像IL进行二值化得到二值文本图像A。二值化的阈值TH采用大津法来选取。
A ( x , y ) = 1 I L ( x , y ) > TH 0 otherwise - - - ( 1 )
2) 如公式(2)所示,以原文本图像IL  为引导文本图像,对得到的二值文本图像A进行基于引导滤波的抠像,得到低分辨文本图像的前景透明度部分QL
QL=GD(A,IL)(2)
其中IL是为参考文本图像(低分辨率灰度文本图像,如果文本图像为彩色文本图像则通过计算三个颜色通道的平均值将其转换为灰度文本图像), A 是待滤波的步骤1)得到的低分辨率二值化文本图像,引导滤波输出结果为低分辨率文本图像的前景透明度部分 QL.
引导滤波的具体实施细节如下:首先采用线性回归法计算如公式(3)所示代价函数的封闭解ak与bk(如公式(4)、(5) 所示)。
E ( a k , b k ) = Σ i ∈ ω k ( ( a k i i L + b k - A i ) 2 + ϵ a k 2 ) - - - ( 3 )
a k = 1 | ω | Σ i ∈ ω k I i L S i - μ k S ‾ k δ k 2 + ϵ - - - ( 4 )
b k = S ‾ k - a k μ k - - - ( 5 )
其中ωk是指以第 k 个像素为中心的半径为r的方形窗口,|ω| 表示该窗口内像素的个数,μk
Figure BDA0000202924795
分别代表引导文本图像以第 k 个像素为中心的窗口ωk内像素的均值和方差,
Figure BDA0000202924796
表示待滤波文本图像以第k 个像素为中心的窗口ωk内像素的均值,ε为常数(在本方明中, 窗口半径r=2,ε=0.13)。然后根据式(6)计算滤波器的输出:
Q i L = a ‾ i I i L + b ‾ i - - - ( 6 )
其中 a ‾ i = 1 | ω | Σ k ∈ ω i a k b ‾ i = 1 | ω | Σ k ∈ ω i b k
3)计算出文本图像的前景透明度QL后,我们提出两种不同的方法来估计文本图像前景色和背景色:
方法一:根据前景透明度QL与原文本图像IL计算前景图像If与背景图像Ib,然后对二者进行腐蚀膨胀得到相应的前景色FL和背景色BL
B L = I b ⊕ H - - - ( 8 )
其中表示腐蚀操作,
Figure BDA00002029247913
表示膨胀操作,If=ILQL,Ib=IL(1-QL),H是一个的方形结构元素:
H = 1 1 1 1 1 1 1 1 1 - - - ( 9 )
方法二:对于QL值很大(大于0.9)的像素,其前景色直接用原文本图像像素值替代,对于QL值很小(小于0.1)的像素,其背景色直接用原文本图像像素值替代,而对于QL值位于 [0.1-0.9] 区间内的像素,其前景色与背景色根据公式(10)所示的代价函数的封闭解(如公式(11),(12)所示)求取。
E ( ( F L - B L ) , B L ) = Σ w k [ ( ( F L - B L ) q L + B L - I L ) 2 + ϵ ( F L - B L ) 2 ] - - - ( 10 )
F k L - B k L = 1 | w i | Σ k ∈ ω i 1 | w k | Σ j ∈ w k q j L I j L - η k I L ‾ k σ k 2 + ϵ - - - ( 11 )
B k L = 1 | w i | Σ k ∈ w i I L ‾ k - X k η k - - - ( 12 )
其中
Figure BDA00002029247918
,wk是以第 k 个像素为中心的3×3的方形窗口,|w| 表示该窗口内像素的个数,ηk
Figure BDA00002029247919
分别代表前景透明度文本图像QL以第 k个像素为中心的窗口wk内像素的均值和方差。
2.采用快速插值方法对步骤1得到的前景色FL和背景色BL分别进行超分辨率得到高分辨率的前景色FH和背景色BH。这里所说的快速插值方法主要是指最近邻插值,双线性插值和双三次插值等快速数值算法。最近邻插值认为待插值点的灰度值等于距离最近的已知点的灰度值;双线性插值利用待插值位置周围四个已知点的灰度值做两个方向上线性插值;双三次插值方法利用待插值位置周围16个点的灰度值做三次插值,不仅考虑到4个直接相邻点的灰度影响,而且考虑各邻点间灰度值变化率的影响。
3.采用边缘增强的插值方法对文本图像的边缘QL进行超分辨率得到超分后的边缘文本图像QH,具体实施步骤如下:
Q 1 H = Enhance ( Bicubic ( Q L ) ) - - - ( 13 )
Q 2 H = Bicubic ( Enhance ( Q L ) ) - - - ( 14 )
Q H = ( 1 - λ ) Q 1 H + λ Q 2 H - - - ( 15 )
其中λ的取值范围是[0,1],在本发明λ的默认值设为0.5,Bicubic()表示双三次插值,Enhance()是文本图像增强操作,它可以用下式表示:
Enhance(I)=I-I*○                  (16)
其中I表示待增强文本图像,*表示卷积运算,○表示如下所示的卷积核:
4.将高分辨率的前景色FH,背景色BH及前景透明度部分QH按如下方式进行组合:
IH(x,y)=QH(x,y)FH(x,y)+(1-QH(x,y))BH(x,y)      (18)
其中(x,y)为像素坐标,IH为最终的文本图像超分辨率结果。
本发明所提出的方法与基于双三次插值与基于稀疏表示的文本图像超分辨率方法进行了比较。附图2中左起第一列为是低分辨率文本图像,第二列为使用双三次插值法获得的高分辨率文本图像,第三列是基于稀疏表示的超分辨率方法得到的高分辨率文本图像,最后一列为采用本发明方法获得的高分辨率文本图像。可以看出本发明与基于稀疏表示的方法都能在放大文本图像的同时有效提升文本图像的清晰度,但双三次插值与基于稀疏表示的方法都会造成文本图像边缘不同程度的模糊。
表1列出了不同算法的计算时间比较,表中所有时间都是用MATLAB在CPU主频为2.8GHz的电脑上的运行时间。可以看出,尽管基于稀疏表示的算法能获得与本算法相当的超分辨率效果,其计算速度很慢,处理一幅256×256的彩色文本图像需要815 秒,然而本发明提出的方法要快很多,处理一幅256×256的彩色文本图像仅需要0.186秒,此外本算法的C++程序处理一幅256×256彩色文本图像的速度能够达到0.047秒,因此本发明具有重要的实用价值。
表1不同超分辨率算法的运行时间比较
Figure BDA00002029247924

Claims (9)

1.一种基于抠像和边缘增强的快速文本图像超分辨率方法,包括以下具体步骤:
1)对低分辨率文本图像进行二值化,得到低分辨率文本图像的二值图像。
2)用低分辨率文本图像及其二值图像作为输入,采用基于引导滤波的抠像算法得到文本图像的前景透明度图像;
3)根据原文本图像和步骤2)得到的前景透明度图像估计前景色和背景色;
4)对低分辨率文本图像的前景色以及背景色部分采用插值算法进行超分辨率处理;
5)对低分辨率文本图像的前景透明度部分采用边缘增强插值算法进行超分辨率处理;
6)将经过超分辨率处理后的前景色、背景色以及前景透明度组合得到最终的高分辨率文本图像;
2.根据权利要求1所述的基于抠像与边缘增强的快速文本图像超分辨率方法,所述的步骤1)采用大津法来选取文本图像二值化的阈值。
3.根据权利要求1所述的基于抠像与边缘增强的快速文本图像超分辨率方法,所述的步骤2)将低分辨率文本图像作为引导文本图像,对低分辨率文本图像的二值化图像进行引导滤波从而得到抠像结果,即低分辨率文本图像的前景透明度。
4.根据权利要求1所述的基于抠像与边缘增强的快速文本图像超分辨率方法,所述的步骤3)中利用引导滤波算法对局部线性模型的解,前景透明度作为引导,把原图像为输入,得到前景色和背景色。
5.根据权利要求4所述的基于抠像与边缘增强的快速文本图像超分辨率方法,所述的步骤3)中采用图像形态学处理中的膨胀腐蚀算法得到前景色和背景色。
6.根据权利要求1所述的基于抠像与边缘增强的快速文本图像超分辨率方法,所述的步骤4)中采用先插值再进行边缘增强与先进行边缘增强再插值相结合的文本图像插值方法。
7.根据权利要求1所述的基于抠像与边缘增强的快速文本图像超分辨率方法,所述的步骤5)中的采用双三次插值方法。
8.根据权利要求1所述的基于抠像与边缘增强的快速文本图像超分辨率方法,所述的步骤5)中采用双线性插值方法。
9.根据权利要求1所述的基于抠像与边缘增强的快速文本图像超分辨率方法,所述的步骤5)中采用最近邻插值方法。
CN2012102944808A 2012-08-18 2012-08-18 一种基于抠像和边缘增强的快速文本图像超分辨率方法 Pending CN102842119A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012102944808A CN102842119A (zh) 2012-08-18 2012-08-18 一种基于抠像和边缘增强的快速文本图像超分辨率方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012102944808A CN102842119A (zh) 2012-08-18 2012-08-18 一种基于抠像和边缘增强的快速文本图像超分辨率方法

Publications (1)

Publication Number Publication Date
CN102842119A true CN102842119A (zh) 2012-12-26

Family

ID=47369445

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012102944808A Pending CN102842119A (zh) 2012-08-18 2012-08-18 一种基于抠像和边缘增强的快速文本图像超分辨率方法

Country Status (1)

Country Link
CN (1) CN102842119A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016062259A1 (zh) * 2014-10-22 2016-04-28 华为技术有限公司 基于透明度的抠图方法和装置
CN110415176A (zh) * 2019-08-09 2019-11-05 北京大学深圳研究生院 一种文本图像超分辨率方法
CN110428366A (zh) * 2019-07-26 2019-11-08 Oppo广东移动通信有限公司 图像处理方法和装置、电子设备、计算机可读存储介质
CN111027560A (zh) * 2019-11-07 2020-04-17 浙江大华技术股份有限公司 文本检测方法以及相关装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080267525A1 (en) * 2006-11-27 2008-10-30 Nec Laboratories America, Inc. Soft Edge Smoothness Prior and Application on Alpha Channel Super Resolution
CN102542601A (zh) * 2010-12-10 2012-07-04 三星电子株式会社 一种用于3d对象建模的设备和方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080267525A1 (en) * 2006-11-27 2008-10-30 Nec Laboratories America, Inc. Soft Edge Smoothness Prior and Application on Alpha Channel Super Resolution
CN102542601A (zh) * 2010-12-10 2012-07-04 三星电子株式会社 一种用于3d对象建模的设备和方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
KAIMING HE等: "Guided Image Filtering", 《COMPUTER VISION–ECCV 2010, LECTURE NOTES IN COMPUTER SCIENCE》, vol. 6311, 31 December 2010 (2010-12-31), pages 1 - 14, XP019150502 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016062259A1 (zh) * 2014-10-22 2016-04-28 华为技术有限公司 基于透明度的抠图方法和装置
CN105590307A (zh) * 2014-10-22 2016-05-18 华为技术有限公司 基于透明度的抠图方法和装置
CN110428366A (zh) * 2019-07-26 2019-11-08 Oppo广东移动通信有限公司 图像处理方法和装置、电子设备、计算机可读存储介质
WO2021017811A1 (zh) * 2019-07-26 2021-02-04 Oppo广东移动通信有限公司 图像处理方法和装置、电子设备、计算机可读存储介质
CN110428366B (zh) * 2019-07-26 2023-10-13 Oppo广东移动通信有限公司 图像处理方法和装置、电子设备、计算机可读存储介质
CN110415176A (zh) * 2019-08-09 2019-11-05 北京大学深圳研究生院 一种文本图像超分辨率方法
CN111027560A (zh) * 2019-11-07 2020-04-17 浙江大华技术股份有限公司 文本检测方法以及相关装置
CN111027560B (zh) * 2019-11-07 2023-09-29 浙江大华技术股份有限公司 文本检测方法以及相关装置

Similar Documents

Publication Publication Date Title
CN102831591B (zh) 一种基于高斯滤波的单幅图像的实时去雾方法
CN102208100B (zh) 基于Split Bregman 迭代的全变差正则化图像盲复原方法
CN105225210A (zh) 一种基于暗通道的自适应直方图增强去雾方法
CN101930597B (zh) 一种基于数学形态学的图像边缘检测方法
CN105023240A (zh) 基于迭代投影重建的字典类图像超分辨率***及方法
CN101908205B (zh) 基于幻方编码的中值滤波方法
CN102930511B (zh) 一种基于灰阶超声图像的心脏流场速度矢量分析方法
CN105513025B (zh) 一种改进的快速去雾方法
CN102842119A (zh) 一种基于抠像和边缘增强的快速文本图像超分辨率方法
CN103366342A (zh) 应用于视频图像放大的分段线性插值方法
CN106127688A (zh) 一种超分辨率图像重建方法及其***
CN104574328A (zh) 一种基于直方图分割的彩色图像增强方法
CN103714537A (zh) 一种图像显著性的检测方法
CN106169174A (zh) 一种图像放大方法
CN108492270A (zh) 一种基于模糊核估计和变分重构的超分辨率方法
CN105427243A (zh) 基于自适应插值核学习的视频超分辨率重建方法
CN104580829A (zh) 一种太赫兹图像增强方法及***
CN106204454A (zh) 基于纹理边缘自适应数据融合的高精度快速图像插值方法
CN101540055A (zh) 面向在线实时应用的卡通风格化方法
CN104715453A (zh) 一种分区域处理的图像增强方法及电路
CN105513023A (zh) 一种平显字符画面全屏反走样方法及装置
CN101383044A (zh) 图像中的空间扩散
CN101655973A (zh) 一种基于人眼视觉特征的图像增强方法
CN109993701B (zh) 一种基于金字塔结构的深度图超分辨率重建的方法
CN104200439B (zh) 基于自适应滤波和正则约束的图像超分辨方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20121226