CN103377462B - 对扫描图像进行处理的方法和装置 - Google Patents

对扫描图像进行处理的方法和装置 Download PDF

Info

Publication number
CN103377462B
CN103377462B CN201210111235.9A CN201210111235A CN103377462B CN 103377462 B CN103377462 B CN 103377462B CN 201210111235 A CN201210111235 A CN 201210111235A CN 103377462 B CN103377462 B CN 103377462B
Authority
CN
China
Prior art keywords
blocked
region
pixel
pixel value
line segment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201210111235.9A
Other languages
English (en)
Other versions
CN103377462A (zh
Inventor
何源
孙俊
直井聪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to CN201210111235.9A priority Critical patent/CN103377462B/zh
Priority to JP2013085182A priority patent/JP6098319B2/ja
Priority to US13/862,935 priority patent/US9202260B2/en
Publication of CN103377462A publication Critical patent/CN103377462A/zh
Application granted granted Critical
Publication of CN103377462B publication Critical patent/CN103377462B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/77Retouching; Inpainting; Scratch removal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • G06T2207/10008Still image; Photographic image from scanner, fax or copier
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及对扫描图像进行处理的方法和装置。对扫描图像进行处理的方法包括:被遮挡区域提取步骤,提取扫描图像的边缘附近的空白处被遮挡物遮挡的区域,即被遮挡区域;像素值修复步骤,根据贯穿被遮挡区域且与边缘平行的线段中的已知页边空白像素的像素值,通过线性模型来修复线段中的被遮挡区域像素的像素值;根据贯穿所述被遮挡区域且与边缘平行的线段中的已知页边空白像素的噪声来估计线段中的被遮挡区域像素的噪声;以及将估计出的噪声添加到通过线性模型修复的线段中的被遮挡区域像素的像素值。

Description

对扫描图像进行处理的方法和装置
技术领域
本发明涉及图像处理领域,具体涉及对扫描图像进行处理的方法和装置。
背景技术
光学成像***能够将纸质的文档转变为数字图像,但是当用非接触式成像装置(例如顶置式扫描仪或者数码相机等)对书籍进行成像时,通常需要用手指按压以固定书页。这种情况下得到的图像两侧会保留手指,降低该图像的可读性、完整性和美观。图5是一个手指按压固定书页的示意图,图6是成像后得到的书页图像,可以明显看到两侧的手指对图像可读性、完整性和美观的影响。因此,如果能够用图像处理的方法将该手指区域去除并用书页内容填充的话,将会有效提高图像质量。图像修描(imageinpainting)是一种图像复原技术,能够去除图像中的指定区域的同时使得该改变不易察觉,最初用于受损油画的修复。
研究人员提出了很多种图像修描方法,包括基于结构传播、纹理合成、范例合成等,其中有些方法能够直接应用于手指区域的去除并获得满意的效果,但是该操作耗时较长,无法实用。
因此,需要用一种图像修描的方法来去除文档图像中的手指,同时保证该改变不易察觉。
发明内容
在下文中给出关于本发明的简要概述,以便提供关于本发明的某些方面的基本理解。应当理解,这个概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的关键或重要部分,也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。
本发明的一个主要目的在于,提供对扫描图像进行处理的方法和装置。
根据本发明的一个方面,提供了一种对扫描图像进行处理的方法,包括:被遮挡区域提取步骤,提取扫描图像的边缘附近的空白处被遮挡物遮挡的区域,即被遮挡区域;像素值修复步骤,根据贯穿被遮挡区域且与边缘平行的线段中的已知页边空白像素的像素值,通过线性模型来修复线段中的被遮挡区域像素的像素值;根据贯穿被遮挡区域且与边缘平行的线段中的已知页边空白像素的噪声来估计线段中的被遮挡区域像素的噪声;以及将估计出的噪声添加到通过线性模型修复的线段中的被遮挡区域像素的像素值。
根据本发明的另一个方面,提供了一种对扫描图像进行处理的装置,包括:被遮挡区域提取模块,被配置用于提取扫描图像的边缘附近的空白处被遮挡物遮挡的区域,即被遮挡区域;像素值修复模块,被配置用于根据贯穿被遮挡区域且与边缘平行的线段中的已知页边空白像素的像素值,通过线性模型来修复线段中的被遮挡区域像素的像素值;噪声估计模块,被配置用于根据贯穿所述被遮挡区域且与边缘平行的线段中的已知页边空白像素的噪声来估计线段中的被遮挡区域像素的噪声;以及噪声添加模块,被配置用于将估计出的噪声添加到通过线性模型修复的线段中的被遮挡区域像素的像素值。
另外,本发明的实施例还提供了用于实现上述方法的计算机程序。
此外,本发明的实施例还提供了至少计算机可读介质形式的计算机程序产品,其上记录有用于实现上述方法的计算机程序代码。
通过以下结合附图对本发明的最佳实施例的详细说明,本发明的这些以及其他优点将更加明显。
附图说明
参照下面结合附图对本发明实施例的说明,会更加容易地理解本发明的以上和其它目的、特点和优点。附图中的部件只是为了示出本发明的原理。在附图中,相同的或类似的技术特征或部件将采用相同或类似的附图标记来表示。
图1是示出根据本发明的一个实施例的对扫描图像进行处理的方法的流程图;
图2是示出根据本发明的另一个实施例的对扫描图像进行处理的方法的流程图;
图3是示出提取被遮挡区域的过程的流程图;
图4是示出根据本发明的又一个实施例的对扫描图像进行处理的方法的流程图;
图5是示出用手按压书籍来进行扫描的情形的示意图;
图6是示出图5中的书籍的扫描结果的示意图;
图7是示出图6中的A部分的放大图;
图8是示出图7中的A部分的关于线段L的修复结果的示意图;
图9是示出根据本发明的实施例的对扫描图像进行处理的装置的框图;
图10是示出根据本发明的另一实施例的对扫描图像进行处理的装置的框图;
图11是示出根据本发明的一个示例的被遮挡区域提取模块的配置的框图;
图12是示出根据本发明的另一实施例的对扫描图像进行处理的装置的框图;以及
图13是示出可以用于实施本发明的对扫描图像进行处理的方法和装置的计算设备的举例的结构图。
具体实施方式
下面参照附图来说明本发明的实施例。在本发明的一个附图或一种实施方式中描述的元素和特征可以与一个或更多个其它附图或实施方式中示出的元素和特征相结合。应当注意,为了清楚的目的,附图和说明中省略了与本发明无关的、本领域普通技术人员已知的部件和处理的表示和描述。
以下参照图1来描述根据本发明的一个实施例的对扫描图像进行处理的方法100。
如图1所示,在步骤S102,可以提取扫描图像的边缘附近的空白处被遮挡物遮挡的区域(即,被遮挡区域)。一般而言,很多扫描图像的边缘没有复杂的图样。例如,书籍或其他印刷制品的边缘可能有空白。在扫描的时候按压该印刷制品的边缘的物体可能会对印刷制品造成遮挡,该物体可以被称作遮挡物。换句话说,在步骤S102中可以提取被该遮挡物遮挡的区域。
在步骤S104,可以根据贯穿被遮挡区域且与扫描图像的边缘平行的线段中的已知页边空白像素的像素值,通过线性模型来修复该线段中的被遮挡区域像素的像素值。话句话说,所取的线段贯穿被遮挡区域并且平行于扫描图像的边缘。该线段中既有已知页边空白像素,也有被遮挡物遮挡的像素。根据该线段中的已知页边空白像素,根据线性模型来修复该线段中的被遮挡无遮挡的区域(即,被遮挡区域)的像素的像素值。
由于所取线段与扫描图像的边缘平行,因而在对书籍或其他多页的印刷制品的扫描图像进行修复的情况下,可以很好地修复书页边缘的痕迹。
此外,由于使用了线性模型,提高了计算速度并节约了运算资源。
以下参照图2来描述根据本发明的另一个实施例的对扫描图像进行处理的方法200。方法200中的步骤S202和步骤S204分别与参照图1描述的步骤S102和步骤S104相同。
在步骤S202,可以提取扫描图像的边缘附近的空白处被遮挡物遮挡的区域(即,被遮挡区域)。
在步骤S204,可以根据贯穿被遮挡区域且与扫描图像的边缘平行的线段中的已知页边空白像素的像素值,通过线性模型来修复该线段中的被遮挡区域像素的像素值。
在步骤S206,可以根据贯穿被遮挡区域且与扫描图像的边缘平行的线段中的已知页边空白像素的噪声来估计线段中的被遮挡区域像素的噪声。
在步骤S208,可以将估计出的噪声添加到该线段中的被遮挡区域像素的像素值。
一般而言,扫描图像上存在噪声,即使对于页边空白而言,也是存在噪声的。通过根据页边空白像素的噪声估计被遮挡区域的噪声并将该噪声添加到像素值,能够使得修复后的区域不易被察觉。
以下参照图3来描述步骤S102(或步骤S202)中提取被遮挡区域的过程300的一个示例。
如图3所示,在步骤S302,可以提供被遮挡区域中的一点。例如,可以接收用户给定的被遮挡区域中的一点。
在步骤S304,可以估计围绕该点的小窗口中的像素的中心像素值,其中,可以采用根据该点附近邻域内进行均值漂移(meanshift)聚类的算法。可替换地,直接统计像素值直方图(例如,颜色直方图)以得到出现频率最高的像素值(例如,颜色值)。
在步骤S306,可以计算围绕该点的大窗口中的各个像素的像素值与步骤S304中估计出的中心像素值之间的差异。在像素值为颜色值的情况下,该差异可以用颜色空间中的欧式距离来表示。距离越大表示与手指区域的相似度越小,反之则表示相似度越大。
在步骤S308,可以根据计算出的差异,通过二值化方法提取被遮挡区域。即,用二值化方法对距离度量进行分类:疑似被遮挡区域和页边空白区域。最后,该点所在的疑似被遮挡区域被提取作为被遮挡区域。
通过过程300可以简单并有效地提取被遮挡区域。
除了过程300之外,还可也采用全自动方式或手动方式提取被遮挡区域。或者,可以将全自动的方式、过程300和手动方式结合起来提取被遮挡区域。图4所示的方法400即为这种情况。
以下参照图4来描述根据本发明的又一个实施例的对扫描图像进行处理的方法400。方法400与参照图1描述方法100的主要区别在于,引入了自动提取步骤(S404)和手动提取步骤(S412)、以及判断步骤(S408)和判断步骤(S410)。
首先,在步骤S402,输入扫描图像,其中,该扫描图像的边缘附近存在被遮挡物遮挡的区域。
在步骤S404,尝试自动提取输入的扫描图像的边缘附近的被遮挡区域。现有的多种方法能够完成此步骤,例如,一些图像特征可以被使用,遮挡物(例如,手指或其他物体)的颜色、遮挡物的形状等特征。
在步骤S406,判断步骤S404中的自动提取是否成功。如果步骤S404中的自动提取成功,则流程前进到步骤S414。如果步骤S404中的自动提取不成功,则流程前进到步骤S408。
在步骤S408,可以尝试半自动提取被遮挡区域。例如,可以在用户的干预下进行半自动的手指区域提取,一个简单可行的方案是用户在手指区域内部点击鼠标,即完成该干预,计算机自动根据用户点击的位置进行手指区域的提取。即,类似于过程300,提供被遮挡区域中的一点,估计围绕该点的小窗口中的像素的中心像素值,计算围绕该点的大窗口中的各个像素的像素值与中心像素值之间的差异,最后可以根据计算出的差异,通过二值化方法提取被遮挡区域。
接下来,在步骤S410,判断步骤S408中的半自动提取是否成功。如果步骤S408中的半自动提取成功,则流程前进到步骤S414。否则,流程前进到步骤S412。在步骤S412处,手动提取被遮挡区域。
在步骤S414,修复被遮挡区域中的像素值,例如,类似于图1中的步骤S104,可以根据贯穿被遮挡区域且与边缘平行的线段中的已知页边空白像素的像素值,通过线性模型来修复该线段中的被遮挡区域像素的像素值。
最后,在步骤S416,输出修复后的扫描图像。
通过将全自动的方式、过程300和手动方式结合起来提取被遮挡区域,可以更有效且准确地提取被遮挡区域。
以下参照图5和图6来描述用手按压书籍来进行扫描的情形。在此,假设书籍B是水平放置的,而可能对其进行按压的手指出现在图像的左右两侧。
如图5所示,在扫描书籍B的情况下,为了使书页变得平整以便于扫描,往往会用手HL和HR或其他物体(即,遮挡物)按压书籍的页边空白从而造成遮挡。但是,在该情况下,所扫描图像的页边空白处有手指F,如图6所示,这影响了扫描页面的可读性、完整性和美观。
以下参照图7和图8来描述图6中的A部分的修复过程。以下主要描述了修复颜色值的过程。但是,可以理解到,其他的像素值,例如,亮度、灰度、色调等,也可以通过类似的过程进行修复。
观察发现,通常书页的左侧和右侧边界包含纯色的背景,而用户用手按压书本时为了避免遮挡住文字等内容通常会按压在纯色的区域。因此,可以采用一个线性的颜色模型来估计被手指遮挡的书本内容。此外,由于多个叠加的页面错开往往形成页面边缘ER和EL,如图6和7所示。页面边缘ER和EL基本与扫描图像的边缘平行。基于该观察结果,可以按照与扫描图像的边缘平行的线段为单位来进行修复,从而能够更快更好地修复页面边缘ER和EL。
以竖直方向的线性颜色模型为例,对手指区域的每一个数值像素列都估计出一个颜色模型。对每一个数值列对其进行上下延伸,根据延伸的像素位置和颜色来估计出该颜色模型。如图7所示,针对待去除的像素列L2,其上下延伸的像素列L1和L3是已知的属于书页空白页面的,每一个像素都具有竖直方向的位置和颜色值,根据它们可以估计出颜色相对竖直方向位置的线性模型。然后根据该模型来估计出待去除的像素列L2中各像素的颜色值。结果如图8所示。在图7和图8中,将像素列L1、L2和L3描绘得具有相当的宽度。应当理解到,这样描绘仅仅是为了使阅读者看得更加清晰。实际上,真正的像素列的宽度会窄一些。
线性模型估计方法描述如下:假设目标像素列L2坐标为{(xi,yi0),(xi,yi0+1),...,(xi,yi1)},其中yi0和yi1分别为最小和最大y方向坐标值。可以考虑相邻的上方像素列L1{(xi,yi1+1),(xi,yi1+2),...,(xi,yi1+M)}和相邻的下方像素列L3{(xi,yi0-N),(xi,yi0-N+1),...,(xi,yi0-1)},其中M和N分别为两个相邻像素列L1和L3的像素个数。在实际应用中可以根据经验或者实验来设置M和N。假设输入文档图像为彩色图像,每一个像素(x,y)均具有颜色值Ik(x,y),其中k=R,G,B。可以针对每一个颜色通道R、G和B分别进行估计线性模型。即输入为,{Ik(xi,yn),n=i0-N,i0-N+1,...,i0-1,i1+1,i1+2,...,i1+M}。估计出来的线性模型为其中aki和bki为对应第i列、颜色通道k的线性模型参数。
对某些印刷及扫描质量很好的文档,仅使用该线性模型,即用来替换原图中的{Ik(xi,y),y=yi0,yi0+1,…,yi1},就可以。但通常来说,图像均匀区域内均具有一定的噪声,如果能在填充手指区域时模拟出这种噪声的现象,能够使得填充结果更为自然,从而使得这种填充不易察觉。人工添加噪声可以采用以下方法:首先,估计噪声的参数;然后根据噪声参数进行模拟。例如,可以假设噪声符合高斯分布,其中θ(x,y)为噪声模型。该高斯模型的参数可以用上下相邻像素列{yn,n=i0-N,i0-N+1,...,i0-1,i1+1,i1+2,...,i1+M}来估计得出。
{ θ ( x i , y n ) = I k ( x i , y n ) - I ~ k ( x i , y n ) , n = i 0 - N , i 0 - N + 1 , ... , i 0 - 1 , i 1 + 1 , i 1 + 2 , ... , i 1 + M } ,
则均值为 μ i = Σ y n θ ( x i , y n ) N + M , 标准差为 σ i = Σ y n ( θ ( x i , y n ) - μ i ) 2 N + M - 1 .
得出噪声的高斯模型参数(均值和标准差)之后,再将该模型随即添加至填充结果中,对于各像素加一个随机噪声其中λj为随机参数,取值范围可以根据经验设定,例如[-3,3]或者[-1,1]。
最后,用来作为最终的填充结果输出。
尽管以上参照高斯模型进行了描述,但是可以理解到,也可以采用其他适当模型来添加噪声。
以下参照图9来描述根据本发明的实施例的对扫描图像进行处理的装置900。
如图9所示,对扫描图像进行处理的装置900可以包括被遮挡区域提取模块902和像素值修复模块904。
在接收到输入的扫描图像时,被遮挡区域提取模块902可以提取扫描图像的边缘附近的空白处被遮挡物遮挡的区域,即被遮挡区域。然后,被遮挡区域提取模块902可以将提取出的被遮挡区域发送到像素值修复模块904。
在接收到被遮挡区域提取模块902发送的被遮挡区域提取结果时,像素值修复模块904可以根据贯穿被遮挡区域且与边缘平行的线段中的已知页边空白像素的像素值,通过线性模型来修复线段中的被遮挡区域像素的像素值。
具体的被遮挡区域提取过程和像素值修复过程与参照图1描述的方法100类似,在此不再赘述。
以下参照图10来描述根据本发明的另一实施例的对扫描图像进行处理的装置900’。图10中的装置900’和图9中的装置900的区别在于,装置900’还可以包括噪声估计模块906和噪声添加模块908。
在接收到输入的扫描图像时,噪声估计模块906可以根据贯穿被遮挡区域且与边缘平行的线段中的已知页边空白像素的噪声来估计线段中的被遮挡区域像素的噪声。噪声添加模块908可以将估计出的噪声添加到该线段中的被遮挡区域像素的像素值,即,将估计出的噪声添加到像素值修复模块904修复的像素值。然后,噪声添加模块908可以输出最后的得到的图像,即,修复后的图像。
以下参照图11来描述根据本发明的一个示例的被遮挡区域提取模块902。
如图11所示,被遮挡区域提取模块902可以包括点提供子模块902-2、中心像素值估计子模块902-4、差异计算子模块902-6和提取子模块902-8。
在接收到输入的扫描图像时,点提供子模块902-2可以提供被遮挡区域中的一点。然后,点提供子模块902-2可以将该点提供给中心像素值估计子模块902-4。
接着,中心像素值估计子模块902-4可以估计围绕该点的小窗口中的像素的中心像素值。
差异计算子模块902-6可以计算围绕该点的大窗口中的各个像素的像素值与中心像素值之间的差异。
提取子模块902-8可以根据该差异,通过二值化方法提取被遮挡区域。
以下参照图12来描述根据本发明的另一实施例的对扫描图像进行处理的装置900”。图12中的装置900”与图10中的装置900’的区别在于,装置900”还可以包括自动提取模块910、判断模块912和用户界面914。
自动提取模块910可以自动提取被遮挡区域。如果自动提取模块910成功地提取被遮挡区域,则被遮挡区域提取模块902不执行被遮挡区域提取,如果自动提取模块910未能成功地提取被遮挡区域,则被遮挡区域提取模块902执行被遮挡区域提取。判断模块912可以判断被遮挡区域提取模块是否成功地提取了被遮挡区域。用户界面914可以在被遮挡区域提取模块未能成功地提取被遮挡区域的情况下,使得被遮挡区域能够被手动提取。
例如,遮挡物可以为手指。像素值可以包括颜色值。其中,扫描图像具有平行错开的多个页面边缘。
以上结合具体实施例描述了本发明的基本原理,但是,需要指出的是,对本领域的普通技术人员而言,能够理解本发明的方法和装置的全部或者任何步骤或者部件,可以在任何计算装置(包括处理器、存储介质等)或者计算装置的网络中,以硬件、固件、软件或者它们的组合加以实现,这是本领域普通技术人员在阅读了本发明的说明的情况下运用他们的基本编程技能就能实现的。
因此,本发明的目的还可以通过在任何计算装置上运行一个程序或者一组程序来实现。所述计算装置可以是公知的通用装置。因此,本发明的目的也可以仅仅通过提供包含实现所述方法或者装置的程序代码的程序产品来实现。也就是说,这样的程序产品也构成本发明,并且存储有这样的程序产品的存储介质也构成本发明。显然,所述存储介质可以是任何公知的存储介质或者将来所开发出来的任何存储介质。
在通过软件和/或固件实现本发明的实施例的情况下,从存储介质或网络向具有专用硬件结构的计算机,例如图13所示的通用计算机1300安装构成该软件的程序,该计算机在安装有各种程序时,能够执行各种功能等等。
在图13中,中央处理单元(CPU)1301根据只读存储器(ROM)1302中存储的程序或从存储部分1308加载到随机存取存储器(RAM)1303的程序执行各种处理。在RAM1303中,也根据需要存储当CPU1301执行各种处理等等时所需的数据。CPU1301、ROM1302和RAM1303经由总线1304彼此链路。输入/输出接口1305也链路到总线1304。
下述部件链路到输入/输出接口1305:输入部分1306(包括键盘、鼠标等等)、输出部分1307(包括显示器,比如阴极射线管(CRT)、液晶显示器(LCD)等,和扬声器等)、存储部分1308(包括硬盘等)、通信部分1309(包括网络接口卡比如LAN卡、调制解调器等)。通信部分1309经由网络比如因特网执行通信处理。根据需要,驱动器1310也可链路到输入/输出接口1305。可拆卸介质1311比如磁盘、光盘、磁光盘、半导体存储器等等根据需要被安装在驱动器1310上,使得从中读出的计算机程序根据需要被安装到存储部分1308中。
在通过软件实现上述系列处理的情况下,从网络比如因特网或存储介质比如可拆卸介质1311安装构成软件的程序。
本领域的技术人员应当理解,这种存储介质不局限于图13所示的其中存储有程序、与设备相分离地分发以向用户提供程序的可拆卸介质1311。可拆卸介质1311的例子包含磁盘(包含软盘(注册商标))、光盘(包含光盘只读存储器(CD-ROM)和数字通用盘(DVD))、磁光盘(包含迷你盘(MD)(注册商标))和半导体存储器。或者,存储介质可以是ROM1302、存储部分1308中包含的硬盘等等,其中存有程序,并且与包含它们的设备一起被分发给用户。
本发明还提出一种存储有机器可读取的指令代码的程序产品。指令代码由机器读取并执行时,可执行上述根据本发明实施例的方法。
相应地,用于承载上述存储有机器可读取的指令代码的程序产品的存储介质也包括在本发明的公开中。存储介质包括但不限于软盘、光盘、磁光盘、存储卡、存储棒等。
本领域的普通技术人员应理解,在此所例举的是示例性的,本发明并不局限于此。
在本说明书中,“第一”、“第二”以及“第N个”等表述是为了将所描述的特征在文字上区分开,以清楚地描述本发明。因此,不应将其视为具有任何限定性的含义。
作为一个示例,上述方法的各个步骤以及上述设备的各个组成模块和/或单元可以实施为软件、固件、硬件或其组合,并作为相应设备中的一部分。上述装置中各个组成模块、单元通过软件、固件、硬件或其组合的方式进行配置时可使用的具体手段或方式为本领域技术人员所熟知,在此不再赘述。
作为一个示例,在通过软件或固件实现的情况下,可以从存储介质或网络向具有专用硬件结构的计算机(例如图13所示的通用计算机1300)安装构成该软件的程序,该计算机在安装有各种程序时,能够执行各种功能等。
在上面对本发明具体实施例的描述中,针对一种实施方式描述和/或示出的特征可以以相同或类似的方式在一个或更多个其他实施方式中使用,与其他实施方式中的特征相组合,或替代其他实施方式中的特征。
应该强调,术语“包括/包含”在本文使用时指特征、要素、步骤或组件的存在,但并不排除一个或更多个其他特征、要素、步骤或组件的存在或附加。
此外,本发明的方法不限于按照说明书中描述的时间顺序来执行,也可以按照其他的时间顺序地、并行地或独立地执行。因此,本说明书中描述的方法的执行顺序不对本发明的技术范围构成限制。
本发明及其优点,但是应当理解在不超出由所附的权利要求所限定的本发明的精神和范围的情况下可以进行各种改变、替代和变换。而且,本发明的范围不仅限于说明书所描述的过程、设备、手段、方法和步骤的具体实施例。本领域内的普通技术人员从本发明的公开内容将容易理解,根据本发明可以使用执行与在此的相应实施例基本相同的功能或者获得与其基本相同的结果的、现有和将来要被开发的过程、设备、手段、方法或者步骤。因此,所附的权利要求旨在在它们的范围内包括这样的过程、设备、手段、方法或者步骤。
应该强调,术语“包括/包含”在本文使用时指特征、要素、步骤或组件的存在,但并不排除一个或更多个其它特征、要素、步骤或组件的存在或附加。
本发明及其优点,但是应当理解在不超出由所附的权利要求所限定的本发明的精神和范围的情况下可以进行各种改变、替代和变换。而且,本发明的范围不仅限于说明书所描述的过程、设备、手段、方法和步骤的具体实施例。本领域内的普通技术人员从本发明的公开内容将容易理解,根据本发明可以使用执行与在此的相应实施例基本相同的功能或者获得与其基本相同的结果的、现有和将来要被开发的过程、设备、手段、方法或者步骤。因此,所附的权利要求旨在在它们的范围内包括这样的过程、设备、手段、方法或者步骤。
附记
1.一种对扫描图像进行处理的方法,包括:
被遮挡区域提取步骤,提取所述扫描图像的边缘附近的空白处被遮挡物遮挡的区域,即被遮挡区域;以及
像素值修复步骤,根据贯穿所述被遮挡区域且与所述边缘平行的线段中的已知页边空白像素的像素值,通过线性模型来修复所述线段中的被遮挡区域像素的像素值。
2.根据附记1所述的方法,还包括:
根据贯穿所述被遮挡区域且与所述边缘平行的线段中的已知页边空白像素的噪声来估计所述线段中的被遮挡区域像素的噪声;以及
将估计出的噪声添加到所述线段中的被遮挡区域像素的像素值。
3.根据附记1所述的方法,其中,所述被遮挡区域提取步骤包括:
提供所述被遮挡区域中的一点;
估计围绕所述点的小窗口中的像素的中心像素值;
计算围绕所述点的大窗口中的各个像素的像素值与所述中心像素值之间的差异;以及
根据所述差异,通过二值化方法提取所述被遮挡区域。
4.根据附记3所述的方法,其中,在所述被遮挡区域提取步骤之前还包括:
自动提取所述被遮挡区域;
如果自动提取成功,则不执行所述被遮挡区域提取步骤;以及
如果自动提取不成功,则执行所述被遮挡区域提取步骤。
5.根据附记4所述的方法,其中,在所述被遮挡区域提取步骤之后还包括:
判断所述被遮挡区域提取是否成功;以及
如果提取不成功,则提供用户界面以使得所述被遮挡区域能够被手动提取。
6.根据附记1至5中任一项所述的方法,其中,所述遮挡物为手指。
7.根据附记1至5中任一项所述的方法,其中,所述像素值包括颜色值。
8.根据附记1至5中任一项所述的方法,其中,所述扫描图像具有平行错开的多个页面边缘。
9.一种对扫描图像进行处理的装置,包括:
被遮挡区域提取模块,被配置用于提取所述扫描图像的边缘附近的空白处被遮挡物遮挡的区域,即被遮挡区域;以及
像素值修复模块,被配置用于根据贯穿所述被遮挡区域且与所述边缘平行的线段中的已知页边空白像素的像素值,通过线性模型来修复所述线段中的被遮挡区域像素的像素值。
10.根据附记9所述的装置,还包括:
噪声估计模块,被配置用于根据贯穿所述被遮挡区域且与所述边缘平行的线段中的已知页边空白像素的噪声来估计所述线段中的被遮挡区域像素的噪声;以及
噪声添加模块,被配置用于将估计出的噪声添加到所述线段中的被遮挡区域像素的像素值。
11.根据附记9所述的装置,其中,所述被遮挡区域提取模块包括:
点提供子模块,被配置用于提供所述被遮挡区域中的一点;
中心像素值估计子模块,被配置用于估计围绕所述点的小窗口中的像素的中心像素值;
差异计算子模块,被配置用于计算围绕所述点的大窗口中的各个像素的像素值与所述中心像素值之间的差异;以及
提取子模块,被配置用于根据所述差异,通过二值化方法提取所述被遮挡区域。
12.根据附记11所述的装置,还包括:
自动提取模块,被配置用于自动提取所述被遮挡区域;
其中,如果所述自动提取模块成功地提取所述被遮挡区域,则所述被遮挡区域提取模块不执行所述被遮挡区域提取,如果所述自动提取模块未能成功地提取所述被遮挡区域,则所述被遮挡区域提取模块执行所述被遮挡区域提取。
13.根据附记12所述的装置,还包括:
判断模块,被配置用于判断所述被遮挡区域提取模块是否成功地提取了所述被遮挡区域;以及
用户界面,被配置用于在所述被遮挡区域提取模块未能成功地提取所述被遮挡区域的情况下,使得所述被遮挡区域能够被手动提取。
14.根据附记9至13中任一项所述的装置,其中,所述遮挡物为手指。
15.根据附记9至13中任一项所述的装置,其中,所述像素值包括颜色值。
16.根据附记9至13中任一项所述的装置,其中,所述扫描图像具有平行错开的多个页面边缘。

Claims (8)

1.一种对扫描图像进行处理的方法,包括:
被遮挡区域提取步骤,提取所述扫描图像的边缘附近的空白处被遮挡物遮挡的区域,即被遮挡区域;
像素值修复步骤,根据贯穿所述被遮挡区域且与所述边缘平行的线段中的已知页边空白像素的像素值,通过线性模型来修复所述线段中的被遮挡区域像素的像素值,
根据贯穿所述被遮挡区域且与所述边缘平行的线段中的已知页边空白像素的噪声来估计所述线段中的被遮挡区域像素的噪声;以及
将估计出的噪声添加到通过所述线性模型修复的所述线段中的被遮挡区域像素的像素值。
2.根据权利要求1所述的方法,其中,所述被遮挡区域提取步骤包括:
提供所述被遮挡区域中的一点;
估计围绕所述点的小窗口中的像素的中心像素值;
计算围绕所述点的大窗口中的各个像素的像素值与所述中心像素值之间的差异;以及
根据所述差异,通过二值化方法提取所述被遮挡区域。
3.根据权利要求2所述的方法,其中,在所述被遮挡区域提取步骤之前还包括:
自动提取所述被遮挡区域;
如果自动提取成功,则不执行所述被遮挡区域提取步骤;以及
如果自动提取不成功,则执行所述被遮挡区域提取步骤。
4.根据权利要求3所述的方法,其中,在所述被遮挡区域提取步骤之后还包括:
判断所述被遮挡区域提取是否成功;以及
如果提取不成功,则提供用户界面以使得所述被遮挡区域能够被手动提取。
5.一种对扫描图像进行处理的装置,包括:
被遮挡区域提取模块,被配置用于提取所述扫描图像的边缘附近的空白处被遮挡物遮挡的区域,即被遮挡区域;
像素值修复模块,被配置用于根据贯穿所述被遮挡区域且与所述边缘平行的线段中的已知页边空白像素的像素值,通过线性模型来修复所述线段中的被遮挡区域像素的像素值,
噪声估计模块,被配置用于根据贯穿所述被遮挡区域且与所述边缘平行的线段中的已知页边空白像素的噪声来估计所述线段中的被遮挡区域像素的噪声;以及
噪声添加模块,被配置用于将估计出的噪声添加到通过所述线性模型修复的所述线段中的被遮挡区域像素的像素值。
6.根据权利要求5所述的装置,其中,所述被遮挡区域提取模块包括:
点提供子模块,被配置用于提供所述被遮挡区域中的一点;
中心像素值估计子模块,被配置用于估计围绕所述点的小窗口中的像素的中心像素值;
差异计算子模块,被配置用于计算围绕所述点的大窗口中的各个像素的像素值与所述中心像素值之间的差异;以及
提取子模块,被配置用于根据所述差异,通过二值化方法提取所述被遮挡区域。
7.根据权利要求6所述的装置,还包括:
自动提取模块,被配置用于自动提取所述被遮挡区域;
其中,如果所述自动提取模块成功地提取所述被遮挡区域,则所述被遮挡区域提取模块不执行所述被遮挡区域提取,如果所述自动提取模块未能成功地提取所述被遮挡区域,则所述被遮挡区域提取模块执行所述被遮挡区域提取。
8.根据权利要求7所述的装置,还包括:
判断模块,被配置用于判断所述被遮挡区域提取模块是否成功地提取了所述被遮挡区域;以及
用户界面,被配置用于在所述被遮挡区域提取模块未能成功地提取所述被遮挡区域的情况下,使得所述被遮挡区域能够被手动提取。
CN201210111235.9A 2012-04-16 2012-04-16 对扫描图像进行处理的方法和装置 Expired - Fee Related CN103377462B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201210111235.9A CN103377462B (zh) 2012-04-16 2012-04-16 对扫描图像进行处理的方法和装置
JP2013085182A JP6098319B2 (ja) 2012-04-16 2013-04-15 走査画像の処理方法及び装置
US13/862,935 US9202260B2 (en) 2012-04-16 2013-04-15 Method and apparatus for processing scanned image

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210111235.9A CN103377462B (zh) 2012-04-16 2012-04-16 对扫描图像进行处理的方法和装置

Publications (2)

Publication Number Publication Date
CN103377462A CN103377462A (zh) 2013-10-30
CN103377462B true CN103377462B (zh) 2016-05-04

Family

ID=49325146

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210111235.9A Expired - Fee Related CN103377462B (zh) 2012-04-16 2012-04-16 对扫描图像进行处理的方法和装置

Country Status (3)

Country Link
US (1) US9202260B2 (zh)
JP (1) JP6098319B2 (zh)
CN (1) CN103377462B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103971361B (zh) * 2013-02-06 2017-05-10 富士通株式会社 图像处理装置和方法
JP6120989B2 (ja) * 2013-12-09 2017-04-26 株式会社Pfu オーバーヘッド型画像読取装置、画像処理方法、および、プログラム
US9760978B1 (en) * 2016-05-09 2017-09-12 Adobe Systems Incorporated Missing region prediction
US9911201B2 (en) 2016-06-23 2018-03-06 Adobe Systems Incorporated Imaging process initialization techniques
CN106204536A (zh) * 2016-06-24 2016-12-07 浙江大学 一种基于邻域搜索的监控图像标记信息消除方法
CN107085850B (zh) * 2017-03-24 2019-10-01 大连成者科技有限公司 遮蔽采集图像中异物的标记体、识别图像中异物标记体的方法以及书籍扫描方法
JP7098601B2 (ja) * 2017-03-31 2022-07-11 ソニーセミコンダクタソリューションズ株式会社 画像処理装置、撮像装置、画像処理方法、およびプログラム
CN109064958A (zh) * 2018-08-24 2018-12-21 上海易密值半导体技术有限公司 基于GPU的color demura***
CN111079494B (zh) * 2019-06-09 2023-08-25 广东小天才科技有限公司 一种学习内容推送方法及电子设备
CN110519515B (zh) * 2019-08-28 2021-03-19 联想(北京)有限公司 一种信息处理方法及电子设备
WO2022081127A1 (en) * 2020-10-12 2022-04-21 Hewlett-Packard Development Company, L.P. Document language prediction
US20240029213A1 (en) * 2020-10-12 2024-01-25 Hewlett-Packard Development Company, L.P. Document-occluding artifact removal

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6233363B1 (en) * 1997-09-26 2001-05-15 Minolta Co., Ltd. Image reading apparatus for a document placed face up having a function of erasing finger area images
CN101777178A (zh) * 2010-01-28 2010-07-14 南京大学 一种图像修复方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5377019A (en) * 1991-12-02 1994-12-27 Minolta Co., Ltd. Document reading apparatus having a function of determining effective document region based on a detected data
US5677776A (en) * 1994-09-29 1997-10-14 Minolta Co., Ltd. Image reader for processing an image of a document
JPH09212626A (ja) * 1996-02-01 1997-08-15 Hitachi Ltd 画像編集方法および編集装置
JPH10336439A (ja) * 1997-05-28 1998-12-18 Minolta Co Ltd 画像読取り装置
US7143434B1 (en) * 1998-11-06 2006-11-28 Seungyup Paek Video description system and method
JP2002209082A (ja) * 2001-01-12 2002-07-26 Minolta Co Ltd 画像処理装置、画像処理方法、画像処理プログラムおよび画像処理プログラムを記録したコンピュータ読取可能な記録媒体
JP2006119817A (ja) * 2004-10-20 2006-05-11 Fuji Photo Film Co Ltd 画像処理装置
US20100082365A1 (en) * 2008-10-01 2010-04-01 Mckesson Financial Holdings Limited Navigation and Visualization of Multi-Dimensional Image Data

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6233363B1 (en) * 1997-09-26 2001-05-15 Minolta Co., Ltd. Image reading apparatus for a document placed face up having a function of erasing finger area images
CN101777178A (zh) * 2010-01-28 2010-07-14 南京大学 一种图像修复方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
新颖的图像修复算法研究;周春霞;《中国优秀硕士学位论文全文数据库》;20090315(第3期);第3.1节,公式(3.1) *

Also Published As

Publication number Publication date
JP6098319B2 (ja) 2017-03-22
US20130272602A1 (en) 2013-10-17
JP2013222466A (ja) 2013-10-28
CN103377462A (zh) 2013-10-30
US9202260B2 (en) 2015-12-01

Similar Documents

Publication Publication Date Title
CN103377462B (zh) 对扫描图像进行处理的方法和装置
CN101453575B (zh) 一种视频字幕信息提取方法
CN103632361B (zh) 一种图像分割方法和***
CN103578085B (zh) 基于可变块的图像空洞区域修补方法
CN103186894B (zh) 一种自适应分块的多聚焦图像融合方法
CN107085726A (zh) 基于多方法去噪和连通区域分析的甲骨拓片单字定位方法
CN110334709B (zh) 基于端到端多任务深度学习的车牌检测方法
JP6612486B1 (ja) 学習装置、分類装置、学習方法、分類方法、学習プログラム、及び分類プログラム
CN105719243A (zh) 图像处理装置和方法
KR102600475B1 (ko) 제품 결함 검출 학습을 위한 딥러닝 기반 데이터 증강 방법
CN106326895A (zh) 图像处理装置和图像处理方法
CN110689000A (zh) 一种基于生成复杂环境下车牌样本的车辆车牌识别方法
CN103955906A (zh) 基于蝙蝠算法的Criminisi图像修复方法
CN115131797A (zh) 一种基于特征增强金字塔网络的场景文本检测方法
CN115170479A (zh) 一种沥青路面修补病害自动提取方法
CN103236056B (zh) 基于模板匹配的图像分割方法
CN114913321A (zh) 基于局部到全局知识迁移的物体注意力挖掘方法及***
CN114359269A (zh) 基于神经网络的虚拟食品盒缺陷生成方法及***
CN110246139A (zh) 基于双阈值的浮游生物原位图像roi快速提取方法
CN105957027A (zh) 一种基于所需方向结构特征统计的mrf样图像修复方法
Park et al. A method for automatically translating print books into electronic Braille books
CN105335953A (zh) 提取图像的背景亮度图的装置和方法、去阴影装置和方法
CN103927533A (zh) 一种针对早期专利文档扫描件中图文信息的智能处理方法
CN106056575A (zh) 一种基于似物性推荐算法的图像匹配方法
CN114419078B (zh) 基于卷积神经网络的表面缺陷区域分割方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160504

Termination date: 20210416