CN110390642A - 一种对木刻版藏文图像几何校正的方法 - Google Patents

一种对木刻版藏文图像几何校正的方法 Download PDF

Info

Publication number
CN110390642A
CN110390642A CN201810358858.3A CN201810358858A CN110390642A CN 110390642 A CN110390642 A CN 110390642A CN 201810358858 A CN201810358858 A CN 201810358858A CN 110390642 A CN110390642 A CN 110390642A
Authority
CN
China
Prior art keywords
point
line
points
woodcut
chase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810358858.3A
Other languages
English (en)
Other versions
CN110390642B (zh
Inventor
胡建
殷锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southwest Minzu University
Original Assignee
Southwest Minzu University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southwest Minzu University filed Critical Southwest Minzu University
Priority to CN201810358858.3A priority Critical patent/CN110390642B/zh
Publication of CN110390642A publication Critical patent/CN110390642A/zh
Application granted granted Critical
Publication of CN110390642B publication Critical patent/CN110390642B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/80Geometric correction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20092Interactive image processing based on input by user
    • G06T2207/20104Interactive definition of region of interest [ROI]

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)

Abstract

一种对木刻版藏文图像几何校正的方法。信息化时代下产生了大量木刻版藏文文档图像,对其几何校正是文档分析和字符识别的基础,然而传统的几何校正方法对此存在困难。对此,本发明根据形变特点,采取了把长化短、把复杂化简单的思路,提出了木刻板藏文文档图像几何校正的分段策略,把图像在长边方向上分割成若干子图像,并对各子图像采用射影变换进行校正。采用本发明方法,解决了木刻板藏文图像所存在的无规则弯曲使得已有的以检测倾斜角为主要思想的投影法、Hough变换法、Fourier变换法和近邻法等无法适合,以及各页形变的复杂性和页面间的差异性使得已有的以数学建模为主要思想的校正方法很难为力的问题,提高了木刻板藏文文档图像几何校正的效果。

Description

一种对木刻版藏文图像几何校正的方法
技术领域
本发明属于图像处理领域,特别涉及文档图像校正。
背景技术
针对图像的几何形变问题,研究者们提出了较多的校正方法。可以把这些方法归类为刚性形变校正方法和非刚性形变校正方法。第一类方法认为图像只存在方向改变,通过求解倾斜角,把图像进行旋转即可校正,这类方法包括投影法、Hough变换法、Fourier变换法和近邻法等。第二类方法认为图像存在几何畸变,通过构建变形图像与未变形图像之间的空间函数模型,把变形图像各像素位置映射到不变形空间,如:文献(Haneishi H,Yagihashi Y, Miyake Y. A New Method for Distortion Correction of ElectronicEndoscope Images. IEEE Transactions on Medical Imaging, 1995, 14(3):548-555)处理电子内窥镜图像桶形畸变时,采用栅格状的校正样板,通过考察栅格节点位置的变化确定畸变图像与理想图像间的关系,据此实现图像的畸变校正;文献(Ai S, Wang X, MaM, et al. A method for Correcting Non-linear Geometric Distortion in Ultra-wide-angle Imaging System. Optik - International Journal for Light andElectron Optics, 2013, 124(24):7014-7021)在处理大倾角超广角***获得的全景视场图像的非线性几何畸变时,利用平面网格模板图像中心点、共线点的交比不变性和获得的失真参数对径向畸变进行校正,采用透视变换法对透视畸变进行校正。
在第一类方法中,原理相对简单,但只有当全幅图像具有相同的旋转支点和旋转角度时才非常有效。木刻版藏文文档图像呈长条形,其形状不是只有方向的改变,而是存在着几何畸变,因此不适合采用第一类方法。在第二类方法中,校正精度直接依赖于数学模型的精确程度,然而藏文文档图像由于形变复杂,且各页具有不同形变,存在建模困难的缺陷。
发明内容
针对上述问题,本发明根据木刻版藏文文档图像形变的特点,采取了把长化短、把复杂化简单的思路,提出了木刻板藏文文档图像几何校正的分段方法,在长边方向上把图像分割成若干子图像,并对各子图像采用射影变换分别进行校正。
本发明的技术方案为:
步骤1:获取上下版框上的候选点。用垂直竖线把图像按设定数量分为若干子图像,在各子图像中,设置一个具有一定高度的、与该子图像同宽的观察窗,使观察窗的底边从各子图像的中间行逐行往上移动并统计窗口中背景像素的比例,该比例一旦高于所设定的门限,就判定此时观察窗上边所在行和观察窗中心所在列为上版框线上候选点所在位置。对所有子图像进行这样处理后,可以获得上版框线上所有候选点。同理,可以判定下版框线上所有候选点。
步骤2:对上下版框上的候选点进行筛选。一种可优选的方法是,在上版框线上,计算所有候选点的纵坐标的最大值和最小值,把低于该最大值和最小值的均值的候选点去除;在下版框线上,计算所有候选点的纵坐标的最大值和最小值,把高于该最大值和最小值均值的候选点去除。
步骤3:补齐上下版框线上的点。因为观察窗中背景像素的比例可能未达到设定门限和一些候选点被去除,所以,所获得的上(下)版框线上的点不一定有下(上)版框线上的点与之对应,这就需要补充上下版框线上的点。对此,一种可优选的方法是采用线性插值方法对缺失点进行补充。
步骤4:基于上下版框线上的点进行分段。以相邻2对点各自连线为左右界把原图像分段成若干子图像,其中两端最边沿的子图像还包含最边沿那对点的外侧图像。
步骤5:计算各子图像的射影变换矩阵。射影变换矩阵的计算需要变换前的4个点和变换后的4个点的位置,在本发明中用来计算射影变换矩阵的点确定如下:在各子图像中,用来分割图像的这2对点是计算射影变换矩阵所需的校正前的4个点;这4个点在校正后的位置,在横坐标上,与校正前的对应点相同,在纵坐标上,一种可优选的方法是,上(下)版框线上点在校正后均与上(下)版框线上校正前的第round(Num/2)个点相同,其中round(.)表示四舍五入取整数,Num表示上(下)版框线上的所获取的点数。
步骤6:基于步骤5的矩阵,对各子图像采用射影变换进行几何校正。
步骤7:计算几何校正后图像上各点位置的像素值。
本发明具有如下技术效果或优点:本发明解决了木刻板藏文图像所存在的无规则弯曲使得已有的以检测倾斜角为主要思想的投影法、Hough变换法、Fourier变换法和近邻法等无法适合,以及各页形变的复杂性和页面间的差异性使得已有的以数学建模为主要思想的校正方法很难为力的问题,提高了木刻板藏文文档图像几何校正的效果。
附图说明
图1是《菩提道次第广论》塔尔寺木刻版第5卷第60页,图2是《菩提道次第广论》塔尔寺木刻版第16卷第2页,图3是上版框线上候选点的获取之观察窗向上逐行移动示意图,图4是上版框线上候选点的获取中确定候选点示意图,图5是对上下版框上的候选点进行筛选示意图,图6是部分点需要补充的示意图,图7是分段及计算射影变换矩阵所需点的位置示意图,图8是对木刻版藏文文档图像示例一采用Hough变换法的校正结果(其中虚线矩形框为参照用),图9是对木刻版藏文文档图像示例一采用Fourier变换法的校正结果(其中虚线矩形框为参照用),图10是对木刻版藏文文档图像示例一采用本发明方法的校正结果(其中虚线矩形框为参照用),图11是对木刻版藏文文档图像示例二采用Hough变换法的校正结果(其中虚线矩形框为参照用),图12是对木刻版藏文文档图像示例二采用Fourier变换法的校正结果(其中虚线矩形框为参照用),图13是对木刻版藏文文档图像示例二采用本发明方法的校正结果(其中虚线矩形框为参照用)。
具体实施方式
下面结合具体实施例来描述本发明。
以宗喀巴大师所作的《菩提道次第广论》塔尔寺木刻版的某两页图像为例展示形变的多样性:在图1中,在倾斜形变的基础上,长边方向上左端略窄且下垂,右端略宽且上翘;在图2中,在长、短边方向上,均有形变,尤以长边为甚,在长边方向上,主要呈折弯状。这些也是木刻板藏文文献常有的现象。对此,采用本发明方法的校正过程如下:
步骤1:获取上下版框上的候选点。用垂直竖线把图像均分为10个子图像,在各子图像中,设置一个具有一定高度的、与该子图像同宽的观察窗,观察窗高为子图像高的0.1倍,使观察窗的底边从各子图像的中间行逐行往上移动并统计窗口中背景像素的比例,该比例一旦高于0.99,就判定此时观察窗上边所在行和观察窗中心所在列为上版框线上候选点所在位置,如图3和图4所示,其中黑色矩形框为观察框。对所有子图像进行这样处理后,可以获得上版框线上所有候选点。同理,可以判定下版框线上所有候选点。
步骤2:对上下版框上的候选点进行筛选。在上版框线上,计算所有候选点的纵坐标的最大值和最小值,把低于该最大值和最小值的均值的候选点去除;在下版框线上,计算所有候选点的纵坐标的最大值和最小值,把高于该最大值和最小值均值的候选点去除。在图5中,实心的圆圈和三角形分别表示步骤1所获取到的上下版框线上的点,空心圆圈和三角形分别表示在过程中上下版框线上被去除的一些候选点,这些被去除的候选点位于上、下版框线上的最左端和最右端,以及上版框线的从左往右数的第7个候选点位置,它们被去除是因为所在的观察窗内含有左右版框线外侧的大量背景像素或版框线内过大的留白区。
步骤3:补齐上下版框线上的点。因为观察窗中背景像素的比例可能未达到设定门限和一些候选点被去除,所以,在同一子图像中,上一节所获得的上(下)版框线上的点不一定有下(上)版框线上的点与之对应,这会对步骤5中计算射影变换矩阵所需的点之间的位置关系造成影响,如图6所示,点DE分别缺失点CF与之对应,在图6中实心圆圈和空心圆圈分别表示版框线上已经选取的点和待补齐的点。本实施例采用线性插值方法对缺失点进行补充。在图6所示例中,点CF的位置分别根据AEBD采用线性插值来确定,记ABDE的位置分别为,则点CF的位置分别为。至此,所获取的上下版框线上的点均成对出现,每对点位于相同的列。
步骤4:基于上下版框线上的点进行分段。以相邻2对点各自连线为左右界把原图像分段成若干子图像,其中两端最边沿的子图像还包含最边沿那对点的外侧图像。如图6所示,点AB、点CD、点EF各是一对点,相邻的线ABCD之间、线CDEF之间各为一子图像,后者由于是最边沿的子图像,所以还包括线EF右侧的图像,最终形成如图7所示的图像分段结果,其中每两相邻竖直虚线之间为一子图像。
步骤5:计算各子图像的射影变换矩阵。其中,用来计算射影变换矩阵的点确定如下:在各子图像中,用来分割图像的这2对点是计算射影变换矩阵所需的校正前的4个点;这4个点在校正后的位置,在横坐标上,与校正前的对应点相同,在纵坐标上,上(下)版框线上点在校正后均与上(下)版框线上校正前的第round(Num/2)个点相同,其中round(.)表示四舍五入取整数,Num表示上(下)版框线上的所获取的点数。如图7所示,黑色圆点为校正前的点,黑色矩形点为校正后的点,其中:在横坐标上,点A’B’C’D’E’F’分别与点ABCDEF相同;在纵坐标上,点A’C’、和E’与上版框上校正前的第round(Num/2)个点相同,点B’D’、和F’与上版框上校正前的第round(Num/2)个点相同。
步骤6:基于步骤5的矩阵,对各子图像采用射影变换进行几何校正。
步骤7:采用双线性插值获得几何校正后图像上各点位置的像素值。
图8-图13显示了采用本发明方法与传统Hough变换法、Fourier变换法校正后的对比结果,其中虚线为水平放置的矩形框,通过观察其与版框线的距离变化可以判断几何校正效果,距离变化越均匀说明校正效果越好。通过对比,可见本发明方法效果最优,这是因为其采用了分段策略,使用射影变换对各子图像进行校正且能实现无缝拼接,相对地,已有的Hough变换法与Fourier变换法采用整体倾斜校正,其缺点是“按下了这头,却翘起了那头”。
在时间复杂度方面,在藏传佛教资源中心(Tibetan Buddhist Resource Center)网站上的宗喀巴大师所作的《菩提道次第广论(塔尔寺木刻版)》的全部图像(共19卷,共17198页)上进行了统计测试,结果表明了本发明虽然把图像进行分段处理,在分段过程中耗费了时间资源,但仍然较传统的Hough变换法、Fourier变换法在时间复杂度方面具有优势。
以上对本发明的一个实施例进行了详细说明,但所述内容仅为本发明的较佳实施例,不能被认为用于限定本发明的实施范围。凡依本发明申请范围所作的均等变化与改进等,均应仍归属于本发明的专利涵盖范围之内。

Claims (2)

1.一种对木刻版藏文图像几何校正的方法,其特征在于采用如下步骤:
步骤1,获取上下版框上的候选点:用垂直竖线把图像按设定数量分为若干子图像,在各子图像中,设置一个具有一定高度的、与该子图像同宽的观察窗,使观察窗的底边从各子图像的中间行逐行往上移动并统计窗口中背景像素的比例,该比例一旦高于所设定的门限,就判定此时观察窗上边所在行和观察窗中心所在列为上版框线上候选点所在位置,对所有子图像进行这样处理后,获得上版框线上所有候选点;同理,判定下版框线上所有候选点;
步骤2,对上下版框上的候选点进行筛选;
步骤3,补齐上下版框线上的点;
步骤4,基于上下版框线上的点进行分段:以相邻2对点各自连线为左右界把原图像分段成若干子图像,其中两端的子图像还包含最边沿那对点的外侧图像;
步骤5,计算各子图像的射影变换矩阵,其中,用来计算射影变换矩阵的点确定如下:在各子图像中,用来分割图像的这2对点是计算射影变换矩阵所需的校正前的4个点;这4个点在校正后的位置,在横坐标上,与校正前的对应点相同;
步骤6,基于步骤5的矩阵,对各子图像采用射影变换进行几何校正;
步骤7,计算几何校正后图像上各点位置的像素值。
2.如权利要求1所述的一种对木刻版藏文图像几何校正的方法,其特征在于:
所述步骤2中,在上版框线上,计算所有候选点的纵坐标的最大值和最小值,把低于该最大值和最小值的均值的候选点去除;在下版框线上,计算所有候选点的纵坐标的最大值和最小值,把高于该最大值和最小值均值的候选点去除;
所述步骤3中,采用线性插值方法对缺失点进行补充;
所述步骤5中,所述4个点在校正后的位置,在纵坐标上,上(下)版框线上点在校正后均与上(下)版框线上校正前的第round(Num/2)个点相同,其中round(.)表示四舍五入取整数,Num表示上(下)版框线上的所获取的点数。
CN201810358858.3A 2018-04-20 2018-04-20 一种对木刻版藏文图像几何校正的方法 Active CN110390642B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810358858.3A CN110390642B (zh) 2018-04-20 2018-04-20 一种对木刻版藏文图像几何校正的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810358858.3A CN110390642B (zh) 2018-04-20 2018-04-20 一种对木刻版藏文图像几何校正的方法

Publications (2)

Publication Number Publication Date
CN110390642A true CN110390642A (zh) 2019-10-29
CN110390642B CN110390642B (zh) 2023-12-08

Family

ID=68283666

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810358858.3A Active CN110390642B (zh) 2018-04-20 2018-04-20 一种对木刻版藏文图像几何校正的方法

Country Status (1)

Country Link
CN (1) CN110390642B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111223065A (zh) * 2020-01-13 2020-06-02 中国科学院重庆绿色智能技术研究院 图像矫正方法、不规则文本识别方法、装置、存储介质和设备
CN111915524A (zh) * 2020-08-04 2020-11-10 深圳企业云科技股份有限公司 一种基于交比运算的全自动图像透视校正方法

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030007187A1 (en) * 2001-06-29 2003-01-09 Curry Douglas N. Systems and methods for generating binary clustered, irrational halftone dots
US20050179688A1 (en) * 2004-02-17 2005-08-18 Chernichenko Dmitry A. Method and apparatus for correction of perspective distortion
JP2005267457A (ja) * 2004-03-19 2005-09-29 Casio Comput Co Ltd 画像処理装置、撮影装置、画像処理方法及びプログラム
CN101398895A (zh) * 2007-09-26 2009-04-01 杨高波 一种数据矩阵(dm)二维条形码识别的图像预处理方法
CN101630360A (zh) * 2008-07-14 2010-01-20 上海分维智能科技有限公司 一种在高清晰图像中识别车牌的方法
JP2010171976A (ja) * 2009-01-22 2010-08-05 Canon Inc 歪み文書画像を補正する方法及びシステム
JP2011054068A (ja) * 2009-09-04 2011-03-17 Fuji Xerox Co Ltd 画像処理システム、画像処理装置、及びプログラム
JP2011059841A (ja) * 2009-09-08 2011-03-24 Nikon Corp 撮像装置
JP2011159300A (ja) * 2011-02-24 2011-08-18 Nintendo Co Ltd 画像処理プログラム、画像処理装置、画像処理システム、および画像処理方法
JP2012019474A (ja) * 2010-07-09 2012-01-26 Oki Data Corp 画像読取装置および画像補正プログラム
CN103413271A (zh) * 2013-07-18 2013-11-27 西安交通大学 基于局部信息的文档图像校正方法
CN104079907A (zh) * 2013-03-27 2014-10-01 精工爱普生株式会社 投影机、影像校正方法以及程序
US20150138610A1 (en) * 2013-11-20 2015-05-21 Fujitsu Limited Device and method for correcting document image and scanner

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030007187A1 (en) * 2001-06-29 2003-01-09 Curry Douglas N. Systems and methods for generating binary clustered, irrational halftone dots
US20050179688A1 (en) * 2004-02-17 2005-08-18 Chernichenko Dmitry A. Method and apparatus for correction of perspective distortion
JP2005267457A (ja) * 2004-03-19 2005-09-29 Casio Comput Co Ltd 画像処理装置、撮影装置、画像処理方法及びプログラム
CN101398895A (zh) * 2007-09-26 2009-04-01 杨高波 一种数据矩阵(dm)二维条形码识别的图像预处理方法
CN101630360A (zh) * 2008-07-14 2010-01-20 上海分维智能科技有限公司 一种在高清晰图像中识别车牌的方法
JP2010171976A (ja) * 2009-01-22 2010-08-05 Canon Inc 歪み文書画像を補正する方法及びシステム
JP2011054068A (ja) * 2009-09-04 2011-03-17 Fuji Xerox Co Ltd 画像処理システム、画像処理装置、及びプログラム
JP2011059841A (ja) * 2009-09-08 2011-03-24 Nikon Corp 撮像装置
JP2012019474A (ja) * 2010-07-09 2012-01-26 Oki Data Corp 画像読取装置および画像補正プログラム
JP2011159300A (ja) * 2011-02-24 2011-08-18 Nintendo Co Ltd 画像処理プログラム、画像処理装置、画像処理システム、および画像処理方法
CN104079907A (zh) * 2013-03-27 2014-10-01 精工爱普生株式会社 投影机、影像校正方法以及程序
CN103413271A (zh) * 2013-07-18 2013-11-27 西安交通大学 基于局部信息的文档图像校正方法
US20150138610A1 (en) * 2013-11-20 2015-05-21 Fujitsu Limited Device and method for correcting document image and scanner

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
段立娟 等: "Text extraction method for historical Tibetan document images based on block projections" *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111223065A (zh) * 2020-01-13 2020-06-02 中国科学院重庆绿色智能技术研究院 图像矫正方法、不规则文本识别方法、装置、存储介质和设备
CN111915524A (zh) * 2020-08-04 2020-11-10 深圳企业云科技股份有限公司 一种基于交比运算的全自动图像透视校正方法
WO2022027843A1 (zh) * 2020-08-04 2022-02-10 深圳企业云科技股份有限公司 一种基于交比运算的全自动图像透视校正方法
CN111915524B (zh) * 2020-08-04 2024-03-29 深圳企业云科技股份有限公司 一种基于交比运算的全自动图像透视校正方法

Also Published As

Publication number Publication date
CN110390642B (zh) 2023-12-08

Similar Documents

Publication Publication Date Title
CN113591795B (zh) 一种基于混合注意力特征金字塔结构的轻量化人脸检测方法和***
CN105261013B (zh) 一种扫描图像质量综合评价方法及评价***
CN115170669B (zh) 基于边缘特征点集配准的识别定位方法及***、存储介质
CN107993208A (zh) 一种基于稀疏重叠组先验约束的非局部全变分图像复原方法
CN110580481B (zh) 一种基于epi的光场图像关键位置检测方法
CN111353961B (zh) 一种文档曲面校正方法及装置
CN102024155A (zh) 基于边缘检测的多光谱图像快速匹配方法
CN103389310B (zh) 一种基于辐射标定的亚像素光学元件损伤在线检测方法
CN105095896A (zh) 一种基于查找表的图像畸变校正方法
CN112669280B (zh) 一种基于lsd算法的无人机倾斜航拍直角像控点目标检测方法
CN110490924B (zh) 一种基于多尺度Harris的光场图像特征点检测方法
CN110390642A (zh) 一种对木刻版藏文图像几何校正的方法
CN112801904A (zh) 一种基于卷积神经网络的混合退化图像增强方法
Zhang et al. GPU-accelerated large-size VHR images registration via coarse-to-fine matching
CN111182293B (zh) 一种镜头阴影校正数据的检测方法及***
CN111179184A (zh) 基于随机抽样一致性的鱼眼图像有效区域提取方法
CN112924037A (zh) 基于图像配准的红外体温检测***及检测方法
CN106920213B (zh) 一种高分辨率图像的获取方法及***
CN111325218B (zh) 基于光场图像的Hog特征检测与匹配方法
CN111368826B (zh) 一种基于可变卷积核的明火检测算法
CN110298347B (zh) 一种基于GrayWorld与PCA-CNN的汽车尾气分析仪屏幕的识别方法
CN112232102A (zh) 一种基于深度神经网络和多任务学习的建筑物目标识别方法和***
CN114001674B (zh) 一种自由视角下的线束弯曲半径机器视觉测量方法
CN113989823B (zh) 基于ocr坐标的图片表格还原方法及***
CN113793309B (zh) 一种基于形态学特征的亚像素级椭圆检测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant