CN110390642A

CN110390642A - 一种对木刻版藏文图像几何校正的方法

Info

Publication number: CN110390642A
Application number: CN201810358858.3A
Authority: CN
Inventors: 胡建; 殷锋
Original assignee: Southwest Minzu University
Current assignee: Southwest Minzu University
Priority date: 2018-04-20
Filing date: 2018-04-20
Publication date: 2019-10-29
Anticipated expiration: 2038-04-20
Also published as: CN110390642B

Abstract

一种对木刻版藏文图像几何校正的方法。信息化时代下产生了大量木刻版藏文文档图像，对其几何校正是文档分析和字符识别的基础，然而传统的几何校正方法对此存在困难。对此，本发明根据形变特点，采取了把长化短、把复杂化简单的思路，提出了木刻板藏文文档图像几何校正的分段策略，把图像在长边方向上分割成若干子图像，并对各子图像采用射影变换进行校正。采用本发明方法，解决了木刻板藏文图像所存在的无规则弯曲使得已有的以检测倾斜角为主要思想的投影法、Hough变换法、Fourier变换法和近邻法等无法适合，以及各页形变的复杂性和页面间的差异性使得已有的以数学建模为主要思想的校正方法很难为力的问题，提高了木刻板藏文文档图像几何校正的效果。

Description

一种对木刻版藏文图像几何校正的方法

技术领域

本发明属于图像处理领域，特别涉及文档图像校正。

背景技术

针对图像的几何形变问题，研究者们提出了较多的校正方法。可以把这些方法归类为刚性形变校正方法和非刚性形变校正方法。第一类方法认为图像只存在方向改变，通过求解倾斜角，把图像进行旋转即可校正，这类方法包括投影法、Hough变换法、Fourier变换法和近邻法等。第二类方法认为图像存在几何畸变，通过构建变形图像与未变形图像之间的空间函数模型，把变形图像各像素位置映射到不变形空间，如：文献（Haneishi H,Yagihashi Y, Miyake Y. A New Method for Distortion Correction of ElectronicEndoscope Images. IEEE Transactions on Medical Imaging, 1995, 14(3):548-555）处理电子内窥镜图像桶形畸变时，采用栅格状的校正样板,通过考察栅格节点位置的变化确定畸变图像与理想图像间的关系,据此实现图像的畸变校正；文献（Ai S, Wang X, MaM, et al. A method for Correcting Non-linear Geometric Distortion in Ultra-wide-angle Imaging System. Optik - International Journal for Light andElectron Optics, 2013, 124(24):7014-7021）在处理大倾角超广角***获得的全景视场图像的非线性几何畸变时，利用平面网格模板图像中心点、共线点的交比不变性和获得的失真参数对径向畸变进行校正，采用透视变换法对透视畸变进行校正。

在第一类方法中，原理相对简单，但只有当全幅图像具有相同的旋转支点和旋转角度时才非常有效。木刻版藏文文档图像呈长条形，其形状不是只有方向的改变，而是存在着几何畸变，因此不适合采用第一类方法。在第二类方法中，校正精度直接依赖于数学模型的精确程度，然而藏文文档图像由于形变复杂，且各页具有不同形变，存在建模困难的缺陷。

发明内容

针对上述问题，本发明根据木刻版藏文文档图像形变的特点，采取了把长化短、把复杂化简单的思路，提出了木刻板藏文文档图像几何校正的分段方法，在长边方向上把图像分割成若干子图像，并对各子图像采用射影变换分别进行校正。

本发明的技术方案为：

步骤1：获取上下版框上的候选点。用垂直竖线把图像按设定数量分为若干子图像，在各子图像中，设置一个具有一定高度的、与该子图像同宽的观察窗，使观察窗的底边从各子图像的中间行逐行往上移动并统计窗口中背景像素的比例，该比例一旦高于所设定的门限，就判定此时观察窗上边所在行和观察窗中心所在列为上版框线上候选点所在位置。对所有子图像进行这样处理后，可以获得上版框线上所有候选点。同理，可以判定下版框线上所有候选点。

步骤2：对上下版框上的候选点进行筛选。一种可优选的方法是，在上版框线上，计算所有候选点的纵坐标的最大值和最小值，把低于该最大值和最小值的均值的候选点去除；在下版框线上，计算所有候选点的纵坐标的最大值和最小值，把高于该最大值和最小值均值的候选点去除。

步骤3：补齐上下版框线上的点。因为观察窗中背景像素的比例可能未达到设定门限和一些候选点被去除，所以，所获得的上（下）版框线上的点不一定有下（上）版框线上的点与之对应，这就需要补充上下版框线上的点。对此，一种可优选的方法是采用线性插值方法对缺失点进行补充。

步骤4：基于上下版框线上的点进行分段。以相邻2对点各自连线为左右界把原图像分段成若干子图像，其中两端最边沿的子图像还包含最边沿那对点的外侧图像。

步骤5：计算各子图像的射影变换矩阵。射影变换矩阵的计算需要变换前的4个点和变换后的4个点的位置，在本发明中用来计算射影变换矩阵的点确定如下：在各子图像中，用来分割图像的这2对点是计算射影变换矩阵所需的校正前的4个点；这4个点在校正后的位置，在横坐标上，与校正前的对应点相同，在纵坐标上，一种可优选的方法是，上（下）版框线上点在校正后均与上（下）版框线上校正前的第round(Num/2)个点相同，其中round(.)表示四舍五入取整数，Num表示上（下）版框线上的所获取的点数。

步骤6：基于步骤5的矩阵，对各子图像采用射影变换进行几何校正。

步骤7：计算几何校正后图像上各点位置的像素值。

本发明具有如下技术效果或优点：本发明解决了木刻板藏文图像所存在的无规则弯曲使得已有的以检测倾斜角为主要思想的投影法、Hough变换法、Fourier变换法和近邻法等无法适合，以及各页形变的复杂性和页面间的差异性使得已有的以数学建模为主要思想的校正方法很难为力的问题，提高了木刻板藏文文档图像几何校正的效果。

附图说明

图1是《菩提道次第广论》塔尔寺木刻版第5卷第60页，图2是《菩提道次第广论》塔尔寺木刻版第16卷第2页，图3是上版框线上候选点的获取之观察窗向上逐行移动示意图，图4是上版框线上候选点的获取中确定候选点示意图，图5是对上下版框上的候选点进行筛选示意图，图6是部分点需要补充的示意图，图7是分段及计算射影变换矩阵所需点的位置示意图，图8是对木刻版藏文文档图像示例一采用Hough变换法的校正结果（其中虚线矩形框为参照用），图9是对木刻版藏文文档图像示例一采用Fourier变换法的校正结果（其中虚线矩形框为参照用），图10是对木刻版藏文文档图像示例一采用本发明方法的校正结果（其中虚线矩形框为参照用），图11是对木刻版藏文文档图像示例二采用Hough变换法的校正结果（其中虚线矩形框为参照用），图12是对木刻版藏文文档图像示例二采用Fourier变换法的校正结果（其中虚线矩形框为参照用），图13是对木刻版藏文文档图像示例二采用本发明方法的校正结果（其中虚线矩形框为参照用）。

具体实施方式

下面结合具体实施例来描述本发明。

以宗喀巴大师所作的《菩提道次第广论》塔尔寺木刻版的某两页图像为例展示形变的多样性：在图1中，在倾斜形变的基础上，长边方向上左端略窄且下垂，右端略宽且上翘；在图2中，在长、短边方向上，均有形变，尤以长边为甚，在长边方向上，主要呈折弯状。这些也是木刻板藏文文献常有的现象。对此，采用本发明方法的校正过程如下：

步骤1：获取上下版框上的候选点。用垂直竖线把图像均分为10个子图像，在各子图像中，设置一个具有一定高度的、与该子图像同宽的观察窗，观察窗高为子图像高的0.1倍，使观察窗的底边从各子图像的中间行逐行往上移动并统计窗口中背景像素的比例，该比例一旦高于0.99，就判定此时观察窗上边所在行和观察窗中心所在列为上版框线上候选点所在位置，如图3和图4所示，其中黑色矩形框为观察框。对所有子图像进行这样处理后，可以获得上版框线上所有候选点。同理，可以判定下版框线上所有候选点。

步骤2：对上下版框上的候选点进行筛选。在上版框线上，计算所有候选点的纵坐标的最大值和最小值，把低于该最大值和最小值的均值的候选点去除；在下版框线上，计算所有候选点的纵坐标的最大值和最小值，把高于该最大值和最小值均值的候选点去除。在图5中，实心的圆圈和三角形分别表示步骤1所获取到的上下版框线上的点，空心圆圈和三角形分别表示在过程中上下版框线上被去除的一些候选点，这些被去除的候选点位于上、下版框线上的最左端和最右端，以及上版框线的从左往右数的第7个候选点位置，它们被去除是因为所在的观察窗内含有左右版框线外侧的大量背景像素或版框线内过大的留白区。

步骤3：补齐上下版框线上的点。因为观察窗中背景像素的比例可能未达到设定门限和一些候选点被去除，所以，在同一子图像中，上一节所获得的上（下）版框线上的点不一定有下（上）版框线上的点与之对应，这会对步骤5中计算射影变换矩阵所需的点之间的位置关系造成影响，如图6所示，点D和E分别缺失点C和F与之对应，在图6中实心圆圈和空心圆圈分别表示版框线上已经选取的点和待补齐的点。本实施例采用线性插值方法对缺失点进行补充。在图6所示例中，点C和F的位置分别根据A和E、B和D采用线性插值来确定，记A、B、D和E的位置分别为、、和，则点C和F的位置分别为和。至此，所获取的上下版框线上的点均成对出现，每对点位于相同的列。

步骤4：基于上下版框线上的点进行分段。以相邻2对点各自连线为左右界把原图像分段成若干子图像，其中两端最边沿的子图像还包含最边沿那对点的外侧图像。如图6所示，点A和B、点C和D、点E和F各是一对点，相邻的线AB与CD之间、线CD与EF之间各为一子图像，后者由于是最边沿的子图像，所以还包括线EF右侧的图像，最终形成如图7所示的图像分段结果，其中每两相邻竖直虚线之间为一子图像。

步骤5：计算各子图像的射影变换矩阵。其中，用来计算射影变换矩阵的点确定如下：在各子图像中，用来分割图像的这2对点是计算射影变换矩阵所需的校正前的4个点；这4个点在校正后的位置，在横坐标上，与校正前的对应点相同，在纵坐标上，上（下）版框线上点在校正后均与上（下）版框线上校正前的第round(Num/2)个点相同，其中round(.)表示四舍五入取整数，Num表示上（下）版框线上的所获取的点数。如图7所示，黑色圆点为校正前的点，黑色矩形点为校正后的点，其中：在横坐标上，点A’、B’、C’、D’、E’和F’分别与点A、B、C、D、E、F相同；在纵坐标上，点A’、C’、和E’与上版框上校正前的第round(Num/2)个点相同，点B’、D’、和F’与上版框上校正前的第round(Num/2)个点相同。

步骤7：采用双线性插值获得几何校正后图像上各点位置的像素值。

图8-图13显示了采用本发明方法与传统Hough变换法、Fourier变换法校正后的对比结果，其中虚线为水平放置的矩形框，通过观察其与版框线的距离变化可以判断几何校正效果，距离变化越均匀说明校正效果越好。通过对比，可见本发明方法效果最优，这是因为其采用了分段策略，使用射影变换对各子图像进行校正且能实现无缝拼接，相对地，已有的Hough变换法与Fourier变换法采用整体倾斜校正，其缺点是“按下了这头，却翘起了那头”。

在时间复杂度方面，在藏传佛教资源中心（Tibetan Buddhist Resource Center）网站上的宗喀巴大师所作的《菩提道次第广论（塔尔寺木刻版）》的全部图像（共19卷，共17198页）上进行了统计测试，结果表明了本发明虽然把图像进行分段处理，在分段过程中耗费了时间资源，但仍然较传统的Hough变换法、Fourier变换法在时间复杂度方面具有优势。

以上对本发明的一个实施例进行了详细说明，但所述内容仅为本发明的较佳实施例，不能被认为用于限定本发明的实施范围。凡依本发明申请范围所作的均等变化与改进等，均应仍归属于本发明的专利涵盖范围之内。

Claims

1.一种对木刻版藏文图像几何校正的方法，其特征在于采用如下步骤：

步骤1，获取上下版框上的候选点：用垂直竖线把图像按设定数量分为若干子图像，在各子图像中，设置一个具有一定高度的、与该子图像同宽的观察窗，使观察窗的底边从各子图像的中间行逐行往上移动并统计窗口中背景像素的比例，该比例一旦高于所设定的门限，就判定此时观察窗上边所在行和观察窗中心所在列为上版框线上候选点所在位置，对所有子图像进行这样处理后，获得上版框线上所有候选点；同理，判定下版框线上所有候选点；

步骤2，对上下版框上的候选点进行筛选；

步骤3，补齐上下版框线上的点；

步骤4，基于上下版框线上的点进行分段：以相邻2对点各自连线为左右界把原图像分段成若干子图像，其中两端的子图像还包含最边沿那对点的外侧图像；

步骤5，计算各子图像的射影变换矩阵，其中，用来计算射影变换矩阵的点确定如下：在各子图像中，用来分割图像的这2对点是计算射影变换矩阵所需的校正前的4个点；这4个点在校正后的位置，在横坐标上，与校正前的对应点相同；

步骤6，基于步骤5的矩阵，对各子图像采用射影变换进行几何校正；

步骤7，计算几何校正后图像上各点位置的像素值。

2.如权利要求1所述的一种对木刻版藏文图像几何校正的方法，其特征在于：

所述步骤2中，在上版框线上，计算所有候选点的纵坐标的最大值和最小值，把低于该最大值和最小值的均值的候选点去除；在下版框线上，计算所有候选点的纵坐标的最大值和最小值，把高于该最大值和最小值均值的候选点去除；

所述步骤3中，采用线性插值方法对缺失点进行补充；

所述步骤5中，所述4个点在校正后的位置，在纵坐标上，上（下）版框线上点在校正后均与上（下）版框线上校正前的第round(Num/2)个点相同，其中round(.)表示四舍五入取整数，Num表示上（下）版框线上的所获取的点数。