CN112070684B - 基于形态先验特征的甲骨刻辞文字修复方法 - Google Patents

基于形态先验特征的甲骨刻辞文字修复方法 Download PDF

Info

Publication number
CN112070684B
CN112070684B CN202010775134.6A CN202010775134A CN112070684B CN 112070684 B CN112070684 B CN 112070684B CN 202010775134 A CN202010775134 A CN 202010775134A CN 112070684 B CN112070684 B CN 112070684B
Authority
CN
China
Prior art keywords
pixel
image
pixels
area
oracle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010775134.6A
Other languages
English (en)
Other versions
CN112070684A (zh
Inventor
宋传鸣
阎晓宇
洪飏
王相海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Liaoning Normal University
Original Assignee
Liaoning Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Liaoning Normal University filed Critical Liaoning Normal University
Priority to CN202010775134.6A priority Critical patent/CN112070684B/zh
Publication of CN112070684A publication Critical patent/CN112070684A/zh
Application granted granted Critical
Publication of CN112070684B publication Critical patent/CN112070684B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/77Retouching; Inpainting; Scratch removal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/13Edge detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/187Segmentation; Edge detection involving region growing; involving region merging; involving connected component labelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/194Segmentation; Edge detection involving foreground-background segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Processing (AREA)

Abstract

本发明公开一种基于形态先验特征的甲骨刻辞文字修复方法,首先,去除甲骨刻辞图像的点状噪声,得到初步降噪后的图像;其次,通过分析甲骨文字区域和噪声区域的面积分布特征,将那些小于面积均值的连通区域和长宽比小的连通区域判定为噪声并进行填充,从而去除甲骨刻辞图像的片状斑纹和固有纹理;最后,进行基于Sobel算子的边缘检测、基于4‑链码的轮廓跟踪以及基于边缘向量夹角的边缘像素段分析和拐点提取,对甲骨文字的凹凸边缘进行基于像素段平移的平滑修复,进而在尽量保持文字字形的同时,实现甲骨文字的边缘修复。

Description

基于形态先验特征的甲骨刻辞文字修复方法
技术领域
本发明涉及数字图像处理和古文字信息处理的交叉领域,尤其是一种可有效抵抗龟甲和兽骨上的点状噪声、片状斑纹和固有纹理的干扰,准确性高、鲁棒性好、处理速度快及具备自适应能力的基于形态先验特征的甲骨刻辞文字修复方法。
背景技术
甲骨文是商朝后期用龟甲、兽骨进行记事和占卜的文字。它作为我国迄今为止发现的年代最早的成熟文字***,具有极其重要的保护价值、研究价值以及崇高的象征意义。甲骨文不仅是我国语言、文化、历史可追溯的最早源头,是汉字的源头和中华优秀传统文化的根脉,是千年中华文明的标志,也印证了历史上一系列古文献的真实性,把有记载的中华文明史向前推进了近五个世纪。因此,甲骨文字考释成为古文字研究领域中最重要的内容之一,为研究中华源远流长的灿烂文明史和早期国家与人文社会形态,提供了独特而真实可信的第一手史料。
因为甲骨文字数量众多,年代久远,其结构不仅明显有别于现代文字,而且形体复杂、字形繁复、异体字众多,所以释读甲骨文要求研究者具有广博的知识基础和长期的专业训练,是一项极具挑战的任务。目前,仍存在大量甲骨文字未被准确释读,甚至有学者将其归之为“绝学”以内。随着计算机图像识别能力的提升,以计算机视觉技术为基础,结合甲骨文的专业知识,进行甲骨文字识别已成为可能。然而,一方面,经过三千余年的土壤压力和腐蚀,又经发掘、运输、辗转流传,很多甲骨均有不同程度的损坏,其文字多已模糊不清,另一方面,由于龟甲和兽骨的质地比较粗糙,本身又存在齿缝、兆纹、盾纹、刻痕等纹理,甲骨文字往往受到点状噪声、片状斑纹和固有纹理的强烈干扰,这就不可避免地导致甲骨拓片图像中的字迹经常出现断裂、毛刺、污迹以及与背景纹理的叠加,且文字边缘粗细不均,锯齿效应明显,有的地方向内凹陷,有的地方向外凸出。在这种情况下,欲想直接利用典型的文档分析和文字识别算法进行自动处理几乎是不可能的。因此,在龟甲或兽骨上自动定位到甲骨文字区域,并对其中的文字笔迹进行有效修复,对于提高后续的字形特征提取和自动识别的精度具有基础且重要的意义。
目前,典型的图像修复方法主要包括三类:基于偏微分方程的修复方法、基于稀疏表示的修复方法、基于纹理合成的修复方法。第一,基于偏微分方程的修复方法利用凸***的思想,将图像待修复区域周围的信息扩散至待修复区域。例如,Shen等人提出了一种整体变分算法;Chan等人提出了一种曲率驱动扩散算法等。该类方法适用于处理划痕等小尺度破损图像,但是对于大范围信息缺失的图像,其修复结果往往不尽人意。第二,基于稀疏表示的修复方法利用固定字典或者是字典学习的方法来修复图像的破损区域。由于自然图像本身具有稀疏性且稀疏表示能够有效刻画图像的内在结构和先验属性,从而实现图像的最优逼近,基于稀疏表示的策略在图像修复领域中获得了广泛应用。例如,Elad等人提出了稀疏形态成分分解模型;Sahoo等人提出了基于局部图像块的稀疏近似模型;李清泉等人结合人机交互和稀疏表示提出了壁画修复模型等。不过在通常情况下,图像的稀疏表示系数服从随机分布,若待修复区域的稀疏系数分布不同于其参考区域,则无法充分发掘稀疏系数的内在联系和相关样本图像块之间的相关性,以致影响图像的修复效果。第三,基于纹理合成的修复方法通过分析整幅图像的纹理特征,在已知区域内选择与待修复区域最相似的图像区块,来实现图像块的修复。例如,Hu等人利用唐卡对称性特点,提出一种用于唐卡图像的修复与预测方法;张东等人利用小波变换将图像分解成具有不同分辨率的低频分量和高频分量,进而根据高频分量的不同特征来修复具有丰富边缘和纹理的破损图像。该类方法适用于修复具有规则纹理的小尺度破损图像,若图像中的边缘和纹理过于复杂,基于纹理合成的方法则无法获得较高的修复质量。同时,上述三类典型方法尚无法抑制甲骨拓片图像中点状噪声、片状斑纹和固有纹理的干扰,甚至会在修复过程中引起更多伪边缘。
针对古文字字形的修复,张显俊等人提出了一种基于傅里叶描述子的书法碑刻文字字形修复方法,采用8-邻域搜索法对填充后的字形图像进行轮廓提取,得到连通的字形外轮廓,再利用基于傅立叶描述子的特征提取和边缘平滑技术对字形轮廓进行重构,获得了平滑后的碑刻文字轮廓。马小虎等人对甲骨文的字形轮廓进行特征点提取,并使用贝塞尔曲线拟合甲骨文字的轮廓,能够把图像形式的甲骨文转化为曲线轮廓描述的甲骨文,但是无法实现残损字形轮廓的修复。顾绍通提出了一种基于自适应阈值和分形几何的甲骨拓片字形复原方法,通过分析甲骨拓片的噪声特点以及甲骨字形边缘的分形特征,计算甲骨拓片图像边缘的分形维数并对甲骨文字边缘进行压缩变换,实现了甲骨拓片中文字边缘的自适应平滑。在此基础上,顾绍通等人引进泊松分布来刻画甲骨拓片图像的连通区域面积,提出了一种基于泊松分布和分形几何的甲骨拓片字形复原方法,通过比较每个连通区域与拓片上所有连通区域的数学期望的差值来识别拓片上的噪声区域,再根据甲骨拓片字形边缘的分形维数和字形轮廓线上当前点与左右相邻点形成的向量夹角,对甲骨拓片的文字区域进行判别,从而达到平滑甲骨字形边缘的目的。为了更好地保持被平滑了的文字边缘的分形特征,顾绍通进一步构造了一种分形插值函数,对提取到的甲骨文字特征点进行分形插值与逼近,进而在保留甲骨字形整体风格的同时,对文字边缘进行平滑。同时,顾绍通还提出了一种基于数学形态学的甲骨拓片字形复原方法,分别沿着水平方向、竖直方向以及斜线方向,对字形边缘进行基于形态学膨胀和腐蚀操作,从而平滑甲骨文字边缘的凹凸形态。不过,由于甲骨拓片中固有纹理和片状斑纹的分形维数与真正的甲骨文字往往存在一定相似性,上述两种方法仅对甲骨拓片图像上的点状噪声具有很好的抵抗能力,却对其固有纹理和片状斑纹的干扰不够鲁棒。
综上所述,目前尚没有一种可同时抵抗龟甲和兽骨上存在的点状噪声、片状斑纹和固有纹理干扰的,准确性高、鲁棒性好、处理速度快、具备自适应能力的甲骨刻辞文字自动修复方法。
发明内容
本发明是为了解决现有技术所存在的上述技术问题,提供一种准确性高、鲁棒性好、处理速度快、具备自适应能力的基于形态先验特征的甲骨刻辞文字修复方法。
本发明的技术解决方案是:一种基于形态先验特征的甲骨刻辞文字修复方法,其特征在于按照如下步骤进行:
步骤1.输入待修复的甲骨文图像I,若与龟甲的盾纹、齿缝或甲骨外缘存在粘连的文字数量大于2,则令DenoiseOption←1,否则令DenoiseOption←0,所述DenoiseOption表示控制连通区域去噪强度的布尔型参数;
步骤2.将I的颜色空间从RGB转换到HSV,并提取其Y分量IV
步骤3.利用迭代式全局阈值法分割IV,得到甲骨文字的粗分割结果;
步骤3.1令IV的最大灰度值和最小灰度值分别为Zmax和Zmin,并令初始分割阈值T1=(Zmax+Zmin)/2;
步骤3.2采用T1作为全局阈值将图像IV分割为前景区域G1和背景区域G2,其中,G1由IV中灰度值大于T1的像素组成,而G2由IV中灰度值不大于T1的像素组成;
步骤3.3计算前景区域G1中所有像素的平均灰度值μ1,计算背景区域G2中所有像素的平均灰度值μ2,并令T2=(μ12)/2;
步骤3.4如果|T2-T1|<T,所述T为预设的迭代阈值,则将T2作为最优的全局分割阈值,转入步骤3.5;否则,令T1←T2,转入步骤3.2;
步骤3.5采用T2作为全局阈值,对IV进行二值化,得到甲骨文字的粗分割结果
Figure BDA0002616302550000041
步骤4.对
Figure BDA0002616302550000042
进行基于连通区域的去噪处理;
步骤4.1若DenoiseOption=1,则采用半径为r1的平坦圆盘型结构元素对
Figure BDA0002616302550000043
进行形态学顶帽运算,从而消除/>
Figure BDA0002616302550000044
中的大面积不均匀背景,得到图像/>
Figure BDA0002616302550000045
所述r1为预设常数,转入步骤5;
步骤4.2若DenoiseOption=0,则对
Figure BDA0002616302550000046
中的4-连通区域进行标记,并将其标签为1的4-连通区域填充为背景,从而消除/>
Figure BDA0002616302550000047
中的大面积盾纹和齿缝,得到图像/>
Figure BDA0002616302550000048
步骤5.将图像
Figure BDA0002616302550000049
中面积小于TNoiseArea的8-连通区域填充为背景,从而去除
Figure BDA00026163025500000410
的小面积区域噪声,所述TNoiseArea为预设常数;
步骤6.统计
Figure BDA00026163025500000411
中所有4-连通区域,令4-连通区域的数量为N4_Area个,令4-连通区域的面积的数学期望为SE,令i←1,再对各个4-连通区域进行基于形态先验特征的填充处理,得到填充后的图像/>
Figure BDA00026163025500000412
步骤6.1从图像
Figure BDA00026163025500000413
中取出第i个4-连通区域;
步骤6.2若第i个4-连通区域的连通面积大于T4_Area,则将该4-连通区域判定为文字区域并转入步骤6.7,否则转入步骤6.3,所述T4_Area为预设常数;
步骤6.3计算第i个4-连通区域的面积Si和外接矩形,令该外接矩形的高度和宽度分别为Hi和Wi
步骤6.4若Si≥SE,则将第i个4-连通区域判定为文字区域并转入步骤6.7,否则转入步骤6.5;
步骤6.5若Hi/Wi>Ratio或者Wi/Hi>Ratio,则将第i个4-连通区域判定为孤立的文字区域并转入步骤6.7,否则转入步骤6.6,所述Ratio为预设常数;
步骤6.6将第i个4-连通区域判定为噪声区域并将其填充为背景;
步骤6.7令i←i+1,若i>N4_Area,则转入步骤7,否则返回步骤6.1;
步骤7.采用直径为r2的方形结构元素对图像
Figure BDA0002616302550000051
进行形态学开运算,去除图像中甲骨文字周围的局部噪声,得到图像/>
Figure BDA0002616302550000052
所述r2为预设常数;
步骤8.提取图像
Figure BDA0002616302550000053
中的边缘特征点,令/>
Figure BDA0002616302550000054
所述Pedge表示边缘像素的坐标集合;
步骤8.1利用Sobel算子对图像
Figure BDA0002616302550000055
进行边缘检测,从而提取图像/>
Figure BDA0002616302550000056
中的边缘像素,并将边缘像素的坐标保存到集合Pedge中;
步骤8.2对于图像
Figure BDA0002616302550000057
中的每个像素p,令其坐标为(px,py),若(px,py)∈Pedge,则将像素p的值设置为1,否则将像素p的值设置为0,所述px表示像素p的横坐标,py表示像素p的纵坐标;
步骤9.提取图像
Figure BDA0002616302550000058
中甲骨文字的拐点以及每个像素的方向转角,将/>
Figure BDA0002616302550000059
中所有像素的状态设置为未被处理过;
步骤9.1按照光栅扫描顺序,从图像
Figure BDA00026163025500000510
中取出一个未被处理过的像素,令其为q,并建立一个集合/>
Figure BDA00026163025500000511
步骤9.2若像素q的值等于0或者像素q处于图像的第1行或第1列或最后1行或最后1列,则转入步骤9,否则转入步骤9.3;
步骤9.3若以像素q为中心的8-邻域相邻像素中,像素值为1的像素数量不足2个,则转入步骤9.8,否则根据公式(1)所定义的模板中的序号,对像素q的8-邻域相邻像素进行编号;
Figure BDA00026163025500000512
步骤9.4在像素q的8-邻域相邻像素中,取出像素值等于1的像素的编号,将其加入集合Uedge
Figure BDA00026163025500000513
步骤9.5在集合Uedge中,找出能满足公式(2)的2个编号e1和e2
Figure BDA0002616302550000061
所述e1∈{1,2,3,4,5,6,7,8},e2∈{1,2,3,4,5,6,7,8},且e1≠e2
Figure BDA0002616302550000062
表示以像素q为起点、以编号e1所对应的像素为终点的向量,/>
Figure BDA0002616302550000063
表示以像素q为起点、以编号e2所对应的像素为终点的向量,/>
Figure BDA0002616302550000064
分别表示/>
Figure BDA0002616302550000065
和/>
Figure BDA0002616302550000066
的模长,“·”表示向量的内积运算;
步骤9.6如果θ<θT,则将像素q判定为甲骨文字的拐点,所述θT为预设常数;
步骤9.7根据编号e1和e2,计算像素q的方向转角θq
步骤9.7.1当e1=1时,若e2=3,则令θq=11,若e2=5,则令θq=2,若e2=6,则令θq=-12,若e2=7,则令θq=-3,若e2=8,则令θq=180,否则转入步骤9.8;
步骤9.7.2当e1=2时,若e2=4,则令θq=0,若e2=5,则令θq=0,若e2=6,则令θq=-3,若e2=7,则令θq=180,若e2=8,则令θq=3,否则转入步骤9.8;
步骤9.7.3当e1=3时,若e2=1,则令θq=11,若e2=4,则令θq=2,若e2=6,则令θq=180,若e2=7,则令θq=3,若e2=8,则令θq=12,否则转入步骤9.8;
步骤9.7.4当e1=4时,若e2=2,则令θq=0,若e2=3,则令θq=2,若e2=5,则令θq=180,若e2=7,则令θq=0,若e2=8,则令θq=-2,否则转入步骤9.8;
步骤9.7.5当e1=5时,若e2=1,则令θq=2,若e2=2,则令θq=0,若e2=4,则令θq=180,若e2=6,则令θq=-2,若e2=7,则令θq=0,否则转入步骤9.8;
步骤9.7.6当e1=6时,若e2=1,则令θq=-12,若e2=2,则令θq=-3,若e2=3,则令θq=180,若e2=5,则令θq=-2,若e2=8,则令θq=-11,否则转入步骤9.8;
步骤9.7.7当e1=7时,若e2=1,则令θq=-3,若e2=2,则令θq=180,若e2=3,则令θq=3,若e2=4,则令θq=0,若e2=5,则令θq=0,否则转入步骤9.8;
步骤9.7.8当e1=8时,若e2=1,则令θq=180,若e2=2,则令θq=3,若e2=3,则令θq=12,若e2=4,则令θq=-2,若e2=6,则令θq=-11,否则转入步骤9.8;
步骤9.8若图像
Figure BDA0002616302550000067
的所有像素都已处理完毕,则转入步骤10,否则返回步骤9.1;
步骤10.将图像
Figure BDA0002616302550000068
中所有像素的状态设置为未经过水平方向修复且未被遍历过,并沿着水平方向对图像/>
Figure BDA0002616302550000069
中甲骨文字的拐点进行修复,令/>
Figure BDA0002616302550000071
所述/>
Figure BDA0002616302550000072
表示经过水平方向修复后的结果图像;
步骤10.1按照光栅扫描顺序,扫描图像
Figure BDA0002616302550000073
的每个像素,从中取出一个未经过水平方向修复或者未被遍历过的像素,令其为m,并令其坐标为(mx,my),所述mx表示像素m的横坐标,my表示像素m的纵坐标;
步骤10.2若像素m是甲骨文字的拐点,则将像素m作为当前边缘像素段的起始点并将其方向转角赋值给θstart,否则将像素m设置为已被遍历过的像素并转入步骤10.7;
步骤10.3若像素m的右侧存在像素值等于1的像素,则继续沿着水平方向向右遍历,直到遇到第一个像素值等于0的像素m′为止,并将m′左侧的相邻像素m″作为当前边缘像素段的终止点,将m″的方向转角赋值给θend,令像素m″的坐标为(mx″,my″),所述mx″表示像素m″的横坐标,my″表示像素m″的纵坐标;
步骤10.4令当前边缘像素段的修复方向角
Figure BDA0002616302550000074
将/>
Figure BDA0002616302550000075
中纵坐标为my且横坐标位于闭区间[mx,mx″]的所有像素的值均设置为0,并将像素m设置为已经过水平方向修复的像素;
步骤10.5若
Figure BDA0002616302550000076
或者/>
Figure BDA0002616302550000077
或者/>
Figure BDA0002616302550000078
则将/>
Figure BDA0002616302550000079
中纵坐标为my+1且横坐标位于闭区间[mx,mx″]的所有像素的值均设置为1,转入步骤10.7;/>
步骤10.6若
Figure BDA00026163025500000710
或者/>
Figure BDA00026163025500000711
或者/>
Figure BDA00026163025500000712
则将/>
Figure BDA00026163025500000713
中纵坐标为my-1且横坐标位于闭区间[mx,mx″]的所有像素的值均设置为1,转入步骤10.7;
步骤10.7若图像
Figure BDA00026163025500000714
的所有像素都已经过水平方向修复或者被遍历过,则转入步骤11,否则返回步骤10.1;
步骤11.将图像
Figure BDA00026163025500000715
中所有像素的状态设置为未经过竖直方向修复且未被遍历过,并沿着竖直方向对图像/>
Figure BDA00026163025500000716
中甲骨文字的拐点进行修复,令/>
Figure BDA00026163025500000717
所述/>
Figure BDA00026163025500000718
表示经过竖直方向修复后的结果图像;
步骤11.1按照从左到右、从上到下的扫描顺序,扫描图像
Figure BDA00026163025500000719
的每个像素,从中取出一个未经过竖直方向修复或者未被遍历过的像素,令其为n,并令其坐标为(nx,ny),所述nx表示像素n的横坐标,ny表示像素n的纵坐标;
步骤11.2若像素n是甲骨文字的拐点,则将像素n作为当前边缘像素段的起始点并将其方向转角赋值给θstart,否则将像素n设置为已被遍历过的像素并转入步骤11.7;
步骤11.3若像素n的下方存在像素值等于1的像素,则继续沿着竖直方向向下遍历,直到遇到第一个像素值等于0的像素n′为止,并将n′上方的相邻像素n″作为当前边缘像素段的终止点,将n″的方向转角赋值给θend,令像素n″的坐标为(nx″,ny″),所述nx″表示像素n″的横坐标,ny″表示像素n″的纵坐标;
步骤11.4令当前边缘像素段的修复方向角
Figure BDA0002616302550000081
将/>
Figure BDA0002616302550000082
中横坐标为nx且纵坐标位于闭区间[ny,ny″]的所有像素的值均设置为0,并将像素n设置为已经过竖直方向修复的像素;
步骤11.5若
Figure BDA0002616302550000083
或者/>
Figure BDA0002616302550000084
或者/>
Figure BDA0002616302550000085
则将/>
Figure BDA0002616302550000086
中横坐标为nx-1且纵坐标位于闭区间[ny,ny″]的所有像素的值均设置为1,转入步骤11.7;
步骤11.6若
Figure BDA0002616302550000087
或者/>
Figure BDA0002616302550000088
或者/>
Figure BDA0002616302550000089
则将/>
Figure BDA00026163025500000810
中横坐标为nx+1且纵坐标位于闭区间[ny,ny″]的所有像素的值均设置为1,转入步骤11.7;
步骤11.7若图像
Figure BDA00026163025500000811
的所有像素都已经过竖直方向修复或者被遍历过,则转入步骤12,否则返回步骤11.1;
步骤12.消除图像
Figure BDA00026163025500000812
中的孤立像素,将/>
Figure BDA00026163025500000813
中所有像素的状态设置为未被处理过;
步骤12.1按照光栅扫描顺序,扫描图像
Figure BDA00026163025500000814
从中取出一个未被处理过的像素,令其为k;
步骤12.2若像素k处于图像的第1行或第1列或最后1行或最后1列,则转入步骤12.4,否则转入步骤12.3;
步骤12.3若像素k的值等于1并且其8-邻域相邻像素的值均为0,则将像素k的值设置为0;
步骤12.4若图像
Figure BDA00026163025500000815
的所有像素都已处理完毕,则输出处理后的图像/>
Figure BDA00026163025500000816
作为最终的甲骨刻辞文字修复结果,否则返回步骤12.1。
本发明第一,利用数学形态学运算、边缘梯度方向分析、边缘向量夹角最大化和连通性约束等手段,对甲骨文字的拐点、连通区域面积、连通区域形状和长宽比等局部特征进行提取,从而充分发掘甲骨刻辞文字的形态先验特征,能够有效抵抗龟甲和兽骨的固有纹理、点状噪声以及片状斑纹的干扰,实现对甲骨文字区域与噪声区域的准确判别;第二,利用基于4-链码的轮廓跟踪方法提取边缘像素段,并进一步利用边缘像素段的两个端点的方向转角之和来快速判别文字边缘的凹凸方向,进而对甲骨文字的凹凸边缘进行基于像素段平移的平滑修复,也就是将上凸的像素段下移、将下凹的像素段上移、将外凸的像素段内移、将内凹的像素段外移;第三,无需人工交互,可以批量自动处理甲骨文字图像,在时间效率上明显优于人工修复方法。因此,本发明具有抵抗点状噪声、片状斑纹和固有纹理干扰的,准确性高、鲁棒性好、处理速度快和自适应能力强等优点。
附图说明
图1是本发明对《甲骨文合集》19800号甲骨拓片图像的文字修复结果图。
图2是本发明对《甲骨文合集》20715号甲骨拓片图像的文字修复结果图。
图3是本发明对《甲骨文合集》17055正号甲骨拓片图像的文字修复结果图。
具体实施方式
本发明的一种基于形态先验特征的甲骨刻辞文字修复方法,按照如下步骤进行;
步骤1.输入待修复的甲骨文图像I,若与龟甲的盾纹、齿缝或甲骨外缘存在粘连的文字数量大于2,则令DenoiseOption←1,否则令DenoiseOption←0,所述DenoiseOption表示控制连通区域去噪强度的布尔型参数;
步骤2.将I的颜色空间从RGB转换到HSV,并提取其Y分量IV
步骤3.利用迭代式全局阈值法分割IV,得到甲骨文字的粗分割结果;
步骤3.1令IV的最大灰度值和最小灰度值分别为Zmax和Zmin,并令初始分割阈值T1=(Zmax+Zmin)/2;
步骤3.2采用T1作为全局阈值将图像IV分割为前景区域G1和背景区域G2,其中,G1由IV中灰度值大于T1的像素组成,而G2由IV中灰度值不大于T1的像素组成;
步骤3.3计算前景区域G1中所有像素的平均灰度值μ1,计算背景区域G2中所有像素的平均灰度值μ2,并令T2=(μ12)/2;
步骤3.4如果|T2-T1|<T,所述T为预设的迭代阈值,本实施例令T=0.5,则将T2作为最优的全局分割阈值,转入步骤3.5;否则,令T1←T2,转入步骤3.2;
步骤3.5采用T2作为全局阈值,对IV进行二值化,得到甲骨文字的粗分割结果
Figure BDA0002616302550000101
步骤4.对
Figure BDA0002616302550000102
进行基于连通区域的去噪处理;
步骤4.1若DenoiseOption=1,则采用半径为r1的平坦圆盘型结构元素对
Figure BDA0002616302550000103
进行形态学顶帽运算,从而消除/>
Figure BDA0002616302550000104
中的大面积不均匀背景,得到图像/>
Figure BDA0002616302550000105
所述r1为预设常数,本实施例令r1=7,转入步骤5;
步骤4.2若DenoiseOption=0,则对
Figure BDA0002616302550000106
中的4-连通区域进行标记,并将其标签为1的4-连通区域填充为背景,从而消除/>
Figure BDA0002616302550000107
中的大面积盾纹和齿缝,得到图像/>
Figure BDA0002616302550000108
步骤5.将图像
Figure BDA0002616302550000109
中面积小于TNoiseArea的8-连通区域填充为背景,从而去除
Figure BDA00026163025500001010
的小面积区域噪声,所述TNoiseArea为预设常数,本实施例令TNoiseArea=60;
步骤6.统计
Figure BDA00026163025500001011
中所有4-连通区域,令4-连通区域的数量为N4_Area个,令4-连通区域的面积的数学期望为SE,令i←1,再对各个4-连通区域进行基于形态先验特征的填充处理,得到填充后的图像/>
Figure BDA00026163025500001012
步骤6.1从图像
Figure BDA00026163025500001013
中取出第i个4-连通区域;
步骤6.2若第i个4-连通区域的连通面积大于T4_Area,则将该4-连通区域判定为文字区域并转入步骤6.7,否则转入步骤6.3,所述T4_Area为预设常数,本实施例令T4_Area=500;
步骤6.3计算第i个4-连通区域的面积Si和外接矩形,令该外接矩形的高度和宽度分别为Hi和Wi
步骤6.4若Si≥SE,则将第i个4-连通区域判定为文字区域并转入步骤6.7,否则转入步骤6.5;
步骤6.5若Hi/Wi>Ratio或者Wi/Hi>Ratio,则将第i个4-连通区域判定为孤立的文字区域并转入步骤6.7,否则转入步骤6.6,所述Ratio为预设常数,本实施例令Ratio=2.5;
步骤6.6将第i个4-连通区域判定为噪声区域并将其填充为背景;
步骤6.7令i←i+1,若i>N4_Area,则转入步骤7,否则返回步骤6.1;
步骤7.采用直径为r2的方形结构元素对图像
Figure BDA00026163025500001014
进行形态学开运算,去除图像中甲骨文字周围的局部噪声,得到图像/>
Figure BDA0002616302550000111
所述r2为预设常数,本实施例令r2=3;
步骤8.提取图像
Figure BDA0002616302550000112
中的边缘特征点,令/>
Figure BDA0002616302550000113
所述Pedge表示边缘像素的坐标集合;
步骤8.1利用Sobel算子对图像
Figure BDA0002616302550000114
进行边缘检测,从而提取图像/>
Figure BDA0002616302550000115
中的边缘像素,并将边缘像素的坐标保存到集合Pedge中;
步骤8.2对于图像
Figure BDA0002616302550000116
中的每个像素p,令其坐标为(px,py),若(px,py)∈Pedge,则将像素p的值设置为1,否则将像素p的值设置为0,所述px表示像素p的横坐标,py表示像素p的纵坐标;
步骤9.提取图像
Figure BDA0002616302550000117
中甲骨文字的拐点以及每个像素的方向转角,将/>
Figure BDA0002616302550000118
中所有像素的状态设置为未被处理过;
步骤9.1按照光栅扫描顺序,从图像
Figure BDA0002616302550000119
中取出一个未被处理过的像素,令其为q,并建立一个集合/>
Figure BDA00026163025500001110
步骤9.2若像素q的值等于0或者像素q处于图像的第1行或第1列或最后1行或最后1列,则转入步骤9,否则转入步骤9.3;
步骤9.3若以像素q为中心的8-邻域相邻像素中,像素值为1的像素数量不足2个,则转入步骤9.8,否则根据公式(1)所定义的模板中的序号,对像素q的8-邻域相邻像素进行编号;
Figure BDA00026163025500001111
步骤9.4在像素q的8-邻域相邻像素中,取出像素值等于1的像素的编号,将其加入集合Uedge
Figure BDA00026163025500001112
步骤9.5在集合Uedge中,找出能满足公式(2)的2个编号e1和e2
Figure BDA00026163025500001113
所述e1∈{1,2,3,4,5,6,7,8},e2∈{1,2,3,4,5,6,7,8},且e1≠e2
Figure BDA00026163025500001114
表示以像素q为起点、以编号e1所对应的像素为终点的向量,/>
Figure BDA00026163025500001115
表示以像素q为起点、以编号e2所对应的像素为终点的向量,/>
Figure BDA00026163025500001116
分别表示/>
Figure BDA00026163025500001117
和/>
Figure BDA00026163025500001118
的模长,“·”表示向量的内积运算;
步骤9.6如果θ≤θT,则将像素q判定为甲骨文字的拐点,所述θT为预设常数,本实施例令θT=0.75π;
步骤9.7根据编号e1和e2,计算像素q的方向转角θq
步骤9.7.1当e1=1时,若e2=3,则令θq=11,若e2=5,则令θq=2,若e2=6,则令θq=-12,若e2=7,则令θq=-3,若e2=8,则令θq=180,否则转入步骤9.8;
步骤9.7.2当e1=2时,若e2=4,则令θq=0,若e2=5,则令θq=0,若e2=6,则令θq=-3,若e2=7,则令θq=180,若e2=8,则令θq=3,否则转入步骤9.8;
步骤9.7.3当e1=3时,若e2=1,则令θq=11,若e2=4,则令θq=2,若e2=6,则令θq=180,若e2=7,则令θq=3,若e2=8,则令θq=12,否则转入步骤9.8;
步骤9.7.4当e1=4时,若e2=2,则令θq=0,若e2=3,则令θq=2,若e2=5,则令θq=180,若e2=7,则令θq=0,若e2=8,则令θq=-2,否则转入步骤9.8;
步骤9.7.5当e1=5时,若e2=1,则令θq=2,若e2=2,则令θq=0,若e2=4,则令θq=180,若e2=6,则令θq=-2,若e2=7,则令θq=0,否则转入步骤9.8;
步骤9.7.6当e1=6时,若e2=1,则令θq=-12,若e2=2,则令θq=-3,若e2=3,则令θq=180,若e2=5,则令θq=-2,若e2=8,则令θq=-11,否则转入步骤9.8;
步骤9.7.7当e1=7时,若e2=1,则令θq=-3,若e2=2,则令θq=180,若e2=3,则令θq=3,若e2=4,则令θq=0,若e2=5,则令θq=0,否则转入步骤9.8;
步骤9.7.8当e1=8时,若e2=1,则令θq=180,若e2=2,则令θq=3,若e2=3,则令θq=12,若e2=4,则令θq=-2,若e2=6,则令θq=-11,否则转入步骤9.8;
步骤9.8若图像
Figure BDA0002616302550000121
的所有像素都已处理完毕,则转入步骤10,否则返回步骤9.1;
步骤10.将图像
Figure BDA0002616302550000122
中所有像素的状态设置为未经过水平方向修复且未被遍历过,并沿着水平方向对图像/>
Figure BDA0002616302550000123
中甲骨文字的拐点进行修复,令/>
Figure BDA0002616302550000124
所述/>
Figure BDA0002616302550000125
表示经过水平方向修复后的结果图像;
步骤10.1按照光栅扫描顺序,扫描图像
Figure BDA0002616302550000126
的每个像素,从中取出一个未经过水平方向修复或者未被遍历过的像素,令其为m,并令其坐标为(mx,my),所述mx表示像素m的横坐标,my表示像素m的纵坐标;
步骤10.2若像素m是甲骨文字的拐点,则将像素m作为当前边缘像素段的起始点并将其方向转角赋值给θstart,否则将像素m设置为已被遍历过的像素并转入步骤10.7;
步骤10.3若像素m的右侧存在像素值等于1的像素,则继续沿着水平方向向右遍历,直到遇到第一个像素值等于0的像素m′为止,并将m′左侧的相邻像素m″作为当前边缘像素段的终止点,将m″的方向转角赋值给θend,令像素m″的坐标为(mx″,my″),所述mx″表示像素m″的横坐标,my″表示像素m″的纵坐标;
步骤10.4令当前边缘像素段的修复方向角
Figure BDA0002616302550000131
将/>
Figure BDA0002616302550000132
中纵坐标为my且横坐标位于闭区间[mx,mx″]的所有像素的值均设置为0,并将像素m设置为已经过水平方向修复的像素;
步骤10.5若
Figure BDA0002616302550000133
或者/>
Figure BDA0002616302550000134
或者/>
Figure BDA0002616302550000135
则将/>
Figure BDA0002616302550000136
中纵坐标为my+1且横坐标位于闭区间[mx,mx″]的所有像素的值均设置为1,转入步骤10.7;
步骤10.6若
Figure BDA0002616302550000137
或者/>
Figure BDA0002616302550000138
或者/>
Figure BDA0002616302550000139
则将/>
Figure BDA00026163025500001310
中纵坐标为my-1且横坐标位于闭区间[mx,mx″]的所有像素的值均设置为1,转入步骤10.7;
步骤10.7若图像
Figure BDA00026163025500001311
的所有像素都已经过水平方向修复或者被遍历过,则转入步骤11,否则返回步骤10.1;
步骤11.将图像
Figure BDA00026163025500001312
中所有像素的状态设置为未经过竖直方向修复且未被遍历过,并沿着竖直方向对图像/>
Figure BDA00026163025500001313
中甲骨文字的拐点进行修复,令
Figure BDA00026163025500001314
所述/>
Figure BDA00026163025500001315
表示经过竖直方向修复后的结果图像;
步骤11.1按照从左到右、从上到下的扫描顺序,扫描图像
Figure BDA00026163025500001316
的每个像素,从中取出一个未经过竖直方向修复或者未被遍历过的像素,令其为n,并令其坐标为(nx,ny),所述nx表示像素n的横坐标,ny表示像素n的纵坐标;
步骤11.2若像素n是甲骨文字的拐点,则将像素n作为当前边缘像素段的起始点并将其方向转角赋值给θstart,否则将像素n设置为已被遍历过的像素并转入步骤11.7;
步骤11.3若像素n的下方存在像素值等于1的像素,则继续沿着竖直方向向下遍历,直到遇到第一个像素值等于0的像素n′为止,并将n′上方的相邻像素n″作为当前边缘像素段的终止点,将n″的方向转角赋值给θend,令像素n″的坐标为(nx″,ny″),所述nx″表示像素n″的横坐标,ny″表示像素n″的纵坐标;
步骤11.4令当前边缘像素段的修复方向角
Figure BDA0002616302550000141
将/>
Figure BDA0002616302550000142
中横坐标为nx且纵坐标位于闭区间[ny,ny″]的所有像素的值均设置为0,并将像素n设置为已经过竖直方向修复的像素;
步骤11.5若
Figure BDA0002616302550000143
或者/>
Figure BDA0002616302550000144
或者/>
Figure BDA0002616302550000145
则将/>
Figure BDA0002616302550000146
中横坐标为nx-1且纵坐标位于闭区间[ny,ny″]的所有像素的值均设置为1,转入步骤11.7;
步骤11.6若
Figure BDA0002616302550000147
或者/>
Figure BDA0002616302550000148
或者/>
Figure BDA0002616302550000149
则将/>
Figure BDA00026163025500001410
中横坐标为nx+1且纵坐标位于闭区间[ny,ny″]的所有像素的值均设置为1,转入步骤11.7;
步骤11.7若图像
Figure BDA00026163025500001411
的所有像素都已经过竖直方向修复或者被遍历过,则转入步骤12,否则返回步骤11.1;
步骤12.消除图像
Figure BDA00026163025500001412
中的孤立像素,将/>
Figure BDA00026163025500001413
中所有像素的状态设置为未被处理过;
步骤12.1按照光栅扫描顺序,扫描图像
Figure BDA00026163025500001414
从中取出一个未被处理过的像素,令其为k;
步骤12.2若像素k处于图像的第1行或第1列或最后1行或最后1列,则转入步骤12.4,否则转入步骤12.3;
步骤12.3若像素k的值等于1并且其8-邻域相邻像素的值均为0,则将像素k的值设置为0;
步骤12.4若图像
Figure BDA00026163025500001415
的所有像素都已处理完毕,则输出处理后的图像
Figure BDA00026163025500001416
作为最终的甲骨刻辞文字修复结果,否则返回步骤12.1。
从《甲骨文合集》中选取3幅甲骨拓片图像,采用本发明进行甲骨文字修复的结果分别如图1-图3所示,其中,图1(a)、图2(a)和图3(a)为原始甲骨拓片图像,图1(b)、图2(b)和图3(b)为采用本发明将背景和噪声区域填充后的图像,图1(c)、图2(c)和图3(c)分别为图1(b)、图2(b)、图3(b)中用白色矩形框标出的文字的原始边缘,图1(d)、图2(d)和图3(d)分别为图1(b)、图2(b)、图3(b)中用白色矩形框标出的文字采用本发明修复后的边缘。
从图1-图3可见,本发明能够在保留文字区域的基础上,有效地去除龟甲和兽骨上的点状噪声、片状斑纹和固有纹理。而且,本发明完整地保持了甲骨文字的字形特点,消除了文字边缘的毛刺、凸起和锯齿,实现了文字边缘的平滑处理,进而更加有利于提高后续的甲骨文字自动识别的精度。

Claims (1)

1.一种基于形态先验特征的甲骨刻辞文字修复方法,其特征在于按照如下步骤进行:
步骤1.输入待修复的甲骨文图像I,若与龟甲的盾纹、齿缝或甲骨外缘存在粘连的文字数量大于2,则令DenoiseOption←1,否则令DenoiseOption←0,所述DenoiseOption表示控制连通区域去噪强度的布尔型参数;
步骤2.将I的颜色空间从RGB转换到HSV,并提取其Y分量IV
步骤3.利用迭代式全局阈值法分割IV,得到甲骨文字的粗分割结果;
步骤3.1令IV的最大灰度值和最小灰度值分别为Zmax和Zmin,并令初始分割阈值T1=(Zmax+Zmin)/2;
步骤3.2采用T1作为全局阈值将图像IV分割为前景区域G1和背景区域G2,其中,G1由IV中灰度值大于T1的像素组成,而G2由IV中灰度值不大于T1的像素组成;
步骤3.3计算前景区域G1中所有像素的平均灰度值μ1,计算背景区域G2中所有像素的平均灰度值μ2,并令T2=(μ12)/2;
步骤3.4如果|T2-T1|<T,所述T为预设的迭代阈值,则将T2作为最优的全局分割阈值,转入步骤3.5;否则,令T1←T2,转入步骤3.2;
步骤3.5采用T2作为全局阈值,对IV进行二值化,得到甲骨文字的粗分割结果
Figure FDA0002616302540000011
步骤4.对
Figure FDA0002616302540000012
进行基于连通区域的去噪处理;
步骤4.1若DenoiseOption=1,则采用半径为r1的平坦圆盘型结构元素对
Figure FDA0002616302540000019
进行形态学顶帽运算,从而消除/>
Figure FDA0002616302540000013
中的大面积不均匀背景,得到图像/>
Figure FDA00026163025400000110
所述r1为预设常数,转入步骤5;
步骤4.2若DenoiseOption=0,则对
Figure FDA0002616302540000014
中的4-连通区域进行标记,并将其标签为1的4-连通区域填充为背景,从而消除/>
Figure FDA0002616302540000015
中的大面积盾纹和齿缝,得到图像/>
Figure FDA0002616302540000016
步骤5.将图像
Figure FDA0002616302540000017
中面积小于TNoiseArea的8-连通区域填充为背景,从而去除
Figure FDA0002616302540000018
的小面积区域噪声,所述TNoiseArea为预设常数;
步骤6.统计
Figure FDA0002616302540000021
中所有4-连通区域,令4-连通区域的数量为N4_Area个,令4-连通区域的面积的数学期望为SE,令i←1,再对各个4-连通区域进行基于形态先验特征的填充处理,得到填充后的图像/>
Figure FDA0002616302540000022
步骤6.1从图像
Figure FDA0002616302540000023
中取出第i个4-连通区域;
步骤6.2若第i个4-连通区域的连通面积大于T4_Area,则将该4-连通区域判定为文字区域并转入步骤6.7,否则转入步骤6.3,所述T4_Area为预设常数;
步骤6.3计算第i个4-连通区域的面积Si和外接矩形,令该外接矩形的高度和宽度分别为Hi和Wi
步骤6.4若Si≥SE,则将第i个4-连通区域判定为文字区域并转入步骤6.7,否则转入步骤6.5;
步骤6.5若Hi/Wi>Ratio或者Wi/Hi>Ratio,则将第i个4-连通区域判定为孤立的文字区域并转入步骤6.7,否则转入步骤6.6,所述Ratio为预设常数;
步骤6.6将第i个4-连通区域判定为噪声区域并将其填充为背景;
步骤6.7令i←i+1,若i>N4_Area,则转入步骤7,否则返回步骤6.1;
步骤7.采用直径为r2的方形结构元素对图像
Figure FDA0002616302540000024
进行形态学开运算,去除图像中甲骨文字周围的局部噪声,得到图像/>
Figure FDA0002616302540000025
所述r2为预设常数;
步骤8.提取图像
Figure FDA0002616302540000026
中的边缘特征点,令/>
Figure FDA0002616302540000027
所述Pedge表示边缘像素的坐标集合;
步骤8.1利用Sobel算子对图像
Figure FDA0002616302540000028
进行边缘检测,从而提取图像/>
Figure FDA0002616302540000029
中的边缘像素,并将边缘像素的坐标保存到集合Pedge中;
步骤8.2对于图像
Figure FDA00026163025400000210
中的每个像素p,令其坐标为(px,py),若(px,py)∈Pedge,则将像素p的值设置为1,否则将像素p的值设置为0,所述px表示像素p的横坐标,py表示像素p的纵坐标;
步骤9.提取图像
Figure FDA00026163025400000211
中甲骨文字的拐点以及每个像素的方向转角,将/>
Figure FDA00026163025400000212
中所有像素的状态设置为未被处理过;
步骤9.1按照光栅扫描顺序,从图像
Figure FDA00026163025400000213
中取出一个未被处理过的像素,令其为q,并建立一个集合/>
Figure FDA00026163025400000214
步骤9.2若像素q的值等于0或者像素q处于图像的第1行或第1列或最后1行或最后1列,则转入步骤9,否则转入步骤9.3;
步骤9.3若以像素q为中心的8-邻域相邻像素中,像素值为1的像素数量不足2个,则转入步骤9.8,否则根据公式(1)所定义的模板中的序号,对像素q的8-邻域相邻像素进行编号;
Figure FDA0002616302540000031
步骤9.4在像素q的8-邻域相邻像素中,取出像素值等于1的像素的编号,将其加入集合Uedge
Figure FDA0002616302540000033
步骤9.5在集合Uedge中,找出能满足公式(2)的2个编号e1和e2
Figure FDA0002616302540000032
所述e1∈{1,2,3,4,5,6,7,8},e2∈{1,2,3,4,5,6,7,8},且e1≠e2
Figure FDA0002616302540000034
表示以像素q为起点、以编号e1所对应的像素为终点的向量,/>
Figure FDA0002616302540000035
表示以像素q为起点、以编号e2所对应的像素为终点的向量,/>
Figure FDA0002616302540000036
分别表示/>
Figure FDA0002616302540000037
和/>
Figure FDA0002616302540000038
的模长,“·”表示向量的内积运算;
步骤9.6如果θ<θT,则将像素q判定为甲骨文字的拐点,所述θT为预设常数;
步骤9.7根据编号e1和e2,计算像素q的方向转角θq
步骤9.7.1当e1=1时,若e2=3,则令θq=11,若e2=5,则令θq=2,若e2=6,则令θq=-12,若e2=7,则令θq=-3,若e2=8,则令θq=180,否则转入步骤9.8;
步骤9.7.2当e1=2时,若e2=4,则令θq=0,若e2=5,则令θq=0,若e2=6,则令θq=-3,若e2=7,则令θq=180,若e2=8,则令θq=3,否则转入步骤9.8;
步骤9.7.3当e1=3时,若e2=1,则令θq=11,若e2=4,则令θq=2,若e2=6,则令θq=180,若e2=7,则令θq=3,若e2=8,则令θq=12,否则转入步骤9.8;
步骤9.7.4当e1=4时,若e2=2,则令θq=0,若e2=3,则令θq=2,若e2=5,则令θq=180,若e2=7,则令θq=0,若e2=8,则令θq=-2,否则转入步骤9.8;
步骤9.7.5当e1=5时,若e2=1,则令θq=2,若e2=2,则令θq=0,若e2=4,则令θq=180,若e2=6,则令θq=-2,若e2=7,则令θq=0,否则转入步骤9.8;
步骤9.7.6当e1=6时,若e2=1,则令θq=-12,若e2=2,则令θq=-3,若e2=3,则令θq=180,若e2=5,则令θq=-2,若e2=8,则令θq=-11,否则转入步骤9.8;
步骤9.7.7当e1=7时,若e2=1,则令θq=-3,若e2=2,则令θq=180,若e2=3,则令θq=3,若e2=4,则令θq=0,若e2=5,则令θq=0,否则转入步骤9.8;
步骤9.7.8当e1=8时,若e2=1,则令θq=180,若e2=2,则令θq=3,若e2=3,则令θq=12,若e2=4,则令θq=-2,若e2=6,则令θq=-11,否则转入步骤9.8;
步骤9.8若图像
Figure FDA0002616302540000041
的所有像素都已处理完毕,则转入步骤10,否则返回步骤9.1;
步骤10.将图像
Figure FDA0002616302540000042
中所有像素的状态设置为未经过水平方向修复且未被遍历过,并沿着水平方向对图像/>
Figure FDA0002616302540000043
中甲骨文字的拐点进行修复,令/>
Figure FDA0002616302540000044
所述/>
Figure FDA0002616302540000045
表示经过水平方向修复后的结果图像;
步骤10.1按照光栅扫描顺序,扫描图像
Figure FDA0002616302540000046
的每个像素,从中取出一个未经过水平方向修复或者未被遍历过的像素,令其为m,并令其坐标为(mx,my),所述mx表示像素m的横坐标,my表示像素m的纵坐标;
步骤10.2若像素m是甲骨文字的拐点,则将像素m作为当前边缘像素段的起始点并将其方向转角赋值给θstart,否则将像素m设置为已被遍历过的像素并转入步骤10.7;
步骤10.3若像素m的右侧存在像素值等于1的像素,则继续沿着水平方向向右遍历,直到遇到第一个像素值等于0的像素m′为止,并将m′左侧的相邻像素m″作为当前边缘像素段的终止点,将m″的方向转角赋值给θend,令像素m″的坐标为(mx″,my″),所述mx″表示像素m″的横坐标,my″表示像素m″的纵坐标;
步骤10.4令当前边缘像素段的修复方向角
Figure FDA0002616302540000047
将/>
Figure FDA0002616302540000048
中纵坐标为my且横坐标位于闭区间[mx,mx″]的所有像素的值均设置为0,并将像素m设置为已经过水平方向修复的像素;
步骤10.5若
Figure FDA0002616302540000049
或者/>
Figure FDA00026163025400000410
或者/>
Figure FDA00026163025400000411
则将/>
Figure FDA00026163025400000412
中纵坐标为my+1且横坐标位于闭区间[mx,mx″]的所有像素的值均设置为1,转入步骤10.7;
步骤10.6若
Figure FDA00026163025400000413
或者/>
Figure FDA00026163025400000414
或者/>
Figure FDA00026163025400000415
则将/>
Figure FDA00026163025400000416
中纵坐标为my-1且横坐标位于闭区间[mx,mx″]的所有像素的值均设置为1,转入步骤10.7;
步骤10.7若图像
Figure FDA00026163025400000417
的所有像素都已经过水平方向修复或者被遍历过,则转入步骤11,否则返回步骤10.1;/>
步骤11.将图像
Figure FDA0002616302540000051
中所有像素的状态设置为未经过竖直方向修复且未被遍历过,并沿着竖直方向对图像/>
Figure FDA0002616302540000052
中甲骨文字的拐点进行修复,令/>
Figure FDA0002616302540000053
所述/>
Figure FDA0002616302540000054
表示经过竖直方向修复后的结果图像;
步骤11.1按照从左到右、从上到下的扫描顺序,扫描图像
Figure FDA0002616302540000055
的每个像素,从中取出一个未经过竖直方向修复或者未被遍历过的像素,令其为n,并令其坐标为(nx,ny),所述nx表示像素n的横坐标,ny表示像素n的纵坐标;
步骤11.2若像素n是甲骨文字的拐点,则将像素n作为当前边缘像素段的起始点并将其方向转角赋值给θstart,否则将像素n设置为已被遍历过的像素并转入步骤11.7;
步骤11.3若像素n的下方存在像素值等于1的像素,则继续沿着竖直方向向下遍历,直到遇到第一个像素值等于0的像素n′为止,并将n′上方的相邻像素n″作为当前边缘像素段的终止点,将n″的方向转角赋值给θend,令像素n″的坐标为(nx″,ny″),所述nx″表示像素n″的横坐标,ny″表示像素n″的纵坐标;
步骤11.4令当前边缘像素段的修复方向角
Figure FDA0002616302540000056
将/>
Figure FDA0002616302540000057
中横坐标为nx且纵坐标位于闭区间[ny,ny″]的所有像素的值均设置为0,并将像素n设置为已经过竖直方向修复的像素;
步骤11.5若
Figure FDA0002616302540000058
或者/>
Figure FDA0002616302540000059
或者/>
Figure FDA00026163025400000510
则将/>
Figure FDA00026163025400000511
中横坐标为nx-1且纵坐标位于闭区间[ny,ny″]的所有像素的值均设置为1,转入步骤11.7;
步骤11.6若
Figure FDA00026163025400000512
或者/>
Figure FDA00026163025400000513
或者/>
Figure FDA00026163025400000514
则将/>
Figure FDA00026163025400000515
中横坐标为nx+1且纵坐标位于闭区间[ny,ny″]的所有像素的值均设置为1,转入步骤11.7;
步骤11.7若图像
Figure FDA00026163025400000516
的所有像素都已经过竖直方向修复或者被遍历过,则转入步骤12,否则返回步骤11.1;
步骤12.消除图像
Figure FDA00026163025400000517
中的孤立像素,将/>
Figure FDA00026163025400000518
中所有像素的状态设置为未被处理过;
步骤12.1按照光栅扫描顺序,扫描图像
Figure FDA00026163025400000519
从中取出一个未被处理过的像素,令其为k;
步骤12.2若像素k处于图像的第1行或第1列或最后1行或最后1列,则转入步骤12.4,否则转入步骤12.3;
步骤12.3若像素k的值等于1并且其8-邻域相邻像素的值均为0,则将像素k的值设置为0;
步骤12.4若图像
Figure FDA0002616302540000061
的所有像素都已处理完毕,则输出处理后的图像/>
Figure FDA0002616302540000062
作为最终的甲骨刻辞文字修复结果,否则返回步骤12.1。/>
CN202010775134.6A 2020-08-04 2020-08-04 基于形态先验特征的甲骨刻辞文字修复方法 Active CN112070684B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010775134.6A CN112070684B (zh) 2020-08-04 2020-08-04 基于形态先验特征的甲骨刻辞文字修复方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010775134.6A CN112070684B (zh) 2020-08-04 2020-08-04 基于形态先验特征的甲骨刻辞文字修复方法

Publications (2)

Publication Number Publication Date
CN112070684A CN112070684A (zh) 2020-12-11
CN112070684B true CN112070684B (zh) 2023-05-23

Family

ID=73656871

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010775134.6A Active CN112070684B (zh) 2020-08-04 2020-08-04 基于形态先验特征的甲骨刻辞文字修复方法

Country Status (1)

Country Link
CN (1) CN112070684B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113362361B (zh) * 2021-07-20 2023-09-05 辽宁师范大学 形态学先验约束的甲骨文字检测的图像数据集构建方法
CN114494306B (zh) * 2022-01-27 2024-04-05 辽宁师范大学 边缘梯度协方差引导的甲骨卜辞文字轮廓修复方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110309830A (zh) * 2019-06-04 2019-10-08 辽宁师范大学 基于数学形态学和区域连通性的甲骨文字自动分割方法
CN111292283A (zh) * 2020-01-21 2020-06-16 河南大学 一种基于时间序列相似性计算的甲骨残片缀合方法
CN111310760A (zh) * 2020-02-13 2020-06-19 辽宁师范大学 结合局部先验特征和深度卷积特征的甲骨刻辞文字检测方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI607901B (zh) * 2015-11-06 2017-12-11 財團法人工業技術研究院 影像修補系統及其方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110309830A (zh) * 2019-06-04 2019-10-08 辽宁师范大学 基于数学形态学和区域连通性的甲骨文字自动分割方法
CN111292283A (zh) * 2020-01-21 2020-06-16 河南大学 一种基于时间序列相似性计算的甲骨残片缀合方法
CN111310760A (zh) * 2020-02-13 2020-06-19 辽宁师范大学 结合局部先验特征和深度卷积特征的甲骨刻辞文字检测方法

Also Published As

Publication number Publication date
CN112070684A (zh) 2020-12-11

Similar Documents

Publication Publication Date Title
CN102790841B (zh) 书籍的书脊区域中数字图像的检测和校正方法
CN111723585A (zh) 一种风格可控的图像文本实时翻译与转换方法
CN111310760B (zh) 结合局部先验特征和深度卷积特征的甲骨刻辞文字检测方法
CN110197153B (zh) 一种户型图中墙体自动识别方法
CN103048329B (zh) 一种基于主动轮廓模型的路面裂缝检测方法
CN109241973B (zh) 一种纹理背景下的字符全自动软分割方法
CN110659644B (zh) 书法单字的笔画自动提取方法
CN106709964B (zh) 基于梯度修正和多向纹理提取的素描画生成方法及装置
CN112070684B (zh) 基于形态先验特征的甲骨刻辞文字修复方法
CN104834890B (zh) 一种对书法作品中文字神采信息的提取方法
CN103093240A (zh) 书法字识别方法
CN108830857B (zh) 一种自适应的汉字碑帖图像二值化分割方法
CN110309830B (zh) 基于数学形态学和区域连通性的甲骨文字自动分割方法
JP2012527665A (ja) 芸術作品の原作者を識別するための装置および方法
CN107578039A (zh) 基于数字图像处理技术的字迹轮廓比对方法
Mello et al. Automatic image segmentation of old topographic maps and floor plans
CN114494306B (zh) 边缘梯度协方差引导的甲骨卜辞文字轮廓修复方法
CN115578741A (zh) 一种基于Mask R-cnn算法和类型分割的扫描文件版面分析方法
CN105373798B (zh) 一种基于k近邻抠图和数学形态学的书法字提取方法
CN113158977B (zh) 改进FANnet生成网络的图像字符编辑方法
CN108205678B (zh) 一种含有亮斑干扰的铭牌文字识别处理方法
CN113538498A (zh) 一种基于局部二值化的***图像分割方法、电子设备和可读存储介质
Park et al. A method for automatically translating print books into electronic Braille books
CN112712860A (zh) 一种基于真实金相图结构的晶粒有限元模型建模方法
CN107609482B (zh) 一种基于汉字笔画特征的中文文本图像倒置判别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant