CN104867114B - 一种基于条件随机场的古籍扫描图像背面渗透盲去除方法 - Google Patents
一种基于条件随机场的古籍扫描图像背面渗透盲去除方法 Download PDFInfo
- Publication number
- CN104867114B CN104867114B CN201510168613.0A CN201510168613A CN104867114B CN 104867114 B CN104867114 B CN 104867114B CN 201510168613 A CN201510168613 A CN 201510168613A CN 104867114 B CN104867114 B CN 104867114B
- Authority
- CN
- China
- Prior art keywords
- back side
- image
- background
- side infiltration
- random field
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开了一种基于条件随机场的古籍文本图像背面渗透盲去除方法。它包括以下步骤:先建立文本图像的随机概率分布模型,将图像分为前景部分,背面渗透部分以及背景部分三个组成成分,得到三者的灰度直方图的逼近函数,并采用K‑means算法得到三者的参数估计,然后建立条件随机场模型对输入图像进行细分类,利用置信传播算法识别背面渗透部分,最后通过随机填充算法修复图像,得到最终的无背面渗透部分的文本扫描图像。本发明采用条件随机场与随即填充修复算法相结合的方法,能够完善的保留文本图像的前景部分,并有效地移除背面渗透部分,大大改善文本扫描图像的视觉效果,解决了历史文本扫描图像的显示和打印等问题,具有很高的实际应用价值。
Description
技术领域
本发明涉及一种文本图像的处理方法,更具体的说是一种基于条件随机场的古籍扫描图像背面渗透盲去除方法。
背景技术
由于古籍文本稀少珍贵,现代的保护方法往往是把这些古籍数字化,以扫描图像的方式供研究人员翻阅。由于古籍纸张质量或者长时间保存的问题,许多双面书写或印刷的古籍都发生了背面渗透的现象,即墨水从纸张的另一面渗出的另一面的现象。这种现象会使古籍文本的内容难以阅读,同时,也影响了某些珍贵手稿的视觉美感。
为了解决上述问题,现已提出很多背面渗透移除的方法。目前来说,这些方法大致可分为两类:盲去除方法和非盲去除方法。非盲去除方法需要一页古籍准确对齐的正反两面的扫描图像。由于自动配准正反两面的图像依然存在诸多难点,因此这类工作通常需要大量人工来完成。与之相对,盲去除方法只需要纸张的单面图像,避免了图像配准问题。A.Tonazzini等人提出使用盲源分离技术,将输入图像看作前景部分、背面渗透部分和背景部分的混合信号,并采用独立成分分析算法计算试图将这三部分恢复出来。因为这种方法需要不同的传感器搜集到的相同对象的信号,所以此方法需要彩色扫描图像。在此之外,同一作者又提出利用马尔科夫随机场和EM算法来解决盲源分离问题。有别于信号分离的想法,C.Wolf将背面渗透去除看作图像分割问题,提出基于双隐藏层的马尔科夫随机场和单一观测场方法。该方法通过最大流算法交替更新两个马尔可夫随机场的隐含值,直至收敛到最终的分割结果。但是这类算法计算消耗过高,很难满足一些实际应用要求。
发明内容
为了解决古籍扫描图像背面渗透盲去除存在的上述技术问题,本发明提供一种基于条件随机场的古籍扫描图像盲去除方法。本发明有效的去除文本扫描图像中的背面渗透部分,同时又较好的保证文本前景部分的完整性,提高了文本图像的可读性。
本发明解决上述问题的技术方案包括以下步骤:
1)将已知类别标签的扫描图像分为前景部分、背面渗透部分、背景部分,并建立图像前景部分、背面渗透部分、背景部分的条件概率分布模型,得到前景、背面渗透、背景三部分的逼近函数;
2)根据步骤1)得到的逼近函数,用未知类别标签的文本图像作为输入,采用基于K-means聚类算法得到未知类别标签的文本图像的前景部分、背面渗透部分、背景部分,并计算图像前景部分、背面渗透部分、背景部分的灰度平均值和方差;
3)对输入图像建立条件随机场模型,并根据步骤2)得到的图像前景部分、背面渗透部分、背景部分的灰度平均值和方差对图像进行细分类,得到背面渗透部分;
4)修复已分类的图像,去除背面渗透部分,得到最终的无背面渗透部分的图像。
本发明的技术效果在于:本发明将古籍文本图像分成三个不同的组成部分,并建立条件概率分布模型;利用K-means算法初始分类之后,估计出三种组份的参数;在此基础上,建立输入图像的条件随机场,通过信念传播算法确定每个像素对应的类别标签;最后采用随机填充算法修复图像中的背面渗透区域,去除图像中的背面渗透盲。本发明能有效去除图像中的背面渗透部分,较好的保存前景部分,大大提高了图像的可读性。
附图说明
图1为本发明的处理流程图;
图2为不同分类方法的文本扫描图像分类结果比较;左起第一列为原文本图像,第二列为K-means聚类算法的结果,第三列为本发明基于条件随机场方法的结果。
图3为不同分类方法的前景像素分类准确率和召回率比较;
图4为不同背面渗透移除方法的文本扫描图像结果比较;
图4中左起第一列为原文本图像,第二列为K-means聚类结合随机填充算法的结果,第三列为本发明的结果。
具体实施方式
图1为本发明的处理流程图。如图所示,本发明先建立文本图像的随机概率分布模型,将图像分为前景部分,背面渗透部分以及背景部分三个组成成分,得到三者的灰度直方图的逼近函数,并采用K-means算法得到三者的参数估计,然后建立条件随机场模型对输入图像进行细分类,利用置信传播算法识别背面渗透部分,最后通过随机填充算法修复图像,得到最终的无背面渗透部分的文本扫描图像。
输入为带有背面渗透的灰度古籍图像,输出为无背面渗透的灰度古籍图像。本发明的详细步骤如下:
1.将已知类别标签的扫描图像分为前景部分、背面渗透部分、背景部分,并建立图像三种成分的条件概率分布模型。整幅图像、前景部分、背面渗透部分和背景部分的灰度直方图分别为H,Hfg,Hbt,Hbg。则每种成分条件概率分布如公式(1)、(2)、(3)所示。
其中s是类别标签,d是灰度值。P(s=0|d),P(s=1|d),P(s=2|d)分别为前景,背面渗透,背景部分条件概率分布。我们选择逻辑函数模拟前景和背景部分的条件概率分布,选择高斯函数模拟背面渗透部分的条件概率分布。
其中是高斯函数的幅值因子,(u0,u1,u2)是中心位置因子,(σ0,σ1,σ2)是形状因子。
2.对于未知类别标签的输入图像,将出现次数最多的灰度值作为背景组份的平均灰度c2,然后采用(7)式根据灰度值大于等于平均灰度的像素估计出背景组份的方差。
其中N是输入图像的像素总数,1{f}为标记函数,当表达式f>0时,函数值为1,否则为0,Ij和Ik分别表示图像I中的第j和k个像素。
3.根据估计出的背景组份的平均灰度和方法,从整个输入图像的直方图中,减去背景组份,然后采用大津法根据剩余的直方图确定区分前景组份和背景渗透组份的灰度阈值,并根据阈值划分的结果来计算前景组份和背面渗透组份的灰度平均值,依次记为c0和c1。
4.根据以上步骤得到的三个组份的灰度平均值和方差,可以直接确定反面渗透组份的条件概率模型;通过固定前景组份条件概率模型在前景组份平均值和反面渗透组份平均值处的概率值和可以用公式(8)和(9)计算出前景组份条件概率模型的两个参数的值;同理,通过固定背景组份条件概率模型在反面渗透组份平均值和背景组份平均值处的概率值和可以用公式(10)和(11)计算出背景组份条件概率模型的两个参数的值。
5.对输入图像建立条件随机场模型。模型包括一个隐藏的马尔科夫随机场和一个观察场,即每个像素对应一个观察节点和一个隐藏节点。观察节点的值为像素灰度值,隐藏节点的值可能为0(前景),1(背面渗透),2(背景)中的一个,取决于以下最优化函数的解:
其中si待估计的隐藏节点,D是观察场,S是隐藏类别场,根据马尔科夫场的性质:
其中di是si对应的观察节点的值,Ni是si在隐藏场中领域的相邻节点集合。利用置信传播算法来逼近此问题的最优解。(置信传播算法的具体实施细节参考J.S.Yedidia等人于2005年发表在IEEE Trans.Inf.Theory上的论文J.S.Yedidia,W.T.Freeman andY.Weiss,Constructing Free-Energy Approximations and Generalized BeliefPropagation Algorithms,IEEE Trans.Inf.Theory,vol.51,no.7,pp.2282-2312,Jul.2005.)6.基于条件随机场分类之后的图像,采用随机填充算法修复背面渗透部分。随机选择每一个背面渗透部分的像素邻域的像素值取代原像素值,达到去除背面渗透部分目的:
其中R是随机选择函数,是待处理的背面渗透部分像素,Wk是的局部邻域,Dbg是背景部分像素集。
本发明所提出的基于条件随机场的分类方法与基于K-means聚类算法的分类方法进行了比较。附图2左起第一列是原图像,第二列为K-means聚类算法的结果,第三列为本发明基于条件随机场方法的结果。可以看出,基于K-means聚类算法的结果又许多噪声,而本发明的结果有更为正确且平滑的边缘。
为了客观的评价分类结果,根据数据库中提供的真实值,评价标准包括准确率及召回率,计算如下:
其中是分类算法得到的类别,Sgt是类别的真实值。从附图3可以看出,本发明提出的算法比K-means算法具有更高的召回率,但是某一些图像上的准确率不及K-means算法。对于历史文本扫面图像来说,前景部分更应受到重视,所以召回率的重要性大于准确率。
附图4展示了背面渗透移除的最终结果,通过比较,本发明提出的算法比K‐means算法对前景部分的保护更好。即使输入图像有较大的对比度和灰度变化,本发明提出的算法也可以有效的去除背面渗透部分。
Claims (3)
1.一种基于条件随机场的古籍扫描图像背面渗透盲去除方法,包括以下步骤:
1)将已知类别标签的扫描图像分为前景部分、背面渗透部分、背景部分,并建立图像前景部分、背面渗透部分、背景部分的条件概率分布模型,得到前景、背面渗透、背景三部分的逼近函数;
2)根据步骤1)得到的逼近函数,用未知类别标签的文本图像作为输入,采用基于K-means聚类算法得到未知类别标签的文本图像的前景部分、背面渗透部分、背景部分,并计算图像前景部分、背面渗透部分、背景部分的灰度平均值和方差;
3)对输入图像建立条件随机场模型,并根据步骤2)得到的图像前景部分、背面渗透部分、背景部分的灰度平均值和方差对图像进行细分类,得到背面渗透部分;其具体步骤为:条件随机场模型包括一个隐藏的马尔科夫随机场和一个观察场,观察节点的值即为像素灰度值,隐藏的马尔科夫节点值为类别标签,利用置信传播算法来逼近最优解,得到背面渗透区域;
4)修复已分类的图像,去除背面渗透部分,得到最终的无背面渗透部分的图像;具体步骤为:采用随机填充算法,在背面渗透像素邻域内随机选择一个背景像素灰度值,取代原灰度值,去除背面渗透区域。
2.根据权利要求1所述的基于条件随机场的古籍扫描图像背面渗透盲去除方法,其特征在于,所述的步骤1)的具体步骤为:采用逻辑函数来近似前景和背景条件概率分布,其概率分布如下:
其中s是类别标签,d是灰度值,(u0,u2)为中心位置因子,(σ0,σ2)为形状 因子;
采用高斯函数近似背面渗透部分的条件概率分布如下:
其中为幅度因子,u1和σ1分别为中心位置因子和形状因子。
3.根据权利要求1所述的基于条件随机场的古籍扫描图像背面渗透盲去除方法,其特征在于,所述的步骤2)的具体步骤为:对于未知类别标签的输入图像,将出现次数最多的灰度值作为背景组份的平均灰度c2,并估计出背景组份的方差如下:
其中N是输入图像的像素总数,1{f}为标记函数,当表达式f>0时,函数值为1,否则为0,Ij和Ik分别表示图像I中的第j和k个像素;
根据估计出的背景组份的平均灰度和方法,从整个输入图像的直方图中,减去背景组份,然后采用大津法根据剩余的直方图确定区分前景组份和背景渗透组份的灰度阈值,并根据阈值划分的结果来计算前景组份和背面渗透组份的灰度平均值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510168613.0A CN104867114B (zh) | 2015-04-13 | 2015-04-13 | 一种基于条件随机场的古籍扫描图像背面渗透盲去除方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510168613.0A CN104867114B (zh) | 2015-04-13 | 2015-04-13 | 一种基于条件随机场的古籍扫描图像背面渗透盲去除方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104867114A CN104867114A (zh) | 2015-08-26 |
CN104867114B true CN104867114B (zh) | 2018-01-09 |
Family
ID=53912931
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510168613.0A Expired - Fee Related CN104867114B (zh) | 2015-04-13 | 2015-04-13 | 一种基于条件随机场的古籍扫描图像背面渗透盲去除方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104867114B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105631837A (zh) * | 2015-10-27 | 2016-06-01 | 江苏思曼特信用管理有限公司 | 文本图像背面渗透的移除方法 |
CN106023090A (zh) * | 2016-03-17 | 2016-10-12 | 陈于中 | 一种消除拍摄得到的页面图像中透出的背面内容的方法 |
US10740644B2 (en) * | 2018-02-27 | 2020-08-11 | Intuit Inc. | Method and system for background removal from documents |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1687961A (zh) * | 2005-04-19 | 2005-10-26 | 浙江大学 | 一种计算机辅助的国画真伪鉴别方法 |
US8194965B2 (en) * | 2007-11-19 | 2012-06-05 | Parascript, Llc | Method and system of providing a probability distribution to aid the detection of tumors in mammogram images |
CN103530405A (zh) * | 2013-10-23 | 2014-01-22 | 天津大学 | 一种基于分层结构的图像检索方法 |
-
2015
- 2015-04-13 CN CN201510168613.0A patent/CN104867114B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1687961A (zh) * | 2005-04-19 | 2005-10-26 | 浙江大学 | 一种计算机辅助的国画真伪鉴别方法 |
US8194965B2 (en) * | 2007-11-19 | 2012-06-05 | Parascript, Llc | Method and system of providing a probability distribution to aid the detection of tumors in mammogram images |
CN103530405A (zh) * | 2013-10-23 | 2014-01-22 | 天津大学 | 一种基于分层结构的图像检索方法 |
Non-Patent Citations (8)
Title |
---|
A Ground Truth Bleed-Through Document Image Database;Roisın Rowley-Brooke 等;《International Conference on Theory and Practice of Digital Libraries. Springer-Verlag》;20121231;1-4 * |
A Markov Model for Blind Image Separation by a Mean-Field EM Algorithm;Anna Tonazzini 等;《IEEE TRANSACTIONS ON IMAGE PROCESSING》;20060228;第15卷(第2期);473-482 * |
Document Ink Bleed-Through Removal with Two Hidden Markov Random Fields and a Single Observation Field;Christian Wolf;《IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE》;20100331;第32卷(第3期);摘要,第1-3章,第5章,第6.1节,第6.2节 * |
Improving recto document side restoration with an estimation of the verso side from a single scanned page;Christian Wolf;《International Conference on Pattern Recognition》;20091231;185-196 * |
Independent component analysis for document restoration;Anna Tonazzini 等;《International Journal on Document Analysis and Recognition (IJDAR)》;20040430;第7卷(第1期);17-27 * |
Scanned Image Descreening With Image Redundancy and Adaptive Filtering;Bin Sun 等;《IEEE TRANSACTIONS ON IMAGE PROCESSING》;20140831;第23卷(第8期);3698-3710 * |
基于条件随机场的复杂背景图像文字分割;王佳鑫 等;《现代电子技术》;20110401;第34卷(第7期);0引言,第1节 * |
条件随机场模型的场景描述;赵龙 等;《中国图象图形学报》;20130316;第18卷(第3期);271-276 * |
Also Published As
Publication number | Publication date |
---|---|
CN104867114A (zh) | 2015-08-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108562589B (zh) | 一种对磁路材料表面缺陷进行检测的方法 | |
CN111145209B (zh) | 一种医学图像分割方法、装置、设备及存储介质 | |
Poletti et al. | A review of thresholding strategies applied to human chromosome segmentation | |
CN104156693B (zh) | 一种基于多模态序列融合的动作识别方法 | |
CN109241973B (zh) | 一种纹理背景下的字符全自动软分割方法 | |
CN103473739A (zh) | 一种基于支持向量机的白细胞图像精确分割方法与*** | |
WO2022012110A1 (zh) | 胚胎光镜图像中细胞的识别方法及***、设备及存储介质 | |
CN111340824B (zh) | 一种基于数据挖掘的图像特征分割方法 | |
CN106127817B (zh) | 一种基于通道的图像二值化方法 | |
CN110189383B (zh) | 基于机器学习的中医舌色苔色定量分析方法 | |
CN109035274A (zh) | 基于背景估计与u型卷积神经网络的文档图像二值化方法 | |
CN109712095B (zh) | 一种快速边缘保留的人脸美化方法 | |
Shaker et al. | Automatic detection and segmentation of sperm head, acrosome and nucleus in microscopic images of human semen smears | |
CN109598681B (zh) | 一种对称唐卡修复后图像的无参考质量评价方法 | |
CN109002755A (zh) | 基于人脸图像的年龄估计模型构建方法及估计方法 | |
CN110728302A (zh) | 一种基于HSV和Lab颜色空间的色纺织物组织识别的方法 | |
CN106529432A (zh) | 一种深度融合显著性检测与先验知识的手部区域分割方法 | |
CN104021566A (zh) | 基于GrabCut算法的舌诊图像自动分割方法 | |
CN104867114B (zh) | 一种基于条件随机场的古籍扫描图像背面渗透盲去除方法 | |
CN112287765B (zh) | 人脸活体检测方法、装置、设备及可读存储介质 | |
CN107705323A (zh) | 一种基于卷积神经网络的水平集目标追踪方法 | |
CN113592783A (zh) | 角膜共聚焦图像中细胞基础指标的精准量化方法及装置 | |
CN103268492B (zh) | 一种玉米籽粒类型识别方法 | |
CN104268845A (zh) | 极值温差短波红外图像的自适应双局部增强方法 | |
CN106780535A (zh) | 一种灰度图像处理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
EXSB | Decision made by sipo to initiate substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20180109 Termination date: 20180413 |