CN111414877A - 去除颜色边框的表格裁切方法、图像处理设备和存储介质 - Google Patents

去除颜色边框的表格裁切方法、图像处理设备和存储介质 Download PDF

Info

Publication number
CN111414877A
CN111414877A CN202010225353.7A CN202010225353A CN111414877A CN 111414877 A CN111414877 A CN 111414877A CN 202010225353 A CN202010225353 A CN 202010225353A CN 111414877 A CN111414877 A CN 111414877A
Authority
CN
China
Prior art keywords
image
frame
outermost
border
hue saturation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010225353.7A
Other languages
English (en)
Other versions
CN111414877B (zh
Inventor
李佳
杨阳
刘旭东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telephase Technology Development Beijing Co ltd
Original Assignee
Telephase Technology Development Beijing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telephase Technology Development Beijing Co ltd filed Critical Telephase Technology Development Beijing Co ltd
Priority to CN202010225353.7A priority Critical patent/CN111414877B/zh
Publication of CN111414877A publication Critical patent/CN111414877A/zh
Application granted granted Critical
Publication of CN111414877B publication Critical patent/CN111414877B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种去除颜色边框的表格裁切方法,包括:获取待处理的图像,待处理的图像包括待提取文字,待提取文字处于至少一个边框中,至少部分至少一个边框的颜色不相同;计算待处理图像的每个像素的色调饱和值,生成色调饱和图像;提取色调饱和图像中对应至少一个边框的至少一个边框色调饱和值;对至少边框色调饱和值进行中值滤波,保留对应最***边框的最外色调饱和值,生成单边框图像;对单边框图像进行边缘检测,获取二值图像;对二值图像进行轮廓检测,并根据检测结果对单边框图像进行裁切,获取裁切图像;将裁切图像中的最***边框的颜色替换为白色,生成提取图像。通过上述方式,本发明能够有效提升工作效率,图像处理设备和存储介质。

Description

去除颜色边框的表格裁切方法、图像处理设备和存储介质
技术领域
本发明涉及领图像处理域,特别是涉及去除颜色边框的表格裁切方法、图像处理设备和存储介质。
背景技术
对于OCR(Optical Character Recognition,光学字符识别)表格文字提取中,有一种情况是文字图片里带有颜色表格。对于表格的裁切需要做边框过滤、边缘检测、轮廓检测和裁切这些步骤,然后才能准确提取表格框,为下一步文字识别准备。
目前针对颜色边框的表格裁切的应用中,对于不同颜色的边框,都是根据具体颜色,手动设置过滤条件,去除颜色,这样会每次修改内部参数,无法实现自动化处理,这样会产生工作效率低下。
发明内容
本发明主要解决的技术问题是提供去除颜色边框的表格裁切方法、图像处理设备和存储介质,能够实现对去除颜色边框的表格进行自动裁切,有效提升工作效率。
为解决上述技术问题,本发明采用的一个技术方案是:提供一种获取待处理的图像,所述待处理的图像包括待提取文字,所述待提取图文字处于至少一个边框中,至少部分所述至少一个边框的颜色不相同;计算所述待处理图像的每个像素的色调饱和值,生成色调饱和图像;提取所述色调饱和图像中对应所述至少一个边框的至少一个边框色调饱和值;对所述至少边框色调饱和值进行中值滤波,保留对应最***边框的最外色调饱和值,生成单边框图像;对所述单边框图像进行边缘检测,获取二值图像;对所述二值图像进行轮廓检测,并根据检测结果对所述单边框图像进行裁切,获取裁切图像;将所述裁切图像中的所述最***边框的颜色替换为白色,生成提取图像。
其中,所述提取所述色调饱和图像中对应所述至少一个边框的至少一个边框色调饱和值的步骤之后,包括:获取所述至少一个边框色调饱和值的最低值和最高值,根据所述最高值和所述最低值获取所述至少一个边框的对应区域。
其中,所述对所述单边框图像进行边缘检测的步骤,包括:采用高斯滤波器对所述单边框图像进行滤波,获取滤波图像;计算所述滤波图像每个像素点的梯度大小和梯度方向;对所述滤波图像进行非极大值抑制,获取抑制图像;采用双阈值法确定所述抑制图像的边缘。
其中,所述双阈值法中的最大阈值和最小阈值之差大于100。
其中,所述对所述单边框图像进行边缘检测的步骤之后,包括:根据所述最***边框的宽度和所述最***边框的行数获取最短线长;在所述边缘检测的图像结果上采用统计概率霍夫直线变换,所述统计概率霍夫直线变换的直线最短长度为所述最短线长。
其中,所述对所述二值图像进行轮廓检测的步骤之后,包括:压缩所述轮廓检测的结果水平方向、垂直方向和对角线方向的像素,仅保留水平方向、垂直方向和对角线方向的终点坐标。
其中,所述根据检测结果对所述单边框图像进行裁切的步骤,包括:从所述单边框图像的行和列的中心点开始,向左和向右各取等距离的正方形进行裁切。
为解决上述技术问题,本发明采用的另一个技术方案是:提供一种图像处理设备,包括:获取模块,用于获取待处理的图像,所述待处理的图像包括待提取文字,所述待提取图文字处于至少一个边框中,至少部分所述至少一个边框的颜色不相同;计算模块,用于计算所述待处理图像的每个像素的色调饱和值,生成色调饱和图像;提取模块,用于提取所述色调饱和图像中对应所述至少一个边框的至少一个边框色调饱和值;滤波模块,用于对所述至少边框色调饱和值进行中值滤波,保留对应最***边框的最外色调饱和值,生成单边框图像;边缘模块,用于对所述单边框图像进行边缘检测,获取二值图像;轮廓模块,用于对所述二值图像进行轮廓检测,并根据检测结果对所述单边框图像进行裁切,获取裁切图像;替换模块,用于将所述裁切图像中的所述最***边框的颜色替换为白色,生成提取图像。
为解决上述技术问题,本发明采用的另一个技术方案是:提供一种图像处理设备,包括:处理器和存储器,所述处理器耦接所述存储器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序以实现如上所述的方法。
为解决上述技术问题,本发明采用的另一个技术方案是:提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序能够被处理器执行以实现如上所述的方法。
本发明的有益效果是:区别于现有技术的情况,本发明引入HSV颜色对照表方法,自动识别对照表对应的颜色,为去除颜色边框的表格裁切提供技术支持,可以实现能够实现对去除颜色边框的表格进行自动裁切,有效提升生工作效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的去除颜色边框的表格裁切方法的第一实施例的流程示意图;
图2是本发明提供的去除颜色边框的表格裁切方法的第二实施例的流程示意图
图3是本发明提供的图像处理设备的第一实施例的结构示意图;
图4是本发明提供的图像处理设备的第二实施例的结构示意图;
图5是本发明提供的计算机可读存储介质的一实施例的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,图1是本发明提供的去除颜色边框的表格裁切方法的第一实施例的流程示意图。本发明提供的去除颜色边框的表格裁切方法包括:
S101:获取待处理的图像,待处理的图像包括待提取文字,待提取图文字处于至少一个边框中,至少部分至少一个边框的颜色不相同。
在一个具体的实施场景中,获取待处理的图像。待处理的图像中包括待提取的文字,待提取的文字处于至少一个边框中,至少一个边框的颜色不同。在提取文字时,需要将该不同颜色的边框去除,以实现对至少一个边框中包含的文字的提取。
在本实施场景中,至少一个边框的颜色不同,例如有三个边框,可以是一个边框的颜色和另外两个边框的颜色不同,也可以是三个边框的颜色都相同,即至少一个边框的颜色包括至少两种颜色。
S102:计算待处理图像的每个像素的色调饱和值,生成色调饱和图像。
在一个具体的实施场景中,计算待处理图像的每个像素的色调饱和值。在本实施场景中,待处理图像为RGB图像转换为HSV(Hue,Saturation,Value)图像。HSV(Hue,Saturation,Value)是根据颜色的直观特性由A.R.Smith在1978年创建的一种颜色空间,也称六角锥体模型(HexconeModel)。这个模型中颜色的参数分别是:色调(H),饱和度(S),亮度(V)。色调H,用角度度量,取值范围为0°~360°,从红色开始按逆时针方向计算,红色为0°,绿色为120°,蓝色为240°。它们的补色是:黄色为60°,青色为180°,品红为300°。饱和度S,取值范围为0.0~1.0,值越大,颜色越饱和。亮度V,取值范围为0(黑色)~255(白色)。对于光源色,亮度值与发光体的光亮度有关;对于物体色,此值和物体的透射比或反射比有关。RGB颜色模型都是面向硬件的,而HSV(Hue Saturation Value)颜色模型是面向用户的。
具体地说,根据以下公式计算每个像素的色调饱和值(HSV)值。
R’=R/255
G’=G/255
B’=B/255
Cmax=max(R’,G’,B’)
Cmin=min(R’,G’,B’)
△=Cmax-Cmin
Figure BDA0002427456500000051
Figure BDA0002427456500000052
V=Cmax
在本实施场景中,计算待处理图像的每个像素的色调饱和值,生成色调饱和图像。在其他实施场景中,也可以仅计算至少一个边框对应的区域的每个像素的色调饱和值,生成色调饱和图像。
S103:提取色调饱和图像中对应至少一个边框的至少一个边框色调饱和值。
在本实施场景中,HSV对照表可以从网络获取。自动获取至少一个边框的HSV值,通过均值和方差计算的结果,对比颜色HSV对照表,获取自动识别至少一个边框是哪种颜色。适用范围适合常用的红,橙,黄,绿,青,蓝,紫,黑,白,灰(颜色HSV对照表)。
在本发明中,获得待处理图像的HSV值以后,根据至少一个边框的框线HSV最低值和最高值进行过滤,提取至少一个边框的框线结果,其中,至少一个边框的框线HSV最低值和最高值通过不同颜色的HSV范围对照表查询获得。
S104:对至少边框色调饱和值进行中值滤波,保留对应最***边框的最外色调饱和值,生成单边框图像。
在本实施场景中,对至少一个边框的框线进行滤波,过滤最外层边框的框线以外的线条,保留最外层。在本实施场景中,采用中值滤波方法,去除掉里面的边框的框线,中值滤波的尺寸步长选择19*19,这样返回最外层边框的框线条,生成单边框图像。
在本实施场景中,单边框图像仅包括待处理图像的最***边框和待提取的文字。
S105:对单边框图像进行边缘检测,获取二值图像。
在本实施场景中,对单边框图像进行边缘检测,例如Canny边缘检测,获取二值图像。通过边缘检测可以去除单边框图像中的多于的轮廓信息。
S106:对二值图像进行轮廓检测,并根据检测结果对单边框图像进行裁切,获取裁切图像。
在本实施场景中,选择轮廓检测的检测模式,在本实施例中选择仅检测二值图像的外轮廓,根据轮廓检测的结果对单边框图像进行裁切,获取裁切图像。根据上述描述可知,裁切图像包括最***的边框以及最***边框内的待提取文字,最***边框具有颜色。
S107:将裁切图像中的最***边框的颜色替换为白色,生成提取图像。
在本实施场景中,获取裁切图像中的最***边框的颜色,将该颜色替换为白色,生成提取图像,此时提取图像中仅包括待提取文字,对提取图像进行文字提取操作即可获取待提取文字。其中,提取图像中文字的方法可以采用现有技术中提取图像中文字的方法,此处不再进行赘述。
通过上述描述可知,在本实施例中计算待处理图像的每个像素的色调饱和值,生成色调饱和图像,提取色调饱和图像中对应至少一个边框的至少一个边框色调饱和值;可以自动获取至少一个边框的颜色,保留对应最***边框的最外色调饱和值,将除最***边框的其他边框删除,生成单边框图像;将最***边框的颜色替换为白色,生成提取图像,可以实现对具有至少一个颜色不同的边框的图像中的待提取文字的自动提取,可以有效提升文字提取的工作效率。
请参阅图2,图2是本发明提供的颜色边框的表格裁切方法的第二实施例的流程示意图。本发明提供的颜色边框的表格裁切方法包括如下步骤:
S201:获取待处理的图像,待处理的图像包括待提取文字,待提取图文字处于至少一个边框中,至少部分至少一个边框的颜色不相同。
S202:计算待处理图像的每个像素的色调饱和值,生成色调饱和图像。
S203:提取色调饱和图像中对应至少一个边框的至少一个边框色调饱和值。
在一个具体的实施场景中,步骤S201-S203与本发明提供的去除颜色边框的表格裁切方法的第一实施例中的步骤S101-S103基本一致,此处不再进行赘述。
S204:获取至少一个边框色调饱和值的最低值和最高值,根据最高值和最低值获取至少一个边框的对应区域。
在本实施场景中,获取至少一个边框的色调饱和值之后,获取其中的最高值和最低值,根据最高值和最低值获取至少一个边框的对应区域。具体地说,可以获取每一个框线的对应区域或者是全部框线的对应区域。
S205:对至少边框色调饱和值进行中值滤波,保留对应最***边框的最外色调饱和值,生成单边框图像。
在一个具体的实施场景中,步骤S205与本发明提供的去除颜色边框的表格裁切方法的第一实施例中的步骤S104基本一致,此处不再进行赘述。
S206:采用高斯滤波器对单边框图像进行滤波,获取滤波图像。
在本实施场景中,采用高斯滤波器对单边框图像进行滤波。高斯滤波是一种线性平滑滤波,适用于消除高斯噪声,广泛应用于图像处理的减噪过程。通俗的讲,高斯滤波就是对整幅图像进行加权平均的过程,每一个像素点的值,都由其本身和邻域内的其他像素值经过加权平均后得到。高斯滤波的具体操作是:用一个模板(或称卷积、掩模)扫描图像中的每一个像素,用模板确定的邻域内像素的加权平均灰度值去替代模板中心像素点的值。经过高斯滤波获取的滤波图像中的高斯噪声将会有效降低,在可以有效提升后续获取额二值图像的图像质量。
S207:计算滤波图像每个像素点的梯度大小和梯度方向。
在本实施场景中,计算图像每个像素点的梯度大小和梯度方向,主要是为了捕获轮廓信息,同时进一步弱化光照的干扰,在后续的二值化操作之前去除更多的噪声。
由于图像在计算机中以数字图像的形式进行存储,即图像是离散的数字信号,对数字图像的梯度使用差分来代替连续信号中的微分。常见的梯度包括Roberts梯度、Sobel梯度、Prewitt梯度、Laplacian梯度等等。
例如,采用Sobel梯度,图像函数f(x,y)在点(x,y)的梯度是一个具有大小和方向的矢量,设Gx和Gy分别表示x方向和y方向的梯度,可采用由Sobel算子首先计算出Gx、Gy,然后计算梯度角θ=arctan(Gy/Gx),梯度方向及图像灰度增大的方向,其中梯度方向的梯度夹角大于平坦区域的梯度夹角。
S208:对滤波图像进行非极大值抑制,获取抑制图像。
在本实施场景中,基于步骤S207中获取额每个像素点的梯度值(包括梯度大小和梯度方向)通过非极大值抑制搜素局部最大值,抑制滤波图像中的极大值。
S209:采用双阈值法确定抑制图像的边缘。
在本实施场景中,采用双阈值法得到的边缘的像素点抗噪性好,边缘连续的同时又保证了边缘的准确性。双阈值选择使用最大阈值和最小阈值之差大于100,这样可以去掉很多轮廓信息。
S210:根据最***边框的宽度和最***边框的行数获取最短线长。
在本实施场景中,采用最***边框的宽度除以最***边框的行数获取最短线长。
S211:在边缘检测的图像结果上采用统计概率霍夫直线变换,统计概率霍夫直线变换的直线最短长度为最短线长。
在本实施场景中,统计概率霍夫直线变换是执行起来效率更高的霍夫线变换.它输出检测到的直线的端点,是一种用来寻找直线的方法,在边缘检测的图像结果(即为抑制图像)上采用统计概率霍夫直线变换可以准确获取抑制图像上的最***边框。在做统计概率霍夫直线变换时需要设置直线最短长度。在本实施场景中,将直线最短长度设置为最***边框宽度除以行数的值,这样获取的是最短线长,低于这个长度的线被忽略。
S212:对二值图像进行轮廓检测。
在一个具体的实施场景中,步骤S212与本发明提供的去除颜色边框的表格裁切方法的第一实施例中的步骤S106基本一致,此处不再进行赘述。
S213:压缩轮廓检测的结果水平方向、垂直方向和对角线方向的像素,仅保留水平方向、垂直方向和对角线方向的终点坐标。
在本实施场景中,压缩轮廓检测的结果(即抑制图像)水平方向、垂直方向和对角线方向的像素,仅保留水平方向、垂直方向和对角线方向的终点坐标。可以有效去除抑制图像中的空白部分,或者说是处最***框线框柱的区域的其他部分。
S214:从单边框图像的行和列的中心点开始,向左和向右各取等距离的正方形进行裁切,获取裁切图像。
在本实施场景中,裁剪图片可通过数组切片操作完成。从行和列的中心点开始,向左向右各取等距离的正方形进行裁切,获取裁切图像。在其他实施场景中,还可以是长方形或者其他图形。从行和列的中心点开始,向左和向右各取等距离的正方形进行裁切,可以有效避免将包括待提取文字的部分区域裁切掉,造成后续文字提取的结果误差。
S215:将裁切图像中的最***边框的颜色替换为白色,生成提取图像。
在一个具体的实施场景中,步骤S212与本发明提供的去除颜色边框的表格裁切方法的第一实施例中的步骤S107基本一致,此处不再进行赘述。
通过上述描述可知,在本实施例中双阈值选择使用最大阈值和最小阈值之差大于100,仅保留水平方向、垂直方向和对角线方向的终点坐标,可以有效去除多余的信息,提升文字提取的准确性。
请参阅图3,图3是本发明提供的图像处理设备的第一实施例的结构示意图。图像处理设备包括:获取模块11、计算模块12、提取模块13、滤波模块14、边缘模块15、轮廓模块16和替换模块17。获取模块11用于获取待处理的图像,待处理的图像包括待提取文字,待提取图文字处于至少一个边框中,至少部分至少一个边框的颜色不相同。计算模块12用于计算待处理图像的每个像素的色调饱和值,生成色调饱和图像。提取模块13用于提取色调饱和图像中对应至少一个边框的至少一个边框色调饱和值。滤波模块14用于对至少边框色调饱和值进行中值滤波,保留对应最***边框的最外色调饱和值,生成单边框图像。边缘模块15用于对单边框图像进行边缘检测,获取二值图像。轮廓模块16用于对二值图像进行轮廓检测,并根据检测结果对单边框图像进行裁切,获取裁切图像。替换模块17用于将裁切图像中的最***边框的颜色替换为白色,生成提取图像。
提取模块13还用于获取至少一个边框色调饱和值的最低值和最高值,根据最高值和最低值获取至少一个边框的对应区域。
边缘模块15还用于采用高斯滤波器对单边框图像进行滤波,获取滤波图像;计算滤波图像每个像素点的梯度大小和梯度方向;对滤波图像进行非极大值抑制,获取抑制图像;采用双阈值法确定抑制图像的边缘。
其中,双阈值法中的最大阈值和最小阈值之差大于100。
边缘模块15还用于据最***边框的宽度和最***边框的行数获取最短线长;在边缘检测的图像结果上采用统计概率霍夫直线变换,统计概率霍夫直线变换的直线最短长度为最短线长。
轮廓模块16用于压缩轮廓检测的结果水平方向、垂直方向和对角线方向的像素,仅保留水平方向、垂直方向和对角线方向的终点坐标。
轮廓模块16还用于从单边框图像的行和列的中心点开始,向左和向右各取等距离的正方形进行裁切。
通过上述描述可知,在本实施例中图像处理设备计算待处理图像的每个像素的色调饱和值,提取对应至少一个边框的至少一个边框色调饱和值;可以自动获取至少一个边框的颜色,保留对应最***边框的最外色调饱和值,将除最***边框的其他边框删除,将最***边框的颜色替换为白色,生成提取图像,可以实现对具有至少一个颜色不同的边框的图像中的待提取文字的自动提取,可以有效提升文字提取的工作效率。
请参阅图4,图4是本发明提供的图像处理设备的第二实施例的结构示意图,图像处理设备20包括处理器21、存储器22。处理器21耦接存储器22。存储器22中存储有计算机程序,处理器21在工作时执行该计算机程序以实现如图1-图3所示的方法。详细的方法可参见上述,在此不再赘述。
通过上述描述可知,在本实施例中图像处理设备计算待处理图像的每个像素的色调饱和值,提取对应至少一个边框的至少一个边框色调饱和值;可以自动获取至少一个边框的颜色,保留对应最***边框的最外色调饱和值,将除最***边框的其他边框删除,将最***边框的颜色替换为白色,生成提取图像,可以实现对具有至少一个颜色不同的边框的图像中的待提取文字的自动提取,可以有效提升文字提取的工作效率。
请参阅图5,图5是本发明提供的计算机可读存储介质的一实施例的结构示意图。计算机可读存储介质30中存储有至少一个计算机程序31,计算机程序31用于被处理器执行以实现如图1-图3所示的方法,详细的方法可参见上述,在此不再赘述。在一个实施例中,计算机可读存储介质30可以是终端中的存储芯片、硬盘或者是移动硬盘或者优盘、光盘等其他可读写存储的工具,还可以是服务器等等。
通过上述描述可知,在本实施例中计算机可读存储介质中的计算机程序可以用于计算待处理图像的每个像素的色调饱和值,提取对应至少一个边框的至少一个边框色调饱和值;可以自动获取至少一个边框的颜色,保留对应最***边框的最外色调饱和值,将除最***边框的其他边框删除,将最***边框的颜色替换为白色,生成提取图像,可以实现对具有至少一个颜色不同的边框的图像中的待提取文字的自动提取,可以有效提升文字提取的工作效率。
区别于现有技术,本发明引入HSV颜色对照表方法,自动识别对照表对应的颜色,为去除颜色边框的表格裁切提供技术支持,可以实现能够实现对去除颜色边框的表格进行自动裁切,有效提升生工作效率。
以上仅为本发明的实施方式,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种去除颜色边框的表格裁切方法,其特征在于,包括:
获取待处理的图像,所述待处理的图像包括待提取文字,所述待提取文字处于至少一个边框中,至少部分所述至少一个边框的颜色不相同;
计算所述待处理图像的每个像素的色调饱和值,生成色调饱和图像;
提取所述色调饱和图像中对应所述至少一个边框的至少一个边框色调饱和值;
对所述至少边框色调饱和值进行中值滤波,保留对应最***边框的最外色调饱和值,生成单边框图像;
对所述单边框图像进行边缘检测,获取二值图像;
对所述二值图像进行轮廓检测,并根据检测结果对所述单边框图像进行裁切,获取裁切图像;
将所述裁切图像中的所述最***边框的颜色替换为白色,生成提取图像。
2.根据权利要求1所述的方法,其特征在于,所述提取所述色调饱和图像中对应所述至少一个边框的至少一个边框色调饱和值的步骤之后,包括:
获取所述至少一个边框色调饱和值的最低值和最高值,根据所述最高值和所述最低值获取所述至少一个边框的对应区域。
3.根据权利要求1所述的方法,其特征在于,所述对所述单边框图像进行边缘检测的步骤,包括:
采用高斯滤波器对所述单边框图像进行滤波,获取滤波图像;
计算所述滤波图像每个像素点的梯度大小和梯度方向;
对所述滤波图像进行非极大值抑制,获取抑制图像;
采用双阈值法确定所述抑制图像的边缘。
4.根据权利要求3所述的方法,其特征在于,所述双阈值法中的最大阈值和最小阈值之差大于100。
5.根据权利要求3所述的方法,其特征在于,所述对所述单边框图像进行边缘检测的步骤之后,包括:
根据所述最***边框的宽度和所述最***边框的行数获取最短线长;
在所述边缘检测的图像结果上采用统计概率霍夫直线变换,所述统计概率霍夫直线变换的直线最短长度为所述最短线长。
6.根据权利要求1所述的方法,其特征在于,所述对所述二值图像进行轮廓检测的步骤之后,包括:
压缩所述轮廓检测的结果水平方向、垂直方向和对角线方向的像素,仅保留水平方向、垂直方向和对角线方向的终点坐标。
7.根据权利要求1所述的方法,其特征在于,所述根据检测结果对所述单边框图像进行裁切的步骤,包括:
从所述单边框图像的行和列的中心点开始,向左和向右各取等距离的正方形进行裁切。
8.一种图像处理设备,其特征在于,包括:
获取模块,用于获取待处理的图像,所述待处理的图像包括待提取文字,所述待提取图文字处于至少一个边框中,至少部分所述至少一个边框的颜色不相同;
计算模块,用于计算所述待处理图像的每个像素的色调饱和值,生成色调饱和图像;
提取模块,用于提取所述色调饱和图像中对应所述至少一个边框的至少一个边框色调饱和值;
滤波模块,用于对所述至少边框色调饱和值进行中值滤波,保留对应最***边框的最外色调饱和值,生成单边框图像;
边缘模块,用于对所述单边框图像进行边缘检测,获取二值图像;
轮廓模块,用于对所述二值图像进行轮廓检测,并根据检测结果对所述单边框图像进行裁切,获取裁切图像;
替换模块,用于将所述裁切图像中的所述最***边框的颜色替换为白色,生成提取图像。
9.一种图像处理设备,其特征在于,包括:处理器和存储器,所述处理器耦接所述存储器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序以实现如权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,存储有计算机程序,所述计算机程序能够被处理器执行以实现如权利要求1-7任一项所述的方法。
CN202010225353.7A 2020-03-26 2020-03-26 去除颜色边框的表格裁切方法、图像处理设备和存储介质 Active CN111414877B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010225353.7A CN111414877B (zh) 2020-03-26 2020-03-26 去除颜色边框的表格裁切方法、图像处理设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010225353.7A CN111414877B (zh) 2020-03-26 2020-03-26 去除颜色边框的表格裁切方法、图像处理设备和存储介质

Publications (2)

Publication Number Publication Date
CN111414877A true CN111414877A (zh) 2020-07-14
CN111414877B CN111414877B (zh) 2023-06-20

Family

ID=71491498

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010225353.7A Active CN111414877B (zh) 2020-03-26 2020-03-26 去除颜色边框的表格裁切方法、图像处理设备和存储介质

Country Status (1)

Country Link
CN (1) CN111414877B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113223041A (zh) * 2021-06-25 2021-08-06 上海添音生物科技有限公司 用于自动提取图像中目标区域的方法、***及存储介质
CN117935296A (zh) * 2024-02-06 2024-04-26 广东度才子集团有限公司 一种就业质量报告生成***

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000357237A (ja) * 1999-04-12 2000-12-26 Minolta Co Ltd 画像処理装置およびこれを搭載した画像読取装置と画像形成装置、並びに画像処理方法、および画像処理手順を記憶したコンピュータ読み取り可能な記憶媒体
JP2001268383A (ja) * 2000-03-23 2001-09-28 Ricoh Co Ltd 画像処理,読取,形成およびカラー複写、の各装置
CN101515325A (zh) * 2009-04-08 2009-08-26 北京邮电大学 基于字符切分和颜色聚类的数字视频中的字符提取方法
CN102968782A (zh) * 2012-09-12 2013-03-13 苏州大学 一种彩色图像中显著对象的自动抠取方法
CN109327646A (zh) * 2017-08-01 2019-02-12 佳能株式会社 图像处理装置、图像处理方法以及计算机可读存储介质
CN110599552A (zh) * 2019-08-30 2019-12-20 杭州电子科技大学 一种基于计算机视觉的pH试纸检测方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000357237A (ja) * 1999-04-12 2000-12-26 Minolta Co Ltd 画像処理装置およびこれを搭載した画像読取装置と画像形成装置、並びに画像処理方法、および画像処理手順を記憶したコンピュータ読み取り可能な記憶媒体
JP2001268383A (ja) * 2000-03-23 2001-09-28 Ricoh Co Ltd 画像処理,読取,形成およびカラー複写、の各装置
CN101515325A (zh) * 2009-04-08 2009-08-26 北京邮电大学 基于字符切分和颜色聚类的数字视频中的字符提取方法
CN102968782A (zh) * 2012-09-12 2013-03-13 苏州大学 一种彩色图像中显著对象的自动抠取方法
CN109327646A (zh) * 2017-08-01 2019-02-12 佳能株式会社 图像处理装置、图像处理方法以及计算机可读存储介质
CN110599552A (zh) * 2019-08-30 2019-12-20 杭州电子科技大学 一种基于计算机视觉的pH试纸检测方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113223041A (zh) * 2021-06-25 2021-08-06 上海添音生物科技有限公司 用于自动提取图像中目标区域的方法、***及存储介质
CN113223041B (zh) * 2021-06-25 2024-01-12 上海添音生物科技有限公司 用于自动提取图像中目标区域的方法、***及存储介质
CN117935296A (zh) * 2024-02-06 2024-04-26 广东度才子集团有限公司 一种就业质量报告生成***

Also Published As

Publication number Publication date
CN111414877B (zh) 2023-06-20

Similar Documents

Publication Publication Date Title
CN110008954B (zh) 一种基于多阈值融合的复杂背景文本图像提取方法及***
KR101683704B1 (ko) 얼굴 보정 방법, 시스템 및 컴퓨터 저장 매체
CN109544583B (zh) 一种提取皮革图像感兴趣区域的方法、装置及设备
JP2016505186A (ja) エッジ保存・ノイズ抑制機能を有するイメージプロセッサ
JP2003228712A (ja) イメージからテキスト状のピクセルを識別する方法
CN110930321A (zh) 一种能够自动选取目标区域的蓝/绿幕数字图像抠取方法
JP5974589B2 (ja) 画像処理装置およびプログラム
CN112887693B (zh) 图像紫边消除方法、设备及存储介质
US8447113B2 (en) Character area extracting device, imaging device having character area extracting function, recording medium saving character area extracting programs, and character area extracting method
US9153013B2 (en) Image processing apparatus, image processing method and computer readable medium
CN111414877B (zh) 去除颜色边框的表格裁切方法、图像处理设备和存储介质
CN110276279B (zh) 一种基于图像分割的任意形状场景文本探测方法
CN109754423B (zh) 一种叶片病斑覆盖区域的提取方法和设备
CN104361335B (zh) 一种基于扫描图像自动去除黑边的处理方法
CN115272362A (zh) 一种数字病理全场图像有效区域分割方法、装置
JP3814353B2 (ja) 画像分割方法および画像分割装置
CN115995078A (zh) 一种浮游生物原位观测的图像预处理方法及***
US7693329B2 (en) Bound document scanning method and apparatus
CN110807747B (zh) 一种基于前景蒙版的文档图像降噪方法
JP2003256834A (ja) 顔領域抽出及び顔構成要素位置判定装置
JPH1125222A (ja) 文字切り出し方法及び文字切り出し装置
Hong et al. A single image dehazing method based on adaptive gamma correction
CN108133204B (zh) 一种手体识别方法、装置、设备及计算机可读存储介质
CN109934215B (zh) 一种身份证识别方法
CN110458012B (zh) 多角度人脸识别方法及装置、存储介质和终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant