CN111368638A - 电子表格的创建方法、装置、计算机设备和存储介质 - Google Patents

电子表格的创建方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN111368638A
CN111368638A CN202010084618.6A CN202010084618A CN111368638A CN 111368638 A CN111368638 A CN 111368638A CN 202010084618 A CN202010084618 A CN 202010084618A CN 111368638 A CN111368638 A CN 111368638A
Authority
CN
China
Prior art keywords
image
boundary line
structure information
actual cell
form image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010084618.6A
Other languages
English (en)
Inventor
夏晓玲
万爽
陆昱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Zhuiyi Technology Co Ltd
Original Assignee
Shenzhen Zhuiyi Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Zhuiyi Technology Co Ltd filed Critical Shenzhen Zhuiyi Technology Co Ltd
Priority to CN202010084618.6A priority Critical patent/CN111368638A/zh
Publication of CN111368638A publication Critical patent/CN111368638A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/20Image enhancement or restoration using local operators
    • G06T5/30Erosion or dilatation, e.g. thinning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Character Input (AREA)

Abstract

本申请涉及一种电子表格的创建方法、装置、计算机设备和存储介质。所述方法包括:获取待录入的表格图像;对所述表格图像进行图像处理,得到与所述表格图像对应的表格结构信息;所述表格结构信息包括每个实际单元格的大小和位置;对所述表格图像进行文字识别,得到与所述表格图像对应的文字信息;所述文字信息包括每个实际单元格的文字;基于所述表格结构信息和所述文字信息,创建电子表格。采用本方法能够在将表格图像转换为电子表格时,适用于存在复杂结构的表格。

Description

电子表格的创建方法、装置、计算机设备和存储介质
技术领域
本申请涉及图像处理技术领域,特别是涉及一种电子表格的创建方法、装置、计算机设备和存储介质。
背景技术
随着科技的发展,常常对纸质表格采用人工转录成电子表格的方式进行文档存储。但是,人工转录表格的工作量非常大,因此,出现了自动转录表格技术,为人们提供了极大地帮助。
在相关技术中,自动转录表格技术通常是将表格图像输入到神经网络模型中,神经网络模型输出表格识别结果,然后根据表格识别结果重建电子表格。
但是,采用神经网络模型进行表格识别,需要大量的训练数据,而人工标注的训练数据不容易获得;并且,对于复杂结构的表格,比如表格中存在拆分单元格、合并单元格等情况,则会增加神经网络模型的训练难度。
发明内容
基于此,有必要针对上述技术问题,提供一种能够适用于复杂结构表格的电子表格的创建方法、装置、计算机设备和存储介质。
一种电子表格的创建方法,该方法包括:
获取待录入的表格图像;
对表格图像进行图像处理,得到与表格图像对应的表格结构信息;表格结构信息包括每个实际单元格的大小和位置;
对表格图像进行文字识别,得到与表格图像对应的文字信息;文字信息包括每个实际单元格的文字;
基于表格结构信息和文字信息,创建电子表格。
在其中一个实施例中,上述对表格图像进行图像处理,得到与表格图像对应的表格结构信息,包括:
对表格图像进行二值化处理,得到二值化图像;
对二值化图像进行图像处理,得到最小粒度单元格的边界线;
对二值化图像进行连通区域分析,得到实际单元格的边界线;
根据最小粒度单元格的边界线和实际单元格的边界线,得到表格结构信息。
在其中一个实施例中,上述对二值化图像进行图像处理,得到最小粒度单元格的边界线,包括:
对二值化图像进行膨胀处理和腐蚀处理,得到二值化图像中横线与竖线的交点;
对交点进行水平方向投影,得到最小粒度单元格在水平方向的边界线;
对交点进行竖直方向投影,得到最小粒度单元格在竖直方向的边界线。
在其中一个实施例中,上述根据最小粒度单元格的边界线和实际单元格的边界线,得到表格结构信息,包括:
根据最小粒度单元格的边界线,确定最小粒度单元格的行数和列数;
根据实际单元格的边界线,确定每个实际单元格所占用的最小粒度单元格的数量和位置,得到表格结构信息。
在其中一个实施例中,上述对表格图像进行文字识别,得到与表格图像对应的文字信息,包括:
根据实际单元格的边界线对表格图像进行分割,得到多个分割图像;
将各分割图像分别输入到预先训练的文字识别模型中,得到各实际单元格对应的文字。
在其中一个实施例中,在上述对表格图像进行图像处理,得到与表格图像对应的表格结构信息之前,该方法还包括:
对表格图像进行直线检测,得到表格图像中的多条直线,以及每条直线与参考坐标轴之间的夹角;
根据多个夹角计算目标旋转角度;
根据目标旋转角度对表格图像进行旋转处理,得到矫正后的表格图像。
在其中一个实施例中,上述基于表格结构信息和文字信息,创建电子表格,包括:
根据表格结构信息中每个实际单元格的大小和位置,绘制表格边框;
根据文字信息中每个实际单元格的文字进行填充处理,得到电子表格。
一种电子表格的创建装置,所述装置包括:
表格图像获取模块,用于获取待录入的表格图像;
表格结构信息获得模块,用于对表格图像进行图像处理,得到与表格图像对应的表格结构信息;表格结构信息包括每个实际单元格的大小和位置;
文字信息获得模块,用于对表格图像进行文字识别,得到与表格图像对应的文字信息;文字信息包括每个实际单元格的文字;
电子表格创建模块,用于基于表格结构信息和文字信息,创建电子表格。
在其中一个实施例中,表格结构信息获得模块,具体用于对表格图像进行二值化处理,得到二值化图像;对二值化图像进行图像处理,得到最小粒度单元格的边界线;对二值化图像进行连通区域分析,得到实际单元格的边界线;根据最小粒度单元格的边界线和实际单元格的边界线,得到表格结构信息。
在其中一个实施例中,表格结构信息获得模块,具体用于对二值化图像进行膨胀处理和腐蚀处理,得到二值化图像中横线与竖线的交点;对交点进行水平方向投影,得到最小粒度单元格在水平方向的边界线;对交点进行竖直方向投影,得到最小粒度单元格在竖直方向的边界线。
在其中一个实施例中,表格结构信息获得模块,具体用于根据最小粒度单元格的边界线,确定最小粒度单元格的行数和列数;根据实际单元格的边界线,确定每个实际单元格所占用的最小粒度单元格的数量和位置,得到表格结构信息。
在其中一个实施例中,文字信息获得模块,具体用于根据实际单元格的边界线对表格图像进行分割,得到多个分割图像;将各分割图像分别输入到预先训练的文字识别模型中,得到各实际单元格对应的文字。
在其中一个实施例中,该装置还包括:
矫正模块,用于对表格图像进行直线检测,得到表格图像中的多条直线,以及每条直线与参考坐标轴之间的夹角;根据多个夹角计算目标旋转角度;根据目标旋转角度对表格图像进行旋转处理,得到矫正后的表格图像。
在其中一个实施例中,电子表格创建模块,具体用于根据表格结构信息中每个实际单元格的大小和位置,绘制表格边框;根据文字信息中每个实际单元格的文字进行填充处理,得到电子表格。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取待录入的表格图像;
对表格图像进行图像处理,得到与表格图像对应的表格结构信息;表格结构信息包括每个实际单元格的大小和位置;
对表格图像进行文字识别,得到与表格图像对应的文字信息;文字信息包括每个实际单元格的文字;
基于表格结构信息和文字信息,创建电子表格。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取待录入的表格图像;
对表格图像进行图像处理,得到与表格图像对应的表格结构信息;表格结构信息包括每个实际单元格的大小和位置;
对表格图像进行文字识别,得到与表格图像对应的文字信息;文字信息包括每个实际单元格的文字;
基于表格结构信息和文字信息,创建电子表格。
上述电子表格的创建方法、装置、计算机设备和存储介质,先获取待录入的表格图像;再对表格图像进行图像处理,得到与表格图像对应的表格结构信息;然后,对表格图像进行文字识别,得到与表格图像对应的文字信息;最后,基于表格结构信息和文字信息,创建电子表格。通过本申请实施例,从表格图像提取出表格结构信息采用图像处理,适用于存在拆分单元格、合并单元格等复杂结构的表格;从表格图像中提取出文字信息也不需要复杂的神经网络模型,降低了神经网络模型的训练难度。
附图说明
图1为一个实施例中电子表格的创建方法的应用环境图;
图2为一个实施例中电子表格的创建方法的流程示意图;
图3为一个实施例中得到与表格图像对应的表格结构信息步骤的流程示意图;
图4a为一个实施例中的表格的结构示意图之一;
图4b为一个实施例中的表格的结构示意图之二;
图4c为一个实施例中的表格的结构示意图之三;
图5为另一个实施例中电子表格的创建方法的流程示意图;
图6为一个实施例中电子表格的创建装置的结构框图;
图7为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的电子表格的创建方法,可以应用于如图1所示的应用环境中。该应用环境中可以包括终端102,由终端102获取待录入的表格图像并进行电子表格的创建。该应用环境也可以包括服务器104,由服务器104获取待录入的表格图像并进行电子表格的创建。该应用环境还可以包括终端102和服务器104,终端102与服务器104通过网络进行通信,由终端102确定待录入的表格图像,由服务器104进行电子表格的创建。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种电子表格的创建方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤201,获取待录入的表格图像。
本申请实施例中,纸质表格文档可以通过扫描或者拍摄等方式转换为待录入的表格图像,表格图像中含有待创建的表格。服务器获取待录入的表格图像具体可以包括:预先在终端中存储多个表格图像,终端将用户选取的待录入的表格图像发送至服务器,服务器接收终端发送的待录入的表格图像;或者,预先在服务器中存储多个表格图像,用户通过终端选取待录入的表格图像,服务器根据用户的选取操作获取本地存储的待录入的表格图像。本申请实施例对获取方式不作详细限定,可以根据实际情况进行设置。
步骤202,对表格图像进行图像处理,得到与表格图像对应的表格结构信息;表格结构信息包括每个实际单元格的大小和位置。
本申请实施例中,表格图像中的表格含有线条和文字,文字包括汉字、数字等各种字符。在获取到表格图像之后,可以对表格图像进行图像处理,去除表格中的文字,只保留表格中的线条。其中,图像处理可以采用二值化处理、膨胀处理、腐蚀处理等,本申请实施例对此不作详细限定,可以根据实际情况进行设置。在得到表格中的线条后,可以根据线条的坐标位置确定表格图像中每个实际单元格的大小和位置,从而得到与表格图像对应的表格结构信息。
步骤203,对表格图像进行文字识别,得到与表格图像对应的文字信息;文字信息包括每个实际单元格的文字。
本申请实施例中,在获取到表格图像之后,对表格图像进行文字识别。具体地,根据实际单元格的大小和位置对表格图像进行分割,对分割出的每个实际单元格进行文字识别,得到每个实际单元格的文字,从而得到与表格图像对应的文字信息。
其中,对每个实际单元格进行文字识别,可以将每个实际单元格的图像输入到预先训练的文字识别模型中,这样,文字识别模型无需对表格图像中的线条进行识别,不仅可以提高识别速度,而且可以降低文字识别模型的训练难度。
步骤204,基于表格结构信息和文字信息,创建电子表格。
本申请实施例中,在获得与表格图像对应的表格结构信息和文字信息之后,根据表格结构信息创建表格边框,然后根据文字信息进行文字填充,得到与表格图像对应的电子表格。
上述电子表格的创建方法中,先获取待录入的表格图像;再对表格图像进行图像处理,得到与表格图像对应的表格结构信息;然后,对表格图像进行文字识别,得到与表格图像对应的文字信息;最后,基于表格结构信息和文字信息,创建电子表格。通过本申请实施例,从表格图像提取出表格结构信息采用图像处理,适用于存在拆分单元格、合并单元格等复杂结构的表格;从表格图像中提取出文字信息也不需要复杂的神经网络模型,降低了神经网络模型的训练难度。
在一个实施例中,如图3所示,上述对表格图像进行图像处理,得到与表格图像对应的表格结构信息的步骤,具体可以包括如下:
步骤301,对表格图像进行二值化处理,得到二值化图像。
本申请实施例中,对表格图像进行二值化处理,可以采用全局化阈值,即对表格图像进行二值化处理采用同一阈值,如果像素值大于该阈值则将像素值设置为第一值,如果像素值不大于该阈值则将像素值设置为第二值,根据重新设置的像素值得到二值化图像。可选地,采用的全局化阈值为表格图像中的像素值均值,第一值对应黑色,第二值对应白色。本申请实施例对此不作详细限定,可以根据实际情况进行设置。
但是,如果光照不均,采用全局化阈值得到的二值化图像效果不佳。因此,可以采用自适应阈值,即对表格图像进行二值化处理时,每个像素点采用的阈值不同,如果像素值大于像素点对应的阈值则将像素值设置为第一值,如果像素值小于像素点对应的阈值则将像素值设置为第二值,最后,根据重新设置的像素值得到二值化图像。其中,每个像素点比对的阈值,是根据该像素点与邻近像素点的像素值确定的。
步骤302,对二值化图像进行图像处理,得到最小粒度单元格的边界线。
本申请实施例中,最小粒度单元格是指待创建的电子表格中的单位单元格。对二值化图像进行图像处理可以包括:对二值化图像进行膨胀处理和腐蚀处理,得到二值化图像中横线与竖线的交点;对交点进行水平方向投影,得到最小粒度单元格在水平方向的边界线;对交点进行竖直方向投影,得到最小粒度单元格在竖直方向的边界线。
具体地,二值化图像中包含表格中的线条,对线条进行膨胀处理,则处于同一水平线的线条互相连接得到二值化图像中的横线,处于同一竖直线的线条互相连接得到二值化图像中的竖线。接着,对膨胀处理后的二值化图像进行腐蚀处理,将表格中的文字腐蚀掉,只保留表格中的线条。此时,可以得到二值化图像中横线和竖线的交点,参照图4a所示的表格。然后,根据交点进行最小粒度单元格的划分,即对每个交点进行水平方向的投影,得到最小粒度单元格在水平方向的边界线;对每个交点进行竖直方向的投影,得到最小粒度单元格在竖直方向的边界线。。
可以理解地,获取到表格图像中的交点,根据交点进行最小粒度单元格的划分,不依赖表格图像中原有的线条,可以使待创建的电子表格的边框更光滑、更规范。
步骤303,对二值化图像进行连通区域分析,得到实际单元格的边界线。
本申请实施例中,在表格图像中可能存在拆分单元格或者合并单元格,因此,实际单元格的边界线可能与最小粒度单元格的边界线不重叠。对二值化图像进行连通区域分析,检测出二值化图像中的连通区域,从而得到实际单元格的边界线。
其中,连通区域(Connected Component)是指图像中具有相同像素值且位置相邻的前景像素点组成的图像区域(Region,Blob)。对二值化图像进行连通区域分析就是查找出二值化图像中的白色连通区域,并进行标记。连通区域分析可以采用两遍扫描(Two-Pass)法或种子填充(Seed-Filling)法,本申请实施例对此不作详细限定,可以根据实际情况进行选取。
步骤304,根据最小粒度单元格的边界线和实际单元格的边界线,得到表格结构信息。
本申请实施例中,在得到最小粒度单元格的边界线和实际单元格的边界线之后,根据最小粒度单元格的边界线,确定最小粒度单元格的行数和列数,参照图4b所示的表格,可以对每个最小粒度单元格进行编号;根据实际单元格的边界线,确定每个实际单元格所占用的最小粒度单元格的数量和位置,参照图4c所示的表格;最后,得到表格结构信息。
例如,如图4c所示,根据最小粒度单元格的边界线确定最小粒度单元格的行数为3行,列数为5列;根据实际单元格的边界线,确定第一个实际单元格占用第一行最小粒度单元格中的第一列和第二列以及第二行最小粒度单元格中的第一列和第二列,其余实际单元格均占用一个最小粒度单元格。这样,即可得到与表格图像对应的表格结构信息。
上述对表格图像进行图像处理,得到与表格图像对应的表格结构信息的步骤中,对表格图像进行二值化处理,得到二值化图像;对二值化图像进行图像处理,得到最小粒度单元格的边界线;对二值化图像进行连通区域分析,得到实际单元格的边界线;根据最小粒度单元格的边界线和实际单元格的边界线,得到表格结构信息。通过本申请实施例,从表格图像中提取出表格结构信息采用图像处理方式,无需训练复杂的神经网络模型,节省了人工标注的时间和人力;并且还适用于复杂结构的表格。
在一个实施例中,如图5所示,在上述实施例的基础上,电子表格的创建方法还可以包括如下步骤:
步骤401,获取待录入的表格图像。
步骤402,对表格图像进行直线检测,得到表格图像中的多条直线,以及每条直线与参考坐标轴之间的夹角;根据多个夹角计算目标旋转角度;根据目标旋转角度对表格图像进行旋转处理,得到矫正后的表格图像。
本申请实施例中,纸质表格文档通过扫描或拍摄等方式转换为表格图像,而在转换过程中,纸质表格文档中的部分线条可能会出现一定角度的旋转。因此在对表格图像进行二值化处理之前,需要先对表格图像进行角度矫正。
具体地,对表格图像进行直线检测,得到表格图像中的多条直线;根据预先设置的参考坐标轴计算各条直线与参考坐标轴之间的夹角。例如,检测出表格图像中的横线1与水平方向的x轴存在10°的夹角。其中,直线检测可以采用哈夫(Hough)检测算法,本申请实施例对此不作详细限定,可以根据实际情况进行设置。
在得到各条直线与参考坐标轴之间的夹角后,统计出数量最多的夹角,根据数量最多的夹角确定表格图像旋转的目标旋转角度。例如,统计出数量最多的夹角为10°,确定表格图像的目标旋转角度为逆时针旋转10°。
在确定目标旋转角度之后,按照目标旋转角度对表格图像进行旋转处理,得到矫正后的表格图像。
步骤403,对表格图像进行二值化处理,得到二值化图像;对二值化图像进行图像处理,得到最小粒度单元格的边界线;对二值化图像进行连通区域分析,得到实际单元格的边界线;根据最小粒度单元格的边界线和实际单元格的边界线,得到表格结构信息。
本申请实施例中,对矫正后的表格图像进行自适应二值化处理,得到二值化图像,再根据二值化图像得到最小粒度单元格的边界线和实际单元格的边界线,最后再根据最小粒度单元格的边界线和实际单元格的边界线,得到表格结构信息。
在其中一个实施例中,对二值化图像进行膨胀处理和腐蚀处理,得到二值化图像中横线与竖线的交点;对交点进行水平方向投影,得到最小粒度单元格在水平方向的边界线;对交点进行竖直方向投影,得到最小粒度单元格在竖直方向的边界线。
在其中一个实施例中,根据最小粒度单元格的边界线,确定最小粒度单元格的行数和列数;根据实际单元格的边界线,确定每个实际单元格所占用的最小粒度单元格的数量和位置,得到表格结构信息。
步骤404,根据实际单元格的边界线对表格图像进行分割,得到多个分割图像;将各分割图像分别输入到预先训练的文字识别模型中,得到各实际单元格对应的文字。
本申请实施例中,在得到实际单元格的边界线之后,根据实际单元格的边界线对表格图像进行分割,得到每个实际单元格对应的分割图像。然后,将各分割图像数据到预先训练的文字识别模型中,文字识别模型输出各实际单元格对应的文字。
步骤405,根据表格结构信息中每个实际单元格的大小和位置,绘制表格边框;根据文字信息中每个实际单元格的文字进行填充处理,得到电子表格。
本申请实施例中,在得到每个实际单元格的边界线之后,根据每个实际单元格的大小和位置,绘制表格边框。然后,将每个实际单元格对应的文字填充到对应的实际单元格中,从而得到电子表格。
上述电子表格的创建方法中,先获取待录入的表格图像,然后对表格图像进行角度矫正;接着,对角度矫正后的表格图像进行图像处理和连通区域检测,得到表格图像对应的表格结构信息;然后对角度矫正后的表格图像进行文字识别,得到表格图像对应的文字信息;最后,根据表格结构信息和文字信息创建电子表格。通过本申请实施例,在将表格图像转换为电子表格的过程中,无需创建复杂的神经网络模型,因此可以节省人工标注的时间和人力,并且还适用于存在复杂结构的表格。
应该理解的是,虽然图2-图5的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-图5中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图6所示,提供了一种电子表格的创建装置,包括:
表格图像获取模块501,用于获取待录入的表格图像;
表格结构信息获得模块502,用于对表格图像进行图像处理,得到与表格图像对应的表格结构信息;表格结构信息包括每个实际单元格的大小和位置;
文字信息获得模块503,用于对表格图像进行文字识别,得到与表格图像对应的文字信息;文字信息包括每个实际单元格的文字;
电子表格创建模块504,用于基于表格结构信息和文字信息,创建电子表格。
在其中一个实施例中,表格结构信息获得模块502,具体用于对表格图像进行二值化处理,得到二值化图像;对二值化图像进行图像处理,得到最小粒度单元格的边界线;对二值化图像进行连通区域分析,得到实际单元格的边界线;根据最小粒度单元格的边界线和实际单元格的边界线,得到表格结构信息。
在其中一个实施例中,表格结构信息获得模块502,具体用于对二值化图像进行膨胀处理和腐蚀处理,得到二值化图像中横线与竖线的交点;对交点进行水平方向投影,得到最小粒度单元格在水平方向的边界线;对交点进行竖直方向投影,得到最小粒度单元格在竖直方向的边界线。
在其中一个实施例中,表格结构信息获得模块502,具体用于根据最小粒度单元格的边界线,确定最小粒度单元格的行数和列数;根据实际单元格的边界线,确定每个实际单元格所占用的最小粒度单元格的数量和位置,得到表格结构信息。
在其中一个实施例中,文字信息获得模块503,具体用于根据实际单元格的边界线对表格图像进行分割,得到多个分割图像;将各分割图像分别输入到预先训练的文字识别模型中,得到各实际单元格对应的文字。
在其中一个实施例中,该装置还包括:
矫正模块,用于对表格图像进行直线检测,得到表格图像中的多条直线,以及每条直线与参考坐标轴之间的夹角;根据多个夹角计算目标旋转角度;根据目标旋转角度对表格图像进行旋转处理,得到矫正后的表格图像。
在其中一个实施例中,电子表格创建模块504,具体用于根据表格结构信息中每个实际单元格的大小和位置,绘制表格边框;根据文字信息中每个实际单元格的文字进行填充处理,得到电子表格。
关于电子表格的创建装置的具体限定可以参见上文中对于电子表格的创建方法的限定,在此不再赘述。上述电子表格的创建装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图7所示。该计算机设备包括通过***总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于存储电子表格的创建数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种电子表格的创建方法。
本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取待录入的表格图像;
对表格图像进行图像处理,得到与表格图像对应的表格结构信息;表格结构信息包括每个实际单元格的大小和位置;
对表格图像进行文字识别,得到与表格图像对应的文字信息;文字信息包括每个实际单元格的文字;
基于表格结构信息和文字信息,创建电子表格。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
对表格图像进行二值化处理,得到二值化图像;
对二值化图像进行图像处理,得到最小粒度单元格的边界线;
对二值化图像进行连通区域分析,得到实际单元格的边界线;
根据最小粒度单元格的边界线和实际单元格的边界线,得到表格结构信息。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
对二值化图像进行膨胀处理和腐蚀处理,得到二值化图像中横线与竖线的交点;
对交点进行水平方向投影,得到最小粒度单元格在水平方向的边界线;
对交点进行竖直方向投影,得到最小粒度单元格在竖直方向的边界线。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
根据最小粒度单元格的边界线,确定最小粒度单元格的行数和列数;
根据实际单元格的边界线,确定每个实际单元格所占用的最小粒度单元格的数量和位置,得到表格结构信息。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
根据实际单元格的边界线对表格图像进行分割,得到多个分割图像;
将各分割图像分别输入到预先训练的文字识别模型中,得到各实际单元格对应的文字。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
对表格图像进行直线检测,得到表格图像中的多条直线,以及每条直线与参考坐标轴之间的夹角;
根据多个夹角计算目标旋转角度;
根据目标旋转角度对表格图像进行旋转处理,得到矫正后的表格图像。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
根据表格结构信息中每个实际单元格的大小和位置,绘制表格边框;
根据文字信息中每个实际单元格的文字进行填充处理,得到电子表格。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取待录入的表格图像;
对表格图像进行图像处理,得到与表格图像对应的表格结构信息;表格结构信息包括每个实际单元格的大小和位置;
对表格图像进行文字识别,得到与表格图像对应的文字信息;文字信息包括每个实际单元格的文字;
基于表格结构信息和文字信息,创建电子表格。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
对表格图像进行二值化处理,得到二值化图像;
对二值化图像进行图像处理,得到最小粒度单元格的边界线;
对二值化图像进行连通区域分析,得到实际单元格的边界线;
根据最小粒度单元格的边界线和实际单元格的边界线,得到表格结构信息。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
对二值化图像进行膨胀处理和腐蚀处理,得到二值化图像中横线与竖线的交点;
对交点进行水平方向投影,得到最小粒度单元格在水平方向的边界线;
对交点进行竖直方向投影,得到最小粒度单元格在竖直方向的边界线。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
根据最小粒度单元格的边界线,确定最小粒度单元格的行数和列数;
根据实际单元格的边界线,确定每个实际单元格所占用的最小粒度单元格的数量和位置,得到表格结构信息。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
根据实际单元格的边界线对表格图像进行分割,得到多个分割图像;
将各分割图像分别输入到预先训练的文字识别模型中,得到各实际单元格对应的文字。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
对表格图像进行直线检测,得到表格图像中的多条直线,以及每条直线与参考坐标轴之间的夹角;
根据多个夹角计算目标旋转角度;
根据目标旋转角度对表格图像进行旋转处理,得到矫正后的表格图像。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
根据表格结构信息中每个实际单元格的大小和位置,绘制表格边框;
根据文字信息中每个实际单元格的文字进行填充处理,得到电子表格。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种电子表格的创建方法,其特征在于,所述方法包括:
获取待录入的表格图像;
对所述表格图像进行图像处理,得到与所述表格图像对应的表格结构信息;所述表格结构信息包括每个实际单元格的大小和位置;
对所述表格图像进行文字识别,得到与所述表格图像对应的文字信息;所述文字信息包括每个实际单元格的文字;
基于所述表格结构信息和所述文字信息,创建电子表格。
2.根据权利要求1所述的方法,其特征在于,所述对所述表格图像进行图像处理,得到与所述表格图像对应的表格结构信息,包括:
对所述表格图像进行二值化处理,得到二值化图像;
对所述二值化图像进行图像处理,得到最小粒度单元格的边界线;
对所述二值化图像进行连通区域分析,得到实际单元格的边界线;
根据所述最小粒度单元格的边界线和所述实际单元格的边界线,得到所述表格结构信息。
3.根据权利要求2所述的方法,其特征在于,所述对所述二值化图像进行图像处理,得到最小粒度单元格的边界线,包括:
对所述二值化图像进行膨胀处理和腐蚀处理,得到所述二值化图像中横线与竖线的交点;
对所述交点进行水平方向投影,得到所述最小粒度单元格在水平方向的边界线;
对所述交点进行竖直方向投影,得到所述最小粒度单元格在竖直方向的边界线。
4.根据权利要求3所述的方法,其特征在于,所述根据所述最小粒度单元格的边界线和所述实际单元格的边界线,得到所述表格结构信息,包括:
根据所述最小粒度单元格的边界线,确定所述最小粒度单元格的行数和列数;
根据所述实际单元格的边界线,确定每个所述实际单元格所占用的所述最小粒度单元格的数量和位置,得到所述表格结构信息。
5.根据权利要求2所述的方法,其特征在于,所述对所述表格图像进行文字识别,得到与所述表格图像对应的文字信息,包括:
根据所述实际单元格的边界线对所述表格图像进行分割,得到多个分割图像;
将各所述分割图像分别输入到预先训练的文字识别模型中,得到各所述实际单元格对应的文字。
6.根据权利要求1所述的方法,其特征在于,在所述对所述表格图像进行图像处理,得到与所述表格图像对应的表格结构信息之前,所述方法还包括:
对所述表格图像进行直线检测,得到所述表格图像中的多条直线,以及每条直线与参考坐标轴之间的夹角;
根据多个所述夹角计算目标旋转角度;
根据所述目标旋转角度对所述表格图像进行旋转处理,得到矫正后的表格图像。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述基于所述表格结构信息和所述文字信息,创建电子表格,包括:
根据所述表格结构信息中每个实际单元格的大小和位置,绘制表格边框;
根据所述文字信息中每个实际单元格的文字进行填充处理,得到所述电子表格。
8.一种电子表格的创建装置,其特征在于,所述装置包括:
表格图像获取模块,用于获取待录入的表格图像;
表格结构信息获得模块,用于对所述表格图像进行图像处理,得到与所述表格图像对应的表格结构信息;所述表格结构信息包括每个实际单元格的大小和位置;
文字信息获得模块,用于对所述表格图像进行文字识别,得到与所述表格图像对应的文字信息;所述文字信息包括每个实际单元格的文字;
电子表格创建模块,用于基于所述表格结构信息和所述文字信息,创建电子表格。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202010084618.6A 2020-02-10 2020-02-10 电子表格的创建方法、装置、计算机设备和存储介质 Pending CN111368638A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010084618.6A CN111368638A (zh) 2020-02-10 2020-02-10 电子表格的创建方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010084618.6A CN111368638A (zh) 2020-02-10 2020-02-10 电子表格的创建方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN111368638A true CN111368638A (zh) 2020-07-03

Family

ID=71208009

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010084618.6A Pending CN111368638A (zh) 2020-02-10 2020-02-10 电子表格的创建方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN111368638A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111985506A (zh) * 2020-08-21 2020-11-24 广东电网有限责任公司清远供电局 一种图表信息提取方法、装置和存储介质
CN112036365A (zh) * 2020-09-15 2020-12-04 中国工商银行股份有限公司 信息导入方法和装置,以及图像处理方法和装置
CN112149506A (zh) * 2020-08-25 2020-12-29 北京来也网络科技有限公司 结合rpa和ai的图像中的表格生成方法、设备及存储介质
CN112241730A (zh) * 2020-11-21 2021-01-19 杭州投知信息技术有限公司 一种基于机器学习的表格提取方法和***
CN112733518A (zh) * 2021-01-14 2021-04-30 卫宁健康科技集团股份有限公司 表格模板生成方法、装置、设备及存储介质
CN113688795A (zh) * 2021-09-27 2021-11-23 上海合合信息科技股份有限公司 一种将图像中表格转换为电子表格的方法及装置
CN114627482A (zh) * 2022-05-16 2022-06-14 四川升拓检测技术股份有限公司 基于图像处理与文字识别实现表格数字化处理方法及***

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109726643A (zh) * 2018-12-13 2019-05-07 北京金山数字娱乐科技有限公司 图像中表格信息的识别方法、装置、电子设备及存储介质
CN110334585A (zh) * 2019-05-22 2019-10-15 平安科技(深圳)有限公司 表格识别方法、装置、计算机设备和存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109726643A (zh) * 2018-12-13 2019-05-07 北京金山数字娱乐科技有限公司 图像中表格信息的识别方法、装置、电子设备及存储介质
CN110334585A (zh) * 2019-05-22 2019-10-15 平安科技(深圳)有限公司 表格识别方法、装置、计算机设备和存储介质

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111985506A (zh) * 2020-08-21 2020-11-24 广东电网有限责任公司清远供电局 一种图表信息提取方法、装置和存储介质
WO2022036997A1 (zh) * 2020-08-21 2022-02-24 广东电网有限责任公司清远供电局 图表信息提取方法、装置和存储介质
CN112149506A (zh) * 2020-08-25 2020-12-29 北京来也网络科技有限公司 结合rpa和ai的图像中的表格生成方法、设备及存储介质
CN112036365A (zh) * 2020-09-15 2020-12-04 中国工商银行股份有限公司 信息导入方法和装置,以及图像处理方法和装置
CN112036365B (zh) * 2020-09-15 2024-05-07 中国工商银行股份有限公司 信息导入方法和装置,以及图像处理方法和装置
CN112241730A (zh) * 2020-11-21 2021-01-19 杭州投知信息技术有限公司 一种基于机器学习的表格提取方法和***
CN112733518A (zh) * 2021-01-14 2021-04-30 卫宁健康科技集团股份有限公司 表格模板生成方法、装置、设备及存储介质
CN113688795A (zh) * 2021-09-27 2021-11-23 上海合合信息科技股份有限公司 一种将图像中表格转换为电子表格的方法及装置
CN114627482A (zh) * 2022-05-16 2022-06-14 四川升拓检测技术股份有限公司 基于图像处理与文字识别实现表格数字化处理方法及***
CN114627482B (zh) * 2022-05-16 2022-08-12 四川升拓检测技术股份有限公司 基于图像处理与文字识别实现表格数字化处理方法及***

Similar Documents

Publication Publication Date Title
CN111368638A (zh) 电子表格的创建方法、装置、计算机设备和存储介质
CN111401371B (zh) 一种文本检测识别方法、***及计算机设备
CN109241904B (zh) 文字识别模型训练、文字识别方法、装置、设备及介质
CN110390666B (zh) 道路损伤检测方法、装置、计算机设备及存储介质
CN108960229B (zh) 一种面向多方向的文字检测方法和装置
CN113239874B (zh) 基于视频图像的行为姿态检测方法、装置、设备及介质
CN107886082B (zh) 图像中数学公式检测方法、装置、计算机设备及存储介质
CN111353489A (zh) 文本图像处理方法、装置、计算机设备和存储介质
CN110866529A (zh) 字符识别方法、装置、电子设备及存储介质
CN111814905A (zh) 目标检测方法、装置、计算机设备和存储介质
CN110796663B (zh) 图片剪裁方法、装置、设备和存储介质
CN112101386B (zh) 文本检测方法、装置、计算机设备和存储介质
CN110210480B (zh) 文字识别方法、装置、电子设备和计算机可读存储介质
CN110163864B (zh) 图像分割方法、装置、计算机设备和存储介质
JP2019102061A (ja) テキスト線の区分化方法
CN112926421B (zh) 图像处理方法和装置、电子设备和存储介质
CN113469092B (zh) 字符识别模型生成方法、装置、计算机设备和存储介质
KR20220093187A (ko) 포지셔닝 방법 및 장치, 전자 기기, 컴퓨터 판독 가능 저장 매체
CN110909665A (zh) 一种多任务的图像处理方法、装置、电子设备及存储介质
CN113034514A (zh) 天空区域分割方法、装置、计算机设备和存储介质
CN112926564A (zh) 图片分析方法、***、计算机设备和计算机可读存储介质
CN111104883A (zh) 作业答案提取方法、装置、设备及计算机可读存储介质
CN111612726A (zh) 图像数据筛选方法、装置、计算机设备和存储介质
CN113537184A (zh) Ocr模型训练方法、装置、计算机设备、存储介质
CN109063601B (zh) 唇纹检测方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination