CN111783735A - 一种基于人工智能的钢材单据解析*** - Google Patents

一种基于人工智能的钢材单据解析*** Download PDF

Info

Publication number
CN111783735A
CN111783735A CN202010711981.6A CN202010711981A CN111783735A CN 111783735 A CN111783735 A CN 111783735A CN 202010711981 A CN202010711981 A CN 202010711981A CN 111783735 A CN111783735 A CN 111783735A
Authority
CN
China
Prior art keywords
document
analysis
steel
pdf
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010711981.6A
Other languages
English (en)
Other versions
CN111783735B (zh
Inventor
邹晓峰
朱彭生
郑东源
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ouye Yunshang Co ltd
Original Assignee
Ouye Yunshang Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ouye Yunshang Co ltd filed Critical Ouye Yunshang Co ltd
Priority to CN202010711981.6A priority Critical patent/CN111783735B/zh
Publication of CN111783735A publication Critical patent/CN111783735A/zh
Application granted granted Critical
Publication of CN111783735B publication Critical patent/CN111783735B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/177Editing, e.g. inserting or deleting of tables; using ruled lines
    • G06F40/18Editing, e.g. inserting or deleting of tables; using ruled lines of spreadsheets
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/54Interprogram communication
    • G06F9/547Remote procedure calls [RPC]; Web services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/54Indexing scheme relating to G06F9/54
    • G06F2209/548Queue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种基于人工智能的钢材单据解析***,该***包括:MongoDB数据库:用以存储未解析的钢材单据文档以及解析后的解析结果;Pdf客户端:用以从MongoDB数据库里扫描新写入的未解析的钢材单据文档,并将其推送到消息队列Rabbitmq中;消息队列Rabbitmq:用以生成多个待解析的文档任务,实现文档任务的分发;Pdf‑worker:接收消息队列Rabbitmq的文档任务,并根据待解析文档的格式选择对应的解析方式,并将解析结果输出储存到MongoDB数据库中。与现有技术相比,本发明具有效率高、解析准确率高、数字化自动化、适用于各类钢材单据样式复杂、不统一的情况等优点。

Description

一种基于人工智能的钢材单据解析***
技术领域
本发明涉及钢材单据信息数据处理技术领域,尤其是涉及一种基于人工智能的钢材单据解析***。
背景技术
目前在钢铁服务领域中,上下游合作方在交互过程中存在大量的钢材单据信息流通,这些钢材单据信息都是非结构化的文档,包括照片、纸质、扫描件、截图等等,但是现在这些非结构化的文档都需要进行人工处理,采用人工处理的方式不但工作量大,而且存在人工处理效果不好、易出错、无法流程化、自动化、智能化等问题。
当前钢材单据主要分为PDF文件和扫描件图像2种,主要使用PDF解析引擎或者OCR文本识别技术来实现,但是这些的技术往往存在以下缺陷:
1、存在并发度不高,横向扩展性不够,不能同时满足大批量单据的同时解析;
2、二者不能互相的兼容,往往只支持一种形式不能满足实际的业务生产需要;
3、未对扫描件图像进行预处理,解析效果较差;
4、对表格解析支持较差且准确性不够;
5、对单据中存在***的情况下会出现解析准确率下降现象。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于人工智能的钢材单据解析***。
本发明的目的可以通过以下技术方案来实现:
一种基于人工智能的钢材单据解析***,该***包括:
MongoDB数据库:用以存储未解析的钢材单据文档以及解析后的解析结果;
Pdf客户端:用以从MongoDB数据库里扫描新写入的未解析的钢材单据文档,并将其推送到消息队列Rabbitmq中;
消息队列Rabbitmq:用以生成多个待解析的文档任务,实现文档任务的分发;
Pdf-worker:接收消息队列Rabbitmq的文档任务,并根据待解析文档的格式选择对应的解析方式,并将解析结果输出储存到MongoDB数据库中。
所述的Pdf-worker在解析扫描件PDF或者图片时,通过RPC接口调用扫描件解析服务scan-page-table对扫描件图像进行预处理。
所述的Pdf-worker采用PDFBox实现文本、表格和图表的PDF解析,并基于PDFBox输出的底层的PDF的信息。
Pdf-worker采用PDFBox实现文本、表格和图表的PDF解析具体包括以下步骤:
21)加载待解析的钢材单据文档获取文档总页数信息;
22)依次对文档每页信息进行解析,并判断文档页面是否为位图扫描件文件,若不是位图扫描件文件,则直接通过PDFBOX解析矢量PDF的文字表格信息,若是位图扫描件文件,则进行步骤23);
23)生成该页的缩略图,并通过RPC接口调用扫描件解析服务对该页扫描件内容进行图像处理和文字检测后返回最终解析结果;
24)对所有页面解析结果进行合并输出。
所述的步骤23)中,扫描件解析服务采用OpenCV作为底层图像处理的库,对扫描件图像进行预处理,并且以TensorFlow作为深度学习框架进行文字检测、文字识别和表格解析,扫描件解析服务具体处理流程为:
231)加载待识别的扫描件图片;
232)对存在旋转角度或畸变情况的图像进行旋转校正;
233)去除***,用以去除***对整个图片的干扰;
234)表格检测;
235)文字区域检测;
236)文字识别;
237)表格解析;
238)将最终结果整合输出。
所述的步骤232)中,图像畸变包括:
仅存在大角度旋转、仅存在小角度旋转、仅存在透视畸变、以及以上三种情况混合出现;
对于不同的图像透视畸变情况采用对应的方法进行矫正畸变,具体为:
对于仅存在大角度旋转的情况:采用基于深度学习的图像分类模型来直接预测大角度类别,包括0度、90度、180度和270度;
对于仅存在小角度旋转的情况:基于像素投影或霍夫变换实现;
对于的仅存在透视畸变的情况:基于LSD直线检测,并在直线基础上获取泯灭点,最后通过泯灭点进行图像变换;
对于三种情况混合出现的情况:根据不同场景组合以上三种情况,分别依次进行三种情况的矫正畸变。
所述的步骤233)中,实现去除***具体为:
采用YOLO图像检测网络检测出***的区域,然后移除掉***区域内红色的像素,完成去除***。
所述的步骤234)中,实现表格检测具体为:
通过语义分割模型SegNet实现表格检测,其结构为分割引擎包含一个编码网络和一个对应的解码网络,并跟随一个像素级别的分类层,所述的编码网络的架构在拓扑上与VGG16网络中的13个卷积层相同,解码网络的角色为映射低分辨率的编码后的特征图到输入分辨率的特征图。
所述的步骤235)中,文字区域检测采用PSENet算法实现,输入图像后根据PSENet模型并输出文字区域坐标,为文字识别和表格还原提供依据;
所述的步骤236)中,文字识别采用CRNN算法实现,输入文字块局部图片后根据文字识别模型输出文字字符串,输出钢材单据识别的文字。
所述的步骤237)中,表格解析的位图表格包括有线表格、无线表格和半无线表格三类,对于不同类型的表格,因其表格线的完整性不同,对应不同的解析方式,具体为:
有线表格的解析以表格线信息为主,通过霍夫变换或者LSD直线检测算法,检测出表格线,然后根据表格线构建出表格的行列结构信息,然后将文本块按照位置信息填写到对应的单元格内;
无线表格和半无线表格的解析以文本块的对齐信息为主,通过虚拟划线划分表格行列结构,对每一条虚拟的行切分线和列切分线计算一个损失,过滤掉损失较大的不合理切分线,保留损失较小的切分线,基于此构建表格结构化信息,表格内检测出的表格线用以辅助虚拟线损失计算以及局部单元格的拆分和合并。
与现有技术相比,本发明具有以下优点:
一、本发明通过钢材单据的多任务解析来实现传统人工识别和手动录入单据的现状,提升工作效率、降低出错风险,实现钢铁生态圈业务数字化、智能化、流程化运营中的关键一环。
二、本发明对于各类钢材单据样式复杂、不统一的情况,能综合解决PDF及扫描件图片格式的问题。
三、实现分布式集群部署模式,***支持横向扩展,具有很强的并发性与扩展性。
四、本发明能够针对位图表格有扭曲、褶皱等异常形变的情况进行处理,提高钢材单据场景下的解析准确率。
附图说明
图1为扫描件解析服务的解析流程。
图2为pdf-worker的解析流程。
图3为本发明的钢材单据文档解析流程图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。
实施例
本发明提供一种基于人工智能的钢材单据解析***,包括以下步骤:
1、pdf-client负责从MongoDB里面扫描新写入的未解析的文档,然后推送到Rabbitmq;
2、pdf-worker从Rabbitmq里面获取待解析的文档任务,然后开始解析,解析完成后,把解析结果写入MongoDB,pdf-worker可以根据服务器的配置情况,部署多个节点,支持更高的并发,pdf-worker可以自动判断待解析文档的格式从而选择相应的解析方式;如图2所示,具体解析流程为:
21)加载待解析的文档获取文档总页数信息;
22)依次对文档每页信息进行解析;
23)判断文档是否是扫描件文件;
24)非扫描件文件直接通过PDFBOX解析改业的文字表格信息;
25)如果是扫描件文档生成该页的缩略图;
26)通过RPC接口调用下一层的扫描件解析相关服务(scan-page-table);
27)对该页扫描件内容进行图像处理和文字检测;
28)返回最终解析结果;
29)对所有页面解析结果进行合并输出。
步骤24)中,pdf-worker服务使用Apache开源的PDFBox来解析PDF,基于PDFBox输出的底层的PDF的信息,来进行文本、表格和图表的解析,通过Rabbitmq来进行文档解析任务的分发,使用MongoDB存储待解析的文档和文档解析结果。
步骤26)-27)中,扫描件解析服务使用OpenCV作为底层图像处理的库,对扫描件图像进行预处理,并且使用TensorFlow作为深度学习框架进行文字检测、文字识别、表格解析,如图1所示,具体流程如下:
101)加载要识别的扫描件图片;
102)对图像进行旋转校正;
103)去除***,避免对整个图片进行干扰;
104)表格检测;
105)文字区域检测;
106)文字识别;
107)表格解析;
108)将最终结果整合输出。
步骤101)-102)中,在pdf-worker解析扫描件PDF或者图片时,通过RPC接口调用扫描件解析服务(scan-page-table),对扫描件图像进行预处理,scan-page-table可以部署多节点,以支持更高的并发,其中,在scan-page-table服务中对扫描件进行以下预处理:
1011)加载要识别的扫描件图片;
1012)对图像进行旋转校正,当遇到图像存在旋转角度或透视畸变的情况时,例如用手机拍照的图像比较容易出现旋转角度或透视畸变,显而易见,一个无畸变的图像比有畸变的图像更有利于图像解析;
常见的图像畸变有以下几种情况:
1、仅存在大角度旋转(90度,180度,270度);
2、仅存在小角度旋转(90以内);
3、仅存在透视畸变;
4、以上三种情况混合出现。比如100度的角度属于大角度和小角度的混合,也可以是大角度和透视畸变同时存在等。
对于上述的四种情况,本例中分别用不同的算法来矫正畸变,具体为:
对于第一种情况:大角度(90度,180度,270度)纠偏采用基于深度学习的图像分类模型来直接预测大角度类别,类别共四种(0度、90度、180度、270度);
对于第二种情况:小角度纠偏采用基于像素投影或霍夫变换两种方法实现;
对于第三种情况:透视畸变采用基于LSD直线检测,并在直线基础上计算泯灭点,最后通过泯灭点计算实现图像变换;
对于第四种情况:根据不同场景自由组合以上三种情况(比如已知图像仅存在角度旋转,不存在透视畸变,就可以先进行大角度旋转纠偏在进行小角度旋转纠偏)。
步骤103)中去除***的实现方式具体为:
本例中采用YOLO图像检测网络检测出***的区域,然后通过图像处理算法,移除掉***区域内红色的像素,以此完成去除***的操作,由于移除***的图像处理限制在通过YOLO网络检测出来的***区域内,这样避免了对整个图片进行处理,避免了对整个图片进行干扰。
步骤104)中表格检测的实现方式具体为:
本例通过语义分割模型SegNet来实现,其结构是分割引擎包含一个编码网络和一个对应的解码网络,并跟随着一个像素级别的分类层。编码器网络的架构在拓扑上与VGG16网络中的13个卷积层相同。解码网络的角色是映射低分辨率的编码后的特征图到输入分辨率的特征图。上采样后的图是稀疏的,然后与可训练的滤波器卷积以产生密集的特征图。
在分别进行步骤104)-107)的文字检测、文字识别、表格解析时,本例采用tensorflow serving里面包含的扫描件解析需要使用的深度学习技术,具体包括以下内容:
文字区域检测采用PSENet算法来实现,从输入图像->PSENet模型->输出文字区域坐标,为下一步文字识别和表格还原提供依据;
文字识别采用CRNN算法实现,从输入文字块局部图片(上一层区域切割)->文字识别模型->输出文字字符串,整个单据识别提供文字输出;
表格解析,位图表格可以分为三类:有线表格、无线表格和半无线表格。对于不同类型的表格,因为表格线的完整性不同,有不同的解析方式。
有线表格解析以表格线信息为主,通过霍夫变换或者LSD等直线检测算法,检测出表格线,然后根据表格线构建出表格的行列结构信息,然后将文本块按照位置信息填写到对应的单元格内。
无线表格和半无线表格因为表格线信息不全,不能通过表格线重构表格结构。因此无线表格、半无线表格的解析主要以文本块的对齐信息为主,通过虚拟划线,划分表格行列结构。算法对每一条虚拟的行切分线和列切分线计算一个损失,过滤掉损失较大的不合理切分线,保留损失较小的切分线,然后基于此构建表格结构化信息,表格内检测出的表格线可以辅助虚拟线损失计算和局部单元格的拆分、合并。
3)最终将解析结果输出存储到MogoDb中。

Claims (10)

1.一种基于人工智能的钢材单据解析***,其特征在于,该***包括:
MongoDB数据库:用以存储未解析的钢材单据文档以及解析后的解析结果;
Pdf客户端:用以从MongoDB数据库里扫描新写入的未解析的钢材单据文档,并将其推送到消息队列Rabbitmq中;
消息队列Rabbitmq:用以生成多个待解析的文档任务,实现文档任务的分发;
Pdf-worker:接收消息队列Rabbitmq的文档任务,并根据待解析文档的格式选择对应的解析方式,并将解析结果输出储存到MongoDB数据库中。
2.根据权利要求1所述的一种基于人工智能的钢材单据解析***,其特征在于,所述的Pdf-worker在解析扫描件PDF或者图片时,通过RPC接口调用扫描件解析服务scan-page-table对扫描件图像进行预处理。
3.根据权利要求1所述的一种基于人工智能的钢材单据解析***,其特征在于,所述的Pdf-worker采用PDFBox实现文本、表格和图表的PDF解析,并基于PDFBox输出的底层的PDF的信息。
4.根据权利要求3所述的一种基于人工智能的钢材单据解析***,其特征在于,Pdf-worker采用PDFBox实现文本、表格和图表的PDF解析具体包括以下步骤:
21)加载待解析的钢材单据文档获取文档总页数信息;
22)依次对文档每页信息进行解析,并判断文档页面是否为位图扫描件文件,若不是位图扫描件文件,则直接通过PDFBOX解析矢量PDF的文字表格信息,若是位图扫描件文件,则进行步骤23);
23)生成该页的缩略图,并通过RPC接口调用扫描件解析服务对该页扫描件内容进行图像处理和文字检测后返回最终解析结果;
24)对所有页面解析结果进行合并输出。
5.根据权利要求4所述的一种基于人工智能的钢材单据解析***,其特征在于,所述的步骤23)中,扫描件解析服务采用OpenCV作为底层图像处理的库,对扫描件图像进行预处理,并且以TensorFlow作为深度学习框架进行文字检测、文字识别和表格解析,扫描件解析服务具体处理流程为:
231)加载待识别的扫描件图片;
232)对存在旋转角度或畸变情况的图像进行旋转校正;
233)去除***,用以去除***对整个图片的干扰;
234)表格检测;
235)文字区域检测;
236)文字识别;
237)表格解析;
238)将最终结果整合输出。
6.根据权利要求5所述的一种基于人工智能的钢材单据解析***,其特征在于,所述的步骤232)中,图像畸变包括:
仅存在大角度旋转、仅存在小角度旋转、仅存在透视畸变、以及以上三种情况混合出现;
对于不同的图像透视畸变情况采用对应的方法进行矫正畸变,具体为:
对于仅存在大角度旋转的情况:采用基于深度学习的图像分类模型来直接预测大角度类别,包括0度、90度、180度和270度;
对于仅存在小角度旋转的情况:基于像素投影或霍夫变换实现;
对于的仅存在透视畸变的情况:基于LSD直线检测,并在直线基础上获取泯灭点,最后通过泯灭点进行图像变换;
对于三种情况混合出现的情况:根据不同场景组合以上三种情况,分别依次进行三种情况的矫正畸变。
7.根据权利要求5所述的一种基于人工智能的钢材单据解析***,其特征在于,所述的步骤233)中,实现去除***具体为:
采用YOLO图像检测网络检测出***的区域,然后移除掉***区域内红色的像素,完成去除***。
8.根据权利要求5所述的一种基于人工智能的钢材单据解析***,其特征在于,所述的步骤234)中,实现表格检测具体为:
通过语义分割模型SegNet实现表格检测,其结构为分割引擎包含一个编码网络和一个对应的解码网络,并跟随一个像素级别的分类层,所述的编码网络的架构在拓扑上与VGG16网络中的13个卷积层相同,解码网络的角色为映射低分辨率的编码后的特征图到输入分辨率的特征图。
9.根据权利要求5所述的一种基于人工智能的钢材单据解析***,其特征在于,所述的步骤235)中,文字区域检测采用PSENet算法实现,输入图像后根据PSENet模型并输出文字区域坐标,为文字识别和表格还原提供依据;
所述的步骤236)中,文字识别采用CRNN算法实现,输入文字块局部图片后根据文字识别模型输出文字字符串,输出钢材单据识别的文字。
10.根据权利要求5所述的一种基于人工智能的钢材单据解析***,其特征在于,所述的步骤237)中,表格解析的位图表格包括有线表格、无线表格和半无线表格三类,对于不同类型的表格,因其表格线的完整性不同,对应不同的解析方式,具体为:
有线表格的解析以表格线信息为主,通过霍夫变换或者LSD直线检测算法,检测出表格线,然后根据表格线构建出表格的行列结构信息,然后将文本块按照位置信息填写到对应的单元格内;
无线表格和半无线表格的解析以文本块的对齐信息为主,通过虚拟划线划分表格行列结构,对每一条虚拟的行切分线和列切分线计算一个损失,过滤掉损失较大的不合理切分线,保留损失较小的切分线,基于此构建表格结构化信息,表格内检测出的表格线用以辅助虚拟线损失计算以及局部单元格的拆分和合并。
CN202010711981.6A 2020-07-22 2020-07-22 一种基于人工智能的钢材单据解析*** Active CN111783735B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010711981.6A CN111783735B (zh) 2020-07-22 2020-07-22 一种基于人工智能的钢材单据解析***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010711981.6A CN111783735B (zh) 2020-07-22 2020-07-22 一种基于人工智能的钢材单据解析***

Publications (2)

Publication Number Publication Date
CN111783735A true CN111783735A (zh) 2020-10-16
CN111783735B CN111783735B (zh) 2021-01-22

Family

ID=72764765

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010711981.6A Active CN111783735B (zh) 2020-07-22 2020-07-22 一种基于人工智能的钢材单据解析***

Country Status (1)

Country Link
CN (1) CN111783735B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112200117A (zh) * 2020-10-22 2021-01-08 长城计算机软件与***有限公司 表格识别方法及装置
CN113435240A (zh) * 2021-04-13 2021-09-24 北京易道博识科技有限公司 一种端到端的表格检测和结构识别方法及***
CN113505762A (zh) * 2021-09-09 2021-10-15 冠传网络科技(南京)有限公司 一种表格识别方法和装置、终端及存储介质
CN113779948A (zh) * 2021-09-10 2021-12-10 成都材智科技有限公司 一种核电结构材料数据文件自动化提取***及方法

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103744983A (zh) * 2014-01-15 2014-04-23 北京理工大学 一种电子文档的元信息提取方法
CN105426856A (zh) * 2015-11-25 2016-03-23 成都数联铭品科技有限公司 一种图像表格文字识别方法
CN105589957A (zh) * 2015-12-22 2016-05-18 新浪网技术(中国)有限公司 一种文档转化方法及文档转化***
WO2017131789A1 (en) * 2016-01-29 2017-08-03 Hewlett Packard Enterprise Development Lp Memory management with versioning of objects
CN107317724A (zh) * 2017-06-06 2017-11-03 中证信用增进股份有限公司 基于云计算技术的数据采集***及方法
CN107480681A (zh) * 2017-08-02 2017-12-15 四川长虹电器股份有限公司 基于深度学习的高并***据识别***与方法
CN108416279A (zh) * 2018-02-26 2018-08-17 阿博茨德(北京)科技有限公司 文档图像中的表格解析方法及装置
CN109726388A (zh) * 2018-05-07 2019-05-07 深圳壹账通智能科技有限公司 Pdf文件解析方法、装置、设备及计算机可读存储介质
CN109948507A (zh) * 2019-03-14 2019-06-28 北京百度网讯科技有限公司 用于检测表格的方法和装置
CN109961008A (zh) * 2019-02-13 2019-07-02 平安科技(深圳)有限公司 基于文字定位识别的表格解析方法、介质及计算机设备
CN109993112A (zh) * 2019-03-29 2019-07-09 杭州睿琪软件有限公司 一种图片中表格的识别方法及装置
CN110363102A (zh) * 2019-06-24 2019-10-22 北京融汇金信信息技术有限公司 一种pdf文件的对象识别处理方法及装置
CN110516208A (zh) * 2019-08-12 2019-11-29 深圳智能思创科技有限公司 一种针对pdf文档表格提取的***及方法

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103744983A (zh) * 2014-01-15 2014-04-23 北京理工大学 一种电子文档的元信息提取方法
CN105426856A (zh) * 2015-11-25 2016-03-23 成都数联铭品科技有限公司 一种图像表格文字识别方法
CN105589957A (zh) * 2015-12-22 2016-05-18 新浪网技术(中国)有限公司 一种文档转化方法及文档转化***
WO2017131789A1 (en) * 2016-01-29 2017-08-03 Hewlett Packard Enterprise Development Lp Memory management with versioning of objects
CN107317724A (zh) * 2017-06-06 2017-11-03 中证信用增进股份有限公司 基于云计算技术的数据采集***及方法
CN107480681A (zh) * 2017-08-02 2017-12-15 四川长虹电器股份有限公司 基于深度学习的高并***据识别***与方法
CN108416279A (zh) * 2018-02-26 2018-08-17 阿博茨德(北京)科技有限公司 文档图像中的表格解析方法及装置
CN109726388A (zh) * 2018-05-07 2019-05-07 深圳壹账通智能科技有限公司 Pdf文件解析方法、装置、设备及计算机可读存储介质
CN109961008A (zh) * 2019-02-13 2019-07-02 平安科技(深圳)有限公司 基于文字定位识别的表格解析方法、介质及计算机设备
CN109948507A (zh) * 2019-03-14 2019-06-28 北京百度网讯科技有限公司 用于检测表格的方法和装置
CN109993112A (zh) * 2019-03-29 2019-07-09 杭州睿琪软件有限公司 一种图片中表格的识别方法及装置
CN110363102A (zh) * 2019-06-24 2019-10-22 北京融汇金信信息技术有限公司 一种pdf文件的对象识别处理方法及装置
CN110516208A (zh) * 2019-08-12 2019-11-29 深圳智能思创科技有限公司 一种针对pdf文档表格提取的***及方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112200117A (zh) * 2020-10-22 2021-01-08 长城计算机软件与***有限公司 表格识别方法及装置
CN112200117B (zh) * 2020-10-22 2023-10-13 长城计算机软件与***有限公司 表格识别方法及装置
CN113435240A (zh) * 2021-04-13 2021-09-24 北京易道博识科技有限公司 一种端到端的表格检测和结构识别方法及***
CN113435240B (zh) * 2021-04-13 2024-06-14 北京易道博识科技有限公司 一种端到端的表格检测和结构识别方法及***
CN113505762A (zh) * 2021-09-09 2021-10-15 冠传网络科技(南京)有限公司 一种表格识别方法和装置、终端及存储介质
CN113505762B (zh) * 2021-09-09 2021-11-30 冠传网络科技(南京)有限公司 一种表格识别方法和装置、终端及存储介质
CN113779948A (zh) * 2021-09-10 2021-12-10 成都材智科技有限公司 一种核电结构材料数据文件自动化提取***及方法

Also Published As

Publication number Publication date
CN111783735B (zh) 2021-01-22

Similar Documents

Publication Publication Date Title
CN111783735B (zh) 一种基于人工智能的钢材单据解析***
CN109933756B (zh) 基于ocr的图像转档方法、装置、设备及可读存储介质
CN110363252B (zh) 趋向于端到端的场景文字检测与识别方法以及***
CN110363102B (zh) 一种pdf文件的对象识别处理方法及装置
US9542752B2 (en) Document image compression method and its application in document authentication
CN111027297A (zh) 一种对图像型pdf财务数据关键表格信息的处理方法
US20120213429A1 (en) System and method for extracting flowchart information from digital images
CN112070649B (zh) 一种去除特定字符串水印的方法及***
CN110765740B (zh) 一种基于dom树的全类型文本替换方法、***、装置及存储介质
CN110689012A (zh) 一种端到端的自然场景文本识别方法及***
CN104699663A (zh) 一种信息输入方法及装置
CN114862845B (zh) 手机触摸屏的缺陷检测方法、装置、设备及存储介质
CN111368511A (zh) Pdf文档解析方法及装置
CN111680690A (zh) 一种文字识别方法及装置
CN111161213B (zh) 一种基于知识图谱的工业产品缺陷图像分类方法
CN111914805A (zh) 表格结构化方法、装置、电子设备及存储介质
CN113221711A (zh) 一种信息提取方法及装置
CN116052193A (zh) Rpa界面动态表格的拾取和匹配方法及***
CN102750686B (zh) 一种基于学习的超分辨文档图像复原处理方法
US20220237397A1 (en) Identifying handwritten signatures in digital images using ocr residues
CN111414889B (zh) 基于文字识别的财务报表识别方法及装置
CN116311297A (zh) 基于计算机视觉的电子凭据图像识别解析方法
CN115965987A (zh) 基于异构架构的表格文字结构化识别方法
CN111291758B (zh) 用于识别***文字的方法和装置
CN114283442A (zh) 一种二次接线图智能识别方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant