CN111814598A - 一种基于深度学习框架的财务报表自动识别方法 - Google Patents

一种基于深度学习框架的财务报表自动识别方法 Download PDF

Info

Publication number
CN111814598A
CN111814598A CN202010571056.8A CN202010571056A CN111814598A CN 111814598 A CN111814598 A CN 111814598A CN 202010571056 A CN202010571056 A CN 202010571056A CN 111814598 A CN111814598 A CN 111814598A
Authority
CN
China
Prior art keywords
image
financial statement
text
deep learning
identification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010571056.8A
Other languages
English (en)
Inventor
杨玉东
张丽影
任昊
刘春影
杨茜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jilin Tong Lian Credit Service Co ltd
Original Assignee
Jilin Tong Lian Credit Service Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jilin Tong Lian Credit Service Co ltd filed Critical Jilin Tong Lian Credit Service Co ltd
Priority to CN202010571056.8A priority Critical patent/CN111814598A/zh
Publication of CN111814598A publication Critical patent/CN111814598A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/243Aligning, centring, orientation detection or correction of the image by compensating for image skew or non-uniform image deformations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)
  • Character Discrimination (AREA)

Abstract

一种基于深度学***状态;OCR文本自动识别:采用基于深度学习网络的图像识别模型依次识别财务报表图像中的文本所在位置和具体内容,提取出整张表格的信息;基于图像形态学检测表格线,并提取单元格位置坐标;生成Excel文件。本发明能够自动识别财务报表中的文本位置、文本内容以及报表中的表格线,最终输出与原财务报表图像逻辑结构和文本内容相一致的Excel文件,以达到降低财务报表识别成本、提高识别工作效率和准确率的目的。

Description

一种基于深度学习框架的财务报表自动识别方法
技术领域
本发明涉及计算机视觉识别技术领域,具体涉及一种基于深度学习框架的财务报表自动识别方法。
背景技术
随着社会经济的快速发展,企业的发展规模不断扩大,导致其融资需求随之增加,而财务报表数据能够直接、客观地反映企业的经营能力、盈利能力、偿债能力以及成长能力,在企业向银行递交融资申请时,被作为重要的资格审核依据。因此,促使银行对财务报表的识别需求也越来越大。目前,现有的财务报表识别主要是通过人工方式进行,人工识别方法所耗时间成本、人力成本均相对较高,效率低下,且人工识别的长时间重复性操作容易造成疲劳,进而引发误差、疏忽、漏项等问题,致使财务报表识别结果的准确率偏低。
如何准确、高效地识别财务报表,同时避免人工识别成本过高、易疲劳、易疏忽等弊端,是目前亟待解决的技术问题。
发明内容
为解决目前人工识别财务报表存在的成本过高、易疲劳、易疏忽、效率低、准确率低的问题,本发明提出一种基于深度学习框架的财务报表自动识别方法,其能够自动识别财务报表中的文本位置、文本内容以及报表中的表格线,最终输出与原财务报表图像逻辑结构和文本内容相一致的Excel文件,以达到降低财务报表识别成本、提高识别工作效率和准确率的目的。
本发明为解决技术问题所采用的技术方案如下:
本发明的一种基于深度学习框架的财务报表自动识别方法,包括以下步骤:
S1、接收财务报表图像;
S2、基于霍夫直线法对财务报表图像进行图像校正,调整表格至水平状态;
S3、OCR文本自动识别:采用基于深度学习网络的图像识别模型依次识别财务报表图像中的文本所在位置和具体内容,提取出整张表格的信息;
S4、基于图像形态学检测表格线,并提取单元格位置坐标;
S5、生成并输出Excel文件。
进一步的,步骤S1具体包括以下步骤:
S11、准备财务报表文件;
S12、使用Python工具中的OpenCV2算法库接收财务报表图像,并统一转化为png格式文件。
进一步的,步骤S2具体包括以下步骤:
S21、准备训练集数据;
S22、基于霍夫直线法,使用Python工具中的OpenCV2算法库获取财务报表图像中倾斜角度小于45度的直线;
S23、根据获取的直线斜率,计算出平均斜率;
S24、根据平均斜率对财务报表图像进行校正,调整表格至水平状态;
S25、基于测试集数据检验有效校正率,有效校正率为99.6%。
进一步的,步骤S3具体包括以下步骤:
S31、准备训练集数据;
S32、获取不同位置、不同噪声下的单元格图像;
S33、使用Python工具中的TensorFlow和Keras算法库,基于CTPN深度学习网络对文本所在区域进行定位,采用区域坐标的方式标记出单元格图像文本的所在位置,坐标采用五级标识进行定位;
S34、使用Python工具中的TensorFlow和Keras算法库,基于训练集数据建立CRNN神经网络模型,进行中英文及数字的识别,获取相应坐标区域内的文本内容;
S35、基于测试集数据对上述CRNN神经网络模型识别结果进行评估,识别准确率为99.5%。
进一步的,步骤S33中,所述五级标识为角度、横坐标、纵坐标、宽度和高度。
进一步的,步骤S4具体包括以下步骤:
S41、准备训练集数据;
S42、对财务报表图像进行二值化处理,将财务报表图像的灰度值根据阈值进行0,1处理;
S43、使用Python工具中的OpenCV2算法库,构造横、竖两种腐蚀核,对二值图像进行过滤,横向腐蚀核处理得到表格的横线,竖向腐蚀核处理得到表格的竖线,并以矩阵形式进行标记;
S44、对每个像素点所对应的矩阵[r,g,b]进行归一化处理,并分别进行横向矩阵投影处理和纵向矩阵投影处理;
S45、根据得到的行和列,定位财务报表图像中每个单元格的位置,同时,根据生成的行和列与文字所对应的位置与大小进行匹配,若字的位置穿过了某条行,则去除该条行对应的表格线,将相邻两个横向单元格合并为一个单元格;若字的位置穿过了某条列,则去除该条列对应的表格线,将相邻两个纵向单元格合并为一个单元格;
S46、基于测试集数据检验模型识别结果准确率,准确率为99.7%。
进一步的,步骤S5具体包括以下步骤:
S51、根据得到的表格位置信息,使用Python工具的xlwt算法库生成对应的空白Excel文件;
S52、根据已识别的文本位置、文本内容将对应坐标区域内的文本内容填入单元格,并输出Excel文件。
本发明的有益效果是:
1、数据内容详细:能够获得企业财务报表中的全部详细数据。
2、识别结果准确度高:与人工识别相比,其准确度相对较高。其一,计算机自动识别不受工作环境、连续重复作业的影响,有效避免了人工操作易疲劳、易疏忽的弊端,与此同时,在OCR文本识别过程中采用了CTPN算法和CRNN算法,均进一步提高了识别结果的准确度。
3、无需设置模板:在本发明中,不需要用户提前准备识别模板,计算机程序可通过自动分析匹配达到精准识别的目的,还原出一个逻辑结构和原财务报表图像一致的表格。
4、识别工作效率高:本发明识别一页报表平均耗时0.02秒,整个财务报表的识别以及输出Excel文件的处理过程全部由计算机程序自动完成,替代了繁重的人工录入工作,节约了相关人员的工作时间,大大缩减了人力成本,提高整体工作效率。
5、新技术的运用:本发明运用了大数据和深度学***。
附图说明
图1为本发明的一种基于深度学习框架的财务报表自动识别方法的流程图。
图2为财务报表图像示意图。
图3为文本位置定位结果示意图。
图4为单元格识别结果矩阵示意图。图4(a)为所有表格线的横坐标投影,图4(b)为所有表格线的纵坐标投影。
具体实施方式
本发明的一种基于深度学***状态;OCR文本识别包括对财务报表图像中文字所在区域的定位和中英文及数字识别,分别用于检测校正后财务报表图像中的文本位置和识别单元格图像中的文本内容,实现对整张报表信息的提取功能;单元格识别,用于识别财务报表中的表格线,并以矩阵的形式进行标记;最终,依据上述过程识别出的文本位置坐标、文本内容以及表格线位置信息,实现自动生成并输出所述财务报表图像的Excel文件的目标。
如图1所示,本发明的一种基于深度学习框架的财务报表自动识别方法,主要包括以下步骤:
步骤一、接收财务报表图像,具体包括以下步骤:
S11、准备财务报表文件,支持输入pdf、png以及jpg等格式文件,如图2所示;
S12、使用Python工具中的OpenCV2算法库接收财务报表图像,并统一转化为png格式文件,以便进一步处理。
步骤二、基于霍夫直线法对财务报表图像进行图像校正,调整财务报表图像中的表格至水平状态,具体包括以下步骤:
S21、准备训练集数据;
S22、基于霍夫直线法,使用Python工具中OpenCV2算法库获取财务报表图像中倾斜角度小于45度的直线;
S23、根据获取的直线斜率,计算平均斜率;
S24、根据得到的平均斜率对财务报表图像进行校正,调整表格至水平状态;
S25、基于测试集数据检验有效校正率,有效校正率为99.6%。
通过对财务报表图像中的表格进行校正能够有效地避免因表格线扭曲或者倾斜带来的误检影响,提高表格线检测的准确率,进而提高报表识别结果的准确性,并且该方法对有噪声干扰的图像表现出相当好的稳定性和鲁棒性。
步骤三、OCR文本自动识别:采用基于深度学习网络的图像识别模型依次识别财务报表图像中的文本所在位置和具体内容,提取出整张表格的有用信息,具体包括以下步骤:
S31、准备训练集数据;
S32、获取不同位置、不同噪声下的单元格图像;
S33、使用Python工具中的TensorFlow和Keras算法库,基于CTPN深度学习网络对文本所在区域进行定位,采用区域坐标的方式标记出单元格图像文本的所在位置,坐标采用五级标识(角度,横坐标,纵坐标,宽度,高度)进行定位;文本位置定位结果如图3所示,根据上述五级标识坐标,用黑色图块标记出文本所在区域。
S34、使用Python工具中的TensorFlow和Keras算法库,基于训练集数据建立CRNN神经网络模型,进行中英文及数字的识别,获取相应坐标区域内的文本内容;
S35、基于测试集数据对上述CRNN神经网络模型识别结果进行评估,识别准确率为99.5%。
其中,CTPN网络提出了Vertical anchor的概念,同时,将LSTM引入到了网络里面,与CNN无缝对接,发挥LSTM的记忆作用,根据前后的anchor序列来提取文本相互之间的关系特征,大大提升了文本行检测的准确度和效率。
除此之外,本发明采用了CRNN算法进行中英文及数字的识别,将CNN与LSTM进行结合,既提取了鲁棒特征,又通过序列识别避免了传统算法中难度极高的单字符切分与单字符识别的问题,同时序列化识别也嵌入时序依赖,进一步提高了文本识别的准确性和效率。
步骤四、基于图像形态学检测表格线,并提取单元格位置坐标,具体包括以下步骤:
S41、准备训练集数据;
S42、对财务报表图像进行二值化处理,将财务报表图像的灰度值根据阈值进行0,1处理;
S43、使用Python工具中的OpenCV2算法库,构造横、竖两种腐蚀核,对二值图像进行过滤,横向腐蚀核处理得到表格的横线,竖向腐蚀核处理得到表格的竖线,并以矩阵形式进行标记;
S44、对每个像素点所对应的矩阵[r,g,b]进行归一化处理,0为黑色,1为白色,并分别进行横向矩阵投影处理和纵向矩阵投影处理;
S45、根据得到的行和列,定位财务报表图像中每个单元格的位置,同时,根据生成的行和列与文字所对应的位置与大小进行匹配,若字的位置穿过了某条行,则去除该条行对应的表格线,将相邻两个横向单元格合并为一个单元格;若字的位置穿过了某条列,则去除该条列对应的表格线,将相邻两个纵向单元格合并为一个单元格;
单元格识别结果矩阵如图4所示。图4(a)为所有表格线的横坐标投影,图4(b)为所有表格线的纵坐标投影。其中,图4(a)中的X轴取值为表格宽度,Y轴取值方法为:图3中相同X轴值像素点基于S44步骤得到的归一化值相加之和;图4(b)中的X轴取值为表格高度,Y轴取值方法为:图3中相同Y轴值像素点基于S44步骤得到的归一化值相加之和。
S46、基于测试集数据检验模型识别结果准确率,准确率为99.7%。
步骤五、生成并输出Excel文件,具体包括以下步骤:
S51、根据得到的表格位置信息,使用Python工具的xlwt算法库生成对应的空白Excel文件;
S52、根据已识别的文本位置、文本内容将对应坐标区域内的文本内容填入单元格,并输出Excel文件。
1、在本次实验中,识别一页财务报表平均耗时0.02秒,识别速度快、效率高。
2、在本次实验中,实现了自动识别并生成与原财务报表图像逻辑结构及内容相一致的Excel文件的目的,财务报表的整体平均识别准确率高达98.8%,识别结果准确度高。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (7)

1.一种基于深度学习框架的财务报表自动识别方法,其特征在于,包括以下步骤:
S1、接收财务报表图像;
S2、基于霍夫直线法对财务报表图像进行图像校正,调整表格至水平状态;
S3、OCR文本自动识别:采用基于深度学习网络的图像识别模型依次识别财务报表图像中的文本所在位置和具体内容,提取出整张表格的信息;
S4、基于图像形态学检测表格线,并提取单元格位置坐标;
S5、生成并输出Excel文件。
2.根据权利要求1所述的一种基于深度学习框架的财务报表自动识别方法,其特征在于,步骤S1具体包括以下步骤:
S11、准备财务报表文件;
S12、使用Python工具中的OpenCV2算法库接收财务报表图像,并统一转化为png格式文件。
3.根据权利要求2所述的一种基于深度学习框架的财务报表自动识别方法,其特征在于,步骤S2具体包括以下步骤:
S21、准备训练集数据;
S22、基于霍夫直线法,使用Python工具中的OpenCV2算法库获取财务报表图像中倾斜角度小于45度的直线;
S23、根据获取的直线斜率,计算出平均斜率;
S24、根据平均斜率对财务报表图像进行校正,调整表格至水平状态;
S25、基于测试集数据检验有效校正率,有效校正率为99.6%。
4.根据权利要求3所述的一种基于深度学习框架的财务报表自动识别方法,其特征在于,步骤S3具体包括以下步骤:
S31、准备训练集数据;
S32、获取不同位置、不同噪声下的单元格图像;
S33、使用Python工具中的TensorFlow和Keras算法库,基于CTPN深度学习网络对文本所在区域进行定位,采用区域坐标的方式标记出单元格图像文本的所在位置,坐标采用五级标识进行定位;
S34、使用Python工具中的TensorFlow和Keras算法库,基于训练集数据建立CRNN神经网络模型,进行中英文及数字的识别,获取相应坐标区域内的文本内容;
S35、基于测试集数据对上述CRNN神经网络模型识别结果进行评估,识别准确率为99.5%。
5.根据权利要求4所述的一种基于深度学习框架的财务报表自动识别方法,其特征在于,步骤S33中,所述五级标识为角度、横坐标、纵坐标、宽度和高度。
6.根据权利要求4所述的一种基于深度学习框架的财务报表自动识别方法,其特征在于,步骤S4具体包括以下步骤:
S41、准备训练集数据;
S42、对财务报表图像进行二值化处理,将财务报表图像的灰度值根据阈值进行0,1处理;
S43、使用Python工具中的OpenCV2算法库,构造横、竖两种腐蚀核,对二值图像进行过滤,横向腐蚀核处理得到表格的横线,竖向腐蚀核处理得到表格的竖线,并以矩阵形式进行标记;
S44、对每个像素点所对应的矩阵[r,g,b]进行归一化处理,并分别进行横向矩阵投影处理和纵向矩阵投影处理;
S45、根据得到的行和列,定位财务报表图像中每个单元格的位置,同时,根据生成的行和列与文字所对应的位置与大小进行匹配,若字的位置穿过了某条行,则去除该条行对应的表格线,将相邻两个横向单元格合并为一个单元格;若字的位置穿过了某条列,则去除该条列对应的表格线,将相邻两个纵向单元格合并为一个单元格;
S46、基于测试集数据检验模型识别结果准确率,准确率为99.7%。
7.根据权利要求6所述的一种基于深度学习框架的财务报表自动识别方法,其特征在于,步骤S5具体包括以下步骤:
S51、根据得到的表格位置信息,使用Python工具的xlwt算法库生成对应的空白Excel文件;
S52、根据已识别的文本位置、文本内容将对应坐标区域内的文本内容填入单元格,并输出Excel文件。
CN202010571056.8A 2020-06-22 2020-06-22 一种基于深度学习框架的财务报表自动识别方法 Pending CN111814598A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010571056.8A CN111814598A (zh) 2020-06-22 2020-06-22 一种基于深度学习框架的财务报表自动识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010571056.8A CN111814598A (zh) 2020-06-22 2020-06-22 一种基于深度学习框架的财务报表自动识别方法

Publications (1)

Publication Number Publication Date
CN111814598A true CN111814598A (zh) 2020-10-23

Family

ID=72846335

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010571056.8A Pending CN111814598A (zh) 2020-06-22 2020-06-22 一种基于深度学习框架的财务报表自动识别方法

Country Status (1)

Country Link
CN (1) CN111814598A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112241730A (zh) * 2020-11-21 2021-01-19 杭州投知信息技术有限公司 一种基于机器学习的表格提取方法和***
CN112418204A (zh) * 2020-11-18 2021-02-26 杭州未名信科科技有限公司 基于纸质文档的文本识别方法、***及计算机介质
CN112800824A (zh) * 2020-12-08 2021-05-14 北京方正印捷数码技术有限公司 扫描文件的处理方法、装置、设备及存储介质
CN113111630A (zh) * 2021-04-21 2021-07-13 江西财经职业学院 一种会计***
CN113657274A (zh) * 2021-08-17 2021-11-16 北京百度网讯科技有限公司 表格生成方法、装置、电子设备、存储介质及产品
CN113723252A (zh) * 2021-08-23 2021-11-30 上海财联社金融科技有限公司 一种表格型文本图片的识别方法和***
CN113989823A (zh) * 2021-09-14 2022-01-28 北京左医科技有限公司 基于ocr坐标的图片表格还原方法及***
CN118071525A (zh) * 2024-04-17 2024-05-24 江西科技学院 一种财务数据审核方法及***

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108470164A (zh) * 2018-03-20 2018-08-31 上海眼控科技股份有限公司 一种用于财务报表的数字识别***及方法
CN108491789A (zh) * 2018-03-20 2018-09-04 上海眼控科技股份有限公司 一种用于财务报表的汉字识别方法及装置
CN109492143A (zh) * 2018-09-21 2019-03-19 平安科技(深圳)有限公司 图像数据处理方法、装置、计算机设备及存储介质
CN110298338A (zh) * 2019-06-20 2019-10-01 北京易道博识科技有限公司 一种文档图像分类方法及装置
CN110399798A (zh) * 2019-06-25 2019-11-01 朱跃飞 一种基于深度学习的离散图片文件信息提取***及方法
CN110569839A (zh) * 2019-08-09 2019-12-13 河海大学常州校区 一种基于ctpn和crnn的银行***识别方法
CN110929580A (zh) * 2019-10-25 2020-03-27 北京译图智讯科技有限公司 一种基于ocr的财务报表信息快速提取方法及***
CN110956171A (zh) * 2019-11-06 2020-04-03 广州供电局有限公司 铭牌自动识别方法、装置、计算机设备和存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108470164A (zh) * 2018-03-20 2018-08-31 上海眼控科技股份有限公司 一种用于财务报表的数字识别***及方法
CN108491789A (zh) * 2018-03-20 2018-09-04 上海眼控科技股份有限公司 一种用于财务报表的汉字识别方法及装置
CN109492143A (zh) * 2018-09-21 2019-03-19 平安科技(深圳)有限公司 图像数据处理方法、装置、计算机设备及存储介质
CN110298338A (zh) * 2019-06-20 2019-10-01 北京易道博识科技有限公司 一种文档图像分类方法及装置
CN110399798A (zh) * 2019-06-25 2019-11-01 朱跃飞 一种基于深度学习的离散图片文件信息提取***及方法
CN110569839A (zh) * 2019-08-09 2019-12-13 河海大学常州校区 一种基于ctpn和crnn的银行***识别方法
CN110929580A (zh) * 2019-10-25 2020-03-27 北京译图智讯科技有限公司 一种基于ocr的财务报表信息快速提取方法及***
CN110956171A (zh) * 2019-11-06 2020-04-03 广州供电局有限公司 铭牌自动识别方法、装置、计算机设备和存储介质

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112418204A (zh) * 2020-11-18 2021-02-26 杭州未名信科科技有限公司 基于纸质文档的文本识别方法、***及计算机介质
CN112241730A (zh) * 2020-11-21 2021-01-19 杭州投知信息技术有限公司 一种基于机器学习的表格提取方法和***
CN112800824A (zh) * 2020-12-08 2021-05-14 北京方正印捷数码技术有限公司 扫描文件的处理方法、装置、设备及存储介质
CN112800824B (zh) * 2020-12-08 2024-02-02 北京方正印捷数码技术有限公司 扫描文件的处理方法、装置、设备及存储介质
CN113111630A (zh) * 2021-04-21 2021-07-13 江西财经职业学院 一种会计***
CN113657274A (zh) * 2021-08-17 2021-11-16 北京百度网讯科技有限公司 表格生成方法、装置、电子设备、存储介质及产品
CN113723252A (zh) * 2021-08-23 2021-11-30 上海财联社金融科技有限公司 一种表格型文本图片的识别方法和***
CN113989823A (zh) * 2021-09-14 2022-01-28 北京左医科技有限公司 基于ocr坐标的图片表格还原方法及***
CN118071525A (zh) * 2024-04-17 2024-05-24 江西科技学院 一种财务数据审核方法及***

Similar Documents

Publication Publication Date Title
CN111814598A (zh) 一种基于深度学习框架的财务报表自动识别方法
CN109902622B (zh) 一种用于登机牌信息验证的文字检测识别方法
CN106156761B (zh) 面向移动终端拍摄的图像表格检测与识别方法
US7657091B2 (en) Method for automatic removal of text from a signature area
CN112651289B (zh) 一种增值税普通***智能识别与校验***及其方法
CN112052852B (zh) 一种基于深度学习的手写气象档案资料的字符识别方法
CN110929580A (zh) 一种基于ocr的财务报表信息快速提取方法及***
CN110647885B (zh) 基于图片识别的试卷拆分方法、装置、设备以及介质
CN111914805A (zh) 表格结构化方法、装置、电子设备及存储介质
CN109447055B (zh) 一种基于ocr字形相近文字识别方法
CN105117741A (zh) 一种书法字风格的识别方法
CN110738030A (zh) 表格重建方法、装置、电子设备及存储介质
CN112906695B (zh) 适配多类ocr识别接口的表格识别方法及相关设备
CN110543475A (zh) 一种基于机器学习的财务报表数据自动识别和分析方法
CN113191309A (zh) 一种手写汉字的识别、评分、纠错方法及***
CN115909375A (zh) 一种基于智能识别的报表分析方法
CN111091090A (zh) 一种银行报表ocr识别方法、装置、平台和终端
CN117037198A (zh) 一种银行对账单的识别方法
CN111652117A (zh) 一种对多文档图像分割的方法及介质
CN111626145A (zh) 一种简捷有效的残缺表格识别及跨页拼接方法
Sanguansat Robust and low-cost Optical Mark Recognition for automated data entry
US20100272359A1 (en) Method for resolving contradicting output data from an optical character recognition (ocr) system, wherein the output data comprises more than one recognition alternative for an image of a character
RU2597163C2 (ru) Сравнение документов с использованием достоверного источника
CN111611883A (zh) 基于最小单元格聚类的表格版面分析方法、***及设备
CN112215192B (zh) 一种基于机器视觉技术的快速录入试卷成绩的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination