CN112818971A - 一种基于智能识别文件中图片内容的方法及装置 - Google Patents

一种基于智能识别文件中图片内容的方法及装置 Download PDF

Info

Publication number
CN112818971A
CN112818971A CN202011453844.3A CN202011453844A CN112818971A CN 112818971 A CN112818971 A CN 112818971A CN 202011453844 A CN202011453844 A CN 202011453844A CN 112818971 A CN112818971 A CN 112818971A
Authority
CN
China
Prior art keywords
character
picture
recognized
sequence
coordinate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011453844.3A
Other languages
English (en)
Inventor
陈剑光
谢化安
谢志武
李�根
杨灿魁
李志�
佟忠正
雷璟
王栋
肖琪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Power Grid Co Ltd
Original Assignee
Guangdong Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Power Grid Co Ltd filed Critical Guangdong Power Grid Co Ltd
Priority to CN202011453844.3A priority Critical patent/CN112818971A/zh
Publication of CN112818971A publication Critical patent/CN112818971A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Character Discrimination (AREA)

Abstract

本发明涉及文字识别领域,具体公开了一种基于智能识别文件中图片内容的方法,其特征在于,包括以下步骤:获取待处理招标文件,生成待识别图片,所述待识别图片中存在至少一个文字序列;对所述待识别图片中的每个文字序列进行数据预处理,获得每个文字序列中各字符相匹配的字符特征,所述字符特征包括语义特征信息和坐标信息;根据每个文字序列中各字符相匹配的字符特征具有的语义特征信息和坐标信息,获得所述待识别图片中的文字识别结果。本发明利用了文本的语义特征,融合了文字在图像上的坐标信息,提高了图像的文字识别的准确度,能够快速识别图像中的文字,较少了专家评审时间,提高了工作效率。

Description

一种基于智能识别文件中图片内容的方法及装置
技术领域
本发明涉及文字识别领域,特别是涉及一种基于智能识别文件中图片内容的方法及装置
背景技术
按照广电企【2019】8号文《关于印发公司深化招标管理改革任务分解表的通知》整体要求,通过利用供应商数据重构等技术实现客观分智能计算、投标文件自动定位、智能辅助验真,减轻专家评标时客观分评审工作量、减少专家机械工作内容、对投标文件所提供资料进行验真。现有技术采用的是人工审查方式对招标文件内容进行评分,不仅使得评分时间较长率较低,还使得评分不够精确。
发明内容
针对上述问题,本发明的目的在于提供了一种基于智能识别文件中图片内容的方法及装置。
为解决上述问题,本发明第一方面提供了一种基于智能识别文件中图片内容的方法,包括以下步骤:
S1.获取待处理招标文件,生成待识别图片,所述待识别图片中存在至少一个文字序列;
S2.对所述待识别图片中的每个文字序列进行数据预处理,获得每个文字序列中各字符相匹配的字符特征,所述字符特征包括语义特征信息和坐标信息;
S3.根据每个文字序列中各字符相匹配的字符特征具有的语义特征信息和坐标信息,获得所述待识别图片中的文字识别结果。
优选地,步骤S1中,所述招标文件包括:营业执照信息、财务数据、业绩数据、产品价格、产品质量及库存数量投标时间信息。
优选地,步骤S2具体为:根据所述待识别图片中每个文字序列中各字符的语义特征进行分析,得到每个文字序列中各字符相匹配的语义向量标签;确定所述待识别图片中每个文字序列中各字符的坐标信息;根据各字符的坐标信息进行标识和坐标校正,得到各字符的位置向量标签,所述位置向量标签与所述语义向量标签的坐标相同;对每个字符的语义向量标签和位置向量标签进行数据融合,得到每个字符的字符特征。
优选地,根据所述待识别图片中每个文字序列中各字符的语义特征进行分析,得到每个文字序列中各字符相匹配的语义向量标签包括:对于所述待识别图片中的各字符,加权融合所述字符所属文字序列中所有字符的语义特征信息,得到所述字符的语义向量标签。
优选地,根据各字符的坐标信息进行标识和坐标校正,得到各字符的位置向量标签包括:确定所述待识别图片中表征各字符的像素点;根据各个字符相匹配的多个像素点的坐标信息,确定每个字符的位置向量;根据各个字符相匹配的语义向量标签的水平方向和垂直方向,对各个字符的位置向量进行坐标校正,得到水平方向和垂直方向与语义向量标签具有相同方向的位置向量标签。
优选地,根据各个字符相匹配的多个像素点的坐标信息,确定每个字符的位置向 量包括设水平方向的向量坐标为
Figure RE-201949DEST_PATH_IMAGE001
,垂直平方向的向量坐标为
Figure RE-443574DEST_PATH_IMAGE002
,则坐标向量为
Figure RE-781014DEST_PATH_IMAGE003
其中,n为像素点数,xj为任一点水平向量坐标,yj为任一点垂直向量坐标。
优选地,将每个文字序列中各字符相匹配的字符特征输入到内容分析模型中,确定各字符的上下文内容,所述内容分析模型用于分析各字符的上下文内容;根据各字符的上下文内容,确定出各字符所属的领域标签;将每个文字序列中各字符的上下文内容以及各字符所属的领域标签输入到判断模型中,得到所述待识别图片中的文字识别结果。
本发明第二方面提供了一种基于智能识别文件中图片内容的装置,包括:
获取数据模块:所述的获取数据模块模块用于:获取待处理招标文件,生成待识别图片,所述待识别图片中存在至少一个文字序列;
文字处理模块:所述的文字处理模块用于对所述待识别图片中的每个文字序列进行数据预处理,获得每个文字序列中各字符相匹配的字符特征,所述字符特征包括语义特征信息和坐标信息;
文字识别模块:所述的文字识别模块用于根据每个文字序列中各字符相匹配的字符特征具有的语义特征信息和坐标信息,获得所述待识别图片中的文字识别结果。
与现有技术相比,本发明具有的有益效果为:本发明利用了文本的语义特征,融合了文字在图像上的坐标信息,提高了图像的文字识别的准确度,能够快速识别图像中的文字,较少了专家评审时间,提高了工作效率。
附图说明
图1为本发明实施例提供的一种基于智能识别文件中图片内容的方法的流程图;
图2为本发明实施例提供的一种基于智能识别文件中图片内容的装置的示意图;
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
请参阅图1,本发明实施例提供了一种基于智能识别文件中图片内容的方法,包括以下步骤:
S1.获取待处理招标文件,生成待识别图片,所述待识别图片中存在至少一个文字序列;
在本发明实施例中,步骤S1中,所述招标文件包括:营业执照信息、财务数据、业绩数据、产品价格、产品质量及库存数量投标时间信息。
S2.对所述待识别图片中的每个文字序列进行数据预处理,获得每个文字序列中各字符相匹配的字符特征,所述字符特征包括语义特征信息和坐标信息;
在本发明实施例中,步骤S2具体为:根据所述待识别图片中每个文字序列中各字符的语义特征进行分析,得到每个文字序列中各字符相匹配的语义向量标签;确定所述待识别图片中每个文字序列中各字符的坐标信息;根据各字符的坐标信息进行标识和坐标校正,得到各字符的位置向量标签,所述位置向量标签与所述语义向量标签的坐标相同;对每个字符的语义向量标签和位置向量标签进行数据融合,得到每个字符的字符特征。
在本发明实施例中,根据所述待识别图片中每个文字序列中各字符的语义特征进行分析,得到每个文字序列中各字符相匹配的语义向量标签包括:对于所述待识别图片中的各字符,加权融合所述字符所属文字序列中所有字符的语义特征信息,得到所述字符的语义向量标签。
在本发明实施例中,根据各字符的坐标信息进行标识和坐标校正,得到各字符的位置向量标签包括:确定所述待识别图片中表征各字符的像素点;根据各个字符相匹配的多个像素点的坐标信息,确定每个字符的位置向量;根据各个字符相匹配的语义向量标签的水平方向和垂直方向,对各个字符的位置向量进行坐标校正,得到水平方向和垂直方向与语义向量标签具有相同方向的位置向量标签。
在本发明实施例中,根据各个字符相匹配的多个像素点的坐标信息,确定每个字 符的位置向量包括设水平方向的向量坐标为
Figure RE-424485DEST_PATH_IMAGE001
,垂直平方向的向量坐标为
Figure RE-759652DEST_PATH_IMAGE004
,则坐标向量为
Figure RE-488573DEST_PATH_IMAGE005
其中,n为像素点数,xj为任一点水平向量坐标,yj为任一点垂直向量坐标。
S3.根据每个文字序列中各字符相匹配的字符特征具有的语义特征信息和坐标信息,获得所述待识别图片中的文字识别结果。
在本发明实施例中,将每个文字序列中各字符相匹配的字符特征输入到内容分析模型中,确定各字符的上下文内容,所述内容分析模型用于分析各字符的上下文内容;根据各字符的上下文内容,确定出各字符所属的领域标签;将每个文字序列中各字符的上下文内容以及各字符所属的领域标签输入到判断模型中,得到所述待识别图片中的文字识别结果。
本发明利用了文本的语义特征,融合了文字在图像上的坐标信息,提高了图像的文字识别的准确度,能够快速识别图像中的文字,较少了专家评审时间,提高了工作效率。
请参阅图2,本发明实施例提供了一种基于智能识别文件中图片内容的装置,包括:
获取数据模块201:所述的获取数据模块模块用于:获取待处理招标文件,生成待识别图片,所述待识别图片中存在至少一个文字序列;
文字处理模块202:所述的文字处理模块用于对所述待识别图片中的每个文字序列进行数据预处理,获得每个文字序列中各字符相匹配的字符特征,所述字符特征包括语义特征信息和坐标信息;
文字识别模块203:所述的文字识别模块用于根据每个文字序列中各字符相匹配的字符特征具有的语义特征信息和坐标信息,获得所述待识别图片中的文字识别结果。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种基于智能识别文件中图片内容的方法,其特征在于,包括以下步骤:
S1.获取待处理招标文件,生成待识别图片,所述待识别图片中存在至少一个文字序列;
S2.对所述待识别图片中的每个文字序列进行数据预处理,获得每个文字序列中各字符相匹配的字符特征,所述字符特征包括语义特征信息和坐标信息;
S3.根据每个文字序列中各字符相匹配的字符特征具有的语义特征信息和坐标信息,获得所述待识别图片中的文字识别结果。
2.根据权利要求1所述的基于智能识别文件中图片内容的方法,其特征在于,步骤S1中,所述招标文件包括:营业执照信息、财务数据、业绩数据、产品价格、产品质量及库存数量投标时间信息。
3.根据权利要求1所述的基于智能识别文件中图片内容的方法,其特征在于,步骤S2具体为:根据所述待识别图片中每个文字序列中各字符的语义特征进行分析,得到每个文字序列中各字符相匹配的语义向量标签;确定所述待识别图片中每个文字序列中各字符的坐标信息;根据各字符的坐标信息进行标识和坐标校正,得到各字符的位置向量标签,所述位置向量标签与所述语义向量标签的坐标相同;对每个字符的语义向量标签和位置向量标签进行数据融合,得到每个字符的字符特征。
4.根据权利要求3所述的基于智能识别文件中图片内容的方法,其特征在于,根据所述待识别图片中每个文字序列中各字符的语义特征进行分析,得到每个文字序列中各字符相匹配的语义向量标签包括:对于所述待识别图片中的各字符,加权融合所述字符所属文字序列中所有字符的语义特征信息,得到所述字符的语义向量标签。
5.根据权利要求3所述的基于智能识别文件中图片内容的方法,其特征在于,根据各字符的坐标信息进行标识和坐标校正,得到各字符的位置向量标签包括:确定所述待识别图片中表征各字符的像素点;根据各个字符相匹配的多个像素点的坐标信息,确定每个字符的位置向量;根据各个字符相匹配的语义向量标签的水平方向和垂直方向,对各个字符的位置向量进行坐标校正,得到水平方向和垂直方向与语义向量标签具有相同方向的位置向量标签。
6.根据权利要求5所述的基于智能识别文件中图片内容的方法,其特征在于,根据各个字符相匹配的多个像素点的坐标信息,确定每个字符的位置向量包括设水平方向的向量坐标为
Figure RE-DEST_PATH_IMAGE001
=(x1,x2,…,x3),垂直平方向的向量坐标为
Figure RE-499641DEST_PATH_IMAGE002
=(y 1,y 2,…,y 3),则坐标向量为
Figure RE-DEST_PATH_IMAGE003
=
Figure RE-76116DEST_PATH_IMAGE004
其中,n为像素点数,xj为任一点水平向量坐标,yj为任一点垂直向量坐标。
7.根据权利要求1所述的基于智能识别文件中图片内容的方法,其特征在于,将每个文字序列中各字符相匹配的字符特征输入到内容分析模型中,确定各字符的上下文内容,所述内容分析模型用于分析各字符的上下文内容;根据各字符的上下文内容,确定出各字符所属的领域标签;将每个文字序列中各字符的上下文内容以及各字符所属的领域标签输入到判断模型中,得到所述待识别图片中的文字识别结果。
8.一种基于智能识别文件中图片内容的装置,其特征在于,包括:
获取数据模块:所述的获取数据模块模块用于:获取待处理招标文件,生成待识别图片,所述待识别图片中存在至少一个文字序列;
文字处理模块:所述的文字处理模块用于对所述待识别图片中的每个文字序列进行数据预处理,获得每个文字序列中各字符相匹配的字符特征,所述字符特征包括语义特征信息和坐标信息;
文字识别模块:所述的文字识别模块用于根据每个文字序列中各字符相匹配的字符特征具有的语义特征信息和坐标信息,获得所述待识别图片中的文字识别结果。
CN202011453844.3A 2020-12-12 2020-12-12 一种基于智能识别文件中图片内容的方法及装置 Pending CN112818971A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011453844.3A CN112818971A (zh) 2020-12-12 2020-12-12 一种基于智能识别文件中图片内容的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011453844.3A CN112818971A (zh) 2020-12-12 2020-12-12 一种基于智能识别文件中图片内容的方法及装置

Publications (1)

Publication Number Publication Date
CN112818971A true CN112818971A (zh) 2021-05-18

Family

ID=75853427

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011453844.3A Pending CN112818971A (zh) 2020-12-12 2020-12-12 一种基于智能识别文件中图片内容的方法及装置

Country Status (1)

Country Link
CN (1) CN112818971A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090110288A1 (en) * 2007-10-29 2009-04-30 Kabushiki Kaisha Toshiba Document processing apparatus and document processing method
CN110569846A (zh) * 2019-09-16 2019-12-13 北京百度网讯科技有限公司 图像文字识别方法、装置、设备及存储介质
CN111680686A (zh) * 2020-06-08 2020-09-18 Oppo(重庆)智能科技有限公司 招牌信息识别方法、装置、终端及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090110288A1 (en) * 2007-10-29 2009-04-30 Kabushiki Kaisha Toshiba Document processing apparatus and document processing method
CN110569846A (zh) * 2019-09-16 2019-12-13 北京百度网讯科技有限公司 图像文字识别方法、装置、设备及存储介质
CN111680686A (zh) * 2020-06-08 2020-09-18 Oppo(重庆)智能科技有限公司 招牌信息识别方法、装置、终端及存储介质

Similar Documents

Publication Publication Date Title
CN110795919B (zh) 一种pdf文档中的表格抽取方法、装置、设备及介质
CN110909123B (zh) 一种数据提取方法、装置、终端设备及存储介质
CN102193946A (zh) 为媒体文件添加标签方法和使用该方法的***
CN113255501B (zh) 生成表格识别模型的方法、设备、介质及程序产品
CN110647956A (zh) 一种联合二维码识别的***信息提取方法
CN111310750B (zh) 一种信息处理方法、装置、计算设备及介质
CN109886257A (zh) 一种ocr***中采用深度学习矫正***图片分割结果的方法
CN112232352A (zh) 一种智能识别pcb图纸自动计价***和方法
CN115687643A (zh) 一种训练多模态信息抽取模型的方法及信息抽取方法
CN111462388A (zh) 一种票据检验方法、装置、终端设备及存储介质
CN110291527A (zh) 信息处理方法、***、云处理设备以及计算机程序产品
CN114758341A (zh) 一种智能化合同图像识别与合同要素抽取方法及装置
WO2022082431A1 (en) Systems and methods for extracting information from paper media based on depth information
CN113780116A (zh) ***分类方法、装置、计算机设备和存储介质
CN112418813A (zh) 基于智能解析识别的aeo资质智能评级管理***、方法及存储介质
CN112418206A (zh) 基于位置检测模型的图片分类方法及其相关设备
CN113743159A (zh) 一种应用于电力企业的ocr方法
CN112818971A (zh) 一种基于智能识别文件中图片内容的方法及装置
CN116110066A (zh) 票据文本的信息提取方法、装置、设备及存储介质
CN115659023A (zh) 一种基于标签自动标注的智能政策匹配方法及***
CN114359931A (zh) 一种快递面单识别方法、装置、计算机设备及存储介质
CN114241485A (zh) 房产证的信息识别方法、装置、设备及存储介质
CN113657373A (zh) 一种文书自动编目方法
CN112560408A (zh) 一种文本标注方法、装置、终端及存储介质
CN113011249A (zh) 票据审核方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination