CN112818971A

CN112818971A - 一种基于智能识别文件中图片内容的方法及装置

Info

Publication number: CN112818971A
Application number: CN202011453844.3A
Authority: CN
Inventors: 陈剑光; 谢化安; 谢志武; 李�根; 杨灿魁; 李志�; 佟忠正; 雷璟; 王栋; 肖琪
Original assignee: Guangdong Power Grid Co Ltd
Current assignee: Guangdong Power Grid Co Ltd
Priority date: 2020-12-12
Filing date: 2020-12-12
Publication date: 2021-05-18

Abstract

本发明涉及文字识别领域，具体公开了一种基于智能识别文件中图片内容的方法，其特征在于，包括以下步骤：获取待处理招标文件，生成待识别图片，所述待识别图片中存在至少一个文字序列；对所述待识别图片中的每个文字序列进行数据预处理，获得每个文字序列中各字符相匹配的字符特征，所述字符特征包括语义特征信息和坐标信息；根据每个文字序列中各字符相匹配的字符特征具有的语义特征信息和坐标信息，获得所述待识别图片中的文字识别结果。本发明利用了文本的语义特征，融合了文字在图像上的坐标信息，提高了图像的文字识别的准确度，能够快速识别图像中的文字，较少了专家评审时间，提高了工作效率。

Description

一种基于智能识别文件中图片内容的方法及装置

技术领域

本发明涉及文字识别领域，特别是涉及一种基于智能识别文件中图片内容的方法及装置

背景技术

按照广电企【2019】8号文《关于印发公司深化招标管理改革任务分解表的通知》整体要求，通过利用供应商数据重构等技术实现客观分智能计算、投标文件自动定位、智能辅助验真，减轻专家评标时客观分评审工作量、减少专家机械工作内容、对投标文件所提供资料进行验真。现有技术采用的是人工审查方式对招标文件内容进行评分，不仅使得评分时间较长率较低，还使得评分不够精确。

发明内容

针对上述问题，本发明的目的在于提供了一种基于智能识别文件中图片内容的方法及装置。

为解决上述问题，本发明第一方面提供了一种基于智能识别文件中图片内容的方法，包括以下步骤：

S1.获取待处理招标文件，生成待识别图片，所述待识别图片中存在至少一个文字序列；

S2.对所述待识别图片中的每个文字序列进行数据预处理，获得每个文字序列中各字符相匹配的字符特征，所述字符特征包括语义特征信息和坐标信息；

S3.根据每个文字序列中各字符相匹配的字符特征具有的语义特征信息和坐标信息，获得所述待识别图片中的文字识别结果。

优选地，步骤S1中，所述招标文件包括：营业执照信息、财务数据、业绩数据、产品价格、产品质量及库存数量投标时间信息。

优选地，步骤S2具体为：根据所述待识别图片中每个文字序列中各字符的语义特征进行分析，得到每个文字序列中各字符相匹配的语义向量标签；确定所述待识别图片中每个文字序列中各字符的坐标信息；根据各字符的坐标信息进行标识和坐标校正，得到各字符的位置向量标签，所述位置向量标签与所述语义向量标签的坐标相同；对每个字符的语义向量标签和位置向量标签进行数据融合，得到每个字符的字符特征。

优选地，根据所述待识别图片中每个文字序列中各字符的语义特征进行分析，得到每个文字序列中各字符相匹配的语义向量标签包括：对于所述待识别图片中的各字符，加权融合所述字符所属文字序列中所有字符的语义特征信息，得到所述字符的语义向量标签。

优选地，根据各字符的坐标信息进行标识和坐标校正，得到各字符的位置向量标签包括：确定所述待识别图片中表征各字符的像素点；根据各个字符相匹配的多个像素点的坐标信息，确定每个字符的位置向量；根据各个字符相匹配的语义向量标签的水平方向和垂直方向，对各个字符的位置向量进行坐标校正，得到水平方向和垂直方向与语义向量标签具有相同方向的位置向量标签。

优选地，根据各个字符相匹配的多个像素点的坐标信息，确定每个字符的位置向量包括设水平方向的向量坐标为

，垂直平方向的向量坐标为

，则坐标向量为

其中，n为像素点数，x_j为任一点水平向量坐标，y_j为任一点垂直向量坐标。

优选地，将每个文字序列中各字符相匹配的字符特征输入到内容分析模型中，确定各字符的上下文内容，所述内容分析模型用于分析各字符的上下文内容；根据各字符的上下文内容，确定出各字符所属的领域标签；将每个文字序列中各字符的上下文内容以及各字符所属的领域标签输入到判断模型中，得到所述待识别图片中的文字识别结果。

本发明第二方面提供了一种基于智能识别文件中图片内容的装置，包括：

获取数据模块：所述的获取数据模块模块用于：获取待处理招标文件，生成待识别图片，所述待识别图片中存在至少一个文字序列；

文字处理模块：所述的文字处理模块用于对所述待识别图片中的每个文字序列进行数据预处理，获得每个文字序列中各字符相匹配的字符特征，所述字符特征包括语义特征信息和坐标信息；

文字识别模块：所述的文字识别模块用于根据每个文字序列中各字符相匹配的字符特征具有的语义特征信息和坐标信息，获得所述待识别图片中的文字识别结果。

与现有技术相比，本发明具有的有益效果为：本发明利用了文本的语义特征，融合了文字在图像上的坐标信息，提高了图像的文字识别的准确度，能够快速识别图像中的文字，较少了专家评审时间，提高了工作效率。

附图说明

图1为本发明实施例提供的一种基于智能识别文件中图片内容的方法的流程图；

图2为本发明实施例提供的一种基于智能识别文件中图片内容的装置的示意图；

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

请参阅图1，本发明实施例提供了一种基于智能识别文件中图片内容的方法，包括以下步骤：

在本发明实施例中，步骤S1中，所述招标文件包括：营业执照信息、财务数据、业绩数据、产品价格、产品质量及库存数量投标时间信息。

在本发明实施例中，步骤S2具体为：根据所述待识别图片中每个文字序列中各字符的语义特征进行分析，得到每个文字序列中各字符相匹配的语义向量标签；确定所述待识别图片中每个文字序列中各字符的坐标信息；根据各字符的坐标信息进行标识和坐标校正，得到各字符的位置向量标签，所述位置向量标签与所述语义向量标签的坐标相同；对每个字符的语义向量标签和位置向量标签进行数据融合，得到每个字符的字符特征。

在本发明实施例中，根据所述待识别图片中每个文字序列中各字符的语义特征进行分析，得到每个文字序列中各字符相匹配的语义向量标签包括：对于所述待识别图片中的各字符，加权融合所述字符所属文字序列中所有字符的语义特征信息，得到所述字符的语义向量标签。

在本发明实施例中，根据各字符的坐标信息进行标识和坐标校正，得到各字符的位置向量标签包括：确定所述待识别图片中表征各字符的像素点；根据各个字符相匹配的多个像素点的坐标信息，确定每个字符的位置向量；根据各个字符相匹配的语义向量标签的水平方向和垂直方向，对各个字符的位置向量进行坐标校正，得到水平方向和垂直方向与语义向量标签具有相同方向的位置向量标签。

在本发明实施例中，根据各个字符相匹配的多个像素点的坐标信息，确定每个字符的位置向量包括设水平方向的向量坐标为

，垂直平方向的向量坐标为

，则坐标向量为

在本发明实施例中，将每个文字序列中各字符相匹配的字符特征输入到内容分析模型中，确定各字符的上下文内容，所述内容分析模型用于分析各字符的上下文内容；根据各字符的上下文内容，确定出各字符所属的领域标签；将每个文字序列中各字符的上下文内容以及各字符所属的领域标签输入到判断模型中，得到所述待识别图片中的文字识别结果。

本发明利用了文本的语义特征，融合了文字在图像上的坐标信息，提高了图像的文字识别的准确度，能够快速识别图像中的文字，较少了专家评审时间，提高了工作效率。

请参阅图2，本发明实施例提供了一种基于智能识别文件中图片内容的装置，包括：

获取数据模块201：所述的获取数据模块模块用于：获取待处理招标文件，生成待识别图片，所述待识别图片中存在至少一个文字序列；

文字处理模块202：所述的文字处理模块用于对所述待识别图片中的每个文字序列进行数据预处理，获得每个文字序列中各字符相匹配的字符特征，所述字符特征包括语义特征信息和坐标信息；

文字识别模块203：所述的文字识别模块用于根据每个文字序列中各字符相匹配的字符特征具有的语义特征信息和坐标信息，获得所述待识别图片中的文字识别结果。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于智能识别文件中图片内容的方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的基于智能识别文件中图片内容的方法，其特征在于，步骤S1中，所述招标文件包括：营业执照信息、财务数据、业绩数据、产品价格、产品质量及库存数量投标时间信息。

3.根据权利要求1所述的基于智能识别文件中图片内容的方法，其特征在于，步骤S2具体为：根据所述待识别图片中每个文字序列中各字符的语义特征进行分析，得到每个文字序列中各字符相匹配的语义向量标签；确定所述待识别图片中每个文字序列中各字符的坐标信息；根据各字符的坐标信息进行标识和坐标校正，得到各字符的位置向量标签，所述位置向量标签与所述语义向量标签的坐标相同；对每个字符的语义向量标签和位置向量标签进行数据融合，得到每个字符的字符特征。

4.根据权利要求3所述的基于智能识别文件中图片内容的方法，其特征在于，根据所述待识别图片中每个文字序列中各字符的语义特征进行分析，得到每个文字序列中各字符相匹配的语义向量标签包括：对于所述待识别图片中的各字符，加权融合所述字符所属文字序列中所有字符的语义特征信息，得到所述字符的语义向量标签。

5.根据权利要求3所述的基于智能识别文件中图片内容的方法，其特征在于，根据各字符的坐标信息进行标识和坐标校正，得到各字符的位置向量标签包括：确定所述待识别图片中表征各字符的像素点；根据各个字符相匹配的多个像素点的坐标信息，确定每个字符的位置向量；根据各个字符相匹配的语义向量标签的水平方向和垂直方向，对各个字符的位置向量进行坐标校正，得到水平方向和垂直方向与语义向量标签具有相同方向的位置向量标签。

6.根据权利要求5所述的基于智能识别文件中图片内容的方法，其特征在于，根据各个字符相匹配的多个像素点的坐标信息，确定每个字符的位置向量包括设水平方向的向量坐标为

=(x₁，x₂，…，x₃)，垂直平方向的向量坐标为

=(y₁，y₂，…，y₃)，则坐标向量为

=

7.根据权利要求1所述的基于智能识别文件中图片内容的方法，其特征在于，将每个文字序列中各字符相匹配的字符特征输入到内容分析模型中，确定各字符的上下文内容，所述内容分析模型用于分析各字符的上下文内容；根据各字符的上下文内容，确定出各字符所属的领域标签；将每个文字序列中各字符的上下文内容以及各字符所属的领域标签输入到判断模型中，得到所述待识别图片中的文字识别结果。

8.一种基于智能识别文件中图片内容的装置，其特征在于，包括：