CN114565044B

CN114565044B - 识别方法及

Info

Publication number: CN114565044B
Application number: CN202210193763.7A
Authority: CN
Inventors: 方磊; 严京旗; 徐敏
Original assignee: Beijing Zetyun Tech Co ltd
Current assignee: Beijing Zetyun Tech Co ltd
Priority date: 2022-03-01
Filing date: 2022-03-01
Publication date: 2022-08-16
Anticipated expiration: 2042-03-01
Also published as: CN114565044A

Abstract

本发明提供了一种***识别方法及***，所述方法包括：对目标文件进行***识别处理，获得目标文件包括的至少两个***图像；根据各***图像之间的图像相似度，确定至少一个***分组；每个***分组包括融合***和N个***图像，融合***基于N个***图像生成，N为大于1的正整数；对每个***分组进行文本识别处理，得到每个***分组对应的目标文本识别结果。上述***识别的过程中，对属于同一***分组中相似度较高的***图像进行文本识别，而不是对单枚***进行文字识别，以此消除了单枚***可能存在图像操作，图像印痕，以及受到成像视角等因素对文本识别结果的影响，以此提高了文本识别结果的准确性。

Description

***识别方法及***

技术领域

本发明涉及图像处理技术领域，特别是涉及一种***识别方法及***。

背景技术

在图像处理技术领域，对应***识别应用较多，通常对合同扫描件或电子合同中的单枚***进行文字识别，得到***图像对应的文字识别结果。上述文字识别过程包括：消除***背景中的文字、将***转换为矩形图像、进行光学字符识别(Optical CharacterRecognition，OCR)以及对识别出的文本局部纠错。

然而，上述单枚***可能存在图像操作，图像印痕，以及受到成像视角等因素的影响，进而降低了文本识别结果的准确性。

发明内容

本发明实施例的目的在于提供一种***识别方法及***，解决现有的***识别方法中受到图像操作，图像印痕，以及受到成像视角等因素的影响，进而降低了文本识别结果的准确性的技术问题。

为了解决上述技术问题，本发明实施例提供了一种***识别方法，所述方法包括：

对目标文件进行***识别处理，获得所述目标文件包括的至少两个***图像；

根据各所述***图像之间的图像相似度，确定至少一个***分组；每个***分组包括融合***和N个***图像，所述融合***基于所述N个***图像生成，N为大于1的正整数；

对每个***分组进行文本识别处理，得到所述每个***分组对应的目标文本识别结果。

可选地，所述根据各所述***图像之间的图像相似度，确定至少一个***分组包括：

确定所述至少两个***图像中匹配的***对，所述***对包括两个所述***图像；

计算所述***对的图像相似度；

在所述图像相似度小于或等于第一预设阈值的情况下，将所述***对包括的***图像，确定为一个中间分组；

对所述中间分组包括的N个***图像进行***融合处理，得到所述融合***；

根据所述N个***图像以及所述融合***，确定所述***分组。

可选地，所述***对包括第一***图像和第二***图像，所述确定所述至少两个***图像中匹配的***对包括：

以所述第二***图像为基准，对所述至少两个***图像中的第一***图像进行矩阵变换处理，得到所述第一***图像对应的第一角度和第一尺度；

基于所述第一角度、所述第一尺度、所述至少两个***图像中的第二***图像对应的第二角度和第二尺度，确定所述第一***图像与所述第二***图像之间的匹配结果；

在所述匹配结果表征匹配成功的情况下，将所述第一***图像和所述第二***图像确定为匹配的***对。

可选地，所述基于所述第一角度、所述第一尺度、所述至少两个***图像中的第二***图像对应的第二角度和第二尺度，确定所述第一***图像与所述第二***图像之间的匹配结果包括：

在所述第一角度与所述第二角度相同，且所述第一尺度与所述第二尺度相同的情况下，确定匹配成功；

在所述第一角度、所述第一尺度、所述第二角度和所述第二尺度满足预设条件的情况下，确定匹配失败；

其中，所述预设条件包括以下至少一项：

所述第一角度与所述第二角度不同；

所述第一尺度与所述第二尺度不同。

可选地，所述对每个***分组进行文本识别处理，得到所述每个***分组对应的目标文本识别结果包括：

对每个***分组进行文本识别处理，得到所述***分组对应的N+1个第一文本识别结果；

对所述N+1个第一文本识别结果进行文本融合处理，得到所述***分组对应的第二文本识别结果；

将所述第二文本识别结果确定为目标文本识别结果。

可选地，所述将所述第二文本识别结果确定为目标文本识别结果之前，所述方法还包括：

根据所述第二文本识别结果与所述N+1个第一文本识别结果，确定对所述第二文本识别结果的第一可信度评价指标；

在所述第一可信度评价指标满足第二预设阈值，将所述第二文本识别结果确定为所述目标文本识别结果。

可选地，所述根据所述第二文本识别结果与所述N+1个第一文本识别结果，确定对所述第二文本识别结果的第一可信度评价指标包括：

计算所述第二文本识别结果与所述N+1个第一文本识别结果之间的平均编辑距离；

基于所述平均编辑距离和所述第二文本识别结果对应的文本长度，确定所述***分组对应的第一目标数值。

可选地，所述方法还包括：

对目标文件进行文本识别处理，获得所述目标文件对应的至少一个第三文本识别结果；

比较所述至少一个第三文本识别结果和所述目标文本识别结果，得到所述目标文本识别结果对应的第二可信度评价指标；

根据所述第二可信度评价指标，验证所述目标文本识别结果。

可选地，所述比较所述至少一个第三文本识别结果和所述目标文本识别结果，得到所述目标文本识别结果对应的第二可信度评价指标包括：

计算所述目标文本识别结果与所述至少一个第三文本识别结果之间的目标编辑距离；

基于所述目标编辑距离和所述目标文本识别结果对应的文本长度，确定所述***分组对应的第二目标数值；

基于所述第二目标数值与第三预设阈值之间的大小关系，生成所述目标文本识别结果对应的第二可信度评价指标。

可选地，所述验证所述目标文本识别结果之后，所述方法包括：

输出目标信息；

所述目标信息包括以下至少一项：

目标文件包括的至少两个***图像；

目标文件对应的至少一个第三文本识别结果；

目标文本识别结果；

目标文本识别结果对应的第二可信度评价指标。

本发明实施例还提供了一种***识别***，所述***包括：

第一识别模块，用于对目标文件进行***识别处理，获得所述目标文件包括的至少两个***图像；

第一确定模块，用于根据各所述***图像之间的图像相似度，确定至少一个***分组；每个***分组包括融合***和N个***图像，所述融合***基于所述N个***图像生成，N为大于1的正整数；

第二识别模块，用于对每个***分组进行文本识别处理，得到所述每个***分组对应的目标文本识别结果。

可选地，所述第一确定模块，具体用于：

计算所述***对的图像相似度；

根据所述N个***图像以及所述融合***，确定所述***分组。

可选地，所述***对包括第一***图像和第二***图像，所述第一确定模块，还具体用于：

可选地，所述第一确定模块，还具体用于：

其中，所述预设条件包括以下至少一项：

所述第一角度与所述第二角度不同；

所述第一尺度与所述第二尺度不同。

可选地，所述第二识别模块，具体用于：

将所述第二文本识别结果确定为目标文本识别结果。

可选地，所述***还包括：

第二确定模块，用于根据所述第二文本识别结果与所述N+1个第一文本识别结果，确定对所述第二文本识别结果的第一可信度评价指标；

第三确定模块，用于在所述第一可信度评价指标满足第二预设阈值，将所述第二文本识别结果确定为所述目标文本识别结果。

可选地，所述第二确定模块，具体用于：

可选地，所述***还包括：

第三识别模块，用于对目标文件进行文本识别处理，获得所述目标文件对应的至少一个第三文本识别结果；

比较模块，用于比较所述至少一个第三文本识别结果和所述目标文本识别结果，得到所述目标文本识别结果对应的第二可信度评价指标；

验证模块，用于根据所述第二可信度评价指标，验证所述目标文本识别结果。

可选地，所述比较模块，具体用于：

可选地，所述***还包括：

输出模块，用于输出目标信息；

所述目标信息包括以下至少一项：

目标文件包括的至少两个***图像；

目标文件对应的至少一个第三文本识别结果；

目标文本识别结果；

目标文本识别结果对应的第二可信度评价指标。

本发明实施例还提供了一种电子设备，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现如上所述的***识别方法。

本发明实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行如上所述的***识别方法。

本发明实施例还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行如上所述的***识别方法。

本发明实施例中，根据目标文件包括的各个***图像之间的相似度，对目标文件包括的***图像进行分组，确定至少一个***分组；且每个***分组包括融合***和N个***图像，融合***基于N个***图像生成，N为大于 1的正整数；从而基于包含融合***的***分组得到目标文本识别结果。本发明提供的技术方式，从目标文件的多处提取多个***图像，并利用相似度找出相似***，并对相似***进行图像融合，从而利用融合***可以避免单枚***受到背景噪声、印痕深浅、成像视角等因素导致识别精度低的问题，以此提高***分组的***质量和对***进行识别的准确性。进一步地，对每个***分组进行文本识别处理，得到每个***分组对应的目标文本识别结果，上述***识别的过程中，对包含融合***的***分组进行文本市识别，利用属于同一***分组中相似度较高的***图像进行多源融合识别，而不是对单枚***进行文字识别，以此消除了单枚***可能存在图像操作，图像印痕，以及受到成像视角等因素对文本识别结果的影响，以此提高了***识别结果的准确性和可靠性。此外，本申请还对目标文件进行文本识别处理，得到目标文件对应的至少一个第三文本识别结果，通过目标文本识别结果与上述至少一个第三文本识别结果，得到目标文本识别结果对应的第二可信度评价指标，本申请根据第三文本识别结果和基于***图像识别出的目标文本结果进行语义综合分析，得到对应的第二可信度评价指标，以此根据上述第二可信度评价指标，确保生成正确的目标文本识别结果。本发明提出了一种高鲁棒、高精准、可评价的***识别技术，该***识别技术综合了多源***融合和语义分析技术，通过将一份合同等目标文件中多处加盖的同公司***进行融合识别，改善了单枚***识别受到背景噪声、印痕深浅、成像视角等因素造成识别结果准确度低的影响，提升***名称识别的精度；同时，合同内容中也会在多处提到相关签约方的名称，通过关键信息提取，可以与***多源识别结果进行比对和验证，进一步提升***名称识别的精度。最后，该比对结果也可以用于合同稽核中各方名称和盖章的一致性判断，为标准***库构建、***真伪鉴别等后续处理任务提供可靠支撑。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。

图1为本发明实施例中***识别方法的流程示意图；

图2a为本发明实施例中***识别方法的应用场景图之一；

图2b为本发明实施例中***识别方法的应用场景图之二；

图2c为本发明实施例中***识别方法的应用场景图之三；

图3为本发明实施例中***识别方法的应用流程图；

图4为本发明实施例中***识别***的结构示意图；

图5为本发明实施例中一种电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行描述。

本发明实施例提供了一种***识别方法，请参阅图1，图1为本发明实施例中***识别方法的流程示意图。本发明实施例提供的***识别方法包括：

S101，对目标文件进行***识别处理，获得所述目标文件包括的至少两个***图像。

上述目标文件可以是格式为PDF或Word的电子合同或电子文档等文件，也可以是图像文件。

本实施例中，使用已训练的深度学习***检测模型对目标文件进行***识别处理，得到目标文件包括的至少两个***图像。其中，上述已训练的深度学习***检测模型包括但不限于基于Faster R-CNN的***检测模型，基于 SSD的***检测模型，以及基于YOLO的***检测模型等。

S102，根据各所述***图像之间的图像相似度，确定至少一个***分组。

本步骤中，在得到***图像之后，根据各个***图像之间的图像相似度，对目标图像包括的***图像进行分组，得到至少一个***分组。其中，每个***分组包括融合***和N个***图像，N为大于1的正整数。

应理解，上述N个***图像之间的相似度较高，上述融合***是基于N个***图像生成的，具体的如何生成融合***的技术方案，请参阅后续实施例。

S103，对每个***分组进行文本识别处理，得到所述每个***分组对应的目标文本识别结果。

本步骤中，在对目标图像包括的***图像进行分组，得到至少一个***分组后，对每个***分组包括的***图像进行文本识别处理，得到每个***分组对应的目标文本识别结果。

可选地，可以对***分组包括的***图像进行OCR文字识别。例如，将圆形***图像进行极坐标展开成矩形图像，得到矩形***图像，然后，使用 CRNN或者BERT-OCR或者TOCR等文本识别引擎对矩形***图像进行OCR文字识别。

本发明实施例中，根据目标文件包括的各个***图像之间的相似度，对目标文件包括的***图像进行分组，确定至少一个***分组；且每个***分组包括融合***和N个***图像，融合***基于N个***图像生成，N为大于1 的正整数。上述融合***可以避免单枚***受严重噪声影响的情况，以此提高***分组的***质量和对***进行识别的准确性。进一步地，对每个***分组进行文本识别处理，得到每个***分组对应的目标文本识别结果。上述***识别的过程中，对属于同一***分组中相似度较高的***图像进行文本识别，而不是对单枚***进行文字识别，以此消除了单枚***可能存在图像操作，图像印痕，以及受到成像视角等因素对文本识别结果的影响，以此提高了文本识别结果的准确性。

确定所述至少两个***图像中匹配的***对；

计算所述***对的图像相似度；

根据所述N个***图像以及所述融合***，确定所述***分组。

本实施例中，确定目标文件包括的***图像中匹配的***对，其中，***对包括两个相互匹配的***图像，具体如何确定***对的技术方案，请参阅后续实施例。

在得到***对后，计算***对的图像相似度。可选地，可以将两个***图像之间的余弦相似度、哈希相似度、直方图相似度、结构相似度、互信息相似度等相似度信息作为该***对的图像相似度，或者，使用孪生神经网络模型或度量神经网络模型等计算***对中两个***图像之间的图像相似度。

示例性的，设定***对包括***图像S_ij和***图像S'_ij，***对的图像相似度为SIM(S_ij,S'_ij)，在归一化处理后的图像相似度 SIM(S_ij,S'_ij)<T的情况下，表示***图像S_ij对应的***与***图像 S'_ij对应的***为同一***，则将***图像S_ij和***图像S'_ij分类为一个***分组。其中，上述T为第一预设阈值，0<T≤1，可选地，设置T等于0.6。

本实施例中，在对目标文件包括的***图中进行分类，得到至少一个***分组后，对于每个***分组，将该***分组包括的N个***图像进行***融合处理，得到融合***。

可选地，可以基于灰度值对N个***图像进行像素级融合处理，或者基于颜色分量的最大值对N个***图像进行像素级融合处理，或者基于像素值的平均值对N个***图像进行像素级融合处理，或者使用其他方式进行***融合处理，在此不做具体限定。

示例性的，请参阅图2a，如图2a所示，***分组包括5个***图像，对5 个***图像进行红色通道最大比例像素级融合处理，得到图2b所示的融合***。本实施例中，计算***对的图像相似度，将图像相似度较高的***图像分类为一个***分组，进而在后续的处理过程中，对目标图像中的***进行多源识别，而不是对单枚***图像进行文本识别处理，以此消除了单枚***可能存在图像操作，图像印痕，以及受到成像视角等因素对文本识别结果的影响，提高了文本识别结果的准确性。

以下，具体阐述确定目标图像中匹配的***对的技术方案：

可选地，所述确定所述至少两个***图像中匹配的***对包括：

本实施例中，任意选择目标文件中的两个***图像，组成***对，***对包括第一***图像和第二***图像，将其中一个***图像称为第一***图像，将另外一个***图像称为第二***图像。对第一***图像和第二***图像进行图像匹配，上述图像匹配方法包括但不限于SIFT方法、SURF方法、 ORB方法和AKAZE方法，应理解，在上述匹配过程中，使用单应性矩阵对第一***图像进行矩阵变换处理，调整第一***图像的尺度和角度，将矩阵变换处理后的第一***图像的尺度称为第一尺度，将矩阵变换处理后的第一***图像的角度称为第一角度。

在得到第一***图像对应的第一角度和第一尺度后，可以基于第一角度、第一尺度以及第二***图像对应的第二角度和第二尺度，确定第一***图像与第二***图像之间的匹配结果。具体的如何确定匹配结果的技术方案，请参阅后续实施例。

在上述匹配结果表征匹配成功的情况下，将第一***图像和第二***图像确定为匹配的***对。在上述匹配结果表征匹配失败的情况下，可以从目标图像包括的***图像中再次选择一个***图像作为上述第一***图像，重复上述匹配过程，与第二***图像进行图像匹配。

本实施例中，对第一***图像进行矩阵变换处理，得到第一***图像对应的第一尺度和第一角度，基于上述第一尺度、第一角度和第二***图像对应的第二尺度、第二角度，确定相互匹配的***图像，进而提高后续对目标图像进行多源识别的准确性。

在所述第一角度、所述第一尺度、所述第二角度和所述第二尺度满足预设条件的情况下，确定匹配失败。

本实施例中，在第一角度与第二角度相同，且第一尺度与第二尺度相同的情况下，确定第一***图像与第二***图像匹配成功。

在第一角度、第一尺度、第二角度和第二尺度满足预设条件的情况下，确定匹配失败。其中，预设条件包括以下至少一项：第一角度与第二角度不同；第一尺度与第二尺度不同。

也就是说，一种可选地实施方式为，在第一角度与第二角度不同的情况下，确定第一***图像与第二***图像匹配失败。

另一种可选地实施方式为，在第一尺度与第二尺度不同的情况下，确定第一***图像与第二***图像匹配失败。

另一种可选地实施方式为，在第一角度与第二角度不同，且第一尺度与第二尺度不同的情况下，确定第一***图像与第二***图像匹配失败。

为便于理解，请参阅图2a和图2c，如图2a所示，***分组包括5个***图像，按照从左至右的顺序，将第一个***图像对应的角度称为目标角度，对应的尺度称为目标尺度。对图2a示出的第二个至第五个***图像进行矩阵变换处理，使得矩阵变换后的第二个至第五个***图像对应的角度为目标角度，对应的尺度为目标尺度，上述矩阵变换后的第二个至第五个***图像即图2c 中，按照从左至右的顺序，示出的第二个至第五个***图像。

将所述第二文本识别结果确定为目标文本识别结果。

如上所述，每个***分组包括N个***图像以及1个融合***。本实施例中，对***分组中的每个***图像进行文本识别处理，得到该***分组对应的N+1个第一文本识别结果。可选地，可以使用OCR技术对***图像进行文本识别处理。

对上述N+1个第一文本识别结果进行文本融合处理，得到***分组对应的第二文本识别结果，其中，可以使用NLP技术对N+1个第一文本识别结果进行分词和以命名实体识别进行地名、人名、机构名称等识别，然后综合词频得分、命名实体得分对识别结果的不同位置进行语义级文本融合，将得到的文本结果确定为第二文本识别结果，进而直接将第二文本识别结果确定为目标文本识别结果。

另一种可选地实施方式为，在得到第二文本识别结果后，确定第二文本识别结果对应的第一可信度评价指标，具体，例如上述第一可信度评价指标可以基于第二文本识别结果与N+1个第一文本识别结果之间的文本相似度得到，或者，还可以基于第二文本识别结果与N+1个第一文本识别结果的交叉熵或偏差熵等得到。具体的如何确定第二文本识别结果的第一可信度评价指标的实施方式，请参阅后续实施例。

本实施例中，上述第一可信度评价指标可以用一个数值表示，将该数值称为第一目标数值。可选地，在第一目标数值大于或等于第二预设阈值的情况下，表示第二文本识别结果与各个第一文本识别结果之间的误差在合理范围内，将第二文本识别结果确定为目标文本识别结果，以此提高目标文本识别结果的准确性。

可选地，第一可信度评价指标基于第二文本识别结果与所述N+1个第一文本识别结果的相似度得到，具体包括：分别计算第二文本识别结果与N+1个第一文本识别结果的相似度，得到N+1个中间结果，从而根据该N+1个中间结果得到平均相似度，进而根据该平均相似度得到该第一可信度评价指标。

本实施例中，在得到第二文本识别结果之后，计算第二文本识别结果与每个第一文本识别结果之间的编辑距离，得到N+1个编辑距离，将上述N+1个编辑距离的平均值确定为平均编辑距离。进一步的，可以基于下述公式，计算得到第一目标数值。

其中，Eval_S_i表示第一目标数值，

表示平均编辑距离， length(T_i)表示第二文本识别结果对应的文本长度。

应理解，在其他实施例中，还可以通过其他方式计算第二文本识别结果与N+1个第一文本识别结果之间的文本相似度，例如，通过计算第二文本识别结果与N+1个第一文本识别结果之间的特征向量长度，确定可以表征该文本相似度的第一目标数值；或者，利用余弦相似度计算第二文本识别结果与N+1个第一文本识别结果之间的文本相似度；还可以利用Dice相似度计算第二文本识别结果与N+1个第一文本识别结果之间的文本相似度，本发明对于文本相似度计算不作特别限定。

可选地，为进一步验证识别出的目标文件识别结果的精准性，以便为后续处理提供可靠支撑，所述方法还包括：

本实施例中，可以对目标文件进行文本识别处理，得到文本识别集合，上述文本识别集合包括至少一个第三文本识别结果。具体而言，若目标文件为电子合同，则可以使用OCR技术，利用预设的先导词信息提取目标文件中的关键字，进而得到第三文本识别结果，其中，上述先导词信息可以是预先设置的合同甲方信息、合同乙方信息等。

在得到目标文件对应的至少一个第三文本识别结果之后，比较上述至少一个第三文本识别结果和目标文本识别结果，得到目标文本识别结果对应的第二可信度评价指标，其中，该第二可信度评价指标可以表征目标文本识别结果与各第三文本识别结果之间的文本相似度。具体的如何得到第二可信度评价指标的实施方式，请参阅后续实施例。

应理解，上述第二可信度评价指标可以以数值的形式表示，将该数值称为第二目标数值。一种可选地实施方式为，在第二目标数值小于或等于第三预设阈值的情况下，表示***分组对应的N个第二文本识别结果中存在与第三文本识别结果不同的文本识别结果，则确定目标文件包括错误的***图像。可选地，上述第三预设阈值为0.8。

另一种可选地实施方式为，在第二目标数值大于第三预设阈值的情况下，表示***分组对应的N个第二文本识别结果与第三文本识别结果相同，则表征目标文件包括的***图像为正确的***图像。

本实施例中，通过比较至少一个第三文本识别结果和目标文本识别结果，得到目标文本识别结果对应的第二可信度评价指标，并基于第二可信度评价指标表征的第二目标数值与第三预设阈值之间的大小关系，确定***图像的真伪，以此确保生成正确的目标文本识别结果。

本实施例中，在得到第三文本识别结果之后，计算目标文本识别结果与每个第三文本识别结果之间的编辑距离，得到多个编辑距离，将上述多个编辑距离的最小值确定为目标编辑距离。

进一步的，可以基于下述公式，计算得到第二目标数值。

其中，

表示第二目标数值，min_j(Edit_dist(T_i,N_j)表示目标编辑距离，length(T_i)表示目标文本识别结果对应的文本长度。

本实施例中，预先设置有第三预设阈值，可以基于第二目标数值与第三预设阈值之间的大小关系，生成目标文本识别结果对应的第二可信度评价指标。

可选地，在第二目标数值大于第三预设阈值的情况下，生成表征***图像为正确的***图像的第二可信度评价指标。

可选地，在第二目标数值小于或等于第三预设阈值的情况下，生成表征***图像为错误的***图像的第二可信度评价指标。

本发明利用OCR技术，提取目标文件中可能出现的各方名称，并将识别都的各方名称与基于***图像识别结果进行语义综合比对，用该比对结果也作为***识别的可靠性评价维度之一，为***稽核中各方名称和盖章的一致性判断提供参考。

输出目标信息。

本实施例中，在对目标文本识别结果极性验证之后，可以向用户终端输出目标信息，其中，上述目标信息包括以下至少一项：目标文件包括的至少两个***图像；目标文件对应的至少一个第三文本识别结果；目标文本识别结果；目标文本识别结果对应的第二可信度评价指标。

可选地，上述目标信息还包括：所有***区域在目标文件中的页码、***分组、各***图像对应的文本识别结果以及第一可信度评价指标。

为便于理解整体技术方案，本发明提供一种***识别方法，其流程图请参阅图3。

如图3所示，该方法的具体实现如下：

步骤一：输入合同的扫描件或电子文档，格式包括PDF文件，或者多幅 JPG、PNG、TIF等图像文件。如果是PDF文件，将PDF文件解析成多幅图像，每页对应一幅图像。

步骤二：利用已训练的深度学习模型，检测合同扫描件或电子文档上的***区域，即***图像。

步骤三：通过图像匹配方法和计算图像相似度对所有的***图像进行分组和配准，即得到***分组；对于每个***分组，对该分组的***图像进行像素级如下融合，得到融合图像。

具体包括：步骤3.1***图像中任选一幅***图像S_ij，组成一个新的***图像组S_i＝{S_ij}，并将S_ij标记为已进组；步骤3.2：将S_ij与任一未进组且未与S_ij匹配过的***图像S_pq进行图像匹配，利用匹配的单应性矩阵M(S_ij，S_pq) 将S_pq变换到与S_ij相同角度和尺度的***图像S′_pq；如果S_ij和S_pq无法匹配，则选取下一个未进组且未与S_ij匹配过的***图像，重复步骤3.2；步骤3.3：计算匹配后***图像S_ij和S′_pq的相似度SIM(S_ij，S′_pq)，并归一化到[0.0，1.0]范围；步骤3.4：如果相似度SIM(S_ij，S′_pq)＜T，(0.0＜T≤1.0，此处T一般可取0.6)，则S_ij和S_pq来源于同一***的盖章图像，此时将S′_pq视为与S_ij是同一尺度和角度的相同***图像，可以进行像素级融合，将S′_pq并入组S_i，即 S_i＝{S_ij，...，S′_pq}，同时将S_pq标记为已进组***图像。否则，S_ij和S_pq视为来源于不同***，选取下一个未进组且未与S_ij匹配过的***图像，重复步骤3.2；步骤3.5：当S_ij和所有未进组的***图像完成匹配和相似度分析后，完成组S_i的初创建；如果还有未进组的***图像，则重复步骤3.1，直到完成分组操作。步骤3.6：初创建的S_i中***图像进行像素级融合生成一幅融合***图像 S_i，n+1，完成分组。

步骤四：对每个***分组中的***图像进行OCR文本识别，得到第一识别结果，并对第一识别结果进行文本融合，得到每个***分组的名称融合结果，上述名称融合结果相当于每个***分组对应的第二文本识别结果；通过计算***分组对应的第二文本识别结果和每个***图像对应的第一文本识别结果之间的编辑距离，得到该***分组对应的多源***识别可靠性评价和目标文本识别结果，即上述实施例中的第一可信度评价指标；以此，得到目标文件中所有***分组对应的第一可信度评价指标。

上述步骤四具体包括：对这n+1幅***图像进行OCR文字识别，得到第一识别结果(RT_i，1，...，RT_i，n+1)；对于每个文本识别结果，可以利用NLP中的分词技术进行分词和以命名实体识别进行地名、人名、机构名称等识别，综合词频得分、命名实体得分对识别结果的不同位置进行语义级文本融合，得到得分最高的文本串作为该组***的名称识别结果第二文本识别结果T_i；以T_i为参考，与RT_i，1，...，RT_i，n+1比对，得到第一可信度评价指标。

步骤五：在步骤一得到目标文件后，对目标文件进行OCR文本识别，并利用NLP技术通过先导词提取目标文件中的关键字，进而得到签约方名称信息，签约方名称信息即上述实施例中的第三文本识别结果，上述得到签约方名称信息的过程即得到第三文本识别结果的过程。具体包括：若利用关键字得到多个重复的签约方名称信息，利用文本融合方法进行处理，得到文本融合处理后的签约方名称集合Ns＝{N_j}。

步骤六：在得到第三文本识别结果和目标文本识别结果后，利用第三文本识别结果和目标文本识别结果之间的编辑距离，得到标文本识别结果对应的一致性评价，上述一致性评价即上述实施例中的第二可信度评价指标。具体的，利用编辑距离得出***名称识别结果T_i与签约方名称Ns＝{N_j}的第二可信度评价指标。

步骤七：返回结果并结束。返回结果可包括：所有***区域所在页码、坐标位置、对应***分组、该分组的***名称识别结果、该分组的名称识别可靠性评价、对应签约方名称、***名称与签约方名称一致性评价等。

本发明提出了一种高鲁棒、高精准、可评价的***识别技术，该***识别技术综合了多源***融合和语义分析技术，通过将一份合同等目标文件中多处加盖的同公司***进行融合识别，改善了单枚***识别受到背景噪声、印痕深浅、成像视角等因素造成识别结果准确度低的影响，提升***名称识别的精度；同时，合同内容中也会在多处提到相关签约方的名称，通过关键信息提取，可以与***多源识别结果进行比对和验证，进一步提升***名称识别的精度。最后，该比对结果也可以用于合同稽核中各方名称和盖章的一致性判断，为标准***库构建、***真伪鉴别等后续处理任务提供可靠支撑。

如图4所示，本发明实施例还提供了一种***识别***200，所述***识别***200包括：

第一识别模块201，用于对目标文件进行***识别处理，获得所述目标文件包括的至少两个***图像；

第一确定模块202，用于根据各所述***图像之间的图像相似度，确定至少一个***分组；每个***分组包括融合***和N个***图像，所述融合***基于所述N个***图像生成，N为大于1的正整数；

第二识别模块203，用于对每个***分组进行文本识别处理，得到所述每个***分组对应的目标文本识别结果。

可选地，所述第一确定模块202，具体用于：

计算所述***对的图像相似度；

根据所述N个***图像以及所述融合***，确定所述***分组。

可选地，所述***对包括第一***图像和第二***图像，所述第一确定模块202，还具体用于：

可选地，所述第一确定模块202，还具体用于：

其中，所述预设条件包括以下至少一项：

所述第一角度与所述第二角度不同；

所述第一尺度与所述第二尺度不同。

可选地，所述第二识别模块203，具体用于：

将所述第二文本识别结果确定为目标文本识别结果。

可选地，所述***识别***200还包括：

可选地，所述第二确定模块，具体用于：

可选地，所述***识别***200还包括：

比较模块，用于计算所述目标文本识别结果与所述至少一个第三文本识别结果之间的目标编辑距离；

第二确定模块，用于比较所述至少一个第三文本识别结果和所述目标文本识别结果，得到所述目标文本识别结果对应的第二可信度评价指标；

可选地，所述比较模块，具体用于：

可选地，所述***还包括：

输出模块，用于输出目标信息；

所述目标信息包括以下至少一项：

目标文件包括的至少两个***图像；

目标文件对应的至少一个第三文本识别结果；

目标文本识别结果；

目标文本识别结果对应的第二可信度评价指标。

本发明实施例还提供了一种电子设备，如图5所示，包括处理器301、通信接口302、存储器303和通信总线304，其中，处理器301，通信接口302，存储器303通过通信总线304完成相互间的通信。

存储器303，用于存放计算机程序；

处理器301，用于执行存储器303上所存放的程序时，所述计算机程序被所述处理器301执行时，用于对目标文件进行***识别处理，获得所述目标文件包括的至少两个***图像；

根据各所述***图像之间的图像相似度，确定至少一个***分组；

可选地，所述计算机程序被所述处理器301执行时，还用于确定所述至少两个***图像中匹配的***对；

计算所述***对的图像相似度；

对所述中分组包括的N个***图像进行***融合处理，得到所述融合***；

根据所述N个***图像以及所述融合***，确定所述***分组。

可选地，所述计算机程序被所述处理器301执行时，还用于以第二***图像为基准，对所述至少两个***图像中的第一***图像进行矩阵变换处理，得到所述第一***图像对应的第一角度和第一尺度；

可选地，所述计算机程序被所述处理器301执行时，还用于在所述第一角度与所述第二角度相同，且所述第一尺度与所述第二尺度相同的情况下，确定匹配成功；

可选地，所述计算机程序被所述处理器301执行时，还用于对每个***分组进行文本识别处理，得到所述***分组对应的N+1个第一文本识别结果；

将所述第二文本识别结果确定为目标文本识别结果。

可选地，所述计算机程序被所述处理器301执行时，还用于根据所述第二文本识别结果与所述N+1个第一文本识别结果，确定对所述第二文本识别结果的第一可信度评价指标；

可选地，所述计算机程序被所述处理器301执行时，还用于计算所述第二文本识别结果与所述N+1个第一文本识别结果之间的平均编辑距离；

可选地，所述计算机程序被所述处理器301执行时，还用于对目标文件进行文本识别处理，获得所述目标文件对应的至少一个第三文本识别结果；

可选地，所述计算机程序被所述处理器301执行时，还用于计算所述目标文本识别结果与所述至少一个第三文本识别结果之间的目标编辑距离；

可选地，所述计算机程序被所述处理器301执行时，还用于输出目标信息。

上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect，PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture，EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述终端与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory，RAM)，也可以包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。可选的，存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器，包括中央处理器(Central Processing Unit，CPU)、网络处理器(Network Processor，NP)等；还可以是数字信号处理器(Digital SignalProcessing，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field－Programmable Gate Array， FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

在本发明提供的又一实施例中，还提供了一种计算机可读存储介质，该计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述实施例中任一实施例所述的***识别方法。

在本发明提供的又一实施例中，还提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述实施例中任一实施例所述的***识别方法。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时，全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线 (例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于***实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

Claims

1.一种***识别方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述根据各所述***图像之间的图像相似度，确定至少一个***分组包括：

计算所述***对的图像相似度；

根据所述N个***图像以及所述融合***，确定所述***分组。

3.根据权利要求2所述的方法，其特征在于，所述***对包括第一***图像和第二***图像，所述确定所述至少两个***图像中匹配的***对包括：

4.根据权利要求3所述的方法，其特征在于，所述基于所述第一角度、所述第一尺度、所述至少两个***图像中的第二***图像对应的第二角度和第二尺度，确定所述第一***图像与所述第二***图像之间的匹配结果包括：

其中，所述预设条件包括以下至少一项：

所述第一角度与所述第二角度不同；

所述第一尺度与所述第二尺度不同。

5.根据权利要求1所述的方法，其特征在于，所述对每个***分组进行文本识别处理，得到所述每个***分组对应的目标文本识别结果包括：

将所述第二文本识别结果确定为目标文本识别结果。

6.根据权利要求5所述的方法，其特征在于，所述将所述第二文本识别结果确定为目标文本识别结果之前，所述方法还包括：

7.根据权利要求6所述的方法，其特征在于，所述根据所述第二文本识别结果与所述N+1个第一文本识别结果，确定对所述第二文本识别结果的第一可信度评价指标包括：

8.根据权利要求1、或5-7中任一项所述的方法，其特征在于，所述方法还包括：

9.根据权利要求8所述的方法，其特征在于，所述比较所述至少一个第三文本识别结果和所述目标文本识别结果，得到所述目标文本识别结果对应的第二可信度评价指标包括：

10.根据权利要求8所述的方法，其特征在于，所述验证所述目标文本识别结果之后，所述方法包括：

输出目标信息；

所述目标信息包括以下至少一项：

目标文件包括的至少两个***图像；

目标文件对应的至少一个第三文本识别结果；

目标文本识别结果；

目标文本识别结果对应的第二可信度评价指标。

11.一种***识别***，其特征在于，包括：

12.根据权利要求11所述的***，其特征在于，所述第一确定模块，具体用于：

计算所述***对的图像相似度；

根据所述N个***图像以及所述融合***，确定所述***分组。

13.根据权利要求12所述的***，其特征在于，所述***对包括第一***图像和第二***图像，所述第一确定模块，还具体用于：

14.根据权利要求13所述的***，其特征在于，所述第一确定模块，还具体用于：

其中，所述预设条件包括以下至少一项：

所述第一角度与所述第二角度不同；

所述第一尺度与所述第二尺度不同。

15.根据权利要求11所述的***，其特征在于，所述第二识别模块，具体用于：

将所述第二文本识别结果确定为目标文本识别结果。

16.根据权利要求15所述的***，其特征在于，所述***还包括：

17.根据权利要求16所述的***，其特征在于，所述第二确定模块，具体用于：

18.根据权利要求11、或15-17中任一项所述的***，其特征在于，所述***还包括：

19.根据权利要求18所述的***，其特征在于，所述比较模块，具体用于：

20.根据权利要求18所述的***，其特征在于，所述***还包括：

输出模块，用于输出目标信息；

所述目标信息包括以下至少一项：

目标文件包括的至少两个***图像；

目标文件对应的至少一个第三文本识别结果；

目标文本识别结果；

目标文本识别结果对应的第二可信度评价指标。

21.一种电子设备，其特征在于，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

存储器，用于存放计算机程序；

处理器，用于执行存储器上所存放的程序时，实现权利要求1-10中任一项所述的***识别方法。

22.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时，实现如权利要求1-10中任一项所述的***识别方法。