CN112861844A

CN112861844A - 业务数据的处理方法、装置和服务器

Info

Publication number: CN112861844A
Application number: CN202110341368.4A
Authority: CN
Inventors: 刘华杰; 王雅欣; 冯歆然; 罗杰文
Original assignee: Industrial and Commercial Bank of China Ltd ICBC
Current assignee: Industrial and Commercial Bank of China Ltd ICBC
Priority date: 2021-03-30
Filing date: 2021-03-30
Publication date: 2021-05-28

Abstract

本说明书提供了业务数据的处理方法、装置和服务器。基于该方法，可以使用已有的预设的OCR识别模型来处理包含有目标业务数据的目标图像，并从中提取出目标文本字段；再根据与目标业务数据匹配的目标文本字段库，确定目标文本字段是否属于待校正的专有文本字段；在确定属于待校正的专有文本字段的情况下，获取同时包含有音阶码和字形码的音形码数据；进一步，可以根据目标文本字段的音形码数据，以及目标文本字段与预设的专有文本字段的编辑距离，从目标文本字段库所包含的预设的专有文本字段中筛选出参考文本字段；并利用参考文本字段对当前得到的目标文本字段进行针对性的校正处理，从而可以得到较为准确的校正后的目标文本字段。

Description

业务数据的处理方法、装置和服务器

技术领域

本说明书属于人工智能技术领域，尤其涉及业务数据的处理方法、装置和服务器。

背景技术

在一些业务数据处理场景中，可能直接采集得到的是包含有业务数据的图像数据，这时需要先从上述图像数据中识别提取出相关的文本字段，以便后续可以利用所提取出文本数据形式的文本字段进行具体的业务数据处理。

基于现有的业务数据的处理方法，如果需要从包含有某种业务数据的图像数据中识别提取出相关的文本字段，往往需要先采集大量包含有该主题类型的业务数据的图像数据作为样本数据；再利用上述样本数据进行大量的模型训练，才能得到针对该主题类型的OCR(Optical Character Recognition，光学字符识别)识别模型；进而可以使用上述OCR识别模型识别处理图像数据，以提取出相关的文本字段。

可见，基于现有的业务数据的处理方法需要先耗费大量的资源、时间和成本来专门训练针对待处理的业务数据的主题类型的OCR识别模型，这样势必会增加业务数据的处理成本，也降低了业务数据的处理效率。

针对上述问题，目前尚未提出有效的解决方案。

发明内容

本说明书提供了一种业务数据的处理方法、装置和服务器，能够直接基于已有的预设的OCR识别模型，高效、精准地从目标图像中识别并提取出目标业务数据中的专有文本字段，有效地降低业务数据的处理成本，提高业务数据的处理效率。

本说明书提供了一种业务数据的处理方法，包括：

获取目标图像；其中，所述目标图像包含有目标业务数据；

通过调用预设的OCR识别模型处理所述目标图像，得到相应的OCR识别结果；并根据所述OCR识别结果，提取出目标文本字段；

根据目标文本字段库，确定所述目标文本字段是否属于待校正的专有文本字段；其中，所述目标文本字段库与目标业务数据的主题类型匹配；所述目标文本字段库存储有多个预设的专有文本字段；

在确定所述目标文本字段属于待校正的专有文本字段的情况下，获取目标文本字段的音形码数据；其中，所述音形码数据包括基于字符的发音特征得到的音阶码，和基于字符的字形特征得到的字形码；

根据所述目标文本字段的音形码数据，以及目标文本字段与预设的专有文本字段的编辑距离，确定出目标文本字段与预设的专有文本字段的相似度参数；

根据所述相似度参数，从目标文本字段库中筛选出符合要求的预设的专有文本字段，作为参考文本字段；并根据所述参考文本字段，校正所述目标文本字段。

在一个实施例中，所述目标业务数据包括以下至少之一：财务报表、转账凭证、交易订单。

在一个实施例中，通过调用预设的OCR识别模型处理所述目标图像，得到相应的OCR识别结果，包括：

确定目标业务数据的主题类型；

根据目标业务数据的主题类型，从多个预设的结构模板中，筛选出与主题类型对应的目标结构模板；

根据所述目标结构模板，对所述目标图像进行切片处理，得到多个图像切片；

调用预设的OCR识别模型处理所述多个图像切片，以得到相应的OCR识别结果。

在一个实施例中，根据目标文本字段库，确定所述目标文本字段是否属于待校正的专有文本字段，包括：

从多个预设的文本字段库中确定出与目标业务数据的主题类型匹配的目标文本字段库；

统计目标文本字段所包含的字符数；

从所述目标文本字段库中筛选出字符数相同的预设的专有文本字段作为对照文本字段；

统计所述对照文本字段与目标文本字段之间相同字符的占比；

检测是否存在至少一个对照文本字段与目标文本字段之间的相同字符的占比大于预设的占比阈值；

在确定存在至少一个对照文本字段与目标文本字段之间的相同字符的占比大于预设的占比阈值的情况下，获取目标文本字段的置信度参数；

根据所述目标文本字段的置信度参数，确定所述目标文本字段是否属于待校正的专有文本字段。

在一个实施例中，获取目标文本字段的置信度参数，包括：

在调用预设的OCR识别模型处理所述多个图像切片，以得到相应的OCR识别结果的同时，获取所述预设的OCR识别模型输出的针对所述OCR识别结果的预测分数值；

根据所述预测分数值，确定所述目标文本字段的置信度参数。

在一个实施例中，获取目标文本字段的音形码数据，包括：

确定出目标文本字段中字符的韵母、声母和声调；

根据所述目标文本字段中字符的韵母、声母和声调，以及预设的编码规则，构造对应的音阶码；

确定出目标文本字段中字符的结构、四角编码和笔画数；

根据所述目标文本字段中字符的结构、四角编码和笔画数，以及预设的编码规则，构造对应的字形码；

拼接所述音阶码和所述字形码，得到目标文本字段的音形码数据。

在一个实施例中，根据所述目标文本字段的音形码数据，以及目标文本字段与预设的专有文本字段的编辑距离，确定出目标文本字段与预设的专有文本字段的相似度参数，包括：

根据所述目标文本字段的音形码数据，计算目标文本字段与预设的专有文本字段的音阶码相似度参数、字形码相似度参数；

根据预设的权重参数，对所述目标文本字段与预设的专有文本字段的编辑距离、音阶码相似度参数、字形码相似度参数进行加权求和，以得到目标文本字段与预设的专有文本字段的相似度参数。

在一个实施例中，按照以下算式计算目标文本字段与预设的专有文本字段的相似度参数：

其中，E为目标文本字段与预设的专有文本字段的相似度参数，edit_distance为目标文本字段与预设的专有文本字段的编辑距离，P为目标文本字段与预设的专有文本字段的音阶码相似度参数，S为目标文本字段与预设的专有文本字段的字形码相似度参数，s₁为目标文本字段的字符长度，s₂为预设的专有文本字段的字符长度，w₁为与编辑距离对应的第一权重参数，w₂为与音阶码相似度参数对应的第二权重参数，w₃为与字形码相似度参数对应的第三权重参数。

在一个实施例中，根据所述参考文本字段，校正所述目标文本字段，包括：

比较所述参考文本字段中的字符和目标文本字段中的字符，确定出存在字符差异的字符位置；

利用参考文本字段中存在字符差异的字符位置处的字符替换目标文本字段中相同字符位置处的字符，得到校正后的目标文本字段。

在一个实施例中，在获取目标图像之前，所述方法还包括：

获取多个历史业务数据；其中，所述历史业务数据与目标业务数据的主题类型相同；

从多个历史业务数据中提取出多个文本字段；

从所述多个文本字段中过滤掉表征数据值的文本字段，得到多个预设的专有文本字段，以构建与目标业务数据的主题类型匹配的预设的文本字段库。

本说明书还提供了一种业务数据的处理装置，包括：

第一获取模块，用于获取目标图像；其中，所述目标图像包含有目标业务数据；

第一处理模块，用于通过调用预设的OCR识别模型处理所述目标图像，得到相应的OCR识别结果；并根据所述OCR识别结果，提取出目标文本字段；

第一确定模块，用于根据目标文本字段库，确定所述目标文本字段是否属于待校正的专有文本字段；其中，所述目标文本字段库与目标业务数据的主题类型匹配；所述目标文本字段库存储有多个预设的专有文本字段；

第二获取模块，用于在确定所述目标文本字段属于待校正的专有文本字段的情况下，获取目标文本字段的音形码数据；其中，所述音形码数据包括基于字符的发音特征得到的音阶码，和基于字符的字形特征得到的字形码；

第二确定模块，用于根据所述目标文本字段的音形码数据，以及目标文本字段与预设的专有文本字段的编辑距离，确定出目标文本字段与预设的专有文本字段的相似度参数；

第二处理模块，用于根据所述相似度参数，从目标文本字段库中筛选出符合要求的预设的专有文本字段，作为参考文本字段；并根据所述参考文本字段，校正所述目标文本字段。

本说明书还提供了一种服务器，包括处理器以及用于存储处理器可执行指令的存储器，所述处理器执行所述指令时实现所述业务数据的处理方法的相关步骤。

本说明书还提供了一种计算机可读存储介质，其上存储有计算机指令，所述指令被执行时实现所述业务数据的处理方法的相关步骤。

本说明书还提供了一种业务数据的处理方法，包括：

获取目标图像；其中，所述目标图像包含有目标业务数据；

根据所述目标文本字段的音形码数据，确定出目标文本字段与预设的专有文本字段的相似度参数；

本说明书提供的一种业务数据的处理方法、装置和服务器，基于该方法，服务器可以直接使用已有的预设的OCR识别模型来处理包含有目标业务数据的目标图像，并从上述预设的OCR识别模型处理得到的OCR识别结果中初步提取出目标文本字段；再根据与目标业务数据的主题类型匹配的目标文本字段库，确定上述目标文本字段是否属于待校正的专有文本字段；在确定属于待校正的专有文本字段的情况下，服务器可以获取同时包含有基于字符的发音特征得到的音阶码和基于字符的字形特征得到的字形码的音形码数据；进一步，可以同时根据目标文本字段的音形码数据，以及目标文本字段与目标文本字段库中的预设的专有文本字段的编辑距离，较为精准地从目标文本字段库所包含的预设的专有文本字段中筛选出符合要求的相匹配的参考文本字段；并利用上述参考文本字段对当前所得到的目标文本字段进行针对性的校正处理，得到较为准确的校正后的目标文本字段。这样服务器不需要耗费大量的资源、时间和成本来专门训练针对目标业务数据的主题类型的OCR识别模型，就能够较为高效、精准地从目标图像中识别并提取出目标业务数据中的专有文本字段，从而可以有效地降低业务数据的处理成本，提高业务数据的处理效率。

附图说明

为了更清楚地说明本说明书实施例，下面将对实施例中所需要使用的附图作简单地介绍，下面描述中的附图仅仅是本说明书中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是应用本说明书实施例提供的业务数据的处理方法的***的结构组成的一个实施例的示意图；

图2是本说明书的一个实施例提供的业务数据的处理方法的流程示意图；

图3是在一个场景示例中，应用本说明书实施例提供的业务数据的处理方法的一种实施例的示意图；

图4是本说明书的一个实施例提供的业务数据的处理方法的流程示意图；

图5是本说明书的一个实施例提供的服务器的结构组成示意图；

图6是本说明书的一个实施例提供的业务数据的处理装置的结构组成示意图；

图7是在一个场景示例中，应用本说明书实施例提供的业务数据的处理方法的一种实施例的示意图；

图8是在一个场景示例中，应用本说明书实施例提供的业务数据的处理方法的一种实施例的示意图；

图9是在一个场景示例中，应用本说明书实施例提供的业务数据的处理方法的一种实施例的示意图。

具体实施方式

为了使本技术领域的人员更好地理解本说明书中的技术方案，下面将结合本说明书实施例中的附图，对本说明书实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本说明书一部分实施例，而不是全部的实施例。基于本说明书中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都应当属于本说明书保护的范围。

考虑到通常如果直接使用通用的OCR识别模型，或者针对其他主题类型的业务数据所训练的OCR识别模型，来处理包含有目标业务数据的目标图像数据时，所得到的OCR识别结果的误差往往相对较大，进而使得基于上述OCR识别结果所提取出文本字段也会存在较大误差，不够精准。

因此，基于现有的业务数据的处理方法，往往需要先针对目标业务数据的主题类型另外专门训练一个OCR识别模型，然后再利用该OCR识别模型来处理目标图像数据，以得到准确度符合要求的文本字段。但是，基于上述方法，势必又需要耗费大量的资源、时间和成本来专门训练OCR识别模型，进而增加了业务数据的处理成本，也降低了业务数据的处理效率。

针对产生上述问题的根本原因，本说明书考虑可以先直接使用已有的预设的OCR识别模型来处理包含有目标业务数据的目标图像，以提取出可能存在误差的目标文本字段；接着，可以根据与目标业务数据的主题类型匹配的目标文本字段库，确定出该目标文本字段是否属于待校正的专有文本字段；在确定该目标文本字段属于待校正的专有文本字段的情况下，可以获取同时包含有基于发音特征得到的音阶码和基于字形特征得到的字形码的音形码数据；进一步，可以同时根据目标文本字段的音形码数据，以及目标文本字段与预设的专有文本字段的编辑距离，较为精准地从目标文本字段库所包含的预设的专有文本字段中筛选出符合要求匹配度较高的参考文本字段；再利用上述参考文本字段，对目标文本字段进行校正，以消除误差，得到准确度较高的校正后的目标文本字段。

通过上述方式，不需要耗费大量的资源、时间和成本来专门训练针对目标业务数据所属的主题类型的OCR识别模型，就能够较为高效、精准地从目标图像中识别并提取出目标业务数据中的专有文本字段，从而可以降低业务数据的处理成本，提高业务数据的处理效率。

本说明书实施例提供一种业务数据的处理方法，所述业务数据的处理方法具体可以应用于包含有服务器和终端设备的***中。具体可以参阅图1所示。服务器和终端设备可以通过有线或无线的方式相连，以便进行具体的数据交互。

具体实施时，终端设备可以采集包含有目标业务数据的目标图像；再将所采集到的目标图像发送至服务器。

例如，用户可以通过设置于智能手机(一种终端设备)的摄像头拍摄财务报表(一种目标业务数据)，得到对应的目标图像；再通过手机网络，将目标图像发送给服务器。

相应的，服务器接收终端设备发送的目标图像，获取目标图像。下面服务器需要对上述目标图像进行相应的数据处理，以从目标图像中准确地识别并提取出目标业务数据中的专有文本字段。

首先，服务器可以通过调用预设的OCR识别模型处理所述目标图像，得到相应的OCR识别结果；并根据所述OCR识别结果，提取出目标文本字段。其中，上述预设的OCR识别模型可以是一种通用的OCR识别模型，也可以之前针对其他主题类型的业务数据训练得到的OCR识别模型。

这时服务器所提取出的目标文本字段是可能存在误差、不够准确的文本字段，需要进行进一步的校正处理。

接着，服务器可以确定出与目标业务数据的主题类型匹配的预设的文本字段库，作为目标文本字段库；并根据目标文本字段库，确定所述目标文本字段是否属于待校正的专有文本字段；其中，所述目标文本字段库存储有多个预设的专有文本字段。

在确定所述目标文本字段属于待校正的专有文本字段的情况下，服务器可以获取目标文本字段的音形码数据；其中，所述音形码数据包括基于字符的发音特征得到的音阶码，和基于字符的字形特征得到的字形码。

然后，服务器可以综合利用目标文本字段的音形码数据，以及目标文本字段与预设的专有文本字段的编辑距离，确定出关于目标文本字段与预设的专有文本字段之间效果较好、参考价值较高的相似度参数。

进而，服务器可以根据上述相似度参数，从目标文本字段库所包含的多个预设的专有文本字段中准确地筛选出符合要求的预设的专有文本字段，作为参考文本字段；并根据上述参考文本字段，有针对性地对目标文本字段进行校正，以消除之前使用预设的OCR识别模型提取目标文本字段时存在的误差，得到误差较小、准确度较高的校正后的目标文本字段。

进一步，服务器可以根据上述校正后的目标文本字段，进行后续的业务数据处理。例如，进行财务数据统计和记录等。

这样服务器不需要专门训练针对目标业务数据所属的主题类型的OCR识别模型，就能够较为高效、精准地从目标图像中识别并提取出目标业务数据中的专有文本字段。

在本实施例中，所述服务器具体可以包括一种应用于业务数据处理平台一侧，能够实现数据传输、数据处理等功能的后台服务器。具体的，所述服务器例如可以为一个具有数据运算、存储功能以及网络交互功能的电子设备。或者，所述服务器也可以为运行于该电子设备中，为数据处理、存储和网络交互提供支持的软件程序。在本实施例中，并不具体限定所述服务器的数量。所述服务器具体可以为一个服务器，也可以为几个服务器，或者，由若干服务器形成的服务器集群。

在本实施例中，所述终端设备具体可以包括一种应用于用户(例如，业务员等)一侧，能够实现数据采集、数据传输等功能的前端电子设备。具体的，所述终端设备例如可以为台式电脑、平板电脑、笔记本电脑、智能手机等。或者，所述终端设备也可以为能够运行于上述电子设备中的软件应用。例如，可以是在智能手机上运行的某APP等。

参阅图2所示，本说明书实施例提供了一种业务数据的处理方法，其中，该方法具体应用于服务器一侧。具体实施时，该方法可以包括以下内容。

S201：获取目标图像；其中，所述目标图像包含有目标业务数据；

S202：通过调用预设的OCR识别模型处理所述目标图像，得到相应的OCR识别结果；并根据所述OCR识别结果，提取出目标文本字段；

S203：根据目标文本字段库，确定所述目标文本字段是否属于待校正的专有文本字段；其中，所述目标文本字段库与目标业务数据的主题类型匹配；所述目标文本字段库存储有多个预设的专有文本字段；

S204：在确定所述目标文本字段属于待校正的专有文本字段的情况下，获取目标文本字段的音形码数据；其中，所述音形码数据包括基于字符的发音特征得到的音阶码，和基于字符的字形特征得到的字形码；

S205：根据所述目标文本字段的音形码数据，以及目标文本字段与预设的专有文本字段的编辑距离，确定出目标文本字段与预设的专有文本字段的相似度参数；

S206：根据所述相似度参数，从目标文本字段库中筛选出符合要求的预设的专有文本字段，作为参考文本字段；并根据所述参考文本字段，校正所述目标文本字段。

在本实施例中，上述预设的OCR识别模型具体可以理解为一种已有的OCR识别模型。具体的，可以是一种通用的OCR识别模型(例如，基础OCR识别模型)，也可以是之前针对其他主题类型的业务数据训练得到OCR识别模型。

通过上述实施例，服务器不需要另外耗费大量的资源、时间和成本来专门训练针对目标业务数据所属的主题类型的OCR识别模型，可以利用已有的预设的OCR识别模型就能较为高效、精准地从目标图像中识别并提取出所需要的目标业务数据中的专有文本字段，从而可以有效地降低业务数据的处理成本，提高业务数据的处理效率。

在一些实施例中，上述目标图像具体可以理解为一种包含有目标业务数据的图像数据。具体的，可以是通过相机拍摄目标业务数据所得到的照片，也可以是从视频中截取出的包含有目标业务数据的截图等等。

在一些实施例中，上述目标业务数据具体可以理解为待处理的业务数据。具体实施时，针对不同的应用场景，上述目标业务数据可以包括多种不同主题类型的业务数据。

在一些实施例中，以银行的业务数据处理场景为例，上述目标业务数据具体可以包括以下至少之一：财务报表、转账凭证、交易订单等等。当然，需要说明的是，上述所列举的业务数据的主题类型只是一种示意性说明。具体实施时，根据具体的应用场景和处理需求，还可以包含有其他主题类型的业务数据。

通过上述实施例，可以将本说明书所提供的业务数据的处理方法进一步拓展应用到更多应用场景中的更多主题类型的业务数据中，从而可以有效地扩展上述业务数据的处理方法的适用范围。

在一些实施例中，目标业务数据中可以包含专有文本字段，以及数据值字段。其中，上述文本字段具体可以理解为目标业务数据中的表征key值的字段。相应的，上述数据值字段具体可以理解为目标业务数据中的表征value值的字段。

具体的，例如，在财务报表中，字段“未分配利润”可以理解为是一种专有文本字段；在同一行，且位于字段“未分配利润”之后的字段“12.23万元”可以理解为一种数据值字段。

在本实施例中，期望通过本说明书所提供的业务数据的处理方法处理目标图像，以从目标图像中精准地识别并提取出目标业务数据中的专有文本字段。

在一些实施例中，在得到上述目标图像后，可以直接调用预设的OCR识别模型通过处理目标图像，得到可能会存在误差、准确度不高的OCR识别结果。其中，上述预设的OCR识别模型具体可以理解为一种已有的，不需要另外进行专门的针对性训练的OCR识别模型。具体的，上述预设的OCR识别模型可以是通用的OCR识别模型，以可以是之前针对其他主题类型的业务数据训练得到的OCR识别模型。

在一些实施例中，上述通过调用预设的OCR识别模型处理所述目标图像，得到相应的OCR识别结果，具体实施时，可以包括以下内容：确定目标业务数据的主题类型；根据目标业务数据的主题类型，从多个预设的结构模板中，筛选出与主题类型对应的目标结构模板；根据所述目标结构模板，对所述目标图像进行切片处理，得到多个图像切片；调用预设的OCR识别模型处理所述多个图像切片，以得到相应的OCR识别结果。

通过上述实施例，可以先找到并利用与目标业务的主题类型对应的目标结构模板对目标图像进行分割切片，得到多个包含有文本字段的图像切片；再利用预设的OCR识别模型分别对各个图像切片进行OCR识别，从而可以更加精准地识别出图像切片中的文本字段，得到准确度更高、效果更好的OCR识别结果。

在一些实施例中，具体实施前，还可以预先针对不同的主题类型的业务数据的板式结构进行学习，以构建得到多个预设的结构模板。其中，一个预设的结构模板对应一种主题类型。

在一些实施例中，可以从上述OCR识别结果提取出具体的文本字段，作为目标文本字段。需要说明的是，由于上述目标文本字段是通过直接调用预设的OCR识别模型处理得到的，可能会存在误差，或者并不是所需要获取的专有文本字段，还需要进行进一步的判断和处理。

在一些实施例中，上述根据所述OCR识别结果，提取出目标文本字段，具体实施时，可以包括：通过对所述OCR识别结果进行分词处理，得到相应的多个目标文本字段。

在一些实施例中，可以先判断上述目标文本字段是否可能为所需要的专有文本字段；在确定目标文本字段可能为所需要的专有文本字段的情况下，进一步可以判断目标文本字段是否属于存在误差、需要进行校正的文本字段，即判断目标文本字段是否属于待校正的专有文本字段；在确定目标文本字段属于上述待校正的专有文本字段的情况下，再对上述目标文本字段进行有针对性的校正处理，以最终得到消除了误差、准确度较高的专有文本字段。

在一些实施例中，上述根据目标文本字段库，确定所述目标文本字段是否属于待校正的专有文本字段，具体实施时，可以包括以下内容。

S1：从多个预设的文本字段库中确定出与目标业务数据的主题类型匹配的目标文本字段库；

S2：统计目标文本字段所包含的字符数；

S3：从所述目标文本字段库中筛选出字符数相同的预设的专有文本字段作为对照文本字段；

S4：统计所述对照文本字段与目标文本字段之间相同字符的占比；

S5：检测是否存在至少一个对照文本字段与目标文本字段之间的相同字符的占比大于预设的占比阈值；

S6：在确定存在至少一个对照文本字段与目标文本字段之间的相同字符的占比大于预设的占比阈值的情况下，获取目标文本字段的置信度参数；

S7：根据所述目标文本字段的置信度参数，确定所述目标文本字段是否属于待校正的专有文本字段。

通过上述实施例，可以较为准确地从基于OCR识别结果得到的多个目标文本字段中，筛选出一方面大概率属于所需要获取的专有文本字段；另一方面还存在一定误差，需要进行进一步校正的待校正的专有文本字段。进而后续可以只针对上述待校正的专有文本字段进行进一步的校正处理，而不是不作区分地对所有目标文本字段统一进行校正处理，从而可以减少后续校正处理时的数据处理量，提高整体的数据处理效率。

在一些实施例中，上述预设的文本字段库分别与一种主题类型对应，具体存储有所对应的主题类型的业务数据中出现的专有文本字段(可以记为预设的专有文本字段)。其中，上述预设的文本字段库具体可以是预先根据所对应的主题类型的历史业务数据汇总整理得到的。关于预设的文本字段库的获取方式，后续将另作说明。

在一些实施例中，具体实施时，可以先确定出目标图像中目标业务数据的主题类型；再根据目标业务数据的主题类型，从多个预设的文本字段库中确定出与目标业务数据的主题类型匹配的预设的文本字段库，作为所述目标文本字段库。

接着，服务器可以统计目标文本字段所包含的字符数。例如，以目标文本字段：“未分配利剂”为例。服务器可以统计该目标文本字段所包含的字符数为5。

进一步，服务器可以从目标文本字段库中先筛选出字符数相同的预设的专有文本字段作为对照文本字段。这样后续只需要对上述对照文本字段进行比较处理，来确定目标文本字段是否属于待校正的专有文本字段，而不需要对目标文本字段库中所包含的所有的预设的专有文本字段都进行比较处理。从而可以降低确定目标文本字段是否属于待校正的专有文本字段过程中的数据处理量，提高整体的数据处理效率。

例如，服务器可以从目标文本字段库中筛选出字符数为5的预设的专有文本字段作为与目标文本字段“未分配利剂”相关的对照文本字段。

在具体实施时，考虑到由于目标文本字段是直接调用预设的OCR识别模型得到的，因此，所得到的目标文本字段所包含的字符数有时也可能存在误差。例如，将原本包含有4个字符的字段识别成了包含有5个字符的字段。因此，在筛选对照文本字段时，服务器可以同时筛选出字符数等于目标文本字段的字符数、字符数等于目标文本字段的字符数减去阈值字符数，以及字符数等于目标文本字段的字符数加上阈值字符数的预设的专有文本字段，作为与目标文本字段相关的对照文本字段。这样可以避免遗漏掉与目标文本字段真正匹配对应的专有文本字段，提高后续校正的准确度。上述阈值字符数具体可以设置为1等较小的数值。

在一些实施例中，服务器可以将目标文本字段与上述所筛选出多个对照文本字段进行比较处理。具体的，服务器可以先统计目标文本字段与各个对照文本字段之间相同的字符占比。再通过检测是否至少存在一个对照文本字段与目标文本字段之间的相同字符的占比大于预设的占比阈值来判断目标文本字段是否可能为所需要获取的专有文本字段。

具体的，例如，服务器可以统计出目标文本字段“未分配利剂”与一个对照文本字段“未分配利润”之间相同字符(包括字符“未”、“分”、“配”、“利”)的占比为4/5＝0.8。类似的，统计出目标文本字段“未分配利剂”与另一个对照文本字段“待分配资产”之间相同字符(包括字符“分”、“配”)的占比为2/5＝0.4。按照上述方式可以统计出各个对照文本字段与目标文本字段之间的相同字符的占比。再从中找出数值最大的占比(例如，0.8)，与预设的占比阈值(例如，0.7)进行比较。

如果发现上述数值最大的占比大于上述预设的占比阈值，即确定存在至少一个对照文本字段与目标文本字段之间的相同字符的占比大于预设的占比阈值。则可以判断该目标文本字段有相对较大的概率可能为所需要获取的专有文本字段，进而可以针对该目标文本字段进行进一步的判断处理。

相反，如果发现上述数值最大的占比小于或等于预设的占比阈值，即确定不存在任何一个对照文本字段与目标文本字段之间的相同字符的占比大于预设的占比阈值。则可以判断该目标文本字段有相对较大的概率可能不是所需要获取的专有文本字段，进而可以停止针对该目标文本字段进行进一步的判断处理。

在一些实施例中，在确定目标文本字段具有较大概率属于所需要获取的专有文本字段的情况下，可以通过获取并根据目标文本字段的置信度参数，来进一步判断目标文本字段的误差情况，以判断是否需要对该目标文本字段进行进一步校正。其中，上述置信度参数具体可以理解为一种用于表征目标文本字段的可信度的参数数据。

如果根据置信度参数，判断该目标文本字段误差较大、可信度较低(例如，置信度参数小于预设的参数阈值)，则可以确定目标文本字段属于待校正的专有文本字段，进而可以针对该目标文本字段进行后续的校正处理。

相反，如果根据置信度参数，判断该目标文本字段误差较小、可信度较高(例如，置信度参数大于或等于预设的参数阈值)，则可以确定目标文本字段不属于待校正的专有文本字段，即该目标文本字段是准确的，不需要再作后续的校正处理。

在一些实施例中，上述获取目标文本字段的置信度参数，具体实施时，可以包括：在调用预设的OCR识别模型处理所述多个图像切片，以得到相应的OCR识别结果的同时，获取所述预设的OCR识别模型输出的针对所述OCR识别结果的预测分数值；根据所述预测分数值，确定所述目标文本字段的置信度参数。

在本实施例中，考虑到常规的OCR识别模型在对图像进行识别处理时，模型内部往往会同时计算出针对OCR识别结果的预测分数值，以辅助模型最终输出OCR识别结果。

因此，服务器可以在在调用预设的OCR识别模型处理所述多个图像切片，以得到相应的OCR识别结果同时，通过预设的OCR识别模型的相关接口导出模型在得到上述OCR识别结果时生成并使用的预测分数值，作为用于判断基于该OCR识别结果得到的目标文本字段的可信度的置信度参数。

通过上述实施例，服务器可以不用耗费额外的处理资源和处理时间，就可以得到用于判断目标文本字段的可信度的置信度参数。

在一些实施例中，在确定出目标文本字段属于待校正的专有文本字段的情况下，可以获取目标文本字段的音形码数据；再根据目标文本字段的音形码数据，结合编辑距离，较为精准地从目标文本字段库中找到真正与目标文本字段对应匹配的预设的专有文本字段作为参考文本字段；进而可以利用上述参考文本字段，对目标文本字段进行有针对性的校正处理，以最终提取得到消除了误差，准确度较高的专有文本字段。

在一些实施例中，上述音形码数据具体可以理解为一种能够同时表征出字符的发音特征和字形特征的编码数据。其中，上述音形码数据体可以包括基于目标文本字段中字符的发音特征得到的音阶码，以及基于目标文本字段中同一个字符的字形特征的字形码两部分。

需要说明的是，相对于编辑距离，针对诸如汉字等同时具备表音结构和表义结构的象形文字，使用音形码数据能够更加全面、准确地描述出字符的特征，进而可以利用上述隐形码数据可以更加精准地找到匹配度较高、语义较接近的字符，具有更好的使用效果。而编辑距离则是针对诸如英文等只具备表音结构的拉丁文字设计的，无法描述出字符的字形特征，因此，单独使用编辑距离寻找匹配度较高、语义较接近的字符，容易出现误差。

在一些实施例中，上述获取目标文本字段的音形码数据，具体实施时，可以包括以下内容：确定出目标文本字段中字符的韵母、声母和声调；根据所述目标文本字段中字符的韵母、声母和声调，以及预设的编码规则，构造对应的音阶码；确定出目标文本字段中字符的结构、四角编码和笔画数；根据所述目标文本字段中字符的结构、四角编码和笔画数，以及预设的编码规则，构造对应的字形码；拼接所述音阶码和所述字形码，得到目标文本字段的音形码数据。

通过上述实施例，可以较为准确地获取得到能够同时描述出目标文本字段所包含的字符的发音特征和字形特征的音形码数据。这样后续可以基于上述音形码数据，更加精准地找出匹配度较高、语义较接近的符合要求的参考文本字段，用于后续的校正处理。

具体的，例如，以获取目标文本字段中的一个字符“琅”的音形码数据为例，可以参阅图3所示。

可以确定出该字符的韵母为“ANG”，声母为“L”，声调为第二声。再根据预设的编码规则，可以将与韵母对应的第一数据位的编码值(可以记为p₁)设置与韵母对应的“F”；将与声母对应的第二数据位的编码值(可以记为p₂)设置为与声母对应的“7”；将第三数据位的编码值(可以记为p₃)设置为空，记为0；将与声调对应的第四数据位的编码值(可以记为p₄)设置为与声调对应的“2”。从而可以得到能够描述出该字符的发音特征的音阶码：“F702”，对应图3的音形码中的前4个数据位编码值。

类似的，可以进一步确定出该字符的结构(例如，左右结构、上下结构、包围结构等)、四角编码和笔画数。再根据预设的编码规则，可以将与字符的结构对应的第五数据位的编码值(可以记为p₅)设置为对应的“1”；将与字符的四角编码对应的相连的第六数据位的编码值(可以记为p₆)、第七数据位的编码值(可以记为p₇)、第八数据位的编码值(可以记为p₈)、第九数据位的编码值(可以记为p₉)依次设置为对应的“1”、“3”、“1”、“3”；将与笔画数对应的第十数据位的编码值(可以记为p₁₀)设置为对应的“B”。从而可以得到能够描述出该字符的字形特征的字形码：“11313B”，对应图3的音形码中的后6个数据位编码值。

再将上述音阶码与字形码进行拼接，从而可以得到图3中能够同时描述出字符“琅”的发音特征和字形特征的音形码数据。

按照上述方式，可以确定并获取该目标字段中其他字符的音形码数据。再将该目标字段中所包含的字符的音形码数据进行组合，可以得到该目标字段的音形码数据。

在一些实施例中，具体实施时，可以同时利用目标文本字段的音形码数据、目标文本字段库中预设的专有文本字段的音形码数据，以及目标文本字段与预设的专有文字段的编辑距离这多种数据来计算目标文本字段与目标文本字段库中的各个预设的专有文本字段的相似度参数；再基于相似度参数，从目标文本字段库所包含的多个预设的专有文本字段中找出与目标文本字段相对较为匹配，语义较为接近的一个预设的专有文本字段，作为符合要求的参考文本字段。

其中，上述相似度参数具体可以理解为一种基于字形、发音、语音等多个维度因素来综合描述不同文本字段之间的相似程度的参数数据。通常如果两个文本字段的相似度参数越大，说明这两个文本字段越相似，具有相对越大的概率属于同一个文本字段。相反，如果两个文本字段的相似度参数越小，说明这两个文本字段越不相似，具有相对越大的概率不属于同一个文本字段。

在一些实施例中，上述根据所述目标文本字段的音形码数据，以及目标文本字段与预设的专有文本字段的编辑距离，确定出目标文本字段与预设的专有文本字段的相似度参数，具体实施时，可以包括以下内容：根据所述目标文本字段的音形码数据，计算目标文本字段与预设的专有文本字段的音阶码相似度参数、字形码相似度参数；根据预设的权重参数，对所述目标文本字段与预设的专有文本字段的编辑距离、音阶码相似度参数、字形码相似度参数进行加权求和，以得到目标文本字段与预设的专有文本字段的相似度参数。

通过上述实施例，可以较为精准地计算出效果较好、准确度较高的目标文本字段与预设的专有文本字段的相似度参数。

在一些实施例中，上述预设的权重参数具体可以包括：与编辑距离对应的第一权重参数(可以记为w₁)、与音阶码相似度参数对应的第二权重参数(可以记为w₂)，以及与字形码相似度参数对应的第三权重参数(可以记为w₃)。

在一些实施例中，可以根据目标文本字段中字符的类型特征，灵活地设置三种权重参数的数值。具体的，例如，对于诸如汉字等象形字符，可以将第三权重参数、第一权重参数的数值设置得相对较大，分别为0.4，将第二权重参数的数值设置得相对较小，为0.2。当然，上述所列举的预设的权重参数只是一种示意性说明。具体实施时，根据具体情况和精度要求，还可以采用其他数值来设置预设的权重参数。对此，本说明书不作限定。

在一些实施例中，具体实施时，可以按照以下算式计算目标文本字段与预设的专有文本字段的相似度参数：

其中，E具体可以表示为目标文本字段与预设的专有文本字段的相似度参数，edit_distance具体可以表示为目标文本字段与预设的专有文本字段的编辑距离，P具体可以表示为目标文本字段与预设的专有文本字段的音阶码相似度参数，S具体可以表示为目标文本字段与预设的专有文本字段的字形码相似度参数，s₁具体可以表示为目标文本字段的字符长度，s₂具体可以表示为预设的专有文本字段的字符长度，w₁具体可以表示为与编辑距离对应的第一权重参数，w₂具体可以表示为与音阶码相似度参数对应的第二权重参数，w₃具体可以表示为与字形码相似度参数对应的第三权重参数。

通过上述算式可以准确地计算得到精度较高的相似度参数。

在一些实施例中，具体计算目标文本字段与预设的专有文本字段的编辑距离时，可以先基于相同转换映射规则，将目标文本字段和预设的专有文本字段转换为对应的两个字符串，再计算上述两个字串所对应的特征向量；通过计算两个特征向量之间的向量距离，得到目标文本字段和预设的专有文本字段的编辑距离。

在一些实施例中，具体计算目标文本字段与预设的专有文本字段的音阶码相似度参数时，可以利用目标文本字段中各个字符的音阶码的数据位的编码值，与预设的专有文本字段中对应字符的音阶码的对应数据为的编码值进行预设的相似度运算，以得到目标文本字段与预设的专有文本字段的音阶码相似度参数。

具体的，以计算只包含有一个字符的目标文本字段与预设的专有文本字段的音阶码相似度参数为例，可以按照以下方式计算出对应的音阶码相似度参数：

其中，P为目标文本字段与预设的专有文本字段的音阶码相似度参数，

表示利用目标文本字段中的字符的第一数据位的编码值与预设的专有文本字段相同位置处的字符的第一数据位的编码值进行预设的相似度运算，

表示利用目标文本字段中的字符的第二数据位的编码值与预设的专有文本字段相同位置处的字符的第二数据位的编码值进行预设的相似度运算，

表示利用目标文本字段中的字符的第三数据位的编码值与预设的专有文本字段相同位置处的字符的第三数据位的编码值进行预设的相似度运算，

表示利用目标文本字段中的字符的第四数据位的编码值与预设的专有文本字段相同位置处的字符的第四数据位的编码值进行预设的相似度运算。

表示一种预设的相似度运算，基于该运算：当参与运算的两个编码值相同，则返回1，否则返回0。

在一些实施例中，类似的，具体计算目标文本字段与预设的专有文本字段的字形码相似度参数时，可以利用目标文本字段中各个字符的字形码的数据位的编码值，与预设的专有文本字段中对应字符的字形码的对应数据为的编码值进行预设的相似度运算，以得到目标文本字段与预设的专有文本字段的字形码相似度参数。

具体的，以计算只包含有一个字符的目标文本字段与预设的专有文本字段的字形码相似度参数为例，可以按照以下方式计算出对应的字形码相似度参数：

其中，S为目标文本字段与预设的专有文本字段的字形码相似度参数，p₁₀为目标文本字段中字符的字形码中第七数据位的编码值，p₁₀'为预设的专有文本字段中相同位置处的字符的字形码中第七数据位的编码值。

通过上述实施例，可以计算出目标文本字段与目标文本字段库中所包含的各个预设的专有文本字段的相似度参数；进而可以从目标文本字段库中筛选出与目标文本字段的相似度参数最大的预设的专有文本字段，作为与目标文本字段最为匹配对应、语义最为接近的符合要求的参考文本字段。

在一些实施例中，具体计算相似参数时，为了减少数据处理量，提高数据处理效率，还可以根据目标文本字段所包含的字符数，先从目标文本字段库所包含的多个预设的专有文本字段中筛选出对照文本字段；进而只计算目标文本字段与各个对照文本字段的相似度参数；再基于相似度参数，从多个对照文本字段中筛选出与目标文本字段匹配对应的参考文本字段。从而可以达到减少数据处理量，提高数据处理效率的效果。

在一些实施例中，上述根据所述参考文本字段，校正所述目标文本字段，具体实施时，可以包括以下内容：比较所述参考文本字段中的字符和目标文本字段中的字符，确定出存在字符差异的字符位置；利用参考文本字段中存在字符差异的字符位置处的字符替换目标文本字段中相同字符位置处的字符，得到校正后的目标文本字段。

通过上述实施例，可以有效地利用标准的参考文本字段对目标文本字段进行针对性的校正处理，以消除目标文本字段中的误差，得到准确度较高的校正后的目标文本字段，从而可以从目标图像中较为精准地识别并提取出所需要的专有文本字段。

具体的，例如，以目标文本字段“未分配利剂”为例，基于上述方式从目标文本字段库中所找出的相似度参数的数值最大的预设的专有文本字段为“未分配利润”。因此，可以将该预设的专有文本字段确定为参考文本字段。进而可以利用上述参考文本字段对目标文本字段“未分配利剂”进行针对性的校正处理。

具体校正时，可以将目标文本字段中的各个位置处的字符依次与参考文本字段中相同位置处的字符进行比较，找出存在字符差异的字符位置。例如，目标文本字段中第五个字符位置处的字符为“剂”，而参考文本字段中第五个字符位置处的字符为“润”，因此，可以将第五个字符位置确定为存在字符差异的字符位置。

接着，可以以参考文本字段中字符为准，利用参考文本字段中存在字符差异的位置处的字符来替换目标文本字段中相同字符位置处的字符，从而实现对目标文本字段的针对性校正，得到校正后的目标文本字段。例如，可以利用参考文本字段中第五个字符位置处的字符“润”来替换目标文本字段中相同字符位置处的字符“剂”，得到校正后的目标文本字段。

在一些实施例中，在得到校正后的目标文本字段后，所述方法具体实施时，还可以包括：根据校正后的目标文本字段进行相应的目标业务数据处理。例如，可以利用校正后的目标文本字段，再去提取与上述目标文本字段存在对应关系的数据值字段，进而可以还原出完整的文本形式的目标业务数据。再利用上述文本形式的目标业务数据进行诸如业务办理、业务数据统计，或者业务数据存储等相关的数据处理。

在一些实施例中，具体实施前，还可以通过整理汇总历史业务数据，以建立多个预设的文本字段库。

具体的，在获取目标图像之前，所述方法具体实施时，还可以包括以下内容：获取多个历史业务数据；其中，所述历史业务数据与目标业务数据的主题类型相同；从多个历史业务数据中提取出多个文本字段；从所述多个文本字段中过滤掉表征数据值的文本字段，得到多个预设的专有文本字段，以构建与目标业务数据的主题类型匹配的预设的文本字段库。

通过上述实施例，可以预先构建得到与多个主题类型分别对应的，且存储有与主题类型相关的预设的专有文本字段的预设的文本字段库。

在一些实施例中，在从所述多个文本字段中过滤掉表征数据值的文本字段，得到多个预设的专有文本字段之后，可以根据历史业务数据，统计上述多个预设的专有文本字段的历史使用频率。再根据历史使用频率，从上述多个预设的专有文本字段中进一步筛选出使用频率较高的多个预设的专有文本字段来构建对应的预设的文本字段库。从而可以得到相对更加精简，后续使用时效率更高的预设的文本字段库。

在一些实施例中，在按照上述方式构建好预设的文本字段库后，还可以每间隔预设的时间段，获取该时间段的相同主题类型的业务数据；进而可以每间隔预设的时间段，利用上一个时间段的相同主题类型的业务数据，对预设的文本字段库进行更新。例如，可以在预设的文本字段库中增加上一个时间段新出现的预设的专有文本字段，也可以在预设的文本字段库中删除上一个时间段使用频率为0的预设的专有文本字段等。

由上可见，本说明书实施例提供的业务数据的处理方法，基于该方法，服务器可以直接使用已有的预设的OCR识别模型来处理包含有目标业务数据的目标图像，并从上述预设的OCR识别模型处理得到的OCR识别结果中提取出目标文本字段；再根据与目标业务数据的主题类型匹配的目标文本字段库，确定上述目标文本字段是否属于待校正的专有文本字段；在确定属于待校正的专有文本字段的情况下，服务器可以获取同时包含有基于字符的发音特征得到的音阶码和基于字符的字形特征得到的字形码的音形码数据；进一步，可以同时根据目标文本字段的音形码数据，以及目标文本字段与预设的专有文本字段的编辑距离，较为精准地从目标文本字段库所包含的预设的专有文本字段中筛选出符合要求的参考文本字段；并利用上述参考文本字段对当前所识别出的目标文本字段进行针对性的校正处理，得到较为准确的校正后的目标文本字段。这样服务器不需要耗费大量的资源、时间和成本来专门训练针对目标业务数据所属的主题类型的OCR识别模型，就能够较为高效、精准地从目标图像中识别并提取出目标业务数据中的专有文本字段，从而可以有效地降低业务数据的处理成本，提高业务数据的处理效率。

参阅图4所示，本说明书实施例还提供了另一种业务数据的处理方法。其中，该方法具体实施时，可以包括以下内容。

S401：获取目标图像；其中，所述目标图像包含有目标业务数据；

S402：通过调用预设的OCR识别模型处理所述目标图像，得到相应的OCR识别结果；并根据所述OCR识别结果，提取出目标文本字段；

S403：根据目标文本字段库，确定所述目标文本字段是否属于待校正的专有文本字段；其中，所述目标文本字段库与目标业务数据的主题类型匹配；所述目标文本字段库存储有多个预设的专有文本字段；

S404：在确定所述目标文本字段属于待校正的专有文本字段的情况下，获取目标文本字段的音形码数据；其中，所述音形码数据包括基于字符的发音特征得到的音阶码，和基于字符的字形特征得到的字形码；

S405：根据所述目标文本字段的音形码数据，确定出目标文本字段与预设的专有文本字段的相似度参数；

S406：根据所述相似度参数，从目标文本字段库中筛选出符合要求的预设的专有文本字段，作为参考文本字段；并根据所述参考文本字段，校正所述目标文本字段。

通过上述实施例不需要再计算编辑距离，就可以从目标图像中获取相对较为准确的校正后的目标文本字段，从而可以进一步简化了数据处理流程，提高了数据处理效率。

本说明书实施例还提供一种服务器，包括处理器以及用于存储处理器可执行指令的存储器，所述处理器具体实施时可以根据指令执行以下步骤：获取目标图像；其中，所述目标图像包含有目标业务数据；通过调用预设的OCR识别模型处理所述目标图像，得到相应的OCR识别结果；并根据所述OCR识别结果，提取出目标文本字段；根据目标文本字段库，确定所述目标文本字段是否属于待校正的专有文本字段；其中，所述目标文本字段库与目标业务数据的主题类型匹配；所述目标文本字段库存储有多个预设的专有文本字段；在确定所述目标文本字段属于待校正的专有文本字段的情况下，获取目标文本字段的音形码数据；其中，所述音形码数据包括基于字符的发音特征得到的音阶码，和基于字符的字形特征得到的字形码；根据所述目标文本字段的音形码数据，以及目标文本字段与预设的专有文本字段的编辑距离，确定出目标文本字段与预设的专有文本字段的相似度参数；根据所述相似度参数，从目标文本字段库中筛选出符合要求的预设的专有文本字段，作为参考文本字段；并根据所述参考文本字段，校正所述目标文本字段。

为了能够更加准确地完成上述指令，参阅图5所示，本说明书实施例还提供了另一种具体的服务器，其中，所述服务器包括网络通信端口501、处理器502以及存储器503，上述结构通过内部线缆相连，以便各个结构可以进行具体的数据交互。

其中，所述网络通信端口501，具体可以用于获取目标图像；其中，所述目标图像包含有目标业务数据。

所述处理器502，具体可以用于通过调用预设的OCR识别模型处理所述目标图像，得到相应的OCR识别结果；并根据所述OCR识别结果，提取出目标文本字段；根据目标文本字段库，确定所述目标文本字段是否属于待校正的专有文本字段；其中，所述目标文本字段库与目标业务数据的主题类型匹配；所述目标文本字段库存储有多个预设的专有文本字段；在确定所述目标文本字段属于待校正的专有文本字段的情况下，获取目标文本字段的音形码数据；其中，所述音形码数据包括基于字符的发音特征得到的音阶码，和基于字符的字形特征得到的字形码；根据所述目标文本字段的音形码数据，以及目标文本字段与预设的专有文本字段的编辑距离，确定出目标文本字段与预设的专有文本字段的相似度参数；根据所述相似度参数，从目标文本字段库中筛选出符合要求的预设的专有文本字段，作为参考文本字段；并根据所述参考文本字段，校正所述目标文本字段。

所述存储器503，具体可以用于存储相应的指令程序。

在本实施例中，所述网络通信端口501可以是与不同的通信协议进行绑定，从而可以发送或接收不同数据的虚拟端口。例如，所述网络通信端口可以是负责进行web数据通信的端口，也可以是负责进行FTP数据通信的端口，还可以是负责进行邮件数据通信的端口。此外，所述网络通信端口还可以是实体的通信接口或者通信芯片。例如，其可以为无线移动网络通信芯片，如GSM、CDMA等；其还可以为Wifi芯片；其还可以为蓝牙芯片。

在本实施例中，所述处理器502可以按任何适当的方式实现。例如，处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application SpecificIntegrated Circuit，ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。本说明书并不作限定。

在本实施例中，所述存储器503可以包括多个层次，在数字***中，只要能保存二进制数据的都可以是存储器；在集成电路中，一个没有实物形式的具有存储功能的电路也叫存储器，如RAM、FIFO等；在***中，具有实物形式的存储设备也叫存储器，如内存条等。

本说明书实施例还提供了一种基于上述业务数据的处理方法的计算机存储介质，所述计算机存储介质存储有计算机程序指令，在所述计算机程序指令被执行时实现：获取目标图像；其中，所述目标图像包含有目标业务数据；通过调用预设的OCR识别模型处理所述目标图像，得到相应的OCR识别结果；并根据所述OCR识别结果，提取出目标文本字段；根据目标文本字段库，确定所述目标文本字段是否属于待校正的专有文本字段；其中，所述目标文本字段库与目标业务数据的主题类型匹配；所述目标文本字段库存储有多个预设的专有文本字段；在确定所述目标文本字段属于待校正的专有文本字段的情况下，获取目标文本字段的音形码数据；其中，所述音形码数据包括基于字符的发音特征得到的音阶码，和基于字符的字形特征得到的字形码；根据所述目标文本字段的音形码数据，以及目标文本字段与预设的专有文本字段的编辑距离，确定出目标文本字段与预设的专有文本字段的相似度参数；根据所述相似度参数，从目标文本字段库中筛选出符合要求的预设的专有文本字段，作为参考文本字段；并根据所述参考文本字段，校正所述目标文本字段。

在本实施例中，上述存储介质包括但不限于随机存取存储器(Random AccessMemory,RAM)、只读存储器(Read-Only Memory,ROM)、缓存(Cache)、硬盘(Hard DiskDrive,HDD)或者存储卡(Memory Card)。所述存储器可以用于存储计算机程序指令。网络通信单元可以是依照通信协议规定的标准设置的，用于进行网络连接通信的接口。

在本实施例中，该计算机存储介质存储的程序指令具体实现的功能和效果，可以与其它实施方式对照解释，在此不再赘述。

参阅图6所示，在软件层面上，本说明书实施例还提供了一种业务数据的处理装置，该装置具体可以包括以下的结构模块。

第一获取模块601，具体可以用于获取目标图像；其中，所述目标图像包含有目标业务数据；

第一处理模块602，具体可以用于通过调用预设的OCR识别模型处理所述目标图像，得到相应的OCR识别结果；并根据所述OCR识别结果，提取出目标文本字段；

第一确定模块603，具体可以用于根据目标文本字段库，确定所述目标文本字段是否属于待校正的专有文本字段；其中，所述目标文本字段库与目标业务数据的主题类型匹配；所述目标文本字段库存储有多个预设的专有文本字段；

第二获取模块604，具体可以用于在确定所述目标文本字段属于待校正的专有文本字段的情况下，获取目标文本字段的音形码数据；其中，所述音形码数据包括基于字符的发音特征得到的音阶码，和基于字符的字形特征得到的字形码；

第二确定模块605，具体可以用于根据所述目标文本字段的音形码数据，以及目标文本字段与预设的专有文本字段的编辑距离，确定出目标文本字段与预设的专有文本字段的相似度参数；

第二处理模块606，具体可以用于根据所述相似度参数，从目标文本字段库中筛选出符合要求的预设的专有文本字段，作为参考文本字段；并根据所述参考文本字段，校正所述目标文本字段。

需要说明的是，上述实施例阐明的单元、装置或模块等，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。为了描述的方便，描述以上装置时以功能分为各种模块分别描述。当然，在实施本说明书时可以把各模块的功能在同一个或多个软件和/或硬件中实现，也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个***，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

由上可见，本说明书实施例提供的业务数据的处理装置，不需要耗费大量的资源、时间和成本来专门训练针对目标业务数据所属的主题类型的OCR识别模型，就能够较为高效、精准地从目标图像中识别并提取出目标业务数据中的专有文本字段，从而可以有效地降低业务数据的处理成本，提高业务数据的处理效率。

在一个具体的场景示例中，可以应用本说明书提供的业务数据的处理方法来对OCR识别出文本字段进行校正。具体实现过程可以参阅以下内容。

具体可以参阅图7所示，主要包括：数据采集、OCR识别、专业词汇判定、判定是否纠错、校正计算、结果输出等步骤。

步骤1：首先进行数据采集(例如，获取包含有目标业务数据的目标图像)，主要可以对财务报表、凭证(目标业务数据)进行采集，例如进行扫描或者拍照。再对采集后的数据根据版式(例如，预设的结构模板)进行切片处理，得到相应的碎片数据，可以参阅图8所示。切片后的碎片数据可以用于进行后续的OCR识别。

步骤2：主要对切片后的图像碎片进行OCR识别(得到OCR识别结果)。

步骤3：对识别后的文本进行分词处理，并进行专业词汇(例如，专有文本字段)判定，识别后的文本如果为专业领域(例如，目标主题类型)的专业词汇。

步骤4：该步骤可以判定上一步骤判定为专业词汇的文本是否需要进行纠错处理(相当于确定目标文本字段是否属于待校正的专有文本字段)。具体判定时，可以采用基于置信度参数的判定方法，来判定OCR识别的置信度是否高于阈值。如果判定低于阈值，则确定需要进行纠错，以触发进入步骤5。

步骤5：该步骤具体可以采用基于字形编码和音节编码(例如，字段中字符的音形码数据)的相似度计算方法进行校正计算。

步骤6：结果输出，处理结束。

在本场景示例中，需要说明的相似度算法具体可以是指通过一定的方法，来计算两个不同字符串之间的相似程度。通常可以使用一个百分比来衡量不同字符串之间的相似程度。

但是基于现有方法通常在处理拉丁文字的文本匹配时，可以起到较好的效果。但是，上述方式是针对拉丁文字设计的，在应用于象形文字(例如，汉文)的相似度计算时，就很容易出现误差，效果相对较差。

举例来说明，例如：南通市–难通市–北通市。现有方法采用编辑距离算法来计算得到三者相互之间的相似度：南通市和难通市之间的相似度，南通市和北通市的相似度，是一模一样的。这是因为基于现有方法针对上述两组都需要付出相同的代价来转换成另一个。例如，使用N-Gram算法，得出的也是相同的结果。

然而，对于熟悉汉文的人来讲，南通市和难通市语义更加接近，实际上具有更高的相似度。因为两者的发音是完全相同。当一个人说“难通市”时，熟悉汉文的人可以很快速地反映他所指的是“南通市”。

又例如，彬彬有礼–杉杉有礼。基于现有方法，如果站在解决拉丁文字的相似度的角度来看，那么这两个字符串大约只有50％的相似度。因为在四个字符中，就有两个字符是完全不同的。这两个字符不仅外形不同，即使是发音，也是完全不同。

然而对于熟悉汉文的人来说，这两个字段应该有着相当高的相似度。因为第一个和第二个字符虽然不同，却有着十分接近的字形。

针对上述问题，在本场景示例中，提出了一种处理思路：首先将字段中的汉字转化成一组的字母数字的序列，而这个转化所用到的hash算法必须能够将该汉字的字形特征、发音特征都保留下来。基于这样的转化，可以将汉字的相似度问题，变成了两组字母数字序列的相似度问题。因此，算法的关键是寻找一个合适的hash算法。

基于这种思路，通过长期的实践测试，确定引入并使用音形码(例如，音形码数据)来解决上述问题。其中，音形码具体可以是一种针对汉字的编码方式，该编码可以将一个汉字转化成一个十位字母数字序列，并在一定程度上保留了该汉字的发音及字形的特征。可以参阅图3所示，整个音形码共分两部分：第一部分是音码(对应音阶码)，第二部分是字形码。

其中，在音码主要覆盖了韵母，声母，补码以及声调的内容。

在字形码中，第一位(第五数据位)可以被称为结构位，根据汉字的不同结构，可以用一个字符来表示该汉字的结构。接下来的四位(第六数据位、第七数据位、第八数据位和第九数据位)，则是借用了四角编码，来描述该汉字的形态。最后一位(第十数据为)，则是汉字的笔画数位，具体可以使用1至9，来分别表示小于10的笔画数，对于大于10的笔画数，可以使用A代表10，B代表11，并依次类推。其中，可以使用Z代表35，以及其他大于35的笔画数。

在按照上述方式进行编码后，可以进行相似度计算，包括：计算音形的相似度(例如，音阶码相似度参数)和字形的相似度(例如，字形码相似度参数)。

在本场景示例中，可以同时基于上述音形和字形，并结合编辑距离来进行相似度计算。具体的相似度计算可以由两部分组成：第一一部分是编辑距离计算，第二部分是音形字形的相似度计算。具体公式可以表示为：

其中，s1、s2分别表示两个字段的字符串长度，P为音阶码相似度(例如，音阶码相似度参数)，S为形码相似度(例如，字形码相似度参数)。w1、w2、w3为权重控制各部分的权重(即第一权重参数、第二权重参数和第三权重参数)。

其中，上述P和S的计算公式如下所示：

其中，

表示一种运算：若两个字符相同返回1，不同返回0。

步骤6：最后输出最相近的专业词汇作为校正后的结果。

在本场景示例中，具体校正后的结果可以参阅图9所示。其中，通过上述方法只有序号3的碎片数据识别出现错误，其他的碎片数据识别之后再通过校正，得到了准确的识别结果。

通过上述场景示例，验证了基于本说明书所提供的方法，确实可以只需要利用已有的OCR识别模型，能够较为高效、精准地从目标图像中识别并提取出目标业务数据中的专有文本字段，从而可以有效地降低业务数据的处理成本，提高业务数据的处理效率。

虽然本说明书提供了如实施例或流程图所述的方法操作步骤，但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式，不代表唯一的执行顺序。在实际中的装置或客户端产品执行时，可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境，甚至为分布式数据处理环境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下，并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。第一，第二等词语用来表示名称，而并不表示任何特定的顺序。

本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内部包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构、类等等。也可以在分布式计算环境中实践本说明书，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

通过以上的实施例的描述可知，本领域的技术人员可以清楚地了解到本说明书可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本说明书的技术方案本质上可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，移动终端，服务器，或者网络设备等)执行本说明书各个实施例或者实施例的某些部分所述的方法。

本说明书中的各个实施例采用递进的方式描述，各个实施例之间相同或相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。本说明书可用于众多通用或专用的计算机***环境或配置中。例如：个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器***、基于微处理器的***、置顶盒、可编程的电子设备、网络PC、小型计算机、大型计算机、包括以上任何***或设备的分布式计算环境等等。

虽然通过实施例描绘了本说明书，本领域普通技术人员知道，本说明书有许多变形和变化而不脱离本说明书的精神，希望所附的权利要求包括这些变形和变化而不脱离本说明书的精神。

Claims

1.一种业务数据的处理方法，其特征在于，包括：

获取目标图像；其中，所述目标图像包含有目标业务数据；

2.根据权利要求1所述的方法，其特征在于，所述目标业务数据包括以下至少之一：财务报表、转账凭证、交易订单。

3.根据权利要求2所述的方法，其特征在于，通过调用预设的OCR识别模型处理所述目标图像，得到相应的OCR识别结果，包括：

确定目标业务数据的主题类型；

4.根据权利要求3所述的方法，其特征在于，根据目标文本字段库，确定所述目标文本字段是否属于待校正的专有文本字段，包括：

统计目标文本字段所包含的字符数；

5.根据权利要求4所述的方法，其特征在于，获取目标文本字段的置信度参数，包括：

6.根据权利要求1所述的方法，其特征在于，获取目标文本字段的音形码数据，包括：

确定出目标文本字段中字符的韵母、声母和声调；

确定出目标文本字段中字符的结构、四角编码和笔画数；

7.根据权利要求6所述的方法，其特征在于，根据所述目标文本字段的音形码数据，以及目标文本字段与预设的专有文本字段的编辑距离，确定出目标文本字段与预设的专有文本字段的相似度参数，包括：

8.根据权利要求7所述的方法，其特征在于，按照以下算式计算目标文本字段与预设的专有文本字段的相似度参数：

9.根据权利要求1所述的方法，其特征在于，根据所述参考文本字段，校正所述目标文本字段，包括：

比较所述参考文本字段中的字符和目标文本字段中相同字符位置处的字符，确定出存在字符差异的字符位置；

10.根据权利要求1所述的方法，其特征在于，在获取目标图像之前，所述方法还包括：

从多个历史业务数据中提取出多个文本字段；

11.一种业务数据的处理装置，其特征在于，包括：

12.一种服务器，其特征在于，包括处理器以及用于存储处理器可执行指令的存储器，所述处理器执行所述指令时实现权利要求1至10中任一项所述方法的步骤。

13.一种计算机可读存储介质，其特征在于，其上存储有计算机指令，所述指令被执行时实现权利要求1至10中任一项所述方法的步骤。

14.一种业务数据的处理方法，其特征在于，包括：

获取目标图像；其中，所述目标图像包含有目标业务数据；