CN114550194B

CN114550194B - 一种识别信访件的方法和装置

Info

Publication number: CN114550194B
Application number: CN202210441221.7A
Authority: CN
Inventors: 温立强; 王晓娟; 韦崟屹; 杨跃; 翁璐嵩
Original assignee: Beijing Peking University Software Engineering Co ltd
Current assignee: Beijing Peking University Software Engineering Co ltd
Priority date: 2022-04-26
Filing date: 2022-04-26
Publication date: 2022-08-19
Anticipated expiration: 2042-04-26
Also published as: CN114550194A

Abstract

本申请实施例提供一种识别信访件的方法和装置，该方法包括：获取待识别信访件；对待识别信访件进行格式转换，得到待识别信访件的图像；对待识别信访件的图像中的指定内容进行识别，得到识别结果；其中，指定内容包括红头标题、文号、日期、公章和手写签名中的至少一个内容。借助于上述技术方案，本申请实施例能够减轻信访工作人员工作量与压力，提升信访件处理效率。

Description

一种识别信访件的方法和装置

技术领域

本申请涉及计算机技术领域，具体涉及计算机视觉和自然语言处理技术领域，尤其涉及一种识别信访件的方法和装置。

背景技术

信访，是指公民个人或群体以书信、电子邮件、走访、电话、传真和短信等多种参与形式与对应单位负责信访工作的机构或人员接触，以反映情况，表达自身意见，请求解决问题，有关信访工作机构或人员采用一定的方式进行处理的一种制度。以及，在大量信访件中，存在许多不规范的信访件，例如没有红头、文号、日期、公章或者手写签名等，故需要对信访件（或者信访文书）进行规范性审查。

目前，现有的审查方法是由信访工作人员对信访件进行规范性审查的。

在实现本发明的过程中，发明人发现现有技术中存在如下问题：由于现有的审查方法是采用人工审查的方式来实现的，故其至少存在着信访件审查效率不高的问题。

发明内容

本申请实施例的目的在于提供一种识别信访件的方法和装置，以提高信访件的审核效率。

第一方面，本申请实施例提供了一种识别信访件的方法，该方法包括：获取待识别信访件；对待识别信访件进行格式转换，得到待识别信访件的图像；对待识别信访件的图像中的指定内容进行识别，得到识别结果；其中，指定内容包括红头标题、文号、日期、公章和手写签名中的至少一个内容。

因此，借助于上述技术方案，本申请实施例能够优化人工筛选处理不合规范信访件方法存在的弊端，减轻信访工作人员工作量与压力，提升信访件处理效率，加强紧急情况下信访人诉求回应的及时性与实时性，提高有效信访件识别的准确率，推进信访领域业务服务智能化与社会治安治理能力现代化。

在一个可能的实施例中，指定内容包括红头标题；

其中，对待识别信访件的图像中的指定内容进行识别，得到识别结果，包括：对待识别信访件的首页内容的图像进行光学字符识别OCR，得到第一OCR结果；从第一OCR结果中选取目标文本部分；其中，目标文本部分为第一OCR结果中纵跨像素最广并且高度最大的文本部分；对目标文本部分进行HSV三通道分离，得到色度通道、饱和度通道和亮度通道；若色度通道、饱和度通道和亮度通道均在红色色域范围内，则确定待识别信访件存在红头标题；若色度通道、饱和度通道和亮度通道中任意一个通道不在红色色域范围内，则确定待识别信访件不存在红头标题。

在一个可能的实施例中，指定内容包括文号；

其中，对待识别信访件的图像中的指定内容进行识别，得到识别结果，包括：对待识别信访件的首页内容的图像进行光学字符识别OCR，得到第一OCR结果；将至少一个文号模板和第一OCR结果进行匹配；若至少一个文号模板中存在与第一OCR结果匹配的目标文号模板，则确定待识别信访件存在文号；若至少一个文号模板中所有文号模板均不与第一OCR结果匹配，则确定待识别信访件不存在文号。

在一个可能的实施例中，指定内容包括日期；

其中，对待识别信访件的图像中的指定内容进行识别，得到识别结果，包括：对待识别信访件的末页内容的图像进行光学字符识别OCR，得到第二OCR结果；将至少一个日期模板和第二OCR结果进行匹配；若至少一个日期模板中存在与第二OCR结果匹配的目标日期模板，则确定待识别信访件存在日期；若至少一个日期模板中所有日期模板均不与第二OCR结果匹配，则确定待识别信访件不存在日期。

在一个可能的实施例中，指定内容包括公章；

其中，对待识别信访件的图像中的指定内容进行识别，得到识别结果，包括：对待识别信访件的图像进行灰度化处理，得到灰度图像；将灰度图像输入到预先训练好的基于YOLOv5的公章识别模型中，得到公章识别结果。

在一个可能的实施例中，用于训练公章识别模型的样本公章图像的数据增强过程包括：获取样本公章图像；对样本公章图像进行透明化处理，得到第一待克隆图像；将第一待克隆图像融合粘贴到第一背景图像中，得到用于训练公章识别模型的第一融合图像；其中，第一背景图像为不包含公章的文本数据图像。

因此，借助于上述技术方案，其能够解决原有的标注数据量比较少的问题，其可通过数据增强的方式来获取更多的训练数据。

在一个可能的实施例中，将第一待克隆图像融合粘贴到第一背景图像中，得到公章识别模型的训练数据，包括：分别获取样本公章图像的梯度场和第一背景图像的梯度场；将样本公章图像的梯度场覆盖到第一背景图像的梯度场上，以得到第一融合图像的梯度场；对第一融合图像的梯度场进行求偏导，得到第一散度值；利用泊松重建算法对第一散度值进行处理，得到第一融合图像中每个像素点的像素颜色值。

在一个可能的实施例中，指定内容包括手写签名；

其中，对待识别信访件的图像中的指定内容进行识别，得到识别结果，包括：对待识别信访件的图像进行灰度化处理，得到灰度图像；将灰度图像输入到预先训练好的基于YOLOv5的手写签名识别模型中，得到手写签名识别结果。

在一个可能的实施例中，用于训练手写签名识别模型的样本手写签名图像的数据增强过程包括：获取样本手写签名图像；对样本手写签名图像进行透明化处理，得到第二待克隆图像；将第二待克隆图像融合粘贴到第二背景图像中，得到用于训练手写签名识别模型的第二融合图像；其中，第二背景图像为不包含手写签名的文本数据图像。

在一个可能的实施例中，将第二待克隆图像融合粘贴到第二背景图像中，得到用于训练手写签名识别模型的第二融合图像，包括：分别获取样本手写签名图像的梯度场和第二背景图像的梯度场；将样本手写签名图像的梯度场覆盖到第二背景图像的梯度场上，以得到第二融合图像的梯度场；对第二融合图像的梯度场进行求偏导，得到第二散度值；利用泊松重建算法对第二散度值进行处理，得到第二融合图像中每个像素点的像素颜色值。

第二方面，本申请实施例提供了一种识别信访件的装置，该装置包括：获取模块，用于获取待识别信访件；格式转换模块，用于对待识别信访件进行格式转换，得到待识别信访件的图像；识别模块，用于对待识别信访件的图像中的指定内容进行识别，得到识别结果；其中，指定内容包括红头标题、文号、日期、公章和手写签名中的至少一个内容。

第三方面，本申请实施例提供了一种存储介质，该存储介质上存储有计算机程序，该计算机程序被处理器运行时执行第一方面或第一方面的任一可选的实现方式所述的方法。

第四方面，本申请实施例提供了一种电子设备，包括：处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当所述电子设备运行时，所述处理器与所述存储器之间通过总线通信，所述机器可读指令被所述处理器执行时执行第一方面或第一方面的任一可选的实现方式所述的方法。

第五方面，本申请提供一种计算机程序产品，所述计算机程序产品在计算机上运行时，使得计算机执行第一方面或第一方面的任意可能的实现方式中的方法。

为使本申请实施例所要实现的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对本申请实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1示出了本申请实施例提供的一种识别信访件的方法的流程图；

图2示出了本申请实施例提供的一种识别红头标题的方法的流程图；

图3示出了本申请实施例提供的一种识别文号的方法的流程图；

图4示出了本申请实施例提供的一种识别日期的方法的流程图；

图5示出了本申请实施例提供的一种识别公章的方法的流程图；

图6示出了本申请实施例提供的一种用于训练公章识别模型的样本公章图像的数据增强方法的流程图；

图7示出了本申请实施例提供的一种图像融合方法的流程图；

图8示出了本申请实施例提供的一种识别手写签名的方法的流程图；

图9示出了本申请实施例提供的一种用于训练手写签名识别模型的样本手写签名图像的数据增强方法的流程图；

图10示出了本申请实施例提供的另一种图像融合方法的流程图；

图11示出了本申请实施例提供的一种识别信访件的装置的结构框图；

图12示出了本申请实施例中提供的一种电子设备的结构框图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。

因此，以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

为了解决现有技术中存在着的信访件审查效率不高的问题，本申请实施例提供了一种信访文书规范性审查方案，通过获取或接收不同格式的信访件并对其进行统一处理，获得信访件的图像，以及从信访件的图像中识别当前信访件是否存在红头、是否存在文号、是否存在日期、是否存在公章以及是否存在手写签名等，从而能够优化人工筛选处理不合规范信访件方法存在的弊端，减轻信访工作人员工作量与压力，提升信访件处理效率，加强紧急情况下信访人诉求回应的及时性与实时性，提高有效信访件识别的准确率，推进信访领域业务服务智能化与社会治安治理能力现代化。

为了便于理解本申请实施例，下面对本申请实施例涉及的一些术语进行解释如下：

“像素颜色值”：其包括红（R）、绿（G）、蓝（B）三个颜色通道，以及图像的RGB通道）作为一种有效的单色图像颜色工具，可以保存图像颜色信息。

“HSV（色调Hue，饱和度Saturation，亮度Value）通道”：其相比于RGB通道，它的彩色描述更符合人描述和解释颜色的方式。

“正则表达式”：它作为计算机科学领域一种常见的文本匹配工具，在提供有效模版的前提下，可以用来检索、替换符合某个模式（规则）的文本。其中，用于分布式全文检索的Elasticsearch作为常用的检索工具，也同样可以实现文本匹配任务。

“基于深度学习的目标检测算法”：它分为two-stage算法和one-stage算法两种，前者准确度略高但速度慢，后者速度快但准确度略低。以及，基于深度学习的目标检测可以分为Input、Backbones、Neck和Head四个部分。其中，Input负责图像的输入处理，以及Backbones负责提取图像特征，以及Neck负责对提取的特征进行增强，以及Head用来输出最终的检测结果。

“YOLO系列”：它代表业界最先进目标检测水平，以及其属于one-stage算法，它在可以保持较高检测准确率的同时，可以大大提高模型的检测速度，可以使用户在速度与精确度之间进行权衡。以及，YOLO系列目前已更新至YOLOv5，YOLOv5相较于YOLOv4在数据增强和网络结构等方面均进行了优化。

请参见图1，图1示出了本申请实施例提供的一种识别信访件的方法的流程图。如图1所示的方法可以由识别信访件的装置执行，并且该装置可以是如图11所示的识别信访件的装置。以及，该装置的具体装置可根据实际需求来进行设置，本申请实施例并不局限于此。例如，该装置可以是计算机，也可以是服务器等。具体地，如图2所示的方法包括：

步骤S110，获取待识别信访件。

步骤S120，对待识别信访件进行格式转换，得到待识别信访件的图像。

具体地，由于待识别信访件的形式有很多（例如，其可以是Word版本，也可以是PDF版本等），故可对获取的至少一个待识别信访件进行统一的格式转换，以将所有的待识别信访件转换为统一的图像格式。例如，可将所有的待识别信访件转换为JPG图像。

步骤S130，对待识别信访件的图像中的指定内容进行识别，得到识别结果。

应理解，由于不同的信访件格式具备不同的信访文书规范性要求，故指定内容的具体内容可根据实际需求来进行设置，本申请实施例并不局限于此。

例如，该指定内容包括红头标题、文号、日期、公章和手写签名中的至少一个内容。

还应理解，红头标题、文号、日期、公章和手写签名也可以看作信访件的格式要素。

还应理解，对待识别信访件的图像中的指定内容进行识别，得到识别结果的具体方式可根据实际需求来进行设置，本申请实施例并不局限于此。

可选地，在指定内容包括红头标题的情况下，请参见图2，图2示出了本申请实施例提供的一种识别红头标题的方法的流程图。具体地，该方法包括：

步骤S210，从待识别信访件的图像中选取待识别信访件的首页内容的图像。其中，首页内容是指首页的全部内容。

步骤S220，对待识别信访件的首页内容的图像进行光学字符识别（OpticalCharacter Recognition，OCR），得到第一OCR结果。

步骤S230，从第一OCR结果中选取目标文本部分。其中，目标文本部分为第一OCR结果中纵跨像素最广并且高度最大的文本部分。

也就是说，根据第一OCR结果（或者说OCR文字识别结果），选取文字识别中纵跨像素最广、高度最大的文本部分。

步骤S240，对目标文本部分进行HSV三通道分离，得到色度通道、饱和度通道和亮度通道。

应理解，色度通道也可以称为H通道，饱和度通道也可以称为S通道，亮度通道也可以称为V通道。

步骤S250，根据红色色域在三个通道的范围，分别检查该文本部分的色度通道、饱和度通道和亮度通道是否在红色色域范围内。

若该文本部分的色度通道、饱和度通道和亮度通道均在红色色域范围内，则执行步骤S260；若该文本部分的色度通道、饱和度通道和亮度通道中任意一个通道不在红色色域范围内，则执行步骤S270。

步骤S260，确定待识别信访件存在红头标题。

步骤S270，确定待识别信访件不存在红头标题。

这里需要说明的是，除了上述方法实施例之外，还可借助目标检测的深度学习模型进行目标检测以完成同样的红头标题的识别任务，本申请实施例并不局限于此。

可选地，在指定内容包括文号的情况下，请参见图3，图3示出了本申请实施例提供的一种识别文号的方法的流程图。具体地，如图3所示的方法包括：

步骤S310，从待识别信访件的图像中选取待识别信访件的首页内容的图像。

步骤S320，对待识别信访件的首页内容的图像进行OCR文字识别，得到第一OCR结果。

步骤S330，将至少一个文号模板和第一OCR结果进行匹配，获得第一匹配结果。

应理解，至少一个文号模板中每个文号模板的获取方式可根据实际需求来进行设置，本申请实施例并不局限于此。

例如，首先需要对数据库中所有信访件的文号格式进行统计和分析，根据正则表达式的形式形成若干文号模版。

步骤S340，根据第一匹配结果，确定文号识别结果。

具体地，若通过第一匹配结果确定至少一个文号模板中存在与第一OCR结果匹配的目标文号模板，则确定待识别信访件存在文号；若通过第一匹配结果确定至少一个文号模板中所有文号模板均不与第一OCR结果匹配，则确定待识别信访件不存在文号。

这里需要说明的是，除了上述方法实施例之外，还可采取Elasticsearch对当前信访件进行检索，以识别当前信访件是否存在文号。

可选地，在指定内容包括日期的情况下，请参见图4，图4示出了本申请实施例提供的一种识别日期的方法的流程图。具体地，如图4所示的方法包括：

步骤S410，从待识别信访件的图像中选取待识别信访件的末页内容的图像。

步骤S420，对待识别信访件的末页内容的图像进行OCR文字识别，得到第二OCR结果。

步骤S430，将至少一个日期模板和第二OCR结果进行匹配，获得第二匹配结果。

应理解，至少一个日期模板中每个日期模板的获取方式可根据实际需求来进行设置，本申请实施例并不局限于此。

例如，首先需要对数据库中所有信访件的日期格式进行统计和分析，根据正则表达式的形式形成若干日期模版。

步骤S440，根据第二匹配结果，确定日期识别结果。

具体地，若通过第二匹配结果确定至少一个日期模板中存在与第二OCR结果匹配的目标日期模板，则确定待识别信访件存在日期；若通过第二匹配结果确定至少一个日期模板中所有日期模板均不与第二OCR结果匹配，则确定待识别信访件不存在日期。

这里需要说明的是，除了上述方法实施例之外，还可采取Elasticsearch对当前信访件进行检索，以识别当前信访件是否存在日期。

可选地，在指定内容包括公章的情况下，请参见图5，图5示出了本申请实施例提供的一种识别公章的方法的流程图。具体地，如图5所示的方法包括：

步骤S510，对待识别信访件的图像进行灰度化处理，得到灰度图像。

步骤S520，将灰度图像输入到预先训练好的基于YOLOv5的公章识别模型中，得到公章识别结果。

应理解，公章识别结果所包含的内容可根据实际需求来进行设置，本申请实施例并不局限于此。

例如，公章识别结果为待识别信访件中是否包含公章。

还应理解，公章识别模型的具体模型和层结构等均可根据实际需求来进行设置，本申请实施例并不局限于此。

还应理解，公章识别模型的训练过程也可根据实际需求来进行设置，本申请实施例并不局限于此。

可选地，在获取数据集后，需要对数据集中的数据打上标签，为每一张图像数据提供公章的位置信息。其中，标签内容可以为检测目标类型（公章）、目标中点横坐标、纵坐标、目标长度和宽度。以及，除了检测目标类型外，其他标签数据均需要进行归一化处理。

以及，利用YOLOv5网络结构对公章识别模型进行训练时，先将信访件图像进行灰度化处理，灰度化处理的目的为消除颜色对训练模型的影响、加快模型训练和检测速度。以及，在图像灰度化处理后，再通过模型进行训练，训练完毕后在测试集上进行测试，根据测试指标准确率、精确率、召回率、AP和IoU等指标评估模型训练情况，选择指标效果最好的超参数在全部数据集上再训练一次，并保存训练好的模型参数。

这里需要说明的是，需要借助YOLOv5网络结构进行模型训练方可使用，但是模型训练面临的一个问题为数据集不充足，模型训练不充分，模型泛化能力弱等，因此，为增大含公章的数据集或者训练数据，增加模型的泛化能力，获得更好的训练效果，可以通过图像融合的方式为模型训练和测试提供更多的有效数据。

例如，可参见图6，图6示出了本申请实施例提供的一种用于训练公章识别模型的样本公章图像的数据增强方法的流程图。具体地，如图6所示的数据增强方法包括：

步骤S610，获取样本公章图像。

步骤S620，对样本公章图像进行透明化处理，得到第一待克隆图像。

步骤S630，将第一待克隆图像融合粘贴到第一背景图像中，得到用于训练公章识别模型的第一融合图像；其中，第一背景图像为不包含公章的文本数据图像。

也就是说，在模型训练数据的生成过程中，为了使生成的图像和真实的图像更接近，首先把样本公章图像处理成透明的，作为待克隆图像区域，把不含公章的普通文本数据图像作为背景图片，图像融合的目的是把待克隆图像区域融合粘贴到背景图片中，生成含有公章的文本数据并与原有的含公章的数据一起构成数据集。

应理解，将第一待克隆图像融合粘贴到第一背景图像中，得到公章识别模型的训练数据的具体过程可根据实际需求来进行设置，本申请实施例并不局限于此。

可选地，请参见图7，图7示出了本申请实施例提供的一种图像融合方法的流程图。具体地，如图7所示的方法包括：

步骤S710，分别获取样本公章图像的梯度场和第一背景图像的梯度场。

应理解，分别获取样本公章图像的梯度场和第一背景图像的梯度场的具体方式可根据实际需求来进行设置，本申请实施例并不局限于此。

例如，可通过差分的方法求得样本公章图像的梯度场和第一背景图像的梯度场。

步骤S720，将样本公章图像的梯度场覆盖到第一背景图像的梯度场上，以得到第一融合图像的梯度场。

步骤S730，对第一融合图像的梯度场进行求偏导，得到第一散度值。

步骤S740，利用泊松重建算法对第一散度值进行处理，得到第一融合图像中每个像素点的像素颜色值。

应理解，利用泊松重建算法对第一散度值进行处理，得到第一融合图像中每个像素点的像素颜色值的具体过程可根据实际需求来进行设置，本申请实施例并不局限于此。

例如，泊松重建方程Ax=b，其中，b是散度，因此只需要构建系数矩阵A就能得到融合后图像的像素值x。对于三通道图像而言，只需要求解三个通道方程，就可以获得融合图像中每个点的像素R、G、B的值。

这里还需要说明的是，除了上述方法实施例外，还可采取two-stage类目标检测算法，以识别当前信访件是否存在公章。

可选地，在指定内容包括手写签名的情况下，请参见图8，图8示出了本申请实施例提供的一种识别手写签名的方法的流程图。具体地，如图8所示的方法包括：

步骤S810，对待识别信访件的图像进行灰度化处理，得到灰度图像。

步骤S820，将灰度图像输入到预先训练好的基于YOLOv5的手写签名识别模型中，得到手写签名识别结果。

还应理解，手写签名识别模型的具体模型和层结构等均可根据实际需求来进行设置，本申请实施例并不局限于此。

还应理解，手写签名识别模型的训练过程也可根据实际需求来进行设置，本申请实施例并不局限于此。

可选地，在获取数据集后，需要对数据集中的数据打上标签，为每一张图像数据提供手写签名的位置信息。其中，标签内容可以为检测目标类型（手写签名）、目标中点横坐标、纵坐标、目标长度和宽度。以及，除了检测目标类型外，其他标签数据均需要进行归一化处理。

以及，利用YOLOv5网络结构对手写签名识别模型进行训练时，先将信访件图像进行灰度化处理，灰度化处理的目的为消除颜色对训练模型的影响、加快模型训练和检测速度。以及，在图像灰度化处理后，再通过模型进行训练，训练完毕后在测试集上进行测试，根据测试指标准确率、精确率、召回率、AP和IoU等指标评估模型训练情况，选择指标效果最好的超参数在全部数据集上再训练一次，并保存训练好的模型参数。

这里需要说明的是，需要借助YOLOv5网络结构进行模型训练方可使用，但是模型训练面临的一个问题为数据集不充足，模型训练不充分，模型泛化能力弱等，因此，为增大含手写签名的数据集或者训练数据，增加模型的泛化能力，获得更好的训练效果，可以通过图像融合的方式为模型训练和测试提供更多的有效数据。

例如，可参见图9，图9示出了本申请实施例提供的一种用于训练手写签名识别模型的样本手写签名图像的数据增强方法的流程图。具体地，如图9所示的数据增强方法包括：

步骤S910，获取样本手写签名图像。

步骤S920，对样本手写签名图像进行透明化处理，得到第二待克隆图像。

步骤S930，将第二待克隆图像融合粘贴到第二背景图像中，得到用于训练手写签名识别模型的第二融合图像；其中，第二背景图像为不包含手写签名的文本数据图像。

也就是说，在模型训练数据的生成过程中，为了使生成的图像和真实的图像更接近，首先把样本手写签名图像处理成透明的，作为待克隆图像区域，把不含手写签名的普通文本数据图像作为背景图片，图像融合的目的是把待克隆图像区域融合粘贴到背景图片中，生成含有手写签名的文本数据并与原有的含手写签名的数据一起构成数据集。

应理解，将第二待克隆图像融合粘贴到第二背景图像中，得到手写签名识别模型的训练数据的具体过程可根据实际需求来进行设置，本申请实施例并不局限于此。

可选地，请参见图10，图10示出了本申请实施例提供的另一种图像融合方法的流程图。具体地，如图10所示的方法包括：

步骤S1010，分别获取样本手写签名图像的梯度场和第二背景图像的梯度场。

应理解，分别获取样本手写签名图像的梯度场和第二背景图像的梯度场的具体方式可根据实际需求来进行设置，本申请实施例并不局限于此。

例如，可通过差分的方法求得样本手写签名图像的梯度场和第二背景图像的梯度场。

步骤S1020，将样本手写签名图像的梯度场覆盖到第二背景图像的梯度场上，以得到第二融合图像的梯度场。

步骤S1030，对第二融合图像的梯度场进行求偏导，得到第二散度值。

步骤S1040，利用泊松重建算法对第二散度值进行处理，得到第二融合图像中每个像素点的像素颜色值。

应理解，利用泊松重建算法对第二散度值进行处理，得到第二融合图像中每个像素点的像素颜色值的具体过程与步骤S740的具体过程是类似的，具体可参见步骤S740的相关描述。

这里还需要说明的是，除了上述方法实施例外，还可采取two-stage类目标检测算法，以识别当前信访件是否存在手写签名。

应理解，上述识别信访件的方法仅是示例性的，本领域技术人员根据上述的方法可以进行各种变形，修改或变形之后的内容也在本申请保护范围内。

请参见图11，图11示出了本申请实施例提供的一种识别信访件的装置1100的结构框图。应理解，该装置1100与上述方法实施例对应，能够执行上述方法实施例涉及的各个步骤，具体的功能可以参见上文中的描述，为避免重复，此处适当省略详细描述。该装置1100包括至少一个能以软件或固件（firmware）的形式存储于存储器中或固化在该装置1100的操作***（operating system，OS）中的软件功能模块。具体地，该装置1100包括：

获取模块1110，用于获取待识别信访件；

格式转换模块1120，用于对待识别信访件进行格式转换，得到待识别信访件的图像；

识别模块1130，用于对待识别信访件的图像中的指定内容进行识别，得到识别结果；其中，指定内容包括红头标题、文号、日期、公章和手写签名中的至少一个内容。

在一个可能的实施例中，指定内容包括红头标题；识别模块1130，具体用于：对待识别信访件的首页内容的图像进行光学字符识别OCR，得到第一OCR结果；从第一OCR结果中选取目标文本部分；其中，目标文本部分为第一OCR结果中纵跨像素最广并且高度最大的文本部分；对目标文本部分进行HSV三通道分离，得到色度通道、饱和度通道和亮度通道；若色度通道、饱和度通道和亮度通道均在红色色域范围内，则确定待识别信访件存在红头标题；若色度通道、饱和度通道和亮度通道中任意一个通道不在红色色域范围内，则确定待识别信访件不存在红头标题。

在一个可能的实施例中，指定内容包括文号；识别模块1130，具体用于：对待识别信访件的首页内容的图像进行光学字符识别OCR，得到第一OCR结果；将至少一个文号模板和第一OCR结果进行匹配；若至少一个文号模板中存在与第一OCR结果匹配的目标文号模板，则确定待识别信访件存在文号；若至少一个文号模板中所有文号模板均不与第一OCR结果匹配，则确定待识别信访件不存在文号。

在一个可能的实施例中，指定内容包括日期；识别模块1130，具体用于：对待识别信访件的末页内容的图像进行光学字符识别OCR，得到第二OCR结果；将至少一个日期模板和第二OCR结果进行匹配；若至少一个日期模板中存在与第二OCR结果匹配的目标日期模板，则确定待识别信访件存在日期；若至少一个日期模板中所有日期模板均不与第二OCR结果匹配，则确定待识别信访件不存在日期。

在一个可能的实施例中，指定内容包括公章；识别模块1130，具体用于：对待识别信访件的图像进行灰度化处理，得到灰度图像；将灰度图像输入到预先训练好的基于YOLOv5的公章识别模型中，得到公章识别结果。

在一个可能的实施例中，该装置1100还包括第一数据增强模块（未示出）；

其中，该第一数据增强模块，具体用于：获取样本公章图像；对样本公章图像进行透明化处理，得到第一待克隆图像；将第一待克隆图像融合粘贴到第一背景图像中，得到用于训练公章识别模型的第一融合图像；其中，第一背景图像为不包含公章的文本数据图像。

在一个可能的实施例中，获取模块1110，还用于：分别获取样本公章图像的梯度场和第一背景图像的梯度场；将样本公章图像的梯度场覆盖到第一背景图像的梯度场上，以得到第一融合图像的梯度场；对第一融合图像的梯度场进行求偏导，得到第一散度值；利用泊松重建算法对第一散度值进行处理，得到第一融合图像中每个像素点的像素颜色值。

在一个可能的实施例中，指定内容包括手写签名；识别模块1130，具体用于：对待识别信访件的图像进行灰度化处理，得到灰度图像；将灰度图像输入到预先训练好的基于YOLOv5的手写签名识别模型中，得到手写签名识别结果。

在一个可能的实施例中，获取模块1110，还用于：获取样本手写签名图像；对样本手写签名图像进行透明化处理，得到第二待克隆图像；将第二待克隆图像融合粘贴到第二背景图像中，得到用于训练手写签名识别模型的第二融合图像；其中，第二背景图像为不包含手写签名的文本数据图像。

在一个可能的实施例中，该装置1100还包括第二数据增强模块（未示出）；

其中，该第二数据增强模块，具体用于：分别获取样本手写签名图像的梯度场和第二背景图像的梯度场；将样本手写签名图像的梯度场覆盖到第二背景图像的梯度场上，以得到第二融合图像的梯度场；对第二融合图像的梯度场进行求偏导，得到第二散度值；利用泊松重建算法对第二散度值进行处理，得到第二融合图像中每个像素点的像素颜色值。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的装置的具体工作过程，可以参考前述方法中的对应过程，在此不再过多赘述。

请参见图12，图12示出了本申请实施例中提供的一种电子设备1200的结构框图。如图12所示，该电子设备1200可以包括处理器1210、通信接口1220、存储器1230和至少一个通信总线1240。其中，通信总线1240用于实现这些组件直接的连接通信。其中，本申请实施例中的通信接口1220用于与其他设备进行信令或数据的通信。处理器1210可以是一种集成电路芯片，具有信号的处理能力。上述的处理器1210可以是通用处理器，包括中央处理器（Central Processing Unit，简称CPU）、网络处理器（Network Processor，简称NP）等；还可以是数字信号处理器（DSP）、专用集成电路（ASIC）、现成可编程门阵列（FPGA）或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器1210也可以是任何常规的处理器等。

存储器1230可以是，但不限于，随机存取存储器（Random Access Memory，RAM），只读存储器（Read Only Memory，ROM），可编程只读存储器（Programmable Read-OnlyMemory，PROM），可擦除只读存储器（Erasable Programmable Read-Only Memory，EPROM），电可擦除只读存储器（Electric Erasable Programmable Read-Only Memory，EEPROM）等。存储器1230中存储有计算机可读取指令，当所述计算机可读取指令由所述处理器1210执行时，电子设备1200可以执行上述方法实施例涉及的各个步骤。

电子设备1200还可以包括存储控制器、输入输出单元、音频单元、显示单元。

所述存储器1230、存储控制器、处理器1210、外设接口、输入输出单元、音频单元、显示单元各元件相互之间直接或间接地电性连接，以实现数据的传输或交互。例如，这些元件相互之间可通过一条或多条通信总线1240实现电性连接。所述处理器1210用于执行存储器1230中存储的可执行模块。并且，电子设备1200用于执行下述方法：获取待识别信访件；对所述待识别信访件进行格式转换，得到所述待识别信访件的图像；对所述待识别信访件的图像中的指定内容进行识别，得到识别结果；其中，所述指定内容包括红头标题、文号、日期、公章和手写签名中的至少一个内容。

输入输出单元用于提供给用户输入数据实现用户与所述服务器（或本地终端）的交互。所述输入输出单元可以是，但不限于，鼠标和键盘等。

音频单元向用户提供音频接口，其可包括一个或多个麦克风、一个或者多个扬声器以及音频电路。

显示单元在所述电子设备与用户之间提供一个交互界面（例如用户操作界面）或用于显示图像数据给用户参考。在本实施例中，所述显示单元可以是液晶显示器或触控显示器。若为触控显示器，其可为支持单点和多点触控操作的电容式触控屏或电阻式触控屏等。支持单点和多点触控操作是指触控显示器能感应到来自该触控显示器上一个或多个位置处同时产生的触控操作，并将该感应到的触控操作交由处理器进行计算和处理。

可以理解，图12所示的结构仅为示意，所述电子设备1200还可包括比图12中所示更多或者更少的组件，或者具有与图12所示不同的配置。图12中所示的各组件可以采用硬件、软件或其组合实现。

本申请还提供一种存储介质，该存储介质上存储有计算机程序，该计算机程序被处理器运行时执行方法实施例所述的方法。

本申请还提供一种计算机程序产品，所述计算机程序产品在计算机上运行时，使得计算机执行方法实施例所述的方法。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的***的具体工作过程，可以参考前述方法中的对应过程，在此不再过多赘述。

需要说明的是，本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现方式中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的***来实现，或者可以用专用硬件与计算机指令的组合来实现。

另外，在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分，也可以是各个模块单独存在，也可以两个或两个以上模块集成形成一个独立的部分。

所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器（ROM，Read-Only Memory）、随机存取存储器（RAM，Random Access Memory）、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述仅为本申请的优选实施例而已，并不用于限制本申请，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应所述以权利要求的保护范围为准。

Claims

1.一种识别信访件的方法，其特征在于，包括：

获取待识别信访件；

对所述待识别信访件进行格式转换，得到所述待识别信访件的图像；

对所述待识别信访件的图像中的指定内容进行识别，得到识别结果；其中，所述指定内容包括红头标题、文号、日期、公章和手写签名中的至少一个内容；所述指定内容包括所述红头标题；其中，所述对所述待识别信访件的图像中的指定内容进行识别，得到识别结果，包括：对所述待识别信访件的首页内容的图像进行光学字符识别OCR，得到第一OCR结果；从所述第一OCR结果中选取目标文本部分；其中，所述目标文本部分为所述第一OCR结果中纵跨像素最广并且高度最大的文本部分；对所述目标文本部分进行HSV三通道分离，得到色度通道、饱和度通道和亮度通道；若所述色度通道、所述饱和度通道和所述亮度通道均在红色色域范围内，则确定所述待识别信访件存在所述红头标题；若所述色度通道、所述饱和度通道和所述亮度通道中任意一个通道不在所述红色色域范围内，则确定所述待识别信访件不存在所述红头标题。

2.根据权利要求1所述的方法，其特征在于，所述指定内容包括所述文号；

其中，所述对所述待识别信访件的图像中的指定内容进行识别，得到识别结果，还包括：

对所述待识别信访件的首页内容的图像进行光学字符识别OCR，得到第一OCR结果；

将至少一个文号模板和所述第一OCR结果进行匹配；

若所述至少一个文号模板中存在与所述第一OCR结果匹配的目标文号模板，则确定所述待识别信访件存在所述文号；

若所述至少一个文号模板中所有文号模板均不与所述第一OCR结果匹配，则确定所述待识别信访件不存在所述文号。

3.根据权利要求1所述的方法，其特征在于，所述指定内容包括所述日期；

对所述待识别信访件的末页内容的图像进行光学字符识别OCR，得到第二OCR结果；

将至少一个日期模板和所述第二OCR结果进行匹配；

若所述至少一个日期模板中存在与所述第二OCR结果匹配的目标日期模板，则确定所述待识别信访件存在所述日期；

若所述至少一个日期模板中所有日期模板均不与所述第二OCR结果匹配，则确定所述待识别信访件不存在所述日期。

4.根据权利要求1所述的方法，其特征在于，所述指定内容包括所述公章；

对所述待识别信访件的图像进行灰度化处理，得到灰度图像；

将所述灰度图像输入到预先训练好的基于YOLOv5的公章识别模型中，得到公章识别结果。

5.根据权利要求4所述的方法，其特征在于，用于训练所述公章识别模型的样本公章图像的数据增强过程包括：

获取所述样本公章图像；

对所述样本公章图像进行透明化处理，得到第一待克隆图像；

将所述第一待克隆图像融合粘贴到第一背景图像中，得到用于训练所述公章识别模型的第一融合图像；其中，所述第一背景图像为不包含公章的文本数据图像。

6.根据权利要求5所述的方法，其特征在于，所述将所述第一待克隆图像融合粘贴到第一背景图像中，得到所述公章识别模型的训练数据，包括：

分别获取所述样本公章图像的梯度场和所述第一背景图像的梯度场；

将所述样本公章图像的梯度场覆盖到所述第一背景图像的梯度场上，以得到所述第一融合图像的梯度场；

对所述第一融合图像的梯度场进行求偏导，得到第一散度值；

利用泊松重建算法对所述第一散度值进行处理，得到所述第一融合图像中每个像素点的像素颜色值。

7.根据权利要求1所述的方法，其特征在于，所述指定内容包括所述手写签名；

将所述灰度图像输入到预先训练好的基于YOLOv5的手写签名识别模型中，得到手写签名识别结果。

8.根据权利要求7所述的方法，其特征在于，用于训练所述手写签名识别模型的样本手写签名图像的数据增强过程包括：

获取所述样本手写签名图像；

对所述样本手写签名图像进行透明化处理，得到第二待克隆图像；

将所述第二待克隆图像融合粘贴到第二背景图像中，得到用于训练所述手写签名识别模型的第二融合图像；其中，所述第二背景图像为不包含手写签名的文本数据图像。

9.根据权利要求8所述的方法，其特征在于，所述将所述第二待克隆图像融合粘贴到第二背景图像中，得到用于训练所述手写签名识别模型的第二融合图像，包括：

分别获取所述样本手写签名图像的梯度场和所述第二背景图像的梯度场；

将所述样本手写签名图像的梯度场覆盖到所述第二背景图像的梯度场上，以得到所述第二融合图像的梯度场；

对所述第二融合图像的梯度场进行求偏导，得到第二散度值；

利用泊松重建算法对所述第二散度值进行处理，得到所述第二融合图像中每个像素点的像素颜色值。

10.一种识别信访件的装置，其特征在于，包括：

获取模块，用于获取待识别信访件；

格式转换模块，用于对所述待识别信访件进行格式转换，得到所述待识别信访件的图像；

识别模块，用于对所述待识别信访件的图像中的指定内容进行识别，得到识别结果；其中，所述指定内容包括红头标题、文号、日期、公章和手写签名中的至少一个内容；所述指定内容包括所述红头标题；其中，所述识别模块具体用于：对所述待识别信访件的首页内容的图像进行光学字符识别OCR，得到第一OCR结果；从所述第一OCR结果中选取目标文本部分；其中，所述目标文本部分为所述第一OCR结果中纵跨像素最广并且高度最大的文本部分；对所述目标文本部分进行HSV三通道分离，得到色度通道、饱和度通道和亮度通道；若所述色度通道、所述饱和度通道和所述亮度通道均在红色色域范围内，则确定所述待识别信访件存在所述红头标题；若所述色度通道、所述饱和度通道和所述亮度通道中任意一个通道不在所述红色色域范围内，则确定所述待识别信访件不存在所述红头标题。