WO2023284608A1

WO2023284608A1 - 字符识别模型生成方法、装置、计算机设备和存储介质

Info

Publication number: WO2023284608A1
Application number: PCT/CN2022/104107
Authority: WO
Inventors: 孙鲲; 姚旭峰; 沈小勇; 吕江波
Original assignee: 深圳思谋信息科技有限公司; 上海思谋科技有限公司
Priority date: 2021-07-13
Filing date: 2022-07-06
Publication date: 2023-01-19
Also published as: CN113469092A; CN113469092B

Abstract

本申请涉及一种字符识别模型生成方法、装置、计算机设备和存储介质，方法包括：获取多个已识别字符数据集与待识别字符数据集之间的相似度，将与待识别字符数据集之间的相似度匹配的已识别字符数据集，作为目标字符数据集(21)；获取与目标字符数据集对应的预训练模型，根据预训练模型构建目标训练模型；预训练模型为经过预先训练后的用于识别目标字符数据集的模型(22)；根据已识别字符数据集与待识别字符数据集，生成目标训练数据集；根据目标训练数据集，对目标训练模型进行训练，得到与待识别字符数据集对应的字符识别模型(23)。

Description

字符识别模型生成方法、装置、计算机设备和存储介质

本申请要求于2021年07月13日提交中国专利局，申请号为2021107876810，申请名称为“字符识别模型生成方法、装置、计算机设备和存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及计算机识别技术领域，特别是涉及一种字符识别模型生成方法、装置、计算机设备和存储介质。

背景技术

随着工业的发展，越来越多的生产场景开始通过字符识别模型来识别生产设备、生产产品等上的字符信息。

但是，针对不同的生产场景往往需要从头开始训练字符识别模型，字符识别模型训练的周期较长，训练所需的数据较多，字符识别生成的效率还较低。

发明内容

根据本申请的各种实施例，提供一种字符识别模型生成方法、装置、计算机设备和存储介质。

一种字符识别模型生成方法，包括：

获取多个已识别字符数据集与待识别字符数据集之间的相似度，将与所述待识别字符数据集之间的相似度匹配的已识别字符数据集，作为目标字符数据集；

获取与所述目标字符数据集对应的预训练模型，根据所述预训练模型构建目标训练模型；所述预训练模型为经过预先训练后的用于识别所述目标字符数据集的模型；

根据所述已识别字符数据集与所述待识别字符数据集，生成目标训练数据集；根据所述目标训练数据集，对所述目标训练模型进行训练，得到与所述待识别字符数据集对应的字符识别模型。

一种字符识别模型生成装置，所述装置包括：

相似度获取模块，用于获取多个已识别字符数据集与待识别字符数据集之间的相似度，将与所述待识别字符数据集之间的相似度匹配的已识别字符数据集，作为目标字符数据集；

模型构建模块，用于获取与所述目标字符数据集对应的预训练模型，根据所述预训练模型构建目标训练模型；所述预训练模型为经过预先训练后的用于识别所述目标字符数据集的模型；

模型生成模块，用于根据所述已识别字符数据集与所述待识别字符数据集，生成目标训练数据集；根据所述目标训练数据集，对所述目标训练模型进行训练，得到与所述待识别字符数据集对应的字符识别模型。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机可读指令，所述处理器执行所述计算机可读指令时实现以下步骤：

一种计算机可读存储介质，其上存储有计算机可读指令，所述计算机可读指令被处理器执行时实现以下步骤：

本申请的一个或多个实施例的细节在下面的附图和描述中提出。本申请的其它特征、目的和优点将从说明书、附图以及权利要求书变得明显。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1为一个或多个实施例中字符识别模型生成方法的应用环境图；

图2为一个或多个实施例中字符识别模型生成方法的流程示意图；

图3为一个或多个实施例中获取多个已识别字符数据集与待识别字符数据集之间的相似度步骤的流程示意图；

图4为一个或多个实施例中得到已识别字符数据集与待识别字符数据集之间的图片参数相似度步骤的流程示意图；

图5为一个或多个实施例中得到已识别字符数据集与待识别字符数据集之间的文本轮廓相似度步骤的流程示意图；

图6为一个或多个实施例中字符识别模型生成装置的结构框图；

图7为一个或多个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请提供的字符识别模型生成方法，可以应用于如图1所示的应用环境中。其中，终端11通过网络与服务器12进行通信。服务器12通过网络从终端11处获取待识别字符数据集，并获取多个已识别字符数据集与待识别字符数据集之间的相似度，服务器12将与待识别字符数据集之间的相似度匹配的已识别字符数据集，作为目标字符数据集；服务器12获取与目标字符数据集对应的预训练模型，服务器12根据预训练模型构建目标训练模型；预训练模型为经过预先训练后的用于识别目标字符数据集的模型；服务器12根据已识别字符数据集与待识别字符数据集，生成目标训练数据集；服务器12根据目标训练数据集，对目标训练模型进行训练，得到与待识别字符数据集对应的字符识别模型。终端11可以直接上传待识别的字符数据至服务器12，使得服务器运行训练完成后的目标训练模型对字符数据进行识别并向终端11返回识别结果；服务器12也可以将训练完成后的目标训练模型转移至终端11中，使得终端11可以直接对字符数据进行识别。

其中，终端11可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备，服务器12可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中，如图2所示，提供了一种字符识别模型生成方法，以该方法应用于图1中的服务器12为例进行说明，包括以下步骤：

步骤21，获取多个已识别字符数据集与待识别字符数据集之间的相似度，将与待识别字符数据集之间的相似度匹配的已识别字符数据集，作为目标字符数据集。

其中，已识别字符数据集是指之前已经利用该字符数据集对模型进行训练后，能够被经过预先训练的模型所识别的字符数据集；待识别字符数据集是指还未被识别，或者未应用于模型训练的字符数据集。字符数据集可以由多张包含有字符的图片组成，图片的文件格式、尺寸等不做限制。

其中，相似度是指通过预设条件判断出的已识别字符数据集与待识别字符数据集之间整体的相似程度，字符数据集的相似度有多种判断方式，也可以由多种判断方式组合加权确定；例如字符数据集中图片数量、尺寸、格式、颜色等都可以作为相似度的确定依据，同理，图片中字符的形状、轮廓、颜色等同样可以作为相似度的确定依据。

其中，相似度匹配是指已识别字符数据集与待识别字符数据集之间的相似度落在预先设置的相似度区间内，即两者的相似度达到某一预设条件即可视作相似度匹配。

其中，目标字符数据集是指与待识别字符数据集的相似度满足匹配条件的已识别字符数据集，可以是一个或多个。

具体地，服务器获取到待识别字符数据集后，对待识别字符数据集进行数据分析、处理，得到一个可以用于进行相似度判断的数值；服务器再获取至少一个之前已经用于模型训练的已识别字符数据集，利用同样的分析、处理方式，同样得到一个可以用于进行相似度判断的数值；将待识别字符数据集的数值与至少一个已识别字符数据集的数值进行比较，得到多个相似度；从多个相似度中选出至少一个相似度达到预设标准的相似度，将该相似度对应的已识别字符数据集作为目标字符数据集。

步骤22，获取与目标字符数据集对应的预训练模型，根据预训练模型构建目标训练模型；预训练模型为经过预先训练后的用于识别目标字符数据集的模型。

其中，预训练模型是预先经过目标字符数据集(已识别字符数据集)训练后的模型，该模型中的权重参数在利用目标字符数据集(已识别字符数据集)进行训练时已经调整过，能够对目标字符数据集(已识别字符数据集)中的字符数据进行识别。

具体地，服务器获取与目标字符数据集对应的预训练模型，根据该预训练模型的神经网络结构、权重参数等构建得到目标训练模型；构建过程中权重参数的大小以及神经网络结构等可以适应调整。

步骤23，根据已识别字符数据集与待识别字符数据集，生成目标训练数据集；根据目标训练数据集，对目标训练模型进行训练，得到与待识别字符数据集对应的字符识别模型。

其中，目标训练数据集是根据已识别字符数据集与待识别字符数据集生成的，例如随机从已识别字符数据集中取出字符数据，与全部待识别字符数据集以2：8的比例，组成新的字符数据集作为目标训练数据集；具体字符数据的获取方式、获取数量、组合比例等不做限制。

具体地，服务器根据已识别字符数据集与待识别字符数据集，生成目新的字符数据集作为目标训练数据集；将目标训练数据集作为目标训练模型的训练数据，对目标训练模型进行训练，当目标训练模型的损失值达到预设标准，或者目标训练模型对待识别字符数据集的识别准确率达到预设标准后，确定目标训练模型训练完成，得到与待识别字符数据集对应的字符识别模型。

举例说明，例如某公司之前为了解决a场景下字符识别的问题，获取了大量的a场景下的包含有字符数据的图片形成字符数据集A，并且利用该字符数据集A训练得到的字符识别模型A’。现在需要解决b场景下字符识别的问题，获取了大量的b场景下的包含有字符数据的图片形成字符数据集B。并且，a场景与b场景十分类似，可以直接将字符识别模型A’应用于识别字符数据集B；即字符数据集A可以作为已识别字符数据集中的一个字符数据集，字符数据集B作为待识别字符数据集；若确定字符数据集A与字符数据集B 的相似度匹配，则确认字符数据集A是目标字符数据集。可以利用字符识别模型A’构建新的字符数据模型B’，或者直接将字符识别模型A’作为字符数据模型B’进行训练；目标训练数据集可以根据字符数据集A、字符数据集B得到，也可以只利用字符数据集B；即直接利用字符数据集B训练字符识别模型A’也是可行的。

上述字符识别模型生成方法、装置、计算机设备和存储介质，方法包括：获取多个已识别字符数据集与待识别字符数据集之间的相似度，将与待识别字符数据集之间的相似度匹配的已识别字符数据集，作为目标字符数据集；获取与目标字符数据集对应的预训练模型，根据预训练模型构建目标训练模型；预训练模型为经过预先训练后的用于识别目标字符数据集的模型；根据已识别字符数据集与待识别字符数据集，生成目标训练数据集；根据目标训练数据集，对目标训练模型进行训练，得到与待识别字符数据集对应的字符识别模型。本申请通过已识别字符数据集与待识别字符数据集之间的相似度，将经过已识别字符数据集的预训练模型作为待识别字符数据集的训练模型进行训练，实现了根据字符数据集之间的相似度对模型训练进行学习迁移，从而提高了字符识别模型的生成效率。

在一个实施例中，已识别字符数据集与待识别字符数据集均携带有图片参数信息以及文本轮廓信息。如图3所示，步骤21，获取多个已识别字符数据集与待识别字符数据集之间的相似度，包括：

步骤31，根据已识别字符数据集携带的图片参数信息，以及待识别字符数据集携带的图片参数信息，得到已识别字符数据集与待识别字符数据集之间的图片参数相似度；

步骤32，根据已识别字符数据集携带的文本轮廓信息，以及待识别字符数据集携带的文本轮廓信息，得到已识别字符数据集与待识别字符数据集之间的文本轮廓相似度；

步骤33，将图片参数相似度与文本轮廓相似度进行加权处理，根据加权处理的结果确定已识别字符数据集与待识别字符数据集之间的相似度。

其中，图片参数信息可以包括字符数据集中图片的数量、尺寸、文件格式、像素、颜色等；文本轮廓信息包括文本轮廓、几何凸包等。

其中，图片参数相似度是指已识别字符数据集与待识别字符数据集之间图片参数信息的相似程度；例如已识别字符数据集中5张图片的尺寸都是10×10，待识别字符数据集中6张图片的尺寸都是10×10；若只考虑尺寸作为相似度判断条件，则两字符数据集的图片参数相似度可以为100％。

其中，文本轮廓相似度是指已识别字符数据集与待识别字符数据集之间文本轮廓信息的相似程度；例如已识别字符数据集中5张图片中包含字符区域的形状的尺寸为a，待识别字符数据集中6张图片中包含字符区域的形状的尺寸为a的尺寸都是10×10；若只考虑尺寸作为相似度判断条件，则两字符数据集的图片参数相似度可以为100％。

具体地，若图片参数相似度为c，文本轮廓相似度为d，服务器可以设置图片参数相似度的权重为0.6，文本轮廓相似度的权重为0.4，则加权处理后的相似度可以是0.6c+0.4d。

本实施例中，通过分别计算图片参数相似度与文本轮廓相似度，能够达到准确计算已识别字符数据集与待识别字符数据集之间的相似度的效果，提高了字符识别模型的生成效率。

在一个实施例中，如图4所示，步骤31，根据已识别字符数据集携带的图片参数信息，以及待识别字符数据集携带的图片参数信息，得到已识别字符数据集与待识别字符数据集之间的图片参数相似度，包括：

步骤41，获取已识别字符数据集与待识别字符数据集中，所有图像的色彩通道均值以及宽高均值；

步骤42，根据色彩通道均值和宽高均值，确定已识别字符数据集与待识别字符数据集的色彩通道均值的余弦距离，以及已识别字符数据集与待识别字符数据集的宽高均值的余弦距离；

步骤43，将色彩通道均值的余弦距离与宽高均值的余弦距离之和，作为图片参数相似度。

具体地，服务器获取两个字符数据集中图像像素点的RGB均值作为色彩通道均值；RGB均值包括图像中所有像素点在各颜色通道的色值平均值。服务器获取两个字符数据集中图像的宽度高度均值作为宽高均值。

图片参数相似度通过以下方式获取：

Ai＝cos(rgb[P],rgb[Qi])+cos(hw[P],hw[Qi])；

其中，P为待识别字符数据集，Qi为已识别字符数据集，Ai为色彩通道均值的余弦距离与宽高均值的余弦距离之和；rgb[P]为待识别字符数据集的色彩通道均值，rgb[Qi]为已识别字符数据集的色彩通道均值；hw[P]为待识别字符数据集的宽高均值，hw[Qi]为已识别字符数据集的宽高均值，cos为余弦距离计算符号。

本实施例中，通过分别计算色彩通道均值和宽高均值，得到已识别字符数据集与待识别字符数据集之间的图片参数相似度，能够达到准确计算已识别字符数据集与待识别字符数据集之间的相似度的效果，提高了字符识别模型的生成效率。

在一个实施例中，如图5所示，步骤32，根据已识别字符数据集携带的文本轮廓信息，以及待识别字符数据集携带的文本轮廓信息，得到已识别字符数据集与待识别字符数据集之间的文本轮廓相似度，包括：

步骤51，识别已识别字符数据集与待识别字符数据集中，文本信息对应的轮廓特征信息；

步骤52，根据轮廓特征信息确定出已识别字符数据集与待识别字符数据集中，文本信息的凸包信息；

步骤53，根据凸包信息，确定出已识别字符数据集与待识别字符数据集中，文本信息的凸包面积以及文本信息的凸包重叠面积；

步骤54，根据文本信息的凸包面积以及文本信息的凸包重叠面积，得到已识别字符数据集与待识别字符数据集的文本轮廓相似度。

具体地，服务器可以采用轮廓匹配算法查找感兴趣区域中与文本信息作为轮廓特征信息；轮廓匹配算法可以将已识别字符数据集与待识别字符数据集中的图像划分为多个通道，以查找文本信息边缘并转化为轮廓特征，并进行轮廓匹配；其中，轮廓匹配方法可以包括凸包等，具体不做限定。

例如，轮廓特征信息包括检测出的文本轮廓；当采用凸包进行计算时，可以首先对已识别字符数据集与待识别字符数据集中每个文本轮廓分别进行平移，使得每个文本轮廓中的外接矩形的左上角和预设坐标系原点重合。将平移后的文本轮廓绘制在同一平面上，使用opencv库中的凸包检测算法找到这些文本轮廓的最小几何凸包，记为convexhull[P](待识别字符数据集P中文本轮廓的最小几何凸包)。使用同样的方法，得到已识别字符数据集中所有文本的几何凸包，记为convexhull[Qi](已识别字符数据集Qi中文本轮廓的最小几何凸包)。

文本轮廓相似度定义为这两个文本几何凸包的交并比：

Bi＝S[inter]/(S[convexhull[P]]+S[convexhull[Qi]]–S[inter])。

其中，Bi为已识别字符数据集与待识别字符数据集的文本轮廓相似度；S[convexhull[P]]和S[convexhull[Qi]]分别为待识别字符数据集与已识别字符数据集中，文本凸包的面积，包含于凸包信息中；S[inter]为待识别字符数据集与已识别字符数据集中文本凸包交叠区域的面积，即凸包重叠面积。

在一个实施例中，将与待识别字符数据集之间的相似度匹配的已识别字符数据集，作为目标字符数据集，包括：从多个已识别字符数据集的相似度中筛选出至少一个相似度大于或等于预设相似度阈值的已识别字符数据集；将筛选后得到的至少一个已识别字符数据集的相似度中，相似度最高的已识别字符数据集，识别为目标字符数据集。

具体地，服务器可以设置预设相似度阈值作为判断相似度是否匹配的标准；例如设置预设相似度阈值为85，则计算出的相似度大于或等于85的可以已识别字符数据集可以作为目标字符数据集。预设相似度阈值还可以设置为一个范围，例如85，±5的相似度都可以视作匹配，即相似度范围落在80-90及90以上的相似度应的已识别字符数据集可作为目标字符数据集。

本实施例中，通过设置预设相似度阈值作为目标字符数据集的识别依据，提高了字符识别模型的生成效率。

在一个实施例中，根据预训练模型构建目标训练模型，包括：获取预训练模型的模型参数；将模型参数应用于预先构建的神经网络模型，得到目标训练模型。

具体地，服务器获取预训练模型的模型参数，将该模型参数设置在预先构建的神经网络模型中，作为目标训练模型。

本实施例中，通过将模型参数应用于预先构建的神经网络模型，使得应用了模型参数的预先构建的神经网络模型能够在具备一定识别能力的基础上进行训练，提高了字符识别模型的生成效率。

在一个实施例中，根据目标训练数据集，对目标训练模型进行训练之前，还包括：对目标训练数据集中的图像进行伽马变换处理以及直方图均衡处理；对经过伽马变换处理以及直方图均衡处理的图像进行图像尺寸统一处理；将尺寸统一处理后的图像输入目标训练模型中进行训练。

具体地，伽马变换处理就是通过非线性变换，让目标训练数据集中图像较暗的区域的灰度值得到增强，图像中灰度值过大的区域的灰度值得到降低；经过伽马变换处理，增强了图像整体的细节表现。直方图均衡处理能够增加图像的全局对比度，尤其是当目标训练数据集中图像的有用数据的对比度接近的时候；经过直方图均衡处理后，亮度可以更好地在直方图上分布。尺寸统一处理能够将目标训练数据集中不同大小的图像，统一为同样大小的图像，提高图像的处理效率。

本实施例中，通过对目标训练数据集中的图像进行图像处理，提高了字符识别模型的生成效率。

应该理解的是，虽然图2-5的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图2-5中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图6所示，提供了一种字符识别模型生成装置，包括相似度获取模块61、模型构建模块62以及模型生成模块63，其中：

相似度获取模块61，用于获取多个已识别字符数据集与待识别字符数据集之间的相似度，将与待识别字符数据集之间的相似度匹配的已识别字符数据集，作为目标字符数据集；

模型构建模块62，用于获取与目标字符数据集对应的预训练模型，根据预训练模型构建目标训练模型；预训练模型为经过预先训练后的用于识别目标字符数据集的模型；

模型生成模块63，用于根据已识别字符数据集与待识别字符数据集，生成目标训练数据集；根据目标训练数据集，对目标训练模型进行训练，得到与待识别字符数据集对应的字符识别模型。

在一个实施例中，已识别字符数据集与待识别字符数据集均携带有图片参数信息以及文本轮廓信息；

相似度获取模块61，还用于根据已识别字符数据集携带的图片参数信息，以及待识别字符数据集携带的图片参数信息，得到已识别字符数据集与待识别字符数据集之间的图片参数相似度；根据已识别字符数据集携带的文本轮廓信息，以及待识别字符数据集携带的文本轮廓信息，得到已识别字符数据集与待识别字符数据集之间的文本轮廓相似度；将图片参数相似度与文本轮廓相似度进行加权处理，根据加权处理的结果确定已识别字符数据集与待识别字符数据集之间的相似度。

在一个实施例中，相似度获取模块61，还用于获取已识别字符数据集与待识别字符数据集中，所有图像的色彩通道均值以及宽高均值；根据色彩通道均值和宽高均值，确定已识别字符数据集与待识别字符数据集的色彩通道均值的余弦距离，以及已识别字符数据集与待识别字符数据集的宽高均值的余弦距离；将色彩通道均值的余弦距离与宽高均值的余弦距离之和，作为图片参数相似度。

在一个实施例中，相似度获取模块61，还用于识别已识别字符数据集与待识别字符数据集中，文本信息对应的轮廓特征信息；根据轮廓特征信息确定出已识别字符数据集与待识别字符数据集中，文本信息的凸包信息；根据凸包信息，确定出已识别字符数据集与待识别字符数据集中，文本信息的凸包面积以及文本信息的凸包重叠面积；根据文本信息的凸包面积以及文本信息的凸包重叠面积，得到已识别字符数据集与待识别字符数据集的文本轮廓相似度。

在一个实施例中，相似度获取模块61，还用于从多个已识别字符数据集的相似度中筛选出至少一个相似度大于或等于预设相似度阈值的已识别字符数据集；将筛选后得到的至少一个已识别字符数据集的相似度中，相似度最高的已识别字符数据集，识别为目标字符数据集。

在一个实施例中，模型构建模块62，还用于获取预训练模型的模型参数；将模型参数应用于预先构建的神经网络模型，得到目标训练模型。

在一个实施例中，模型生成模块63，还用于对目标训练数据集中的图像进行伽马变换处理以及直方图均衡处理；对经过伽马变换处理以及直方图均衡处理的图像进行图像尺寸统一处理；将尺寸统一处理后的图像输入目标训练模型中进行训练。

关于字符识别模型生成装置的具体限定可以参见上文中对于字符识别模型生成方法的限定，在此不再赘述。上述字符识别模型生成装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图7所示。该计算机设备包括通过***总线连接的处理器、存储器和网络接口。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机可读指令和数据库。该内存储器为非易失性存储介质中的操作***和计算机可读指令的运行提供环境。该计算机设备的数据库用于存储字符识别模型生成数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机可读指令被处理器执行时以实现一种字符识别模型生成法。

本领域技术人员可以理解，图7中示出的结构，是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机可读指令，该处理器执行计算机可读指令时实现以下步骤：

获取多个已识别字符数据集与待识别字符数据集之间的相似度，将与待识别字符数据集之间的相似度匹配的已识别字符数据集，作为目标字符数据集；

获取与目标字符数据集对应的预训练模型，根据预训练模型构建目标训练模型；预训练模型为经过预先训练后的用于识别目标字符数据集的模型；

根据已识别字符数据集与待识别字符数据集，生成目标训练数据集；根据目标训练数据集，对目标训练模型进行训练，得到与待识别字符数据集对应的字符识别模型。

在一个实施例中，已识别字符数据集与待识别字符数据集均携带有图片参数信息以及文本轮廓信息；处理器执行计算机可读指令时还实现以下步骤：根据已识别字符数据集携带的图片参数信息，以及待识别字符数据集携带的图片参数信息，得到已识别字符数据集与待识别字符数据集之间的图片参数相似度；根据已识别字符数据集携带的文本轮廓信息，以及待识别字符数据集携带的文本轮廓信息，得到已识别字符数据集与待识别字符数据集之间的文本轮廓相似度；将图片参数相似度与文本轮廓相似度进行加权处理，根据加权处理的结果确定已识别字符数据集与待识别字符数据集之间的相似度。

在一个实施例中，处理器执行计算机可读指令时还实现以下步骤：获取已识别字符数据集与待识别字符数据集中，所有图像的色彩通道均值以及宽高均值；根据色彩通道均值和宽高均值，确定已识别字符数据集与待识别字符数据集的色彩通道均值的余弦距离，以及已识别字符数据集与待识别字符数据集的宽高均值的余弦距离；将色彩通道均值的余弦距离与宽高均值的余弦距离之和，作为图片参数相似度。

在一个实施例中，处理器执行计算机可读指令时还实现以下步骤：识别已识别字符数据集与待识别字符数据集中，文本信息对应的轮廓特征信息；根据轮廓特征信息确定出已识别字符数据集与待识别字符数据集中，文本信息的凸包信息；根据凸包信息，确定出已识别字符数据集与待识别字符数据集中，文本信息的凸包面积以及文本信息的凸包重叠面积；根据文本信息的凸包面积以及文本信息的凸包重叠面积，得到已识别字符数据集与待识别字符数据集的文本轮廓相似度。

在一个实施例中，处理器执行计算机可读指令时还实现以下步骤：从多个已识别字符数据集的相似度中筛选出至少一个相似度大于或等于预设相似度阈值的已识别字符数据集；将筛选后得到的至少一个已识别字符数据集的相似度中，相似度最高的已识别字符数据集，识别为目标字符数据集。

在一个实施例中，处理器执行计算机可读指令时还实现以下步骤：获取预训练模型的模型参数；将模型参数应用于预先构建的神经网络模型，得到目标训练模型。

在一个实施例中，处理器执行计算机可读指令时还实现以下步骤：对目标训练数据集中的图像进行伽马变换处理以及直方图均衡处理；对经过伽马变换处理以及直方图均衡处理的图像进行图像尺寸统一处理；将尺寸统一处理后的图像输入目标训练模型中进行训练。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机可读指令，计算机可读指令被处理器执行时实现以下步骤：

在一个实施例中，已识别字符数据集与待识别字符数据集均携带有图片参数信息以及文本轮廓信息；计算机可读指令被处理器执行时还实现以下步骤：根据已识别字符数据集携带的图片参数信息，以及待识别字符数据集携带的图片参数信息，得到已识别字符数据集与待识别字符数据集之间的图片参数相似度；根据已识别字符数据集携带的文本轮廓信息，以及待识别字符数据集携带的文本轮廓信息，得到已识别字符数据集与待识别字符数据集之间的文本轮廓相似度；将图片参数相似度与文本轮廓相似度进行加权处理，根据加权处理的结果确定已识别字符数据集与待识别字符数据集之间的相似度。

在一个实施例中，计算机可读指令被处理器执行时还实现以下步骤：获取已识别字符数据集与待识别字符数据集中，所有图像的色彩通道均值以及宽高均值；根据色彩通道均值和宽高均值，确定已识别字符数据集与待识别字符数据集的色彩通道均值的余弦距离，以及已识别字符数据集与待识别字符数据集的宽高均值的余弦距离；将色彩通道均值的余弦距离与宽高均值的余弦距离之和，作为图片参数相似度。

在一个实施例中，计算机可读指令被处理器执行时还实现以下步骤：识别已识别字符数据集与待识别字符数据集中，文本信息对应的轮廓特征信息；根据轮廓特征信息确定出已识别字符数据集与待识别字符数据集中，文本信息的凸包信息；根据凸包信息，确定出已识别字符数据集与待识别字符数据集中，文本信息的凸包面积以及文本信息的凸包重叠面积；根据文本信息的凸包面积以及文本信息的凸包重叠面积，得到已识别字符数据集与待识别字符数据集的文本轮廓相似度。

在一个实施例中，计算机可读指令被处理器执行时还实现以下步骤：从多个已识别字符数据集的相似度中筛选出至少一个相似度大于或等于预设相似度阈值的已识别字符数据集；将筛选后得到的至少一个已识别字符数据集的相似度中，相似度最高的已识别字符数据集，识别为目标字符数据集。

在一个实施例中，计算机可读指令被处理器执行时还实现以下步骤：获取预训练模型的模型参数；将模型参数应用于预先构建的神经网络模型，得到目标训练模型。

在一个实施例中，计算机可读指令被处理器执行时还实现以下步骤：对目标训练数据集中的图像进行伽马变换处理以及直方图均衡处理；对经过伽马变换处理以及直方图均衡处理的图像进行图像尺寸统一处理；将尺寸统一处理后的图像输入目标训练模型中进行训练。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机可读指令来指令相关的硬件来完成，上述的计算机可读指令可存储于一非易失性计算机可读取存储介质中，该计算机可读指令在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory，ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory，RAM)或外部高速缓冲存储器。作为说明而非局限，RAM可以是多种形式，比如静态随机存取存储器(Static Random Access Memory，SRAM)或动态随机存取存储器(Dynamic Random Access Memory，DRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上各个实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本申请范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

一种字符识别模型生成方法，包括：

获取多个已识别字符数据集与待识别字符数据集之间的相似度，将与所述待识别字符数据集之间的相似度匹配的已识别字符数据集，作为目标字符数据集；

获取与所述目标字符数据集对应的预训练模型，根据所述预训练模型构建目标训练模型；所述预训练模型为经过预先训练后的用于识别所述目标字符数据集的模型；

根据所述已识别字符数据集与所述待识别字符数据集，生成目标训练数据集；根据所述目标训练数据集，对所述目标训练模型进行训练，得到与所述待识别字符数据集对应的字符识别模型。
根据权利要求1所述的方法，其特征在于，所述已识别字符数据集与待识别字符数据集均携带有图片参数信息以及文本轮廓信息；

所述获取多个已识别字符数据集与待识别字符数据集之间的相似度，包括：

根据所述已识别字符数据集携带的图片参数信息，以及所述待识别字符数据集携带的图片参数信息，得到所述已识别字符数据集与所述待识别字符数据集之间的图片参数相似度；

根据所述已识别字符数据集携带的文本轮廓信息，以及所述待识别字符数据集携带的文本轮廓信息，得到所述已识别字符数据集与所述待识别字符数据集之间的文本轮廓相似度；

将所述图片参数相似度与所述文本轮廓相似度进行加权处理，根据加权处理的结果确定所述已识别字符数据集与所述待识别字符数据集之间的相似度。
根据权利要求2所述的方法，其特征在于，所述根据所述已识别字符数据集携带的图片参数信息，以及所述待识别字符数据集携带的图片参数信息，得到所述已识别字符数据集与所述待识别字符数据集之间的图片参数相似度，包括：

获取所述已识别字符数据集与待识别字符数据集中，所有图像的色彩通道均值以及宽高均值；

根据所述色彩通道均值和所述宽高均值，确定所述已识别字符数据集与待识别字符数据集的色彩通道均值的余弦距离，以及所述已识别字符数据集与待识别字符数据集的宽高均值的余弦距离；

将所述色彩通道均值的余弦距离与所述宽高均值的余弦距离之和，作为所述图片参数相似度。
根据权利要求2所述的方法，其特征在于，所述根据所述已识别字符数据集携带的文本轮廓信息，以及所述待识别字符数据集携带的文本轮廓信息，得到所述已识别字符数据集与所述待识别字符数据集之间的文本轮廓相似度，包括：

识别所述已识别字符数据集与所述待识别字符数据集中，文本信息对应的轮廓特征信息；

根据所述轮廓特征信息确定出所述已识别字符数据集与所述待识别字符数据集中，文本信息的凸包信息；

根据所述凸包信息，确定出所述已识别字符数据集与所述待识别字符数据集中，文本信息的凸包面积以及文本信息的凸包重叠面积；

根据所述文本信息的凸包面积以及文本信息的凸包重叠面积，得到所述已识别字符数据集与所述待识别字符数据集的文本轮廓相似度。
根据权利要求1所述的方法，其特征在于，所述将与所述待识别字符数据集之间的相似度匹配的已识别字符数据集，作为目标字符数据集，包括：

从多个已识别字符数据集的相似度中筛选出至少一个相似度大于或等于预设相似度阈值的已识别字符数据集；

将筛选后得到的至少一个已识别字符数据集的相似度中，相似度最高的已识别字符数据集，识别为所述目标字符数据集。
根据权利要求1至5任意一项所述的方法，其特征在于，根据所述预训练模型构建目标训练模型，包括：

获取所述预训练模型的模型参数；

将所述模型参数应用于预先构建的神经网络模型，得到所述目标训练模型。
根据权利要求1至5任意一项所述的方法，其特征在于，在根据所述目标训练数据集，对所述目标训练模型进行训练之前，还包括：

对所述目标训练数据集中的图像进行伽马变换处理以及直方图均衡处理；

对经过所述伽马变换处理以及直方图均衡处理的图像进行图像尺寸统一处理；

将尺寸统一处理后的图像输入所述目标训练模型中进行训练。
一种字符识别模型生成装置，所述装置包括：

相似度获取模块，用于获取多个已识别字符数据集与待识别字符数据集之间的相似度，将与所述待识别字符数据集之间的相似度匹配的已识别字符数据集，作为目标字符数据集；

模型构建模块，用于获取与所述目标字符数据集对应的预训练模型，根据所述预训练模型构建目标训练模型；所述预训练模型为经过预先训练后的用于识别所述目标字符数据集的模型；

模型生成模块，用于根据所述已识别字符数据集与所述待识别字符数据集，生成目标训练数据集；根据所述目标训练数据集，对所述目标训练模型进行训练，得到与所述待识别字符数据集对应的字符识别模型。
根据权利要求8所述的装置，其特征在于，所述已识别字符数据集与待识别字符数据集均携带有图片参数信息以及文本轮廓信息；

所述相似度获取模块，还用于根据所述已识别字符数据集携带的图片参数信息，以及所述待识别字符数据集携带的图片参数信息，得到所述已识别字符数据集与所述待识别字符数据集之间的图片参数相似度；根据所述已识别字符数据集携带的文本轮廓信息，以及所述待识别字符数据集携带的文本轮廓信息，得到所述已识别字符数据集与所述待识别字符数据集之间的文本轮廓相似度；将所述图片参数相似度与所述文本轮廓相似度进行加权处理，根据加权处理的结果确定所述已识别字符数据集与所述待识别字符数据集之间的相似度。
根据权利要求9所述的装置，其特征在于，

所述相似度获取模块，还用于获取所述已识别字符数据集与待识别字符数据集中，所有图像的色彩通道均值以及宽高均值；根据所述色彩通道均值和所述宽高均值，确定所述已识别字符数据集与待识别字符数据集的色彩通道均值的余弦距离，以及所述已识别字符数据集与待识别字符数据集的宽高均值的余弦距离；将所述色彩通道均值的余弦距离与所述宽高均值的余弦距离之和，作为所述图片参数相似度。
根据权利要求9所述的装置，其特征在于，

所述相似度获取模块，还用于识别所述已识别字符数据集与所述待识别字符数据集中，文本信息对应的轮廓特征信息；根据所述轮廓特征信息确定出所述已识别字符数据集与所述待识别字符数据集中，文本信息的凸包信息；根据所述凸包信息，确定出所述已识别字符数据集与所述待识别字符数据集中，文本信息的凸包面积以及文本信息的凸包重叠面积；根据所述文本信息的凸包面积以及文本信息的凸包重叠面积，得到所述已识别字符数据集与所述待识别字符数据集的文本轮廓相似度。
根据权利要求8所述的装置，其特征在于，

所述相似度获取模块，还用于从多个已识别字符数据集的相似度中筛选出至少一个相似度大于或等于预设相似度阈值的已识别字符数据集；将筛选后得到的至少一个已识别字符数据集的相似度中，相似度最高的已识别字符数据集，识别为所述目标字符数据集。
根据权利要求8至12任意一项所述的装置，其特征在于，

所述模型构建模块，还用于获取所述预训练模型的模型参数；将所述模型参数应用于预先构建的神经网络模型，得到所述目标训练模型。
根据权利要求8至12任意一项所述的装置，其特征在于，

所述模型生成模块，还用于对所述目标训练数据集中的图像进行伽马变换处理以及直方图均衡处理；对经过所述伽马变换处理以及直方图均衡处理的图像进行图像尺寸统一处理；将尺寸统一处理后的图像输入所述目标训练模型中进行训练。
一种计算机设备，包括存储器和处理器，所述存储器存储有计算机可读指令，其特征在于，所述处理器执行所述计算机可读指令时实现权利要求1至7中任一项所述的方法的步骤。
一种计算机可读存储介质，其上存储有计算机可读指令，其特征在于，所述计算机可读指令被处理器执行时实现权利1至7中任一项所述的方法的步骤。