CN113902018A

CN113902018A - 图像样本生成方法、装置、计算机可读介质及电子设备

Info

Publication number: CN113902018A
Application number: CN202111187073.2A
Authority: CN
Inventors: 成武超
Original assignee: OneConnect Financial Technology Co Ltd Shanghai
Current assignee: OneConnect Smart Technology Co Ltd; OneConnect Financial Technology Co Ltd Shanghai
Priority date: 2021-10-12
Filing date: 2021-10-12
Publication date: 2022-01-07

Abstract

本申请属于人工智能技术领域，具体涉及一种图像样本生成方法、装置、计算机可读介质以及电子设备，在本申请实施例提供的技术方案中，本申请通过获取图像样本库文件，并提取样本库文件中的图像样本的样本编码值，然后基于样本编码值利用离屏canvas算法提取图像，然后再将该图像通过图像数据获取算法转化成图形特征，利用该方法可以提高图像样本的采集效率，而且，本申请采集到图像样本之后，对图像样本进行裁剪和缩放，以适应卷积训练的进行，提高了图像识别的准确性和样本卷积训练的效率，有利于图像识别技术的发展。

Description

图像样本生成方法、装置、计算机可读介质及电子设备

技术领域

本申请属于人工智能技术领域，具体涉及一种图像样本生成方法、图像样本生成装置、计算机可读介质以及电子设备。

背景技术

随着人工智能的不断发展，图像识别技术发展迅速，其中，图像识别方法需要用到卷积神经网络，卷积神经网络是通过采集大量样本进行卷积训练形成模型，然后基于训练的模型来进行图像识别。

然而，现有的图像样本的生成存在以下几个问题。第一，现有的图像样本的采集过程十分繁琐，需要去网页上进行截图或去图片库中进行下载，采集效率低；第二，现有的图像样本不进行处理导入到卷积模型进行训练，导致卷积训练无法适应拉伸变形的图像样本，从而降低了图像识别的准确性，而且还会导致卷积训练的计算量增大，降低了训练的效率，不利于图像识别技术的发展。

需要说明的是，在上述背景技术部分公开的信息仅用于加强对本申请的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

发明内容

本申请的目的在于提供一种图像样本生成方法、图像样本生成装置、计算机可读介质以及电子设备，至少在一定程度上克服相关技术中样本采集效率低、样本进行训练时准确性低等技术问题。

本申请的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本申请的实践而习得。

根据本申请实施例的一个方面，提供一种图像样本生成方法，所述方法包括：

获取图像样本库文件，所述图像样本库文件包括图像样本的样本编码值集合，所述样本编码值包括用于表示所述图像样本的十六进制文件；

提取所述图像样本的样本编码值，基于所述样本编码值，利用离屏canvas算法对与所述样本编码值对应的图像样本进行渲染，得到第一样本特征；

利用图像数据获取算法将所述第一样本特征转化成图形特征，并对所述图形特征进行裁剪和缩放，得到第二样本特征，所述图像数据获取算法用于获取所述第一样本特征的像素数据；

将所述第二样本特征通过编码算法进行编码之后输出，得到卷积图像样本。

在本申请的一些实施例中，基于以上技术方案，对所述图形特征进行裁剪和缩放，得到第二样本特征的方法包括：

遍历所述图形特征的像素，获取所述图形特征的最小非空白矩形区域，将所述最小非空白矩形区域扩展为非空白正方形区域；

根据所述非空白正方形区域对所述图形特征进行裁剪并缩放，得到第二样本特征。

在本申请的一些实施例中，基于以上技术方案，基于所述样本编码值，利用离屏canvas算法对与所述样本编码值对应的图像样本进行渲染，得到第一样本特征，包括：

利用离屏canvas算法调用图像样本映射表，从所述图像样本映射表中获取与所述样本编码值获取对应的图像样本符号信息；

利用离屏canvas算法将所述图像样本符号信息绘制到画布上，得到第一样本特征。

在本申请的一些实施例中，基于以上技术方案，在获取图像样本库文件之前，所述方法还包括构建图像样本库文件，其中，构建图像样本库文件的方法包括：

建立图像样本像素信息、图像样本符号信息和图像样本的样本编码值的映射关系，形成图像样本映射表；

将所述图像样本的样本编码值与所述图像样本的名称进行绑定形成键值对；

将所述键值对保存到数组，形成图像样本库文件。

在本申请的一些实施例中，基于以上技术方案，在将所述第二样本特征通过编码算法进行编码之后输出，得到卷积图像样本之后，所述方法还包括：

遍历所述图像样本库文件中的图像样本，将所述图像样本转化成卷积图像样本；

将所述卷积图像样本进行汇聚，得到卷积图像样本集；

将所述卷积图像样本集转换成json格式文件。

在本申请的一些实施例中，基于以上技术方案，在将所述卷积图像样本集转换成json格式文件之后，所述方法还包括：

利用打散算法将所述json格式文件打散，形成随机样本集；

挑选所述随机样本集，将所述随机样本集中百分之七十的图像样本作为训练样本，所述随机样本集中百分之二十的图像样本作为验证样本，所述随机样本集中百分之十的图像样本作为测试样本；

以所述训练样本作为输入样本，以对应于所述训练样本的样本标签作为输出样本，对预设的卷积神经网络模型进行训练，得到图像识别模型，将所述验证样本和所述测试样本输入到所述图像识别模型中，根据所述验证样本和所述测试样本的已知样本标签和图像识别模型输出的预测样本标签对所述图像识别模型的系数进行调整，使所述图像识别模型输出的预测样本标签与所述验证样本和所述测试样本的已知样本标签一致。

根据本申请实施例的一个方面，提供一种图像识别方法，所述方法包括：

获取待识别的图像样本；

将所述待识别的图像样本进行裁剪和缩放，得到待识别样本特征；

将所述待识别样本特征输入到如上所述的图像识别模型中进行识别，得到所述待识别的图像样本的标签。

根据本申请实施例的一个方面，提供一种图像样本生成装置，包括：

获取模块，被配置为获取图像样本库文件，所述图像样本库文件包括图像样本的样本编码值集合，所述样本编码值包括用于表示所述图像样本的十六进制文件；

特征提取模块，被配置为提取所述图像样本的样本编码值，基于所述样本编码值，利用离屏canvas算法对与所述样本编码值对应的图像样本进行渲染，得到第一样本特征；

特征处理模块，被配置为利用图像数据获取算法将所述第一样本特征转化成图形特征，并对所述图形特征进行裁剪和缩放，得到第二样本特征，所述图像数据获取算法用于获取所述第一样本特征的像素数据；

输出模块，被配置为将所述第二样本特征通过编码算法进行编码之后输出，得到卷积图像样本。

在本申请的一些实施例中，基于以上技术方案，所述特征处理模块包括：

区域获取单元，被配置为遍历所述图形特征的像素，获取所述图形特征的最小非空白矩形区域，

扩展单元，被配置为将所述最小非空白矩形区域扩展为非空白正方形区域；

裁剪缩放单元，被配置为根据所述非空白正方形区域对所述图形特征进行裁剪并缩放，得到第二样本特征。

在本申请的一些实施例中，基于以上技术方案，所述特征提取模块包括：

符号获取单元，被配置为利用离屏canvas算法调用图像样本映射表，从所述图像样本映射表中获取与所述样本编码值获取对应的图像样本符号信息；

绘制单元，被配置为利用离屏canvas算法将所述图像样本符号信息绘制到画布上，得到第一样本特征。

在本申请的一些实施例中，基于以上技术方案，所述图像样本生成装置还包括样本库构建单元，所述样本库构建单元包括：

样本映射单元，被配置为建立图像样本像素信息、图像样本符号信息和图像样本的样本编码值的映射关系，形成图像样本映射表；

绑定单元，别配置为将所述图像样本的样本编码值与所述图像样本的名称进行绑定形成键值对；

保存单元，被配置为将所述键值对保存到数组，形成图像样本库文件。

在本申请的一些实施例中，基于以上技术方案，所述图像样本生成装置还包括样本处理模块，所述样本处理模块包括：

遍历单元，被配置为遍历所述图像样本库文件中的图像样本，将所述图像样本转化成卷积图像样本；

汇聚单元，被配置为将所述卷积图像样本进行汇聚，得到卷积图像样本集；

格式转换单元，被配置为将所述卷积图像样本集转换成json格式文件。

在本申请的一些实施例中，基于以上技术方案，所述样本处理模块还包括：

打散单元，被配置为利用打散算法将所述json格式文件打散，形成随机样本集；

样本挑选单元，被配置为挑选所述随机样本集，将所述随机样本集中百分之七十的图像样本作为训练样本，所述随机样本集中百分之二十的图像样本作为验证样本，所述随机样本集中百分之十的图像样本作为测试样本；

模型训练单元，被配置为以所述训练样本作为输入样本，以对应于所述训练样本的样本标签作为输出样本，对预设的卷积神经网络模型进行训练，得到图像识别模型，将所述验证样本和所述测试样本输入到所述图像识别模型中，根据所述验证样本和所述测试样本的已知样本标签和图像识别模型输出的预测样本标签对所述图像识别模型的系数进行调整，使所述图像识别模型输出的预测样本标签与所述验证样本和所述测试样本的已知样本标签一致。

根据本申请实施例的一个方面，提供一种图像识别装置，包括：

样本获取模块，被配置为获取待识别的图像样本；

样本特征提取模块，被配置为将所述待识别的图像样本进行裁剪和缩放，得到待识别样本特征；

识别模块，别配置为将所述待识别样本特征输入到如上所述的图像识别模型中进行识别，得到所述待识别的图像样本的标签。

根据本申请实施例的一个方面，提供一种计算机可读介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如以上技术方案中的图像样本生成方法。

根据本申请实施例的一个方面，提供一种电子设备，该电子设备包括：处理器；以及存储器，用于存储所述处理器的可执行指令；其中，所述处理器被配置为经由执行所述可执行指令来执行如以上技术方案中的图像样本生成方法。

根据本申请实施例的一个方面，提供一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行如以上技术方案中的图像样本生成方法。

在本申请实施例提供的技术方案中，本申请的有益效果包括：第一，本申请通过获取图像样本库文件，并提取样本库文件中的图像样本的样本编码值，然后基于样本编码值，利用离屏canvas算法提取图像，然后再将该图像通过图像数据获取算法转化成图形特征，利用该方法进行图像样本的采集，可以直接通过网页的图像样本库文件自动采集图片，而无需对图片截图和下载，图像样本的采集效率高；第二，本申请采集到图像样本之后，对图像样本进行裁剪和缩放，以适应卷积训练的进行，避免拉伸变形的图像样本进行卷积训练无法识别的问题，提高了图像识别的准确性；第三，本申请的图像样本通过编码算法进行编码之后输出，可以有效的降低图像样本的文件大小，减小了卷积训练的计算量，提高了训练的效率，有利于图像识别技术的发展。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本申请。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本申请的实施例，并与说明书一起用于解释本申请的原理。显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1示意性地示出了应用本申请技术方案的示例性***架构框图。

图2示意性地示出了本申请图像样本生成方法的流程图。

图3示意性地示出了本申请构建图像样本库文件方法的流程图。

图4示意性的示出了本申请一张箭头图像样本映射表。

图5示意性地示出了本申请获得第一样本特征方法的流程图。

图6示意性地示出了本申请获得图形特征的方法流程图。

图7示意性地示出了本申请获得第二样本特征的方法流程图。

图8示意性地示出了本申请对卷积图像样本做进一步处理的方法流程图。

图9示意性地示出了本申请图像识别模型的训练方法流程图。

图10示意性地示出了本申请图像识别方法的流程图。

图11示意性地示出了本申请实施例提供的图像样本生成装置的结构框图。

图12示意性地示出了本申请实施例提供的图像识别装置的结构框图。

图13示意性示出了适于用来实现本申请实施例的电子设备的计算机***结构框图。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而，示例实施方式能够以多种形式实施，且不应被理解为限于在此阐述的范例；相反，提供这些实施方式使得本申请将更加全面和完整，并将示例实施方式的构思全面地传达给本领域的技术人员。

此外，所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中，提供许多具体细节从而给出对本申请的实施例的充分理解。然而，本领域技术人员将意识到，可以实践本申请的技术方案而没有特定细节中的一个或更多，或者可以采用其它的方法、组元、装置、步骤等。在其它情况下，不详细示出或描述公知方法、装置、实现或者操作以避免模糊本申请的各方面。

附图中所示的方框图仅仅是功能实体，不一定必须与物理上独立的实体相对应。即，可以采用软件形式来实现这些功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

附图中所示的流程图仅是示例性说明，不是必须包括所有的内容和操作/步骤，也不是必须按所描述的顺序执行。例如，有的操作/步骤还可以分解，而有的操作/步骤可以合并或部分合并，因此实际执行的顺序有可能根据实际情况改变。

本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中，人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。

人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互***、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

图像识别技术是人工智能的一个重要领域。它是指对图像进行对象识别，以识别各种不同模式的目标和对像的技术。图像识别技术可以使用卷积神经网络来进行训练，卷积神经网络(Convolutional Neural Networks,CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(Feedforward Neural Networks)，最常用于分析视觉图像。

在图像识别技术中，图像样本是图像识别技术精确与否的重要依据，如果没有足够数量的图像样本，或者图像样本本身有瑕疵都将会导致图像识别的准确性降低。而目前对于图像样本的获取，常常是通过下载图片或者通过网络截图的方式，采集效率非常低，同时采集到的图像样本未经处理直接进行卷积训练，会导致训练效率低和训练精确度低的问题。

为了解决以上的技术问题，本申请公开了一种图像样本生成方法、图像样本生成装置、计算机可读介质以及电子设备，下面将通过各个方面进一步说明本申请的内容。

如图1所示，***架构100可以包括终端设备110、网络120和服务器130。终端设备110可以包括智能手机、平板电脑、笔记本电脑、台式电脑等各种电子设备。服务器130可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式***，还可以是提供云计算服务的云服务器。网络120可以是能够在终端设备110和服务器130之间提供通信链路的各种连接类型的通信介质，例如可以是有线通信链路或者无线通信链路。

根据实现需要，本申请实施例中的***架构可以具有任意数目的终端设备、网络和服务器。例如，服务器130可以是由多个服务器设备组成的服务器群组。另外，本申请实施例提供的技术方案可以应用于终端设备110，也可以应用于服务器130，或者可以由终端设备110和服务器130共同实施，本申请对此不做特殊限定。

以上部分介绍了应用本申请技术方案的示例性***架构的内容，接下来继续介绍本申请的图像样本生成方法。本申请提供一种图像样本生成方法，包括步骤S210-步骤S240。

在步骤S210中：获取图像样本库文件，图像样本库文件包括图像样本的样本编码值集合，样本编码值包括用于表示图像样本的十六进制文件。

图像样本库文件又称字体库文件，是网页所采用的格式，不同的浏览器对应使用不同的字体库文件。本申请可以使用的图像样本库文件格式可以是tff文件，otf文件、woff文件、eot文件和svg文件，对应的后缀分别是.tff、.otf、.woff、.eot、.svg，当然并不限于这五种，还可以是其它可以作为网页的字体格式。

其中，tff文件(TureType文件)是一种新型数学字形描述技术。它用数学函数描述字体轮廓外形，含有字形构造、颜色填充、数字描述函数、流程条件控制、栅格处理控制、附加提示控制等指令，可以用于多数的浏览器。otf文件(OpenType文件)也是一种轮廓字体，并内置在TureType的基础上，所以也提供了更多的功能，该文件格式同样适用于多数的浏览器。woff文件(WEB开放字体格式文件)是一种网页所采用的字体格式标准，一般作为Web字体中最佳格式。此字体格式不但能够有效利用压缩来减少档案大小，并且不包含加密也不受数位著作权管理(DRM)限制。是IE专用字体，可以从tff文件创建此格式字体。SVG文件是一种图像文件格式，是基于SVG字体渲染的一种格式。

图像样本库文件中包含了网页的图片，文字，排版等数据，这些数据在图像样本库文件中都是以编码的方式存在，对于图像样本而言，图像样本库中就包含了网页中存在的所有图片的对应图像样本的样本编码值集合，而样本编码值用于表示图像样本的十六进制文件，例如可以表示为0x**************，该样本编码值与对应的图像样本是一一对应并绑定在一起的。

下面举例说明本申请上述的内容，例如，需要获取箭头图标的图像样本，可以通过搜索调整到网络的素材库对应的网页，然后获取到该网页的网页格式，例如获取到woff文件格式。而对应的woff文件中就包括了网页中所有箭头图标的样本编码值，因此，通过步骤S210就可以得到包含样本编码值的样本库文件。

对于图像样本，有些图像由于素材库中不存在或者无法获取到对应的样本库文件时，例如对于新定义的产品，网络上不存在素材，因此，就可以根据通过预先收集或通过用户上传的方法获得这些产品的位图，构建样本库文件，具体的方法如下。

在本申请的一个实施例中，如图3所示，图3示意性地示出了本申请构建图像样本库文件方法的流程图。在获取图像样本库文件之前，可以构建图像样本库文件，其中，构建图像样本库文件的方法包括步骤S310-步骤S330。

步骤S310：建立图像样本像素信息、图像样本符号信息和图像样本的样本编码值的映射关系，形成图像样本映射表；

图像样本像素信息对应的就是图像样本的实际图片信息，一般以位图(ImageBitmap)的形式，由于位图文件需要占用较大内存，因此，对于离屏canvas算法来说，并不会直接对位图文件进行处理，而是将位图文件与图像样本符号信息建立映射，然后利用离屏canvas算法渲染图像样本符号信息。其中，本申请可以利用符号生成算法自动生成位图文件的图像样本符号信息，而图像样本符号信息是一些随机的符号，只要确保图像样本符号信息与图像样本像素信息一一对应，且互相不重复即可。但是，对于图像样本符号信息信息，由于含有特殊符号，对于上述的样本库文件的存储存在困难，例如，woff文件中存储特殊符号较为复杂和繁琐，因此，本申请又引入了图像样本的样本编码值，来建立图像样本的样本编码值与图像样本符号信息的映射关系，以此实现了图像样本像素信息、图像样本符号信息和图像样本的样本编码值三者的映射关系，根据其中任意一个，就可以利用特定的工具获得其他的内容。

下面举例说明本申请图像样本映射表的内容，如图4所示，图4示意性的示出了本申请一张箭头图像样本映射表。表中示出了几种箭头的映射关系，例如，向右的箭头对应的图像样本像素信息就是向右的箭头图像，而与其对应的图像样本的样本编码值是0x00000000000001，图像样本符号信息“！”。因此，利用步骤S310就可以得到图像样本映射表，继续步骤S320。

步骤S320：将图像样本的样本编码值与图像样本的名称进行绑定形成键值对。

其中，样本编码值可以随机分配，也可以根据图像样本的顺序或者文件名称来设定，例如，图像样本的文件名称是p1-p100，对应的图像样本就会按1-100的顺序自动排序，那么样本编码值就可以是0x*************1-0x***********100，因此就可以将图像样本的名称与对应的样本编码值进行绑定形成键值对，绑定之后，就使得样本编码值与图像样本的名称形成一一对应的关系，通过一个样本编码值就可以获得对应的一个样本，绑定完成之后就可以进行步骤S330。

步骤S330：将键值对保存到数组，形成图像样本库文件。

形成键值对之后，就可以将所有的图像样本对应的键值对保存到数组中，就形成了图像样本库文件，此时可以根据不同的浏览器生成不同的文件格式，例如可以保存为woff文件格式，就形成了图像样本库文件。

通过以上步骤获取到了图像样本库文件，此时就可以进行步骤S220。

在步骤S220中：提取图像样本的样本编码值，基于样本编码值利用离屏canvas算法对与样本编码值对应的图像样本进行渲染，得到第一样本特征。

提取图像样本的样本编码值，例如可以提取第一张图像样本对应的样本编码值0x*************1，然后就可以基于样本编码值利用离屏canvas算法对与样本编码值对应的图像样本进行渲染，得到第一样本特征，具体的方法如下。

在本申请的一个实施例中，如图5所示，图5示意性地示出了本申请获得第一样本特征方法的流程图。基于所述样本编码值利用离屏canvas算法对与所述样本编码值对应的图像样本进行渲染，得到第一样本特征的方法，包括步骤S510-步骤S520：

步骤S510：利用离屏canvas算法调用图像样本映射表，从所述图像样本映射表中获取与样本编码值获取对应的图像样本符号信息。

通过步骤S310可知，图像样本映射表中建立了图像样本像素信息、图像样本符号信息和图像样本的样本编码值的映射关系，而离屏canvas算法中配置了调用图像样本符号信息和图像样本的样本编码值的接口，因此，通过离屏canvas算法调用图像样本映射表，就可以基于样本编码值获得对应的图像样本符号信息。例如，参照步骤S310的例子，通过样本编码值0x00000000000001，获得图像样本符号信息“！”。此时就可以继续步骤S520。

步骤S520：利用离屏canvas算法将所述图像样本符号信息绘制到画布上，得到第一样本特征。

介绍离屏canvas算法之前，首先要介绍canvas算法，canvas算法是HTML5中新出的一种算法，JavaScript就提供了Canvas的系列API，因此Canvas是直接使用JavaScript来进行绘图，开发者可以在上面绘制一系列图形，灵活度高。Canvas在HTML文件中的写法如下：

其中id属性是所有HTML元素都可以用的，Canvas自带的属性只有后面两个(分别控制宽度、高度)，canvas算法可以支持90％的浏览器使用。虽然canvas算法用于绘制图形较为实用，但是在一些web站点，脚本解析运行是实现流畅用户反馈的最大的问题之一。因为Canvas计算和渲染和用户操作响应都发生在同一个线程中，Canvas的绘制功能都与<canvas>标签绑定在一起，这意味着Canvas API和DOM是耦合的，在动画中(有时候很耗时)的计算操作将会导致App卡顿，降低用户体验。而本申请所使用的离屏canvas算法(OffscreenCanvas)通过将Canvas移出屏幕来解耦了DOM和Canvas API。由于这种解耦，可以有效的提高绘制的流畅度，提高用户体验。

而本申请具体是利用离屏canvas算法的文本填充函数(fillText)将图像样本符号信息绘制到画布上，得到第一样本特征，利用该方法进行图像样本的生成，可以提高用户体验，不影响用户在屏幕上的其它任务进行。其中，该步骤所得到的第一样本特征并无法形成位图文件，第一样本特征是在移出屏幕的另一个线程中生成的，因此，用户并无法通过屏幕获取到第一样本特征。而第一样本特征只能通过图像数据获取算法(getImageData)来获取，并将第一样本特征转化成图像特征，具体的步骤如步骤S230。

在步骤S230中：利用图像数据获取算法将第一样本特征转化成图形特征，并对图形特征进行裁剪和缩放，得到第二样本特征，图像数据获取算法用于获取第一样本特征的像素数据。

其中，图像数据获取算法(getImageData)的作用是用来获取canvas画布上指定矩形区域的像素数据，指定矩形区域对应的就是步骤S520中将图像样本符号信息绘制到画布上所对应的区域。而像素数据包括了指定矩形区域中所有像素点的RGB值以及透明度。例如，获取到了画布上的两个像素点，分别是不透明度为100％的纯黑色和纯白色，那么对应的像素数据就可以这么表示：rgba(0,0,0,1)，rgba(255,255,255,1)，其中前面的三个参数代表了RGB颜色，最后一个参数1代表了透明度A，范围为(0,1)，但是由于颜色数据的数值范围都在(0,255)。因此这里需要按照0＝>0，1＝>255的方式对应将透明度也转化成(0,255)的形式。解释完以上信息之后，下面进一步说明本申请将第一样本特征转化成图形特征的过程。

在本申请的一个实施例中，如图6所示，图6示意性地示出了本申请获得图形特征的方法流程图。在本申请的一个实施例中，利用图像数据获取算法将第一样本特征转化成图形特征，包括步骤S610-步骤S630：

步骤S610：利用图像数据获取算法调用图像样本映射表，从所述图像样本映射表中获取与图像样本符号信息对应的图像样本像素信息。

通过步骤S310可知，图像样本映射表中建立了图像样本像素信息、图像样本符号信息和图像样本的样本编码值的映射关系，而图像数据获取算法(getImageData)中配置了调用图像样本符号信息和图像样本像素信息的接口，因此，通过图像数据获取算法(getImageData)调用图像样本映射表，就可以基于图像样本符号信息获得对应的图像样本像素信息。例如，参照步骤S310的例子，通过图像样本符号信息“！”，获得向右的箭头对应的图像样本像素信息，即该箭头对应的RGBA的组成。此时就可以继续步骤S620。

步骤S620：获取第一样本特征中与图像样本符号信息对应的矩形区域作为绘制区域。

该区域对应的就是步骤S520中绘制到画布上的区域，一般取矩形区域，即以绘制在画布上的图像样本符号信息为中心，向外取特定大小的区域，其中该特定区域可以根据预先设定，例如都默认设定为长*宽对应为30mm*20mm。本申请的绘制区域还可以根据图像样本像素信息来确定，例如，图像样本像素信息包含了所有的像素点的像素信息，对应的绘制区域就是包含了所有像素点的最小矩形区域。利用以上方式设置完成绘制区域后，就可以继续步骤S630。

步骤S630：将图像样本像素信息渲染在绘制区域上。

本申请将图像样本像素信息渲染在绘制区域上的方法是利用rgba像素数据在新建的画布中绘制生成图像，其中，该画布直接在显示器中展示，用户可以通过显示器看到该画布中绘制得到的图形特征，例如，通过渲染得到的一个向右的箭头。

通过以上方法获得的图形特征对应的样本图像，由于本申请绘制区域的尺寸是固定的，因此对应的图像样本可能存在较多的空白。或者由于图像样本本身形状，导致图像样本中会存在较多的空白。因此，需要将这些空白区域去除，才可以避免拉伸变形的图像样本或者无效区域较多的图形样本对卷积训练造成的影响。本申请对图形特征进行处理的方法如下。

在本申请的一个实施例中，如图7所示，图7示意性地示出了本申请获得第二样本特征的方法流程图。对图形特征进行裁剪和缩放，得到第二样本特征的方法包括步骤S710-步骤S720。

步骤S710：遍历图形特征的像素，获取图形特征的最小非空白矩形区域。

若采用以上的步骤S610-步骤S630获得图形特征，由于绘制区域本身就是矩形区域，因此，可以不进行步骤S710。但是如果通过其他方法，例如获取的图形特征并非矩形的，而是根据轮廓来获取的，此时就需要利用步骤S710将图像样本统一化。具体方法是遍历图像特征中的所有像素，然后获取图形特征的最小非空白矩形区域，对于像素都会有rgba值，而空白的区域可以是全白的区域，即rgba值为(255，255，255，255)，透明度对应是100％。因此，可以通过获取图形特征的像素来确定最小非空白矩形区域。而最小非空白矩形区域对应的就是包络了图形特征的最小矩形区域。获得最小矩形区域之后就可以继续步骤S720。

步骤S720：将最小非空白矩形区域扩展为非空白正方形区域。

将最小非空白矩形区域扩展为非空白正方形区域的方法是判断最小非空白矩形区域的长宽大小，将其中较小的扩展为与较大值相同，例如，一个矩形区域是30mm*20mm，扩展后的非空白正方形区域就是30mm*30mm，利用该方法就可以将图像样本都变成一样的形状，继续步骤S730.

步骤S730：根据非空白正方形区域对图形特征进行裁剪并缩放，得到第二样本特征。

确定了非空白正方形区域之后就可以将图形特征的其它空白区域都进行裁剪，然后将所有的图像样本都进行缩放，具体缩放的比例是以缩放后的尺寸来定的，本申请可以将缩放后的尺寸统一定义为5mm*5mm，这样输入到卷积训练中的图像样本都是固定尺寸的，有助于卷积训练。

利用以上步骤获得了固定尺寸的第二样本特征之后，就可以继续步骤S240。

在步骤S240中：将第二样本特征通过编码算法进行编码之后输出，得到卷积图像样本。

本申请步骤S240的作用是将第二样本特征通过特定编码方法进行编码后输出，以进一步的缩小其文件的大小，以降低卷积训练的运算量。其中，本申请使用的编码方法可以是base64编码，base64编码是用于传输8Bit字节码的编码方式之一，它是一种基于64个可打印字符来表示二进制数据的方法。base64编码是从二进制到字符的过程，可用于在HTTP环境下传递较长的标识信息。本申请通过以上步骤得到了卷积图像样本，就可以利用该卷积图像样本进行卷积训练。

利用以上步骤得到了卷积图像样本，本申请还包括以下步骤，以对得到的卷积图像样本做进一步处理。

在本申请的一个实施例中，如图8所示，图8示意性地示出了本申请对卷积图像样本做进一步处理的方法流程图。在将第二样本特征通过编码算法进行编码之后输出，得到卷积图像样本之后，本申请对应的方法还包括步骤S810-步骤S830。

步骤S810：遍历图像样本库文件中的图像样本，将图像样本转化成卷积图像样本。

通过步骤S210-步骤S240得到的是图像样本库中一张图像样本的卷积图像样本，本申请还需要将图像样本库中其它的图像样本利用同样的方法转化成卷积图像样本，具体的方法是遍历图像样本库文件中的图像样本，利用同步骤S210-步骤S240的方法将图像样本转化成卷积图像样本。通过该方法就得到了足够数量的卷积图像样本，如果将这些卷积图像样本一一输入模型进行卷积训练，步骤较为繁琐，因此，本申请将所有的卷积图像样本进行了处理，具体的方法如步骤S820。

步骤S820：将卷积图像样本进行汇聚，得到卷积图像样本集。

得到卷积图像样本集之后，就可以将该集合输入到模型进行卷积训练，而本申请为了进一步提高卷积训练的效率，还包括步骤S830。

步骤S830：将卷积图像样本集转换成json格式文件。

利用目标追踪算法(Blob)将上一步得到的全量样本转换成json格式文件。其中Blob是一种JavaScript的对象类型。HTML5的文件操作对象，file对象就是Blob的一个分支或说一个子集。json格式文件是存储和交换文本信息的一种数据格式，是一种轻量级的数据交换格式，利用json格式文件将所有的卷积图像样本集输入到模型中进行卷积训练，可以提高训练的效率。本申请对于模型的训练方法如下。

在本申请的一个实施例中，如图9所示，图9示意性地示出了本申请图像识别模型的训练方法流程图。在将卷积图像样本集转换成json格式文件之后，对图像识别模型进行训练的方法包括步骤S910-步骤S930：

步骤S910：利用打散算法将json格式文件打散，形成随机样本集。

本申请利用打散算法(node)对json格式文件随机打散，node是服务器端运行的一个脚本，其功能是将数据集随机打散以提高随机性。获得随机样本集之后，继续步骤S920的内容。

步骤S920：挑选随机样本集，将随机样本集中百分之七十的图像样本作为训练样本，随机样本集中百分之二十的图像样本作为验证样本，随机样本集中百分之十的图像样本作为测试样本。

通过步骤S920获得多种样本之后，就可以讲这些样本输入到模型中进行训练。

步骤S930：以训练样本作为输入样本，以对应于训练样本的样本标签作为输出样本，对预设的卷积神经网络模型进行训练，得到图像识别模型，将验证样本和测试样本输入到图像识别模型中；根据验证样本和测试样本的已知样本标签和图像识别模型输出的预测样本标签对图像识别模型的系数进行调整，使图像识别模型输出的预测样本标签与验证样本和测试样本的已知样本标签一致。

本申请利用步骤S930对应的方法训练生成了图像识别模型，其中该图像识别模型中使用的样本是本申请步骤S210-步骤S240获得的样本，利用该图像识别模型就可以进行图像样本的预测。其中，本申请可以针对大部分图像进行图像识别，例如，可以针对图标进行图像识别。现有的前端页面都会使用各种图标，随着时间推移，图标越来越多，图标的命名也五花八门，很难约束。开发者还原设计稿时，经常要肉眼从几百个图标中寻找对应的图标，较为繁琐，而本申请利用以上的图像识别模型，就可以识别出图标的类别，达到自动识别的效果。当然本申请还可以利用以上的图像识别模型进行其它图像的识别。

在本申请实施例提供的技术方案中，本申请的有益效果包括：第一，本申请通过获取图像样本库文件，并提取样本库文件中的图像样本的样本编码值，然后基于样本编码值利用离屏canvas算法提取图像，然后再将该图像通过图像数据获取算法转化成图形特征，利用该方法进行图像样本的采集，可以直接通过网页的图像样本库文件自动采集图片，而无需对图片截图和下载，图像样本的采集效率高；第二，本申请采集到图像样本之后，对图像样本进行裁剪和缩放，以适应卷积训练的进行，避免拉伸变形的图像样本进行卷积训练无法识别的问题，提高了图像识别的准确性；第三，本申请的图像样本通过编码算法进行编码之后输出，可以有效的降低图像样本的文件大小，减小了卷积训练的计算量，提高了训练的效率，有利于图像识别技术的发展。

以上部分介绍了本申请样本生成方法的步骤，接下来继续公开本申请其它方面的内容。

根据本申请实施例的一个方面，如图10所示，图10示意性地示出了本申请图像识别方法的流程图。本申请提供一种图像识别方法，包括步骤S1010-步骤S1030.：

步骤S1010：获取待识别的图像样本。

其中，待识别的图像样本可以是特定的图标或者图片信息。

步骤S1020：将待识别的图像样本进行裁剪和缩放，得到待识别样本特征。

其中，对待识别的图像样本进行裁剪和缩放的方法同步骤S730，此处不再赘述。

步骤S1030：将待识别样本特征输入到上述图像识别模型中进行识别，得到待识别的图像样本的标签。

利用图像识别模型就可以获得待识别的图像样本的标签，实现对待识别的图像样本的自动识别。

本申请对应的图像识别方法进行图像识别，由于使用了本申请步骤S210-步骤S240获得的样本，因此，识别的准确度更高。

应当注意，尽管在附图中以特定顺序描述了本申请中方法的各个步骤，但是，这并非要求或者暗示必须按照该特定顺序来执行这些步骤，或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的，可以省略某些步骤，将多个步骤合并为一个步骤执行，以及/或者将一个步骤分解为多个步骤执行等。

以上部分介绍了本申请方法的内容，接下来继续介绍本申请装置的内容。

以下介绍本申请的装置实施例，可以用于执行本申请上述实施例中的图像样本生成方法。如图11示，图11示意性地示出了本申请实施例提供的图像样本生成装置的结构框图。

根据本申请实施例的一个方面，提供一种图像样本生成装置1100，包括：

获取模块1110，被配置为获取图像样本库文件，图像样本库文件包括图像样本的样本编码值集合，样本编码值用于表示图像样本的十六进制文件；

特征提取模块1120，被配置为提取图像样本的样本编码值，基于样本编码值利用离屏canvas算法对与样本编码值对应的图像样本进行渲染，得到第一样本特征；

特征处理模块1130，被配置为利用图像数据获取算法将第一样本特征转化成图形特征，并对图形特征进行裁剪和缩放，得到第二样本特征，图像数据获取算法用于获取第一样本特征的像素数据；

输出模块1140，被配置为将第二样本特征通过编码算法进行编码之后输出，得到卷积图像样本。

在本申请的一个实施例中，特征处理模块1130包括：

区域获取单元，被配置为遍历图形特征的像素，获取图形特征的最小非空白矩形区域，

扩展单元，被配置为将最小非空白矩形区域扩展为非空白正方形区域；

裁剪缩放单元，被配置为根据非空白正方形区域对图形特征进行裁剪并缩放，得到第二样本特征。

在本申请的一个实施例中，特征提取模块1120包括：

符号获取单元，被配置为利用离屏canvas算法调用图像样本映射表，从图像样本映射表中获取与所述样本编码值获取对应的图像样本符号信息；

绘制单元，被配置为利用离屏canvas算法将图像样本符号信息绘制到画布上，得到第一样本特征。

在本申请的一个实施例中，图像样本生成装置还包括样本库构建单元，样本库构建单元包括：

绑定单元，别配置为将图像样本的样本编码值与图像样本的名称进行绑定形成键值对；

保存单元，被配置为将键值对保存到数组，形成图像样本库文件。

在本申请的一个实施例中，图像样本生成装置还包括样本处理模块，样本处理模块包括：

遍历单元，被配置为遍历图像样本库文件中的图像样本，将图像样本转化成卷积图像样本；

汇聚单元，被配置为将卷积图像样本进行汇聚，得到卷积图像样本集；

格式转换单元，被配置为将卷积图像样本集转换成json格式文件。

在本申请的一个实施例中，样本处理模块还包括：

打散单元，被配置为利用打散算法将json格式文件打散，形成随机样本集；

样本挑选单元，被配置为挑选随机样本集，将随机样本集中百分之七十的图像样本作为训练样本，随机样本集中百分之二十的图像样本作为验证样本，随机样本集中百分之十的图像样本作为测试样本；

模型训练单元，被配置为以训练样本作为输入样本，以对应于训练样本的样本标签作为输出样本，对预设的卷积神经网络模型进行训练，得到图像识别模型，将验证样本和测试样本输入到图像识别模型中，根据验证样本和测试样本的已知样本标签和图像识别模型输出的预测样本标签对图像识别模型的系数进行调整，使图像识别模型输出的预测样本标签与验证样本和测试样本的已知样本标签一致。

本申请各实施例中提供的图像生成装置的具体细节已经在对应的方法实施例中进行了详细的描述，此处不再赘述。

以上部分介绍了本申请图像样本生成装置的内容，接下来继续公开本申请的图像识别装置。

根据本申请实施例的一个方面，如图12示，图12示意性地示出了本申请实施例提供的图像识别装置的结构框图。本申请提供一种图像识别装置1200，包括：

样本获取模块1210，被配置为获取待识别的图像样本；

样本特征提取模块1220，被配置为将待识别的图像样本进行裁剪和缩放，得到待识别样本特征；

识别模块1230，被配置为将待识别样本特征输入到如上的图像识别模型中进行识别，得到待识别的图像样本的标签。

本申请提供的图像识别装置的具体细节已经在对应的方法实施例中进行了详细的描述，此处不再赘述。

以上部分介绍了本申请装置的内容，接下来继续介绍本申请其它方面的内容。

根据本申请实施例的一个方面，提供一种电子设备，该电子设备包括：处理器；以及存储器，用于存储处理器的可执行指令；其中，处理器被配置为经由执行可执行指令来执行如以上技术方案中的图像样本生成方法。

图13示意性地示出了用于实现本申请实施例的电子设备的计算机***结构框图。

需要说明的是，图13示出的电子设备的计算机***1300仅是一个示例，不应对本申请实施例的功能和使用范围带来任何限制。

如图13所示，计算机***1300包括中央处理器1301(Central Processing Unit，CPU)，其可以根据存储在只读存储器1302(Read-Only Memory，ROM)中的程序或者从存储部分1308加载到随机访问存储器1303(Random Access Memory，RAM)中的程序而执行各种适当的动作和处理。在随机访问存储器1303中，还存储有***操作所需的各种程序和数据。中央处理器1301、在只读存储器1302以及随机访问存储器1303通过总线1304彼此相连。输入/输出接口1305(Input/Output接口，即I/O接口)也连接至总线1304。

以下部件连接至输入/输出接口1305：包括键盘、鼠标等的输入部分1306；包括诸如阴极射线管(Cathode Ray Tube，CRT)、液晶显示器(Liquid Crystal Display，LCD)等以及扬声器等的输出部分1307；包括硬盘等的存储部分1308；以及包括诸如局域网卡、调制解调器等的网络接口卡的通信部分1309。通信部分1309经由诸如因特网的网络执行通信处理。驱动器1310也根据需要连接至输入/输出接口1305。可拆卸介质1311，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器1310上，以便于从其上读出的计算机程序根据需要被安装入存储部分1308。

特别地，根据本申请的实施例，各个方法流程图中所描述的过程可以被实现为计算机软件程序。例如，本申请的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分1309从网络上被下载和安装，和/或从可拆卸介质1311被安装。在该计算机程序被中央处理器1301执行时，执行本申请的***中限定的各种功能。

需要说明的是，本申请实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory，EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory，CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本申请中，计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、有线等等，或者上述的任意合适的组合。

附图中的流程图和框图，图示了按照本申请各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的***来实现，或者可以用专用硬件与计算机指令的组合来实现。

应当注意，尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元，但是这种划分并非强制性的。实际上，根据本申请的实施方式，上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之，上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。

通过以上的实施方式的描述，本领域的技术人员易于理解，这里描述的示例实施方式可以通过软件实现，也可以通过软件结合必要的硬件的方式来实现。因此，根据本申请实施方式的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM，U盘，移动硬盘等)中或网络上，包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本申请实施方式的方法。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。

应当理解的是，本申请并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

Claims

1.一种图像样本生成方法，其特征在于，包括：

2.根据权利要求1所述的图像样本生成方法，其特征在于，对所述图形特征进行裁剪和缩放，得到第二样本特征，包括：

遍历所述图形特征的像素，获取所述图形特征的最小非空白矩形区域，

将所述最小非空白矩形区域扩展为非空白正方形区域；

3.根据权利要求1所述的图像样本生成方法，其特征在于，基于所述样本编码值，利用离屏canvas算法对与所述样本编码值对应的图像样本进行渲染，得到第一样本特征，包括：

4.根据权利要求1所述的图像样本生成方法，其特征在于，在获取图像样本库文件之前，所述方法还包括构建图像样本库文件，其中，构建图像样本库文件的方法包括：

将所述键值对保存到数组中，形成图像样本库文件。

5.根据权利要求1所述的图像样本生成方法，其特征在于，在将所述第二样本特征通过编码算法进行编码之后输出，得到卷积图像样本之后，所述方法还包括：

将所述卷积图像样本进行汇聚，得到卷积图像样本集；

将所述卷积图像样本集转换成json格式文件。

6.根据权利要求5所述的图像样本生成方法，其特征在于，在将所述卷积图像样本集转换成json格式文件之后，所述方法还包括：

利用打散算法将所述json格式文件打散，形成随机样本集；

7.一种图像识别方法，其特征在于，包括：

获取待识别的图像样本；

将所述待识别样本特征输入到如权利要求6所述的图像识别模型中进行识别，得到所述待识别的图像样本的标签。

8.一种图像样本生成装置，其特征在于，包括：

9.一种计算机可读介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时实现权利要求1至6中任意一项所述的图像样本生成方法。

10.一种电子设备，其特征在于，包括：

处理器；以及

存储器，用于存储所述处理器的可执行指令；

其中，所述处理器配置为经由执行所述可执行指令来执行权利要求1至6中任意一项所述的图像样本生成方法。