CN111275129A

CN111275129A - 一种图像数据的增广策略选取方法及***

Info

Publication number: CN111275129A
Application number: CN202010095784.6A
Authority: CN
Inventors: 王俊; 高鹏; 谢国彤; 杨苏辉
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2020-02-17
Filing date: 2020-02-17
Publication date: 2020-06-12
Also published as: WO2021164228A1

Abstract

本发明实施例提供了一种图像数据的增广策略选取方法及***，本发明涉及人工智能技术领域，方法包括：从增广策略集合中选取多个待定策略子集对预设的样本训练集进行样本增广，得到多个增广后的样本训练集；利用每个增广后的样本训练集训练初始化的分类模型，得到多个训练后的分类模型；将预设的样本验证集输入每个训练后的分类模型，得到训练好的分类模型对应的分类准确度；利用贝叶斯优化算法基于每个训练好的分类模型对应的分类准确度，从多个待定策略子集中确定最优策略子集。本发明实施例提供的技术方案能够解决难以确定哪种增广策略对当前类型的图像样本最有效的问题。

Description

一种图像数据的增广策略选取方法及***

【技术领域】

本发明涉及基架运维技术领域，尤其涉及一种图像数据的增广策略选取方法及***。

【背景技术】

深度学习在计算机视觉领域的成功一定程度归功于拥有大量带标记的训练数据，因为模型的性能通常会随着训练数据质量、多样性和数量的增加而相应提高。然而，要收集足够多的高质量数据来训练模型以使其具有良好的性能，往往非常困难和成本昂贵。

目前常用一些数据增广策略去增加数据量，用以训练计算机视觉模型，如平移、旋转和翻转等通过随机“扩充”来增加训练样本的数量和多样性。

然而，目前现有的增广策略各式各样，在面对不同的数据集的时候表现不一，难以确定哪种增广策略对当前类型的图像数据集最有效。

【发明内容】

有鉴于此，本发明实施例提供了一种图像数据的增广策略选取方法及装置，用以解决现有技术中难以确定哪种增广策略对当前类型的图像数据集最有效的问题。

为了实现上述目的，根据本发明的一个方面，提供了一种图像数据的增广策略选取方法，所述方法包括：从增广策略集合中选取多个待定策略子集对预设的样本训练集进行样本增广，得到多个增广后的样本训练集，其中，每个所述待定策略子集由所述增广策略集合中至少一个增广策略组成；利用每个所述增广后的样本训练集训练初始化的分类模型，得到多个训练后的分类模型；将预设的样本验证集输入每个所述训练后的分类模型，得到训练好的所述分类模型对应的分类准确度；利用贝叶斯优化算法基于每个所述训练好的分类模型对应的分类准确度，从多个待定策略子集中确定最优策略子集。

可选地，所述利用贝叶斯优化算法基于每个所述训练好的分类模型对应的分类准确度，从多个待定策略子集中确定最优策略子集的步骤，包括：基于多个样本点构建高斯过程的回归模型，其中，每个样本点包括所述训练好的分类模型的分类准确度及训练所述分类模型所采用的待定策略子集；根据所述回归模型确定贝叶斯优化算法的获取函数；通过对所述获取函数的最大优化，从多个所述待定策略子集中确定最优策略子集，其中，利用所述最优策略子集增广后的样本训练集训练得到的分类模型的分类准确度最高。

可选地，所述将预设的样本验证集输入每个所述训练后的分类模型，得到训练好的所述分类模型对应的分类准确度，包括：

将预设的样本验证集输入每个所述训练后的分类模型；获取所述分类模型输出的训练精度及验证精度；根据所述训练精度和所述验证精度判断所述分类模型是否拟合良好；将拟合良好的所述分类模型确定为训练好的分类模型，并将所述训练好的分类模型的验证精度作为所述分类模型的分类准确度。

可选地，所述利用每个所述增广后的样本训练集训练初始化的分类模型，得到多个训练后的分类模型，包括：利用卷积神经网络提取输入分类模型的所述增广后的样本训练集中的每个样本的特征图；根据所述特征图，对所述增广后的样本训练集中的对应一个样本进行分类预测，得到分类结果；获取所述分类结果集合与所述样本训练集中的所有样本的标签集合的均方误差的损失函数；通过反向传播对所述卷积神经网络进行优化，以使得所述损失函数的值收敛，得到优化训练后的所述分类模型。

可选地，在所述将预设的样本验证集输入每个所述训练后的分类模型，得到训练好的所述分类模型对应的分类准确度之前，所述方法还包括：从所述预设的样本验证集随机抽取多个验证子集；将所述多个验证子集分别输入每个所述训练后的分类模型。

可选地，所述增广策略集合包括旋转变换、翻转变换、缩放变换、平移变换、尺度变换、区域裁剪、噪声添加、分段仿射、随机掩盖、边界检测、对比度变换、颜色抖动、随机混合及复合叠加。

为了实现上述目的，根据本发明的一个方面，提供了一种图像数据的增广策略选取***，所述***包括增广器、分类模型及控制器；

所述增广器，用于从增广策略集合中选取多个待定策略子集对预设的样本训练集进行样本增广，得到多个增广后的样本训练集，其中，每个所述待定策略子集由所述增广策略集合中至少一个增广策略组成；

所述分类模型，用于利用每个所述增广后的样本训练集训练初始化的分类模型，得到多个训练后的分类模型；并将预设的样本验证集输入每个所述训练后的分类模型，得到训练好的所述分类模型对应的分类准确度；

所述控制器，用于利用贝叶斯优化算法基于每个所述训练好的分类模型对应的分类准确度，从多个待定策略子集中确定最优策略子集。

可选地，所述控制器包括构建单元、第一确定单元、第二确定单元；

所述构建单元，用于基于多个样本点构建高斯过程的回归模型，其中，每个样本点包括所述训练好的分类模型的分类准确度及训练所述分类模型所采用的待定策略子集；所述第一确定单元，用于根据所述回归模型确定贝叶斯优化算法的获取函数；所述第二确定单元，用于通过对所述获取函数的最大优化，从多个所述待定策略子集中确定最优策略子集，其中，利用所述最优策略子集增广后的样本训练集训练得到的分类模型的分类准确度最高。

为了实现上述目的，根据本发明的一个方面，提供了一种计算机非易失性存储介质，所述存储介质包括存储的程序，在所述程序运行时控制所述存储介质所在设备执行上述图像数据的增广策略选取方法。

为了实现上述目的，根据本发明的一个方面，提供了一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述图像数据的增广策略选取方法的步骤。

在本方案中，通过利用不同的增广策略对同类样本分别进行样本增广，从而利用每个增广后的样本训练集训练初始化的分类模型，得到多个训练后的分类模型，利用样本验证集验证训练后的分类模型，然后根据分类模型的分类准确度及贝叶斯优化算法来获取符合该类样本的合适的增广策略，能够提高增广策略选取效率。

【附图说明】

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其它的附图。

图1是本发明实施例提供的一种可选的图像数据的增广策略选取方法的流程图；

图2是本发明实施例提供的一种可选的图像数据的增广策略选取***的示意图；

图3是本发明实施例提供的一种可选的控制器的功能框图；

图4是本发明实施例提供的一种可选的计算机设备的示意图。

【具体实施方式】

为了更好的理解本发明的技术方案，下面结合附图对本发明实施例进行详细描述。

应当明确，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。

应当理解，本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

应当理解，尽管在本发明实施例中可能采用术语第一、第二、第三等来描述终端，但这些终端不应限于这些术语。这些术语仅用来将终端彼此区分开。例如，在不脱离本发明实施例范围的情况下，第一终端也可以被称为第二终端，类似地，第二终端也可以被称为第一终端。

取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地，取决于语境，短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。

图1是根据本发明实施例的一种图像数据的增广策略选取方法的流程图，如图1所示，该方法包括：

步骤S01，从增广策略集合中选取多个待定策略子集对预设的样本训练集进行样本增广，得到多个增广后的样本训练集，其中，每个待定策略子集由增广策略集合中至少一个增广策略组成；

步骤S02，利用每个增广后的样本训练集训练初始化的分类模型，得到多个训练后的分类模型；

步骤S03，将预设的样本验证集输入每个训练后的分类模型，得到训练好的分类模型对应的分类准确度；

步骤S04，利用贝叶斯优化算法基于每个训练好的分类模型对应的分类准确度，从多个待定策略子集中确定最优策略子集。

其中，样本训练集中的样本为图形数据样本。

下面对本实施例提供的图像数据的增广策略选取方法的具体技术方案进行详细的说明。

在本实施方式中，样本训练集中的样本是同类型的医学影像样本，例如肺部影像、胃部影像等。每个训练样本都设有标签，例如带有正标签的训练样本，即为标记为有肺炎症状的肺部影像，带有负标签的训练样本，标记为没有肺炎症状的肺部影像。示例性的，训练样本为512*512的医学影像样本。

其中，增广策略包括旋转变换、翻转变换、缩放变换、平移变换、尺度变换、区域裁剪、添加噪声、分段仿射、随机掩盖、边界检测、对比度变换、颜色抖动、随机混合及复合叠加。增广策略例如为翻转变换。

1)旋转变换(Rotation)：随机旋转图像预设的角度，改变图像内容的朝向；

2)翻转变换(Flip)：沿着水平或者垂直方向翻转图像；

3)缩放变换(Zoom)：按照预设的比例放大或者缩小图像；

4)平移变换(Shift)：在图像平面上对图像以预设方式进行平移；

5)尺度变换(Scale)：对图像按照预设的尺度因子，进行放大或缩小，或者利用预设的尺度因子对图像滤波构造尺度空间，改变图像内容的大小或模糊程度；

6)区域裁剪(Crop)：裁剪图片的感兴趣区域；

7)添加噪声(Noise)：在原来的图片上随机叠加一些噪声；

8)分段仿射(Piecewise Affine)：在图像上放置一个规则的点网格，根据正态分布的样本数量移动这些点及周围的图像区域；

9)随机掩盖(Dropout)：在面积大小可选定、位置随机的矩形区域上丢失信息实现转换，所有通道的信息丢失产生黑色矩形块，部分通道的信息丢失产生彩色噪声；

10)边界检测(Edge Detect)：检测图像中的所有边缘，将它们标记为黑白图像，再将结果与原始图像叠加；

11)对比度变换(Contrast)：在图像的HSV颜色空间，改变饱和度S和V亮度分量，保持色调H不变，对每个像素的S和V分量进行指数运算(指数因子在0.25到4之间)，增加光照变化；

12)颜色抖动(Color jitter)：对图像的曝光度(exposure)、饱和度(saturation)和色调(hue)进行随机变化形成不同光照及颜色下的图片，尽可能使得模型能够使用不同光照条件小的情形；

13)随机混合(Mix up)：基于邻域风险最小化原则的数据增广方法，使用线性插值得到新样本数据；

14)复合叠加(Sample Pairing)：随机抽取两张图片分别经过基础数据增广操作处理后经像素取平均值的形式叠加合成一个新的样本，新样板的标签为原样本标签中的一种。

在本实施方式中，从上述14种增广策略中随机抽取上述任意3种增广策略组成一个待定策略子集，即一个待定策略子集包括3种增广策略，每种增广策略包括3个策略参数，分别为策略类型(μ)、概率值(α)、幅度(β)。那么一个待定策略子集可以用数值矩阵形式来表示：

其中，每一行表示一个增广策略。利用数值矩阵来表示待定策略子集，提高计算效率。

步骤S02，利用每个增广后的样本训练集训练初始化的分类模型，得到多个训练后的分类模型。

在本实施方式中，分类模型为卷积神经网络模型，由卷积神经网络和全连接网络组成，其具体构成至少包括卷积网络层、池化层和全连接网络层。训练时具体步骤包括：

利用卷积神经网络提取输入分类模型的增广后的样本训练集中的每个样本的特征图；根据特征图，对增广后的样本训练集中的对应一个样本进行分类预测，得到分类结果；获取分类结果集合与样本训练集中的所有样本的标签集合的均方误差的损失函数；通过反向传播对卷积神经网络进行优化，以使得损失函数的值收敛，得到优化训练后的分类模型。

在本实施方式中，分类结果有两种，分别是肺炎和非肺炎。初始的卷积神经网络对带有标签的样本进行特征提取，并进行预设轮次的训练，使得卷积神经网络层能够有效提取更泛化的特征(例如边缘、纹理等)。进行反向传播时，不断地梯度下降之后，模型的精度才能得到提高，使得损失函数的值收敛至最小，其中会自动调整卷积层与全连接层的权重和偏置，从而使得分类模型最优化。

在其他实施方式中，分类模型还可以是长短时神经网络模型、随机森林模型、支持向量机模型、最大熵模型等等，在此不做限定。

步骤S03，将预设的样本验证集输入每个训练后的分类模型，得到训练好的分类模型对应的分类准确度。

具体地，预设的样本验证集中的样本也设有标签，例如带有正标签的训练样本，即为标记为有肺炎症状的肺部影像，带有负标签的训练样本，标记为没有肺炎症状的肺部影像。采用预设的样本验证集对训练后的分类模型进行验证，每个分类模型对应的样本验证集不同，能够实现更好的模型泛化性能，有效解决样本增广可能引入的过度拟合问题。

在步骤S03之前，方法还包括：

从预设的样本验证集随机抽取多个验证子集；

将多个验证子集分别输入每个训练后的分类模型。

在本实施方式中，采用随机抽取方式，样本训练集与样本验证集中的样本量比例可以是2:8，4:6，6:4，8:2等。可以理解地，每次抽取时，随机抽取样本验证集中50％的样本组成验证子集。在其他实施方式中，随机抽取的比例可以是30％、40％、60％等等。

在另一种实施方式中，采用交叉验证方法对分类模型进行验证。交叉验证方法为十折交叉验证方法或五折交叉验证方法中的任意一种。例如采用五折交叉验证方法，具体地，将多个训练样本随机分成10份，每次取其中2份作为交叉验证集，其余8份作为训练集。训练时，先用其中的8份对初始化后的分类模型进行训练，然后对2份交叉验证集进行分类标注，以此重复训练及验证过程5次，每次选取的交叉验证集不同，直至所有的训练样本都被分类标注一遍。

步骤S03，具体包括：

步骤S031，将预设的样本验证集输入每个训练后的分类模型；

步骤S032，获取分类模型输出的训练精度及验证精度；

步骤S033，根据训练精度和验证精度判断分类模型是否拟合良好；

步骤S034，将拟合良好的分类模型确定为训练好的分类模型，并将训练好的分类模型的验证精度作为分类模型的分类准确度。

其中，每个分类模型的训练过程中，分类模型的训练轮次可以预先设定，例如训练轮次为训练100次，在100次训练后，再将样本验证集输入分类模型，得到分类模型输出的训练精度和验证精度，并对分类模型进行拟合判断，以确定训练后的分类模型是否拟合良好，具体地，当(训练精度-验证精度)/验证精度≤10％，那么认为分类模型拟合良好。在本实施方式中，将拟合良好的分类模型的验证精度作为分类准确度。

采用贝叶斯优化算法才寻找最优策略子集时，将待定策略子集(数值矩阵)作为样本点的x值，将分类准确度作为样本点的y值，从而组成多个样本点，并基于多个样本点构建高斯过程的回归模型，通过对目标函数进行学习拟合，找到使目标函数向全局最优值提升的策略子集。

步骤S04具体包括：

基于多个样本点构建高斯过程的回归模型，其中，每个样本点包括训练好的分类模型的分类准确度及训练分类模型所采用的待定策略子集；

根据回归模型确定贝叶斯优化算法的获取函数；

通过对获取函数的最大优化，从多个待定策略子集中确定最优策略子集，其中，利用最优策略子集增广后的样本训练集训练得到的分类模型的分类准确度最高。

在本实施方式中，基于分类准确度并利用贝叶斯优化算法从多个待定策略子集中确定最优策略子集。在其他实施方式中，也可以采用其他算法来选取，在此不做限定。

可以理解地，我们认为y与x＝(μ，α，β)之间存在某种函数关系，即y＝f(x)贝叶斯优化算法通过对获取函数进行学习拟合，找到使目标函数f(x)向全局最优值提升的策略参数。每一次贝叶斯优化迭代使用新的样本点来测试目标函数f(x)时，利用这个信息来更新目标函数f(x)的先验分布，最后，利用贝叶斯优化算法测试由后验分布给出的全局最值最可能出现的位置的样本点。

在本实施方式中，贝叶斯优化迭代的过程中，通过获取函数指导我们去选择样本点，不断修正GP高斯过程曲线去逼近目标函数f(x)，当获取函数最大的时候说明选择的样本点最优，相当于我们就搜索到了令目标函数f(x)最大的最优策略子集。

由于f(x)形式无法显性求取，我们用高斯过程来逼近，

即f(x)～GP(m(x)，k(x，x′))，其中m(x)代表样本点f(x)的数学期望E(f(x))，在贝叶斯优化中通常取0，k(x，x')为核函数，描述的是x的协方差。

对于每个x都有一个对应的高斯分布，而对于一组{x₁，x₂...x_n}，假设y值服从联合正态分布，其均值为0，协方差为：

其中，协方差只与x有关，和y无关。

对于一个新的样本点x_n+1，联合高斯分布为：

因此可以通过前n个样本点估计出f_n+1的后验概率分布：P(f_n+1|D_1:t,x_t+1)～N(μ_n(x),σ_n ²(x))，其中，μ_n(x)＝k^TK^-1f_1:n；σ_n ²(x)＝k(x_n+1,x_n+1)-k^TK^-1k；

在本实施方式中，采用改进概率(Probability of Improvement，POI)作为获取函数。

获取函数为：

其中，f(x)为x的目标函数值，x为验证精度，f(X+)为到目前为止最优的x的目标函数值，μ(x)，σ(x)分别是高斯过程所得到的目标函数的均值和方差，即f(x)的后验分布，Φ(·)表示的是正态累计分布函数。ξ为trade-off系数，如果没有该系数，POI函数会倾向于取在X+周围的点，收敛到接近f(X+)附近的位置，即倾向于开发而不是探索，因此加入该项进行权衡。通过不断尝试新的x，下一个最大点应该要比它大或至少与之相等。因此，下一个采样在交叉点f(X+)和置信域之间，我们能假定在f(X+)点以下的样本是可以丢弃的，因为我们只需要搜索令目标函数取极大值的参数，于是通过迭代这一过程缩小了观察区域，直到搜索到最优解，使得POI(X)最大。

本发明实施例提供了一种图像数据的增广策略选取***，如图2所示，***包括增广器10、分类模型20及控制器30；

增广器10，用于从增广策略集合中选取多个待定策略子集对预设的样本训练集进行样本增广，得到多个增广后的样本训练集，其中，每个待定策略子集由增广策略集合中至少一个增广策略组成。具体地，增广策略集合包括旋转变换、翻转变换、缩放变换、平移变换、尺度变换、区域裁剪、噪声添加、分段仿射、随机掩盖、边界检测、对比度变换、颜色抖动、随机混合及复合叠加。其中，增广策略例如为翻转变换。

在本实施方式中，随机抽取上述任意3种增广策略组成一个待定策略子集，每种增广策略包括3个策略参数，分别为策略类型(μ)、概率值(α)、幅度(β)。那么一个待定策略子集可以用数值矩阵形式来表示：

分类模型20包括训练单元210及验证单元220。训练单元210，用于利用每个增广后的样本训练集训练初始化的分类模型，得到多个训练后的分类模型；验证单元220，用于将预设的样本验证集输入每个训练后的分类模型，得到训练好的分类模型对应的分类准确度。

在本实施方式中，分类模型为卷积神经网络模型，由卷积神经网络和全连接网络组成，其具体构成至少包括卷积网络层、池化层和全连接网络层。

训练单元210包括提取子单元、分类子单元、第一获取子单元及优化子单元。

提取子单元，用于利用卷积神经网络提取输入分类模型的增广后的样本训练集中的每个样本的特征图；分类子单元，用于根据特征图，对增广后的样本训练集中的对应一个样本进行分类预测，得到分类结果；获取子单元，用于获取分类结果集合与样本训练集中的所有样本的标签集合的均方误差的损失函数；优化子单元，用于通过反向传播对卷积神经网络进行优化，以使得损失函数的值收敛，得到优化训练后的分类模型。

验证单元220包括输入子单元、第二获取子单元、判断子单元及确定子单元。

输入子单元，用于将预设的样本验证集输入每个训练后的分类模型；

第二获取子单元，用于获取分类模型输出的训练精度及验证精度；

判断子单元，用于根据训练精度和验证精度判断分类模型是否拟合良好；

确定子单元，用于将拟合良好的分类模型确定为训练好的分类模型，并将训练好的分类模型的验证精度作为分类模型的分类准确度。

***还包括数据库40及处理模块50，数据库40用于存储样本训练集及样本验证集。

处理模块50用于从预设的样本验证集随机抽取多个验证子集；将多个验证子集分别输入每个训练后的分类模型。

控制器30，用于利用贝叶斯优化算法基于每个训练好的分类模型对应的分类准确度，从多个待定策略子集中确定最优策略子集。

在本实施方式中，控制器30基于分类准确度并利用贝叶斯优化算法从多个待定策略子集中确定最优策略子集。在其他实施方式中，也可以采用其他算法来选取，在此不做限定。

请参阅图3，可选地，控制器30包括构建单元310、第一确定单元320、第二确定单元330。

构建单元310，用于基于多个样本点构建高斯过程的回归模型，其中，每个样本点包括训练好的分类模型的分类准确度及训练分类模型所采用的待定策略子集；

第一确定单元320，用于根据回归模型确定贝叶斯优化算法的获取函数；

第二确定单元330，用于通过对获取函数的最大优化，从多个待定策略子集中确定最优策略子集，其中，利用最优策略子集增广后的样本训练集训练得到的分类模型的分类准确度最高。

由于f(x)形式无法显性求取，我们用高斯过程来逼近，

其中，协方差只与x有关，和y无关。

对于一个新的样本点x_n+1，联合高斯分布为：

获取函数为：

进一步地，在控制器30选取出最优增广策略后，控制器30还用于输出最优增广策略至增广器10，增广器10将最优增广策略确认为预设的样本训练集的增广策略。可以理解地，在增广器10获取最优增广策略后，增广器每次进行样本增广时，都将采用控制器输出的最优增广策略来进行样本增广。

本发明实施例提供了一种计算机非易失性存储介质，存储介质包括存储的程序，其中，在程序运行时控制存储介质所在设备执行以下步骤：

从增广策略集合中选取多个待定策略子集对预设的样本训练集进行样本增广，得到多个增广后的样本训练集，其中，每个待定策略子集由增广策略集合中至少一个增广策略组成；利用每个增广后的样本训练集训练初始化的分类模型，得到多个训练后的分类模型；将预设的样本验证集输入每个训练后的分类模型，得到训练好的分类模型对应的分类准确度；利用贝叶斯优化算法基于每个训练好的分类模型对应的分类准确度，从多个待定策略子集中确定最优策略子集。

可选地，在程序运行时控制存储介质所在设备执行利用贝叶斯优化算法基于每个训练好的分类模型对应的分类准确度，从多个待定策略子集中确定最优策略子集的步骤，包括：

基于多个样本点构建高斯过程的回归模型，其中，每个样本点包括训练好的分类模型的分类准确度及训练分类模型所采用的待定策略子集；根据回归模型确定贝叶斯优化算法的获取函数；通过对获取函数的最大优化，从多个待定策略子集中确定最优策略子集，其中，利用最优策略子集增广后的样本训练集训练得到的分类模型的分类准确度最高。

可选地，在程序运行时控制存储介质所在设备执行将预设的样本验证集输入每个训练后的分类模型，得到训练好的分类模型对应的分类准确度，包括：

将预设的样本验证集输入每个训练后的分类模型；获取分类模型输出的训练精度及验证精度；根据训练精度和验证精度判断分类模型是否拟合良好；将拟合良好的分类模型确定为训练好的分类模型，并将训练好的分类模型的验证精度作为分类模型的分类准确度。

可选地，在程序运行时控制存储介质所在设备执行利用每个增广后的样本训练集训练初始化的分类模型，得到多个训练后的分类模型的步骤，包括：利用卷积神经网络提取输入分类模型的增广后的样本训练集中的每个样本的特征图；根据特征图，对增广后的样本训练集中的对应一个样本进行分类预测，得到分类结果；获取分类结果集合与样本训练集中的所有样本的标签集合的均方误差的损失函数；通过反向传播对卷积神经网络进行优化，以使得损失函数的值收敛，得到优化训练后的分类模型。

可选地，在程序运行时控制存储介质所在设备在执行将预设的样本验证集输入每个训练后的分类模型，得到训练好的分类模型对应的分类准确度之前，还包括：从预设的样本验证集随机抽取多个验证子集；将多个验证子集分别输入每个训练后的分类模型。

图4是本发明实施例提供的一种计算机设备的示意图。如图3所示，该实施例的计算机设备100包括：处理器101、存储器102以及存储在存储器102中并可在处理器101上运行的计算机程序103，处理器101执行计算机程序103时实现实施例中的图像数据的增广策略选取方法，为避免重复，此处不一一赘述。或者，该计算机程序被处理器101执行时实现实施例中图像数据的增广策略选取***中各模型/单元的功能，为避免重复，此处不一一赘述。

计算机设备100可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。计算机设备可包括，但不仅限于，处理器101、存储器102。本领域技术人员可以理解，图3仅仅是计算机设备100的示例，并不构成对计算机设备100的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如计算机设备还可以包括输入输出设备、网络接入设备、总线等。

所称处理器101可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器102可以是计算机设备100的内部存储单元，例如计算机设备100的硬盘或内存。存储器102也可以是计算机设备100的外部存储设备，例如计算机设备100上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。进一步地，存储器102还可以既包括计算机设备100的内部存储单元也包括外部存储设备。存储器102用于存储计算机程序以及计算机设备所需的其他程序和数据。存储器102还可以用于暂时地存储已经输出或者将要输出的数据。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的***，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本发明所提供的几个实施例中，应该理解到，所揭露的***，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如，多个单元或组件可以结合或者可以集成到另一个***，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

上述以软件功能单元的形式实现的集成的单元，可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中，包括若干指令用以使得一台计算机装置(可以是个人计算机，服务器，或者网络装置等)或处理器(Processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明保护的范围之内。

Claims

1.一种图像数据的增广策略选取方法，其特征在于，所述方法包括：

从增广策略集合中选取多个待定策略子集对预设的样本训练集进行样本增广，得到多个增广后的样本训练集，其中，每个所述待定策略子集由所述增广策略集合中至少一个增广策略组成；

利用每个所述增广后的样本训练集训练初始化的分类模型，得到多个训练后的分类模型；

将预设的样本验证集输入每个所述训练后的分类模型，得到训练好的所述分类模型对应的分类准确度；

利用贝叶斯优化算法基于每个所述训练好的分类模型对应的分类准确度，从多个待定策略子集中确定最优策略子集。

2.根据权利要求1所述的方法，其特征在于，所述利用贝叶斯优化算法基于每个所述训练好的分类模型对应的分类准确度，从多个待定策略子集中确定最优策略子集的步骤，包括：

基于多个样本点构建高斯过程的回归模型，其中，每个样本点包括所述训练好的分类模型的分类准确度及训练所述分类模型所采用的待定策略子集；

根据所述回归模型确定贝叶斯优化算法的获取函数；

通过对所述获取函数的最大优化，从多个所述待定策略子集中确定最优策略子集，其中，利用所述最优策略子集增广后的样本训练集训练得到的分类模型的分类准确度最高。

3.根据权利要求1所述的方法，其特征在于，所述将预设的样本验证集输入每个所述训练后的分类模型，得到训练好的所述分类模型对应的分类准确度，包括：

将预设的样本验证集输入每个所述训练后的分类模型；

获取所述分类模型输出的训练精度及验证精度；

根据所述训练精度和所述验证精度判断所述分类模型是否拟合良好；

将拟合良好的所述分类模型确定为训练好的分类模型，并将所述训练好的分类模型的验证精度作为所述分类模型的分类准确度。

4.根据权利要求1所述的方法，其特征在于，所述利用每个所述增广后的样本训练集训练初始化的分类模型，得到多个训练后的分类模型，包括：

利用卷积神经网络提取输入分类模型的所述增广后的样本训练集中的每个样本的特征图；

根据所述特征图，对所述增广后的样本训练集中的对应一个样本进行分类预测，得到分类结果；

获取所述分类结果集合与所述样本训练集中的所有样本的标签集合的均方误差的损失函数；

通过反向传播对所述卷积神经网络进行优化，以使得所述损失函数的值收敛，得到优化训练后的所述分类模型。

5.根据权利要求1所述的方法，其特征在于，在所述将预设的样本验证集输入每个所述训练后的分类模型，得到训练好的所述分类模型对应的分类准确度之前，所述方法还包括：

从所述预设的样本验证集随机抽取多个验证子集；

将所述多个验证子集分别输入每个所述训练后的分类模型。

6.根据权利要求1所述的方法，其特征在于，所述增广策略集合包括旋转变换、翻转变换、缩放变换、平移变换、尺度变换、区域裁剪、噪声添加、分段仿射、随机掩盖、边界检测、对比度变换、颜色抖动、随机混合及复合叠加。

7.一种图像数据的增广策略选取***，其特征在于，所述***包括增广器、分类模型及控制器；

8.根据权利要求7所述的***，其特征在于，所述控制器包括构建单元、第一确定单元、第二确定单元；

所述构建单元，用于基于多个样本点构建高斯过程的回归模型，其中，每个样本点包括所述训练好的分类模型的分类准确度及训练所述分类模型所采用的待定策略子集；

所述第一确定单元，用于根据所述回归模型确定贝叶斯优化算法的获取函数；

所述第二确定单元，用于通过对所述获取函数的最大优化，从多个所述待定策略子集中确定最优策略子集，其中，利用所述最优策略子集增广后的样本训练集训练得到的分类模型的分类准确度最高。

9.一种计算机非易失性存储介质，所述存储介质包括存储的程序，其特征在于，在所述程序运行时控制所述存储介质所在设备执行权利要求1至6任意一项所述的图像数据的增广策略选取方法。

10.一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至6任意一项所述的图像数据的增广策略选取方法的步骤。