CN109583485B

CN109583485B - 一种基于反馈训练的有监督深度学习方法

Info

Publication number: CN109583485B
Application number: CN201811367393.4A
Authority: CN
Inventors: 杨俊杰; 郑军
Original assignee: Matrixtime Robotics Shanghai Co ltd
Current assignee: Matrixtime Robotics Shanghai Co ltd
Priority date: 2018-11-16
Filing date: 2018-11-16
Publication date: 2023-12-08
Anticipated expiration: 2038-11-16
Also published as: CN109583485A

Abstract

本发明涉及一种基于反馈训练的有监督深度学习方法，该方法在训练有监督深度学习模型的过程中，在每次迭代开始时，以一采样概率对训练集中的各样本进行抽样，所述采样概率随各样本的预测损失值动态调整。与现有技术相比，本发明通过将有监督学习训练过程中各样本的预测损失值与其自身被采样频率相关联，利用反馈训练的方式实现了调整离群样本被采样到的概率，具有提高训练效果等优点。

Description

一种基于反馈训练的有监督深度学习方法

技术领域

本发明涉及深度学习领域，尤其是涉及一种基于反馈训练的有监督深度学习方法。

背景技术

现在的有监督深度学习方法在使用过程中，需要使用大量的样本数据进行学习，为了降低有监督深度学习模型训练时对硬件的需求，通常采用小批量采样或单样本输入的方式训练模型。通常的采样方式为均匀采样或采用按序输入。

在该种情况下，大量的常规样本与小量的离群样本会有相等的概率被送入模型训练，导致模型难以学到小量离群样本的空间分布。当模型的训练目标需要检测或识别小量离群样本时，通过常规采样方式的有监督训练不仅降低了模型的准确率，而且降低了模型的训练速度。

为了解决上述问题，现有的解决方式通常为数据重采样、类别均衡采样、代价敏感矩阵与代价敏感向量的方法的方式进行训练。重采样和类别均衡采样的方式均为将不同类别的样本采样相同的个数进行训练。该方法在解决类间差异大、类内差异小的不同种类的样本数量不平衡问题上效果较好。然而当类内差异大，即出现少量离群样本时，模型极难学到其样本分布。代价敏感矩阵或代价敏感向量的方法可以通过构建混淆矩阵或代价敏感矩阵，对被错分的类别增大学习率，从而加速模型对离群样本的学习。但当离群样本存在于大样本量类别中时，由于离群样本被抽到的概率微乎其微，该方法的效果几乎可以忽略不计。

因此，为了提升离群样本的学***衡的问题，而且要解决类内样本数量不平衡的问题。而现有技术难以解决上述问题。

发明内容

本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于反馈训练的有监督深度学习方法。

本发明的目的可以通过以下技术方案来实现：

一种基于反馈训练的有监督深度学习方法，该方法在训练有监督深度学习模型的过程中，在每次迭代开始时，以一采样概率对训练集中的各样本进行抽样，所述采样概率随各样本的预测损失值动态调整。

进一步地，所述采样概率动态调整的过程具体包括：

1)初始化各样本权重参数；

2)根据各样本当前的权重参数计算对应的采样概率：

其中，P(i)是样本i的采样概率，α为优先级系数，p_i为样本i的权重参数；

3)进行一次迭代后，获得各样本的预测损失值，基于所述预测损失值更新权重参数；

4)在下一次迭代开始时，令p_i＝p(i)，返回步骤2)。

进一步地，所述初始化各样本权重参数时，令各样本权重参数均为1。

进一步地，所述基于所述预测损失值更新权重参数具体为：

p(i)＝|δ(i)|+ε

其中，p(i)为更新后的样本i的权重参数，δ(i)为样本i的预测损失值，ε为修正因子。

进一步地，所述修正因子ε为一大于0的正数。

进一步地，所述预测损失值δ(i)的表达式为：

δ(i)＝L(y_i,f(x_i))

其中，x_i为输入，y_i为x_i对应的真值标签，函数f为通过输入x_i预测标签的函数，函数L为计算真值标签y_i与预测标签f(x_i)差异的损失函数。

进一步地，所述基于所述预测损失值更新权重参数时，权重参数与预测损失值的倒数成正比。

与现有技术相比，本发明具有以如下有益效果：

第一，本发明首次提出在有监督深度学习中采用动态调整采样频率的方法，通过增加离群样本被学习的概率以使模型更快地学到整体样本空间分布，从而减少了模型训练时间并可提高模型训练效果。

第二，本发明可以结合其他采样方式(重采样、类别均衡采样、代价敏感矩阵等方式)以达到效果更好的训练效果。

第三，本发明可以逆向使用，通过降低离群样本被采样的概率增大模型学习常规样本特征的能力。

附图说明

图1为本发明训练有监督深度学习模型的流程示意图。

具体实施方式

下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施，给出了详细的实施方式和具体的操作过程，但本发明的保护范围不限于下述的实施例。

本发明提供一种基于反馈训练的有监督深度学习方法，运行于GPU中，应用于图像处理过程，该方法在训练有监督深度学习模型的过程中，在每次迭代开始时，以一采样概率对训练集中的各样本进行抽样，所述采样概率随各样本的预测损失值动态调整。

采样概率动态调整的过程具体包括：

1)初始化各样本权重参数p_i＝1；

2)根据各样本当前的权重参数计算对应的采样概率：

其中，P(i)是样本i的采样概率，p_i为样本i的权重参数，α为优先级系数，值越大则代表优先级越大，当α取0时为均匀采样；

3)进行一次迭代后，获得各样本的预测损失值，更新权重参数：

p(i)＝|δ(i)|+ε

其中，p(i)为更新后的样本i的权重参数，δ(i)为样本i的预测损失值，ε为修正因子，可以取10^-5等很小的正常数，以防止δ(i)＝0时x₀将不会再被抽样；

4)在下一次迭代开始时，令p_i＝p(i)，返回步骤2)。

预测损失值δ(i)的表达式为：

δ(i)＝L(y_i,f(x_i))

上述方法可以结合其他采样方式(如重采样、类别均衡采样、代价敏感矩阵等方式)以达到效果更好的训练效果。以与类别均衡采样结合为例，从大量的样本类与小量的样本类中分别采集同量的样本，类内采集概率均按权重值计算。

上述方法可以逆向使用，通过降低离群样本被采样的概率增大模型学习常规样本特征的能力。例如在使用自动编码器(Auto-encoder)时，其需要学习更多正常标准样本的特征，此时需要采样更多的正常样本，通过将损失值的倒数作为自身权重计算概率时，离群样本会被更少地采样。

如图1所示，基于上述采样概率动态调整的有监督深度学习模型训练过程具体为：

在步骤401中，预先读入所有图片样本与其对应分类标签的信息；

在步骤402中，对所有读入的图像样本信息进行采集权值初始化，初始化值为1；

在步骤403中，计算各图像样本的采集概率；

在步骤404中，根据各图像样本的采集概率采集图像与其对应的分类标签；

在步骤405中，将采集到的图像送入有监督深度学习网络模型训练，并与其损失值；

在步骤406中，判断该有监督深度学习网络模型是否达到训练迭代次数上限，若达到上限则终止训练，否则执行步骤407；

在步骤407中，利用步骤405计算所得各图像样本的损失值；

在步骤408中，更新各样本的权重，完成后执行步骤403。

以上详细描述了本发明的较佳具体实施例。应当理解，本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此，凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案，皆应在由权利要求书所确定的保护范围内。

Claims

1.一种基于反馈训练的有监督深度学习方法，其特征在于，该方法应用于图像处理过程，在训练有监督深度学习模型的过程中，在每次迭代开始时，以一采样概率对训练集中的各样本进行抽样，所述采样概率随各样本的预测损失值动态调整，该方法包括以下步骤：

步骤401，预先读入所有图片样本与其对应分类标签的信息；

步骤402，对所有读入的图像样本信息进行采集权值初始化，初始化值为1；

步骤403，计算各图像样本的采集概率；

步骤404，根据各图像样本的采集概率采集图像与其对应的分类标签；

步骤405，将采集到的图像送入有监督深度学习网络模型训练，并计算其损失值；

步骤406，判断该有监督深度学习网络模型是否达到训练迭代次数上限，若达到上限则终止训练，否则执行步骤407；

步骤407，获取步骤405计算所得各图像样本的损失值；

步骤408，更新各样本的权重，完成后执行步骤403；

所述采样概率动态调整的过程具体包括：

1)初始化各样本权重参数；

2)根据各样本当前的权重参数计算对应的采样概率：

4)在下一次迭代开始时，令p_i＝p(i)，返回步骤2)；

所述基于所述预测损失值更新权重参数具体为：

p(i)＝|δ(i)|+ε

2.根据权利要求1所述的基于反馈训练的有监督深度学习方法，其特征在于，所述修正因子ε为一大于0的正数。

3.根据权利要求1所述的基于反馈训练的有监督深度学习方法，其特征在于，所述预测损失值δ(i)的表达式为：

δ(i)＝L(y_i,f(x_i))

4.根据权利要求1所述的基于反馈训练的有监督深度学习方法，其特征在于，所述基于所述预测损失值更新权重参数时，权重参数与预测损失值的倒数成正比。