CN111582299B

CN111582299B - 针对图像深度学习模型识别的自适应正则化优化处理方法

Info

Publication number: CN111582299B
Application number: CN202010191674.XA
Authority: CN
Inventors: 罗兆经; 谢钟乐; 姚畅
Original assignee: Hangzhou Mingzhihui Technology Co ltd
Current assignee: Hangzhou Mingzhihui Technology Co ltd
Priority date: 2020-03-18
Filing date: 2020-03-18
Publication date: 2022-11-01
Anticipated expiration: 2040-03-18
Also published as: CN111582299A

Abstract

本发明公开了一种针对图像深度学习模型识别的自适应正则化优化处理方法。建立深度学习模型，提取出深度学习模型每一层的模型参数；首先计算混合高斯中高斯模型对于深度学习模型的每一层模型参数的责任函数；再采用以下公式处理获得自适应的正则项；依次重复步骤迭代处理直到收敛为止；将正则项输入到深度学习模型中，然后在模型参数基础上减去正则项。本发明不同层的模型参数学习到最佳的正则项，从而有效地解决过拟合的问题，提高图像识别准确率，运用了延迟更新的方法来快速更新正则项，可广泛用于图像识别领域的深度学习模型。

Description

针对图像深度学习模型识别的自适应正则化优化处理方法

技术领域

本发明涉及了一种图像识别优化处理方法，尤其是涉及了一种针对图像深度学习模型识别的自适应正则化优化处理方法，尤其是对于图像识别领域的层数非常多的深度学习模型非常有效。

背景技术

深度学习技术在近些年发展的非常迅猛，尤其是在图像识别领域。给定一幅图片，深度学习模型现在可以非常准确地给出这个图像展示的物体的类别，比如猫，狗，鸟，汽车等等。这个应用对于自动驾驶和人脸识别等都是十分适用的。现阶段图像识别的深度学习模型准确率越来越高，同时它们的层数也变得越来越多。举一个著名的图像识别比赛，ILSVRC作为例子。从2012年到2015年，每年赢得比赛的深度学习模型的层数从8层上升到152层。

但是，当模型层数变得越来越多，过拟合问题就变得越来越突出。过拟合是指在训练数据有限的情况下，模型在训练图像上表现得非常好，但在新的测试图像上表现不好的现象。过拟合现象在层数很多的模型中非常常见，而且也极大地影响着模型的性能。

幸运的是，过拟合问题能由正则化方法很好的解决。正则化方法的基本思路是在优化目标函数中加一个惩罚项(正则项)以此来惩罚太过于复杂的模型。传统的正则化方法包括L1正则化方法[可参考Williams PM.Bayesian regularization and pruning usinga Laplace prior.Neural computation.1995 Jan；7(1):117-43.]以及L2正则化方法[可参考Wang Y,Sun X,Liu L.A variable step size LMS adaptive filtering algorithmbased on L2 norm.In2016 IEEE International Conference on Signal Processing,Communications and Computing(ICSPCC)2016 Aug 5(pp.1-6).IEEE.]。但是这些方法都是非常实验性的。比如说，对于一个有多层的深度学习模型，数据科学家需要对模型的每一层试验得出一个固定的最好的正则项参数β，这个过程是十分耗时和辛苦的。特别是当深度学习模型的层数上升到几百几千层的时候，这种手动试验得到每层合适的正则项参数就会显得非常不现实。

发明内容

为了解决背景技术中存在的问题，本发明提出了一种针对图像深度学习模型识别的自适应正则化优化处理方法，采用自适应的正则化方法来给模型的每一层学习最佳的正则项参数。

本发明采用的技术方案是：

1)对于需识别的图像，建立深度学习模型，提取出深度学习模型每一层的模型参数；在这里，为了方便叙述，以一层的模型参数作为例子，其它层的模型参数方法一样。

2)方法采用与混合高斯结合，对于深度学习模型每一层的模型参数w，首先计算混合高斯中第k个高斯模型对于该层第m个模型参数w_m的责任函数r_k(w_m)，混合高斯模型用来计算正则项，并实时迭代更新其中的混合参数，如下：

其中，p_k(w_m)是深度学习模型的第m层的模型参数w_m在第k个高斯模型的概率密度函数，π_k是第k个高斯模型的混合参数，必须满足

的条件，π_j表示第j个高斯模型的混合参数，p_j(wm)表示该层第m个的模型参数w_m在第j个高斯模型的概率密度函数，j表示遍历所有的高斯模型的序数，K表示混合高斯中的高斯模型总数；

3)再采用以下公式处理获得自适应的正则项，并实时迭代更新其中的精度参数：

其中，λ_k是第k个高斯模型的精度参数，其中精度参数λ_k对应于L2正则项中的正则项参数β；

4)依次重复以上步骤2)～3)迭代处理直到收敛为止，每一层均获得自身的正则项βw，直至模型参数、高斯精度参数和混合参数均收敛稳定；

5)当计算出正则项之后，将不同层的正则项输入到深度学习模型各自对应的层中，然后在每一层的模型参数基础上减去该层的正则项，由此用自适应的正则项训练获得了一个能更好地进行图像识别的深度学习模型。

对于图像识别领域的深度学习模型，一般层数都很深。本发明以L2正则化方式，对于每一层的模型参数w计算正则项βw并减去正则项βw，其中β是正则项参数，控制正则化强度；并且采用自适应的正则化方法来学习每一层最优的正则化强度获得最终正则项βw。由此，本发明为每一层的模型参数新构建了正则项，能防止过拟合，提高图像识别准确率。

本发明能自适应地为每一层模型学习到最佳的正则项，从而有效地解决图片识别领域深度学习模型的过拟合问题，运用了延迟更新的方法来快速地更新层数很多的图像识别领域深度学习模型每层的正则项。

本发明方法对不同的图像识别领域的深度学习模型均通用。

所述的第k个高斯模型的精度λ_k采用以下公式更新：

其中，a和b是预设的第一、第二超参数；

第k个高斯模型的混合参数π_k采用以下公式更新：

其中，α_k是第k个高斯模型的预设的模型超参数，α_j表示第j个高斯模型的预设的模型超参数，j表示遍历所有的高斯模型的序数。

所述的深度学习模型为卷积神经网络。

所述步骤4)中，迭代处理时，每重复一次步骤2)～3)作为一步，实际操作时不是每一次都计算步骤2)，而是每隔步I_m步才进行一步，I_m是预设的模型超参数，一般设为50。

由于计算责任函数r_k(w_m)，更新高斯精度λ_k和混合参数π_k是比较费时的，本发明也采用了一种延迟更新的方法。这种更新方法不会每步都计算责任函数r_k(w_m)以及更新高斯精度λ_k和混合参数π_k，而是每隔步I_m步才做一次，以此来减少总的计算时间。

所述的深度学习模型中的总层数大于10层以上，直到上千层的深度学习模型都是适用的。

本发明的有益效果是：

本发明可广泛用于图像识别领域的深度学习模型，为不同层的模型参数学习到最佳的正则项，从而有效地解决过拟合的问题，提高图像识别准确率；并且运用了延迟更新的方法来快速的更新层数很多的深度学习模型的正则项。

附图说明

图1是本发明方法逻辑框架示意图。

表1是在ResNet模型不同层上学到的混合高斯参数

表2是不同正则化方法准确率的结果对比图。

具体实施方式

下面结合附图和实施例对本发明作进一步说明。

本发明的实施例如下：

如图1所示，右边是一个多层的深度学习模型，输入不同图像之后，模型会预测这个图像是猫还是轿车还是其他类别。自适应的正则化方法在左边。这个方法会依次地计算每层的责任函数，计算每层的正则项并传给深度学习模型去更新每层的模型参数，然后更新每层的混合高斯参数π，λ。

1)对于上述待识别的图像，建立深度学习模型，提取出深度学习模型每一层的模型参数；在这里，为了方便叙述，以一层的模型参数作为例子，其它层的模型参数方法一样。

2)方法采用与混合高斯结合，对于某一层的模型参数w，首先计算混合高斯中第k个高斯模型对于该层的第m个的模型参数w_m的责任函数r_k(w_m)，并实时迭代更新其中的混合参数，如下：

3)再采用以下公式处理获得该层的自适应正则项，并实时迭代更新其中的精度参数：

4)依次重复以上步骤2)～3)迭代处理直到收敛为止，学到该层的正则项βw，直至模型参数、高斯精度参数和混合参数均收敛稳定；

5)当计算出正则项之后，将每一层的正则项输入到深度学习模型中的对应层中，然后在每一层的模型参数基础上减去正则项，由此用自适应的正则项训练获得了一个能更好地进行图像识别的深度学习模型。

为了证实本自适应正则化方法在深度学习模型应用中的有效性，使用残差卷积神经网络模型(ResNet)来进行验证。这个模型一共有20层。在这个实验中，使用的数据集是CIFAR-10图像分类数据集。这个数据集有60000张图像(50000张训练图像和10000张测试图像)，一共分成十个类别。每张图像有32×32个像素点。

本实施例所用的参数如下：K＝4。对于某一层，假设M为该层的模型参数数量，b＝0.001M，a＝1+10^(-2)b，α＝M^(0.5)。

本实施例的实验结果如下表。

表1在ResNet模型不同层上学到的混合高斯参数

表2不同正则化方法在CIFAR-10数据集上的准确率

正则化方法	ResNet
		无正则化	0.901
L2正则化	0.909
		自适应正则化	0.921

表1展示了自适应正则化方法在几个有代表性的层中学到的混合高斯参数。从这个表可以看出来，的正则化方法能自动地给不同层学到两个高斯，并且不同层的混合高斯参数是不一样的。这个结果印证了的想法：的自适应正则化方法能够自适应的给每层学到不同的混合高斯参数，从而给每层产生不同的最佳的正则项。

表2展示了不同正则化方法的准确率。从这个表中可见无正则化方法的结果是最差的，有了L2正则化也并无差异影响，而自适应正则化则显著提升了。这个说明了本发明自适应的正则化方法比传统的L2正则化方法要好，正则化的方法能够自适应地给每层学到最佳的正则项，从而给每层最佳的正则化强度，显著提高了准确率。

因此，本发明自适应正则化方法处理对于深度学习模型具有显著的技术效果。

Claims

1.一种针对图像深度学习模型识别的自适应正则化优化处理方法，其特征在于：

1)对于需识别的图像，建立深度学习模型，提取出深度学习模型每一层的模型参数；

2)对于深度学习模型每一层的模型参数w，首先计算混合高斯中第k个高斯模型对于深度学习模型的第m层的模型参数w_m的责任函数r_k(w_m)，并实时迭代更新其中的混合参数，如下：

其中，p_k(w_m)是深度学习模型的第m层的模型参数w_m在第k个高斯模型的概率密度函数，π_k是第k个高斯模型的混合参数，π_j表示第j个高斯模型的混合参数，p_j(w_m)表示深度学习模型的第m层的模模型参数w_m在第j个高斯模型的概率密度函数，j表示遍历所有的高斯模型的序数，K表示混合高斯中的高斯模型总数；

其中，λ_k是第k个高斯模型的精度参数；

4)依次重复以上步骤2)～3)迭代处理直到收敛为止，每一层均获得自身的正则项βw；

5)将不同层的正则项输入到深度学习模型各自对应的层中，然后在每一层的模型参数基础上减去该层的正则项，由此用自适应的正则项训练获得了一个能更好地进行图像识别的深度学习模型；

所述的第k个高斯模型的精度λ_k采用以下公式更新：

其中，a和b是预设的第一、第二超参数；

第k个高斯模型的混合参数π_k采用以下公式更新：

2.根据权利要求1所述的一种针对图像深度学习模型识别的自适应正则化优化处理方法，其特征在于：所述的深度学习模型为卷积神经网络。

3.根据权利要求1所述的一种针对图像深度学习模型识别的自适应正则化优化处理方法，其特征在于：所述步骤4)中，迭代处理时，每重复一次步骤2)～3)作为一步，每隔步I_m步才进行一步，I_m是预设的模型超参数。

4.根据权利要求1所述的一种针对图像深度学习模型识别的自适应正则化优化处理方法，其特征在于：所述的深度学习模型中的总层数大于10层以上，直到上千层的深度学习模型都是适用的。