CN113762495A

CN113762495A - 一种提高卷积神经网络模型低比特量化模型精度的方法

Info

Publication number: CN113762495A
Application number: CN202010497770.7A
Authority: CN
Inventors: 张东; 于康龙
Original assignee: Hefei Ingenic Technology Co ltd
Current assignee: Hefei Ingenic Technology Co ltd
Priority date: 2020-06-04
Filing date: 2020-06-04
Publication date: 2021-12-07

Abstract

本发明提供一种提高卷积神经网络模型低比特量化模型精度的方法，包括以下步骤：S1，卷积神经网络训练：用全精度算法训练模型，得到一个可以用于目标分类的网络，即获得模型推理过程中的相关参数；S2,量化权重：对于已经获得权重参数按照公式1所示的公式进行量化，得到低比特的权重；公式1：

变量说明：W_f为全精度数据，W_q为量化后的数据，max_w全精度数据的最大值，min_w全精度数据的最小值,b为量化后的位宽；S3，feature map的量化：对于量化feature map的scale采用线下统计的方法获得数据的最大值最小值，再利用公式1完成量化；S4，进行卷积运算输出结果。

Description

一种提高卷积神经网络模型低比特量化模型精度的方法

技术领域

本发明涉及神经网络加速技术领域，特别涉及一种提高卷积神经网络模型低比特量化模型精度的方法。

背景技术

近年来，随着科技的飞速发展，大数据时代已经到来。深度学习以深度神经网络(DNN)作为模型，在许多人工智能的关键领域取得了十分显著的成果，如图像识别、增强学习、语义分析等。卷积神经网络(CNN)作为一种典型的DNN结构，能有效提取出图像的隐层特征，并对图像进行准确分类，在近几年的图像识别和检测领域得到了广泛的应用。

特别地，实时量化feature map：将卷积运算出来的结果反量化为全精度数，然后根据实时统计获得的最大最小值完成对feature map的量化。

然而，现有技术中对卷积神经网络进行量化时，由于feature map的数值是实时计算出来的，所以对feature map进行量化时可能会受到异常值的影响，无法有效的量化从而降低最终量化后模型的精度。

此外，现有技术中的常用术语如下：

卷积神经网络(Convolutional Neural Networks,CNN)：是一类包含卷积计算且具有深度结构的前馈神经网络。

量化：量化指将信号的连续取值(或者大量可能的离散取值)近似为有限多个(或较少的)离散值的过程。

低比特：将数据量化为位宽为8bit，4bit或者2bit的数据。

推理：神经网络训练结束后，利用保存的数据进行运算的过程。

发明内容

本申请提出了一种卷积神经网络模型低比特量化提高精度的方法，旨在克服上述现有技术中存在的缺陷，提出一种提高量化模型精度的方法，解决现有低比特模型推理过程精度损失严重的问题。

本方法在量化feature map的时候会考虑到其中异常值对量化的影响，对于量化feature map的scale采用线下统计的方法从而提高最终量化模型的精度。

具体地，本发明提供一种提高卷积神经网络模型低比特量化模型精度的方法，所述方法包括以下步骤：

S1，卷积神经网络训练：用全精度算法训练模型，得到一个用于目标分类的网络，即获得模型推理过程中的相关参数；

S2,量化权重：对于已经获得权重参数按照公式1所示的公式进行量化，得到低比特的权重；

公式1：

变量说明：W_f为全精度数据，W_q为量化后的数据，max_w全精度数据的最大值，min_w全精度数据的最小值,b为量化后的位宽；

S3，feature map的量化：对于量化feature map的scale采用线下统计的方法获得数据的最大值最小值，再利用公式1完成量化；

S4，进行卷积运算输出结果。

所述步骤S1中所述的全精度算法是以Resnet-50为神经网络结构的图像分类算法。

所述步骤S1中所述的相关参数包括，卷积的权重，BiasAdd算子的偏置，BatchNormal算子的gamma，beta，均值和方差。

所述步骤S3进一步包括：

S3.1，在模型的训练时使用滑动平均的方法按照公式2统计每一层feature map的最大值最小值然后保存下来，

公式2：v_t＝β·v_t-1+(1-β)·(θ_t)，

变量说明：v_t为变量v在t时刻的值，β为加权系数，θ_t为变量v在t时刻的值，v_t-1为变量v在t-1时刻的值；

S3.2，利用该最大值最小值和公式1完成对feature map的量化。

所述的统计的数据集来源训练集，所述的数据集为统计5000张和2万张的数据集，优选统计5000张数据集的模型在测试集。

对于加权系数可以采用0.992、0.994、0.996。

加权系数优选为0.994。

由此，本申请的优势在于：

(1)由于是预先采用滑动平均统计的方法来获取feature map的最大值最小值，从而避免了异常值对量化的影响，提高了量化后模型的精度；

(2)由于统计的数据集来源于训练集，所以统计后的参数更符合目标任务的数据分布特征，可以提高模型的泛化能力。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，并不构成对本发明的限定。

图1是本发明方法的流程示意图。

图2是本发明方法步骤S3的具体流程示意图。

具体实施方式

为了能够更清楚地理解本发明的技术内容及优点，现结合附图对本发明进行进一步的详细说明。

如图1所示，本发明是一种提高卷积神经网络模型低比特量化模型精度的方法，所述方法包括以下步骤：

公式1：

S4，进行卷积运算输出结果。

其中，S1中所述相关参数包括，卷积的权重，BiasAdd算子的偏置，BatchNormal算子的gamma，beta，均值和方差；所述的全精度算法是以Resnet-50为神经网络结构的图像分类算法；

如图2所示，所述步骤S3的feature map的量化：进一步包括：S3.1，在模型的训练时使用滑动平均的方法按照公式2统计每一层feature map的最大值最小值然后保存下来,

公式2：v_t＝β·v_t-1+(1-β)·(θ_t)，

S3.2，利用该最大值最小值和公式1完成对feature map的量化。

由于feature map时模型推理过程中实时计算出来的，所以无法预先知道他的最大值和最小值，按照公式1的公式得知要想对数据进行量化就必须预先知道该数据的最大值最小值，所以对于feature map的最大值最小值采用的方法是，在模型的训练时使用滑动平均的方法(公式2所示)统计每一层feature map的最大值最小值然后保存下来，利用该最大值最小值和公式1完成对feature map的量化。通过测试发现，统计的数据集来源训练集的话，最终模型的泛化能力会更好，并且分别尝试了统计5000张和2万张数据集，发现统计5000张数据集的模型在测试集的表现会更好。对于加权系数分别采用了0.992,0.994,0.996，发现但加权系数为0.994的时候模型的精度最高。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明实施例可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种提高卷积神经网络模型低比特量化模型精度的方法，其特征在于，所述方法包括以下步骤：

公式1：

S4，进行卷积运算输出结果。

2.根据权利要求1所述的一种提高卷积神经网络模型低比特量化模型精度的方法，其特征在于，所述步骤S1中所述的全精度算法是以Resnet-50为神经网络结构的图像分类算法。

3.根据权利要求1所述的一种提高卷积神经网络模型低比特量化模型精度的方法，其特征在于，所述步骤S1中所述的相关参数包括，卷积的权重，BiasAdd算子的偏置，BatchNormal算子的gamma，beta，均值和方差。

4.根据权利要求1所述的一种提高卷积神经网络模型低比特量化模型精度的方法，其特征在于，所述步骤S3进一步包括：

公式2：v_t＝β·v_t-1+(1-β)·(θ_t)，

S3.2，利用该最大值最小值和公式1完成对feature map的量化。

5.根据权利要求4所述的一种提高卷积神经网络模型低比特量化模型精度的方法，其特征在于，所述的统计的数据集来源训练集。

6.根据权利要求5所述的一种提高卷积神经网络模型低比特量化模型精度的方法，其特征在于，所述的数据集为统计5000张和2万张的数据集，优选统计5000张数据集的模型在测试集。

7.根据权利要求4所述的一种提高卷积神经网络模型低比特量化模型精度的方法，其特征在于，对于加权系数可以采用0.992、0.994、0.996。

8.根据权利要求7所述的一种提高卷积神经网络模型低比特量化模型精度的方法，其特征在于，加权系数优选为0.994。