CN113159301B

CN113159301B - 一种基于二值化量化模型的图像处理方法

Info

Publication number: CN113159301B
Application number: CN202110569275.7A
Authority: CN
Inventors: 刘启和; 但毅; 周世杰; 张准; 董婉祾; 王钰涵; 严张豹
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2021-05-25
Filing date: 2021-05-25
Publication date: 2022-10-28
Anticipated expiration: 2041-05-25
Also published as: CN113159301A

Abstract

本发明公开了一种基于二值化量化模型的图像处理方法，属于图像处理技术领域，其包括以下步骤：S1、对图像集进行预处理，得到每张图像的初始输入数据；S2、构建二值化量化模型；S3、采用每张图像的初始输入数据对二值化量化模型进行训练，得到训练完成的二值化量化模型；S4、将一张图像的初始输入数据输入训练完成的二值化量化模型，得到图像中物体的边界和属性，完成对图像的处理；本发明解决了无人机存储内存很小，无法存储现有的全精度模型的问题。

Description

一种基于二值化量化模型的图像处理方法

技术领域

本发明涉及图像处理技术领域，具体涉及一种基于二值化量化模型的图像处理方法。

背景技术

卷积神经网络(Convolutional Neural Networks,CNN)在无人机领域应用十分广泛，尤其是在图像处理方面。目前有研究人员提出了对于航拍图像的CNN算法，例如进行图像分类和目标跟踪任务。但是，将全精度的CNN模型应用到无人机领域会遇到一些困难。全精度的CNN模型需要大量的存储空间和计算资源，目前市面上的无人机存储内存很小，无法将训练好的全精度模型移植上去，而且，无人机搭载的计算组件耗能非常严重，根据现有的电池容量，无人机的续航骤减。

发明内容

针对现有技术中的上述不足，本发明提供的一种基于二值化量化模型的图像处理方法解决了无人机存储内存很小，无法存储现有的全精度模型的问题。

为了达到上述发明目的，本发明采用的技术方案为：一种基于二值化量化模型的图像处理方法，包括以下步骤：

S1、对图像集进行预处理，得到每张图像的初始输入数据；

S2、构建二值化量化模型；

S3、采用每张图像的初始输入数据对二值化量化模型进行训练，得到训练完成的二值化量化模型；

S4、将一张图像的初始输入数据输入训练完成的二值化量化模型，得到图像中物体的边界和属性，完成对图像的处理。

进一步地，步骤S1包括以下分步骤：

S11、对图像集中每一张图像进行归一化处理，得到归一化后的图像像素点值；

S12、将归一化后的图像像素点值缩放到[-128,128]，得到每一张图像的初始输入数据。

进一步地，步骤S11中对图像进行归一化处理的方法为：将图像中所有像素点的均值调整为0，方差调整为1；

归一化处理的公式为：

其中，

为第i个归一化后的图像像素点值，x_i为第i个像素点值，m为像素点总数，∈为防止分母为零的参数；

步骤S12中将归一化后的图像像素点值缩放到[-128,128]的具体方法为：将每个归一化后的图像像素点值均用一个256位的一维二值化向量I＝(i₁,i₂,...,i_n,...,i₂₅₆)表示，其中，i₁,i₂,...,i_n,...,i₂₅₆为二值化向量I的256个分量，每个分量的取值范围{+1，-1}。

上述进一步方案的有益效果为：归一化是保证所有的维度上数据都在一个变化幅度上，归一化是一种简化计算的方式，即将有量纲的表达式，经过变换，化为无量纲的表达式，成为纯量。目的是为了保证输出数据中数值小的不被吞食。

图像像素点值缩放到[-128,128]的目的是进一步转化为256维的向量，方便第一卷积层

的处理。

进一步地，二值化量化模型包括：第一子二值化量化模型、第二子二值化量化模型、第三子二值化量化模型、第四子二值化量化模型、第五子二值化量化模型、第六子二值化量化模型和第七子二值化量化模型；

所述第一子二值化量化模型的输入端作为二值化量化模型的输入端，其A输出端与第二子二值化量化模型的输入端连接，其B输出端分别与第六子二值化量化模型的输出端和第七子二值化量化模型的输入端连接；所述第二子二值化量化模型的A输出端与第三子二值化量化模型的输入端连接，其B输出端分别与第六子二值化量化模型的输入端和第五子二值化量化模型的输出端连接；所述第三子二值化量化模型的A输出端与第四子二值化量化模型的输入端连接，其B输出端分别与第五子二值化量化模型的输入端和第四子二值化量化模型的输出端连接；所述第七子二值化量化模型的输出端作为二值化量化模型的输出端。

进一步地，第一子二值化量化模型包括：第一卷积层、第一线性整流层、第二卷积层、第二线性整流层、第一最大池化层、第一归一化层和第一量化层；

所述第一卷积层的输入端作为第一子二值化量化模型的输入端，其输出端与第一线性整流层的输入端连接；所述第二卷积层的输入端与第一线性整流层的输出端连接，其输出端与第二线性整流层的输入端连接；所述第二线性整流层的输出端与第一最大池化层的输入端连接，并作为第一子二值化量化模型的B输出端；所述第一最大池化层的输出端与第一归一化层的输入端连接；所述第一量化层的输入端与第一归一化层的输出端连接，其输出端作为第一子二值化量化模型的A输出端；

所述第一卷积层的卷积核大小为3×3，其公式为：L¹(I)＝I*W_b，W_b＝Binariz e(W)，

其中，W为待训练的权重矩阵，W_b为二值化后的权重矩阵，Binariz e()为二值化函数，I为二值化向量，L¹(I)为第一卷积层的输出，*为卷积操作；

所述第一线性整流层的公式为：L²(I)＝ReLU(L¹(I))，其中，ReLU()为激活函数，

L²(I)为第一线性整流层的输出，；

所述第二卷积层的卷积核大小为3×3，其公式为：L³(I)＝L²(I)*W_b，其中，L³(I)为第二卷积层的输出；

所述第二线性整流层的公式为：L⁴(I)＝ReLU(L³(I))，其中，L⁴(I)为第二线性整流层的输出；

所述第一最大池化层上设置有1个2×2的滤波器，其步长为2，其公式为：L⁵(I)＝MaxPool(L⁴(I))，其中，MaxPool()为最大池化函数，L⁵(I)为第一最大池化层的输出；

所述第一归一化层的公式为：L⁶(I)＝BN(L⁵(I))，其中，BN()为BatchNormalization函数，L⁶(I)为第一归一化层的输出；

所述第一量化层的公式为：L⁷(I)＝Binarize(L⁶(I))，其中，Binarize()为量化函数，L⁷(I)为第一量化层的输出；

在第一量化层的正向传播时：

在第一量化层的反向传播时：

进一步地，第二子二值化量化模型包括：第三卷积层、第三线性整流层、第四卷积层、第四线性整流层、第二最大池化层、第二归一化层和第二量化层；

所述第三卷积层的输入端作为第二子二值化量化模型的输入端，其输出端与第三线性整流层的输入端连接；所述第四卷积层的输入端与第三线性整流层的输出端连接，其输出端与第四线性整流层的输入端连接；所述第四线性整流层的输出端与第二最大池化层的输入端连接，并作为第二子二值化量化模型的B输出端；所述第二最大池化层的输出端与第二归一化层的输入端连接；所述第二量化层的输入端与第二归一化层的输出端连接，其输出端作为第二子二值化量化模型的A输出端；

所述第三卷积层与第一卷积层的结构相同，第三线性整流层与第一线性整流层的结构相同，第四卷积层与第二卷积层的结构相同，第四线性整流层与第二线性整流层的结构相同，第二最大池化层与第一最大池化层的结构相同，第二归一化层与第一归一化层的结构相同，第二量化层与第一量化层的结构相同。

进一步地，第三子二值化量化模型包括：第五卷积层、第五线性整流层、第六卷积层、第六线性整流层、第三最大池化层、第三归一化层和第三量化层；

所述第五卷积层的输入端作为第三子二值化量化模型的输入端，其输出端与第五线性整流层的输入端连接；所述第六卷积层的输入端与第五线性整流层的输出端连接，其输出端与第六线性整流层的输入端连接；所述第六线性整流层的输出端与第三最大池化层的输入端连接，并作为第三子二值化量化模型的B输出端；所述第三最大池化层的输出端与第三归一化层的输入端连接；所述第三量化层的输入端与第三归一化层的输出端连接，其输出端作为第三子二值化量化模型的A输出端；

所述第五卷积层与第一卷积层的结构相同，第五线性整流层与第一线性整流层的结构相同，第六卷积层与第二卷积层的结构相同，第六线性整流层与第二线性整流层的结构相同，第三最大池化层与第一最大池化层的结构相同，第三归一化层与第一归一化层的结构相同，第三量化层与第一量化层的结构相同。

进一步地，第四子二值化量化模型包括依次连接的第七卷积层、第七线性整流层、第八卷积层、第八线性整流层和第一反池化层；所述第七卷积层的输入端作为第四子二值化量化模型的输入端；所述第一反池化层的输出端作为第四子二值化量化模型的输出端；

所述第五子二值化量化模型包括依次连接的第九卷积层、第九线性整流层、第十卷积层、第十线性整流层和第二反池化层；所述第九卷积层的输入端作为第五子二值化量化模型的输入端；所述第二反池化层的输出端作为第五子二值化量化模型的输出端；

所述第六子二值化量化模型包括依次连接的第十一卷积层、第十一线性整流层、第十二卷积层、第十二线性整流层和第三反池化层；所述第十一卷积层的输入端作为第六子二值化量化模型的输入端；所述第三反池化层的输出端作为第六子二值化量化模型的输出端；

所述第七子二值化量化模型包括依次连接的第十三卷积层、第十三线性整流层、第十四卷积层、第十四线性整流层和第十五卷积层；所述第十三卷积层的输入端作为第七子二值化量化模型的输入端；所述第十五卷积层的输出端作为第七子二值化量化模型的输出端；

所述第七卷积层、第八卷积层、第九卷积层、第十卷积层、第十一卷积层、第十二卷积层、第十三卷积层和第十四卷积层的结构均与第一卷积层相同；

所述第十五卷积层的运算公式与第一卷积层相同，其卷积核大小为1*1；

所述第七线性整流层、第八线性整流层、第九线性整流层、第十线性整流层、第十一线性整流层、第十二线性整流层、第十三线性整流层和第十四线性整流层的结构均与第一线性整流层相同；

所述第一反池化层、第二反池化层和第三反池化层的结构相同，其均采用反池化函数UnPool()。

上述进一步方案的有益效果为：本发明通过多层的卷积层来进行特征提取，在最后一层卷积层，采用1*1的卷积核将图像维度压缩；通过引入量化层，压缩了参数的字节大小；通过多层整流层，使输出结果不再与输入线性相关；通过多层池化层，使参数数量缩减为原数量的1/4，从而进一步起到压缩模型的目的。

进一步地，步骤S3包括以下分步骤：

S31、构建损失函数；

S32、对二值化量化模型随机输入一张图像的初始输入数据，采用损失函数计算梯度；

S33、根据梯度，对二值化量化模型中二值化后的权重矩阵和学习率进行更新；

S34、重复执行步骤S32至步骤S33，直到二值化后的权重矩阵和学习率达到最优，得到训练完成的二值化量化模型。

进一步地，步骤S31中损失函数为：

其中，

为损失函数，y_true为训练过程的二值化量化模型的输出，y_pred为预测输出；

所述步骤S32中对二值化后的权重矩阵和学习率进行更新的公式为：

其中，W_b ^t为第t次训练过程得到的二值化后的权重矩阵，W_b ^t-1为第t-1次训练过程得到的二值化后的权重矩阵，η为超参数，W_b为二值化后的权重矩阵，η^t为第t次训练过程的学习率，η^t-1为第t-1次训练过程的学习率，

为第t-1次训练过程的一阶矩估计的指数衰减率。

上述进一步方案的有益效果为：损失函数对于最后一层权重的梯度不再跟激活函数的导数相关，只跟输出值和真实值的差值成正比，而此时收敛较快。又因为反向传播是连乘的，因此整个权重矩阵和学习率的更新都会加快。

二值化后的权重矩阵和学习率更新公式使学习率随权重值更新的目的是不断减小学习率，加快参数收敛速度。

综上，本发明的有益效果为：本发明设计一种轻量化的图像处理模型，该模型具有模型小，占用内存少，且图像处理精度高，在减少存储空间的同时提高了计算速度。本发明通过改变模型的层级结构以及修改量化函数，可以将压缩后的模型顺利迁移到无人机计算组件进行计算。

附图说明

图1为一种基于二值化量化模型的图像处理方法的流程图；

图2为二值化量化模型的结构示意图。

具体实施方式

下面对本发明的具体实施方式进行描述，以便于本技术领域的技术人员理解本发明，但应该清楚，本发明不限于具体实施方式的范围，对本技术领域的普通技术人员来讲，只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内，这些变化是显而易见的，一切利用本发明构思的发明创造均在保护之列。

如图1所示，一种基于二值化量化模型的图像处理方法，包括以下步骤：

S1、对图像集进行预处理，得到每张图像的初始输入数据；

步骤S1包括以下分步骤：

步骤S11中对图像进行归一化处理的方法为：将图像中所有像素点的均值调整为0，方差调整为1；

归一化处理的公式为：

其中，

步骤S12中将归一化后的图像像素点值缩放到[-128,128]的具体方法为：将每个归一化后的图像像素点值均用一个256位的一维二值化向量I＝(i₁,i₂,...,i_n,...,i₂₅₆)表示，其中，i₁,i₂,...,i_n,...,i₂₅₆为二值化向量I的256个分量，每个分量的取值范围{+1，-1}，归一化后的图像像素点值与二值化向量I的关系为：

S2、构建二值化量化模型；

如图2所示，二值化量化模型的具体结构包括：第一子二值化量化模型、第二子二值化量化模型、第三子二值化量化模型、第四子二值化量化模型、第五子二值化量化模型、第六子二值化量化模型和第七子二值化量化模型；

第五子二值化量化模型的输入为第三子二值化量化模型B输出端的输出和第四子二值化量化模型的输出。

第六子二值化量化模型的输入为五子二值化量化模型的输出和第二子二值化量化模型B输出端的输出。

第七子二值化量化模型的输入为第六子二值化量化模型的输出和第一子二值化量化模型B输出端的输出。

第一子二值化量化模型包括：第一卷积层、第一线性整流层、第二卷积层、第二线性整流层、第一最大池化层、第一归一化层和第一量化层；

L²(I)为第一线性整流层的输出，；

所述第一最大池化层上设置有1个2×2的滤波器，其步长为2，其公式为：L⁵(I)＝MaxPool(L⁴(I))，其中，MaxPool()为最大池化函数，L⁵(I)为第一最大池化层的输出，由于第一最大池化层上设置有1个2×2的滤波器，其步长为2，因此，每移动一步，输出4个值中的最大值，最后得到一个长宽均为L⁴(I)一半的结果；

在第一量化层的正向传播时：

在第一量化层的反向传播时：

第二子二值化量化模型包括：第三卷积层、第三线性整流层、第四卷积层、第四线性整流层、第二最大池化层、第二归一化层和第二量化层；

第三子二值化量化模型包括：第五卷积层、第五线性整流层、第六卷积层、第六线性整流层、第三最大池化层、第三归一化层和第三量化层；

第四子二值化量化模型包括依次连接的第七卷积层、第七线性整流层、第八卷积层、第八线性整流层和第一反池化层；所述第七卷积层的输入端作为第四子二值化量化模型的输入端；所述第一反池化层的输出端作为第四子二值化量化模型的输出端；

步骤S3包括以下分步骤：

S31、构建损失函数；

步骤S31中损失函数为：

其中，

为第t-1次训练过程的一阶矩估计的指数衰减率。

S34、重复执行步骤S32至步骤S33，直到二值化后的权重矩阵和学习率达到最优，得到训练完成的二值化量化模型；

Claims

1.一种基于二值化量化模型的图像处理方法，其特征在于，包括以下步骤：

S1、对图像集进行预处理，得到每张图像的初始输入数据；

S2、构建二值化量化模型；

S4、将一张图像的初始输入数据输入训练完成的二值化量化模型，得到图像中物体的边界和属性，完成对图像的处理；

所述步骤S2中二值化量化模型包括：第一子二值化量化模型、第二子二值化量化模型、第三子二值化量化模型、第四子二值化量化模型、第五子二值化量化模型、第六子二值化量化模型和第七子二值化量化模型；

所述第一子二值化量化模型的输入端作为二值化量化模型的输入端，其A输出端与第二子二值化量化模型的输入端连接，其B输出端分别与第六子二值化量化模型的输出端和第七子二值化量化模型的输入端连接；所述第二子二值化量化模型的A输出端与第三子二值化量化模型的输入端连接，其B输出端分别与第六子二值化量化模型的输入端和第五子二值化量化模型的输出端连接；所述第三子二值化量化模型的A输出端与第四子二值化量化模型的输入端连接，其B输出端分别与第五子二值化量化模型的输入端和第四子二值化量化模型的输出端连接；所述第七子二值化量化模型的输出端作为二值化量化模型的输出端；

所述第一子二值化量化模型包括：第一卷积层、第一线性整流层、第二卷积层、第二线性整流层、第一最大池化层、第一归一化层和第一量化层；

所述第二子二值化量化模型包括：第三卷积层、第三线性整流层、第四卷积层、第四线性整流层、第二最大池化层、第二归一化层和第二量化层；

所述第三卷积层与第一卷积层的结构相同，第三线性整流层与第一线性整流层的结构相同，第四卷积层与第二卷积层的结构相同，第四线性整流层与第二线性整流层的结构相同，第二最大池化层与第一最大池化层的结构相同，第二归一化层与第一归一化层的结构相同，第二量化层与第一量化层的结构相同；

所述第三子二值化量化模型包括：第五卷积层、第五线性整流层、第六卷积层、第六线性整流层、第三最大池化层、第三归一化层和第三量化层；

2.根据权利要求1所述的基于二值化量化模型的图像处理方法，其特征在于，所述步骤S1包括以下分步骤：

3.根据权利要求2所述的基于二值化量化模型的图像处理方法，其特征在于，所述步骤S11中对图像进行归一化处理的方法为：将图像中所有像素点的均值调整为0，方差调整为1；

归一化处理的公式为：

其中，

为第i个归一化后的图像像素点值，x_i为归一化前的第i个像素点值，m为像素点总数，∈为防止分母为零的参数；

步骤S12中将归一化后的图像像素点值缩放到[-128,128]的具体方法为：将每个归一化后的图像像素点值均用一个256位的一维二值化向量I＝(i₁,i₂,…,i_n,…,i₂₅₆)表示，其中，i₁,i₂,…,i_n,…,i₂₅₆为二值化向量I的256个分量，每个分量的取值范围{+1，-1}。

4.根据权利要求1所述的基于二值化量化模型的图像处理方法，其特征在于，所述第一卷积层的卷积核大小为3×3，其公式为：I¹(I)＝I*W_b，W_b＝Binariz e(W)，

L²(I)为第一线性整流层的输出；

在第一量化层的正向传播时：

在第一量化层的反向传播时：

5.根据权利要求1所述的基于二值化量化模型的图像处理方法，其特征在于，所述第四子二值化量化模型包括依次连接的第七卷积层、第七线性整流层、第八卷积层、第八线性整流层和第一反池化层；所述第七卷积层的输入端作为第四子二值化量化模型的输入端；所述第一反池化层的输出端作为第四子二值化量化模型的输出端；

6.根据权利要求1所述的基于二值化量化模型的图像处理方法，其特征在于，所述步骤S3包括以下分步骤：

S31、构建损失函数；

7.根据权利要求6所述的基于二值化量化模型的图像处理方法，其特征在于，所述步骤S31中损失函数为：

其中，

为第t-1次训练过程的一阶矩估计的指数衰减率。