CN111523526A

CN111523526A - 一种目标检测方法、计算机设备及可读存储介质

Info

Publication number: CN111523526A
Application number: CN202010627991.1A
Authority: CN
Inventors: 王增冠
Original assignee: Hangzhou Xiongmai Integrated Circuit Technology Co Ltd
Current assignee: Hangzhou Xiongmai Integrated Circuit Technology Co Ltd
Priority date: 2020-07-02
Filing date: 2020-07-02
Publication date: 2020-08-11

Abstract

本发明公开了一种目标检测方法、计算机设备及可读存储介质，涉及目标检测技术领域。本发明所提供的技术方案，在利用训练样本对目标检测模型进行训练时，分别对卷积权重和激活函数的输入值分别进行量化，并以此构建损失函数，对量化后的卷积权重和量化后的输入值进行调整迭代。本发明所提供的方法在训练过程调整权重值，可以保证精度，并满足各个场景条件下的需求，简化计算过程。

Description

一种目标检测方法、计算机设备及可读存储介质

技术领域

本发明涉及目标检测技术领域，具体涉及一种目标检测方法、计算机设备及可读存储介质。

背景技术

目前，深度学***。基于深度学习的各种应用功能层出不穷，并下沉到各行各业中。基于深度学习训练得到的模型，具有较好的效果，但也存在着计算量大的缺点，限制了在嵌入式等低功耗、低计算能力设备上的应用。

现有技术中，通过将权重和激活值量化到预设大小，利用硬件定点运算速度比浮点运算速度快的特性，来解决训练深度学习模型计算量大、功耗高的问题，有利于在嵌入式等低功耗设备上运行。但是，现有技术存在如下缺陷：第一，在实际应用中，场景复杂多变，光照条件不可控，激活的取值范围变化多样，难以统计出一个满足各个场景条件下的量化值；第二，使用非对称量化提升量化后数值的表达精度，但是量化后计算过程变得复杂。

发明内容

为解决前述问题，本发明提供了一种目标检测方法，在训练过程调整权重值，可以保证精度，并满足各个场景条件下的需求，简化计算过程。

为了达到上述目的，本发明采用如下技术方案：

一种目标检测方法，包括如下步骤：

收集训练样本，对收集的训练样本进行预处理；

构建目标检测模型，所述目标检测模型包括若干卷积层，所述卷积层具有激活函数和卷积权重；

利用训练样本对目标检测模型进行训练；

利用训练好的目标检测模型进行目标检测识别；

利用训练样本对目标检测模型进行训练时，对所述卷积权重和所述激活函数的输入值分别进行量化，所述目标检测模型的损失函数为：

其中，minimize _Q(w),Q(x)为目标函数最小值，y为目标，w表示卷积权重，Q(w)表示量化后的卷积权重，x表示输入值，Q(x)表示量化后的输入值；

对量化后的卷积权重Q(w)和量化后的输入值Q(x)进行调整迭代。

可选的，所述卷积层包括Bn层，对所述卷积权重进行量化包括如下步骤：

预设卷积权重需要被量化到的大小；

将Bn层的参数合入到卷积层的参数；

根据公式1添加被训练参数v ₁、v ₂、v ₃

公式1

其中，Q’(w)表示归一映射函数，n ₁表示卷积权重需要被量化到的大小，

，

，sign函数表示函数自变量为负时取值-1，函数自变量为正时取值+1；

根据公式1对卷积权重进行归一映射，把卷积权重映射到[-1，1]，再根据公式2对卷积权重进行量化，用量化后的卷积权重执行卷积操作：

公式2

其中，

，n ₁表示卷积权重需要被量化到的大小，

表示取整操作。

可选的，在卷积的反向处理中，在对卷积权重进行量化的过程中使用透传操作。

可选的，所述激活函数具有激活权重，利用训练样本对目标检测模型进行训练时，预设激活权重需要被量化到的大小，然后根据公式3对激活权重进行归一映射，把激活权重映射到[-1，1]：

公式3

其中，c表示激活权重，Q(c)表示归一映射函数，sign函数表示函数自变量为负时取值-1，函数自变量为正时取值+1，

表示取整操作，

，n ₂表示激活权重需要被量化到的大小。

可选的，对所述激活函数的输入值进行量化包括如下步骤：

预设输入值需要被量化到的大小；

根据公式4添加被训练参数d ₁、d ₂，并将输入值映射到[-1，1]

公式4

其中，x表示输入值，Q(x)表示量化后的输入值，n ₃表示输入值需要被量化到的大小，

，

，sign函数表示函数自变量为负时取值-1，函数自变量为正时取值+1。

可选的，在输入值量化的反向处理中，在对输入值进行量化的过程中使用透传操作。

可选的，利用训练样本对目标检测模型进行训练时，学习率为0.01，且学习率下降至少10倍，批量大小为128，训练样本至少遍历5次，卷积权重的衰退为0.0005。

可选的，训练样本中的目标包括子目标，对收集的训练样本进行预处理包括：

将子目标的对应位置映射到指定位置，将训练样本缩放到112*112的分辨率；

归一化训练样本的图片亮度，把训练样本的图片亮度归一到100，再根据如下公式进行归一化形成数据：

其中：

为归一化形成的数据，x为训练样本。

本发明具有如下有益效果：

发明了所提供的技术方案，通过对卷积权重、激活权重以及激活函数的输入值分别进行量化，缩小量化的范围，使得量化精度更高，有利于在较低功耗、较低计算能力的设备上应用，更加方便移植到移动设备上；结合训练任务的损失函数，通过训练的损失函数的梯度来更新量化参数，提供端到端的量化训练方法，在场景复杂多变、光照条件不可控的情况下，依然做到满足各个场景、条件的应用，并且，在保证量化后数值的表达精度的前提下，减少可训练参数，减少量化损失，简化计算过程。

此外，本发明还提供了一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述任一项所述的方法。

同时，本发明还提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述任一项所述的方法。

本发明的这些特点和优点将会在下面的具体实施方式以及附图中进行详细的揭露。本发明最佳的实施方式或手段将结合附图来详尽表现，但并非是对本发明技术方案的限制。另外，在每个下文和附图中出现的这些特征、要素和组件是具有多个，并且为了表示方便而标记了不同的符号或数字，但均表示相同或相似构造或功能的部件。

附图说明

下面结合附图对本发明作进一步说明：

图1为本发明实施例一的流程图。

具体实施方式

下面结合本发明实施例的附图对本发明实施例的技术方案进行解释和说明，但下述实施例仅为本发明的优选实施例，并非全部。基于实施方式中的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得其他实施例，都属于本发明的保护范围。

在本说明书中引用的“一个实施例”或“实例”或“例子”意指结合实施例本身描述的特定特征、结构或特性可被包括在本专利公开的至少一个实施例中。短语“在一个实施例中”在说明书中的各位置的出现不必都是指同一个实施例。

实施例一：

如图1所示，本实施例提供了一种目标检测方法，具体而言，是用于人脸识别的目标检测方法，包括如下步骤：

收集训练样本，所收集的训练样本包括各种姿态、角度、不同光照下的人脸训练样本；对收集的训练样本进行预处理。训练样本中的目标包括子目标，具体到本实施例中，子目标则是指人脸的左眼、右眼、鼻子、左嘴角、右嘴角。对收集的训练样本进行预处理包括：

将子目标的对应位置映射到指定位置，即根据左眼、右眼、鼻子、左嘴角、右嘴角的位置，映射到如下标准位置：

左眼： [30.29459953, 51.69630051]；

右眼： [65.53179932, 51.50139999]；

鼻子： [48.02519989, 71.73660278]；

左嘴角：[33.54930115, 92.3655014]；

右嘴角：[62.72990036, 92.20410156]。

然后将训练样本缩放到112*112的分辨率；

其中：

为归一化形成的数据，x为训练样本，即训练样本的原始图片数据。

构建目标检测模型如下表所示：

其中k为卷积核大小，n为输出卷积特征图个数，s为卷积滑动步长，Bn为BatchNormalization层，PReLU6为使用的激活函数。

目标检测模型包括若干卷积层，卷积层包括Bn层，卷积层具有卷积权重和激活函数，激活函数具有激活权重。

利用训练样本对目标检测模型进行训练。在这一步骤中，需要对目标检测模型的激活函数的输入值、卷积权重以及激活权重分别进行量化。

对卷积权重进行量化包括如下步骤：

预设卷积权重需要被量化到的大小；

将Bn层的参数合入到卷积层的参数，合入的计算方式为本领域技术人员所公知的标准计算公式，在此不再赘述；

根据公式1添加被训练参数v ₁、v ₂、v ₃

公式1

，

根据公式1对卷积权重进行归一映射，把卷积权重映射到[-1，1]，以便于后续的量化操作。再根据公式2对卷积权重进行量化，用量化后的卷积权重执行卷积操作：

公式2

其中，Q(w)表示量化后的卷积权重，

，n ₁表示卷积权重需要被量化到的大小，

表示取整操作。

在卷积的反向处理中，在对卷积权重进行量化的过程中使用透传操作。

对于激活权重的量化，包括如下步骤：

预设激活权重需要被量化到的大小，然后根据公式3对激活权重进行归一映射，把激活权重映射到[-1，1]：

公式3

表示取整操作，

，n ₂表示激活权重需要被量化到的大小。

对激活函数的输入值进行量化包括如下步骤：

预设输入值需要被量化到的大小；

公式4

，

在输入值量化的反向处理中，在对输入值进行量化的过程中使用透传操作。

对每一层的卷积权重，激活权重以及激活函数的输入值都添加前述的量化操作，累加层和分类层不需要添加量化操作。

通过对卷积权重、激活权重以及激活函数的输入值分别进行量化，缩小量化的范围，使得量化精度更高，有利于在较低功耗、较低计算能力的设备上应用，更加方便移植到移动设备上。

完成对于目标检测模型的激活函数的输入值、卷积权重以及激活权重分的量化以后，构建损失函数。本实施例中，目标检测模型的损失函数为：

其中，minimize _Q(w),Q(x)为目标函数最小值，y为目标，Q(w)表示量化后的卷积权重，Q(x)表示量化后的输入值；同时，使用sgd优化方法，设置学习率为0.01，且学习率下降至少10倍，批量大小为128，训练样本至少遍历5次，因此总共至少遍历40次，卷积权重的衰退为0.0005，对量化后的卷积权重Q(w)、量化后的输入值Q(x)以及量化后的激活权重进行调整迭代，在保证卷积权重、激活权重以及激活函数的输入值量化的同时，使整体损失最小，得到最优的量化结果。结合训练任务的损失函数，通过训练的损失函数的梯度来更新量化参数，提供端到端的量化训练方法，在场景复杂多变、光照条件不可控的情况下，依然做到满足各个场景、条件的应用，并且，在保证量化后数值的表达精度的前提下，减少可训练参数，减少量化损失，简化计算过程。

最后，利用训练好的目标检测模型进行目标检测识别。

实施例二

本实施例提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现如上的任意实施例中的方法。本领域普通技术人员可以理解，实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成。据此，的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可实现上述任意一项实施例的方法。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM (PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)以及存储器总线动态RAM(RDRAM)等。

以上，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，熟悉该本领域的技术人员应该明白本发明包括但不限于附图和上面具体实施方式中描述的内容。任何不偏离本发明的功能和结构原理的修改都将包括在权利要求书的范围中。