CN108288089A

CN108288089A - 用于生成卷积神经网络的方法和装置

Info

Publication number: CN108288089A
Application number: CN201810084926.1A
Authority: CN
Inventors: 姜志超
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Baidu Online Network Technology Beijing Co Ltd; Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2018-01-29
Filing date: 2018-01-29
Publication date: 2018-07-17

Abstract

本申请实施例公开了用于生成卷积神经网络的方法和装置。该方法的一具体实施方式包括：获取卷积神经网络的目标卷积层的初始输入值和初始权重，以分别生成第一输入值集合和第一权重集合；根据当前阶段的量化比例，对第一输入值集合和第一权重集合分别进行量化取整，生成第二输入值集合和第二权重集合，其中，第二权重集合中包括量化取整后的第一权重；将第二权重集合作为目标卷积层的权重，并确定当前阶段的总量化比例是否达到预设比例值；响应于确定当前阶段的总量化比例达到预设比例值，生成并存储目标卷积神经网络。该实施方式可以实现目标卷积层权重的多阶段量化，有助于提高卷积神经网络的生成方法的灵活性。

Description

用于生成卷积神经网络的方法和装置

技术领域

本申请实施例涉及计算机技术领域，具体涉及神经网络技术领域，尤其涉及用于生成卷积神经网络的方法和装置。

背景技术

深度学习的概念源于人工神经网络的研究。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征，以发现数据的分布式特征表示。深度学习是机器学习研究中的一个新的领域，其动机在于建立、模拟人脑进行分析学习的神经网络，它模仿人脑的机制来解释数据，例如图像，声音和文本。

同机器学习方法一样，深度机器学习方法也有监督学习与无监督学习之分。不同的学习框架下建立的学习模型很是不同。例如，卷积神经网络(Convolution NeuralNetwork，简称CNN)就是一种深度的监督学习下的机器学习模型；而深度置信网(DeepBelief Net，简称DBN)就是一种无监督学习下的机器学习模型。

发明内容

本申请实施例提出了用于生成卷积神经网络的方法和装置。

第一方面，本申请实施例提供了一种用于生成卷积神经网络的方法，包括：获取卷积神经网络的目标卷积层的初始输入值和初始权重；根据初始输入值和初始权重，分别生成第一输入值集合和第一权重集合；根据当前阶段的量化比例，对第一输入值集合中的各第一输入值和第一权重集合中的各第一权重分别进行量化取整，生成第二输入值集合和第二权重集合，其中，第二权重集合中包括量化取整后的第一权重；将第二权重集合作为目标卷积层的权重，并确定目标卷积层的权重在当前阶段的总量化比例是否达到预设比例值；响应于确定目标卷积层的权重在当前阶段的总量化比例达到预设比例值，将当前阶段的卷积神经网络作为目标卷积神经网络，并存储目标卷积神经网络。

在一些实施例中，该方法还包括：响应于确定目标卷积层的权重在当前阶段的总量化比例未达到预设比例值，根据损失函数对当前阶段的卷积神经网络进行训练，以调整第二权重集合中未量化取整的第一权重，直至损失函数的值趋于目标值；获取下一阶段的量化比例作为当前阶段的量化比例；根据当前阶段的量化比例，对第二输入值集合中未量化取整第一输入值和第二权重集合中未量化取整的第一权重分别进行量化取整，以更新第二输入值集合和第二权重集合；将更新的第二权重集合作为目标卷积层的权重，并确定目标卷积层的权重在当前阶段的总量化比例是否达到预设比例值。

在一些实施例中，根据初始输入值和初始权重，分别生成第一输入值集合和第一权重集合，包括：根据量化编码的位数，将初始输入值的范围和初始权重的范围分别均匀划分为预设数目个子区间，其中，预设数目与量化编码的位数正相关；根据位于预设数目个子区间中的各输入值和各权重，分别生成第一输入值集合和第一权重集合。

在一些实施例中，对第一输入值集合中的各第一输入值和第一权重集合中的各第一权重分别进行量化取整，生成第二输入值集合和第二权重集合，包括：根据预设量化方法，对第一输入值集合中的各第一输入值进行量化取整，并将量化取整后的第一输入值作为第二输入值，生成第二输入值集合；根据第一权重集合中的各第一权重的分布概率，对第一权重集合中的各第一权重进行上取整或下取整，并将取整后的第一权重作为第二权重，生成第二权重集合。

在一些实施例中，根据初始输入值和初始权重，分别生成第一输入值集合和第一权重集合，包括：根据预设的第一数值，将初始输入值的范围和初始权重的范围划分为预设数目个区间长度不同的子区间；以第一数值为底数，计算各初始输入值的对数，将计算结果作为第一输入值，生成第一输入值集合；根据位于各子区间的各初始权重，确定区间权重，以作为第一权重，生成第一权重集合。

在一些实施例中，对第一输入值集合中的各第一输入值和第一权重集合中的各第一权重分别进行量化取整，生成第二输入值集合和第二权重集合，包括：对第一输入值集合中的各第一输入值进行量化取整，并以量化取整后的各第一输入值分别为指数，计算第一数值的指数幂，以作为第二输入值，生成第二输入值集合；根据各子区间的顺序，依次对各第一权重建立序号，生成查询表，并将各第一权重对应的序号作为第二权重，生成第二权重集合，其中，序号为整数，且查询表中序号与和各第一权重以键值对形式存储。

在一些实施例中，根据当前阶段的量化比例，对第一输入值集合中的各第一输入值和第一权重集合中的各第一权重分别进行量化取整，包括：根据当前阶段的量化比例，在第一输入值集合和第一权重集合中分别选取相应数量的第一输入值和第一权重进行量化取整，其中，选取包括按照数值由大到小，从数值大的一端选取，或者按照量化误差由小到大，从误差小的一端选取。

在一些实施例中，该方法还包括：获取目标卷积神经网络的目标卷积层的初始输入信息；对初始输入信息进行量化取整，得到整数输入值；将整数输入值输入目标卷积层，并与目标卷积层的权重进行卷积运算，生成输出信息。

第二方面，本申请实施例提供了一种用于生成卷积神经网络的装置，包括：第一获取单元，配置用于获取卷积神经网络的目标卷积层的初始输入值和初始权重；第一生成单元，配置用于根据初始输入值和初始权重，分别生成第一输入值集合和第一权重集合；第一量化单元，配置用于根据当前阶段的量化比例，对第一输入值集合中的各第一输入值和第一权重集合中的各第一权重分别进行量化取整，生成第二输入值集合和第二权重集合，其中，第二权重集合中包括量化取整后的第一权重；确定单元，配置用于将第二权重集合作为目标卷积层的权重，并确定目标卷积层的权重在当前阶段的总量化比例是否达到预设比例值；第二生成单元，配置用于响应于确定目标卷积层的权重在当前阶段的总量化比例达到预设比例值，将当前阶段的卷积神经网络作为目标卷积神经网络，并存储目标卷积神经网络。

在一些实施例中，该装置还配置用于：响应于确定目标卷积层的权重在当前阶段的总量化比例未达到预设比例值，根据损失函数对当前阶段的卷积神经网络进行训练，以调整第二权重集合中未量化取整的第一权重，直至损失函数的值趋于目标值；获取下一阶段的量化比例作为当前阶段的量化比例；根据当前阶段的量化比例，对第二输入值集合中未量化取整第一输入值和第二权重集合中未量化取整的第一权重分别进行量化取整，以更新第二输入值集合和第二权重集合；将更新的第二权重集合作为目标卷积层的权重，并确定目标卷积层的权重在当前阶段的总量化比例是否达到预设比例值。

在一些实施例中，第一生成单元进一步配置用于：根据量化编码的位数，将初始输入值的范围和初始权重的范围分别均匀划分为预设数目个子区间，其中，预设数目与量化编码的位数正相关；根据位于预设数目个子区间中的各输入值和各权重，分别生成第一输入值集合和第一权重集合。

在一些实施例中，第一量化单元进一步配置用于：根据预设量化方法，对第一输入值集合中的各第一输入值进行量化取整，并将量化取整后的第一输入值作为第二输入值，生成第二输入值集合；根据第一权重集合中的各第一权重的分布概率，对第一权重集合中的各第一权重进行上取整或下取整，并将取整后的第一权重作为第二权重，生成第二权重集合。

在一些实施例中，第一生成单元还进一步配置用于：根据预设的第一数值，将初始输入值的范围和初始权重的范围划分为预设数目个区间长度不同的子区间；以第一数值为底数，计算各初始输入值的对数，将计算结果作为第一输入值，生成第一输入值集合；根据位于各子区间的各初始权重，确定区间权重，以作为第一权重，生成第一权重集合。

在一些实施例中，第一量化单元还进一步配置用于：对第一输入值集合中的各第一输入值进行量化取整，并以量化取整后的各第一输入值分别为指数，计算第一数值的指数幂，以作为第二输入值，生成第二输入值集合；根据各子区间的顺序，依次对各第一权重建立序号，生成查询表，并将各第一权重对应的序号作为第二权重，生成第二权重集合，其中，序号为整数，且查询表中序号与和各第一权重以键值对形式存储。

在一些实施例中，第一量化单元进一步配置用于：根据当前阶段的量化比例，在第一输入值集合和第一权重集合中分别选取相应数量的第一输入值和第一权重进行量化取整，其中，选取包括按照数值由大到小，从数值大的一端选取，或者按照量化误差由小到大，从误差小的一端选取。

在一些实施例中，该装置还包括：第二获取单元，配置用于获取目标卷积神经网络的目标卷积层的初始输入信息；第二量化单元，配置用于对初始输入信息进行量化取整，得到整数输入值；第三生成单元，配置用于将整数输入值输入目标卷积层，并与目标卷积层的权重进行卷积运算，生成输出信息。

第三方面，本申请实施例提供了一种电子设备，包括：一个或多个处理器；存储装置，用于存储一个或多个程序；当一个或多个程序被一个或多个处理器执行，使得一个或多个处理器实现如上述第一方面中任一实施例所描述的方法。

第四方面，本申请实施例提供了一种计算机可读存储介质，其上存储有计算机程序，其中，该计算机程序被处理器执行时实现如上述第一方面中任一实施例所描述的方法。

本申请实施例提供的用于生成卷积神经网络的方法和装置，通过获取卷积神经网络的目标卷积层的初始输入值和初始权重，从而可以分别生成第一输入值集合和第一权重集合。接着，根据当前阶段的量化比例，可以对第一输入值集合中的各第一输入值和第一权重集合中的各第一权重分别进行量化取整，以生成第二输入值集合和第二权重集合。其中，第二权重集合中包括量化取整后的第一权重。之后，可以将第二权重集合作为目标卷积层的权重，即将目标卷积层的至少部分权重转换为整数权重。同时，可以确定目标卷积层的权重在当前阶段的总量化比例是否达到预设比例值。若确定当目标卷积层的权重在前阶段的总量化比例达到预设比例值，则可以将当前阶段的卷积神经网络作为目标卷积神经网络，并存储该目标卷积神经网络。即此时的目标卷积神经网络的目标卷积层中，整数权重的总比例为上述预设比例值。这种实施方式可以实现目标卷积层权重的多阶段量化，可以丰富卷积神经网络的生成方法，且有助于提高卷积神经网络的生成方法的灵活性。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本申请的其它特征、目的和优点将会变得更明显：

图1是本申请可以应用于其中的示例性***架构图；

图2是根据本申请的用于生成卷积神经网络的方法的一个实施例的流程图；

图3是根据本申请的用于生成卷积神经网络的装置的一个实施例的结构示意图；

图4是适于用来实现本申请实施例的电子设备的计算机***的结构示意图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释相关发明，而非对该发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与有关发明相关的部分。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

图1示出了可以应用本申请的用于生成卷积神经网络的方法或用于生成卷积神经网络的装置的示例性***架构100。

如图1所示，***架构100可以包括终端101、102、103，网络104和服务器105。网络104用以在终端101、102、103与服务器105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端101、102、103可以通过网络104与服务器105进行交互，以接收或发送消息等。终端101、102、103上可以安装有各种客户端应用，例如训练神经网络类应用、网页浏览器、搜索类应用、购物类应用和即时通讯工具等。

终端101、102、103可以是具有显示屏的各种电子设备，包括但不限于智能手机、平板电脑、电子书阅读器、膝上型便携计算机和台式计算机等等。

服务器105可以是提供各种服务的服务器，例如对终端101、102、103上显示的各种应用提供支持的后台服务器。后台服务器可以对终端101、102、103发送的目标卷积层的初始输入值和初始权重进行分析处理，以对卷积神经网络进行训练，并且可以将处理结果(例如生成的目标卷积神经网络)发送给终端101、102、103。其中，目标卷积神经网络的目标卷积层的至少部分权重为整数。

需要说明的是，本申请实施例所提供的用于生成卷积神经网络的方法一般由服务器105执行，相应地，用于生成卷积神经网络的装置一般设置于服务器105中。

应该理解，图1中的终端、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端、网络和服务器。

继续参考图2，其示出了根据本申请的用于生成卷积神经网络的方法的一个实施例的流程200。该用于生成卷积神经网络的方法可以包括以下步骤：

步骤201，获取卷积神经网络的目标卷积层的初始输入值和初始权重。

在本实施例中，用于生成卷积神经网络的方法运行于其上的电子设备(例如图1所示的服务器105)可以通过多种方法，来获取卷积神经网络的目标卷积层的初始输入值和初始权重。例如通过有线连接方式或无线连接方式，从与其通信连接的终端(例如图1所示的终端101、102、103)、数据库服务器或者云服务器等，来获取上述初始输入值和初始权重。

在本实施例中，卷积神经网络可以是具有各种功能或用途的卷积神经网络，如可以用于人脸检测或人脸识别的卷积神经网络。其可以是已训练好的卷积神经网络，也可以是待训练的卷积神经网络。卷积神经网络一般是一种前馈神经网络，它的人工神经元可以响应一部分覆盖范围内的周围单元，对于大型图像处理有出色表现。卷积神经网络通常可以包括卷积层(alternating convolution layer)、池层(pooling layer)和全连接层等。这里的目标卷积层可以是目标卷积神经网络中的任意卷积层。

在本实施例中，初始输入值可以是输入目标卷积层的任意输入信息。例如可以是描述人脸图像的输入信息；再例如可以是上一卷积层的输出信息等。而初始权重可以是目标卷积层的任意权重。例如人为设置的初始权重；再例如通过反向传播算法等方法修正后的权重等。在这里，初始输入值和初始权重的值可以是整数值和/或浮点值。

需要说明的是，当某一卷积层的卷积核为1×1，说明该卷积层的输出与输入的大小相同。此时，为了避免将该卷积层的权重量化为整数而引入误差，所以可以不将该卷积层的权重量化为整数。也就是说，目标卷积层可以不包括卷积核为1×1的卷积层。此外，卷积神经网络的存储位置在本申请中并不限制。例如可以存储在电子设备本地，也可以存储在数据库服务器或云服务器上。

步骤202，根据初始输入值和初始权重，分别生成第一输入值集合和第一权重集合。

在本实施例中，根据步骤201中获取的初始输入值和初始权重，电子设备可以采用各种方法，来分别生成第一输入值集合和第一权重集合。

在本实施例的一些可选地实现方式中，电子设备可以直接将各初始输入值作为第一输入值，从而生成第一输入值集合。同时，可以直接将各初始权重作为第一权重，从而生成第一权重集合。

可选地，电子设备还可以将初始权重的范围划分为一定数目个子区间；然后，根据每个子区间中的初始权重，可以确定区间权重，以作为第一权重，从而生成第一权重集合。其中，划分方法可以包括随机、等间隔或不等间隔划分中的至少一种。这里的一定数目可以根据实际情况进行设置。

进一步地，电子设备可以采用均匀量化方法，即先根据量化编码的位数，将初始输入值的范围和初始权重的范围分别均匀划分为预设数目个子区间。其中，预设数目与量化编码的位数正相关。然后，可以根据位于预设数目个子区间中的各输入值和各权重，分别生成第一输入值集合和第一权重集合。这里量化编码的位数可以是电子设备记载、传输信息所用的编码的位数，如二进制编码的位数、十进制编码的位数等。

例如，电子设备可以直接将初始输入值的范围均匀划分为预设数目个子区间。且直接将初始权重的范围均匀划分为预设数目个子区间。然后，可以将位于预设数目个子区间中的各初始输入值分别作为第一输入值，从而生成第一输入值集合。同时，可以将位于预设数目个子区间中的各初始权重分别作为第一权重，从而生成第一权重集合。或者，也可以根据位于该子区间内的各初始权重，确定该子区间的区间权重，以作为第一权重，从而生成第一权重集合。其中，确定方法可以包括计算位于该子区间的各初始权重的统计平均值或中值。

再例如，电子设备可以先将初始输入值的范围放缩至预设范围内，再将该预设范围均匀划分为预设数目个子区间。然后，可以将上述预设范围内的各输入值，即放缩后的初始输入值，作为第一输入值，生成第一输入值集合。同时，可以将初始权重的范围均放缩至预设范围内，并将该预设范围均匀划分为预设数目个子区间。之后，可以将预设范围内的各权重，即放缩后的初始权重，作为第一权重，生成第一权重集合。其中，预设范围的边界值可以为整数。

作为示例，量化编码的位数可以为8，即二进制编码的位数为8。若初始权重的范围为[a,b]，则电子设备可以先将该范围放缩至[0,2⁸]范围内；接着可以将[0,2⁸]的权重范围均匀划分为256个子区间。此时，各子区间的区间长度均为1，即依次为[0,1]、[1,2]、[2,3]···[255,256]。

再或者，电子设备可以先将[a,b]归一至[0,1]范围；然后可以将归一后的权重范围均匀划分为256个子区间，即区间长度为1/256；之后可以再放缩至[0,2⁸]范围内，以使各子区间的边界值为整数，即[0,1]、[1,2]、[2,3]等。

在本实施例的一些可选地实现方式中，电子设备还可以采用对数量化方法，即根据预设的第一数值，将初始输入值的范围和初始权重的范围划分为预设数目个区间长度不同的子区间；以第一数值为底数，计算各初始输入值的对数，将计算结果作为第一输入值，生成第一输入值集合；根据位于各子区间的各初始权重，确定区间权重，以作为第一权重，生成第一权重集合。这里的确定方法同样不限制。其中，第一数值可以是1以外的正整数。

例如，量化编码的位数可以为8，即二进制编码的位数为8。若初始输入值(如x)的范围为[a,b]，第一数值为r。则电子设备可以将该范围划分为区间长度分别为(b-a)/r、(b-a)/r²、(b-a)/r³···(b-a)/r²⁵⁶的256个子区间。然后，可以将log_r ^x作为第一输入值，从而生成第一输入值集合。

步骤203，根据当前阶段的量化比例，对第一输入值集合中的各第一输入值和第一权重集合中的各第一权重分别进行量化取整，生成第二输入值集合和第二权重集合。

在本实施例中，电子设备可以根据当前阶段的量化比例，在第一输入值集合和第一权重集合中分别选取相应数量的第一输入值和第一权重进行量化取整。从而可以分别生成第二输入值集合和第二权重集合。其中，具体选取方式并不限制，如可以是随机选取；也可以是按照数值由大到小，从数值大的一端选取；或者按照量化误差由小到大，从误差小的一端选取。这里的量化方法同样不限制。

在本实施例中，第二输入值集合中可以包括量化取整后的第一输入值。第二权重集合中可以包括量化取整后的第一权重。需要说明的是，在第一输入值集合中的各第一输入值未被全部量化之前，第二输入值集合中还可以包括未量化的第一输入值。且在第一权重集合中的各第一权重未被全部量化之前，第二权重集合中还可以包括未量化的第一权重。

可以理解的是，当前阶段的量化比例的获取方式在本申请中并不限制。如可以是电子设备从本地的预置参数文件中获取的，也可以是电子设备从云服务器获取的，还可以是用户通过终端发送给电子设备的。

在本实施例的一些可选地实现方式中，对于均匀量化方法，电子设备可以根据预设量化方法，对第一输入值集合中的各第一输入值进行量化取整。并可以将量化取整后的第一输入值作为第二输入值，生成第二输入值集合。其中，预设量化方法可以根据实际情况进行设置，如可以采用四舍五入的方法。

进一步地，电子设备可以根据第一权重集合中的各第一权重的分布概率，对该第一权重集合中的各第一权重进行随机化处理(上取整或下取整)。并可以将取整后的第一权重作为第二权重，生成第二权重集合。例如，对于[0,1]子区间内的各第一权重，若至少一半的第一权重均分布在[0.5,1]之间，则可以对该子区间内的各第一权重进行上取整，即全部量化取整为1。这样有助于降低量化误差。

可以理解的是，采用均匀划分子区间的方法，可以使量化后的权重分布更加均匀。同时，采用随机化处理，可以平衡由于精度损失导致整体参数的分布空间的缩小，从而可以提高参数的分布空间。

可选地，对于对数量化方法，电子设备可以对第一输入值集合中的各第一输入值进行量化取整，即round(log_r ^x)。并且可以以量化取整后的各第一输入值分别为指数，计算第一数值的指数幂，即r ⁿ(n＝round(log_r ^x))，以作为第二输入值，生成第二输入值集合。

同时，电子设备可以根据各子区间的顺序，依次对各第一权重建立序号，生成查询表。并可以将各第一权重对应的序号作为第二权重，从而生成第二权重集合。其中，序号为整数。且查询表中序号与第一权重以键值对形式存储。

例如，根据数值大小，由于[a,(b-a)/r]为第一个子区间，所以位于该子区间内的第一权重对应的序号可以为1。而位于其他子区间的第一权重对应的序号可以依次为2、3、4等等。也就是说，通过整数序号来代替权重，这样可以减少卷积神经网络所需占用的存储空间。同时又可以避免对权重进行实际的量化取整处理，从而可以简化处理过程，提高运算效率。而且可以避免因量化取整处理引入误差。

步骤204，将第二权重集合作为目标卷积层的权重，并确定目标卷积层的权重在当前阶段的总量化比例是否达到预设比例值。

在本实施例中，电子设备可以将步骤203中生成的第二权重集合中的各权重，作为卷积神经网络的目标卷积层的权重。并且可以确定目标卷积层的权重在当前阶段的总量化比例是否达到预设比例值(如100％)。若目标卷积层的权重在当前阶段的总量化比例达到预设比例值，则可以继续执行步骤205；若目标卷积层的权重在当前阶段的总量化比例未达到预设比例值，则可以执行步骤206。可以理解的是，目标卷积层的权重在当前阶段的总量化比例可以是指到当前阶段为止目标卷积层中已被量化的权重在目标卷积层的权重中的比例。即已被量化的第一权重在第二权重集合中的比例。

步骤205，响应于确定目标卷积层的权重在当前阶段的总量化比例达到预设比例值，将当前阶段的卷积神经网络作为目标卷积神经网络，并存储目标卷积神经网络。

在本实施例中，若在步骤204中确定目标卷积层的权重在当前阶段的总量化比例达到预设比例值，说明量化过程已完成。则电子设备可以将当前阶段的卷积神经网络，即目标卷积层的权重已为第二权重集合、且总量化比例达到上述预设比例值的卷积神经网络，作为目标卷积神经网络。并且可以存储该目标卷积神经网络。可以理解的是，在目标卷积神经网络的生成过程中，上述预设比例值通常可以是一恒定值。

步骤206，响应于确定目标卷积层的权重在当前阶段的总量化比例未达到预设比例值，根据损失函数对当前阶段的卷积神经网络进行训练，以调整第二权重集合中未量化取整的第一权重，直至损失函数的值趋于目标值。

在本实施例中，若在步骤204中确定目标卷积层的权重在当前阶段的总量化比例未达到预设比例值，说明量化过程还未完成。则电子设备可以根据损失函数对当前阶段的卷积神经网络进行训练，以调整第二权重集合中未量化取整的第一权重，直至损失函数的值趋于目标值。其中，目标值可以根据实际情况来设置。也就是说，在多阶段量化的过程中，第一权重被量化一次后可以保持不变。

需要说明的是，除了采用损失函数外，也可以采用其他训练方法，以使当前阶段(即当前阶段的量化比例下)的卷积神经网络稳定或收敛。

步骤207，获取下一阶段的量化比例作为当前阶段的量化比例。

在本实施例中，在步骤206中的当前阶段的卷积神经网络训练收敛后，电子设备可以获取下一阶段的量化比例作为当前阶段的量化比例，以进行下一阶段的量化过程。

步骤208，根据当前阶段的量化比例，对第二输入值集合中未量化取整第一输入值和第二权重集合中未量化取整的第一权重分别进行量化取整，以更新第二输入值集合和第二权重集合。

在本实施例中，电子设备可以根据步骤207中的当前阶段的量化比例，从第二输入值集合中未量化取整的各第一输入值中选取相应数量的第一输入值进行量化取整，并更新第二输入值集合。同时，可以从第二权重集合中未量化取整的各第一权重中选取相应数量的第一权重进行量化取整，并更新第二权重集合。这里的选取方法可以与上述选取方法相同。

也就是说，本实施例中的多阶段量化采用的是增量量化，即在前一阶段量化的基础上，进行下一阶段量化。例如两个阶段的量化比例依次为20％和50％，那么第一阶段可以量化至20％(即量化20％)，第二阶段可以量化至50％(即在第一阶段的基础上再量化30％)，或者第二阶段可以量化至70％(即在第一阶段的基础上再量化50％)。

步骤209，将更新的第二权重集合作为目标卷积层的权重，并确定目标卷积层的权重在当前阶段的总量化比例是否达到预设比例值。

在本实施例中，电子设备可以将更新的第二权重集合中的权重作为目标卷积层的权重，即更新目标卷积层的权重。同时，可以继续确定目标卷积层的权重在当前阶段的总量化比例是否达到上述预设比例值。若确定目标卷积层的权重在当前阶段的总量化比例达到预设比例值，则可以返回执行步骤205；若确定目标卷积层的权重在当前阶段的总量化比例未达到预设比例值，则可以继续执行步骤206。

可以理解的是，本实施例中的方法可以通过多阶段量化来生成目标卷积神经网络。这样，对于不同的量化阶段(量化比例)，可以调整卷积神经网络的处理精度，从而有利于提高训练的灵活性。同时，在多阶段量化的过程中，可以便于问题的发现和解决。

此外，为了提高生成目标卷积神经网络的效率，在上述实施例中可以仅对目标卷积层的权重进行多阶段量化，而对于目标卷积层的初始输入值可以将其全部量化取整，以生成第二输入值集合。此时的第二输入值集合中不存在未量化取整的第一输入值。这样，在后面的各量化阶段中，可以不需要再对第二输入值集合进行处理和更新，从而简化了处理过程。同时，由于在各量化阶段中，目标卷积层的输入值(即第二输入值集合)保持不变，所以有助于保证生成的目标卷积神经网络的目标卷积层的权重的精度。

在一些应用场景中，在生成目标卷积神经网络之后，电子设备还可以获取该目标卷积神经网络的目标卷积层的初始输入信息；然后，可以对初始输入信息进行量化取整，得到整数输入值；之后，可以将整数输入值输入目标卷积层，并与目标卷积层的权重进行卷积运算，生成输出信息。其中，目标卷积层的权重为整数。也就是说，将输入信息转换为整数后，可以实现整数与整数间的运算，这样有助于提高运算效率。

可以理解的是，通过上述方法得到的目标卷积神经网络，可以实现将浮点数运算转换为定点数运算，这样可以减少内存空间的占用，同时有助于提高运算速度。且通过实验可知，对于通用CPU(Central Processing Unit，中央处理器)，其处理速度可以提升至原来的大致两倍。对于FPGA(Field-Programmable Gate Array，现场可编程门阵列)，其处理速度基本上可以与图形处理器(Graphics Processing Unit，GPU)同步。而且可以减小能耗。

此外，为了使量化后的权重分布更加均匀，电子设备还可以在量化之前对权重中的离群点进行处理。具体地，首先，电子设备可以统计权重的分布信息；然后，根据分布信息，可以确定权重中是否存在满足预设条件的权重；接着，若确定存在满足预设条件的权重，可以对满足预设条件的权重进行处理。其中，处理方式可以是删除或缩放那些满足预设条件的权重。

这里的缩放方式并不限制，可以是按比例缩放，也可以是缩放至目标权重值等。这里的预设条件同样可以根据实际情况设置，如可以是权重值超出平均权重值的预设比例(如5％)，还可以是按照权重值由大到小的顺序，排列在大的一端的一定比例(如前5％)的权重。需要说明的是，上述处理过程可以包含在每次迭代训练中，也可以每间隔一定迭代训练次数之后再进行。

本实施例提供的用于生成卷积神经网络的方法，通过获取卷积神经网络的目标卷积层的初始输入值和初始权重，从而可以分别生成第一输入值集合和第一权重集合。接着，根据当前阶段的量化比例，可以对第一输入值集合中的各第一输入值和第一权重集合中的各第一权重分别进行量化取整，以生成第二输入值集合和第二权重集合。其中，第二权重集合中包括量化取整后的第一权重。之后，可以将第二权重集合作为目标卷积层的权重，即将目标卷积层的至少部分权重转换为整数权重。同时，可以确定目标卷积层的权重在当前阶段的总量化比例是否达到预设比例值。若确定目标卷积层的权重在当前阶段的总量化比例达到预设比例值，则可以将当前阶段的卷积神经网络作为目标卷积神经网络，并存储该目标卷积神经网络。此时的目标卷积神经网络的目标卷积层中，整数权重的总比例为上述预设比例值。这种实施方式可以实现目标卷积层权重的多阶段量化，可以丰富卷积神经网络的生成方法，且有助于提高卷积神经网络的生成方法的灵活性。

进一步参见图3，作为对上述各图所示方法的实现，本申请提供了一种用于生成卷积神经网络的装置的一个实施例。该装置实施例与图2所示的方法实施例相对应，该装置具体可以应用于各种电子设备中。

如图3所示，本实施例的用于生成卷积神经网络的装置300可以包括：第一获取单元301，配置用于获取卷积神经网络的目标卷积层的初始输入值和初始权重；第一生成单元302，配置用于根据初始输入值和初始权重，分别生成第一输入值集合和第一权重集合；第一量化单元303，配置用于根据当前阶段的量化比例，对第一输入值集合中的各第一输入值和第一权重集合中的各第一权重分别进行量化取整，生成第二输入值集合和第二权重集合，其中，第二权重集合中包括量化取整后的第一权重；确定单元304，配置用于将第二权重集合作为目标卷积层的权重，并确定目标卷积层的权重在当前阶段的总量化比例是否达到预设比例值；第二生成单元305，配置用于响应于确定目标卷积层的权重在当前阶段的总量化比例达到预设比例值，将当前阶段的卷积神经网络作为目标卷积神经网络，并存储目标卷积神经网络。

在本实施例中，第一获取单元301、第一生成单元302、第一量化单元303、确定单元304和第二生成单元305的具体实现方式及产生的有益效果，可以分别参见图2所示实施例中的步骤201、步骤202、步骤203步骤204和步骤205的相关描述，此处不再赘述。

在本实施例的一些可选的实现方式中，该装置300还可以配置用于：响应于确定目标卷积层的权重在当前阶段的总量化比例未达到预设比例值，根据损失函数对当前阶段的卷积神经网络进行训练，以调整第二权重集合中未量化取整的第一权重，直至损失函数的值趋于目标值；获取下一阶段的量化比例作为当前阶段的量化比例；根据当前阶段的量化比例，对第二输入值集合中未量化取整第一输入值和第二权重集合中未量化取整的第一权重分别进行量化取整，以更新第二输入值集合和第二权重集合；将更新的第二权重集合作为目标卷积层的权重，并确定目标卷积层的权重在当前阶段的总量化比例是否达到预设比例值。

可选地，第一生成单元302可以进一步配置用于：根据量化编码的位数，将初始输入值的范围和初始权重的范围分别均匀划分为预设数目个子区间，其中，预设数目与量化编码的位数正相关；根据位于预设数目个子区间中的各输入值和各权重，分别生成第一输入值集合和第一权重集合

进一步地，第一量化单元303可以进一步配置用于：根据预设量化方法，对第一输入值集合中的各第一输入值进行量化取整，并将量化取整后的第一输入值作为第二输入值，生成第二输入值集合；根据第一权重集合中的各第一权重的分布概率，对第一权重集合中的各第一权重进行上取整或下取整，并将取整后的第一权重作为第二权重，生成第二权重集合。

可选地，第一生成单元302还可以进一步配置用于：根据预设的第一数值，将初始输入值的范围和初始权重的范围划分为预设数目个区间长度不同的子区间；以第一数值为底数，计算各初始输入值的对数，将计算结果作为第一输入值，生成第一输入值集合；根据位于各子区间的各初始权重，确定区间权重，以作为第一权重，生成第一权重集合。

进一步地，第一量化单元303还可以进一步配置用于：对第一输入值集合中的各第一输入值进行量化取整，并以量化取整后的各第一输入值分别为指数，计算第一数值的指数幂，以作为第二输入值，生成第二输入值集合；根据各子区间的顺序，依次对各第一权重建立序号，生成查询表，并将各第一权重对应的序号作为第二权重，生成第二权重集合，其中，序号为整数，且查询表中序号与和各第一权重以键值对形式存储。

在一些实施例中，第一量化单元303可以进一步配置用于：根据当前阶段的量化比例，在第一输入值集合和第一权重集合中分别选取相应数量的第一输入值和第一权重进行量化取整，其中，选取包括按照数值由大到小，从数值大的一端选取，或者按照量化误差由小到大，从误差小的一端选取。

此外，该装置300还可以包括：第二获取单元(图中未示出)，配置用于获取目标卷积神经网络的目标卷积层的初始输入信息；第二量化单元(图中未示出)，配置用于对初始输入信息进行量化取整，得到整数输入值；第三生成单元(图中未示出)，配置用于将整数输入值输入目标卷积层，并与目标卷积层的权重进行卷积运算，生成输出信息。

下面参见图4，其示出了适于用来实现本申请实施例的电子设备的计算机***400的结构示意图。图4示出的电子设备仅仅是一个示例，不应对本申请实施例的功能和使用范围带来任何限制。

如图4所示，计算机***400包括中央处理单元(CPU)401，其可以根据存储在只读存储器(ROM)402中的程序或者从存储部分408加载到随机访问存储器(RAM)403中的程序而执行各种适当的动作和处理。在RAM 403中，还存储有***400操作所需的各种程序和数据。CPU 401、ROM 402以及RAM 403通过总线404彼此相连。输入/输出(I/O)接口405也连接至总线404。

以下部件连接至I/O接口405：包括触摸屏、键盘、鼠标等的输入部分406；包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分407；包括硬盘等的存储部分408；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分409。通信部分409经由诸如因特网的网络执行通信处理。驱动器410也根据需要连接至I/O接口405。可拆卸介质411，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器410上，以便于从其上读出的计算机程序根据需要被安装入存储部分408。

特别地，根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分409从网络上被下载和安装，和/或从可拆卸介质411被安装。在该计算机程序被中央处理单元(CPU)401执行时，执行本申请的方法中限定的上述功能。需要说明的是，本申请的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本申请中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、RF等等，或者上述的任意合适的组合。

附图中的流程图和框图，图示了按照本申请各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的***来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本申请实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中，例如，可以描述为：一种处理器包括获取单元、量化单元和生成单元。其中，这些单元的名称在某种情况下并不构成对该单元本身的限定，例如，获取单元还可以被描述为“获取目标卷积神经网络的目标卷积层的初始输入信息的单元”。

作为另一方面，本申请还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的电子设备中所包含的；也可以是单独存在，而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被该电子设备执行时，使得该电子设备：获取卷积神经网络的目标卷积层的初始输入值和初始权重；根据初始输入值和初始权重，分别生成第一输入值集合和第一权重集合；根据当前阶段的量化比例，对第一输入值集合中的各第一输入值和第一权重集合中的各第一权重分别进行量化取整，生成第二输入值集合和第二权重集合，其中，第二权重集合中包括量化取整后的第一权重；将第二权重集合作为目标卷积层的权重，并确定目标卷积层的权重在当前阶段的总量化比例是否达到预设比例值；响应于确定目标卷积层的权重在当前阶段的总量化比例达到预设比例值，将当前阶段的卷积神经网络作为目标卷积神经网络，并存储目标卷积神经网络。

以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本申请中所涉及的发明范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离上述发明构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims

1.一种用于生成卷积神经网络的方法，包括：

获取卷积神经网络的目标卷积层的初始输入值和初始权重；

根据所述初始输入值和所述初始权重，分别生成第一输入值集合和第一权重集合；

根据当前阶段的量化比例，对所述第一输入值集合中的各第一输入值和所述第一权重集合中的各第一权重分别进行量化取整，生成第二输入值集合和第二权重集合，其中，所述第二权重集合中包括量化取整后的第一权重；

将所述第二权重集合作为所述目标卷积层的权重，并确定所述目标卷积层的权重在当前阶段的总量化比例是否达到预设比例值；

响应于确定所述目标卷积层的权重在当前阶段的总量化比例达到预设比例值，将当前阶段的卷积神经网络作为目标卷积神经网络，并存储所述目标卷积神经网络。

2.根据权利要求1所述的方法，其中，所述方法还包括：

响应于确定所述目标卷积层的权重在当前阶段的总量化比例未达到预设比例值，根据损失函数对当前阶段的卷积神经网络进行训练，以调整所述第二权重集合中未量化取整的第一权重，直至损失函数的值趋于目标值；获取下一阶段的量化比例作为当前阶段的量化比例；根据当前阶段的量化比例，对所述第二输入值集合中未量化取整第一输入值和所述第二权重集合中未量化取整的第一权重分别进行量化取整，以更新所述第二输入值集合和所述第二权重集合；将更新的第二权重集合作为所述目标卷积层的权重，并确定所述目标卷积层的权重在当前阶段的总量化比例是否达到所述预设比例值。

3.根据权利要求1所述的方法，其中，所述根据所述初始输入值和所述初始权重，分别生成第一输入值集合和第一权重集合，包括：

根据量化编码的位数，将所述初始输入值的范围和所述初始权重的范围分别均匀划分为预设数目个子区间，其中，所述预设数目与所述量化编码的位数正相关；

根据位于预设数目个子区间中的各输入值和各权重，分别生成第一输入值集合和第一权重集合。

4.根据权利要求3所述的方法，其中，所述对所述第一输入值集合中的各第一输入值和所述第一权重集合中的各第一权重分别进行量化取整，生成第二输入值集合和第二权重集合，包括：

根据预设量化方法，对所述第一输入值集合中的各第一输入值进行量化取整，并将量化取整后的第一输入值作为第二输入值，生成第二输入值集合；

根据所述第一权重集合中的各第一权重的分布概率，对所述第一权重集合中的各第一权重进行上取整或下取整，并将取整后的第一权重作为第二权重，生成第二权重集合。

5.根据权利要求1所述的方法，其中，所述根据所述初始输入值和所述初始权重，分别生成第一输入值集合和第一权重集合，包括：

根据预设的第一数值，将所述初始输入值的范围和所述初始权重的范围划分为预设数目个区间长度不同的子区间；

以所述第一数值为底数，计算各初始输入值的对数，将计算结果作为第一输入值，生成第一输入值集合；

根据位于各子区间的各初始权重，确定区间权重，以作为第一权重，生成第一权重集合。

6.根据权利要求5所述的方法，其中，所述对所述第一输入值集合中的各第一输入值和所述第一权重集合中的各第一权重分别进行量化取整，生成第二输入值集合和第二权重集合，包括：

对所述第一输入值集合中的各第一输入值进行量化取整，并以量化取整后的各第一输入值分别为指数，计算所述第一数值的指数幂，以作为第二输入值，生成第二输入值集合；

根据各子区间的顺序，依次对各第一权重建立序号，生成查询表，并将各第一权重对应的序号作为第二权重，生成第二权重集合，其中，所述序号为整数，且所述查询表中序号与和各第一权重以键值对形式存储。

7.根据权利要求1所述的方法，其中，所述根据当前阶段的量化比例，对所述第一输入值集合中的各第一输入值和所述第一权重集合中的各第一权重分别进行量化取整，包括：

根据当前阶段的量化比例，在所述第一输入值集合和所述第一权重集合中分别选取相应数量的第一输入值和第一权重进行量化取整，其中，所述选取包括按照数值由大到小，从数值大的一端选取，或者按照量化误差由小到大，从误差小的一端选取。

8.根据权利要求1-7之一所述的方法，其中，所述方法还包括：

获取所述目标卷积神经网络的目标卷积层的初始输入信息；

对所述初始输入信息进行量化取整，得到整数输入值；

将所述整数输入值输入所述目标卷积层，并与所述目标卷积层的权重进行卷积运算，生成输出信息。

9.一种用于生成卷积神经网络的装置，包括：

第一获取单元，配置用于获取卷积神经网络的目标卷积层的初始输入值和初始权重；

第一生成单元，配置用于根据所述初始输入值和所述初始权重，分别生成第一输入值集合和第一权重集合；

第一量化单元，配置用于根据当前阶段的量化比例，对所述第一输入值集合中的各第一输入值和所述第一权重集合中的各第一权重分别进行量化取整，生成第二输入值集合和第二权重集合，其中，所述第二权重集合中包括量化取整后的第一权重；

确定单元，配置用于将所述第二权重集合作为所述目标卷积层的权重，并确定所述目标卷积层的权重在当前阶段的总量化比例是否达到预设比例值；

第二生成单元，配置用于响应于确定所述目标卷积层的权重在当前阶段的总量化比例达到预设比例值，将当前阶段的卷积神经网络作为目标卷积神经网络，并存储所述目标卷积神经网络。

10.根据权利要求9所述的装置，其中，所述装置还配置用于：

11.根据权利要求9所述的装置，其中，所述第一生成单元进一步配置用于：

12.根据权利要求11所述的装置，其中，所述第一量化单元进一步配置用于：

13.根据权利要求9所述的装置，其中，所述第一生成单元还进一步配置用于：

14.根据权利要求13所述的装置，其中，所述第一量化单元还进一步配置用于：

15.根据权利要求9所述的装置，其中，所述第一量化单元进一步配置用于：

16.根据权利要求9-15之一所述的装置，其中，所述装置还包括：

第二获取单元，配置用于获取所述目标卷积神经网络的目标卷积层的初始输入信息；

第二量化单元，配置用于对所述初始输入信息进行量化取整，得到整数输入值；

第三生成单元，配置用于将所述整数输入值输入所述目标卷积层，并与所述目标卷积层的权重进行卷积运算，生成输出信息。

17.一种电子设备，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序；

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-8中任一所述的方法。

18.一种计算机可读存储介质，其上存储有计算机程序，其中，所述计算机程序被处理器执行时实现如权利要求1-8中任一所述的方法。