CN110322414B

CN110322414B - 一种基于ai处理器的图像数据在线量化矫正方法及***

Info

Publication number: CN110322414B
Application number: CN201910605865.3A
Authority: CN
Inventors: 周韧研
Original assignee: Beijing Intengine Technology Co Ltd
Current assignee: Beijing Intengine Technology Co Ltd
Priority date: 2019-07-05
Filing date: 2019-07-05
Publication date: 2021-08-10
Anticipated expiration: 2039-07-05
Also published as: CN110322414A

Abstract

本发明涉及人工智能技术领域，尤其涉及一种基于AI处理器的图像数据在线量化矫正方法及***，其中，基于AI处理器的图像数据在线量化矫正方法包括：当检测到图像数据的量到阈值时，使用神经网络对所述图像数据进行处理并生成所述图像数据对应的高精度中间层数据、根据所述高精度中间层数据中的各项数据项匹配所述高精度中间层数据对应的量化方案、根据所述量化方案对所述高精度中间层数据进行量化并生成低精度中间层数据等步骤。本发明的基于AI处理器的图像数据在线量化矫正方法和***能够根据训练得到的未量化数据，而量化过程将采用在线实际采集到的数据量化进行和矫正，具有一定的自适应性。

Description

一种基于AI处理器的图像数据在线量化矫正方法及***

技术领域

本发明涉及人工智能技术领域，尤其涉及一种基于AI处理器的图像数据在线量化矫正方法及***。

背景技术

目前，主流的无重训中间层量化采取的算法是使用测试集抽样的算法过程。即采取量化后或者量化前的权重和一些测试集抽样进行前向推理，统计中间层数据的分布特性从而充分使用低bit的位宽有损失地映射高范围、高精度的数据，从而将每一个中间层的低bit映射方法固定下来。进一步地，有了量化后的权重和中间层的低bit映射方法，权重和中间数据的数据量就大大降低了，把这些参数存放在端上推理AI处理器，在应用场合推理处理器就可以利用低bit数据进行计算。

然而，训练得到的未量化权重必须经过离线处理才能应用到AI处理器之上，在这个过程中，矫正集相比AI处理器应用场合的数据是否有足够的代表性也是量化成败的关键。

发明内容

本发明实施例所要解决的技术问题在于，提供一种基于AI处理器的图像数据在线量化矫正方法及***，该基于AI处理器的图像数据在线量化矫正方法和***能够根据训练得到的未量化数据，而量化过程将采用在线实际采集到的数据量化进行和矫正，具有一定的自适应性。

为了解决上述技术问题，本发明第一方面公开一种基于AI处理器的图像数据在线量化矫正方法，其中，该方法包括：

当检测到图像数据的量到阈值时，使用神经网络对所述图像数据进行处理并生成所述图像数据对应的高精度中间层数据；

根据所述高精度中间层数据中的各项数据项匹配所述高精度中间层数据对应的量化方案；

根据所述量化方案对所述高精度中间层数据进行量化并生成低精度中间层数据；

基于所述低精度中间层数据对所述图像数据进行推理并生成第一推理结果；

将所述第一推理结果与第一预设结果进行比较并确定所述第一推理结果与所述第一预设结果之间的推理误差；

基于所述第一推理结果与所述第一预设结果之间的推理误差，迭代上述步骤，当迭代次数达到预设第一迭代阈值时，生成中间层量化方案。

在本发明第一方面中，可选地，所述方法还包括：

当检测到所述图像数据的量到所述阈值时，使用所述神经网络对所述图像数据进行处理并生成所述图像数据对应的权重数据，所述权重数据为高精度权重数据；

逐层降低所述高精度权重数据的位宽并生成至少一个低精度权重数据；

基于所述低精度权重数据，对所述图像数据进行推理并生成第二推理结果；

将所述第二推理结果与所述第二预期结果进行比较并确定所述第二推理结果与所述第二预期结果之间的误差；

基于所述第二推理结果与所述第二预期结果之间的误差，迭代上述步骤，直至迭代次数达到预设第二迭代阈值时，生成权重量化方案。

在本发明第一方面中，可选地，所述方法还包括：

采集目标应用场景对应的所述图像数据；

检测到所述图像数据的量是否到所述阈值时，当所述图像数据的量到达所述阈值时，触发使用神经网络对所述图像数据进行处理并生成所述图像数据对应的高精度中间层数据执行，和/或使用所述神经网络对所述图像数据进行处理并生成所述图像数据对应的权重数据。

在本发明第一方面中，可选地，根据所述高精度中间层数据中的各项数据项匹配所述高精度中间层数据对应的量化方案的具体方式为：

根据所述高精度中间层数据中的各项数据，使用最大最小值对称量化算法、最大值非对称量化算法、交叉熵量化算法中的一种算法匹配所述高精度中间层数据对应的量化方案。

在本发明第一方面中，可选地，在生成中间层量化方案之后，所述方法还包括：

保存所述中间层量化方案；

以及，在生成权重量化方案之后，所述方法还包括：

保存所述权重量化方案。

在本发明第二方面中，一种基于AI处理器的图像数据在线量化矫正***，包括数据采集单元、双模式神经网络推理单元、量化计算单元，其中，

所述数据采集单元，用于检测到图像数据的量是否到所述阈值时；

所述双模式神经网络推理单元，用于当所述数据采集单元检测到所述图像数据的量达到所述阈值时，使用神经网络对所述图像数据进行处理并生成所述图像数据对应的高精度中间层数据；

所述量化计算单元，用于当所述双模式神经网络推理单元使用神经网络对所述图像数据进行处理并生成所述图像数据对应的高精度中间层数据时，根据所述高精度中间层数据中的各项数据项匹配所述高精度中间层数据对应的量化方案；

所述双模式神经网络推理单元，还用于当量化计算单元根据所述高精度中间层数据中的各项数据项匹配所述高精度中间层数据对应的量化方案之后，根据所述量化方案对所述高精度中间层数据进行量化并生成低精度中间层数据；

所述量化计算单元，还用于在双模式神经网络推理单元根据所述量化方案对所述高精度中间层数据进行量化并生成低精度中间层数据之后，基于所述低精度中间层数据对所述图像数据进行推理并生成第一推理结果；

所述量化计算单元，还用于将所述第一推理结果与第一预设结果进行比较并确定所述第一推理结果与第一预设结果之间的推理误差。

在本发明第二方面中，可选地，所述双模式神经网络推理单元，还用于当所述数据采集单元检测到所述图像数据的量达到所述阈值时，使用所述神经网络对所述图像数据进行处理并生成所述图像数据对应的权重数据，所述权重数据为高精度权重数据；

双模式神经网络推理单元，还用于在使用所述神经网络对所述图像数据进行处理并生成所述图像数据对应的权重数据之后，逐层降低所述高精度权重数据的位宽并生成至少一个低精度权重数据；

所述量化计算单元，还用于在所述双模式神经网络推理单元逐层降低所述高精度权重数据的位宽并生成至少一个低精度权重数据之后，基于所述低精度权重数据，对所述图像数据进行推理并生成第二推理结果；

所述量化计算单元，还用于在基于所述低精度权重数据，对所述图像数据进行推理并生成第二推理结果之后，将所述第二推理结果与所述第二预期结果进行比较并确定所述第二推理结果与所述第二预期结果之间的误差。

在本发明第二方面中，可选地，所述数据采集单元，还用于采集目标应用场景对应的所述图像数据。

在本发明第二方面中，可选地，所述量化计算单元根据所述高精度中间层数据中的各项数据项匹配所述高精度中间层数据对应的量化方案，包括：

在本发明第二方面中，可选地，所述***还包括中间层数据存储单元及非挥发存储单元，其中：

所述中间层数据存储单元，用于保存所述中间层量化方案；

所述非挥发存储单元，用于保存所述权重量化方案。

与现有技术相比，本发明具有如下技术效果：

本发明的基于AI处理器的图像数据在线量化矫正方法和***能够根据训练得到的未量化数据，而量化过程将采用在线实际采集到的数据量化进行和矫正，具有一定的自适应性。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例的一种基于AI处理器的图像数据在线量化矫正方法的流程示意图；

图2是本发明实施例的另一种基于AI处理器的图像数据在线量化矫正方法的流程示意图；

图3是本发明实施例的又一种基于AI处理器的图像数据在线量化矫正方法的流程示意图；

图4是本发明实施例的再一种基于AI处理器的图像数据在线量化矫正方法的流程示意图；

图5是本发明实施例的一种基于AI处理器的图像数据在线量化矫正***的结构示意图。

具体实施方式

为了更好地理解和实施，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例一

请参阅图1，图1是本发明实施例所示的基于AI处理器的图像数据在线量化矫正方法的流程示意图，如图1所示，该基于AI处理器的图像数据在线量化矫正方法可以包括：

步骤221，当检测到图像数据的量到阈值时，使用神经网络对所述图像数据进行处理并生成所述图像数据对应的高精度中间层数据；

步骤222，根据所述高精度中间层数据中的各项数据项匹配所述高精度中间层数据对应的量化方案；

步骤223，根据所述量化方案对所述高精度中间层数据进行量化并生成低精度中间层数据；

步骤224，基于所述低精度中间层数据对所述图像数据进行推理并生成第一推理结果；

步骤225，将所述第一推理结果与第一预设结果进行比较并确定所述第一推理结果与所述第一预设结果之间的推理误差；

步骤226，基于所述第一推理结果与所述第一预设结果之间的推理误差，迭代步骤221-步骤225，当迭代次数达到预设第一迭代阈值时，生成中间层量化方案。

其中，神经网络能够进行高精度计算(例如Float32或者Float16，)或者支持低精度高速度的计算(例如Int8)。

作为一种可选的实施方式，如图2所示，所述方法还包括：

步骤211，当检测到所述图像数据的量到所述阈值时，使用所述神经网络对所述图像数据进行处理并生成所述图像数据对应的权重数据，所述权重数据为高精度权重数据；

步骤212，逐层降低所述高精度权重数据的位宽并生成至少一个低精度权重数据；

步骤213，基于所述低精度权重数据，对所述图像数据进行推理并生成第二推理结果；

步骤214，将所述第二推理结果与所述第二预期结果进行比较并确定所述第二推理结果与所述第二预期结果之间的误差；

步骤215，基于所述第二推理结果与所述第二预期结果之间的误差，迭代步骤211-步骤214，直至迭代次数达到预设第二迭代阈值时，生成权重量化方案。

作为一种可选的实施方式，如图3，图4所示，所述方法还包括：

步骤100，采集目标应用场景对应的所述图像数据；

步骤101、检测到所述图像数据的量是否到所述阈值时，当所述图像数据的量到达所述阈值时，触发使用神经网络对所述图像数据进行处理并生成所述图像数据对应的高精度中间层数据执行，和/或使用所述神经网络对所述图像数据进行处理并生成所述图像数据对应的权重数据。

其中，所述图像数据的采集可以是连续的，也可以是间断的，本发明对此不作限定。

作为一种可选的实施方式，根据所述高精度中间层数据中的各项数据项匹配所述高精度中间层数据对应的量化方案的具体方式为：

作为一种可选的实施方式，在生成中间层量化方案之后，所述方法还包括：

步骤227，保存所述中间层量化方案；

以及，在生成权重量化方案之后，所述方法还包括：

步骤216，保存所述权重量化方案。

本发明的基于AI处理器的图像数据在线量化矫正方法能够根据训练得到的未量化数据，而量化过程将采用在线实际采集到的数据量化进行和矫正，具有一定的自适应性。

实施例二

请参阅图5，图5是本发明实施例所示的基于AI处理器的图像数据在线量化矫正***的结构示意图，如图5所示，该基于AI处理器的图像数据在线量化矫正***可以包括数据采集单元301、双模式神经网络推理单元303、量化计算单元305，其中，

所述数据采集单元301，用于检测到图像数据的量是否到所述阈值时；

所述双模式神经网络推理单元303，用于当所述数据采集单元301检测到所述图像数据的量达到所述阈值时，使用神经网络对所述图像数据进行处理并生成所述图像数据对应的高精度中间层数据；

所述量化计算单元305，用于当所述双模式神经网络推理单元303使用神经网络对所述图像数据进行处理并生成所述图像数据对应的高精度中间层数据时，根据所述高精度中间层数据中的各项数据项匹配所述高精度中间层数据对应的量化方案；

所述双模式神经网络推理单元303，还用于当量化计算单元305根据所述高精度中间层数据中的各项数据项匹配所述高精度中间层数据对应的量化方案之后，根据所述量化方案对所述高精度中间层数据进行量化并生成低精度中间层数据；

所述量化计算单元305，还用于在双模式神经网络推理单元303根据所述量化方案对所述高精度中间层数据进行量化并生成低精度中间层数据之后，基于所述低精度中间层数据对所述图像数据进行推理并生成第一推理结果；

所述量化计算单元305，还用于将所述第一推理结果与第一预设结果进行比较并确定所述第一推理结果与第一预设结果之间的推理误差。

作为一种可选的实施方式，所述双模式神经网络推理单元303，还用于当所述数据采集单元301检测到所述图像数据的量达到所述阈值时，使用所述神经网络对所述图像数据进行处理并生成所述图像数据对应的权重数据，所述权重数据为高精度权重数据；

双模式神经网络推理单元303，还用于在使用所述神经网络对所述图像数据进行处理并生成所述图像数据对应的权重数据之后，逐层降低所述高精度权重数据的位宽并生成至少一个低精度权重数据；

所述量化计算单元305，还用于在所述双模式神经网络推理单元303逐层降低所述高精度权重数据的位宽并生成至少一个低精度权重数据之后，基于所述低精度权重数据，对所述图像数据进行推理并生成第二推理结果；

所述量化计算单元305，还用于在基于所述低精度权重数据，对所述图像数据进行推理并生成第二推理结果之后，将所述第二推理结果与所述第二预期结果进行比较并确定所述第二推理结果与所述第二预期结果之间的误差。

作为一种可选的实施方式，所述数据采集单元301，还用于采集目标应用场景对应的所述图像数据。其中，所述图像数据的采集可以是连续的，也可以是间断的，本发明对此不作限定。

作为一种可选的实施方式，所述量化计算单元305根据所述高精度中间层数据中的各项数据项匹配所述高精度中间层数据对应的量化方案，包括：

作为一种可选的实施方式，所述***还包括中间层数据存储单元302及非挥发存储单元304，其中：

所述中间层数据存储单元302，用于保存所述中间层量化方案；

所述非挥发存储单元304，用于保存所述权重量化方案。

本发明的基于AI处理器的图像数据在线量化矫正***能够根据训练得到的未量化数据，而量化过程将采用在线实际采集到的数据量化进行和矫正，具有一定的自适应性。

实施例三

本发明实施例公开了一种计算机可读存储介质，其存储用于电子数据交换的计算机程序，其中，该计算机程序使得计算机执行实施例一所描述的基于AI处理器的图像数据在线量化矫正方法中的步骤。

本发明的计算机可读存储介质通过执行基于AI处理器的图像数据在线量化矫正方法，能够根据训练得到的未量化数据，而量化过程将采用在线实际采集到的数据量化进行和矫正，具有一定的自适应性。

实施例四

本发明实施例公开了一种计算机程序产品，该计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质，且该计算机程序可操作来使计算机执行实施例一所描述的基于AI处理器的图像数据在线量化矫正方法中的步骤。

本发明的计算机程序产品通过执行基于AI处理器的图像数据在线量化矫正方法，能够根据训练得到的未量化数据，而量化过程将采用在线实际采集到的数据量化进行和矫正，具有一定的自适应性。以上所描述的装置实施例仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施例的具体描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory，ROM)、随机存储器(Random Access Memory，RAM)、可编程只读存储器(Programmable Read-only Memory，PROM)、可擦除可编程只读存储器(ErasableProgrammable Read Only Memory，EPROM)、一次可编程只读存储器(One-timeProgrammable Read-Only Memory，OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory，EEPROM)、只读光盘(CompactDisc Read-Only Memory，CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。

最后应说明的是：本发明实施例公开的一种基于AI处理器的图像数据在线量化矫正方法及***所揭露的仅为本发明较佳实施例而已，仅用于说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解；其依然可以对前述各项实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或替换，并不使相应的技术方案的本质脱离奔放各项实施例技术方案的精神和范围。

Claims

1.一种基于AI处理器的图像数据在线量化矫正方法，其特征在于，所述方法包括：

步骤(221)，当检测到图像数据的量到阈值时，使用神经网络对所述图像数据进行处理并生成所述图像数据对应的高精度中间层数据；

步骤(222)，根据所述高精度中间层数据中的各项数据项匹配所述高精度中间层数据对应的量化方案；

步骤(223)，根据所述量化方案对所述高精度中间层数据进行量化并生成低精度中间层数据；

步骤(224)，基于所述低精度中间层数据对所述图像数据进行推理并生成第一推理结果；

步骤(225)，将所述第一推理结果与第一预设结果进行比较并确定所述第一推理结果与所述第一预设结果之间的推理误差；

步骤(226)，基于所述第一推理结果与所述第一预设结果之间的推理误差，迭代步骤(221)-步骤(225)，当迭代次数达到预设第一迭代阈值时，生成中间层量化方案。

2.如权利要求1所述的方法，其特征在于，所述方法还包括：

步骤(211)，当检测到所述图像数据的量到所述阈值时，使用所述神经网络对所述图像数据进行处理并生成所述图像数据对应的权重数据，所述权重数据为高精度权重数据；

步骤(212)，逐层降低所述高精度权重数据的位宽并生成至少一个低精度权重数据；

步骤(213)，基于所述低精度权重数据，对所述图像数据进行推理并生成第二推理结果；

步骤(214)，将所述第二推理结果与第二预期结果进行比较并确定所述第二推理结果与所述第二预期结果之间的误差；

步骤(215)，基于所述第二推理结果与所述第二预期结果之间的误差，迭代所述步骤(211)-步骤(214)，直至迭代次数达到预设第二迭代阈值时，生成权重量化方案。

3.如权利要求2所述的方法，其特征在于，所述方法还包括：

步骤(100)，采集目标应用场景对应的所述图像数据；

步骤(101)，检测到所述图像数据的量是否到所述阈值时，当所述图像数据的量到达所述阈值时，触发步骤(221)，和/或步骤(211)执行。

4.如权利要求1所述的方法，其特征在于，步骤(222)包括：

5.如权利要求2所述的方法，其特征在于，步骤(226)之后，所述方法还包括：

步骤(227)，保存所述中间层量化方案；

以及，在步骤(215)之后，所述方法还包括：

步骤(216)，保存所述权重量化方案。

6.一种基于AI处理器的图像数据在线量化矫正***，其特征在于，所述***包括数据采集单元(301)、双模式神经网络推理单元(303)、量化计算单元(305)，其中，

所述数据采集单元(301)，用于检测到图像数据的量是否到阈值时；

所述双模式神经网络推理单元(303)，用于当所述数据采集单元(301)检测到所述图像数据的量达到所述阈值时，使用神经网络对所述图像数据进行处理并生成所述图像数据对应的高精度中间层数据；

所述量化计算单元(305)，用于当所述双模式神经网络推理单元(303)使用神经网络对所述图像数据进行处理并生成所述图像数据对应的高精度中间层数据时，根据所述高精度中间层数据中的各项数据项匹配所述高精度中间层数据对应的量化方案；

所述双模式神经网络推理单元(303)，还用于当量化计算单元(305)根据所述高精度中间层数据中的各项数据项匹配所述高精度中间层数据对应的量化方案之后，根据所述量化方案对所述高精度中间层数据进行量化并生成低精度中间层数据；

所述量化计算单元(305)，还用于在双模式神经网络推理单元(303)根据所述量化方案对所述高精度中间层数据进行量化并生成低精度中间层数据之后，基于所述低精度中间层数据对所述图像数据进行推理并生成第一推理结果；

所述量化计算单元(305)，还用于将所述第一推理结果与第一预设结果进行比较并确定所述第一推理结果与第一预设结果之间的推理误差。

7.如权利要求6所述的基于AI处理器的图像数据在线量化矫正***，其特征在于，

所述双模式神经网络推理单元(303)，还用于当所述数据采集单元(301)检测到所述图像数据的量达到所述阈值时，使用所述神经网络对所述图像数据进行处理并生成所述图像数据对应的权重数据，所述权重数据为高精度权重数据；

双模式神经网络推理单元(303)，还用于在使用所述神经网络对所述图像数据进行处理并生成所述图像数据对应的权重数据之后，逐层降低所述高精度权重数据的位宽并生成至少一个低精度权重数据；

所述量化计算单元(305)，还用于在所述双模式神经网络推理单元(303)逐层降低所述高精度权重数据的位宽并生成至少一个低精度权重数据之后，基于所述低精度权重数据，对所述图像数据进行推理并生成第二推理结果；

所述量化计算单元(305)，还用于在基于所述低精度权重数据，对所述图像数据进行推理并生成第二推理结果之后，将所述第二推理结果与第二预期结果进行比较并确定所述第二推理结果与所述第二预期结果之间的误差。

8.如权利要求6所述的基于AI处理器的图像数据在线量化矫正***，其特征在于，

所述数据采集单元(301)，还用于采集目标应用场景对应的所述图像数据。

9.如权利要求6所述的基于AI处理器的图像数据在线量化矫正***，其特征在于，

所述量化计算单元(305)根据所述高精度中间层数据中的各项数据项匹配所述高精度中间层数据对应的量化方案，包括：

10.如权利要求7所述的基于AI处理器的图像数据在线量化矫正***，其特征在于，

所述***还包括中间层数据存储单元(302)及非挥发存储单元(304)，其中：

所述中间层数据存储单元(302)，用于保存中间层量化方案；

所述非挥发存储单元(304)，用于保存权重量化方案。