CN107292382A

CN107292382A - 一种神经网络声学模型激活函数定点量化方法

Info

Publication number: CN107292382A
Application number: CN201610191900.8A
Authority: CN
Inventors: 张鹏远; 邢安昊; 潘接林; 颜永红
Original assignee: Institute of Acoustics CAS; Beijing Kexin Technology Co Ltd
Current assignee: Institute of Acoustics CAS; Beijing Kexin Technology Co Ltd
Priority date: 2016-03-30
Filing date: 2016-03-30
Publication date: 2017-10-24

Abstract

本发明提供一种神经网络声学模型激活函数定点量化方法，该方法具体包括：步骤(1)在DNN模型的第l层，将所述第l‑1层的浮点激活向量中x^(l‑1)＝[x₁,…,x_N]^T的每个浮点激活值线性地量化为0～2^K的整数，得到所述第l‑1层的线性定点量化的激活向量x^*(l‑1)；步骤(2)对步骤(1)中得到的所述第l‑1层的线性定点量化的激活向量x^*(l‑1)中的每个激活值进一步分级，即将所述每个激活值近似为最为邻近的2的整次幂，最终得到所述第l‑1层的分级定点量化激活向量x^**(l‑1)；步骤(3)对第l层进行线性定点量化，即将该层浮点型权值矩阵W^(l)的权值w_M,N线性地量化为‑127到127间的整数；步骤(4)进行DNN第l层的前馈计算，最终得到第l层的浮点型激活向量x^(l)。

Description

一种神经网络声学模型激活函数定点量化方法

技术领域

本发明涉及语音识别技术领域，特别涉及一种神经网络声学模型激活函数定点量化方法。

背景技术

在语音识别领域，利用深层神经网络(Deep Neural Network，DNN)进行声学建模取得了很好的效果。DNN的深层结构使得模型具有很强的学习能力，同时需要大量的浮点数乘加运算，DNN的主要运算用如下公式：

x^(l)＝σ(W^(l)·x^(l-1))

其中，l为层数，x^(l)为第l层的激活向量，W^(l)为第l层的权值矩阵，x^(l-1)为第l-1层的激活向量，σ(·)为激活函数；其一般采用的是sigmoid函数，如下：

其中，e^-x为指数运算。

对DNN模型进行定点量化的方法被用来降低浮点运算量，其原理如下：

由于sigmoid函数σ(x)∈(0,1)，可以将浮点型激活值使用无符号8位定点整数表示，即将激活值线性地量化为0～256的整数(为了简洁，以下公式中不含表示层数的上标)：

x^*＝round(x·256)

其中，x*为经过线性定点量化后的激活向量，round(·)为四舍五入取整操作。

同时，将权值矩阵使用有符号8位定点整数表示，即将权值线性地量化为-127～127的整数，用如下两个公式(为了简洁，以下公式中不含表示层数的上标)：

w_max＝max(|W|)

其中，W为权值矩阵，max(|W|)为取出矩阵W中的绝对值最大的元素值，w_max为权值矩阵W中所有元素中的绝对值最大值，W^*为线性定点量化后的权值矩阵。

对模型的定点量化以后，原本的浮点运算就可以转变为定点运算，从而节省计算成本。模型从浮点转为定点之后，由于数据精度的降低，模型的性能也会略有降低，另一方面，即使经过定点量化把浮点运算转化为定点运算，乘法的数量没有减少，DNN模型依然需要大量的定点乘加运算。因此，要在计算资源有限，尤其是乘法器数量有限的嵌入式设备上应用DNN进行语音识别的声学建模十分困难。

发明内容

本发明的目的在于，为解决现有的定点量化方法不能降低乘法运算数量的缺陷，本发明提供了一种神经网络声学模型激活函数定点量化方法，该方法具体包括：

步骤(1)在DNN模型的第l层，将所述第l-1层的浮点激活向量中x^(l-1)＝[x₁,…,x_N]^T的每个浮点激活值线性地量化为0～2^K的整数，K为量化的级数，得到所述第l-1层的线性定点量化的激活向量

其中，

其中，x_i为第l-1层的浮点激活向量x^(l-1)的第i维元素，为第l-1层的线性定点量化的激活向量x^*(l-1)的第i维元素；

步骤(2)对步骤(1)中得到的所述第l-1层的线性定点量化的激活向量x^*(l-1)中的每个激活值进一步分级，即将所述每个激活值近似为最为邻近的2的整次幂，最终得到所述第l-1层的分级定点量化激活向量

所述第l-1层的分级定点量化激活向量中的任意一个元素的取值需满足：

具体对应关系如下：

其中，x^*(l-1)为第l-1层的线性定点化的激活向量中的元素，x^**(l-1)为第l-1层分级定点量化的激活向量中的元素，和分别表示向上取整和向下取整。

步骤(3)根据如下公式对第l层进行线性定点量化，即将该层浮点型权值矩阵W^(l)的权值w_i,j线性地量化为-127到127间的整数：

其中，W^(l)为包含第l层的权值w_i,j(其中i＝1,…,M，j＝1,…,N)的浮点型权值矩阵，即

max(|W^(l)|)为取出矩阵W^(l)的绝对值最大的元素值，为第l层权值矩阵W^(l)中所有元素中的绝对值最大值，W^*(l)为线性定点量化后的浮点型权值矩阵，round(·)为四舍五入取整操作。

步骤(4)根据如下公式，进行DNN第l层的前馈计算：

a^(l)＝W^*(l)·x^**(l-1)

其中，x^**(l-1)为第l-1层的分级定点量化的激活向量；W^*(l)为线性定点量化后的浮点型权值矩阵；a^(l)为临时变量；

a^(l)先与解量化因子相乘，再通过sigmoid函数σ(·)，最终得到第l层的浮点型激活向量x^(l)。

本发明的优点在于：本发明可以将DNN前馈计算中的大量乘法运算用整数移位操作替代，大大降低了DNN计算对于计算资源，尤其是乘法器的需求；简化DNN前馈计算中的权值矩阵与激活向量的乘法。

附图说明

图1是本发明的神经网络激活函数定点量化方法的流程图

图2是实施例中采用的DNN结构示意图

具体实施方式

以下结合附图对本发明作进一步的详细说明。

本发明提供了一种神经网络声学模型激活函数定点量化方法，将DNN的激活值量化为2的整次幂，通过这种方式，DNN运算中，权值矩阵和激活向量相乘中的定点乘法运算都可以替换成定点数的移位操作。

在本实施例中，进行试验的实验环境为：输入特征向量包含572维，具体来讲，输入特征为52维感知线性预测(PLP)特征，并做了前后各5帧的上下文扩展，最终得到52*11＝572维的输入向量，输入层的权值矩阵规模为2048*572。另外，DNN的2个隐层各自包含2048*2048规模的权值矩阵，输出层的权值矩阵规模为19508*2048，输出向量共有19508维，对应于绑定后的上下文相关音素状态。语音识别任务使用的是中文测试集，共有3000小时语音数据作为训练集，2小时数据作为测试集。

在本实施例中，如图2所示，所述DNN模型共有4层，以第2层为例，现给出具体的实施方案，如图1所示：

步骤(1)在DNN模型的第2层，将所述第1层的浮点激活向量中x⁽¹⁾＝[x₁,…,x_N]^T的每个浮点激活值线性地量化为0～2^K的整数，K为量化的级数，得到所述第1层的线性定点量化的激活向量

其中，

其中，x_i为第1层的浮点激活向量x⁽¹⁾的第i维元素，为第1层的线性定点量化的激活向量x^*(1)的第i维元素；

步骤(2)对步骤(1)中得到的所述第1层的线性定点量化的激活向量x^*(1)中的每个激活值进一步分级，即将所述每个激活值近似为最为邻近的2的整次幂，最终得到所述第1层的分级定点量化激活向量

所述第1层的分级定点量化激活向量中的任意一个元素的取值需满足：

具体对应关系如下：

其中，x^*(1)为第1层的线性定点化的激活向量中的元素，x^**(1)为第1层分级定点量化的激活向量中的元素，和分别表示向上取整和向下取整。

步骤(3)根据公式(2)和(3)，对第2层进行线性定点量化，即将该层浮点型权值矩阵W⁽²⁾的权值w_M,N线性地量化为-127到127间的整数：

其中，W⁽²⁾为包含第2层的权值w_i,j(其中i＝1,…,M，j＝1,…,N)的浮点型权值矩阵，规模为M×N即

max(|W⁽²⁾|)为取出矩阵W⁽²⁾的绝对值最大的元素值，为第2层权值矩阵W⁽²⁾中所有元素中的绝对值最大值，W^*(2)为线性定点量化后的浮点型权值矩阵，round(·)为四舍五入取整操作。

步骤(4)根据公式(4)和(5)，进行DNN第2层的前馈计算：

a⁽²⁾＝W^*(2)·x^**(1) (4)

其中，x^**(1)为第1层的分级定点量化的激活向量；W^*(2)为线性定点量化后的浮点型权值矩阵；a⁽²⁾为临时变量；

如图1所示，根据计算机语言，如果判断第2层是输出层，则为DNN输出层，即本实施例中第2层的激活函数，通常使用softmax函数，具体如公式(6-1)和(6-2)所示：

其中，e为自然常数，y_i为向量y的第i维元素，x_i和x_k分别为向量x的第i维和第k维元素，和均为指数运算，N为向量x和y的维数。

在公式(5)中，a⁽²⁾先与解量化因子相乘，再通过所述sigmoid函数σ(·)，最终得到第2层的浮点型激活向量x⁽²⁾，即整个DNN的输出向量。

如果判断第2层不是输出层，则得到第2层的浮点型激活向量x⁽²⁾，用于第3层的计算。

基于上述的定点量化方法，DNN前馈计算中当前层的权值矩阵与上一层的激活向量相乘可以进一步简化，以整个网络的第2层的前馈计算为例：

a⁽²⁾＝W^*(2)·x^**(1)

其中M＝N＝2048，具体的计算方法为：

其中，为临时向量a⁽²⁾的第i维元素，为第二层线性量化后的权值矩阵的第i行第j列的元素，即连接第2层第j个神经元和第1层第i个神经元的权值，为第一层分级量化后的激活向量的第j维元素，N为向量x^**(1)的维数，即第1层神经元的个数；

假设其中，

在计算机或者其他嵌入式***中，对于整数y和x，有y·2^x＝y<<x，其中“<<”为左移操作，因此上面计算可以变为：

即原本矩阵乘向量中的乘法运算，全部被移位操作替代，这大大降低了DNN计算对于计算资源，尤其是乘法器的需求。

下面对本实施例的性能进行分析。

利用测试集测试各个模型的字错误率(word error rate，WER)，模型分别为原始的浮点模型，线性定点量化模型(权值和激活值经过线性定点量化)和不同K值的分级定点量化模型(权值为线性定点量化，激活值为分级定点量化)；

字错误率的计算公式如下：

实验结果见表1：

表1

由实验结果可以看出，对定点量化模型进行进一步的分级量化，性能并没有明显的下降，值得注意的是K＝5时，分级量化模型的性能甚至优于定点量化模型，与原始的浮点模型性能接近。新引入的对于激活值的分级量化，在没有带来明显性能损失的前提下，将DNN前馈计算中的绝大多数乘法运算替换成了移位操作，大大降低了将DNN应用于嵌入式***的计算资源需求，尤其是对于乘法器数量的要求。

最后需要说明的是，具体实施方式中所述的实验用图仅用来说明本发明的技术方案软件算法的可行性而非局限于此例，算法已经经过大量实验数据验证，是真实可靠的，搭配硬件便可实现本发明的技术方案。尽管参照实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，对本发明的技术方案进行修改或者等同替换，都不脱离本发明技术方案的精神和范围，其均应涵盖在本发明的权利要求范围当中。

Claims

1.一种神经网络声学模型激活函数定点量化方法，其特征在于，该方法具体包括：

其中，

步骤(3)对第l层进行线性定点量化，即将该层浮点型权值矩阵W^(l)的权值w_M,N线性地量化为-127到127间的整数；

步骤(4)进行DNN第l层的前馈计算，最终得到第l层的浮点型激活向量x^(l)：

a^(l)＝W^*(l)·x^**(l-1)

<mrow> <msup> <mi>x</mi> <mrow> <mo>(</mo> <mi>l</mi> <mo>)</mo> </mrow> </msup> <mo>=</mo> <mi>&sigma;</mi> <mrow> <mo>(</mo> <mrow> <msup> <mi>a</mi> <mrow> <mo>(</mo> <mi>l</mi> <mo>)</mo> </mrow> </msup> <mo>&CenterDot;</mo> <mfrac> <msubsup> <mi>w</mi> <mi>max</mi> <mrow> <mo>(</mo> <mi>l</mi> <mo>)</mo> </mrow> </msubsup> <mrow> <mn>127</mn> <mo>&times;</mo> <msup> <mn>2</mn> <mi>K</mi> </msup> </mrow> </mfrac> </mrow> <mo>)</mo> </mrow> </mrow>

其中，x^**(l-1)为第l-1层的分级定点量化的激活向量；W^*(l)为线性定点量化后的浮点型权值矩阵；为第l层权值矩阵W^(l)中所有元素中的绝对值最大值，a^(l)为临时变量。

2.根据权利要求1所述的一种神经网络声学模型激活函数定点量化方法，其特征在于，在所述步骤(2)中，所述第l-1层的分级定点量化激活向量中的任意一个元素的取值需满足：

具体对应关系如下：

3.根据权利要求1所述的一种神经网络声学模型激活函数定点量化方法，其特征在于，所述步骤(3)中，对第l层进行线性定点量化进一步包括：

<mrow> <msup> <mi>W</mi> <mrow> <mo>*</mo> <mrow> <mo>(</mo> <mi>l</mi> <mo>)</mo> </mrow> </mrow> </msup> <mo>=</mo> <mi>r</mi> <mi>o</mi> <mi>u</mi> <mi>n</mi> <mi>d</mi> <mrow> <mo>(</mo> <mrow> <mfrac> <msup> <mi>W</mi> <mrow> <mo>(</mo> <mi>l</mi> <mo>)</mo> </mrow> </msup> <msubsup> <mi>W</mi> <mi>max</mi> <mrow> <mo>(</mo> <mi>l</mi> <mo>)</mo> </mrow> </msubsup> </mfrac> <mo>&CenterDot;</mo> <mn>127</mn> </mrow> <mo>)</mo> </mrow> </mrow>

max(|W^(l)|)为取出矩阵W^(l)的绝对值最大的元素值，W^*(l)为线性定点量化后的浮点型权值矩阵，round(·)为四舍五入取整操作。