CN111178520A

CN111178520A - 一种低计算能力处理设备的数据处理方法及装置

Info

Publication number: CN111178520A
Application number: CN202010011285.4A
Authority: CN
Inventors: 王乃岩; 黄泽昊
Original assignee: Beijing Tusimple Technology Co Ltd
Current assignee: Beijing Tusimple Technology Co Ltd
Priority date: 2017-06-15
Filing date: 2017-06-15
Publication date: 2020-05-19
Anticipated expiration: 2037-06-15
Also published as: CN111178520B; WO2018227801A1; CN107247991A

Abstract

本发明公开一种低计算能力处理设备的数据处理方法及装置。该方法包括：在实时的计算机视觉处理过程中，低计算能力的处理设备获取图像数据；所述处理设备使用预先设置的神经网络对获取到的图像数据进行计算机视觉处理，得到计算机视觉处理结果；其中，预先设置的神经网络是通过如下处理获得的目标神经网络。构建初始神经网络，所述初始神经网络中预置的多个特定结构分别设置有对应的稀疏缩放算子，其中稀疏缩放算子用于对相应特定结构的输出进行缩放；采用预置的训练样本数据对所述初始神经网络的权重和特定结构的稀疏缩放算子进行训练，得到中间神经网络；将所述中间神经网络中稀疏缩放算子为零的特定结构删除，得到目标神经网络。

Description

一种低计算能力处理设备的数据处理方法及装置

技术领域

本发明涉及计算机领域，特别涉及一种低计算能力处理设备的数据处理方法及装置。

背景技术

近几年来，深度神经网络在诸多领域中取得了巨大的成功，如计算机视觉、自然语言处理等。但深度神经网络的模型往往包含大量的模型参数，计算量大、处理速度慢，无法在一些低功耗、低计算能力的设备(如嵌入式设备、集成设备等)上进行实时计算。低计算能力的设备是指，如果一个设备的计算能力低于部署在其上的计算任务或计算模型要求的计算能力的情况下，该设备即为一个低计算能力的设备。

为解决该问题，目前提出了一些解决方案：

方案1、Hao Zhou在论文“Less is More:Towards Compact CNNS”中指出现有的卷积神经网络包括大量的参数，在计算平台上部署和运行这样的卷积神经网络需要大量的存储资源和硬件资源，这使得在存储资源有限的移动计算设备上无法使用深度卷积神经网络。该论文提出通过组稀疏约束来学习神经网络中每层神经元个数的方案，该方案在卷积神经网络的权重中加入组稀疏约束，即每一个神经元的权重为一个组。由于组稀疏约束会将每个组内的权重尽可能地全压缩为0，因此当一个神经元的权重全为0时，即可去掉该神经元，由此即可学习得到神经网络的神经元个数。

方案2、Jose M.Alvarez在论文“Learning the number of neurons in DeepNetworks”中提出的解决方案与方案1基本一致，区别在于，该方案2中每一层神经元用的组稀疏约束不同，即对不同层的神经元其组约束的强度不同。

方案3、Wen Wei在论文“Learning Structured Sparsity in Deep NeuralNetworks”中指出部署一个如此之大的模型，需要大量的计算资源和存储资源。该论文提出的解决方案为利用组稀疏约束学习例如神经元的个数、神经元的形状、跨层连接网络层的深度等。

但是根据上述方案得到的神经网络仍无法较好的满足结构紧凑、运行速度快、精度高的要求，从而无法在低计算能力设备上进行实时运算。

发明内容

本申请实施例，一方面提供一种低计算能力处理设备的数据处理方法，该方法包括：

在实时的计算机视觉处理过程中，低计算能力的处理设备获取图像数据；

所述处理设备使用预先设置的神经网络对获取到的图像数据进行计算机视觉处理，得到计算机视觉处理结果；其中，预先设置的神经网络是通过如下处理获得的目标神经网络：

构建实现计算机视觉处理的初始神经网络，所述初始神经网络中预置的多个特定结构分别设置有对应的稀疏缩放算子，其中稀疏缩放算子用于对相应特定结构的输出进行缩放；

采用预置的训练样本数据对所述初始神经网络的权重和特定结构的稀疏缩放算子进行训练，得到中间神经网络；

将所述中间神经网络中稀疏缩放算子为零的特定结构删除，得到实现计算机视觉处理的目标神经网络。

本申请实施例，另一方面提供一种低计算能力处理设备的数据处理装置，该装置包括：至少一个处理器和至少一个存储器，至少一个存储器中存储有至少一条机器可执行指令，至少一个处理器执行至少一条机器可执行指令后执行如下处理：

在实时的计算机视觉处理过程中，获取图像数据；

使用预先设置的神经网络对获取到的图像数据进行计算机视觉处理，得到计算机视觉处理结果；其中，预先设置的神经网络是通过构建装置获得的目标神经网络，构建装置包括：

第一构建单元，用于构建初始神经网络，所述初始神经网络中预置的多个特定结构分别设置有对应的稀疏缩放算子，其中稀疏缩放算子用于对相应特定结构的输出进行缩放；

训练单元，用于采用预置的训练样本数据对所述初始神经网络的权重和特定结构的稀疏缩放算子进行训练，得到中间神经网络；

第二构建单元，用于将所述中间神经网络中稀疏缩放算子为零的特定结构删除，得到目标神经网络。

本申请另一方面，提供了一种低计算能力处理设备的数据处理方法，包括：

在实时的自然语言处理过程中，低计算能力的处理设备获取文本数据；

所述处理设备使用预先设置的神经网络对获取到的文本数据进行自然语言处理，得到自然语言处理结果；其中，预先设置的神经网络是通过如下处理获得的目标神经网络：

构建实现自然语言处理的初始神经网络，所述初始神经网络中预置的多个特定结构分别设置有对应的稀疏缩放算子，其中稀疏缩放算子用于对相应特定结构的输出进行缩放；

将所述中间神经网络中稀疏缩放算子为零的特定结构删除，得到实现自然语言处理的目标神经网络。

本申请的另一方面，提供了一种低计算能力处理设备的数据处理装置，包括：至少一个处理器和至少一个存储器，至少一个存储器中存储有至少一条机器可执行指令，至少一个处理器执行至少一条机器可执行指令后执行如下处理：

在实时的自然语言处理过程中，获取文本数据；

使用预先设置的神经网络对获取到的文本数据进行自然语言处理，得到自然语言处理结果；其中，预先设置的神经网络是通过构建装置获得的目标神经网络，构建装置包括：

第三构建单元，用于构建实现自然语言处理的初始神经网络，所述初始神经网络中预置的多个特定结构分别设置有对应的稀疏缩放算子，其中稀疏缩放算子用于对相应特定结构的输出进行缩放；

第四构建单元，用于将所述中间神经网络中稀疏缩放算子为零的特定结构删除，得到实现自然语言处理的目标神经网络。

本申请实施例提供的低计算能力处理设备的数据处理方法，一方面，引入稀疏缩放算子来缩放不同特定结构的输出，不需要在权重上加入新的约束，权重和稀疏缩放算子可进行独立优化，能够提高神经网络的精度，另一方面，稀疏缩放算子为零的特定结构对神经网络的输出结果没有贡献，将稀疏缩放算子为零的特定结构删除，并不影响神经网络的精度，而且还能够精简神经网络以提高神经网络运行速度。因此，低计算能力的处理设备可以应用上述神经网络来执行实时的计算机视觉处理，或者执行实时的自然语言处理。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。

图1为本发明实施例中构建神经网络的方法流程图；

图2为本发明实施例中特定结构为模块的示意图；

图3为本发明实施例中特定结构为残差网络中的残差模块的示意图；

图4为本发明实施例中特定结构为模组的示意图；

图5为本发明实施例中特定结构为神经元的示意图；

图6为本发明实施例中构建神经网络的装置的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明中的技术方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

实施例一

参见图1，为本发明实施例中构建神经网络的方法的流程图，该方法包括：

步骤101、构建初始神经网络，所述初始神经网络中预置的多个特定结构分别设置有对应的稀疏缩放算子，其中稀疏缩放算子用于对相应特定结构的输出进行缩放。

步骤102、采用预置的训练样本数据对所述初始神经网络的权重和特定结构的稀疏缩放算子进行训练，得到中间神经网络。

步骤103、将所述中间神经网络中稀疏缩放算子为零的特定结构删除，得到目标神经网络。

优选地，前述步骤101可通过以下步骤A1～步骤A3实现：

步骤A1、选取神经网络模型。

本发明实施例，可从预置的神经网络模型集中选取一个与期望目标神经网络所实现的功能(如计算机视觉处理功能：图像分割、物体检测、人脸识别，或者自然语言处理功能等)对应的神经网络模型，也可以根据期望目标神经网络所实现的功能构建一个对应的神经网络模型。本申请不做严格的限定。

步骤A2、确定所述神经网络模型中需要设置稀疏缩放算子的特定结构。

本发明实施例中，可由设计人员确定神经网络模型中的特定结构，例如：可将神经网络中的某一层或某些网络层的全部或部分神经元确定为特定结构。和/或，将神经网络中具有以下特性的一个或多个模组确定为特定结构：特性1、包含一个以上网络层(例如，该特定结构包含两个以上级联的网络层)；特性2、与其他模组并联或者该模组前后端具有跨层连接。和/或，将神经网络中具有以下特性的一个或多个模块确定为特定结构：特性1、包含一个以上模组的模块(例如，该特定结构包含两个以上并联的模组)；特性2、该模块的前后端具有跨层连接。

步骤A3、对所述神经网络模型中的特定结构设置初始稀疏缩放算子，得到所述初始神经网络。

本发明实施例中，各特定结构的稀疏缩放算子的取值大于等于0。优选地，初始稀疏缩放算子的取值接近1，例如可以直接取值为1。

优选地，本发明实施例中，前述步骤102具体可通过以下步骤B1～步骤B3实现：

步骤B1、构建初始神经网络对应的目标函数，所述目标函数包含损失函数和稀疏正则函数。该目标函数如式(1)所示：

式(1)中，所述W为神经网络的权重，λ为神经网络的稀疏缩放算子向量，N为训练样本数据的数量，

为神经网络在样本数据x_i上的损失，

为稀疏正则函数。

步骤B2、采用所述训练样本数据对所述初始神经网络进行迭代训练。

步骤B3、当迭代训练次数达到阈值或者所述目标函数满足预置的收敛条件时，得到所述中间神经网络。

优选地，前述步骤B2具体实现可通过对初始神经网络进行多次以下的迭代训练，以一次非首次迭代和非尾次迭代的迭代过程(以下称为本次迭代训练)为例进行描述，一次迭代训练包括以下步骤C1～步骤C3：

步骤C1、将前一次迭代训练得到的稀疏缩放算子作为所述目标函数的常量，将所述权重作为所述目标函数的变量，采用第一优化算法对所述目标函数进行优化，得到本次迭代训练的权重；

步骤C2、将本次迭代训练的权重作为所述目标函数的常量，将稀疏缩放算子作为所述目标函数的变量，采用第二优化算法对所述目标函数进行优化，得到本次迭代训练的稀疏缩放算子；

步骤C3、基于本次迭代训练的权重和稀疏缩放算子进行下一次迭代训练。

首次迭代训练过程如下：将初始稀疏缩放算子作为所述目标函数的常量，将所述权重作为所述目标函数的变量，采用第一优化算法对所述目标函数进行优化，得到本次迭代训练的权重；将本次迭代训练的权重作为所述目标函数的常量，将稀疏缩放算子作为所述目标函数的变量，采用第二优化算法对所述目标函数进行优化，得到本次迭代训练的稀疏缩放算子；基于本次迭代训练的权重和稀疏缩放算子进行第二次迭代训练。

尾次迭代训练过程如下：将前一次迭代训练得到的稀疏缩放算子作为所述目标函数的常量，将所述权重作为所述目标函数的变量，采用第一优化算法对所述目标函数进行优化，得到本次迭代训练的权重；将本次迭代训练的权重作为所述目标函数的常量，将稀疏缩放算子作为所述目标函数的变量，采用第二优化算法对所述目标函数进行优化，得到本次迭代训练的稀疏缩放算子；将包含本次迭代训练得到的稀疏缩放算子和权重的神经网络作为中间神经网络。

优选地，本发明实施例中，所述第一优化算法可以为但不仅限于为以下任意一种算法：随机梯度下降算法、引入动量的变种算法。

优选地，本发明实施例中，所述第二优化算法可以为但不仅限于为以下任意一种算法：加速邻域梯度下降算法、邻域梯度下降算法、交替方向乘子算法。

优选地，在另一个实施例中，本发明实施例中目标函数包含损失函数、权重正则函数和稀疏正则函数，该目标函数如式(2)所示：

式(2)中，所述W为神经网络的权重，λ为神经网络的稀疏缩放算子向量，N为训练样本数据的数量，

为神经网络在样本数据x_i上的损失，

为权重正则函数，

为稀疏正则函数。

优选地，本发明实施例中

为权重为γ的稀疏正则，即

当然本领域技术人员还可将

设置为更复杂的稀疏约束，例如非凸的稀疏约束。

为进一步对本发明实施例中如何求解出目标函数中的W和λ进行详细的描述，下面以目标函数为公式(2)、

为例，对一次迭代训练优化目标函数求解得到W和λ进行描述。将

记为

记为

将λ作为常量，将W作为变量，则目标函数换转为

采用随机梯度下降算法即可求解得到W的取值，具体过程不再详细描述。

将W作为常量，将λ作为变量，则目标函数换转为

采用加速邻域梯度下降算法求解λ的取值，具体可通过但不仅限于以下几种方式得到：

方式1，采用下式(3)～式(5)得到λ：

其中η_t表示在第t次迭代训练时梯度下降的步长，

为软阈值算子，定义如下

方式2、由于前述方式1求解λ需要额外的前向后向计算来得到

将该算法直接应用到现有深度学习框架有点难度。因此，方式2对前述方式1的公式进行变形，得到式(6)～式(8)，根据式(6)～式(8)计算得到λ：

λ_t＝λ_t-1+v_t 式(8)

方式3、本发明实施例为进一步降低难度，提供更为简单的下式(9)～(11)计算得到λ：

其中λ′_t-1＝λ_t-1+μ_t-1v_t-1，μ为预设的固定值，并采用批量随机梯度下降的形式来更新W和λ。

下面分别以特定结构为模块、模组和神经元进行详细描述。

如图2所示，假设神经网络包含N个模块，每个模块对应一个稀疏缩放算子，且每个模块的前后端具有跨层连接。

以一个具体为例，假设神经网络为残差网络，设置特定结构为残差模块，如上图3所示，该残差模块前后端具有跨层连接，第i个残差模块对应的稀疏缩放算子为λⁱ，则：

若经过训练之后，得到第三个残差模块的稀疏缩放算子λ³＝0时，则将残差网络中第3个残差模块

删除。

如图4所示，假设神经网络包含N个模块，每个模块包含M个模组，每个模组包含多个级联的网络层，每个模组对应一个稀疏缩放算子。

如图5所示，假设神经网络包含L个网络层，第l网络层包含k神经元，则该k个神经元分别对应一个稀疏缩放算子。

通过上述处理得到的神经网络，一方面，引入稀疏缩放算子来缩放不同特定结构的输出，不需要在权重上加入新的约束，权重和稀疏缩放算子可进行独立优化，能够提高神经网络的精度，另一方面，稀疏缩放算子为零的特定结构对神经网络的输出结果没有贡献，将稀疏缩放算子为零的特定结构删除，并不影响神经网络的精度，而且还能够精简神经网络以提高神经网络运行速度。

从而该神经网络能够应用在低计算能力处理设备中，对图像数据进行实时的计算机视觉处理，或者对文本数据进行实时的自然语言处理。低计算能力处理设备包括低计算能力的集成设备或嵌入式设备、低计算能力计算平台、低计算能力的移动设备等。

在一个示例实施例中，低计算能力处理设备进行数据处理的方法包括：

步骤1、在实时的计算机视觉处理过程中，低计算能力的处理设备获取图像数据；

步骤2、所述处理设备使用预先设置的神经网络对获取到的图像数据进行计算机视觉处理，得到计算机视觉处理结果。

其中，预先设置的神经网络是通过如图1所示处理获得的目标神经网络。

通过上述处理，低计算能力处理设备能够通过预先配置的神经网络，在实时的计算机视觉处理中，对获取到的图像数据进行高效快速的处理。从而使得低计算能力的处理设备能够通过配置的神经网络执行实时的计算机视觉处理。

步骤1’、在实时的自然语言处理过程中，低计算能力的处理设备获取文本数据；

步骤2’、所述处理设备使用预先设置的神经网络对获取到的文本数据进行自然语言处理，得到自然语言处理结果。

通过上述处理，低计算能力处理设备能够通过预先配置的神经网络，在实时的自然语言处理中，对获取到的文本数据进行高效快速的处理。从而使得低计算能力的处理设备能够通过预先配置的神经网络执行实时的自然语言处理。

实施例二

基于前述实施例一提供的构建神经网络方法相同的发明构思，本发明实施例二提供一种构建神经网络的装置，该装置的结构如图6所示，包括：

第一构建单元61，用于构建初始神经网络，所述初始神经网络中预置的多个特定结构分别设置有对应的稀疏缩放算子，其中稀疏缩放算子用于对相应特定结构的输出进行缩放；

训练单元62，用于采用预置的训练样本数据对所述初始神经网络的权重和特定结构的稀疏缩放算子进行训练，得到中间神经网络；

第二构建单元63，用于将所述中间神经网络中稀疏缩放算子为零的特定结构删除，得到目标神经网络。

优选地，所述第一构建单元61，具体包括选取模块、特定结构确定模块和构建模块，其中：

选取模块，用于选取神经网络模型；

本发明实施例，选取模块具体实现可如下：可从预置的神经网络模型集中选取一个与期望目标神经网络所实现的功能(如计算机视觉处理的功能：图像分割、物体检测、人脸识别，或者自然语言处理的功能等)对应的神经网络模型，也可以根据期望目标神经网络所实现的功能构建一个对应的神经网络模型。本申请不做严格的限定。

特定结构确定模块，用于确定所述神经网络模型中需要设置稀疏缩放算子的特定结构；

构建模块，用于对所述神经网络模型中的特定结构设置初始稀疏缩放算子，得到所述初始神经网络。

本发明实施例中，各特定结构的稀疏缩放算子的取值大于等于0且小于等于1。优选地，初始稀疏缩放算子的取值接近1，例如可以直接取值为1。

优选地，所述训练单元62，具体包括目标函数构建模块、训练模块和确定模块，其中：

目标函数构建模块，用于构建初始神经网络对应的目标函数，所述目标函数包含损失函数和稀疏正则函数；

训练模块，用于采用所述训练样本数据对所述初始神经网络进行迭代训练；

确定模块，用于当迭代训练次数达到阈值或者所述目标函数满足预置的收敛条件时，得到所述中间神经网络。

优选地，所述训练模块具体用于：对所述初始神经网络进行多次以下的迭代训练(该一次迭代训练为非首次和非尾次迭代训练)：将前一次迭代训练得到的稀疏缩放算子作为所述目标函数的常量，将所述权重作为所述目标函数的变量，采用第一优化算法对所述目标函数进行优化，得到本次迭代训练的权重；将本次迭代训练的权重作为所述目标函数的常量，将稀疏缩放算子作为所述目标函数的变量，采用第二优化算法对所述目标函数进行优化，得到本次迭代训练的稀疏缩放算子；基于本次迭代训练的权重和稀疏缩放算子进行下一次迭代训练。

优选地，所述第一优化算法可以为但不仅限于为以下任意一种算法：随机梯度下降算法、引入动量的变种算法。

优选地，所述第二优化算法为加速邻域梯度下降算法、邻域梯度下降算法或者交替方向乘子算法。

优选地，所述目标函数为：

所述W为神经网络的权重，λ为神经网络的稀疏缩放算子向量，N为训练样本数据的数量，

为神经网络在样本数据x_i上的损失，

为稀疏正则函数。

优选地，在另一个实施例中，本发明实施例中目标函数包含损失函数、权重正则函数和稀疏正则函数，该目标函数如下：

为神经网络在样本数据x_i上的损失，

为权重正则函数，

为稀疏正则函数。

优选地，本发明实施例中

为权重为γ的稀疏正则，即

当然本领域技术人员还可将

设置为更复杂的稀疏约束，例如非凸的稀疏约束。

优选地，所述特定结构为一个神经元；或者，所述特定结构为包含一个以上网络层的模组(例如，特定结构包含两个以上级联的网络层)，且该模组与其他模组并联；或者，所述特定结构为包含一个以上并联模组的模块(例如，特定结构包含两个以上并联的模组)，且该模块的前后端具有跨层连接。

图6所示构建装置得到的神经网络一方面，引入稀疏缩放算子来缩放不同特定结构的输出，不需要在权重上加入新的约束，权重和稀疏缩放算子可进行独立优化，能够提高神经网络的精度，另一方面，稀疏缩放算子为零的特定结构对神经网络的输出结果没有贡献，将稀疏缩放算子为零的特定结构删除，并不影响神经网络的精度，而且还能够精简神经网络以提高神经网络运行速度。

从而该神经网络能够应用在低计算能力处理设备中，对图像数据进行实时的计算机视觉处理，或这对文本数据进行实时的自然语言处理。

在一个示例实施例中提供了一种低计算能力处理设备的数据处理装置，该装置可以用于实时的图像数据处理。该装置包括：至少一个处理器和至少一个存储器，至少一个存储器中存储有至少一条机器可执行指令，至少一个处理器执行至少一条机器可执行指令后执行如下处理：

在实时的计算机视觉处理过程中，获取图像数据；

使用预先设置的神经网络对获取到的图像数据进行计算机视觉处理，得到计算机视觉处理结果。

其中，预先设置的神经网络是通过如图6所示的构建装置获得的目标神经网络。其中，在低计算能力处理设备进行图像数据处理时，图6所示的第一构建单元61可以用于构建得到用于计算机视觉处理的初始神经网络，第二构建单元63可以用于构建得到用于计算机视觉处理的目标神经网络。

该装置可以位于低计算能力处理设备中、是低计算能力设备的一部分，也可以与低计算能力处理设备合一设置。该装置通过预设的神经网络能够在实时的计算机视觉处理过程中，对实时获取的图像数据进行处理。

在一个示例实施例中提供了一种低计算能力处理设备的数据处理装置，该装置可以用于实时的文本数据处理。该装置包括：至少一个处理器和至少一个存储器，至少一个存储器中存储有至少一条机器可执行指令，至少一个处理器执行至少一条机器可执行指令后执行如下处理：

在实时的自然语言处理过程中，获取文本数据；

使用预先设置的神经网络对获取到的文本数据进行自然语言处理，得到自然语言处理结果。

其中，预先设置的神经网络是通过如图6所示的构建装置获得的目标神经网络。其中，在低计算能力处理设备对文本数据进行实时的自然语言处理时，为了与对图像数据进行的实时的计算机视觉处理相区别，图6所示的第一构建单元61可以是第三构建单元(图中未示出)，第二构建单元63可以是第四构建单元(图中未示出)，第三构建单元可以用于构建得到用于自然语言处理的初始神经网络，第四构建单元可以用于构建得到用于自然语言处理的目标神经网络。

该装置可以位于低计算能力处理设备中、是低计算能力设备的一部分，也可以与低计算能力处理设备合一设置。该装置通过预设的神经网络能够在实时的自然语言处理过程中，对实时获取的文本数据进行处理。

以上是本发明的核心思想，为了使本技术领域的人员更好地理解本发明实施例中的技术方案，并使本发明实施例的上述目的、特征和优点能够更加明显易懂，下面结合附图对本发明实施例中技术方案作进一步详细的说明。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种低计算能力处理设备的数据处理方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，构建实现计算机视觉处理的初始神经网络，具体包括：

选取实现计算机视觉处理的神经网络模型；

确定所述神经网络模型中需要设置稀疏缩放算子的特定结构；

对所述神经网络模型中的特定结构设置初始稀疏缩放算子，得到所述初始神经网络。

3.根据权利要求1所述的方法，其特征在于，采用预置的训练样本数据对所述初始神经网络的权重和特定结构的稀疏缩放算子进行训练，得到中间神经网络，具体包括：

构建初始神经网络对应的目标函数，所述目标函数包含损失函数和稀疏正则函数；

采用所述训练样本数据对所述初始神经网络进行迭代训练；

当迭代训练次数达到阈值或者所述目标函数满足预置的收敛条件时，得到所述中间神经网络。

4.根据权利要求3所述的方法，其特征在于，所述采用所述训练样本数据对所述初始神经网络进行迭代训练，具体包括：

对所述初始神经网络进行多次以下的迭代训练：

将前一次迭代训练得到的稀疏缩放算子作为所述目标函数的常量，将所述权重作为所述目标函数的变量，采用第一优化算法对所述目标函数进行优化，得到本次迭代训练的权重；

将本次迭代训练的权重作为所述目标函数的常量，将稀疏缩放算子作为所述目标函数的变量，采用第二优化算法对所述目标函数进行优化，得到本次迭代训练的稀疏缩放算子；

基于本次迭代训练的权重和稀疏缩放算子进行下一次迭代训练。

5.根据权利要求4所述的方法，其特征在于，所述第二优化算法为加速邻域梯度下降算法、邻域梯度下降算法或者交替方向乘子算法。

6.根据权利要求3所述的方法，其特征在于，所述目标函数为：

所述W为权重，λ为稀疏缩放算子向量，N为样本数据的数量，

为神经网络在样本数据x_i上的损失，

为稀疏正则函数。

7.根据权利要求1～6任一项所述的方法，其特征在于，所述特定结构为一个神经元；

或者，所述特定结构为包含一个以上网络层的模组，且该模组与其他模组并联；

或者，所述特定结构为包含一个以上模组的模块，且该模块的前后端具有跨层连接。

8.一种低计算能力处理设备的数据处理装置，其特征在于，包括：至少一个处理器和至少一个存储器，至少一个存储器中存储有至少一条机器可执行指令，至少一个处理器执行至少一条机器可执行指令后执行如下处理：

在实时的计算机视觉处理过程中，获取图像数据；

第一构建单元，用于构建实现计算机视觉处理的初始神经网络，所述初始神经网络中预置的多个特定结构分别设置有对应的稀疏缩放算子，其中稀疏缩放算子用于对相应特定结构的输出进行缩放；

训练单元，用于采用预置的训练样本数据对所述初始神经网络的权重和特定结构的稀疏缩放算子进行训练，得到实现计算机视觉处理的中间神经网络；

9.根据权利要求8所述的装置，其特征在于，所述第一构建单元，具体包括：

选取模块，用于选取实现计算机视觉处理的神经网络模型；

10.根据权利要求8所述的方法，其特征在于，所述训练单元，具体包括：

11.根据权利要求10所述的装置，其特征在于，所述训练模块具体用于：

对所述初始神经网络进行多次以下的迭代训练：

12.根据权利要求11所述的装置，其特征在于，所述第二优化算法为加速邻域梯度下降算法、邻域梯度下降算法或者交替方向乘子算法。

13.根据权利要求10所述的装置，其特征在于，所述目标函数为：

所述，W为权重，λ为稀疏缩放算子向量，N为样本数据的数量，

为神经网络在样本数据x_i上的损失，

为稀疏正则函数。

14.根据权利要求8～13任一项所述的装置，其特征在于，所述特定结构为一个神经元；

15.一种低计算能力处理设备的数据处理方法，其特征在于，包括：

16.一种低计算能力处理设备的数据处理装置，其特征在于，包括：至少一个处理器和至少一个存储器，至少一个存储器中存储有至少一条机器可执行指令，至少一个处理器执行至少一条机器可执行指令后执行如下处理：

在实时的自然语言处理过程中，获取文本数据；