CN113378994A

CN113378994A - 一种图像识别方法、装置、设备及计算机可读存储介质

Info

Publication number: CN113378994A
Application number: CN202110779957.0A
Authority: CN
Inventors: 陈珉; 毛冰城; 金朝汇; 谌明
Original assignee: Zhejiang University ZJU; Hithink Royalflush Information Network Co Ltd
Current assignee: Zhejiang University ZJU; Hithink Royalflush Information Network Co Ltd
Priority date: 2021-07-09
Filing date: 2021-07-09
Publication date: 2021-09-10
Anticipated expiration: 2041-07-09
Also published as: CN113378994B

Abstract

本申请公开了一种图像识别方法、装置、设备及计算机可读存储介质，方法包括：将全局模型框架及全局权重发送至各设备，判断全局模型是否收敛或迭代次数是否达到最大迭代次数，若否，由各设备进行训练得到本地模型权重；利用全局权重及本地模型权重计算平均模型伪梯度，利用平均模型伪梯度计算一阶矩估计；根据一阶矩估计得到当前全局权重，根据当前全局权重得到当前全局模型，将当前全局权重发送至各设备，执行判断步骤；利用当前全局模型对待识别图像进行识别。本申请公开的技术方案，计算平均模型伪梯度和一阶矩估计将一阶矩估计参与到全局权重中，以减少数据分布差异带来的影响，提高全局模型的准确性，从而提高图像识别的准确性。

Description

一种图像识别方法、装置、设备及计算机可读存储介质

技术领域

本申请涉及图像识别技术领域，更具体地说，涉及一种图像识别方法、装置、设备及计算机可读存储介质。

背景技术

目前，多利用深度学习模型进行图像识别，以提高图像识别的效率和准确性等。其中，在利用深度学习模型进行图像识别时，需要先对模型进行训练。

现有在进行图像识别时，是先利用各分布设备上的数据集进行训练，并直接将训练得到的模型进行综合，以得到全局模型，然后，利用得到的全局模型进行图像识别，但是，由于各分布设备上的数据分布存在差异，因此，利用各分布设备上的数据集进行模型训练并直接进行综合的方式会导致最终得到的全局模型的准确性比较低，从而会降低图像识别的准确性。

综上所述，如何提高图像识别的准确性，是目前本领域技术人员亟待解决的技术问题。

发明内容

有鉴于此，本申请的目的是提供一种图像识别方法、装置、设备及计算机可读存储介质，用于提高图像识别的准确性。

为了实现上述目的，本申请提供如下技术方案：

一种图像识别方法，包括：

将全局模型框架及全局权重发送至各设备，判断全局模型是否收敛或迭代次数是否达到最大迭代次数，若否，由各所述设备利用本地图像集对全局模型进行训练，得到本地模型权重；所述全局模型为带有所述全局权重的全局模型框架；

利用所述全局权重及各所述目标设备的本地模型权重，计算平均模型伪梯度，并利用所述平均模型伪梯度计算一阶矩估计；

根据所述一阶矩估计得到当前全局权重，根据所述当前全局权重得到当前全局模型，将所述当前全局权重发送至各所述设备，并执行判断全局模型是否收敛或迭代次数是否达到最大迭代次数的步骤，直至所述当前全局模型收敛或迭代轮次达到最大迭代次数为止；

获取待识别图像，利用所述当前全局模型对待识别图像进行识别。

优选的，在利用所述全局权重及各所述目标设备的本地模型权重，计算平均模型伪梯度时，还包括：

利用所述全局权重及各所述目标设备的本地模型权重，计算平均绝对模型伪梯度，利用所述平均绝对模型伪梯度计算二阶矩估计；

相应地，根据所述一阶矩估计得到当前全局权重，包括：

根据所述一阶矩估计和所述二阶矩估计得到所述当前全局权重。

优选的，利用所述全局权重及各所述目标设备的本地模型权重，计算平均绝对模型伪梯度，利用所述平均绝对模型伪梯度计算二阶矩估计，包括：

利用

计算所述平均绝对模型伪梯度Δ'_t；其中，t为当前迭代轮次，S_t为当前迭代轮次中参与训练的设备的集合，|S_t|为S_t中包含的设备的个数，

为模型伪梯度，

为

的绝对值，

为第i个设备在当前迭代轮次得到的本地模型权重，w^t-1为上一迭代轮次的全局权重；

利用

计算二阶矩估计v_t；其中，v_t-1为上一迭代轮次得到的二阶矩估计，β₂为二阶矩估计的系数。

优选的，根据所述一阶矩估计和所述二阶矩估计得到当前全局权重，包括：

利用

计算当前全局权重w^t；其中，η₀为全局学习率，γ为全局学习率递减系数，m_t为当前迭代轮次得到的一阶矩估计，ζ为调节系数且大于0。

优选的，在确定所述全局模型不收敛或所述迭代次数未达到最大迭代次数时，还包括：

从各所述设备中选择目标设备，其中，所述目标设备的数量小于所述设备的总数量。

优选的，从各所述设备中选择目标设备，包括：

从各所述设备中随机选择所述目标设备。

优选的，在将全局模型框架及全局权重发送至各设备之前，还包括：

对所述全局模型框架及所述全局权重进行加密。

一种图像识别装置，包括：

第一发送模块，用于将全局模型框架及全局权重发送至各设备，判断全局模型是否收敛或迭代次数是否达到最大迭代次数，若否，由各所述设备利用本地图像集对全局模型进行训练，得到本地模型权重；所述全局模型为带有所述全局权重的全局模型框架；

第一计算模块，用于利用所述全局权重及各所述目标设备的本地模型权重，计算平均模型伪梯度，并利用所述平均模型伪梯度计算一阶矩估计；

第二发送模块，用于根据所述一阶矩估计得到当前全局权重，根据所述当前全局权重得到当前全局模型，将所述当前全局权重发送至各所述设备，并执行判断全局模型是否收敛或迭代次数是否达到最大迭代次数的步骤，直至所述当前全局模型收敛或迭代轮次达到最大迭代次数为止；

识别模块，用于获取待识别图像，利用所述当前全局模型对待识别图像进行识别。

一种图像识别设备，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如上述任一项所述的图像识别方法的步骤。

一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机程序，所述计算机程序被处理器执行时实现如上述任一项所述的图像识别方法的步骤。

本申请提供了一种图像识别方法、装置、设备及计算机可读存储介质，其中，该方法包括：将全局模型框架及全局权重发送至各设备，判断全局模型是否收敛或迭代次数是否达到最大迭代次数，若否，由各设备利用本地图像集对全局模型进行训练，得到本地模型权重；全局模型为带有全局权重的全局模型框架；利用全局权重及各目标设备的本地模型权重，计算平均模型伪梯度，并利用平均模型伪梯度计算一阶矩估计；根据一阶矩估计得到当前全局权重，根据当前全局权重得到当前全局模型，将当前全局权重发送至各设备，并执行判断全局模型是否收敛或迭代次数是否达到最大迭代次数的步骤，直至当前全局模型收敛或迭代轮次达到最大迭代次数为止；获取待识别图像，利用当前全局模型对待识别图像进行识别。

本申请公开的上述技术方案，在利用各设备训练全局模型的过程中，获取各设备的本地模型权重，并利用本地模型权重及全局权重计算平均模型伪梯度和一阶矩估计，通过计算平均模型伪梯度和一阶矩估计并将一阶矩估计参与到全局权重中来减少不同设备中图像集分布差异带来的影响，从而提高最终得到的全局模型的准确性，进而在利用最终得到的全局模型进行图像识别时则可以提高图像识别的准确性。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本申请实施例提供的一种图像识别方法的流程图；

图2为本申请实施例提供的另一种图像识别方法的流程图；

图3为本申请实施例提供的一种图像识别装置的结构示意图；

图4为本申请实施例提供的一种图像识别设备的结构示意图。

具体实施方式

现有技术中，不同设备间的图像集可能存在较大的差异，由于一些图像集是不允许汇总在一起进行集中建模和图像识别的，因此，现有是采用由各设备利用各自的图像集进行训练和建模，然后，由中心设备直接将这些模型综合在一起而得到全局模型，而这则会使全局模型受不同设备间图像集分布的差异而存在准确性比较低的问题，从而会导致利用该全局模型进行图像识别的准确性比较低。

为此，本申请提供一种图像识别方法、装置、设备及计算机可读存储介质，用于提高图像识别的准确性。

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

参见图1，其示出了本申请实施例提供的一种图像识别方法的流程图，本申请实施例提供的一种图像识别方法，可以包括：

S11：将全局模型框架及全局权重发送至各设备。

S12：判断全局模型是否收敛或迭代次数是否达到最大迭代次数；若否，由设备利用本地图像集对全局模型进行训练，得到本地模型权重；全局模型为带有全局权重的全局模型框架。

中心节点设备(包含但不限于服务器或其他计算终端)初始化一个神经网络模型作为全局模型框架，并设置最大迭代次数T，初始化当前迭代次数t＝1，且初始化全局权重和一阶矩估计(其中，初始化的一阶矩估计可以等于0)。其中，设置最大迭代次数T的目的是为了避免因得到的全局模型不收敛而一直处于迭代中，从而降低计算资源的消耗。然后，中心节点设备将初始化的全局模型框架、初始化的全局权重及上述提及的其他初始化的相关参数发送至设备列表中包含的各设备中，以便于设备为模型训练做准备，并便于进行相关信息的同步。其中，设备列表包含与中心节点设备存在连接关系且合法的设备且设备包含但不限于服务器或者其他计算终端设备，如手机、PC机(Personal Computer，个人计算机)、边缘设备等。

然后，中心节点设备判断带有全局权重的全局模型框架(即此时对应的全局模型)是否收敛或t是否等于T+1，若全局模型未收敛且t不等于T+1，则中心节点设备可以给各设备发送训练指令，由各设备利用本地图像集对全局模型进行训练，以得到本地模型，然后，各设备根据本地模型得到本地模型权重，并将本地模型权重发送至中心节点设备。需要说明的是，这里提及的本地图像集具体可以为医学图像集(即内部包含的是医学图像)，当然，也可以为其他类型的本地图像集，本申请对本地图像集的类型不做任何限定。

S13：利用全局权重及各目标设备的本地模型权重，计算平均模型伪梯度，并利用平均模型伪梯度计算一阶矩估计。

中心节点设备在得到各设备发送的本地模型权重之后，利用全局权重及各设备的本地模型权重计算平均模型伪梯度，具体地：

利用

计算所述平均模型伪梯度Δ_t；其中，t为当前迭代轮次，S_t为当前迭代轮次中参与训练的设备的集合，|S_t|为S_t中包含的设备的个数，

为模型伪梯度，

为第i个设备在当前迭代轮次得到的本地模型权重，w^t-1为上一迭代轮次的全局权重。

通过上述过程可知，中心节点设备计算各设备的模型伪梯度，并将各设备的模型伪梯度进行平均，以平衡因各设备间图像集分布存在差异而带来的影响，即通过计算平均模型伪梯度来考虑整体水平情况，以尽量减少设备间图像集存在差异而带来的影响。

在计算出平均模型伪梯度之后，利用平均模型伪梯度计算全局模型的一阶矩估计，具体地：

利用m_t＝β₁m_t-1+(1-β₁)Δ_t计算全局模型的一阶矩估计m_t；其中，β₁为一阶矩估计的系数(决定上一轮估计结果的权重)，m_t-1为上一迭代轮次得到的一阶矩估计。

通过上述计算公式可知，本申请通过计算全局模型的一阶矩估计而将之前迭代轮次中计算得到的一阶矩估计(实际上为平均模型伪梯度)考虑在内，以保留之前迭代轮次的信息，同时，又将当前迭代轮次中对应的平均模型伪梯度包含在内，以降低图像集分布差异、本地模型差异带来的影响。

S14：根据一阶矩估计得到当前全局权重，根据当前全局权重得到当前全局模型，将当前全局权重发送至各设备，并执行判断全局模型是否收敛或迭代次数是否达到最大迭代次数的步骤，直至当前全局模型收敛或迭代轮次达到最大迭代次数为止。

在计算出一阶矩估计之后，可以根据一阶矩估计得到全局模型的当前权重，具体地，可以利用

计算全局模型的当前全局权重w^t，其中，η₀为全局学习率，γ为全局学习率递减系数，即在进行全局权重更新时，将步骤S13计算出的与当前迭代次数对应的一阶矩估计考虑在内，以便于降低目标设备间图像集分布差异带来的影响。之后，则将得到的当前全局权重带入到全局模型框架中，以得到当前全局模型。

然后，则将t+1赋值给t(即令t＝t+1)，且中心节点设备可以同时将计算出的当前全局权重发送至各设备，以对各设备的当前全局权重进行更新，从而便于进行相关信息的同步，并便于从中选择设备而进行模型训练。之后，中心节点设备返回执行步骤S12，即重复执行上述相关步骤，若在执行过程中，出现当前全局模型收敛或t等于T+1，则结束模型训练。由于在进行判断之前，已经将当前全局权重发送至各设备，因此，各设备可以利用最新接收到的当前全局权重以及之前接收到的全局模型框架来得到对应的当前全局模型，并利用当前全局模型对自身存储或获取到的待识别图像进行识别。

S15：获取待识别图像，利用当前全局模型对待识别图像进行识别。

在确定得到的当前全局模型收敛或迭代轮次达到最大迭代次数时，中心节点设备可以获取待识别图像，并利用最终得到的全局模型来对待识别图像进行识别

由于在当前全局模型获取的过程中，本申请是将各设备计算的本地模型权重及全局权重计算平均模型伪梯度和一阶矩估计，因此，则可以减弱因各设备中的图像集存在差异而对全局模型带来的影响，从而提高最终得到的全局模型的准确性，进而提高图像识别的准确性。

参见图2，其示出了本申请实施例提供的另一种图像识别方法的流程图，本申请实施例提供的一种图像识别方法，在利用全局权重及各目标设备的本地模型权重，计算平均模型伪梯度时，还可以包括：

利用全局权重及各目标设备的本地模型权重，计算平均绝对模型伪梯度，利用平均绝对模型伪梯度计算二阶矩估计；

相应地，根据一阶矩估计得到当前全局权重，可以包括：

根据一阶矩估计和二阶矩估计得到当前全局权重。

在本申请中，在利用全局权重及各目标设备的本地模型权重，计算平均模型伪梯度时，中心节点设备还可以执行“偏离抵抗聚合”，具体地，可以同时利用全局权重及各目标设备的本地模型权重计算平均绝对模型伪梯度，利用平均绝对模型伪梯度计算二阶矩估计，相应地，在根据一阶矩估计得到当前全局权重时，可以根据一阶矩估计和二阶矩估计得到当前全局权重，其中，加入二阶矩估计的计算和将其参与到当前全局权重更新中可以进一步降低目标设备间图像集分布差异带来的影响，而且通过加入二阶据估计可以加快全局模型收敛速度，以便于缩短模型训练时间，提高模型训练效率，进而便于及时对图像识别做出响应，提高图像识别效率。

本申请实施例提供的一种图像识别方法，利用全局权重及各目标设备的本地模型权重，计算平均绝对模型伪梯度，利用平均绝对模型伪梯度计算二阶矩估计，可以包括：

利用

计算平均绝对模型伪梯度Δ'_t；其中，t为当前迭代轮次，S_t为当前迭代轮次中参与训练的设备的集合，|S_t|为S_t中包含的设备的个数，

为模型伪梯度，

为

的绝对值，

利用

在本申请中，具体可以利用上述公式计算平均绝对模型伪梯度Δ'_t和二阶矩估计v_t，以提高平均绝对模型伪梯度Δ'_t和二阶矩估计v_t计算的准确性，从而便于提高最终得到的全局模型的准确性，进而便于提高图像识别的准确性。

本申请实施例提供的一种图像识别方法，根据一阶矩估计和二阶矩估计得到当前全局权重，可以包括：

利用

计算全局模型的当前全局权重w^t；其中，η₀为全局学习率，γ为全局学习率递减系数，m_t为当前迭代轮次得到的一阶矩估计，ζ为调节系数且大于0。

在根据一阶矩估计和二阶矩估计得到全局模型的当前全局权重时，具体可以利用上述公式计算全局模型的当前全局权重w^t，其中，ζ为一个正数，以防止分母出现0的情况，且通常将其设置为1e-6(即1*10^-6)，以减少对模型的影响。

通过上述公式可以准确地计算出当前全局权重w^t，从而便于提高最终得到的全局模型的准确性，进而便于提高图像识别的准确性。

本申请实施例提供的一种图像识别方法，在确定全局模型不收敛或迭代次数未达到最大迭代次数时，还可以包括：

从各设备中选择目标设备，其中，目标设备的数量小于设备的总数量。

在本申请中，在确定全局模型不收敛或迭代次数未达到最大迭代次数时，可以从各设备中选择目标设备，其中，所选择的目标设备的数量小于设备的总数量，然后，只由所选目标设备利用本地图像集对全局模型进行训练，以缩短训练时间，从而便于提高模型获取效率，进而便于提高图像识别的效率。需要说明的是，在此基础上，S_t即为当前迭代轮次中被选择的目标计算设备的集合。

本申请实施例提供的一种图像识别方法，从各设备中选择目标设备，可以包括：

从各设备中随机选择目标设备。

在从各设备中选择目标设备时，可以从各设备中随机选择目标设备，以提高设备被选择的公平性，降低数据分布差异，从而便于提高全局模型的准确性，进而便于提高图像识别的准确性。

当然，在从各设备中选择目标设备时，也可以采用如下方式进行实现：获取各设备被选中的次数，然后，中心节点设备在进行目标设备选择时，按照各设备被选中次数从小到大的原则来从各设备中选择目标设备，以避免某些经常被选中的设备一直被选中，从而尽量减少图像集分布差异带来的影响，进而便于提高图像识别的准确性。

本申请实施例提供的一种图像识别方法，在将全局模型框架及全局权重发送至各设备之前，还可以包括：

对全局模型及全局权重进行加密。

在将全局模型及全局权重发送至各设备之前，中心节点设备可以对全局模型及全局权重进行加密，然后，设备在利用时对其进行解密，以保证数据传输的可靠性和安全性，从而便于提高图像识别的可靠性和安全性。

当然，中心节点设备在将当前全局权重发送至各设备之前，同样也可以对当前全局权重进行加密，且在将当前全局模型发送至各设备之前，也可以对当前全局模型进行加密，以保证数据传输的可靠性和安全性。

本申请实施例提供的一种图像识别装置，参见图3，其示出了本申请实施例提供的一种图像识别装置的结构示意图，可以包括：

第一发送模块31，用于将全局模型框架及全局权重发送至各设备，判断全局模型是否收敛或迭代次数是否达到最大迭代次数，若否，由各设备利用本地图像集对全局模型进行训练，得到本地模型权重；全局模型为带有全局权重的全局模型框架；

第一计算模块32，用于利用全局权重及各目标设备的本地模型权重，计算平均模型伪梯度，并利用平均模型伪梯度计算一阶矩估计；

第二发送模块33，用于根据一阶矩估计得到当前全局权重，根据当前全局权重得到当前全局模型，将当前全局权重发送至各设备，并执行判断全局模型是否收敛或迭代次数是否达到最大迭代次数的步骤，直至当前全局模型收敛或迭代轮次达到最大迭代次数为止；

识别模块34，用于获取待识别图像，利用当前全局模型对待识别图像进行识别。

本申请实施例提供的一种图像识别装置，还可以包括：

第二计算模块，用于在利用全局权重及各目标设备的本地模型权重，计算平均模型伪梯度时，利用全局权重及各目标设备的本地模型权重，计算平均绝对模型伪梯度，利用平均绝对模型伪梯度计算二阶矩估计；

相应地，第二发送模块可以包括：

得到权重单元，用于根据一阶矩估计和二阶矩估计得到当前全局权重。

本申请实施例提供的一种图像识别装置，第二计算模块可以包括：

第一计算单元，用于利用

为模型伪梯度，

为

的绝对值，

第二计算单元，用于利用

本申请实施例提供的一种图像识别装置，得到权重单元可以包括：

计算子单元，用于利用

本申请实施例提供的一种图像识别装置，还可以包括：

选择模块，用于在确定全局模型不收敛或迭代次数未达到最大迭代次数时，从各设备中选择目标设备，其中，目标设备的数量小于设备的数量。

本申请实施例提供的一种图像识别装置，选择模块可以包括：

选择单元，用于从各设备中随机选择目标设备。

本申请实施例提供的一种图像识别装置，还可以包括：

加密模块，用于在将全局模型框架及全局权重发送至各设备之前，对全局模型及全局权重进行加密。

本申请实施例还提供了一种图像识别设备，参见图4，其示出了本申请实施例提供的一种图像识别设备的结构示意图，可以包括：

存储器41，用于存储计算机程序；

处理器42，用于执行存储器41存储的计算机程序时可实现如下步骤：

将全局模型框架及全局权重发送至各设备，判断全局模型是否收敛或迭代次数是否达到最大迭代次数，若否，由各设备利用本地图像集对全局模型进行训练，得到本地模型权重；全局模型为带有全局权重的全局模型框架；利用全局权重及各目标设备的本地模型权重，计算平均模型伪梯度，并利用平均模型伪梯度计算一阶矩估计；根据一阶矩估计得到当前全局权重，根据当前全局权重得到当前全局模型，将当前全局权重发送至各设备，并执行判断全局模型是否收敛或迭代次数是否达到最大迭代次数的步骤，直至当前全局模型收敛或迭代轮次达到最大迭代次数为止；获取待识别图像，利用当前全局模型对待识别图像进行识别。

本申请实施例还提供了一种计算机可读存储介质，计算机可读存储介质中存储有计算机程序，计算机程序被处理器执行时可实现如下步骤：

该计算机可读存储介质可以包括：U盘、移动硬盘、只读存储器(Read-OnlyMemory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

本申请实施例提供的一种图像识别装置、设备及计算机可读存储介质中相关部分的说明可以参见本申请实施例提供的一种图像识别方法中对应部分的详细说明，在此不再赘述。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。另外，本申请实施例提供的上述技术方案中与现有技术中对应技术方案实现原理一致的部分并未详细说明，以免过多赘述。

对所公开的实施例的上述说明，使本领域技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下，在其它实施例中实现。因此，本申请将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。