CN115225405A

CN115225405A - 联邦学习框架下基于安全聚合和密钥交换的矩阵分解方法

Info

Publication number: CN115225405A
Application number: CN202210899003.8A
Authority: CN
Inventors: 夏长达; 张子扬; ***; 张佳辰
Original assignee: Shanghai Light Tree Technology Co ltd
Current assignee: Shanghai Light Tree Technology Co ltd
Priority date: 2022-07-28
Filing date: 2022-07-28
Publication date: 2022-10-21
Anticipated expiration: 2042-07-28
Also published as: CN115225405B; CN116545734A; CN116545735A

Abstract

本发明公开了一种联邦学习框架基于安全聚合和密钥交换的矩阵分解方法，通过在联邦学习框架下对矩阵分解的物品矩阵I的梯度进行安全聚合，为联邦学习增强数据安全性提供了新的思路；利用不出本地

和安全聚合的梯度

高效地利用上推荐模型(即联邦学习模型)的训练样本，确保了用户数据不离开本地，同时使得推荐模型训练过程更加安全；对梯度加掩码和噪声，有效避免了数据因暴露真实梯度而造成源数据信息的泄露；提供的基于安全聚合的梯度汇总方式，相比较背景技术中采用的同态加密技术，对梯度加解密的计算复杂度更低，计算速度更快，利于提高推荐模型的训练速度。

Description

联邦学习框架下基于安全聚合和密钥交换的矩阵分解方法

技术领域

本发明涉及信息处理技术领域，具体涉及一种联邦学习框架下基于安全聚合和密钥交换的矩阵分解方法。

背景技术

目前安全矩阵分解算法主要基于矩阵分解的分布式算法，并通过Paillier同态加密等加密技术来保证传输信息的安全性，避免用户本地数据泄露。现有的安全矩阵分解算法的实现步骤主要为：

1、服务端初始化物品矩阵I，客户端本地初始化各自的用户矩阵U，公钥在服务端和客户端共有，私钥只有客户端有；

2、服务端利用公钥加密I得到密文C_I后广播给所有客户端；

3、每个客户端得到C_I后利用本地私钥对C_I解密得到真实的物品矩阵I，并用来计算客户端所持有的U的梯度并对U进行更新，更新完后计算I的梯度G并加密后得到密文C_G；

4、服务端收集C_G并更新得到C_I＝G_I-C_G，然后将更新后的C_I广播给所有的客户端；

5、重复步骤3-4直至算法收敛。

通过上述步骤1-5可以看到，现有的方案保证了用户数据不出本地，而且同态加密技术让服务端在整个训练流程中都无法拿到梯度的明文，从而无法从单条梯度反推出原始数据，但同态加密的方案需要反复的加解密使得训练不够高效，但若去掉同态加密直接对单条数据的明文梯度进行汇总，在多步训练后可以反推出原始数据，本地数据的安全性又无法保障，因此如何破解现有的安全矩阵分解算法存在的上述技术问题成为行业亟待解决的难题。

发明内容

本发明以使得推荐模型训练过程更为高效，且确保模型训练中本地数据***露为目的，提供了一种联邦学习框架下基于安全聚合和密钥交换的矩阵分解方法。

为达此目的，本发明采用以下技术方案：

提供一种联邦学习框架下基于安全聚合和密钥交换的矩阵分解方法，步骤包括：

S1，记联邦学习框架的调度方为服务端，各参与训练方为客户端，所述服务端将初始化后的物品的嵌入矩阵I广播给每个所述客户端；

S2，每个客户端X利用所述嵌入矩阵I计算关于各自本地用户嵌入矩阵U^X的梯度

并利用

更新本地用户的嵌入矩阵U^X；

S3，每个所述客户端X利用本地更新后的U^X，计算对所述嵌入矩阵I产生的梯度

S4，采用密钥交换方法更新所述梯度

并对

进行汇总得到

后，利用

更新所述嵌入矩阵I；

S5，重复步骤S2-S4，直至达到联邦学习的终止条件。

作为优选，步骤S2中，所述嵌入矩阵

中关联本地用户i的嵌入向量

的梯度

通过以下公式(1)计算而得：

公式(1)中，L为客户端X进行联邦学习的损失函数，

M^X表示所述客户端X处的评分矩阵；

I^T是I的矩阵转置；

‖·‖_F表示矩阵的Frobenius范数；

I_j∈R^1×k表示所有所述客户端共有的物品j的嵌入向量，是嵌入矩阵I＝[I₁,I₂,…,I_j,…,I_d]∈R^d×k的第j行；

表示I_j的向量转置；

表示所述客户端X拥有的所述用户i关于物品j的评分(用户i关于物品j没有实际评分的缺失项是建模完后需要预测的)；

j:

exists表示所述客户端X拥有的所述用户i实际评过分的物品j；

表示对所述客户端X拥有的所述用户i实际评过分的物品j关于记号j进行求和。

作为优选，步骤S2中，通过以下公式(2)更新每个所述客户端X各自本地的用户嵌入矩阵：

公式(2)中，λ_U表示U^X的正则化参数,

作为优选，步骤S3中，所述嵌入矩阵I中关联物品j的嵌入向量I_j对应的梯度

通过以下公式(3)计算而得：

公式(3)中，

表示

的第j行；

表示所有所述客户端共有的所述物品j的嵌入向量I_j的向量转置；

表示所述嵌入矩阵U^X中关联本地用户i的嵌入向量；

表示所述客户端X本地拥有的所述用户i关于所述物品j的评分；

i:

exists表示所述客户端X拥有的对物品j有过评分行为的那些用户i；

表示对所述客户端X拥有的对物品j有过评分行为的那些用户i关于记号i进行求和。

作为优选，步骤S4中，更换所述梯度

采用的所述密钥交换方法具体为：

S41，每个客户端X本地生成私钥s_X和公钥p_X,所述服务端对每个所述客户端X产生的公钥进行交换，每个所述客户端X得到对应的交换公钥集合，记为C_X；

S42，根据C_X和每个所述客户端X在本地生成的私钥s_X，在所述客户端X和其他每个客户端Y的两两客户端之间生成密钥协定，记为key_agreement(X,Y)；

S43，所述客户端X将本地生成的key_agreement(X,Y)作为种子生成掩码，记为mask(X,Y),然后更新步骤S3中的所述梯度

作为优选，步骤S41中，C_X通过以下表达式(4)表达：

C_X＝{P₁,…,P_X,…,p_N} 表达式(4)

表达式(4)中，

表示所述客户端X本地生成的公钥；

p表示素数，各客户端预先约定好；

g表示模p的原根，各客户端预先约定好；

％p表示对素数p取模运算；

{p₁,…,p_X,…,p_N}表示所服务器接收到的所有共N个所述客户端在本地生成的公钥的集合。

作为优选，步骤S42中，key_agreement(X,Y)的生成方法为：

所述客户端X从所述交换公钥集合C_X中取出所述客户端Y的公钥p_Y；

所述客户端X根据所述公钥p_Y和本地生成的所述私钥s_X生成为key_agreement(X,Y)。

作为优选，key_agreement(X,Y)的生成公式表达如下：

公式(5)中，

表示p_Y的s_X次幂；

p表示各客户端预先约定好的素数，；

％p表示对素数p取模运算。

作为优选，步骤S43中，通过以下公式(6)更新所述梯度

公式(6)中，a(X,Y)表示1或者-1，给客户端按{1,2,…,X,…,N}进行编号，如果客户端X的编号大于客户端Y的编号那么该值等于1，否则等于-1；

∑_{Y∈{1,2,…,N}\{X}}表示对所有非X的客户端Y关于记号Y求和。

作为优选，步骤S4中，汇总

的方法通过以下公式(7)表达：

步骤S4中，更新所述嵌入矩阵I的方法通过以下公式(8)表达：

公式(8)中，λ_I表示所述嵌入矩阵I的正则化参数。

作为优选，对步骤S3产生的所述梯度

加噪声后再转入步骤S4，对所述梯度

加噪声的方法通过以下公式(9)表达：

公式(9)中，n^X表示高斯噪声。

本发明具有以下有益效果：

1、利用安全聚合的梯度

和

获取推荐模型的训练样本，确保了用户数据不离开本地，同时使得推荐模型训练过程更加安全。

2、对梯度加掩码和噪声，有效避免了数据因暴露真实梯度而造成源数据信息的泄露；

3、提供的基于安全聚合的梯度汇总方式，相比较背景技术中采用的同态加密技术，对梯度加解密的计算复杂度更低，计算速度更快，利于提高推荐模型的训练速度；

4、在联邦学习框架下基于本申请提供的矩阵分解算法来训练推荐模型，在模型训练过程中，参与方不需要交换本地数据，更为有效地确保了本地数据***露。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例中所需要使用的附图作简单地介绍。显而易见地，下面所描述的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一实施例提供的联邦学习框架下基于安全聚合和密钥交换的矩阵分解方法的实现步骤图；

图2是本发明实施例提供的联邦学习框架下基于安全聚合和密钥交换的矩阵分解方法的流程框图。

具体实施方式

下面结合附图并通过具体实施方式来进一步说明本发明的技术方案。

其中，附图仅用于示例性说明，表示的仅是示意图，而非实物图，不能理解为对本专利的限制；为了更好地说明本发明的实施例，附图某些部件会有省略、放大或缩小，并不代表实际产品的尺寸；对本领域技术人员来说，附图中某些公知结构及其说明可能省略是可以理解的。

本发明实施例的附图中相同或相似的标号对应相同或相似的部件；在本发明的描述中，需要理解的是，若出现术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此附图中描述位置关系的用语仅用于示例性说明，不能理解为对本专利的限制，对于本领域的普通技术人员而言，可以根据具体情况理解上述术语的具体含义。

在本发明的描述中，除非另有明确的规定和限定，若出现术语“连接”等指示部件之间的连接关系，该术语应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或成一体；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个部件内部的连通或两个部件的相互作用关系。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本发明中的具体含义。

以下以具有A、B、C三个客户端为例，对本实施例提供的联邦学习框架下基于安全聚合和密钥交换的矩阵分解方法具体如何实现进行说明：

记联邦学习框架中的调度方为服务端，各参与训练方为客户端，M为评分矩阵(比如imdb多个用户对电影评分对应的矩阵，含有一些需要预测填充的缺失项)，U^A、U^B、U^C分别表示客户端A、B、C的本地用户的嵌入矩阵(利用矩阵来数值化本地的用户)，I表示物品的嵌入矩阵(利用矩阵来数值化共有物品)。如图2所示，本实施例提供的联邦学习框架下基于安全聚合和密钥交换的矩阵分解方法的具体实现步骤如下：

1、各方确定好嵌入维度(嵌入维度表示利用多少维度的空间来数值化用户和物品)，服务端根据嵌入维度初始化物品的嵌入矩阵I，客户端A、B、C根据嵌入维度分别初始化自己所拥有的本地用户的嵌入矩阵U^A、U^B、U^C

2、服务端将嵌入矩阵I广播给客户端A、B、C；

3、客户端A利用嵌入矩阵I计算U^A的梯度

然后更新本地用户的嵌入矩阵U^A，

其中

m_A表示客户端A的用户总数，I_j表示所有客户端共有的物品j的嵌入向量，

表示I_j的向量转置，

表示客户端A拥有的用户i关于物品j的评分，j:

exists表示客户端A拥有的用户i实际评过分的那些物品j，

表示对客户端A拥有的用户i实际评过分的那些物品j关于记号i进行求和；U^A的更新方式为：

λ_U示U^A的正则化参数；

客户端B、C分别对应的梯度

的计算方法，以及分别更新U^B、U^C的方法同客户端A，在此不再赘述；

4、客户端A利用本地更新后的U^A，计算对用户对嵌入矩阵I产生的梯度

其中

d表示共有物品总数，i:

exists表示客户端A拥有的对物品j有过评分行为的那些用户i，

对客户端A拥有的对物品j有过评分行为的那些用户i关于记号i进行求和；

客户端B、C分别对应的梯度

的计算方法同客户端A，在此不再赘述；

为了避免暴露真实梯度，优选对每个客户端对应的梯度作加噪声处理，更优选地，通过差分隐私技术对客户端A、B、C的

分别加上高斯噪声n^A、n^B、n^C。以客户端A为例，n^A表示生成的服从高斯分布的随机矩阵(大小和

相同)，

更新为

5、客户端A、B、C在本地分别生成各自的公钥和私钥，p_A、p_B、p_C分别表示客户端A、B、C在本地生成的公钥，s_A、s_B、s_C分别表示客户端A、B、C在本地生成的私钥。以客户端A为例，私钥s_A为本地生成的随机数(数值上小于p)，p_A(通过私钥s_A计算)为

其中g表示生成子(模p的原根，可以选较小的数，简单可以取成2)，

表示g的s_A次幂，p是大素数(一般可取2048位)，％p表示对p取模运算，每个客户端的g、p预先确定；

6、服务端收集所有公钥p_A、p_B、p_C，并发给客户端A的公钥为p_B、p_C，发给客户端B的公钥为p_A、p_C，发给客户端C的公钥为p_A、p_B；

7、客户端A根据公钥p_B、p_C和本地生成的私钥s_A生成与客户端B的key_agreement(A,B)，与客户端C的key_agreement(A,C)；客户端B根据公钥p_A、p_C和私钥s_B生成与客户端A的key_agreement(A,B)，与客户端C的key_agreement(B,C)；客户端C根据公钥p_A、p_B和自己的私钥s_C生成与客户端A的key_agreement(A,C)，与客户端B的key_agreement(B,C)。以客户端A为例，

分别表示p_B的s_A次幂和p_C的s_A次幂,％p表示对p取模运算。

8、客户端A将本地的key_agreement(A,B)作为种子生成掩码mask(A,B)，将本地的key_agreement(A,C)作为种子生成掩码mask(A,C)，并更新梯度

客户端B将本地的key_agreement(A,B)作为种子生成掩码mask(A,B)，将本地的key_agreement(B,C)作为种子生成掩码mask(B,C)，并更新梯度

客户端C将本地的key_agreement(A,C)作为种子生成掩码mask(A,C)，将本地的key_agreement(B,C)作为种子生成掩码mask(B,C)，并更新梯度

以客户端A为例，掩码mask(A,B)是以key_agreement(A,B)作为种子生成的大小、形状与

相同的随机矩阵(可调用开源库函数传入种子参数直接生成)。

9、服务端对梯度进行汇总得到

然后更新I，得到

λ_I表示嵌入矩阵I的正则化参数；

10、重复步骤2-8，直到达到联邦推荐模型的最大训练次数或算法收敛。

简而言之，本实施例提供的联邦学习框架下基于安全聚合和密钥交换的矩阵分解方法，如图1所示，包括步骤：

S1，记联邦学习框架的调度方为服务端，各参与训练方为客户端，服务端将初始化后的物品的嵌入矩阵I广播给每个客户端；

S2，每个客户端X利用嵌入矩阵I计算各自本地用户的嵌入矩阵U^X的梯度

并利用

更新本地用户的嵌入矩阵U^X；

S3，每个客户端X利用本地更新后的U^X，计算对嵌入矩阵I产生的梯度

S4，采用密钥交换方法更新梯度

并对

进行汇总得到

后，利用

更新所述嵌入矩阵I；

S5，重复步骤S2-S4，直至达到联邦学习的终止条件。

综上，本发明在联邦学习框架下对矩阵分解的物品矩阵I的梯度进行安全聚合，为联邦学习增强数据安全性提供了新的思路；利用安全聚合的梯度

和

获取推荐模型(即联邦学习模型)的训练样本，确保了用户数据不离开本地，同时使得推荐模型训练过程更加安全；对梯度加掩码和噪声，有效避免了数据因暴露真实梯度而造成源数据信息的泄露；提供的基于安全聚合的梯度汇总方式，相比较背景技术中采用的同态加密技术，对梯度加解密的计算复杂度更低，计算速度更快，利于提高推荐模型的训练速度。

需要声明的是，上述具体实施方式仅仅为本发明的较佳实施例及所运用技术原理。本领域技术人员应该明白，还可以对本发明做各种修改、等同替换、变化等等。但是，这些变换只要未背离本发明的精神，都应在本发明的保护范围之内。另外，本申请说明书和权利要求书所使用的一些术语并不是限制，仅仅是为了便于描述。