CN114826699B

CN114826699B - 基于区块链的去中心化联邦学习中拜占庭攻击抵御方法

Info

Publication number: CN114826699B
Application number: CN202210369653.1A
Authority: CN
Inventors: 王子龙; 肖丹; 陈谦; 周伊琳; 陈嘉伟
Original assignee: Xidian University
Current assignee: Xidian University
Priority date: 2022-04-08
Filing date: 2022-04-08
Publication date: 2022-12-06
Anticipated expiration: 2042-04-08
Also published as: CN114826699A

Abstract

本发明公开了一种基于区块链的去中心化联邦学习中拜占庭攻击抵御方法，主要解决去中心化联邦学习出现拜占庭攻击时现有技术的计算开销和通信开销过高问题。其实现步骤为：1)本地用户获取预训练的模型，并建立信誉对照关系；2)本地用户对模型训练后传输，然后生成签名消息并广播；3)本地用户对签名消息验证后存储，当签名消息存储了一定数量时，生成区块并利用改进的PBFT共识算法对区块共识后上链；4)本地用户对其他本地用户的传输和广播行为进行信誉对照关系的更新，然后调整签名消息的生成难度，重复执行流程直到模型收敛时结束。本发明能够有效降低现有技术的计算开销和通信开销，可用于提升去中心化联邦学习的拜占庭鲁棒性。

Description

基于区块链的去中心化联邦学习中拜占庭攻击抵御方法

技术领域

本发明属于信息安全技术领域，进一步涉及攻击抵御，具体为一种基于区块链的去中心化联邦学习中拜占庭攻击抵御方法。用于抵御去中心化联邦学习出现的拜占庭攻击，并减小消息数据的计算量和传输规模，提高去中心化联邦学习的安全性。

背景技术

去中心化联邦学习不需要中央服务器，相邻的用户通过多次不断交换和更新模型来保障训练的模型具有良好的泛化能力。具体地，参与去中心化联邦学习的用户持有各自的隐私数据并获取预训练的全局模型作为本地模型，利用隐私数据对本地模型进行训练得到本地更新模型，将本地更新模型发送给相邻用户，并接收相邻用户发送的本地更新模型作为本地模型进行再次训练。该过程一直持续，直到用户的本地模型收敛。去中心化联邦学习中的用户依据伪随机算法选择相邻用户发送模型，这使得模型训练路线是既定的。然而，由于中央服务器的缺失，未经身份认证的恶意用户可能发起拜占庭攻击，它试图在未训练模型的情况下发送本地模型，从而改变模型训练路线，影响用户对模型训练路线的共识。最终，模型的实际训练过程偏离正确方向，进而影响模型的泛化能力。因此，如何在保障模型泛化能力的前提下，提升去中心化联邦学习抵御拜占庭攻击的能力，并降低消息数据的计算开销和共识过程的通信开销成为了发展去中心化联邦学习的关键问题。

杭州趣链科技有限公司在其申请的专利文献“基于区块链去中心化的联邦学习成员推理攻击防御方法和装置”(申请号CN202110553163.2，申请公布号 CN113467928A，公布日期2021.10.01)中提出了一种基于区块链去中心化的联邦学习成员推理攻击防御方法和装置。该方法虽然在一定程度上增强了去中心化联邦学习***抗推理攻击的能力，然而其要在每轮聚合模型过程中随机选择用户作为临时中央服务器，去中心化不强，且由于用户需要通过工作量证明的方式获取区块的记账权，从而浪费了大量的计算资源，导致用户在争夺记账权过程中的计算开销过大。因此，存在浪费用户算力、增加计算成本的问题。

Li等人在其发表的论文“Byzantine Resistant Secure BlockchainedFederated Learning at the Edge”(IEEE Network,2021,PP(99):1-7.)中提出了一个名为BytoChain的抗拜占庭的安全区块链联邦学习框架。在该论文提出的BytoChain框架中，通过区块链打包节点、数据持有者、验证者三方协作训练模型，并使用抗拜占庭共识算法PoA来检测异常模型，增强了联邦学习抗拜占庭攻击的能力，但其不足之处在于：每轮训练时，数据持有者都需要从区块链打包节点处获取最新全局模型以及发送局部模型给验证者检查，从而在模型传输过程中产生大量通信，增加了通信开销。

发明内容

本发明的目的在于针对上述已有技术的不足，提出一种基于区块链的去中心化联邦学习中拜占庭攻击抵御方法，用于抵御去中心化联邦学习模型训练过程中恶意用户实施的拜占庭攻击，以及优化已有技术存在的计算开销大、通信开销大的问题。

实现本发明目的的技术思路是：首先，针对去中心化联邦学习模型训练和传输过程中出现的拜占庭攻击问题，本发明设计并搭建了一条区块链，着重设计用于广播模型传输行为的消息的内容，以前驱指针和后继公钥的方式，防止恶意节点篡改模型训练路线；其次，针对消息生成过程中的计算成本过大问题，本发明利用信誉值动态调整消息的生成难度，从而降低了计算开销；最后，针对用于区块上链的PBFT共识算法出现的消息通信数量过多的问题，本发明对PBFT算法的提交阶段进行改进，从而降低消息共识过程中的通信开销。本发明在抵御拜占庭攻击并保证模型泛化能力的前提下，有效提高了计算效率和通信效率。

为实现上述目的，发明采用的技术方案包括如下步骤：

1)设本地用户的总数为n，将第i个本地用户表示为u_i，i＝1,2,...,n；每个本地用户持有各自的垃圾邮件数据，并将获取的***预训练的全局模型作为本地模型；

2)本地用户分别建立各自的本地公私钥对，并广播公钥：

(2a)本地用户u_i利用ECC签名算法计算符合PKCS#8标准的私钥sk_i；

(2b)本地用户u_i利用DSS加密算法和私钥sk_i计算公钥pk_i，得到其本地公私钥对＜sk_i,pk_i＞；

(2c)本地用户u_i向其他本地用户u_j∈U_i广播公钥pk_i，其中U_i＝{u_j|j≠i} 表示本地用户集合，j＝1,2,...,n；

3)本地用户u_i为其他本地用户u_j的信誉值R_ij建立信誉对照关系＜＜u_j,R_ij＞＞，设定R_ij初始值为0.5；

4)本地用户u_i利用本地模型和其垃圾邮件数据生成本地更新模型

5)本地用户u_i随机选择某个相邻本地用户u_A，且u_A∈U_i，向其发送本地更新模型

6)本地用户u_i生成签名消息M_i，并将该消息广播给其他本地用户u_j：

(6a)本地用户u_i构建由消息编号id、消息内容mess、相邻本地用户u_A公钥、u_i消息集合

中尾端消息编号prevId以及随机值nonce组成的消息M_i'：

＜id,mess,nextPubKey,prevId,nonce＞，

其中，消息集合

初始状态为空，用于存储本地用户u_i自身生成的消息以及该用户接收到的其他合法消息，消息编号id是本地用户u_i对消息集合

中尾端消息的消息编号加1所得，消息编号id的初始编号为1；消息内容mess为“本地用户u_i向相邻本地用户u_A发送了一个模型”；随机值nonce的初始值为1；

(6b)本地用户u_i根据信誉值R_ij，利用信誉对照公式计算难度值

(6c)本地用户u_i判断消息M_i'的消息序列化哈希值

十六进制字符串中从左开始字符连续为0的数量是否等于难度值

若等于，则直接执行步骤(6d)，反之，对随机值nonce加1后再次判断，直到等于难度值

时再进入步骤(6d)；

(6d)本地用户u_i用私钥sk_i对消息M_i'进行签名，得到签名消息M_i：

＜id,mess,nextPubKey,prevId,nonce＞_σi，

其中，σ_i为本地用户u_i的签名；

(6e)本地用户u_i将签名消息M_i存储到消息集合

中，然后向其他本地用户u_j广播该签名消息M_i；

7)其他本地用户u_j将签名消息M_i转移到区块链上：

(7a)其他本地用户u_j对签名消息M_i进行合法性校验，并更新信誉对照关系；

(7b)其他本地用户u_j对存储了固定数量的u_j消息集合

生成区块B_j，然后利用改进PBFT共识算法对区块B_j的区块序列化哈希值

进行共识，得到共识结果；

所述的改进PBFT共识算法按如下步骤实现：

(7b1)本地用户u_i向***中其他本地用户u_j广播预准备消息：

其中，

为预准备消息标志，m为区块B_i的区块序列化哈希值

h为区块链的高度，d为m的摘要；

(7b2)其他本地用户u_j检查本地区块链中是否包含区块高度h相同但摘要d不同的预准备消息，若是，则执行步骤(7b10)，否则，执行步骤(7b3)；

(7b3)其它本地用户u_j向除其之外的别的本地用户u_k广播准备消息：

其中，k＝1,2,...,n且k≠j，

为准备消息标志；

(7b4)其他本地用户u_j检查是否接收到2f条高度h和摘要d一一对应的准备消息，若是，则执行步骤(7b5)，否则，执行步骤(7b10)；

(7b5)其他本地用户u_j向本地用户u_i发送预提交消息

其中

为预提交消息标志；

(7b6)本地用户u_i检查是否收到2f+1条预提交消息，若是，则执行步骤(7b7)，否则，执行步骤(7b10)；

(7b7)本地用户u_i向其他本地用户u_j广播提交消息

其中

为提交消息标志；

(7b8)其他本地用户u_j检查是否收到提交消息，若是，判定本地用户u_i和其他本地用户u_j共识成功；反之，判定为本地用户u_i和其他本地用户u_j共识失败；

(7c)其他本地用户u_j根据共识结果判断是否共识成功，若是，则执行步骤 (7d)，否则，判定***中恶意的本地用户数量超过拜占庭容错算法的范围，无法达成***一致性共识，结束流程并退出***；

(7d)其他本地用户u_j将区块B_j放到区块链上；

8)相邻本地用户u_A将本地用户u_i发送的本地更新模型

作为更新后本地模型；

9)本地用户u_i判断更新后本地模型是否收敛，若是，则直接执行步骤10)，否则，用更新后本地模型作为本地模型，返回执行步骤4)；

10)结束训练。

本发明与现有技术相比具有如下优点：

第一，本发明通过信誉值动态调整每个用户生成消息的难度，降低了合法消息生成时的计算成本，克服了现有技术存在的计算成本大的问题，使得本发明在抵御拜占庭攻击并保证模型泛化能力的前提下，降低消息生成过程中的计算开销，提高了去中心化联邦学习模型训练过程的效率。

第二，本发明改进了PBFT共识算法的提交阶段，降低了区块共识过程中的消息通信的数量，克服了现有PBFT共识算法存在的通信数量大的问题，使得本发明在抵御拜占庭攻击并保证模型泛化能力的前提下，降低共识过程中的通信数量，提高了通信效率。

附图说明

图1为本发明的实现流程图；

图2为本发明方法的应用场景示意图；

图3为本发明中信誉值更新的流程图；

图4为本发明中改进PBFT共识算法的流程图。

具体实施方式

去中心化联邦学习依靠相邻用户间直接交互，将训练模型任务分摊到***中的其他用户，从而获得一个具有良好泛化能力的模型。具体来说，参与去中心化联邦学习的用户持有各自的隐私数据并获取预训练的全局模型作为本地模型，利用隐私数据对本地模型进行训练得到本地更新模型，将本地更新模型发送给相邻用户，并接收相邻用户发送的本地更新模型作为本地模型进行再次训练。该去中心化联邦学习模型更新过程迭代进行，直到用户的本地模型收敛。

下面结合附图和实施例对本发明做进一步的详细描述。

参照图1和图2，对本发明提出的基于区块链的去中心化联邦学习中拜占庭攻击抵御方法做进一步的详细描述，具体实现步骤如下：

步骤1，设本地用户的总数为n，将第i个本地用户表示为u_i，i＝1,2,...,n；每个本地用户持有各自的垃圾邮件数据，并将获取的***预训练的全局模型作为本地模型。本实施例中***预训练的模型数据和每个本地用户持有的垃圾邮件数据分别来源于国际文本分类会议于2006年提供的Trec06p数据集和2007年提供的Trec07数据集。本发明所述模型均为卷积神经网络结构CNN，其中包括一层嵌入层、两层卷积层、两层池化层和三层全连接层。***经过预训练后，会得到一个全局模型和一个用于将文本数据转化成模型可以接受的向量的字典。

步骤2，本地用户分别建立各自的本地公私钥对，并广播公钥：

本地用户u_i建立本地公私钥对＜sk_i,pk_i＞，首先利用PyCryptodome加密库中的ECC签名算法计算符合PKCS#8标准的私钥sk_i，然后利用加密库中的DSS加密算法和私钥sk_i计算符合PKCS#8的公钥pk_i，最后向其他本地用户u_j∈U_i广播公钥pk_i，其中，本地用户集合U_i＝{u_j|j≠i}，j＝1,2,...,n。

步骤3，本地用户u_i为其他本地用户u_j的信誉值R_ij建立信誉对照关系＜＜u_j,R_ij＞＞，设定R_ij初始值为0.5；

步骤4，本地用户u_i利用本地模型和其垃圾邮件数据生成本地更新模型M_i。

在这一步，本地用户u_i利用字典将自身的垃圾邮件数据转化成模型可以接受的向量，然后利用向量对本地模型进行再次训练后，得到本地更新模型。

步骤5，本地用户u_i随机选择某个相邻本地用户u_A，且u_A∈U_i，向其发送本地更新模型

本实施例中，本地用户u_i按照伪随机算法选择某个相邻本地用户u_A，该相邻本地用户u_A除了需要验证其他的消息之外，还需要根据消息的合法性决定接收的模型是否该丢弃。

步骤6，本地用户u_i生成签名消息M_i，并将该签名消息广播给其他本地用户u_j：

(6a)本地用户u_i构建包含模型发送行为的消息M_i'，M_i'的结构为：

＜id,mess,nextPubKey,prevId,nonce＞，

其中，id为消息M_i'的编号，mess为消息M_i的内容，具体内容为“本地用户u_i向相邻本地用户u_A发送了一个模型”，nextPubKey为相邻本地用户u_A的公钥 pk_A，prevId为消息集合

中尾端消息的编号，nonce为随机值。消息集合

初始状态为空，用于存储本地用户u_i自身生成的签名消息以及该本地用户接收到的其他用户广播的合法签名消息，消息编号id是本地用户u_i对消息集合

中尾端消息的消息编号加1所得，消息编号id的初始编号为1；随机值nonce的初始值为1。

(6c)本地用户u_i判断消息M_i'的消息序列化哈希值

的十六进制字符串形式中从左开始字符连续为0的数量是否等于难度值

时再进入步骤(6d)；

＜id,mess,nextPubKey,prevId,nonce＞_σi，

其中，σ_i为本地用户u_i的签名；

(6e)本地用户u_i将签名消息M_i存储到消息集合

中，然后向其他本地用户u_j广播该签名消息M_i；

在所构建的签名消息中，id不仅是签名消息M_i的编号，结合prevId，可以将签名消息M_i以链的形式按序排放在消息集合

中。随机值nonce和哈希函数的难度值

的结合，使得恶意的本地用户篡改链中的任意签名消息时，需要将后续的签名消息重新生成，这会造成较大的计算开销。为了保障正常的本地用户在生成签名消息时的计算开销降低，本发明用信誉值R_ij动态调整哈希函数的难度值。nextPubKey是相邻本地用户u_A的公钥pk_A，用于指定本地更新模型将要被发送的其他的本地用户。σ_i保证了签名消息M_i的不可否认性。并且，对于其他本地用户u_j收到的签名消息M_i而言，其签名σ_i只能被消息集合

中尾端签名消息的nextPubKey成功验证。

通过指定后继本地用户的公钥的形式，该发明保证了去中心化联邦学习的模型训练路线不被篡改。当恶意本地用户发起拜占庭攻击，通过冒充模型训练路线即将到达的本地用户的身份，发送模型并广播签名消息时，其他的本地用户的消息集合中尾端消息存储的nextPubKey并非恶意本地用户的公钥，即可验证该签名消息的错误性。

步骤7，其他本地用户u_j将签名消息M_i转移到区块链上：

所述合法性校验，过程如下：

(7a1-1)其他本地用户u_j利用信誉对照关系和信誉对照公式，获取本地用户u_i的难度值

(7a1-2)其他本地用户u_j判断是否同时满足如下情况：

情况1：签名消息M_i不在u_j消息集合

中，且签名消息M_i的签名σ_i能被u_j消息集合

中尾端消息的nextPubKey验证成功；

情况2：签名消息M_i的消息序列化哈希值

的十六进制字符串形式中从左开始字符连续为0的数量等于难度值

若是，则执行步骤(7a1-4)；反之，则签名消息M_i来源于发起拜占庭攻击的恶意本地用户，执行步骤(7a1-3)；

(7a1-3)其他本地用户u_j丢弃签名消息M_i，若其他本地用户u_j是相邻本地用户u_A，则还需丢弃本地更新模型

该步骤保证了模型训练路线不被恶意本地用户所篡改；

(7a1-4)其他本地用户u_j将签名消息M_i存储到u_j消息集合

参照图3，对本发明实施例中所述更新用户信誉对照关系的过程做进一步的详细描述，具体是对信誉值R_ij进行如下更新：

(7a2-1)本地用户u_i在x倍的训练模型和生成消息总和时间内，统计收到其他本地用户u_j的签名消息M_j的数量N_j，其中，1＜x＜2；

(7a2-2)本地用户u_i对数量N_j进行如下判断：

a)若N_j大于1，则将信誉值R_ij更新为0；

b)若N_j等于0，则信誉值R_ij更新为y×R_ij，0＜y＜1；

c)若N_j等于1，则本地用户u_i将信誉值R_ij更新为

其中，min为取最小值操作，t为训练轮次。

这里x倍的总和时间保证了正常的本地用户执行一***作所需的时间，而无法满足恶意本地用户发起攻击所需的时间。在该x倍的总和时间中，本地用户广播一种签名消息，则本地用户是正常执行流程，其信誉值会增加。随着聚合轮次的增多，正常的本地用户的信誉值将缓慢增长到不超过1。如果在该时间段内本地用户没有广播签名消息，意味着可能该本地用户的当前网络状态不太良好，那么其信誉值就会下降，下降的速度由y的值决定。如果该时间段内本地用户广播了超过一种签名消息，该本地用户将被认作为发起拜占庭攻击的恶意本地用户，其信誉值直接降为0，生成签名消息的难度值超过了一台正常设备的算力要求范围。

本发明根据本地用户发送模型和广播消息的行为对其进行信誉值评分，利用信誉值对消息生成的难度值进行动态调整，使得正常的本地用户的计算开销越来越低，有利于***的正向发展；而恶意的本地用户信誉值降低，其计算开销呈指数级增长。

(7b)其他本地用户u_j对存储了固定数量的u_j消息集合

进行共识，得到共识结果；这里的固定数量至少为50条，具体根据需要进行设定，本实施例优选设定固定数量为100条。

参照图4，对本发明实施例中所述的改进PBFT共识算法的过程做进一步的详细描述。

所述的改进PBFT共识算法，按如下步骤实现：

(7b1)本地用户u_i向***中其他本地用户u_j广播预准备消息：

其中，

为预准备消息标志，m为区块B_i的区块序列化哈希值

h为区块链的高度，d为m的摘要；

原有的PBFT共识算法中包含了视图v和消息的序列号n，当发起共识请求的本地用户因为宕机等故障需要执行视图切换选择下一个本地用户时，保证消息的请求次序一致。去中心化联邦学习***中每个本地用户都可以发起共识请求，并不需要经历视图切换的过程。因此，本发明利用区块链高度h保证了m的次序一致性。m只在该步骤中被广播至其他的本地用户，之后的判断依据依赖于h和d。

在同一个区块高度h下，只会存在一个共识成功后存储在区块链中的区块。若接收的预准备消息中区块高度h相同但摘要d不同，意味着发起共识的本地用户是恶意本地用户，它广播了错误的预准备消息。

其中，k＝1,2,...,n且k≠j，

为准备消息标志；

在准备阶段要求本地用户收到2f个消息是因为若有f个恶意本地用户不响应时，网络中正常本地用户至少能发送2f条消息，使得***能够运行下去。

该步骤可以保证***中的每个本地用户的m的次序一致性。由于没有视图切换的过程，PBFT共识算法的提交阶段可以优化成两个部分：预提交阶段和提交阶段。

(7b5)其他本地用户u_j向本地用户u_i发送预提交消息

其中

为预提交消息标志；

该步骤是发起共识的本地用户收集其他本地用户的反馈，获取m在共识过程中其他本地用户的了解情况。

在预提交阶段要求发起共识的本地用户收到包含自己在内的2f+1条内容相同的预提交消息是因为，***认为有最多f个恶意本地用户故意掉线，而事实上这f个恶意本地用户发出恶意的预提交消息，那么只有正确的预提交消息的条数至少为f+1时，即收到包括自己在内的2f+1条消息时，则有效的正常本地用户数量比恶意本地用户数量多，算法一定能运行下去。

(7b7)本地用户u_i向其他本地用户u_j广播提交消息

其中

为提交消息标志；

该步骤是发起共识的本地用户确认其他本地用户的m一致性后，将结果反馈给其他本地用户。

(7c)其他本地用户u_j根据共识结果判断是否共识成功，若是，则执行步骤 (7d)，否则，判定***中的恶意用户数量超过拜占庭容错算法的范围，无法达成***一致性共识，结束本发明方法的执行流程并退出***；

(7d)其他本地用户u_j将区块B_j放到区块链上；

步骤8，相邻本地用户u_A将本地用户u_i发送的本地更新模型M_i作为更新后本地模型。

步骤9，本地用户u_i判断更新后本地模型是否收敛，若是，则直接执行步骤 10，否则，用更新后本地模型作为本地模型，返回执行步骤4；

步骤10，结束训练。

去中心化联邦学习在模型训练过程中会面临拜占庭攻击。拜占庭攻击具体体现为恶意用户在未对模型训练的情况下随意发送模型，对模型训练路线篡改，以达到***局部区域模型泛化能力最优，而全局模型泛化能力欠缺。现有方案面临两个难点：难点一，计算开销过大；现有方案采用工作量证明的方式增加消息生成的计算成本，在一定程度上加大恶意用户发起拜占庭攻击的难度，然而，对于 ***中的正常用户而言，过高的消息生成难度会引起不必要的计算资源的浪费，大大增加了计算开销；难点二，通信开销过大；现有方案采用PBFT共识算法对包含模型发送行为的消息进行共识上链，在***出现一定数量的拜占庭用户时，仍然保证***的可用性；然而，PBFT共识算法有两个阶段需要传输的网络消息数为O(n²)，造成了很大的通信开销，降低了去中心化联邦学习的通信效率。

针对难点一，本发明利用信誉值对每个用户生成消息的难度进行动态调整，降低了消息产生过程中的计算成本，克服了现有技术存在的计算开销大的问题。本发明在抵御拜占庭攻击并保证模型泛化能力的前提下，降低了消息生成过程中的计算开销。针对难点二，本发明通过对PBFT共识算法的提交阶段的改进，降低了***传输的网络消息数量，克服了现有PBFT共识算法存在的通信开销大的问题。本发明在抵御拜占庭攻击并保证模型泛化能力的前提下，降低消息共识过程的通信开销。

本发明未详细说明部分属于本领域技术人员公知常识。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，显然对于本领域的专业人员来说，在了解了本发明内容和原理后，都可能在不背离本发明原理、结构的情况下，进行形式和细节上的各种修正和改变，但是这些基于本发明思想的修正和改变仍在本发明的权利要求保护范围之内。