WO2020224205A1

WO2020224205A1 - 基于区块链的安全协作深度学习方法及装置

Info

Publication number: WO2020224205A1
Application number: PCT/CN2019/114984
Authority: WO
Inventors: 徐恪; 张智超; 吴波; 李琦; 徐松松
Original assignee: 清华大学
Priority date: 2019-05-07
Filing date: 2019-11-01
Publication date: 2020-11-12
Also published as: CN110197285A; CN110197285B; US11954592B2; US20200401890A1

Abstract

一种基于区块链的安全协作深度学习方法及装置，其中，该方法包括：允许一个全局参数服务器收集每轮训练中用户提交的模型参数并维护全局模型，同时每个用户利用自身拥有的验证数据集评估上传参数，并通过智能合约实现最优参数共识，最终由全局参数服务器聚合每轮训练中的最优参数，得到最终协作训练出的全局模型。由此，在允许用户之间在不公开隐私数据集的前提下进行协作训练，保护了彼此数据的隐私性，通过参数共享的方式让全局模型能够学习到所有数据源的特征，提高全局模型的准确率以及泛化能力。

Description

基于区块链的安全协作深度学习方法及装置

相关申请的交叉引用

本申请要求清华大学于2019年05月07日提交的、申请反馈名称为“基于区块链的安全协作深度学习方法及装置”的、中国专利申请号“201910375181.9”的优先权。

技术领域

本申请反馈属于分布式机器学习技术领域，特别涉及一种基于区块链的安全协作深度学习方法及装置。

背景技术

深度学习作为机器学习的一个重要分支，在近十年的时间内发展迅速，但是受限于计算机的计算能力和算法本身存在梯度消失等问题，虽然深度学习在图像识别、声音识别和推荐***等研究领域取得了巨大突破，但是深度学习训练过程中往往需要投入大量的训练数据，才能得到理想的训练结果。一些小型研究机构或者普通的研究人员，在特定的研究课题中，往往只拥有有限的训练数据，而数据集问题往往是限制其算法研究和模型设计的重要障碍之一。研究表明，深度模型的训练中，数据的特征反映在模型的参数改变量上，因此协作深度学习让不同用户之间通过参数共享的方式共享数据源特征，而不用直接将数据集公开。但是，协作深度学习中需要有合适的机制保障参数更新的最优化，防止恶意用户或者低质量数据源对全局模型产生负面影响。

区块链可视为一个公开可信的分布式账本(或数据库)，许多区块依次连接构成链式的存储结构，并通过共识机制保证数据记录的一致性和不可篡改特性。区块链上的智能合约是存储在区块链上的一段自动执行的电子合同代码，而智能合约的编程语言具有图灵完备性，可以根据需求编写对应功能的合约代码。外部应用可以通过调用合约代码的接口函数实现与区块链数据的交互，完成在协作深度学习中的最优参数共识等功能。

发明内容

本申请反馈旨在至少在一定程度上解决相关技术中的技术问题之一。

为此，本申请反馈的一个目的在于提出一种基于区块链的安全协作深度学习方法，该方法保证参与协作训练进程中，所有用户数据源的隐私特性、训练过程的安全性以及最终训练模型的高泛化和高准确率。

本申请反馈的另一个目的在于提出一种基于区块链的安全协作深度学习装置。

为达到上述目的，本申请反馈一方面实施例提出了一种基于区块链的安全协作深度学习方法，包括：

S1，获取全局模型、最优参数改变量集合和评价矩阵，对所述全局模型的参数、所述最优参数改变量集合和所述评价矩阵进行初始化；

S2，获取所述全局模型的下载指令，将所述下载指令发送至多个用户端以使所述多个用户端下载所述全局模型，每个用户端根据训练数据集对全局模型进行训练生成参数改变量集合，并按照预设的方法对所述参数改变量集合进行筛选；

S3，将所述每个用户端筛选后的参数改变量集合的哈希值存入至区块链，生成对应的存储交易号码，将所述筛选后的参数改变量集合和对应的所述存储交易号码发送至所述每个用户端，以使所述每个用户端根据验证数据集对接收到的所述筛选后的参数改变量集合和对应的所述存储交易号码进行验证和评估后生成用户端之间的多个评价值，将所述多个评价值存入所述区块链；

S4，根据所述多个评价值对所述评价矩阵进行更新，根据更新后的评价矩阵和预设的区块链共识合约优选出所述最优参数改变量集合，根据所述最优参数改变量集合对所述全局模型进行更新；

S5，迭代S2、S3和S4对所述全局模型进行更新，直至所述全局模型满足预设条件，结束迭代过程。

本申请反馈实施例的基于区块链的安全协作深度学***稳收敛。

另外，根据本申请反馈上述实施例的基于区块链的安全协作深度学习方法还可以具有以下附加的技术特征：

进一步地，所述每个用户端根据训练数据集对所述全局模型进行训练生成参数改变量集合，并按照预设的方法对所述参数改变量集合进行筛选，包括：

所述每个用户端根据本地的训练数据集对所述全局模型进行训练，并计算出所述参数改变量集合，公式为：

Δθ _i＝θ′ _i-θ _i

其中，θ′ _i为所述全局模型训练后的参数值，θ _i为所述全局模型训练前的参数值，Δθ _i为所述全局模型参数改变量；

将所述参数改变量按照降序排列，筛选出变化量最大的一组参数，生成所述筛选后的参数改变量集合，公式为：

其中，

为参数改变量集合，γ为筛选参数比例，θ _g为所述全局模型的参数集合。

进一步地，所述S2，还包括：

所述每个用户端对所述筛选后的参数改变量集合附加时间戳并进行签名。

进一步地，所述S3，还包括：

所述每个用户端对接收到的所述筛选后的参数改变量集合进行验证；

根据接收到的所述存储交易号码验证所述区块链上对应存储的所述筛选后的参数改变量集合的哈希值与接收到的所述筛选后的参数改变量集合是否一致。

进一步地，S4进一步包括：

根据用户端之间的所述多个评价值更新所述评价矩阵M；

根据所述评价矩阵M和所述预设的区块链共识合约优选出最优参数的用户端集合

获取所述最优参数的用户端集合

对应的所述最优参数改变量集合，根据所述最优参数改变量集合对所述全局模型进行更新，

具体步骤为：记M _i,:为第i个用户端对其它用户端的所有评价值，降序排列M _i,:，记为

根据在

中的排列位置，第j个用户端的得分为：

其中，m为总参与用户端个数，p _j为第j个用户端在

中的位置，第j个用户端的总分为：

其中，u _i为第i个用户端，

为所有用户端集合，s(j；u _i)为第j个用户端在u _i的评价下所得分数，基于总得分，所述最优参数的用户端集合：

为达到上述目的，本申请反馈另一方面实施例提出了一种基于区块链的安全协作深度学习装置，包括：

初始化模块，用于获取全局模型、最优参数改变量集合和评价矩阵，对所述全局模型的参数、所述最优参数改变量集合和所述评价矩阵进行初始化；

训练模块，用于所述获取全局模型的下载指令，将所述下载指令发送至多个用户端以使所述多个用户端下载所述全局模型，每个用户端根据训练数据集对所述全局模型进行训练生成参数改变量集合，并按照预设的方法对所述参数改变量集合进行筛选；

评估模块，用于将所述每个用户端筛选后的参数改变量集合的哈希值存入至区块链，生成对应的存储交易号码，将所述筛选后的参数改变量集合和对应的所述存储交易号码发送至所述每个用户端，以使所述每个用户端根据验证数据集对接收到的所述筛选后的参数改变量集合和对应的所述存储交易号码进行验证和评估后生成用户端之间的多个评价值，将所述多个评价值存入所述区块链；

更新模块，用于根据所述多个评价值对所述评价矩阵进行更新，根据更新后的评价矩阵和预设的区块链共识合约优选出所述最优参数改变量集合，根据所述最优参数改变量集合对所述全局模型进行更新；

迭代模块，用于通过迭代直至所述全局模型满足预设条件。

另外，根据本申请反馈上述实施例的基于区块链的安全协作深度学习装置还可以具有以下附加的技术特征：

Δθ _i＝θ′ _i-θ _i

其中，

进一步地，所述训练模块，还用于，

进一步地，所述评估模块，包括：验证单元，

所述验证单元，用于所述每个用户端对接收到的所述筛选后的参数改变量集合进行验证；

所述验证单元，具体用于根据接收到的所述存储交易号码验证所述区块链上对应存储的所述筛选后的参数改变量集合的哈希值与接收到的所述筛选后的参数改变量集合是否一致。

进一步地，所述更新模块，具体用于，

根据用户端之间的所述多个评价值更新所述评价矩阵M；

获取所述最优参数的用户端集合

根据在

中的排列位置，第j个用户端的得分为：

其中，m为总参与用户端个数，p _j为第j个用户端在

中的位置，第j个用户端的总分为：

其中，u _i为第i个用户端，

本申请反馈附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本申请反馈的实践了解到。

附图说明

本申请反馈上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：

图1为根据本申请反馈一个实施例的基于区块链的安全协作深度学习方法流程图；

图2为根据本申请反馈另一个实施例的基于区块链的安全协作深度学习方法流程图；

图3为根据本申请反馈一个实施例的协作学习实体及之间连接关系示意图；

图4为根据本申请反馈一个实施例的用户参与协作时的操作时序图；

图5为根据本申请反馈一个实施例的参数服务器与区块链之间的交互示意图；

图6为根据本申请反馈一个实施例的智能合约内容逻辑流程图；

图7为根据本申请反馈一个实施例的基于区块链的安全协作深度学习装置结构示意图。

具体实施方式

下面详细描述本申请反馈的实施例，实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本申请反馈，而不能理解为对本申请反馈的限制。

在目前深度学习发展的大背景下，深度模型的结构、规模不断增加，而对应训练过程需要的数据需求也与日俱增。对于同一训练目标，往往单一数据源的训练无法得到泛化能力强、准确率高的深度模型。但是，由于数据源数据隐私性等问题，交换隐私数据集的行为将受到法律的惩罚。本发明提出的一种基于区块链的协作深度学习方法，针对在实际中各种业务场景，利用不同用户的训练目标以及训练数据集之间的相关特性，设计出了一套在彼此无需公开数据集的前提下，能够协作训练同一深度模型的技术机制。该机制不仅可以让具有相同训练目标的用户之间能够共同协同训练得到泛化能力强、准确率高的深度模型，并且允许用户无需公开数据集，保护了数据集的隐私性。同时，基于区块链的可信存储特性，保证协作学习过程中任何一个参与实体无法恶意篡改协作进程中的中间参数，利用链上合约的共识机制，在训练用户之间达成最优参数的共识选择，保证训练进程中只有所有用户共识出的最优参数能够更新全局模型，即本技术方案能够容忍部分拥有低质数据集参与者的存在，保证了全局深度模型的稳定收敛。

下面参照附图描述根据本申请反馈实施例提出的基于区块链的安全协作深度学习方法及装置。

首先将参照附图描述根据本申请反馈实施例提出的基于区块链的安全协作深度学习方法。

图1为根据本申请反馈一个实施例的基于区块链的安全协作深度学习方法流程图。

如图1所示，该基于区块链的安全协作深度学习方法包括以下步骤：

步骤S1，获取全局模型、最优参数改变量集合和评价矩阵，对全局模型的参数、最优参数改变量集合和评价矩阵进行初始化。

具体地，通过协作学习的方式训练一个全局模型，首先对全局模型的参数进行初始化化，同时初始化后续用到的最优参数改变量集合。

可以理解的是，通过一个全局参数服务器作为中间桥梁实现用户端与区块链之间的信息交互，以协作学习的方式实现全局模型的训练更新。

具体地，全局参数服务器根据参与用户的设定初始化全局模型，并将最优参数量聚合到全局模型。假定有m个用户，选举其中n(n<m)个用户的参数作为每轮训练的最优集合，用于更新全局模型，其中全局模型共有k个参数。

初始化最优参数的用户列表(可以为空或者任意集合)，以及随机初始化全局模型参数。

步骤S2，获取全局模型的下载指令，将下载指令发送至多个用户端以使多个用户端下载全局模型，每个用户端根据训练数据集对全局模型进行训练生成参数改变量集合，并按照预设的方法对参数改变量集合进行筛选。

具体地，通过全局参数服务器向所有的用户端发出下载指令，所有的用户端下载初始化后的全局模型，开始第一轮的协作训练进程。

所有的用户端在下载全局模型后，每个客户端利用自身本地存储的训练数据集对全局模型进行训练生成参数改变量集合，其中，全局模型包含多个参数，多个参数在训练后会发生改变。每个用户端还会按照预设的方法对生成的参数改变量集合进行筛选。

需要说明的是，对全局模型进行训练可以使用随机梯度下降SGD的方法，也可以使用其它方法进行训练，根据实际需要选择训练方法进行训练。

进一步地，每个用户端根据训练数据集对全局模型进行训练生成参数改变量集合，并按照预设的方法对参数改变量集合进行筛选，包括：

每个用户端根据本地的训练数据集对全局模型进行训练，并计算出参数改变量集合，公式为：

Δθ _i＝θ′ _i-θ _i

其中，θ′ _i为全局模型训练后的参数值，θ _i为全局模型训练前的参数值，Δθ _i为全局模型参数改变量；

将参数改变量按照降序排列，筛选出变化量最大的一组参数，生成筛选后的参数改变量集合，公式为：

其中，

为参数改变量集合，γ为筛选参数比例，θ _g为全局模型的参数集合。

由述可知，在筛选参数改变量时采用的是降序排列，选择变化量最大的一组参数的方法，也可以根据实际需要选择其它的方法进行筛选。

步骤S3，将每个用户端筛选后的参数改变量集合的哈希值存入至区块链，生成对应的存储交易号码，将筛选后的参数改变量集合和对应的存储交易号码发送至每个用户端，以使每个用户端根据验证数据集对接收到的筛选后的参数改变量集合和对应的存储交易号码进行验证和评估后生成用户端之间的多个评价值，将多个评价值存入区块链。

进一步地，S3，还包括：

每个用户端对接收到的筛选后的参数改变量集合进行验证；

根据接收到的存储交易号码验证区块链上对应存储的筛选后的参数改变量集合的哈希值与接收到的筛选后的参数改变量集合是否一致。

可以理解的是，所有的用户端在筛选出参数改变集合后，将筛选出参数改变集合的上传至全局参数服务器，并对上传的参数进行时间戳签名，通过全局参数服务器将上传的参数改变量集合的哈希值存入区块链中，并得到一个对应的存储交易号码，通过存储交易号码可以查询区块链上存储的数据预上传至全局参数服务器的数据是否一致，保证全局参数服务器真实上传了每个用户筛选出的参数改变量集合。

全局参数服务器接收用户上传的训练得到的参数改变量集合，并存储在本地，并将参数改变量集合的哈希值Hash_para记录到区块链，得到对应的存储交易号码，记做Tx-ID。其中，H为哈希函数。

进一步地，在确定所有的用户端全部上传了筛选的参数改变量集合到区块链并生成对应的存储交易号码后，全局参数服务器再将所有用户端上传的参数改变量集合和对应的存储交易号码发送给所有的用户端，所有的用户端利用本地存储的验证数据集对接收到的参数改变量集合和对应的存储交易号码进行验证和打分得到评价值，其中，每一个客户端对其它的客户端进行打分，得到一一对应的评价值，并存储在区块链中。

需要说明的是，在用户端上传参数改变量集合时，若存在用户端没有上传参数改变量集合时，则等待未上传的用户端上传完成后，再将所有用户端上传的参数改变量集合和对应的存储交易号码发送给所有的用户端。

具体地，利用本地验证数据集计算参数更新对应的F1-score值，调用智能合约的函数，记录至区块链，作为最佳参数选择的依据。

步骤S4，根据多个评价值对评价矩阵进行更新，根据更新后的评价矩阵和预设的区块链共识合约优选出最优参数改变量集合，根据最优参数改变量集合对全局模型进行更新。

进一步地，S4进一步包括：

根据用户端之间的多个评价值更新评价矩阵M；

根据评价矩阵M和预设的区块链共识合约优选出最优参数的用户端集合

获取最优参数的用户端集合

对应的最优参数改变量集合，根据最优参数改变量集合对全局模型进行更新。

基于多赢选举规则和用户上传的F1-score值，为每个用户的参数改变量投票打分，分数最高的n个用户被记为最优参数集合，然后服务器用其对应上传的参数改变量更新模型。

具体地，协作学习进程开始时，初始化评价矩阵M＝{0} _m*m。

接收用户之间的评价值，并更新评价矩阵M。M _ij则表示第i个用户对第j个用户的评价值。

当所有用户进行完彼此参数改变量的评价之后，根据M选择出最优参数的用户集合

并通告参数服务器进行模型更新。具体选择方法如下：

记M _i,:为第i个用户对其他用户的所有评价值，首先降序排列M _i,:，记为

根据在

中的排列位置，第j个用户的得分为：

其中，m为总参与用户数，p _j为第j个用户在

中的位置。根据上式，第j个用户的总分为：

其中u _i为第i个用户，

为所有用户集合，s(j；u _i)为第j个用户在u _i的评价下所得分数。基于总得分，最优参数的用户集合：

其中

即选出在所有

中得分最高的n个最优用户集合。

可以理解的是，在得到最优参数改变量集合时，首先得到最优参数的用户集合，再根据最优参数用户集合对应的参数改变量集合得到最优参数改变量集合，利用最优参数改变量集合更新全局模型。

当收到智能合约最终的共识结果

后，更新最优参数的用户集合，并聚合所有对应用户的参数改变量。

其中，

是模型对应的一个参数，

是每个最优用户上传对应参数的改变量。全局参数服务器首先平均所有用户模型对θ _i的改变量，得到的值加到对应参数上，并循环执行该操作遍历所有的模型参数，最终实现对模型的更新。

步骤S5，迭代S2、S3和S4对全局模型进行更新，直至全局模型满足预设条件，结束迭代过程。

具体地，在完成一次全局模型的训练更新后，全局参数服务器再向用户端发送下载最新全局模型的指令，再进行训练更新，通过多次的迭代过程，直至全局模型满足预设条件，比如当模型准确率达到用户的预期值，或者当训练轮数足够多时，结束迭代，结束协作训练的标志可以根据实际需要进行设定。

本申请反馈的协作学***稳收敛。

如图2所示，展示了***实例初始化部署的流程图，主要包括5个步骤：

步骤1，参与协作学习训练的m个用户，协商出一个共同的深度模型结构。该模型由参数服务器全局维护。

步骤2，参数服务器进行初始化。主要包括两个部分，首先初始化最优参数用户列表，然后随机初始化深度模型，并通告所有参与用户进行下载。

步骤3，部署共识合约。合约首先初始化评价矩阵M，其次，共识合约内需要设定一些重要参数，例如选择每轮训练中的最优参数用户的个数n。

步骤4，所有参与协作训练的用户，从参数服务器下载初始化的深度模型。注意，应该保证所有用户起始训练的模型结构保持一致，因此需要有全局参数服务器对模型进行随机初始化，所有用户在同一随机初始模型基础上进行训练。

步骤5，每个用户准备好训练数据集和验证数据集，并利用训练数据集训练初始化的深度模型，启动协作学习进程。

本申请反馈的方法让具有相同训练目标的用户之间能够共同协同训练目标模型，并不失对隐私数据的保护，允许一个全局参数服务器收集每轮训练中用户提交的模型参数并维护全局模型，同时每个用户利用自身拥有的验证数据集评估上传参数，并通过智能合约实现最优参数共识，最终由全局参数服务器聚合每轮训练中的最优参数，得到最终协作训练出的全局模型。

如图3所示，展示了涉及的3个实体以及在协作学习进程中各自的交互流程，其中每个实体的具体实施职能概要如下：

第一部分为用户群组(多个用户端)。每个用户拥有各自的训练数据集以及验证数据集，并通过随机梯度下降等方式进行本地训练。当本地训练结束后，用户选择相应的参数改变列表，附加时间戳并签名后上传至参数服务器，防止他人复制(或重放)对应的参数。同时，每当有新的参数改变列表上传时，所有用户都应下载最新的参数改变量，并用自身拥有的验证数据集，计算出评价值F1-score(或其他验证方法得到对应的评价值)，然后将对应的评价结果同步至区块链智能合约。需要注意的是，在本申请反馈的协作学习方法中，每个用户应该具有相同的训练目标，例如相同的深度模型。

第二部分为参数服务器。参数服务器与用户和区块链进行数据交互，如模型参数的上传下载、参数对应哈希值的交易广播等。此外，参数服务器还维护全局模型，并使用最优参数集合中的用户上传的参数改变量来更新全局模型。同时，参数服务器应存储每个用户的公钥，用于验证用户的签名数据。为防止参数服务器被攻击，从而出现参数的恶意篡改等现象，所有用户上传的参数改变哈希需要附加到区块链交易的数据字段中，并返回给每个用户对应下载参数的交易号码，即Tx-ID，用于验证参数的一致性，防止上述恶意行为的出现。

第三部分为区块链及链上智能合约。每个用户上传的参数改变量哈希值，需要附加到交易的数据段中，并广播至区块链网络，以保证记录的哈希值不能被服务器篡改。其中，由于现有的公有链网络的性能受限，成本较高，因此本实施方案建议使用的是性能较好的联盟链，例如使用超级账本fabric等开源联盟链项目。同时，所搭建的区块链必须支持智能合约的运行，比如以太坊支持solidity合约，fabric则支持Golang，java等高级编程语言。智能合约是一种计算机协议，旨在对合同的协商或履行进行数字化，从而便于验证或强制执行。智能合约允许在没有第三方的情况下进行可信的交易。这些交易是可跟踪和不可逆转的。方案中的智能合约必须运行与区块链之上，区块链为智能合约提供一个可信的执行环境。因此，本申请反馈方法中的共识合约基于上述特性，保证用户群组内能够形成对最优参数的共识，从而保证全局模型平稳收敛，而避免受到恶意用户或者低质量参数的影响。

如图4所示，展示了用户群组中每个用户在本实施例中所需要的操作时序流程图，主要包括两个阶段，每个阶段包括6个步骤：

训练阶段：

步骤1，在每轮训练开始时，用户需要从服务器下载最新的全局模型，用于本轮训练。

步骤2，用户利用自身的验证数据集进行本地训练。所有用户的训练方法需要保持一致，例如利用随机梯度下降的方法。利用本地的验证数据集对模型进行训练后，需要并计算出每个参数改变量

步骤3，将

降序排列，挑选出变化量最大的一组参数改变

进行上传。注意，此时挑选的比例会影响***运行的效率，挑选比例记做γ,即

比例γ越大，上传模型的更新程度越高，可以稍微提高全局模型收敛的速率，但是，相应的通信带宽也就越大，因为每个客户端需要与服务器交互更多的参数。因此，建议γ可以位于区间[0.01,0.2]内，根据实际模型参数整体的大小调整上传比例，综合考虑通信效率和收敛速率两个重要因素。

步骤4，将

以及对应时间戳签名后，上传至服务器，防止简单的重放攻击等恶意行为。

步骤5，服务器反馈记录上链的交易Tx-ID，用户收到Tx-ID后，验证链上存储是否与上传参数保持一致，这样防止服务器篡改参数后下发给其他用户。

步骤6，服务器通告其他用户下载最新的参数更新。

验证阶段：

步骤1，当有其它用户上传新的参数更新后，服务器通告当前用户下载并评估上传参数。

步骤2，用户下载参数更新以及对应的区块链交易Tx-ID。

步骤3，查询链上存储的参数哈希Hash_para，对比下载的参数更新对应的哈希值，保证下载的参数不会被服务器恶意篡改。

步骤4，利用本地验证数据集对参数进行评估。需要注意，评估方法需要具有一致性，例如利用常用的F1、准确率等评价方法，验证其他用户上传参数的优劣。

步骤5，用户将对应的评价值同步至区块链共识合约。共识合约需要留出对应的合约接口，供用户调用。

步骤6，合约事件触发，通告服务器对应的评估结果。此处需要服务器监听区块链上的合约事件，一旦事件触发，服务器捕捉到相应的事件类型，按照事件分类执行对应的回调响应。例如此处一旦用户提交了最新的评估值，服务器需要捕捉对应的合约事件，保证内容与链上数据的一致性。

如图5所示，展示了参数服务器与区块链的交互流程图，主要分为4个步骤：

步骤1，当用户上传参数时，服务器将对应参数的哈希值Hash_para附加在交易数据段记录在区块链上。

步骤2，区块链反馈对应的交易Tx-ID。Tx-ID是一段哈希值，唯一标识一个交易，服务器将此Tx-ID反馈给用户，用于验证下载参数的一致性。

步骤3，服务器注册监听服务。共识合约需要编写相应的合约事件，服务器监听对应的事件回调响应，对事件作出相应的处理。

步骤4，合约函数被用户调用，抛出对应的事件，由服务器捕捉。服务器捕捉到相应的事件后，根据事件类型，作出对应的响应处理。例如当用户评估参数得到相应的评估结果后，合约会触发对应的事件，服务器需要捕捉对应事件，及时同步数据。

如图6所示，展示了共识合约的数据处理流程图，主要有5个步骤：

步骤1，合约内容的编写及部署。合约内需要定义函数接口以及对应的事件类型。

步骤2，初始化合约内部的参数。包括但不限于最优参数用户的个数n、评价矩阵M等。最优集合个数n影响模型收敛的速率，例如，较大的个数n代表每次服务器会选用较多的参数聚合至全局模型，如果低质数据集数量较多或者有恶意用户的存在，可能会将负面影响引入到全局模型。因此，n的取值应适应实际参与协作训练的用户的数量及数据集之间的差异性。

步骤3，等待接收用户的评估值。

步骤4，当收到用户的评估值后，更新评价矩阵M中对应元素的数值，并抛出对应事件，通告服务器最新的用户评价参数。然后判断是否收到了所有用户之间的评价，如果当前轮次中仍有用户没有上传参数，则跳转至步骤3，否则当每轮训练超时或所有用户均已对模型进行了训练与评估，跳转步骤5。

步骤5，根据评价矩阵M，选举出当前轮次中的最优参数用户集合

并通告服务器。服务器收到最新轮次中的最优参数集合后，根据

内每个用户上传的参数改变量

聚合至全局模型，并通知所有用户下载最新的全局模型，然后开启下一轮的训练进程。

协作训练进程结束的标志可以由用户群组协定，例如，当模型准确率达到用户的预期值，或者当训练轮数足够多时，停止协作训练进程，每个用户可以从参数服务器中下载得到最新的深度模型。根据实际模型的大小，参数服务器需要为每个用户分配适合的带宽，保证协作训练进程的连续性。

根据本申请反馈实施例提出的基于区块链的安全协作深度学***稳收敛。

其次参照附图描述根据本申请反馈实施例提出的基于区块链的安全协作深度学习装置。

如图7所示，该基于区块链的安全协作深度学习装置包括：初始化模块100、训练模块200、评估模块300、更新模块400和迭代模块500。

其中，初始化模块100，用于获取全局模型、最优参数改变量集合和评价矩阵，对全局模型的参数、最优参数改变量集合和评价矩阵进行初始化。

训练模块200，用于获取全局模型的下载指令，将下载指令发送至多个用户端以使多个用户端下载全局模型，每个用户端根据训练数据集对全局模型进行训练生成参数改变量集合，并按照预设的方法对参数改变量集合进行筛选。

评估模块300，用于将每个用户端筛选后的参数改变量集合的哈希值存入至区块链，生成对应的存储交易号码，将筛选后的参数改变量集合和对应的存储交易号码发送至每个用户端，以使每个用户端根据验证数据集对接收到的筛选后的参数改变量集合和对应的存储交易号码进行验证和评估后生成用户端之间的多个评价值，将多个评价值存入区块链。

更新模块400，用于根据多个评价值对评价矩阵进行更新，根据更新后的评价矩阵和预设的区块链共识合约优选出最优参数改变量集合，根据最优参数改变量集合对全局模型进行更新。

迭代模块500，用于通过迭代直至全局模型满足预设条件。

该装置使得用户之间在不公开隐私数据集的前提下进行协作训练，不仅保护了彼此数据的隐私性，还通过参数共享的方式让全局模型能够学习到所有数据源的特征，提高全局模型的准确率以及泛化能力。

Δθ _i＝θ′ _i-θ _i

其中，

进一步地，训练模块，还用于，

每个用户端对筛选后的参数改变量集合附加时间戳并进行签名。

进一步地，评估模块，包括：验证单元，

验证单元，用于每个用户端对接收到的筛选后的参数改变量集合进行验证；

验证单元，具体用于根据接收到的存储交易号码验证区块链上对应存储的筛选后的参数改变量集合的哈希值与接收到的筛选后的参数改变量集合是否一致。

进一步地，更新模块，具体用于，

根据用户端之间的多个评价值更新评价矩阵M；

获取最优参数的用户端集合

对应的最优参数改变量集合，根据最优参数改变量集合对全局模型进行更新，

根据在

中的排列位置，第j个用户端的得分为：

其中，m为总参与用户端个数，p _j为第j个用户端在

中的位置，第j个用户端的总分为：

其中，u _i为第i个用户端，

为所有用户端集合，s(j；u _i)为第j个用户端在u _i的评价下所得分数，基于总得分，最优参数的用户端集合：

需要说明的是，前述对基于区块链的安全协作深度学习方法实施例的解释说明也适用于该实施例的装置，此处不再赘述。

在本申请反馈的描述中，需要理解的是，术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”、“顺时针”、“逆时针”、“轴向”、“径向”、“周向”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本申请反馈和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本申请反馈的限制。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请反馈的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

在本申请反馈中，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或成一体；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通或两个元件的相互作用关系，除非另有明确的限定。对于本领域的普通技术人员而言，可以根据具体情况理解上述术语在本申请反馈中的具体含义。

在本申请反馈中，除非另有明确的规定和限定，第一特征在第二特征“上”或“下”可以是第一和第二特征直接接触，或第一和第二特征通过中间媒介间接接触。而且，第一特征在第二特征“之上”、“上方”和“上面”可是第一特征在第二特征正上方或斜上方，或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方，或仅仅表示第一特征水平高度小于第二特征。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请反馈的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

尽管上面已经示出和描述了本申请反馈的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本申请反馈的限制，本领域的普通技术人员在本申请反馈的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

一种基于区块链的安全协作深度学习方法，其特征在于，包括以下步骤：

S1，获取全局模型、最优参数改变量集合和评价矩阵，对所述全局模型的参数、所述最优参数改变量集合和所述评价矩阵进行初始化；

S2，获取所述全局模型的下载指令，将所述下载指令发送至多个用户端以使所述多个用户端下载所述全局模型，每个用户端根据训练数据集对全局模型进行训练生成参数改变量集合，并按照预设的方法对所述参数改变量集合进行筛选；

S3，将所述每个用户端筛选后的参数改变量集合的哈希值存入至区块链，生成对应的存储交易号码，将所述筛选后的参数改变量集合和对应的所述存储交易号码发送至所述每个用户端，以使所述每个用户端根据验证数据集对接收到的所述筛选后的参数改变量集合和对应的所述存储交易号码进行验证和评估后生成用户端之间的多个评价值，将所述多个评价值存入所述区块链；

S4，根据所述多个评价值对所述评价矩阵进行更新，根据更新后的评价矩阵和预设的区块链共识合约优选出所述最优参数改变量集合，根据所述最优参数改变量集合对所述全局模型进行更新；

S5，迭代S2、S3和S4对所述全局模型进行更新，直至所述全局模型满足预设条件，结束迭代过程。
根据权利要求1所述的方法，其特征在于，所述每个用户端根据训练数据集对所述全局模型进行训练生成参数改变量集合，并按照预设的方法对所述参数改变量集合进行筛选，包括：

所述每个用户端根据本地的训练数据集对所述全局模型进行训练，并计算出所述参数改变量集合，公式为：

Δθ _i＝θ′ _i-θ _i

其中，θ′ _i为所述全局模型训练后的参数值，θ _i为所述全局模型训练前的参数值，Δθ _i为所述全局模型参数改变量；

将所述参数改变量按照降序排列，筛选出变化量最大的一组参数，生成所述筛选后的参数改变量集合，公式为：

其中，
为参数改变量集合，γ为筛选参数比例，θ _g为所述全局模型的参数集合。
根据权利要求1所述的方法，其特征在于，所述S2，还包括：

所述每个用户端对所述筛选后的参数改变量集合附加时间戳并进行签名。
根据权利要求1所述的方法，其特征在于，所述S3，还包括：

所述每个用户端对接收到的所述筛选后的参数改变量集合进行验证；

根据接收到的所述存储交易号码验证所述区块链上对应存储的所述筛选后的参数改变量集合的哈希值与接收到的所述筛选后的参数改变量集合是否一致。
根据权利要求1所述的方法，其特征在于，S4进一步包括：

根据用户端之间的所述多个评价值更新所述评价矩阵M；

根据所述评价矩阵M和所述预设的区块链共识合约优选出最优参数的用户端集合
获取所述最优参数的用户端集合
对应的所述最优参数改变量集合，根据所述最优参数改变量集合对所述全局模型进行更新，

具体步骤为：记M _i,:为第i个用户端对其它用户端的所有评价值，降序排列M _i,:，记为
根据在
中的排列位置，第j个用户端的得分为：

其中，m为总参与用户端个数，p _j为第j个用户端在
中的位置，第j个用户端的总分为：

其中，u _i为第i个用户端，
为所有用户端集合，s(j；u _i)为第j个用户端在u _i的评价下所得分数，基于总得分，所述最优参数的用户端集合：
一种基于区块链的安全协作深度学习装置，其特征在于，包括：

初始化模块，用于获取全局模型、最优参数改变量集合和评价矩阵，对所述全局模型的参数、所述最优参数改变量集合和所述评价矩阵进行初始化；

训练模块，用于所述获取全局模型的下载指令，将所述下载指令发送至多个用户端以使所述多个用户端下载所述全局模型，每个用户端根据训练数据集对所述全局模型进行训练生成参数改变量集合，并按照预设的方法对所述参数改变量集合进行筛选；

评估模块，用于将所述每个用户端筛选后的参数改变量集合的哈希值存入至区块链，生成对应的存储交易号码，将所述筛选后的参数改变量集合和对应的所述存储交易号码发送至所述每个用户端，以使所述每个用户端根据验证数据集对接收到的所述筛选后的参数改变量集合和对应的所述存储交易号码进行验证和评估后生成用户端之间的多个评价值，将所述多个评价值存入所述区块链；

更新模块，用于根据所述多个评价值对所述评价矩阵进行更新，根据更新后的评价矩阵和预设的区块链共识合约优选出所述最优参数改变量集合，根据所述最优参数改变量集合对所述全局模型进行更新；

迭代模块，用于通过迭代直至所述全局模型满足预设条件。
根据权利要求6所述的装置，其特征在于，所述每个用户端根据训练数据集对所述全局模型进行训练生成参数改变量集合，并按照预设的方法对所述参数改变量集合进行筛选，包括：

所述每个用户端根据本地的训练数据集对所述全局模型进行训练，并计算出所述参数改变量集合，公式为：

Δθ _i＝θ′ _i-θ _i

其中，θ′ _i为所述全局模型训练后的参数值，θ _i为所述全局模型训练前的参数值，Δθ _i为所述全局模型参数改变量；

将所述参数改变量按照降序排列，筛选出变化量最大的一组参数，生成所述筛选后的参数改变量集合，公式为：

其中，
为参数改变量集合，γ为筛选参数比例，θ _g为所述全局模型的参数集合。
根据权利要求6所述的装置，其特征在于，所述训练模块，还用于，

所述每个用户端对所述筛选后的参数改变量集合附加时间戳并进行签名。
根据权利要求6所述的装置，其特征在于，所述评估模块，包括：验证单元，

所述验证单元，用于所述每个用户端对接收到的所述筛选后的参数改变量集合进行验证；

所述验证单元，具体用于根据接收到的所述存储交易号码验证所述区块链上对应存储的所述筛选后的参数改变量集合的哈希值与接收到的所述筛选后的参数改变量集合是否一致。
根据权利要求6所述的装置，其特征在于，所述更新模块，具体用于，

根据用户端之间的所述多个评价值更新所述评价矩阵M；

根据所述评价矩阵M和所述预设的区块链共识合约优选出最优参数的用户端集合
获取所述最优参数的用户端集合
对应的所述最优参数改变量集合，根据所述最优参数改变量集合对所述全局模型进行更新，

具体步骤为：记M _i,:为第i个用户端对其它用户端的所有评价值，降序排列M _i,:，记为
根据在
中的排列位置，第j个用户端的得分为：

其中，m为总参与用户端个数，p _j为第j个用户端在
中的位置，第j个用户端的总分为：

其中，u _i为第i个用户端，
为所有用户端集合，s(j；u _i)为第j个用户端在u _i的评价下所得分数，基于总得分，所述最优参数的用户端集合：