CN114996762A - 一种基于联邦学习的医疗数据共享与隐私保护方法和*** - Google Patents

一种基于联邦学习的医疗数据共享与隐私保护方法和*** Download PDF

Info

Publication number
CN114996762A
CN114996762A CN202210844308.9A CN202210844308A CN114996762A CN 114996762 A CN114996762 A CN 114996762A CN 202210844308 A CN202210844308 A CN 202210844308A CN 114996762 A CN114996762 A CN 114996762A
Authority
CN
China
Prior art keywords
model
ciphertext
gradient
data
machine learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210844308.9A
Other languages
English (en)
Inventor
王连海
孟令云
徐淑奖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Computer Science Center National Super Computing Center in Jinan
Original Assignee
Shandong Computer Science Center National Super Computing Center in Jinan
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Computer Science Center National Super Computing Center in Jinan filed Critical Shandong Computer Science Center National Super Computing Center in Jinan
Priority to CN202210844308.9A priority Critical patent/CN114996762A/zh
Publication of CN114996762A publication Critical patent/CN114996762A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/64Protecting data integrity, e.g. using checksums, certificates or signatures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2211/00Indexing scheme relating to details of data-processing equipment not covered by groups G06F3/00 - G06F13/00
    • G06F2211/007Encryption, En-/decode, En-/decipher, En-/decypher, Scramble, (De-)compress
    • G06F2211/008Public Key, Asymmetric Key, Asymmetric Encryption
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2221/00Indexing scheme relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/21Indexing scheme relating to G06F21/00 and subgroups addressing additional information or applications relating to security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F2221/2107File encryption

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Security & Cryptography (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Bioethics (AREA)
  • Computer Hardware Design (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明属于数据安全领域,提供了一种基于联邦学习的医疗数据共享与隐私保护方法和***,本发明保证医院数据不离开本地的情况下进行联合训练;模型训练的中间梯度加密并基于区块链的数据资源发布;通过智能合约在基于SGX可信执行环境中进行模型中间梯度解密并聚合;SGX将聚合的新全局模型上传到智能合约进行判断是否满足收敛条件,从而决定是否继续迭代训练;智能合约在新全局模型满足收敛条件下将模型发送给数据需求方,否则继续迭代进行联合训练;在保证各个医院医疗数据安全和隐私安全的同时,实现聚合过程的安全保护,防止中间梯度泄露隐私,从而高效的实现数据共享。

Description

一种基于联邦学习的医疗数据共享与隐私保护方法和***
技术领域
本发明属于数据安全领域,尤其涉及一种基于联邦学习的医疗数据共享与隐私保护方法和***。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
随着大数据、移动边缘计算和机器学习等技术的飞速发展,共享经济也在快速发展。网络信息时代产生了海量的医疗数据,其共享将会产生极大的价值。使用大数据分析和机器学习等技术将分散在各个医疗机构的医疗数据进行学习和分析,打破医疗数据的信息孤岛桎梏,将会更好的推动医药事业的发展。由于可能会带来隐私泄露等方面的安全风险,各个医疗机构并不愿意共享数据,这使得不同医疗机构之间难以利用对方的数据进行联合分析或者建模。因此,亟需构建医疗数据安全共享和隐私保护的新模式,打消医疗机构的安全顾虑,联合多方数据协同生产,推动医疗数据价值的高效释放。
为了实现数据安全共享和隐私保护,一些学者提出基于联邦学习来实现医疗数据协同应用。数据拥有方利用收到的模型在本地联合训练模型,然后将训练产生的梯度上传进行聚合,循环多轮直至收敛完成模型训练。虽然联邦学习虽然没有发送任何原始数据,但是每次迭代都会暴露中间结果。这一中间结果可能是每方提供的梯度,或者多方聚合的梯度,或者是一个本轮结束之后的模型中间结果。而一个参与方可以根据这些暴露的结果以及结果之间的差异性推算一些不应该泄露的信息,这将会对数据安全和隐私安全造成威胁。为解决联邦学习由于暴露中间结果造成数据泄露的问题,一些学者利用密码学方法来计算梯度聚合,但会造成计算代价增加。另一些方法利用差分隐私给中间结果加一些噪音,但会影响最终训练结果的准确性。
发明内容
为了解决上述背景技术中存在的至少一项技术问题,本发明提供一种基于联邦学习的医疗数据共享与隐私保护方法和***,其在保证各个医院医疗数据安全和隐私安全的同时,实现聚合过程的安全保护,防止中间梯度泄露隐私,从而高效的实现数据共享。
为了实现上述目的,本发明采用如下技术方案:
本发明的第一个方面提供一种基于联邦学习的医疗数据共享与隐私保护方法,包括如下步骤:
接收数据需求方选定的初始化机器学习模型,并交给安全审查智能合约进行合规性审核,审查通过后继续执行;否则,返回安全校验不通过;
存储医院节点上传的模型信息并发布;
调用模型训练智能合约将模型信息采用SGX进行处理得到新的全局模型密文,并验证其是否满足收敛条件,若不满足则开启新一轮的联邦学习迭代,若满足收敛条件,则将训练完成的机器学习模型保存到区块链。
本发明的第二个方面提供一种基于联邦学习的医疗数据共享与隐私保护方法,包括如下步骤:
选定初始化机器学习模型并将其交给安全审查智能合约进行合规性审核;
通过审查后将初始化机器学习模型采用各个医院的公钥加密,并对模型密文取哈希后上传至区块链;
调用模型训练智能合约进行机器学习模型训练;
调用数据查询智能合约获取训练完成的机器学习模型的密文和密文哈希值;
将训练完成的机器学习模型密文哈希值和从区块链下载的模型密文哈希值进行对比,对模型的完整性进行校验;
采用私钥对进行完整性校验后的模型的密文进行解密,获取模型。
本发明的第三个方面提供一种基于联邦学习的医疗数据共享与隐私保护方法,包括如下步骤:
调用数据查询智能合约获取数据需求方的初始化机器学习模型;
使用本地数据进行联邦学习对初始化机器学习模型进行训练,得到模型梯度;
将模型梯度使用SGX的公钥进行加密,生成梯度密文;
对梯度密文取哈希值,获取模型梯度密文的哈希值;
将模型梯度密文和密文哈希值上传到区块链,进行发布。
本发明的第四个方面提供一种基于联邦学习的医疗数据共享与隐私保护***,包括:
合规性审核模块,被配置为:接收数据需求方选定的初始化机器学习模型,并交给安全审查智能合约进行合规性审核,审查通过后继续执行;否则,返回安全校验不通过;
信息获取模块,被配置为:存储医院节点上传的模型信息并发布;
部署节点梯度模块,被配置为:调用模型训练智能合约将模型信息采用SGX进行处理得到新的全局模型密文,并验证其是否满足收敛条件,若不满足则开启新一轮的联邦学习迭代,若满足收敛条件,则将训练完成的机器学习模型保存到区块链。
本发明的第五个方面提供一种基于联邦学习的医疗数据共享与隐私保护***,包括:
模型选定模块,被配置为:选定初始化机器学习模型并将其交给安全审查智能合约进行合规性审核;
模型加密模块,被配置为:通过审查后将初始化机器学习模型采用各个医院的公钥加密,并对模型密文取哈希后上传至区块链;
模型训练模块,被配置为:调用模型训练智能合约进行机器学习模型训练;
模型获取模块,被配置为:调用数据查询智能合约获取训练完成的机器学习模型的密文和密文哈希值;
将训练完成的机器学习模型密文哈希值和从区块链下载的模型密文哈希值进行对比,对模型的完整性进行校验;
采用私钥对进行完整性校验后的模型的密文进行解密,获取模型。
本发明的第六个方面提供一种基于联邦学习的医疗数据共享与隐私保护***,包括:
数据查询模块,被配置为:调用数据查询智能合约获取数据需求方的初始化机器学习模型;
本地训练模块,被配置为:使用本地数据进行联邦学习对初始化机器学习模型进行训练,得到模型梯度;
模型加密模块,被配置为:将模型梯度使用SGX的公钥进行加密,生成梯度密文;对梯度密文取哈希值,获取模型梯度密文的哈希值;将模型梯度密文和密文哈希值上传到区块链,进行发布。
与现有技术相比,本发明的有益效果是:
本发明通过在保证医院数据不离开本地的情况下进行联合训练,模型训练的中间梯度加密并基于区块链的数据资源发布,通过智能合约在基于SGX可信执行环境中进行模型中间梯度解密并聚合,SGX将聚合的新全局模型上传到智能合约进行判断是否满足收敛条件,从而决定是否继续迭代训练,智能合约在新全局模型满足收敛条件下将模型发送给数据需求方,否则继续迭代进行联合训练;在保证各个医院医疗数据安全和隐私安全的同时,实现聚合过程的安全保护,防止中间梯度泄露隐私,从而高效的实现数据共享。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1是本发明基于联邦学习的数据共享流程图;
图2是本发明SGX数据处理过程;
图3是本发明数据共享架构及分布式数据交换网络实现。
具体实施方式
下面结合附图与实施例对本发明作进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
术语解释
SGX,(Software Guard Extensions),是英特尔指令集架构上的扩展,为程序的运行提供了硬件级的安全,而不是基于外部软硬件的安全状态。其允许应用程序在内存中开辟一个被保护的、可信的可执行区域,称为安全区(Enclave),将不同程序进行隔离再运行,为程序提供机密性和完整性的保护,如图2为其数据处理过程。
本发明的整体思路为:
如图1和图3所示,数据需求方选定初始化机器学习模型并将其交给安全审核智能合约进行合规性审核;通过审核后数据需求方将初始化机器学习模型使用各个医院公钥加密,然后对模型密文取哈希,将模型密文、密文哈希值和收敛条件上传至区块链,然后生成模型聚合智能合约;
医院节点使用数据查询智能合约从区块链上下载初始化机器学习模型到本地;医院使用本地数据进行联邦学习训练模型,训练出己方的局部梯度;医院将己方的局部梯度使用SGX公钥进行加密,生成梯度密文;医院对梯度密文取哈希值,生成梯度密文哈希值;医院将梯度密文和梯度密文哈希值上传到区块链;
模型聚合智能合约调用SGX并将各个医院上传的梯度密文和密文哈希值传输到SGX;SGX计算梯度密文的哈希值并与收到的梯度密文哈希值做对比,进行完整性校验;校验通过后使用SGX 的私钥解密梯度密文,获取到各个医院的梯度值,并进行模型聚合,形成新的全局模型;
SGX审核新的全局模型是否达到收敛条件;若模型达到收敛结果,则使用数据需求方的公钥加密数据,若未达到则使用各个医院公钥加密,然后对模型密文取哈希;SGX将新的全局模型密文、密文哈希值和模型是否收敛的结果上传到区块链,发布数据;模型审核智能合约验证新的全局模型是否满足预定义的收敛条件;若新的全局模型并未达到收敛条件,则将新的全局模型再次分发给各个医院进行联邦学习迭代,若满足了收敛条件则将全局模型返回给数据需求方;数据需求方验证模型的完整性然后使用私钥解密,获取模型。
本发明可在保证医院医疗数据留存在本地的同时保证医疗数据共享的隐私安全和数据安全。
实施例一
本实施例提供一种基于联邦学习的医疗数据共享与隐私保护方法,包括如下步骤:
区块链实现模型审核、智能合约部署和执行、数据资源发布和数据资源查询等操作。
步骤1:部署安全审查智能合约;
步骤2:接收数据需求方选定的初始化机器学习模型,并交给安全审查智能合约进行合规性审核,审查通过后继续执行;否则,返回安全校验不通过;
步骤3:部署模型审核合约、模型聚合合约和数据查询合约;
步骤4:存储医院节点上传的模型中间梯度密文、密文哈希值、模型密文和模型密文哈希值等信息,并将这些信息进行发布;
步骤5:调用模型训练智能合约将模型中间梯度密文和密文哈希值等信息采用SGX进行模型聚合;
步骤6:SGX验证梯度完整性之后将验证结果上传,并对这些信息进行记录;
步骤7:接收SGX聚合完成的新的全局模型,并验证其是否满足收敛条件,若不满足则开启新一轮的联邦学习迭代,若满足收敛条件,则将训练完成的机器学习模型保存到区块链;
步骤8:数据需求方检索区块链获取训练完成的机器学习模型密文和密文哈希值。
如图2所示为SGX数据处理过程,具体包括:
步骤1:通过链下合约接收模型梯度密文和密文哈希值;
步骤2:对模型梯度密文取哈希值,然后将其从区块链下载的模型梯度密文哈希做对比,若两者有差别,则终止程序并反馈到区块链,若无差别,则转至下一步;
步骤3:使用自身私钥解密加密后的模型梯度密钥,获取模型梯度;
步骤4:使用获取的模型梯度聚合生成新的全局模型;
步骤5:SGX审核新的全局模型是否达到收敛条件;若模型达到收敛条件,则使用数据需求方的公钥加密数据,若未达到则使用各个医院公钥加密,然后对模型密文取哈希;
步骤6:SGX将新的全局模型密文、密文哈希值和模型是否收敛的结果上传到区块链,并发布数据。
上述方案的优点在于,支持数据需求方的模型安全审核;保证医院数据不离开本地的情况下进行联合训练;模型训练的中间梯度加密并基于区块链的数据资源发布;通过智能合约在基于SGX可信执行环境中进行模型中间梯度解密并聚合;SGX将聚合的新全局模型上传到智能合约进行判断是否满足收敛条件,从而决定是否继续迭代训练;智能合约在新全局模型满足收敛条件下将模型发送给数据需求方,否则继续迭代进行联合训练;在保证各个医院医疗数据安全和隐私安全的同时,实现聚合过程的安全保护,防止中间梯度泄露隐私,从而高效的实现数据共享。
实施例二
本实施例提供一种基于联邦学习的医疗数据共享与隐私保护方法,包括如下步骤:
数据需求方选定初始化机器学习模型并审核、模型加密、上传初始化机器学习模型密文、调用模型训练智能合约进行模型训练、调用数据查询合约获取训练完成的机器学习模型密文、验证模型完整性和获取模型等操作。
步骤1:数据需求方选定初始化机器学习模型并将其交给安全审查智能合约进行合规性审核;
步骤2:通过审查后将初始化机器学习模型采用各个医院的公钥加密,并对模型密文取哈希后上传至区块链;
步骤3:调用模型训练智能合约进行机器学习模型训练;
步骤4:调用数据查询智能合约获取训练完成的机器学习模型的密文和密文哈希值;
步骤5:将训练完成的机器学习模型密文哈希值和从区块链下载的模型密文哈希值进行对比,对模型的完整性进行校验;
步骤6:采用私钥对进行完整性校验后的模型的密文进行解密,获取模型。
实施例三
本实施例提供一种基于联邦学习的医疗数据共享与隐私保护方法,包括如下步骤:
医院从区块链上检索全局模型模型、使用本地数据对全局模型进行训练得到模型梯度、使用SGX 的公钥加密生成的模型梯度、将模型梯度密文取哈希值和将模型梯度密文和密文哈希值上传到区块链。
步骤1:调用数据查询智能合约获取数据需求方的初始化机器学习模型;
步骤2:使用本地数据进行联邦学习对初始化机器学习模型进行训练,得到模型梯度;
步骤3:将模型梯度使用SGX的公钥进行加密,生成梯度密文;
步骤4:对梯度密文取哈希值,获取模型梯度密文的哈希值;
步骤5:将模型梯度密文和密文哈希值上传到区块链,进行发布。
实施例四
本实施例提供一种基于联邦学习的医疗数据共享与隐私保护***,包括:
合规性审核模块,被配置为:部署安全审查智能合约;接收数据需求方选定的初始化机器学习模型,并交给安全审查智能合约进行合规性审核,审查通过后继续执行;否则,返回安全校验不通过;
合约部署模块,被配置为:部署模型审核合约、模型聚合合约和数据查询合约;
信息获取模块,被配置为:存储医院节点上传的模型中间梯度密文、密文哈希值、模型密文和模型密文哈希值等信息,并将这些信息进行发布;
部署节点梯度模块,被配置为:调用模型训练智能合约将模型中间梯度密文和密文哈希值等信息采用SGX进行模型聚合;
SGX验证梯度完整性之后将验证结果上传,并对这些信息进行记录;
接收SGX聚合完成的新的全局模型,并验证其是否满足收敛条件,若不满足则开启新一轮的联邦学习迭代,若满足收敛条件,则将训练完成的机器学习模型保存到区块链;
数据需求方检索区块链获取训练完成的机器学习模型密文和密文哈希值。
其中,部署节点梯度模块,具体被配置为:调用模型训练智能合约将模型信息采用SGX进行处理得到新的全局模型密文,包括:
通过链下合约接收模型梯度密文和密文哈希值;
对模型梯度密文取哈希值,将其从区块链下载的模型梯度密文哈希做对比,若两者有差别,则终止程序并反馈到区块链,若无差别,则转使用自身私钥解密加密后的模型梯度密钥,获取模型梯度;
使用获取的模型梯度聚合生成新的全局模型。
审核新的全局模型是否达到收敛条件;若模型达到收敛条件,则使用数据需求方的公钥加密数据,若未达到则使用各个医院公钥加密,然后对模型密文取哈希;
将新的全局模型密文、密文哈希值和模型是否收敛的结果上传到区块链,并发布数据。
实施例五
本实施例提供一种基于联邦学习的医疗数据共享与隐私保护***,包括:
模型选定模块,被配置为:数据需求方选定初始化机器学习模型并将其交给安全审查智能合约进行合规性审核;
模型加密模块,被配置为:通过审查后将初始化机器学习模型采用各个医院的公钥加密并对密文取哈希后上传至区块链;
模型训练模块,被配置为:调用模型训练智能合约进行机器学习模型训练;
模型获取模块,被配置为:调用数据查询智能合约获取训练完成的机器学习模型的密文和密文哈希值;将训练完成的机器学习模型密文哈希值和从区块链下载的模型密文哈希值进行对比,对模型的完整性进行校验;
采用私钥对进行完整性校验后的模型的密文进行解密,获取模型。
实施例六
本实施例提供一种基于联邦学习的医疗数据共享与隐私保护***,包括:
数据查询模块,被配置为:调用数据查询智能合约获取数据需求方的初始化机器学习模型;
本地训练模块,被配置为:使用本地数据进行联邦学习对初始化机器学习模型进行训练,得到模型梯度;
模型加密模块,被配置为:将模型梯度使用SGX的公钥进行加密,生成梯度密文;对梯度密文取哈希值,获取模型梯度密文的哈希值;将模型梯度密文和密文哈希值上传到区块链,进行发布。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于联邦学习的医疗数据共享与隐私保护方法,其特征在于,包括如下步骤:
接收数据需求方选定的初始化机器学习模型,并交给安全审查智能合约进行合规性审核,审查通过后继续执行;否则,返回安全校验不通过;
存储医院节点上传的模型信息并发布;
调用模型训练智能合约将模型信息采用SGX进行处理得到新的全局模型密文,并验证其是否满足收敛条件,若不满足则开启新一轮的联邦学习迭代,若满足收敛条件,则将训练完成的机器学习模型保存到区块链。
2.根据权利要求1所述的一种基于联邦学习的医疗数据共享与隐私保护方法,其特征在于,所述医院节点上传的模型信息包括中间梯度密文、密文哈希值、模型密文和模型密文哈希值。
3.根据权利要求1所述的一种基于联邦学习的医疗数据共享与隐私保护方法,其特征在于,所述调用模型训练智能合约将模型信息采用SGX进行处理得到新的全局模型密文的过程包括:
通过链下合约接收模型梯度密文和密文哈希值;
对模型梯度密文取哈希值,将其从区块链下载的模型梯度密文哈希做对比,若两者有差别,则终止程序并反馈到区块链,若无差别,则转使用自身私钥解密加密后的模型梯度密钥,获取模型梯度;
使用获取的模型梯度聚合生成新的全局模型;
审核新的全局模型是否达到收敛条件;若模型达到收敛条件,则使用数据需求方的公钥加密数据,若未达到则使用各个医院公钥加密,然后对模型密文取哈希;
将新的全局模型密文、密文哈希值和模型是否收敛的结果上传到区块链,并发布数据。
4.一种基于联邦学习的医疗数据共享与隐私保护方法,其特征在于,包括如下步骤:
选定初始化机器学习模型并将其交给安全审查智能合约进行合规性审核;
通过审查后将初始化机器学习模型采用各个医院的公钥加密,并对模型密文取哈希后上传至区块链;
调用模型训练智能合约进行机器学习模型训练;
调用数据查询智能合约获取训练完成的机器学习模型的密文和密文哈希值;
将训练完成的机器学习模型密文哈希值和从区块链下载的模型密文哈希值进行对比,对模型的完整性进行校验;
采用私钥对进行完整性校验后的模型的密文进行解密,获取模型。
5.一种基于联邦学习的医疗数据共享与隐私保护方法,其特征在于,包括如下步骤:
调用数据查询智能合约获取数据需求方的初始化机器学习模型;
使用本地数据进行联邦学习对初始化机器学习模型进行训练,得到模型梯度;
将模型梯度使用SGX的公钥进行加密,生成梯度密文;
对梯度密文取哈希值,获取模型梯度密文的哈希值;
将模型梯度密文和密文哈希值上传到区块链,进行发布。
6.一种基于联邦学习的医疗数据共享与隐私保护***,其特征在于,包括:
合规性审核模块,被配置为:接收数据需求方选定的初始化机器学习模型,并交给安全审查智能合约进行合规性审核,审查通过后继续执行;否则,返回安全校验不通过;
信息获取模块,被配置为:存储医院节点上传的模型信息并发布;
部署节点梯度模块,被配置为:调用模型训练智能合约将模型信息采用SGX进行处理得到新的全局模型密文,并验证其是否满足收敛条件,若不满足则开启新一轮的联邦学习迭代,若满足收敛条件,则将训练完成的机器学习模型保存到区块链。
7.根据权利要求6所述的一种基于联邦学习的医疗数据共享与隐私保护***,其特征在于,所述医院节点上传的模型信息包括中间梯度密文、密文哈希值、模型密文和模型密文哈希值。
8.根据权利要求6所述的一种基于联邦学习的医疗数据共享与隐私保护***,其特征在于,所述调用模型训练智能合约将模型信息采用SGX进行处理得到新的全局模型密文的过程包括:
通过链下合约接收模型梯度密文和密文哈希值;
对模型梯度密文取哈希值,将其从区块链下载的模型梯度密文哈希做对比,若两者有差别,则终止程序并反馈到区块链,若无差别,则转使用自身私钥解密加密后的模型梯度密钥,获取模型梯度;
使用获取的模型梯度聚合生成新的全局模型;
审核新的全局模型是否达到收敛条件;若模型达到收敛条件,则使用数据需求方的公钥加密数据,若未达到则使用各个医院公钥加密,然后对模型密文取哈希;
将新的全局模型密文、密文哈希值和模型是否收敛的结果上传到区块链,并发布数据。
9.一种基于联邦学习的医疗数据共享与隐私保护***,其特征在于,包括:
模型选定模块,被配置为:选定初始化机器学习模型并将其交给安全审查智能合约进行合规性审核;
模型加密模块,被配置为:通过审查后将初始化机器学习模型采用各个医院的公钥加密,并对模型密文取哈希后上传至区块链;
模型训练模块,被配置为:调用模型训练智能合约进行机器学习模型训练;
模型获取模块,被配置为:调用数据查询智能合约获取训练完成的机器学习模型的密文和密文哈希值;
将训练完成的机器学习模型密文哈希值和从区块链下载的模型密文哈希值进行对比,对模型的完整性进行校验;
采用私钥对进行完整性校验后的模型的密文进行解密,获取模型。
10.一种基于联邦学习的医疗数据共享与隐私保护***,其特征在于,包括:
数据查询模块,被配置为:调用数据查询智能合约获取数据需求方的初始化机器学习模型;
本地训练模块,被配置为:使用本地数据进行联邦学习对初始化机器学习模型进行训练,得到模型梯度;
模型加密模块,被配置为:将模型梯度使用SGX的公钥进行加密,生成梯度密文;对梯度密文取哈希值,获取模型梯度密文的哈希值;将模型梯度密文和密文哈希值上传到区块链,进行发布。
CN202210844308.9A 2022-07-19 2022-07-19 一种基于联邦学习的医疗数据共享与隐私保护方法和*** Pending CN114996762A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210844308.9A CN114996762A (zh) 2022-07-19 2022-07-19 一种基于联邦学习的医疗数据共享与隐私保护方法和***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210844308.9A CN114996762A (zh) 2022-07-19 2022-07-19 一种基于联邦学习的医疗数据共享与隐私保护方法和***

Publications (1)

Publication Number Publication Date
CN114996762A true CN114996762A (zh) 2022-09-02

Family

ID=83021365

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210844308.9A Pending CN114996762A (zh) 2022-07-19 2022-07-19 一种基于联邦学习的医疗数据共享与隐私保护方法和***

Country Status (1)

Country Link
CN (1) CN114996762A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116595574A (zh) * 2023-04-14 2023-08-15 京信数据科技有限公司 一种对隐私计算模型安全发布及引用的装置及方法
CN116665913A (zh) * 2023-07-13 2023-08-29 之江实验室 一种跨机构的患者匹配***和方法
CN117251726A (zh) * 2023-08-28 2023-12-19 北京邮电大学 公共卫生事件检测模型训练方法、检测方法、装置及***
CN117473324A (zh) * 2023-11-16 2024-01-30 北京熠智科技有限公司 基于SGX和XGBoost的模型训练方法、***及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113052331A (zh) * 2021-02-19 2021-06-29 北京航空航天大学 一种基于区块链的物联网个性化联邦学习方法
CN113204787A (zh) * 2021-05-06 2021-08-03 广州大学 基于区块链的联邦学习隐私保护方法、***、设备和介质
CN113536382A (zh) * 2021-08-09 2021-10-22 北京理工大学 利用联邦学习基于区块链的医疗数据共享隐私保护方法
CN113901505A (zh) * 2021-12-06 2022-01-07 北京笔新互联网科技有限公司 数据共享方法、装置、电子设备及存储介质
CN114254360A (zh) * 2021-12-22 2022-03-29 东软集团股份有限公司 模型训练方法、装置、存储介质、***以及区块链节点

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113052331A (zh) * 2021-02-19 2021-06-29 北京航空航天大学 一种基于区块链的物联网个性化联邦学习方法
CN113204787A (zh) * 2021-05-06 2021-08-03 广州大学 基于区块链的联邦学习隐私保护方法、***、设备和介质
CN113536382A (zh) * 2021-08-09 2021-10-22 北京理工大学 利用联邦学习基于区块链的医疗数据共享隐私保护方法
CN113901505A (zh) * 2021-12-06 2022-01-07 北京笔新互联网科技有限公司 数据共享方法、装置、电子设备及存储介质
CN114254360A (zh) * 2021-12-22 2022-03-29 东软集团股份有限公司 模型训练方法、装置、存储介质、***以及区块链节点

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116595574A (zh) * 2023-04-14 2023-08-15 京信数据科技有限公司 一种对隐私计算模型安全发布及引用的装置及方法
CN116595574B (zh) * 2023-04-14 2024-02-20 京信数据科技有限公司 一种对隐私计算模型安全发布及引用的装置及方法
CN116665913A (zh) * 2023-07-13 2023-08-29 之江实验室 一种跨机构的患者匹配***和方法
CN116665913B (zh) * 2023-07-13 2023-10-13 之江实验室 一种跨机构的患者匹配***和方法
CN117251726A (zh) * 2023-08-28 2023-12-19 北京邮电大学 公共卫生事件检测模型训练方法、检测方法、装置及***
CN117473324A (zh) * 2023-11-16 2024-01-30 北京熠智科技有限公司 基于SGX和XGBoost的模型训练方法、***及存储介质

Similar Documents

Publication Publication Date Title
US11206132B2 (en) Multiparty secure computing method, device, and electronic device
Li et al. EduRSS: A blockchain-based educational records secure storage and sharing scheme
CN111130757B (zh) 一种基于区块链的多云cp-abe访问控制方法
TWI706279B (zh) 多方安全計算方法及裝置、電子設備
WO2021103794A1 (zh) 在区块链中实现隐私保护的高效交易方法及装置
CN110474893B (zh) 一种异构跨信任域密态数据安全分享方法及***
Mohassel et al. Fast and secure three-party computation: The garbled circuit approach
Zhou et al. TR-MABE: White-box traceable and revocable multi-authority attribute-based encryption and its applications to multi-level privacy-preserving e-healthcare cloud computing systems
CN114996762A (zh) 一种基于联邦学习的医疗数据共享与隐私保护方法和***
CN112380565A (zh) 一种基于可信硬件与区块链的安全多方计算方法
CN112380578A (zh) 一种基于区块链和可信执行环境的边缘计算框架
Agudo et al. Cryptography goes to the cloud
Sharma et al. Blockchain-based cloud storage system with CP-ABE-based access control and revocation process
KR20210017432A (ko) 블록체인 기반 개인정보 관리 장치 및 방법
CN109547218B (zh) 一种改进bip协议的联盟链节点秘钥分配及备份***
CN113420886B (zh) 纵向联邦学习模型的训练方法、装置、设备及存储介质
CN116502732B (zh) 基于可信执行环境的联邦学习方法以及***
CN115473678A (zh) 一种基于sgx与智能合约的可控数据共享方法
Mishra et al. Enhancing privacy‐preserving mechanisms in Cloud storage: A novel conceptual framework
Veeraragavan et al. Decansec: A decentralized architecture for secure statistical computations on distributed health registry data
Veeraragavan et al. Securing federated gans: Enabling synthetic data generation for health registry consortiums
Talviste Applying secure multi-party computation in practice
Di Crescenzo et al. Efficient and private three-party publish/subscribe
CN117879820A (zh) 一种基于区块链的数据共享方法
Li et al. Efficient and traceable data sharing for the Internet of Things in smart cities

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination