CN111859360A - 一种安全的多设备联合数据计算***、方法及装置 - Google Patents

一种安全的多设备联合数据计算***、方法及装置 Download PDF

Info

Publication number
CN111859360A
CN111859360A CN202010663590.1A CN202010663590A CN111859360A CN 111859360 A CN111859360 A CN 111859360A CN 202010663590 A CN202010663590 A CN 202010663590A CN 111859360 A CN111859360 A CN 111859360A
Authority
CN
China
Prior art keywords
data
calculation
sample
local
data providing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010663590.1A
Other languages
English (en)
Inventor
姚明
王湾湾
何浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Dongjian Intelligent Technology Co ltd
Original Assignee
Shenzhen Dongjian Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Dongjian Intelligent Technology Co ltd filed Critical Shenzhen Dongjian Intelligent Technology Co ltd
Priority to CN202010663590.1A priority Critical patent/CN111859360A/zh
Publication of CN111859360A publication Critical patent/CN111859360A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/30Authentication, i.e. establishing the identity or authorisation of security principals
    • G06F21/44Program or device authentication
    • G06F21/445Program or device authentication by mutual authentication, e.g. between devices or programs

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供了一种安全的多设备联合数据计算***、方法及装置,数据请求端,用于向数据融合端发送针对待计算对象的数据计算请求;数据融合端,用于向各个数据提供端发送数据计算请求所针对的待计算对象的标识;各个数据提供端,用于根据标识,确定本地存储的待计算对象的特征数据;依据所确定的特征数据,对待计算对象的数据进行数据计算,得到局部计算结果;向数据融合端发送局部计算结果;数据融合端,用于对所接收的局部计算结果进行融合,获得全局计算结果,向数据请求端发送全局计算结果;数据请求端,用于接收数据融合端发送的全局计算结果。应用本发明实施例提供的方案可以提高数据提供端中存储的待计算对象的特征数据的安全性。

Description

一种安全的多设备联合数据计算***、方法及装置
技术领域
本发明涉及数据计算技术领域,特别是涉及一种安全的多设备联合数据计算***、方法及装置。
背景技术
随着网络技术的发展,网络能够提供的用户、车辆、视频等对象的数据越来越多,因此,在不同的应用场景下需要结合对象的特征数据,对对象的数据进行数据计算,获得数据计算结果。例如,结合对象的特征数据实现对象分类、结合对象的特征数据实现对象数据预测等。然而同一对象的不同特征数据可能分别存储在不同场景的不同服务器中,各个服务器分别作为数据提供端,因此,当需要依据同一对象的不同特征数据进行数据计算时,数据融合端需要分别从不同的数据提供端中获取对象特征数据,再进行数据计算。
例如,在上述对象为用户的情况下,与用户信用相关的***使用信息、消费购物信息、手机通话信息等用户的特征数据分别存储在银行的银行服务器、电商平台的电商服务器、通讯公司的通讯服务器中。数据融合端在需要对用户信用进行分析时,需要分别从银行服务器中获取用户的***使用信息,从电商服务器中获取用户的消费购物信息,从通讯服务器中获取用户的手机通话信息,再通过分析所获取的各种信息实现对用户信用的分析。
但各个数据提供端将自身存储的特征数据提供给数据融合端,相当于将对象的特征数据暴露给自身之外的设备,这样会导致对象的特征数据存在被暴露的风险,使得对象的特征数据安全性较低。
发明内容
本发明实施例的目的在于提供一种安全的多设备联合数据计算***、方法及装置,以提高待计算对象的特征数据和对象标记数据的安全性。具体技术方案如下:
第一方面,一种安全的多设备联合数据计算***,所述***包括:数据请求端、数据融合端、至少两个数据提供端;
所述数据请求端,用于向所述数据融合端发送针对待计算对象的数据计算请求;
所述数据融合端,用于接收所述数据请求端发送的所述数据计算请求,向各个数据提供端发送所述数据计算请求所针对的所述待计算对象的标识;
各个数据提供端,用于接收所述数据融合端发送的所述待计算对象的标识;根据所述标识,确定本地存储的所述待计算对象的特征数据;依据所确定的特征数据,对所述待计算对象的数据进行数据计算,得到局部计算结果;向所述数据融合端发送所述局部计算结果;
所述数据融合端,用于接收各个数据提供端发送的局部计算结果;对所接收的局部计算结果进行融合,获得全局计算结果,向所述数据请求端发送所述全局计算结果;
所述数据请求端,用于接收所述数据融合端发送的所述全局计算结果。
第二方面,本发明实施例提供了一种数据计算方法,应用于数据融合端,所述方法包括:
接收数据请求端发送的数据计算请求,向各个数据提供端发送所述数据计算请求所针对的所述待计算对象的标识,使得数据提供端根据所述待计算对象的标识,依据数据提供端本地存储的所述待计算对象的特征数据,计算得到局部计算结果;
接收各个数据提供端发送的局部计算结果;
对所接收的局部计算结果进行融合,获得全局计算结果;
向所述数据请求端发送所述全局计算结果。
第三方面,本发明实施例提供了一种数据计算方法,应用于数据提供端,所述方法包括:
接收数据融合端发送的待计算对象的标识;
根据所述标识,确定本地存储的所述待计算对象的特征数据;
依据所确定的特征数据,对所述待计算对象的数据进行数据计算,得到局部计算结果;
向所述数据融合端发送所述局部计算结果。
第四方面,本发明实施例提供了一种数据计算装置,应用于数据融合端,所述装置包括:
标识发送模块,用于接收数据请求端发送的数据计算请求,向各个数据提供端发送所述数据计算请求所针对的所述待计算对象的标识,使得数据提供端根据所述待计算对象的标识,依据数据提供端本地存储的所述待计算对象的特征数据,计算得到局部计算结果;
结果接收模块,用于接收各个数据提供端发送的局部计算结果;
结果融合模块,用于对所接收的局部计算结果进行融合,获得全局计算结果;
全局结果发送模块,用于向所述数据请求端发送所述全局计算结果。
第五方面,本发明实施例提供了一种数据计算装置,应用于数据提供端,所述装置包括:
标识接收模块,用于接收数据融合端发送的待计算对象的标识;
数据确定模块,用于根据所述标识,确定本地存储的所述待计算对象的特征数据;
数据计算模块,用于依据所确定的特征数据,对所述待计算对象的数据进行数据计算,得到局部计算结果;
局部结果发送模块,用于向所述数据融合端发送所述局部计算结果。
第六方面,本发明实施例提供了一种电子设备,应用于数据融合端,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现第二方面任一所述的方法步骤。
第七方面,本发明实施例提供了一种计算机可读存储介质,应用于数据融合端,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现第二方面任一所述的方法步骤。
第八方面,本发明实施例提供了一种电子设备,应用于数据提供端,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现第三方面任一所述的方法步骤。
第九方面,本发明实施例提供了一种计算机可读存储介质,应用于数据提供端,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现第三方面任一所述的方法步骤。
第十方面,本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述第二方面任一所述的方法步骤。
第十一方面,本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述第三方面任一所述的方法步骤。
本发明实施例有益效果:
本发明实施例提供的安全的多设备联合数据计算***中,数据融合端在接收到数据请求端发送的数据计算请求后,向各个数据提供端发送数据计算请求所针对的待计算对象的标识,各个数据提供端,根据上述标识,确定本地存储的待计算对象的特征数据;依据所确定的特征数据,对待计算对象的数据进行数据计算,得到局部计算结果;向上述数据融合端发送上述局部计算结果。数据融合端对所接收的局部计算结果进行融合,获得全局计算结果。由以上可见,根据待计算对象的特征数据,得到局部计算结果的过程是在数据提供端中进行的,数据提供端向数据融合端发送的是局部计算结果,数据融合端对局部计算结果进行融合,获得全局计算结果,而不是数据提供端直接向数据融合端发送待计算对象的特征数据。因此在数据计算的过程中,各个数据提供端存储的特征数据始终位于数据提供端本地,并未从各个数据提供端中被发送出来,数据融合端并未获得待计算对象的特征数据,从而提高了数据提供端中存储的待计算对象的特征数据的安全性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种安全的多设备联合数据计算***的结构示意图;
图2为本发明实施例提供的一种安全的多设备联合数据计算方法的信令流程图;
图3为本发明实施例提供的第一种安全的多设备联合模型训练方法的信令流程图;
图4为本发明实施例提供的第二种安全的多设备联合模型训练方法的信令流程图;
图5为本发明实施例提供的一种安全的多设备联合样本对象确定方法的流程示意图;
图6为本发明实施例提供的一种电子设备的结构示意图;
图7为本发明实施例提供的另一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
由于现有技术中数据计算的过程中,数据提供端中存储的待计算对象的特征数据的安全性较低,为解决这一问题,本发明实施例提供了一种安全的多设备联合数据计算***、方法及装置。
本发明的一个实施例中,提供了一种安全的多设备联合数据计算***,上述***包括:数据请求端、数据融合端、至少两个数据提供端;
上述数据请求端,用于向上述数据融合端发送针对待计算对象的数据计算请求。
上述数据融合端,用于接收上述数据请求端发送的上述数据计算请求,向各个数据提供端发送上述数据计算请求所针对的上述待计算对象的标识。
各个数据提供端,用于接收上述数据融合端发送的上述待计算对象的标识;根据上述标识,确定本地存储的上述待计算对象的特征数据;依据所确定的特征数据,对上述待计算对象的数据进行数据计算,得到局部计算结果;向上述数据融合端发送上述局部计算结果。
上述数据融合端,用于接收各个数据提供端发送的局部计算结果;对所接收的局部计算结果进行融合,获得全局计算结果,向上述数据请求端发送上述全局计算结果。
上述数据请求端,用于接收上述数据融合端发送的上述全局计算结果。
由以上可见,根据待计算对象的特征数据,得到局部计算结果的过程是在数据提供端中进行的,数据提供端向数据融合端发送的是局部计算结果,数据融合端对局部计算结果进行融合,获得全局计算结果,而不是数据提供端直接向数据融合端发送待计算对象的特征数据。因此在数据计算的过程中,各个数据提供端存储的特征数据始终位于数据提供端本地,并未从各个数据提供端中被发送出来,数据融合端并未获得待计算对象的特征数据,从而提高了数据提供端中存储的待计算对象的特征数据的安全性。
下面先对本发明实施例所提供方案的应用场景进行说明。
本发明实施例提供的***可以应用于多个机构或平台联合实现数据分类、数据预测、数据分析等数据计算过程的应用场景中,其中,各个机构或平台的服务器中存储有该机构或平台所服务的对象的特征数据,各个机构或平台的服务器可以作为数据提供端。
例如,上述机构、平台可以为银行、电商平台、电信运营商等,根据银行服务器存储的用户***使用信息、电商平台服务器存储的用户消费信息、电信运营商服务器存储的用户通讯信息,联合对用户的未来信用状况进行预测。则银行服务器、电商平台服务器、电信运营商服务器分别作为数据提供端,上述数据计算过程为对用户的未来信用状况进行预测的过程。
上述机构、平台也可以为视频平台、电影院、电影打分网站等,根据视频平台服务器存储的电影播放量、电影院服务器存储的电影票房数据、电影打分网站服务器存储的电影评分数据,联合对电影的受欢迎程度进行数据计算。则视频平台服务器、电影院服务器、电影打分网站服务器分别作为数据提供端,上述数据计算过程为对电影的受欢迎程度进行数据分析的过程。
另外,上述安全的多设备联合数据计算***也可以应用于其他多个平台或机构联合进行数据计算的应用场景,在此不再赘述。
下面通过具体的实施例对本发明实施例提供的安全的多设备联合数据计算***、方法及装置进行说明。
参见图1,本发明实施例提供了一种安全的多设备联合数据计算***的结构示意图,上述***包括:数据请求端101、数据融合端102、至少两个数据提供端103。
其中,上述数据请求端101可以为除数据融合端102与数据提供端103之外的第三方设备,也可以是数据融合端102、数据提供端103中的一个设备。
上述数据提供端103可以为不同应用场景下的服务器,上述数据融合端可以为云端服务器或可信的第三方服务器。
数据提供端103中分别存储有各个对象的各类特征数据,其中各个数据提供端103中包含的特征数据所属的对象可以相同,也可以不同。
例如,上述对象可以为用户,数据提供端A中存储有用户A、用户B、用户C的***使用特征数据,如***还款时间、***额度等特征数据,数据提供端B中存储有用户B、用户C、用户D的电商消费特征数据,如电商购物消费额、每月消费次数等特征数据,数据提供端C中存储有用户A、用户B、用户C、用户D的手机通话特征数据,如通话时长、手机消费费用等特征数据。
另外,上述对象也可以为车辆,则数据提供端A中存储有车辆A、车辆B、车辆C的车辆保险特征数据,如车辆保险时长、车辆保险额度等特征数据,数据提供端B中存储有车辆B、车辆C、车辆D的车辆基本特征数据,如车辆品牌、车辆信号等特征数据。
再者,上述对象也可以为音频,则数据提供端A中存储有音频A、音频B、音频C的音频基本特征数据,如音频时长、音频所属类别等特征数据,数据提供端B中存储有音频A、音频C、音频D的音频评价特征数据,如音频评分、音频评论等特征数据。
上述对象还可以为其他形式,在此不再赘述。
参见图2,提供了一种安全的多设备联合数据计算方法的信令流程图。下面结合图2对图1所示安全的多设备联合数据计算***的工作流程进行说明。
S201:上述数据请求端101向上述数据融合端102发送针对待计算对象的数据计算请求。
其中,上述数据计算请求与安全的多设备联合数据计算***所进行的数据计算相对应。
例如,对待计算对象进行数据计算可以为对待计算对象进行分类,则上述数据计算请求为对待计算对象进行分类的数据计算请求。
对待计算对象进行数据计算也可以为对待计算对象的某一类或某几类特征数据进行预测,则上述数据计算请求为对待计算对象的特征数据进行预测的数据计算请求。
S202:上述数据融合端102向各个数据提供端103发送上述数据计算请求所针对的上述待计算对象的标识。
本发明的一个实施例中,上述数据计算请求中可以携带待计算对象的标识,这种情况下,数据融合端102可以通过解析数据计算请求得到待计算对象的标识。另外,上述数据计算请求中也可以不携带待计算对象的标识,这种情况下,数据请求端101向数据融合端102发送数据计算请求后,可以再单独向数据融合端102发送待计算对象的标识。本发明实施例仅仅以此为例进行说明,并不对数据融合端102如何获得待计算对象的标识的方式进行限定。
具体的,上述数据提供端103中存储有对象的标识,且不同对象的标识不同。例如,在待计算对象是用户的情况下,上述标识可以为用户的身份证号码、手机号码等,在待计算对象是车辆的情况下,上述标识可以为车辆的车牌号等。
S203:各个数据提供端103根据上述标识,确定本地存储的上述待计算对象的特征数据。
具体的,在接收到上述标识之后,可以根据上述标识查询本地存储特征数据的数据库,确定待计算对象的特征数据。经过查询可以得知,数据提供端本地可能不存在上述待计算对象的特征数据,那么不存在上述待计算对象的特征数据的数据提供端103不再针对待计算对象进行后续数据计算流程。
上述特征数据为:上述待计算对象的预设种类的特征数据。
例如,预设种类可以为***还款时间、***额度,在上述待计算对象为用户A的情况下,上述特征数据为用户A的***还款时间与***额度数据。
预设种类也可以为视频时长、视频评分,在上述待计算对象为视频A的情况下,上述特征数据为视频A的视频时长和视频评分。
S204:上述数据提供端103依据所确定的特征数据,对上述待计算对象的数据进行数据计算,得到局部计算结果。
由于上述安全的多设备联合数据计算***中包含多个数据提供端,每一数据提供端存储的待计算对象的局部的特征数据均会对数据计算结果产生一定的影响,得到全局计算结果。
由于每一数据提供端存储有待计算对象的特征数据,所以每一数据提供端会根据自身存储的特征数据进行数据计算,而由于每一数据提供端存储的特征数据是待计算对象的特征数据的一部分,因此对部分的特征数据进行数据计算得到的结果可以称之为局部计算结果。
具体的,数据提供端对本地存储的特征数据进行数据计算可以得到具有数理意义的局部计算结果。
例如,在上述数据计算为对特征数据进行数据分析的情况下,上述局部计算结果可以为局部数据分析结果,如上述数据提供端为电商平台服务器,则可以对电商平台服务器中存储的用户退换货数据进行数据分析,获得用户在电商平台的信用等级,作为局部计算结果,上述数据提供端为银行服务器,则可以对银行服务器中存储的用户***使用数据进行数据分析,获得用户在银行的信用等级,作为另一局部计算结果。
另外,数据提供端也可以对本地存储的特征数据进行数据清洗、特征提取等数据计算,得到局部计算结果。
再者,由于待计算对象的特征数据种类较多,分别来自不同的数据提供端,因此,若通过一个公式,为便于描述称为总公式,描述对各个特征数据统一进行数据计算,总公式中包含的自变量较多。数据提供端可以分别通过局部公式对本地存储的特征数据进行数据计算。由于本地存储的特征数据仅为待计算对象所有特征数据中的一部分,因此局部公式为总公式的一部分,局部公式中包含的自变量为本地存储的特征数据对应的自变量。
具体的,可以认为上述总公式涉及各个数据提供端所存储的特征数据,而可以认为每一数据提供对应的局部公式涉及的是该数据提供端存储的特征数据。
本发明的另一个实施例中,也可以以所确定的特征数据为本地部署的局部数据计算模型的输入,对上述待计算对象的数据进行数据计算,得到局部计算结果。
上述本地部署的局部数据计算模型为:采用本地存储的样本对象的特征数据、且与其他数据提供端的样本对象的特征数据联合训练得到的、用于对对象的数据进行数据计算的模型。
具体的,训练得到上述局部数据计算模型的过程可以通过图3所示的第一种安全的多设备联合模型训练方法或图4所示的第二种安全的多设备联合模型训练方法实现,确定样本对象的过程可以通过图5所示的安全的多设备联合样本对象确定方法实现,在此暂不详述。
以逻辑回归模型为例,假设,逻辑回归模型为:
Figure BDA0002579521460000101
其中,f(z)为逻辑回归模型的计算结果,z为待计算对象的总特征数据,其中,
z=w1x1+w2x2+…+wnxn
其中,w0至wn分别为各个预设参数,x1至xn分别为待计算对象的第1-第n类特征数据,每一数据提供端中存储有x1至xn中的一项或多项,按照n的取值不同,wn与xn一一对应。
可以将本地存储的特征数据xn与对应的wn相乘,并将相乘得到的结果相加作为局部计算结果。
因此若数据提供端A中存储有第1-第8类特征数据,则数据提供端A可以计算得到w1x1+w2x2+…+w8x8作为数据提供端A的局部计算结果发送到数据融合端。若数据提供端B中存储有第9-第15类特征数据,则数据提供端B可以计算得到w9x9+w10x10+…+w15x15作为数据提供端B的局部计算结果发送到数据融合端,以此类推。
S205:上述数据提供端103向上述数据融合端102发送上述局部计算结果。
由于数据提供端103向数据融合端102发送的是局部计算结果,而不是数据提供端中存储的特征数据,因此,数据提供端103中存储的特征数据未被发送出数据提供端。
S206:上述数据融合端102对所接收的局部计算结果进行融合,获得全局计算结果。
以逻辑回归模型为例,具体的,参照前述公式,
z=w1x1+w2x2+…+wnxn
由于各个局部计算结果分别为各个数据提供端本地存储的特征数据xn与wn的乘积的和,也就是,局部计算结果是总特征数据z的一部分,而数据融合端期望根据总特征数据x进行逻辑回归计算,因此数据融合端可以对接收到的局部计算结果进行融合,即将各个局部计算结果相加得到待计算对象的总特征数据z,再根据前述公式
Figure BDA0002579521460000121
计算得到逻辑回归模型的计算结果,作为全局计算结果。
S207:上述数据融合端102向上述数据请求端101发送上述全局计算结果。
由以上可见,根据待计算对象的特征数据,得到局部计算结果的过程是在数据提供端中进行的,数据提供端向数据融合端发送的是局部计算结果,数据融合端对局部计算结果进行融合,获得全局计算结果,而不是数据提供端直接向数据融合端发送待计算对象的特征数据。因此在数据计算的过程中,各个数据提供端存储的特征数据始终位于数据提供端本地,并未从各个数据提供端中被发送出来,数据融合端并未获得待计算对象的特征数据,从而提高了数据提供端中存储的待计算对象的特征数据的安全性。
参见图3,本发明的一个实施例中,提供了第一种安全的多设备联合模型训练方法的信令流程图,上述方法应用于数据提供端与数据融合端,通过上述方法能够训练得到上述局部数据计算模型。
S301:各个数据提供端中的第一数据提供端确定本地存储的上述样本对象的第一样本特征数据。
上述样本对象为:各个数据提供端均存储有特征数据的对象。
具体的,由于各个数据提供端需要联合进行数据计算才能完成完整的数据计算过程,不同数据提供端中存储的特征数据可能不同,数据提供端分别对不同的特征数据进行计算,因此需要预设顺序,使得各个数据提供端按照预设顺序分别计算不同的特征数据,从而实现数据计算的全过程。各个数据计算模型进行数据计算的过程需要根据预设顺序中上一数据提供端中部署的数据计算模型进行数据计算得到的局部计算结果进行进一步的数据计算。
其中,第一数据提供端为:上述预设顺序中位于第一位的数据提供端。
本发明的一个实施例中,各个数据提供端之间可以通过图5所示的安全的多设备联合样本对象确定方法确定上述样本对象,在此暂不详述。
S302:上述第一数据提供端根据本地部署的数据计算流程对上述第一样本特征数据进行数据计算,得到局部样本计算结果。
以逻辑回归模型为例,上述逻辑回归模型的公式为:
Figure BDA0002579521460000131
其中,f(z)为逻辑回归模型的计算结果,z为根据各个样本特征数据计算得到的全局样本特征数据。
z=WTX=w1x1+w2x2+…+wnxn
其中,上述W为由参数w1到wn组成的全局参数向量,X为样本特征数据x1到xn组成的样本特征向量。
若数据提供端A中存储有样本特征数据x1、x2、x3,则可以计算zA=w1x1+w2x2+w3x3作为局部样本计算结果。
S303:上述第一数据提供端向第二数据提供端发送局部样本计算结果。
其中,上述第二数据提供端为:按照各个数据提供端对数据进行计算的预设顺序、上述第一数据提供端的下一数据提供端。
S304:上述第二数据提供端确定本地存储的上述样本对象的第二样本特征数据。
S305:上述第二数据提供端根据上述第二数据提供端本地部署的数据计算流程对接收到的局部样本计算结果与上述第二样本特征数据进行数据计算,得到本地计算得到的局部样本计算结果。
由于各个数据提供端是按预设顺序依次进行数据计算的,因此第二数据提供端在进行数据计算的过程中需要根据预设顺序中上一数据提供端发送的局部计算结果,在上一数据提供端得到的局部计算结果的基础上继续进行数据计算。
以逻辑回归模型为例,若数据提供端B为第二数据提供端,存储有样本特征数据x4、x5,则数据提供端B接受数据提供端A发送的zA,并计算本地计算得到的局部样本计算结果zB=zA+w4x4+w5x5=w1x1+w2x2+w3x3+w4x4+w5x5
S306:上述第二数据提供端向上述预设顺序中上述第二数据提供端的下一数据提供端发送本地进行数据计算得到的局部样本计算结果。
具体的,上述第二数据提供端接收到预设顺序中上一数据提供端发送的局部样本计算结果后,根据第二样本特征数据与本地存储的第二样本特征数据进行数据计算,得到局部样本计算结果,将本地计算得到的局部样本计算结果发送到预设顺序中下一数据提供端,下一数据提供端作为新的第二数据提供端将接收到的局部样本计算结果与新的第二数据提供端本地存储的第二样本特征数据输入新的第二数据提供端本地部署的局部数据计算模型,继续进行数据计算,以此类推,直至预设顺序中最后一个数据提供端进行数据计算得到局部计算结果,完成完整的数据计算过程。
S307:预设顺序中最后一个数据提供端向存储有上述样本对象的样本标记的数据提供端发送局部样本计算结果。
具体的,上述存储有上述样本对象的样本标记的数据提供端可以为各个数据提供端中的任意一个。
以逻辑回归模型为例,最后一个数据提供端进行数据计算得到的局部样本计算结果为:
z=WTX=w1x1+w2x2+…+wnxn
S308:存储有上述样本对象的样本标记的数据提供端根据所获得的局部样本计算结果与样本标记,计算各个数据提供端进行数据计算的梯度计算中间结果与总损失。
具体的,在预设顺序中最后一个数据提供端进行数据计算得到局部样本计算结果之后,各个数据提供端按照预设顺序的数据计算流程结束,最后一个数据提供端进行数据计算得到的局部样本计算结果是各个数据提供端依次进行数据计算之后得到的总体结果,因此最后一个数据提供端将局部样本计算结果发送到存储有样本对象的样本标记的数据提供端,由存储有上述样本标记的数据提供端计算得到的梯度计算中间结果与损失是各个数据提供端进行数据计算的梯度计算中间结果与总损失。
以逻辑回归模型为例,可以通过以下公式计算上述梯度计算中间结果:
Figure BDA0002579521460000151
其中,m为样本对象,
Figure BDA0002579521460000152
是样本对象m的上述梯度计算中间结果,zm为计算得到的样本对象m的局部样本计算结果,ym为样本对象m的样本标记。
可以通过以下公式计算得到上述总损失:
Loss=∑m∈D(log2-0.5zmym+0.125zm 2)
其中,D为样本对象的集合,上述Loss为计算得到的上述总损失,zm为计算得到的样本对象m的局部样本计算结果,ym为样本对象m的样本标记。
S309:存储有样本标记的数据提供端向存储有上述样本对象的样本标记的数据提供端之外的其他数据提供端发送上述梯度计算中间结果。
S310:存储有样本标记的数据提供端向上述数据融合端发送上述总损失。
S311:各个数据提供端在获得上述梯度计算中间结果之后,根据上述梯度计算中间结果与本地存储的样本特征数据,计算数据提供端本地部署的数据计算流程的第一梯度。
具体的,由于上述梯度计算中间结果反映的各个数据提供端进行数据计算的梯度差,在梯度计算中间结果的基础上,结合本地存储的针对本地的样本特征数据进行计算,能够得到针对本地的第一梯度。
以逻辑回归模型为例,数据提供端A获得上述梯度计算中间结果之后,可以通过以下公式计算得到上述第一梯度:
Figure BDA0002579521460000153
其中,gradA为数据提供端A计算得到的上述第一梯度,
Figure BDA0002579521460000154
为上述样本对象m的梯度计算中间结果,
Figure BDA0002579521460000155
为数据提供端A存储的样本对象m的样本特征数据。
S312:各个数据提供端向上述数据融合端发送上述第一梯度。
S313:上述数据融合端根据预设学习率调整每一数据提供端发送的第一梯度,获得每一数据提供端对应的第二梯度。
具体的,上述预设学习率用于控制各个数据提供端的数据计算流程的训练速度,上述预设学习率越大,计算得到的第二梯度越大,则各个数据提供端根据第二梯度调整的针对该数据提供端的数据计算流程的参数的变化越大,各个数据提供端的数据计算流程的训练速度越快。
以逻辑回归模型为例,可以通过以下公式计算得到上述第二梯度:
gradA′=ηgradA
其中,上述gradA′为计算得到的数据提供端A的第二梯度,gradA为上述数据提供端A的第一梯度,η为上述预设学习率。
S314:上述数据融合端向各个数据提供端发送与该数据提供端对应的第二梯度。
S315:各个数据提供端根据上述第二梯度调整该数据提供端本地部署的数据计算流程的参数。
以逻辑回归模型为例,可以通过以下公式调整数据提供端A的数据计算流程的参数:
WA′=WA-gradA′
其中,上述WA为数据提供端A所存储的样本特征数据xn对应的w1组成的向量,WA′为调整之后的WA,gradA′为数据提供端A的第二梯度。
S316:上述数据融合端根据上述总损失判断各个数据提供端的数据计算流程是否收敛。
具体的,若上述总损失低于第一预设损失,可以认为各个数据提供端的数据计算流程收敛,则上述收敛标志表征各个数据提供端的数据计算流程收敛,否则不收敛,则上述收敛标志表征各个数据提供端的数据计算流程不收敛。
S317:上述数据融合端向各个数据提供端发送表征是否收敛的收敛标志。
若各个数据提供端的数据计算流程收敛,将针对各个数据提供端的数据计算流程确定为各个数据提供端本地部署的局部数据计算模型。
否则,继续执行上述图3所示的模型训练流程。
上述第一种模型训练方法中各个数据提供端中部署的局部数据计算模型是按照预设顺序依次向下一数据提供端发送局部计算结果,联合进行训练的,因此上述模型训练过程可以称为联邦学习过程。
由以上可见,上述安全的多设备联合数据计算***中包含的数据提供端在进行模型训练的过程中不会将自身存储的样本对象的样本特征数据发送给其他设备,因此各个数据提供端存储的样本特征数据始终位于数据提供端本地,并未从各个数据提供端中被发送出来,其他数据提供端只能接收到根据样本特征数据计算得到的局部样本计算结果,而不能得到样本特征数据,因此样本特征数据不会被暴露给其他设备,提高了样本特征数据的安全性。并且存储有样本标记的数据提供端也不会将样本标记发送给其他数据提供端或数据融合端,因此样本标记不会被暴露给其他设备,提高了样本标记的安全性。
本发明的一个实施例中,上述第一种模型训练方法中,上述数据融合端,还用于向各个数据提供端发送公钥。
具体的,由于上述公钥是由上述数据融合端发送的,因此上述数据融合端能够对经过上述公钥加密的数据进行解密,而接收到上述公钥的数据提供端能够使用上述公钥对数据进行加密。
其中,上述公钥可以为同态加密形式的公钥,对经过同态加密的数据进行数据计算得到的数据计算结果,再对数据计算结果进行解密,得到解密结果,与直接对未经过加密的数据进行相同的数据计算得到的数据计算结果相同。
各个数据提供端,还用于接收上述数据融合端发送的上述公钥。
在上述情况下,上述步骤S303可以通过以下步骤S303A实现。
步骤S303A:上述第一数据提供端向第二数据提供端发送使用公钥加密的局部样本计算结果。
上述步骤S305可以通过以下步骤S305A实现。
S305A:上述第二数据提供端根据第二数据提供端本地部署的数据计算流程对接收到的经过加密的局部样本计算结果与第二样本特征数据进行数据计算,得到本地计算得到的局部样本计算结果。
上述步骤S306可以通过以下步骤S306A实现。
S306A:上述第二数据提供端向上述预设顺序中上述第二数据提供端的下一数据提供端发送本地进行数据计算得到的、使用公钥加密的局部样本计算结果。
上述步骤S308可以通过以下步骤S308A实现。
S308A:存储有上述样本对象的样本标记的数据提供端根据所获得的经过加密的局部样本计算结果与样本标记,计算各个数据提供端进行数据计算的梯度计算中间结果与总损失。
上述步骤S309可以通过以下步骤S309A实现。
S309A:存储有样本标记的数据提供端向存储有样本标记的数据提供端之外的其他数据提供端发送使用公钥加密的梯度计算中间结果。
上述步骤S310可以通过以下步骤S310A实现。
S310A:向上述数据融合端发送使用公钥加密的上述总损失。
上述数据融合端,还用于对接收到的经过加密的总损失进行解密。
上述步骤S312可以通过以下步骤S312A实现。
S312A:各个数据提供端,向上述数据融合端发送使用公钥加密的第一梯度。
上述步骤S313可以通过以下步骤S313A实现。
S313A:对接收到的经过加密的第一梯度进行解密,根据预设学习率调整经过解密的每一数据提供端发送的第一梯度,获得每一数据提供端对应的第二梯度。
上述步骤S316可以通过以下步骤S316A实现。
S316A:对接收到的经过加密的总损失进行解密,根据上述经过解密的总损失判断各个数据提供端的数据计算流程是否收敛。
由以上可见,与在训练得到上述局部数据计算模型的过程中,各个数据提供端之间、数据提供端与数据融合端之间进行数据交互的过程中传输的数据经过公钥加密,而公钥来自数据融合端,仅有数据融合端能够进行解密,因此各个数据提供端在接收到其他数据提供端发送的数据之后不能进行解密,也就无法确定其他数据提供端发送的数据的明文,提供了模型训练过程中数据的安全性。
参见图4,本发明的一个实施例中,提供了第二种安全的多设备联合模型训练方法的信令流程图,其中,数据融合端本地部署有全局数据计算模型。
S401:各个数据提供端向上述数据融合端发送样本对象的样本特征数据。
具体的,上述样本特征数据可以是经过全同态加密得到的经过加密的样本特征数据。
S402:存储有上述样本对象的样本标记的数据提供端向上述数据融合端发送上述样本标记。
其中,上述存储有上述样本对象的样本标记的数据提供端可以是各个数据提供端中的任意一个。
S403:上述数据融合端根据接收到的样本特征数据计算数据融合端本地部署的全局数据计算流程的全局梯度差,对全局数据计算流程的全局参数进行调整。
由于上述数据融合端会接收来自各个数据提供端的样本特征数据,根据各个数据提供端存储的样本特征数据统一进行训练,因此上述数据计算流程可以称之为全局数据计算流程。
以逻辑回归模型为例,上述逻辑回归模型的公式为:
Figure BDA0002579521460000191
其中,f(z)为逻辑回归模型的计算结果,z为根据各个样本特征数据计算得到的全局样本特征数据。
z=WTX=wix1+w2x2+…+wnxn
其中,上述W为由参数w1到wn组成的全局参数向量,X为样本特征数据x1到xn组成的样本特征向量。
上述数据融合端接收到各个数据提供端发送的样本对象特征后,可以通过以下公式计算上述全局梯度差:
Figure BDA0002579521460000201
其中,i为样本对象的编号,yi为样本对象i的样本标记,Xi为样本对象i的样本特征向量,f(WTXi)为根据样本对象i的样本特征向量计算得到的样本对象i的全局计算结果,n为样本对象的总数,α为预设学习率,ΔW为全局梯度差。
则可以使用W-ΔW得到W’作为新的全局参数向量,从而调整上述全局参数。
而由于上述数据提供端中分别存储有样本特征数据x1-xn中的一部分,每一样本特征数据xn与参数wn相对应,因此可以将与数据提供端中存储的各个样本特征数据相对应的参数作为局部参数发送到对应的数据提供端。
S404:上述数据融合端根据接收到的样本特征数据与样本标记计算上述全局数据计算流程的损失值。
具体的,以逻辑回归模型为例。可以通过以下公式计算上述损失值:
Figure BDA0002579521460000202
其中,上述Loss为计算得到的损失值,D为样本对象的集合。
S405:上述数据融合端根据上述损失值判断上述全局数据计算流程是否满足预设的收敛条件,若为是,则上述全局数据计算流程为全局数据计算模型。
具体的,上述预设的收敛条件可以为上述损失值低于第二预设损失。
S406:上述数据融合端分别向各个数据提供端发送全局数据计算模型中包含的各个数据提供端本地部署的局部数据计算流程的局部参数。
S407:上述数据提供端使用局部参数更新本地部署的局部数据计算流程的参数,则局部数据计算流程为局部数据计算模型。
以逻辑回归模型为例,上述数据融合端发送的局部参数以wn的形式表示,数据提供端可以根据接收到的wn调整上述数据提供端中部署的局部数据计算模型中wn的值。
具体的,在上述数据融合端为云服务器的情况下,根据上述第二种模型训练方法进行模型训练的过程可以称为基于云的联合建模方案,在上述数据融合端为可信的第三方服务器的情况下,根据上述第二种模型训练方法进行模型训练的过程可以称为基于TEE(Trusted Execution Environment,可信执行环境)的联合建模方案。
由以上可见,数据融合端接收到数据提供端发送的样本特征数据之后,根据样本特征数据对数据融合端中预设的全局数据计算流程进行训练,将训练得到的全局数据计算模型中包含的各个局部数据计算流程的局部参数发送到各个数据提供端中,数据提供端根据接收到的局部参数更新该数据提供端对应的局部数据计算流程的参数,从而得到训练好的局部数据计算模型。并且,在基于云的联合建模方案中,数据提供端向数据融合端发送的样本特征数据是经过同态加密的,其他数据提供端不会获取到该数据提供端中存储的样本特征数据;在基于TEE的联合建模方案中,数据提供端的样本特征数据进行加密后发送到数据融合端,数据融合端解密进行运算,数据融合端是没有存储有样本对象的样本特征数据的第三方可信设备,因此提高了上述样本特征数据的安全性。
参见图5,本发明的一个实施例中,提供了一种安全的多设备联合样本对象确定方法的流程示意图。
S501:上述数据提供端使用该数据提供端的第一私钥对本地存储的各个对象的第一对象标签进行加密,得到第一加密标签,并向其他数据提供端发送上述第一加密标签。
其中,上述第一私钥为该数据提供端生成的私钥,因此其他数据提供端无法对经过第一私钥加密的第一对象标签进行解密,也就无法获得第一对象标签的明文。
第一对象标签与每一对象一一对应,每一对象的第一对象标签与其他对象的第一对象标签不同,每一数据提供端存储的各个对象的数据中均包含属于第一对象标签对应的对象标签类别的数据。
上述第一对象标签对应的对象标签类别可以为用户的身份证号、电话号码等。
S502:接收其他数据提供端发送的第二加密标签。
上述第二加密标签为:其他数据提供端使用自身的第二私钥对本地存储的各个对象的第二对象标签进行加密得到的标签。
其中,第二私钥为其他数据提供端自身的私钥。
S503:使用上述第一私钥对上述第二加密标签进行加密,得到第三加密标签,并向其他数据提供端发送上述第三加密标签。
由于第二加密标签是经过第二私钥加密的第二对象标签,使用第一私钥对第二加密标签进行加密得到的第三加密标签即为:经过第一私钥与第二私钥共同加密的第二对象标签。
S504:接收其他数据提供端发送第四加密标签。
其中,上述第四加密标签为:其他数据提供端使用上述第二私钥对上述第一加密标签进行加密得到的标签。
由于第一密文为:经过第一私钥加密的第一对象标签,而第四加密标签为:经过第二私钥加密的第一加密标签,因此第四加密标签为:经过第一私钥与第二私钥共同加密的第一对象标签。
S505:确定上述第三加密标签和第四加密标签中相同的标签,并将所确定的标签对应的对象作为样本对象。
由于同一数据经过相同的加密方式加密之后得到的加密数据依旧相同,而第三加密标签为:经过第一私钥与第二私钥共同加密的第二对象标签,第四加密标签为:经过第一私钥与第二私钥共同加密的第一对象标签,因此第三加密标签与第四加密标签中相同标签对应的第一对象标签与第二对象标签相同。
由于上述数据计算过程需要各个数据提供端联合进行数据计算过程,因此在进行局部数据计算模型训练的过程中,兼顾各个数据提供端中存储的样本特征数据,可以使得训练得到的局部数据计算模型满足各个数据提供端对数据计算的需求。所以确定各个数据提供端均存储有其样本特征数据的样本对象,依据所确定的样本对象的样本特征数据训练得到的局部数据计算模型,能够在各个数据提供端联合进行数据计算的应用场景中取得较好的应用效果。
由以上可见,各个数据提供端分别使用自身的私钥对自身存储的对象标签进行加密,再将经过加密的对象标签发送到其他数据提供端,而其他数据提供端不确定对上述私钥解密的方法,因此无法获得上述对象标签的明文,因此数据提供端自身存储的对象标签不会暴露给其他数据提供端,提高了对象标签的安全性。
与前述安全的多设备联合数据计算***相对应,本发明的一个实施例中,提供了一种数据计算方法,应用于数据融合端,上述方法包括:
接收数据请求端发送的数据计算请求,向各个数据提供端发送所述数据计算请求所针对的所述待计算对象的标识,使得数据提供端根据所述待计算对象的标识,依据数据提供端本地存储的所述待计算对象的特征数据,计算得到局部计算结果;
接收各个数据提供端发送的局部计算结果;
对所接收的局部计算结果进行融合,获得全局计算结果;
向所述数据请求端发送所述全局计算结果。
由以上可见,数据提供端向数据融合端发送局部计算结果,数据融合端对局部计算结果进行融合,获得全局计算结果,而不是数据提供端直接向数据融合端发送待计算对象的特征数据。因此在数据计算的过程中,数据融合端并未获得待计算对象的特征数据,特征数据始终位于数据提供端本地,并未被发送出去,因此提高了数据提供端中存储的待计算对象的特征数据的安全性。
本发明的一个实施例中,所述方法还包括:
接收各个数据提供端发送的第一梯度,并接收存储有样本标记的数据提供端发送的、对各个数据提供端所部署的局部数据计算流程进行训练的总损失;
根据预设学习率调整每一数据提供端发送的第一梯度,获得每一数据提供端对应的第二梯度,向各个数据提供端发送与该数据提供端对应的第二梯度;
根据上述总损失判断各个数据提供端本地部署的数据计算流程是否收敛,向各个数据提供端发送表征是否收敛的收敛标志。
由以上可见,在训练局部数据计算模型的过程中,数据融合端无法接收到数据提供端自身存储的样本对象的样本特征数据,因此各个数据提供端存储的样本特征数据始终位于数据提供端本地,并未从各个数据提供端中被发送出来,因此样本特征数据不会被暴露给数据融合端,提高了样本特征数据的安全性。并且数据融合端也不会接收到样本标记,因此样本标记不会被暴露给数据融合端,提高了样本标记的安全性。
本发明的一个实施例中,在所述接收各个数据提供端发送的第一梯度,并接收存储有样本标记的数据提供端发送的、对各个数据提供端对应的局部数据计算流程进行训练的总损失之前,还包括:
向各个数据提供端发送公钥;
所述接收各个数据提供端发送的第一梯度,并接收存储有样本标记的数据提供端发送的、对各个数据提供端对应的局部数据计算流程进行训练的总损失,包括:
接收各个数据提供端发送的经过加密的第一梯度,并接收存储有样本标记的数据提供端发送的、经过加密的总损失;
对接收到的经过加密的第一梯度与经过加密的总损失进行解密,根据预设学习率调整每一数据提供端发送的、经过解密的第一梯度,获得每一数据提供端对应的第二梯度;
所述向各个数据提供端发送与该数据提供端对应的第二梯度,包括:
向各个数据提供端发送与该数据提供端对应的经过解密的第二梯度;
所述根据上述总损失判断各个数据提供端的数据计算流程是否收敛,向各个数据提供端发送表征是否收敛的收敛标志,包括:
根据经过解密的总损失判断各个数据提供端本地部署的数据计算流程是否收敛,向各个数据提供端发送表征是否收敛的收敛标志。
由以上可见,与在训练得到上述局部数据计算模型的过程中,数据提供端与数据融合端之间进行数据交互的过程中传输的数据经过公钥加密,而公钥来自数据融合端,仅有数据融合端能够进行解密,因此各个数据提供端在接收到其他数据提供端发送的数据之后不能进行解密,也就无法确定其他数据提供端发送的数据的明文,提供了模型训练过程中数据的安全性。
本发明的一个实施例中,数据融合端通过以下方式训练得到局部数据计算模型:
接收数据提供端发送的样本特征数据与样本标记;
根据接收到的样本特征数据计算数据融合端本地部署的全局数据计算流程的全局梯度差,对全局数据计算流程的全局参数进行调整;
根据接收到的样本特征数据与样本标记计算所述全局数据计算流程的损失值;
根据所述损失值判断所述全局数据计算流程是否满足预设的收敛条件,若为是,则所述全局数据计算流程为全局数据计算模型;
分别向各个数据提供端发送全局数据计算模型中包含的各个数据提供端本地部署的局部数据计算流程的局部参数。
由以上可见,数据融合端接收到数据提供端发送的样本特征数据之后,根据样本特征数据对数据融合端中预设的全局数据计算流程进行训练,将训练得到的全局数据计算模型中包含的各个局部数据计算流程的局部参数发送到各个数据提供端中,数据提供端根据接收到的局部参数更新该数据提供端对应的局部数据计算流程的模型参数,从而得到训练好的局部数据计算模型。并且,由于数据提供端仅向数据融合端发送样本特征数据,其他数据提供端不会获取到该数据提供端中存储的样本特征数据。由于数据融合端是没有存储有样本对象的样本特征数据的第三方可信设备,因此提高了上述样本特征数据的安全性。
具体的,上述应用于数据融合端的数据计算方法与前述安全的多设备联合数据计算***中数据融合端的操作流程相同,在此不再赘述。
与前述安全的多设备联合数据计算***相对应,本发明的一个实施例中,提供了一种数据计算方法,应用于数据提供端,所述方法包括:
接收数据融合端发送的待计算对象的标识;
根据所述标识,确定本地存储的所述待计算对象的特征数据;
依据所确定的特征数据,对所述待计算对象的数据进行数据计算,得到局部计算结果;
向所述数据融合端发送所述局部计算结果。
本发明的一个实施例中,所述依据所确定的特征数据,对所述待计算对象的数据进行数据计算,得到局部计算结果,包括:
以所确定的特征数据为本地部署的局部数据计算模型的输入,对所述待计算对象的数据进行数据计算,得到局部计算结果,所述本地部署的局部数据计算模型为:采用本地存储的样本对象的特征数据、且与其他数据提供端中部署的局部数据计算模型联合训练得到的、用于对对象的数据进行数据计算的模型,所述样本对象为:各个数据提供端均存储有特征数据的对象。
由以上可见,根据待计算对象的特征数据,得到局部计算结果的过程是在数据提供端中进行的,数据提供端向数据融合端发送的是局部计算结果,而不是数据提供端直接向数据融合端发送待计算对象的特征数据。因此在数据计算的过程中,各个数据提供端存储的特征数据始终位于数据提供端本地,并未从各个数据提供端中被发送出来,数据融合端并未获得待计算对象的特征数据,从而提高了数据提供端中存储的待计算对象的特征数据的安全性。
本发明的一个实施例中,应用于数据提供端,所述方法还包括:
向数据融合端发送样本对象的样本特征数据,所述数据融合端本地部署有全局数据计算流程;
若本地存储有所述样本对象的样本标记,则向所述数据融合端发送所述样本标记,使得所述数据融合端根据所述样本特征数据与样本标记训练得到所述全局数据计算模型;
接收所述数据融合端发送的全局数据计算模型中包含的针对本地部署的局部数据计算流程的局部参数,使用局部参数更新本地部署的局部数据计算流程的参数,则所述局部数据计算流程为局部数据计算模型。
由以上可见,数据融合端接收到数据提供端发送的样本特征数据之后,根据样本特征数据对数据融合端中预设的全局数据计算流程进行训练,将训练得到的全局数据计算模型中包含的各个局部数据计算流程的局部参数发送到各个数据提供端中,数据提供端根据接收到的局部参数更新该数据提供端对应的局部数据计算流程的模型参数,从而得到训练好的局部数据计算模型。并且由于数据提供端仅向数据融合端发送样本特征数据,其他数据提供端不会获取到该数据提供端中存储的样本特征数据。由于数据融合端是没有存储有样本对象的样本特征数据的第三方可信设备,因此提高了上述样本特征数据的安全性。
本发明的一个实施例中,通过以下方式确定样本对象:
使用该数据提供端的第一私钥对本地存储的各个对象的第一对象标签进行加密,得到第一加密标签,并向其他数据提供端发送所述第一加密标签;
接收其他数据提供端发送的第二加密标签,所述第二加密标签为:其他数据提供端使用自身的第二私钥对本地存储的各个对象的第二对象标签进行加密得到的标签;
使用所述第一私钥对所述第二加密标签进行加密,得到第三加密标签;
向其他数据提供端发送所述第三加密标签;
接收其他数据提供端发送第四加密标签,所述第四加密标签为:其他数据提供端使用所述第二私钥对所述第一加密标签进行加密得到的标签;
确定所述第三加密标签和第四加密标签中相同的标签,并将所确定的标签对应的对象作为样本对象。
由以上可见,各个数据提供端分别使用自身的私钥对自身存储的对象标签进行加密,再将经过加密的对象标签发送到其他数据提供端,而其他数据提供端不确定对上述私钥解密的方法,因此无法获得上述对象标签的明文,因此数据提供端自身存储的对象标签不会暴露给其他数据提供端,提高了对象标签的安全性。
具体的,上述应用于数据提供端的数据计算方法与前述安全的多设备联合数据计算***中数据提供端的操作流程相同,在此不再赘述。
与前述应用于数据融合端的数据计算方法相对应,提供了一种应用于数据融合端的数据计算装置,所述装置包括:
标识发送模块,用于接收数据请求端发送的数据计算请求,向各个数据提供端发送所述数据计算请求所针对的所述待计算对象的标识,使得数据提供端根据所述待计算对象的标识,依据数据提供端本地存储的所述待计算对象的特征数据,计算得到局部计算结果;
结果接收模块,用于接收各个数据提供端发送的局部计算结果;
结果融合模块,用于对所接收的局部计算结果进行融合,获得全局计算结果;
全局结果发送模块,用于向所述数据请求端发送所述全局计算结果。
由以上可见,数据提供端向数据融合端发送局部计算结果,数据融合端对局部计算结果进行融合,获得全局计算结果,而不是数据提供端直接向数据融合端发送待计算对象的特征数据。因此在数据计算的过程中,数据融合端并未获得待计算对象的特征数据,各个数据提供端存储的特征数据始终位于数据提供端本地,并未被发送出去,因此提高了数据提供端中存储的待计算对象的特征数据的安全性。
本发明的一个实例中,通过以下应用于数据融合端的安全的多设备联合模型训练装置参与训练得到各个局部数据计算模型:
损失接收模块,用于接收各个数据提供端发送的第一梯度,并接收存储有样本标记的数据提供端发送的、对各个数据提供端所部署的局部数据计算流程进行训练的总损失;
第二梯度发送模块,用于根据预设学习率调整每一数据提供端发送的第一梯度,获得每一数据提供端对应的第二梯度,向各个数据提供端发送与该数据提供端对应的第二梯度;
收敛标志发送模块,用于根据上述总损失判断各个数据提供端本地部署的数据计算流程是否收敛,向各个数据提供端发送表征是否收敛的收敛标志。
由以上可见,在训练局部数据计算模型的过程中,数据融合端无法接收到数据提供端自身存储的样本对象的样本特征数据,因此各个数据提供端存储的样本特征数据始终位于数据提供端本地,并未从各个数据提供端中被发送出来,因此样本特征数据不会被暴露给数据融合端,提高了样本特征数据的安全性。并且存储有样本标记的数据提供端也不会将样本标记发送给其他数据提供端或数据融合端,因此样本标记不会被暴露给其他设备,提高了样本标记的安全性。
本发明的一个实施例中,所述应用于数据融合端的安全的多设备联合模型训练装置还包括:
公钥发送模块,用于在所述接收各个数据提供端发送的第一梯度,并接收存储有样本标记的数据提供端发送的、对各个数据提供端对应的局部数据计算流程进行训练的总损失之前,向各个数据提供端发送公钥;
所述损失接收模块,具体用于接收各个数据提供端发送的经过加密的第一梯度,并接收存储有样本标记的数据提供端发送的、经过加密的总损失,对接收到的经过加密的第一梯度与经过加密的总损失进行解密;
所述第二梯度发送模块,具体用于,根据预设学习率调整每一数据提供端发送的、经过解密的第一梯度,获得每一数据提供端对应的第二梯度,向各个数据提供端发送与该数据提供端对应的经过解密的第二梯度;。
所述收敛标志发送模块,具体用于根据经过解密的总损失判断各个数据提供端本地部署的数据计算流程是否收敛,向各个数据提供端发送表征是否收敛的收敛标志。
由以上可见,与在训练得到上述局部数据计算模型的过程中,数据提供端与数据融合端之间进行数据交互的过程中传输的数据经过公钥加密,而公钥来自数据融合端,仅有数据融合端能够进行解密,因此各个数据提供端在接收到其他数据提供端发送的数据之后不能进行解密,也就无法确定其他数据提供端发送的数据的明文,提供了模型训练过程中数据的安全性。
本发明的一个实施例中,可以通过以下第二种应用于数据融合端的模型训练装置训练得到局部数据计算模型:
数据接收模块,用于接收数据提供端发送的样本特征数据与样本标记;
全局参数调整模块,用于根据接收到的样本特征数据计算数据融合端本地部署的全局数据计算流程的全局梯度差,对全局数据计算流程的全局参数进行调整;
损失计算模块,用于根据接收到的样本特征数据与样本标记计算所述全局数据计算流程的损失值;
收敛判断模块,用于根据所述损失值判断所述全局数据计算流程是否满足预设的收敛条件,若为是,则所述全局数据计算流程为全局数据计算模型;
参数发送模块,用于分别向各个数据提供端发送全局数据计算模型中包含的各个数据提供端本地部署的局部数据计算流程的局部参数。
由以上可见,数据融合端接收到数据提供端发送的样本特征数据之后,根据样本特征数据对数据融合端中预设的全局数据计算流程进行训练,将训练得到的全局数据计算模型中包含的各个局部数据计算流程的局部参数发送到各个数据提供端中,数据提供端根据接收到的局部参数更新该数据提供端对应的局部数据计算流程的模型参数,从而得到训练好的局部数据计算模型。并且,由于数据提供端仅向数据融合端发送样本特征数据,其他数据提供端不会获取到该数据提供端中存储的样本特征数据。由于数据融合端是没有存储有样本对象的样本特征数据的第三方可信设备,因此提高了上述样本特征数据的安全性。
与前述应用于数据提供端的数据计算方法相对应,提供了一种应用于数据提供端的数据计算装置,所述装置包括:
标识接收模块,用于接收数据融合端发送的待计算对象的标识;
数据确定模块,用于根据所述标识,确定本地存储的所述待计算对象的特征数据;
数据计算模块,用于依据所确定的特征数据,对所述待计算对象的数据进行数据计算,得到局部计算结果;
局部结果发送模块,用于向所述数据融合端发送所述局部计算结果。
本发明的一个实施例中,所述数据计算模块,具体用于:
以所确定的特征数据为本地部署的局部数据计算模型的输入,对所述待计算对象的数据进行数据计算,得到局部计算结果,所述本地部署的局部数据计算模型为:采用本地存储的样本对象的特征数据、且与其他数据提供端中部署的局部数据计算模型联合训练得到的、用于对对象的数据进行数据计算的模型,所述样本对象为:各个数据提供端均存储有特征数据的对象。
由以上可见,根据待计算对象的特征数据,得到局部计算结果的过程是在数据提供端中进行的,数据提供端向数据融合端发送的是局部计算结果,而不是数据提供端直接向数据融合端发送待计算对象的特征数据。因此在数据计算的过程中,各个数据提供端存储的特征数据始终位于数据提供端本地,并未从各个数据提供端中被发送出来,数据融合端并未获得待计算对象的特征数据,从而提高了数据提供端中存储的待计算对象的特征数据的安全性。
本发明的一个实施例中,可以通过以下应用于数据提供端的模型训练装置对局部数据计算模型进行训练,所述装置包括:
样本数据发送模块,用于向数据融合端发送样本对象的样本特征数据,所述数据融合端本地部署有全局数据计算流程;
标记发送模块,用于若本地存储有所述样本对象的样本标记,则向所述数据融合端发送所述样本标记,使得所述数据融合端根据所述样本特征数据与样本标记训练得到所述全局数据计算模型;
参数接收模块,用于接收所述数据融合端发送的全局数据计算模型中包含的针对本地部署的各个局部数据计算流程的局部参数,使用局部参数更新本地对应的局部数据计算流程的参数,则所述局部数据计算流程为局部数据计算模型。
由以上可见,数据融合端接收到数据提供端发送的样本特征数据之后,根据样本特征数据对数据融合端中预设的全局数据计算流程进行训练,将训练得到的全局数据计算模型中包含的各个局部数据计算流程的局部参数发送到各个数据提供端中,数据提供端根据接收到的局部参数更新该数据提供端对应的局部数据计算流程的参数,从而得到训练好的局部数据计算模型。并且,由于数据提供端仅向数据融合端发送样本特征数据,其他数据提供端不会获取到该数据提供端中存储的样本特征数据。由于数据融合端是没有存储有样本对象的样本特征数据的第三方可信设备,因此提高了上述样本特征数据的安全性。
本发明的一个实施例中,可以通过应用于数据提供端的样本对象确定装置确定所述样本对象,所述装置包括:
第一标签加密模块,用于使用该数据提供端的第一私钥对本地存储的各个对象的第一对象标签进行加密,得到第一加密标签,并向其他数据提供端发送所述第一加密标签;
第二标签接收模块,用于接收其他数据提供端发送的第二加密标签,所述第二加密标签为:其他数据提供端使用自身的第二私钥对本地存储的各个对象的第二对象标签进行加密得到的标签;
第三标签加密模块,用于使用所述第一私钥对所述第二加密标签进行加密,得到第三加密标签;
标签发送模块,用于向其他数据提供端发送所述第三加密标签;
第四标签发送模块,用于接收其他数据提供端发送第四加密标签,所述第四加密标签为:其他数据提供端使用所述第二私钥对所述第一加密标签进行加密得到的标签;
对象确定模块,用于确定所述第三加密标签和第四加密标签中相同的标签,并将所确定的标签对应的对象作为样本对象。
由以上可见,各个数据提供端分别使用自身的私钥对自身存储的对象标签进行加密,再将经过加密的对象标签发送到其他数据提供端,而其他数据提供端不确定对上述私钥解密的方法,因此无法获得上述对象标签的明文,因此数据提供端自身存储的对象标签不会暴露给其他数据提供端,提高了对象标签的安全性。
本发明实施例还提供了一种电子设备,作为数据融合端,如图6所示,包括处理器601、通信接口602、存储器603和通信总线604,其中,处理器601,通信接口602,存储器603通过通信总线604完成相互间的通信,
存储器603,用于存放计算机程序;
处理器601,用于执行存储器603上所存放的程序时,实现上述应用于数据融合端的数据计算方法的任一所述方法步骤。
应用本发明实施例提供的电子设备作为数据融合端进行数据计算的情况下,数据提供端向数据融合端发送局部计算结果,数据融合端对局部计算结果进行融合,获得全局计算结果,而不是数据提供端直接向数据融合端发送待计算对象的特征数据。因此在数据计算的过程中,数据融合端并未获得待计算对象的特征数据,从而提高了数据提供端中存储的待计算对象的特征数据的安全性。
本发明实施例还提供了另一种电子设备,作为数据提供端,如图7所示,包括处理器701、通信接口702、存储器703和通信总线704,其中,处理器701,通信接口702,存储器703通过通信总线704完成相互间的通信,
存储器703,用于存放计算机程序;
处理器701,用于执行存储器703上所存放的程序时,实现上述应用于数据提供端的数据计算方法的任一所述方法步骤。
应用本发明实施例提供的电子设备作为数据提供端进行数据计算的情况下,根据待计算对象的特征数据,得到局部计算结果的过程是在数据提供端中进行的,数据提供端向数据融合端发送的是局部计算结果,而不是数据提供端直接向数据融合端发送待计算对象的特征数据。因此在数据计算的过程中,各个数据提供端存储的特征数据始终位于数据提供端本地,并未从各个数据提供端中被发送出来,数据融合端并未获得待计算对象的特征数据,从而提高了数据提供端中存储的待计算对象的特征数据的安全性。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,应用于数据融合端,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一应用于数据融合端的数据计算方法的步骤。
执行本发明实施例提供的应用于数据融合端的计算机可读存储介质中存储的计算机程序进行数据计算的情况下,数据提供端向数据融合端发送局部计算结果,数据融合端对局部计算结果进行融合,获得全局计算结果,而不是数据提供端直接向数据融合端发送待计算对象的特征数据。因此在数据计算的过程中,数据融合端并未获得待计算对象的特征数据,从而提高了数据提供端中存储的待计算对象的特征数据的安全性。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,应用于数据提供端,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一应用于数据融合端的数据计算方法的步骤。
执行本发明实施例提供的应用于数据接收端的计算机可读存储介质中存储的计算机程序进行数据计算的情况下,根据待计算对象的特征数据,得到局部计算结果的过程是在数据提供端中进行的,数据提供端向数据融合端发送的是局部计算结果,而不是数据提供端直接向数据融合端发送待计算对象的特征数据。因此在数据计算的过程中,各个数据提供端存储的特征数据始终位于数据提供端本地,并未从各个数据提供端中被发送出来,数据融合端并未获得待计算对象的特征数据,从而提高了数据提供端中存储的待计算对象的特征数据的安全性。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,应用于数据融合端,当其在计算机上运行时,使得计算机执行上述实施例中任一应用于数据融合端的数据计算方法的步骤。
执行本发明实施例提供的应用于数据融合端的计算机程序进行数据计算的情况下,数据提供端向数据融合端发送局部计算结果,数据融合端对局部计算结果进行融合,获得全局计算结果,而不是数据提供端直接向数据融合端发送待计算对象的特征数据。因此在数据计算的过程中,数据融合端并未获得待计算对象的特征数据,从而提高了数据提供端中存储的待计算对象的特征数据的安全性。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,应用于数据提供端,当其在计算机上运行时,使得计算机执行上述实施例中任一应用于数据提供端的数据计算方法的步骤。
执行本发明实施例提供的应用于数据提供端的计算机程序进行数据计算的情况下,根据待计算对象的特征数据,得到局部计算结果的过程是在数据提供端中进行的,数据提供端向数据融合端发送的是局部计算结果,而不是数据提供端直接向数据融合端发送待计算对象的特征数据。因此在数据计算的过程中,各个数据提供端存储的特征数据始终位于数据提供端本地,并未从各个数据提供端中被发送出来,数据融合端并未获得待计算对象的特征数据,从而提高了数据提供端中存储的待计算对象的特征数据的安全性。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于方法、装置、电子设备、计算机可读存储介质和计算机程序产品而言,由于其基本相似于***实施例,所以描述的比较简单,相关之处参见***实施例的部分说明即可。
以上所述仅为本发明的较佳实施例,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (13)

1.一种安全的多设备联合数据计算***,其特征在于,所述***包括:数据请求端、数据融合端、至少两个数据提供端;
所述数据请求端,用于向所述数据融合端发送针对待处理对象的数据计算请求;
所述数据融合端,用于接收所述数据请求端发送的所述数据计算请求,向各个数据提供端发送所述数据计算请求所针对的所述待计算对象的标识;
各个数据提供端,用于接收所述数据融合端发送的所述待计算对象的标识;根据所述标识,确定本地存储的所述待计算对象的特征数据;依据所确定的特征数据,对所述待计算对象的数据进行数据计算,得到局部计算结果;向所述数据融合端发送所述局部计算结果;
所述数据融合端,用于接收各个数据提供端发送的局部计算结果;对所接收的局部计算结果进行融合,获得全局计算结果,向所述数据请求端发送所述全局计算结果;
所述数据请求端,用于接收所述数据融合端发送的所述全局计算结果。
2.根据权利要求1所述的***,其特征在于,
各个数据提供端,具体用于以所确定的特征数据为本地部署的局部数据计算模型的输入,对所述待计算对象的数据进行数据计算,得到局部计算结果,所述本地部署的局部数据计算模型为:采用本地存储的样本对象的特征数据、且与其他数据提供端中部署的特征数据联合训练得到的、用于对对象的数据进行数据计算的模型,所述样本对象为:各个数据提供端均存储有特征数据的对象。
3.根据权利要求2所述的***,其特征在于,
各个数据提供端中的第一数据提供端,还用于确定本地存储的所述样本对象的第一样本特征数据;根据所述第一数据提供端本地部署的数据计算流程对所述第一样本特征数据进行数据计算,得到局部样本计算结果;向第二数据提供端发送局部样本计算结果,其中,所述第二数据提供端为:按照各个数据提供端对数据进行计算的预设顺序、所述第一数据提供端的下一数据提供端;
所述第二数据提供端,还用于接收所述预设顺序中所述第二数据提供端的上一数据提供端发送的局部样本计算结果;确定本地存储的所述样本对象的第二样本特征数据;根据所述第二数据提供端本地部署的数据计算流程对接收到的局部样本计算结果与所述第二样本特征数据进行数据计算,得到本地计算得到的局部样本计算结果;向所述预设顺序中所述第二数据提供端的下一数据提供端发送本地进行数据计算得到的局部样本计算结果;
存储有所述样本对象的样本标记的数据提供端,还用于获得所述预设顺序中最后一个数据提供端发送的局部样本计算结果,根据所获得的局部样本计算结果与样本标记,计算各个数据提供端进行数据计算的梯度计算中间结果与总损失,向存储有所述样本对象的样本标记的数据提供端之外的其他数据提供端发送所述梯度计算中间结果,向所述数据融合端发送所述总损失;
各个数据提供端,还用于在获得所述梯度计算中间结果之后,根据所述梯度计算中间结果与本地存储的样本特征数据,计算数据提供端本地部署的数据计算流程的第一梯度,向所述数据融合端发送所述第一梯度;
所述数据融合端,还用于接收各个数据提供端发送的第一梯度,并接收存储有所述样本对象的样本标记的数据提供端发送的总损失,根据预设学习率调整每一数据提供端发送的第一梯度,获得每一数据提供端对应的第二梯度,向各个数据提供端发送与该数据提供端对应的第二梯度,根据所述总损失判断各个数据提供端本地部署的数据计算流程是否收敛,向各个数据提供端发送表征是否收敛的收敛标志;
各个数据提供端,还用于接收所述数据融合端发送的第二梯度与收敛标志,根据所述第二梯度调整针对该数据提供端的数据计算流程的参数,若所述收敛标志表征各个数据提供端的数据计算流程收敛,则针对本地的数据计算流程为本地部署的局部数据计算模型。
4.根据权利要求3所述的***,其特征在于,
所述数据融合端,还用于向各个数据提供端发送公钥;
各个数据提供端,还用于接收所述数据融合端发送的所述公钥;
各个数据提供端中的第一数据提供端,具体用于向第二数据提供端发送使用公钥加密的局部样本计算结果;
所述第二数据提供端,具体用于接收所述预设顺序中所述第二数据提供端的上一数据提供端发送的、经过加密的局部样本计算结果;根据第二数据提供端本地部署的数据计算流程对接收到的经过加密的局部样本计算结果与第二样本特征数据进行数据计算,得到本地计算得到的局部样本计算结果;向所述预设顺序中所述第二数据提供端的下一数据提供端发送本地进行数据计算得到的、使用公钥加密的局部样本计算结果;
所述存储有所述样本对象的样本标记的数据提供端,具体用于获得所述预设顺序中最后一个数据提供端发送的经过加密的局部样本计算结果,根据所获得的经过加密的局部样本计算结果与样本标记,计算各个数据提供端进行数据计算的梯度计算中间结果与总损失;向存储有所述样本对象的样本标记的数据提供端之外的其他数据提供端发送使用公钥加密的梯度计算中间结果,向所述数据融合端发送使用公钥加密的所述总损失;
各个数据提供端,具体用于在获得经过加密的梯度计算中间结果之后,根据经过加密的梯度计算中间结果与本地存储的样本特征数据,计算针对本地的数据计算流程的第一梯度,向所述数据融合端发送使用公钥加密的第一梯度;
所述数据融合端,具体用于接收各个数据提供端发送的经过加密的第一梯度,并接收存储有所述样本对象的样本标记的数据提供端发送的经过加密的总损失,对接收到的经过加密的第一梯度与经过加密的总损失进行解密,根据预设学习率调整经过解密的每一数据提供端发送的第一梯度,获得每一数据提供端对应的第二梯度。
5.根据权利要求2所述的***,其特征在于,数据融合端本地部署有全局数据计算模型;
各个数据提供端,还用于向所述数据融合端发送样本对象的样本特征数据;
存储有所述样本对象的样本标记的数据提供端,还用于向所述数据融合端发送所述样本标记;
所述数据融合端,还用于接收数据提供端发送的样本特征数据与样本标记;根据接收到的样本特征数据计算数据融合端本地部署的全局数据计算流程的全局梯度差,对全局数据计算流程的全局参数进行调整;根据接收到的样本特征数据与样本标记计算所述全局数据计算流程的损失值;根据所述损失值判断所述全局数据计算流程是否满足预设的收敛条件,若为是,则所述全局数据计算流程为全局数据计算模型;分别向各个数据提供端发送全局数据计算模型中包含的各个数据提供端本地部署的局部数据计算流程的局部参数;
所述数据提供端,还用于接收所述数据融合端发送的所述局部参数,使用局部参数更新本地部署的局部数据计算流程的参数,则所述局部数据计算流程为局部数据计算模型。
6.根据权利要求3-5中任一项所述的***,其特征在于,
所述数据提供端,还用于使用该数据提供端的第一私钥对本地存储的各个对象的第一对象标签进行加密,得到第一加密标签,并向其他数据提供端发送所述第一加密标签;接收其他数据提供端发送的第二加密标签;使用所述第一私钥对所述第二加密标签进行加密,得到第三加密标签;向其他数据提供端发送所述第三加密标签;接收其他数据提供端发送第四加密标签;确定所述第三加密标签和第四加密标签中相同的标签,并将所确定的标签对应的对象作为样本对象;
所述第二加密标签为:其他数据提供端使用自身的第二私钥对本地存储的各个对象的第二对象标签进行加密得到的标签;
所述第四加密标签为:其他数据提供端使用所述第二私钥对所述第一加密标签进行加密得到的标签。
7.一种数据计算方法,其特征在于,应用于数据融合端,所述方法包括:
接收数据请求端发送的数据计算请求,向各个数据提供端发送所述数据计算请求所针对的所述待计算对象的标识,使得数据提供端根据所述待计算对象的标识,依据数据提供端本地存储的所述待计算对象的特征数据,计算得到局部计算结果;
接收各个数据提供端发送的局部计算结果;
对所接收的局部计算结果进行融合,获得全局计算结果;
向所述数据请求端发送所述全局计算结果。
8.一种数据计算方法,其特征在于,应用于数据提供端,所述方法包括:
接收数据融合端发送的待计算对象的标识;
根据所述标识,确定本地存储的所述待计算对象的特征数据;
依据所确定的特征数据,对所述待计算对象的数据进行数据计算,得到局部计算结果;
向所述数据融合端发送所述局部计算结果。
9.一种数据计算装置,其特征在于,应用于数据融合端,所述装置包括:
标识发送模块,用于接收数据请求端发送的数据计算请求,向各个数据提供端发送所述数据计算请求所针对的所述待计算对象的标识,使得数据提供端根据所述待计算对象的标识,依据数据提供端本地存储的所述待计算对象的特征数据,计算得到局部计算结果;
结果接收模块,用于接收各个数据提供端发送的局部计算结果;
结果融合模块,用于对所接收的局部计算结果进行融合,获得全局计算结果;
全局结果发送模块,用于向所述数据请求端发送所述全局计算结果。
10.一种数据计算装置,其特征在于,应用于数据提供端,所述装置包括:
标识接收模块,用于接收数据融合端发送的待计算对象的标识;
数据确定模块,用于根据所述标识,确定本地存储的所述待计算对象的特征数据;
数据计算模块,用于依据所确定的特征数据,对所述待计算对象的数据进行数据计算,得到局部计算结果;
局部结果发送模块,用于向所述数据融合端发送所述局部计算结果。
11.一种电子设备,作为数据融合端,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求7所述的方法步骤。
12.一种电子设备,作为数据提供端,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求8所述的方法步骤。
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求7或8所述的方法步骤。
CN202010663590.1A 2020-07-10 2020-07-10 一种安全的多设备联合数据计算***、方法及装置 Pending CN111859360A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010663590.1A CN111859360A (zh) 2020-07-10 2020-07-10 一种安全的多设备联合数据计算***、方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010663590.1A CN111859360A (zh) 2020-07-10 2020-07-10 一种安全的多设备联合数据计算***、方法及装置

Publications (1)

Publication Number Publication Date
CN111859360A true CN111859360A (zh) 2020-10-30

Family

ID=73153509

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010663590.1A Pending CN111859360A (zh) 2020-07-10 2020-07-10 一种安全的多设备联合数据计算***、方法及装置

Country Status (1)

Country Link
CN (1) CN111859360A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112671870A (zh) * 2020-12-16 2021-04-16 珠海格力电器股份有限公司 一种数据处理方法、装置、电子设备及存储介质
CN112989368A (zh) * 2021-02-07 2021-06-18 支付宝(杭州)信息技术有限公司 多方联合进行隐私数据处理的方法及装置
CN113704779A (zh) * 2021-07-16 2021-11-26 杭州医康慧联科技股份有限公司 加密的分布式机器学习训练方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9747455B1 (en) * 2014-12-04 2017-08-29 Amazon Technologies, Inc. Data protection using active data
CN110633805A (zh) * 2019-09-26 2019-12-31 深圳前海微众银行股份有限公司 纵向联邦学习***优化方法、装置、设备及可读存储介质
CN110874484A (zh) * 2019-10-16 2020-03-10 众安信息技术服务有限公司 基于神经网络和联邦学习的数据处理方法和***
CN111027086A (zh) * 2019-12-16 2020-04-17 支付宝(杭州)信息技术有限公司 一种私有数据保护方法和***

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9747455B1 (en) * 2014-12-04 2017-08-29 Amazon Technologies, Inc. Data protection using active data
CN110633805A (zh) * 2019-09-26 2019-12-31 深圳前海微众银行股份有限公司 纵向联邦学习***优化方法、装置、设备及可读存储介质
CN110874484A (zh) * 2019-10-16 2020-03-10 众安信息技术服务有限公司 基于神经网络和联邦学习的数据处理方法和***
CN111027086A (zh) * 2019-12-16 2020-04-17 支付宝(杭州)信息技术有限公司 一种私有数据保护方法和***

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112671870A (zh) * 2020-12-16 2021-04-16 珠海格力电器股份有限公司 一种数据处理方法、装置、电子设备及存储介质
CN112671870B (zh) * 2020-12-16 2023-12-12 珠海格力电器股份有限公司 一种数据处理方法、装置、电子设备及存储介质
CN112989368A (zh) * 2021-02-07 2021-06-18 支付宝(杭州)信息技术有限公司 多方联合进行隐私数据处理的方法及装置
CN112989368B (zh) * 2021-02-07 2022-05-17 支付宝(杭州)信息技术有限公司 多方联合进行隐私数据处理的方法及装置
CN113704779A (zh) * 2021-07-16 2021-11-26 杭州医康慧联科技股份有限公司 加密的分布式机器学习训练方法

Similar Documents

Publication Publication Date Title
CN110955907B (zh) 一种基于联邦学习的模型训练方法
US11546373B2 (en) Cryptocurrency based malware and ransomware detection systems and methods
CN111859360A (zh) 一种安全的多设备联合数据计算***、方法及装置
CN111008709A (zh) 联邦学习、资料风险评估方法、装置和***
US20200160344A1 (en) Blockchain Transaction Analysis and Anti-Money Laundering Compliance Systems and Methods
CN111460511A (zh) 基于隐私保护的联邦学习、虚拟对象分配方法和装置
CN112116008B (zh) 基于智能决策的目标检测模型的处理方法、及其相关设备
CN112465627B (zh) 基于区块链和机器学习的金融借贷审核方法及***
US20160125402A1 (en) Method and device for payment using token
CN110837653B (zh) 标签预测方法、装置以及计算机可读存储介质
CN111027981B (zh) 多方联合训练针对IoT机具的风险评估模型的方法及装置
CN111144576A (zh) 模型训练方法、装置和电子设备
JP7257172B2 (ja) 通信プログラム、通信装置、および、通信方法
CN113239391B (zh) 一种无第三方的逻辑回归联邦学习模型训练***及方法
CN112199706B (zh) 基于多方安全计算的树模型的训练方法和业务预测方法
WO2022237175A1 (zh) 图数据的处理方法、装置、设备、存储介质及程序产品
CN109241423B (zh) 信息推荐方法、装置、电子设备及存储介质
CN109583228B (zh) 一种隐私信息管理方法、装置和***
CN113282935A (zh) 一种基于模型的预测方法、装置和存储介质
CN111368196A (zh) 模型参数的更新方法、装置、设备及可读存储介质
JP6910229B2 (ja) 情報処理装置および信用度算出方法
CN113704805B (zh) 一种风控规则匹配方法、装置及电子设备
CN113033717B (zh) 一种模型生成方法、装置以及用于模型生成的装置
CN110874481B (zh) 一种基于gbdt模型的预测方法和装置
CN111275071B (zh) 预测模型训练、预测方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination