CN115130121A - 一种去第三方的隐私计算下纵向逻辑回归模型训练方法 - Google Patents

一种去第三方的隐私计算下纵向逻辑回归模型训练方法 Download PDF

Info

Publication number
CN115130121A
CN115130121A CN202210650114.5A CN202210650114A CN115130121A CN 115130121 A CN115130121 A CN 115130121A CN 202210650114 A CN202210650114 A CN 202210650114A CN 115130121 A CN115130121 A CN 115130121A
Authority
CN
China
Prior art keywords
value
data
data value
ciphertext
gradient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210650114.5A
Other languages
English (en)
Inventor
薛瑞东
田�健
南文捷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Rongshulianzhi Technology Co ltd
Original Assignee
Beijing Rongshulianzhi Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Rongshulianzhi Technology Co ltd filed Critical Beijing Rongshulianzhi Technology Co ltd
Priority to CN202210650114.5A priority Critical patent/CN115130121A/zh
Publication of CN115130121A publication Critical patent/CN115130121A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/008Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols involving homomorphic encryption
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2211/00Indexing scheme relating to details of data-processing equipment not covered by groups G06F3/00 - G06F13/00
    • G06F2211/007Encryption, En-/decode, En-/decipher, En-/decypher, Scramble, (De-)compress
    • G06F2211/008Public Key, Asymmetric Key, Asymmetric Encryption

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • Signal Processing (AREA)
  • Computer Hardware Design (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种去第三方的隐私计算下纵向逻辑回归模型训练方法,获取隐私计算中的第一用户特征数据并计算第一数据值;接收数据源方发送的第一加密数据值;根据第一数据值和第一加密数据值计算目标加密数据值;利用预设算法对目标加密数据值进行计算得到第一密文预测值;根据第一密文预测值和标签数据计算第一密文数据值并根据第一密文数据值计算第一密文更新梯度值;对第一密文更新梯度值进行加盐处理后更新梯度;更新梯度后,根据预设第一同态密钥对第一密文数据值进行加密得到第二加密数据值并将第二加密数据值发送至数据源方使得数据源方利用预设第一同态密钥对第二加密数据值进行解密,降低了数据泄露风险,保证了中间步骤的***露性。

Description

一种去第三方的隐私计算下纵向逻辑回归模型训练方法
技术领域
本发明涉及数据处理技术领域,具体涉及一种去第三方的隐私计算下纵向逻辑回归模型训练方法。
背景技术
在当前“人工智能”、“数据科技”的年代,数据作为最重要的生产要素之一有着大量的流通与融合的需要。目前当多家机构展开数据合作时,需要将各方的明文数据归集在一处(可以统一归集在其中的某一家机构,也可以归集在某个独立的第三方平台),之后再进行中心化的数量化建模或分析工作。数据有着开放与融合的需要,但是在另外一面,对数据安全与保护有着越来越严格的要求,而各个机构对于自身商业数据保护的需要也都使得机构明文数据“出库”这样的操作越来越不可行。
现有技术中,为了解决数据流通与数据安全保护这一对矛盾,通常利用以下方法:使用一种基于“可信第三方”的联邦学习框架下的纵向逻辑回归算法,还有一种不完全保护中间步骤的两方逻辑回归方法采取的手段。但是这些方法虽然大大简化了联邦学习下纵向逻辑回归算法实现的难度,并且如果“可信第三方”不和任意一方串谋的情况下,安全性是可以保证的,而使用两方的厂商认为中间步骤的Z值已经是经过加工的,并不会暴露太多信息。但是这些条件比较理想,在实际情况下,无论是可信第三方的方案,还是两方的不保护中间步骤的方案,都可能存在数据泄露等重大安全隐患。
发明内容
有鉴于此,本发明实施例提供了涉及一种去第三方的隐私计算下纵向逻辑回归模型训练方法,以解决现有技术中使用一种基于“可信第三方”的联邦学习框架下的纵向逻辑回归算法和一种不完全保护中间步骤的两方逻辑回归方法采取的手段解决数据流通与数据安全保护的问题时可能存在数据泄露等重大安全隐患的技术问题。
本发明提出的技术方案如下:
本发明实施例第一方面提供一种去第三方的隐私计算下纵向逻辑回归模型训练方法,该去第三方的隐私计算下纵向逻辑回归模型训练方法包括:获取隐私计算中的第一用户特征数据并根据所述第一用户特征数据计算得到对应的第一数据值;接收数据源方发送的第一加密数据值,所述第一加密数据值为所述数据源方根据数据需求方发起的数据使用请求,对所述数据使用请求对应的第二用户特征数据进行预处理并加密得到;根据所述第一数据值和所述第一加密数据值计算得到对应的目标加密数据值;利用预设基于联邦学习的纵向逻辑回归算法对所述目标加密数据值进行计算得到对应的第一密文预测值;根据所述第一密文预测值和目标标签变量计算得到用于纵向逻辑回归算法中梯度计算的第一密文数据值并对所述第一密文数据值进行计算得到对应的第一密文更新梯度值;对所述第一密文更新梯度值加盐处理后更新所述纵向逻辑回归算法中对应的第一梯度;当更新所述第一梯度后,根据预设第一同态密钥对所述第一密文数据值进行加密得到对应的第二加密数据值并将所述第二加密数据值发送至所述数据源方使得所述数据源方利用所述预设第一同态密钥对所述第二加密数据值进行解密。
可选地,对所述第一密文更新梯度值加盐处理后更新所述纵向逻辑回归算法中对应的第一梯度,包括:将所述第一密文更新梯度值和第一预设随机数进行组合后发送至所述数据源方以使所述数据源方对所述第一密文更新梯度值和第一预设随机数形成的组合进行解密得到对应的第一解密数据值;对所述第一解密数据值进行处理得到对应的第一梯度值并根据所述第一梯度值更新所述纵向逻辑回归算法中对应的第一梯度。
可选地,所述利用预设基于联邦学习的纵向逻辑回归算法对所述目标加密数据值进行计算得到对应的第一密文预测值,包括:利用预设多项式函数拟合纵向逻辑回归算法中的激活函数得到对应的预设基于联邦学习的纵向逻辑回归算法;利用所述预设基于联邦学习的纵向逻辑回归算法对所述目标加密数据值计算得到对应的第一密文预测值。
本发明实施例第二方面提供一种去第三方的隐私计算下纵向逻辑回归模型训练方法,该去第三方的隐私计算下纵向逻辑回归模型训练方法包括:当获取到数据需求方发送的数据使用请求,对所述数据使用请求对应的第二用户特征数据进行预处理得到对应的第二数据值;根据预设第二同态密钥对所述第二数据值进行加密得到对应的第一加密数据值并将所述第一加密数据值发送至对应的数据需求方;接收所述数据需求方发送的第二加密数据值,所述第二加密数据值为所述数据需求方根据预设第一同态加密公钥对所述数据需求方中用于纵向逻辑回归算法中梯度计算的第一密文数据值进行加密得到,所述第一密文数据值为所述数据需求方对所述第一加密数据值进行处理得到;利用所述预设第一同态密钥对所述第二加密数据值进行解密得到对应的第二解密数据值;根据所述第二解密数据值和所述用户特征数据计算得到对应的第二密文更新梯度值并对所述第二密文更新梯度值加盐处理后更新所述纵向逻辑回归算法中对应的第二梯度。
可选地,对所述第二密文更新梯度值加盐处理后更新所述纵向逻辑回归算法中对应的第二梯度,包括:根据所述第二解密数据值和所述用户特征数据计算得到对应的第二密文更新梯度值;将所述第二密文更新梯度值和第二预设随机数进行组合后发送至所述数据需求方以使所述数据需求方对所述第二密文更新梯度值和第二预设随机数形成的组合进行解密得到对应的第三解密数据值;对所述第三解密数据值进行处理得到对应的第二梯度值并根据所述第二梯度值更新所述纵向逻辑回归算法中对应的第二梯度。
本发明实施例第三方面提供一种去第三方的隐私计算下纵向逻辑回归模型训练装置,该去第三方的隐私计算下纵向逻辑回归模型训练装置包括:第一获取模块,用于获取隐私计算中的第一用户特征数据并根据所述第一用户特征数据计算得到对应的第一数据值;第一接收模块,用于接收数据源方发送的第一加密数据值,所述第一加密数据值为所述数据源方根据数据需求方发起的数据使用请求,对所述数据使用请求对应的第二用户特征数据进行预处理并加密得到;第一计算模块,用于根据所述第一数据值和所述第一加密数据值计算得到对应的目标加密数据值;第二计算模块,用于利用预设基于联邦学习的纵向逻辑回归算法对所述目标加密数据值进行计算得到对应的第一密文预测值;第三计算模块,用于根据所述第一密文预测值和目标标签变量计算得到用于纵向逻辑回归算法中梯度计算的第一密文数据值并对所述第一密文数据值进行计算得到对应的第一密文更新梯度值;第一处理模块,用于对所述第一密文更新梯度值加盐处理后更新所述纵向逻辑回归算法中对应的第一梯度;第二处理模块,用于当更新所述第一梯度后,根据预设第一同态密钥对所述第一密文数据值进行加密得到对应的第二加密数据值并将所述第二加密数据值发送至所述数据源方使得所述数据源方利用所述预设第一同态密钥对所述第二加密数据值进行解密。
可选地,所述第一处理模块包括:第一计算子模块,用于根据所述第一密文数据值计算得到对应的第一密文更新梯度值;第一解密子模块,用于将所述第一密文更新梯度值和第一预设随机数进行组合后发送至所述数据源方以使所述数据源方对所述第一密文更新梯度值和第一预设随机数形成的组合进行解密得到对应的第一解密数据值;第一更新子模块,用于对所述第一解密数据值进行处理得到对应的第一梯度值并根据所述第一梯度值更新所述纵向逻辑回归算法中对应的第一梯度。
本发明实施例第四方面提供一种去第三方的隐私计算下纵向逻辑回归模型训练装置,该去第三方的隐私计算下纵向逻辑回归模型训练装置包括:第三处理模块,用于当获取到数据需求方发送的数据使用请求,对所述数据使用请求对应的第二用户特征数据进行预处理得到对应的第二数据值;第一加密模块,用于根据预设第二同态密钥对所述第二数据值进行加密得到对应的第一加密数据值并将所述第一加密数据值发送至对应的数据需求方;第二接收模块,用于接收所述数据需求方发送的第二加密数据值,所述第二加密数据值为所述数据需求方根据预设第一同态加密公钥对所述数据需求方中用于纵向逻辑回归算法中梯度计算的第一密文数据值进行加密得到,所述第一密文数据值为所述数据需求方对所述第一加密数据值进行处理得到;第二解密模块,用于利用所述预设第一同态密钥对所述第二加密数据值进行解密得到对应的第二解密数据值;更新模块,用于根据所述第二解密数据值和所述用户特征数据计算得到对应的第二密文更新梯度值并对所述第二密文更新梯度值加盐处理后更新所述纵向逻辑回归算法中对应的第二梯度。
本发明实施例第五方面提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行如本发明实施例第一方面及第一方面任一项所述的去第三方的隐私计算下纵向逻辑回归模型训练方法,或者如本发明实施例第二方面及第二方面任一项所述的去第三方的隐私计算下纵向逻辑回归模型训练方法。
本发明实施例第六方面提供一种电子设备,包括:存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行如本发明实施例第一方面及第一方面任一项所述的去第三方的隐私计算下纵向逻辑回归模型训练方法,或者如本发明实施例第二方面及第二方面任一项所述的去第三方的隐私计算下纵向逻辑回归模型训练方法。
本发明提供的技术方案,具有如下效果:
本发明实施例提供的去第三方的隐私计算下纵向逻辑回归模型训练方法,获取隐私计算中的第一用户特征数据并根据所述第一用户特征数据计算得到对应的第一数据值;接收数据源方发送的第一加密数据值,所述第一加密数据值为所述数据源方根据数据需求方发起的数据使用请求,对所述数据使用请求对应的第二用户特征数据进行预处理并加密得到;根据所述第一数据值和所述第一加密数据值计算得到对应的目标加密数据值;利用预设基于联邦学习的纵向逻辑回归算法对所述目标加密数据值进行计算得到对应的第一密文预测值;根据所述第一密文预测值和目标标签变量计算得到用于纵向逻辑回归算法中梯度计算的第一密文数据值并对所述第一密文数据值进行计算得到对应的第一密文更新梯度值;对所述第一密文更新梯度值加盐处理后更新所述纵向逻辑回归算法中对应的第一梯度;当更新所述第一梯度后,根据预设第一同态密钥对所述第一密文数据值进行加密得到对应的第二加密数据值并将所述第二加密数据值发送至所述数据源方使得所述数据源方利用所述预设第一同态密钥对所述第二加密数据值进行解密。该方法利用了可交换的同态加密手段的方式,成功去除了“可信第三方”的要求,解决了第三方潜在的串谋风险所引起的安全性隐患等问题;参与计算的两方都是实际拥有数据的两方,可以更好的估计实施计算所需要的花费,避免了出现算力浪费等情况。因此,通过实时本发明,利用可交换的同态加密手段进行中间步骤的计算和数值的交换,降低了数据泄露的风险;利用加盐的手段也保证了中间步骤的***露性。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的去第三方的隐私计算下纵向逻辑回归模型训练方法的流程图;
图2是根据本发明实施例的去第三方的隐私计算下纵向逻辑回归模型训练方法的流程图;
图3是根据本发明实施例的去第三方的隐私计算下纵向逻辑回归模型训练装置的结构框图;
图4是根据本发明实施例的去第三方的隐私计算下纵向逻辑回归模型训练装置的结构框图;
图5是根据本发明实施例提供的计算机可读存储介质的结构示意图;
图6是根据本发明实施例提供的电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供一种去第三方的隐私计算下纵向逻辑回归模型训练方法,如图1所示,该方法包括如下步骤:
步骤S101:获取隐私计算中的第一用户特征数据并根据所述第一用户特征数据计算得到对应的第一数据值。具体地,联邦学习是一个机器学习框架,能有效帮助多个机构在满足用户隐私保护、数据安全等要求下进行数据使用和机器学习建模。在联邦学习中,包括数据需求方和数据源方两个参与方,两方均拥有对应的用户特征数据,其中,数据需求方(A)还拥有对应的标签。根据数据需求方(A)拥有的第一用户特征数据可以计算得到对应的第一数据值。
具体地,通过下式进行计算:
ZA=np.dot(XA,wA)+b…………………………………(1)
其中,ZA表示第一数据值;XA表示第一用户特征数据,可以为数值型、字符型等,本发明中不做具体限定,只要能够有助于预测对应的标签即可;wA表示模型系数,初始值为0,模型训练结果有很多轮,每轮训练都得到两个梯度值,
Figure BDA0003686380460000081
Figure BDA0003686380460000082
然后用梯度来对wa和wb进行更新:
Figure BDA0003686380460000083
Figure BDA0003686380460000084
其中,alpha是用户在模型训练之前设定的学习率,比如可以设定为0.3。
wa和wb更新完成之后,就一次一次重复训练过程:得到新的
Figure BDA0003686380460000085
Figure BDA0003686380460000086
以此更新wa和wb,直到模型训练完成;b表示截距;
步骤S102:接收数据源方发送的第一加密数据值,所述第一加密数据值为所述数据源方根据数据需求方发起的数据使用请求,对所述数据使用请求对应的第二用户特征数据进行预处理并加密得到。具体地,数据源方(B)为没有标签数据的一方,但是拥有用户特征数据,当数据源方接收到数据需求方发起的数据使用请求后,首先,根据该数据使用请求获取对应的第二用户特征数据并对该用户特征数据进行预处理:
ZB=np.dot(XB,wB)…………………………………(2)
其中,ZB表示对用户特征数据进行预处理后的处理值;XB表示第二用户特征数据,可以作为数据需求方中第一用户特征数据的补充内容,可以为数值型、字符型等,本发明中不做具体限定;wB表示参数,初始值为0;
其次,数据源方生成同态加密(满足可交换的法则)的密钥(pk,sk)B
最后,用该密钥pkB对该预处理后的处理值ZB进行加密得到第一加密数据值
Figure BDA0003686380460000091
并将该第一加密数据值发送至对应的数据需求方。
步骤S103:根据所述第一数据值和所述第一加密数据值计算得到对应的目标加密数据值。具体地,由于数据源方发送过来的加密后的
Figure BDA0003686380460000092
是在同态加密体系下的,因此,直接通过下式得到同态加密下的目标加密数据值:
Figure BDA0003686380460000093
步骤S104:利用预设基于联邦学习的纵向逻辑回归算法对所述目标加密数据值进行计算得到对应的第一密文预测值。具体地,基于联邦学习的纵向逻辑回归算法中激活函数因为其非线性的特点,在密文形式下无法进行计算,因此,通过预先处理得到可以在密文下进行计算操作的预设基于联邦学习的纵向逻辑回归算法,其中,本发明中对预先处理方法不做具体限定,只要处理结果满足计算需求即可。
最后,通过该最终得到的算法对该目标加密数据值进行计算得到对应的第一密文预测值:
Figure BDA0003686380460000094
其中,
Figure BDA0003686380460000095
表示第一密文预测值;sigmoid()表示预设基于联邦学习的纵向逻辑回归算法;
Figure BDA0003686380460000096
表示目标加密数据值。
步骤S105:根据所述第一密文预测值和目标标签变量计算得到用于纵向逻辑回归算法中梯度计算的第一密文数据值并对所述第一密文数据值进行计算得到对应的第一密文更新梯度值。具体地,根据该纵向逻辑回归算法,数据需求方利用该第一密文预测值和目标标签变量通过下式进行计算得到用于纵向逻辑回归算法中梯度计算的第一密文数据值:
Figure BDA0003686380460000103
其中,
Figure BDA0003686380460000104
表示第一密文数据值;Y表示目标标签变量,表示根据第一用户特征数据确定的用于评估标签的变量,取值为0(坏标签)或1(好标签)。
通过下式计算第一密文更新梯度值:
Figure BDA0003686380460000101
其中,
Figure BDA0003686380460000105
表示第一密文更新梯度值;m表示样本量;
Figure BDA0003686380460000102
表示对XA做转置处理。
步骤S106:对所述第一密文更新梯度值加盐处理后更新所述纵向逻辑回归算法中对应的第一梯度。具体地,第一密文更新梯度值用于纵向逻辑回归算法中梯度更新,步骤S105中得到的第一密文更新梯度值为一个加密数值,需要发送至数据源方进行解密,为了保证数据不被数据源方获取,对该第一密文更新梯度值进行加盐处理后利用处理结果更新所述纵向逻辑回归算法中对应的第一梯度。
步骤S107:当更新所述第一梯度后,根据预设第一同态密钥对所述第一密文数据值进行加密得到对应的第二加密数据值并将所述第二加密数据值发送至所述数据源方使得所述数据源方利用所述预设第一同态密钥对所述第二加密数据值进行解密。具体地,更新对应的梯度后,数据需求方生成一个属于自己的预设第一同态加密密钥(pk,sk)A,并用该密钥对第一密文数据值
Figure BDA0003686380460000106
进行二次加密得到第二加密数据值
Figure BDA0003686380460000107
然后将该第二加密数据值发送至数据源方,由于使用的同态加密方法是可交换的,所以数据源方可以对该第二加密数据值进行解密得到对应的解密值
Figure BDA0003686380460000108
其中,该
Figure BDA0003686380460000109
为单纯使用数据需求方的密钥加密后的结果。
本发明实施例提供的去第三方的隐私计算下纵向逻辑回归模型训练方法,利用了可交换的同态加密手段的方式,成功去除了“可信第三方”的要求,解决了第三方潜在的串谋风险所引起的安全性隐患等问题;参与计算的两方都是实际拥有数据的两方,可以更好的估计实施计算所需要的花费,避免了出现算力浪费等情况。因此,通过实时本发明,利用可交换的同态加密手段进行中间步骤的计算和数值的交换,降低了数据泄露的风险;利用加盐的手段也保证了中间步骤的***露性。
作为本发明实施例一种可选的实施方式,步骤S104,包括:利用预设多项式函数拟合纵向逻辑回归算法中的激活函数得到对应的预设基于联邦学习的纵向逻辑回归算法;利用所述预设基于联邦学习的纵向逻辑回归算法对所述目标加密数据值计算得到对应的第一密文预测值。
具体地,基于联邦学习的纵向逻辑回归算法中激活函数(sigmoid函数)是一个用于逻辑回归的非线性函数,在密文形式下无法进行计算。而密文上可以进行多项式级别的操作,因此,利用一个多项式函数F去拟合sigmoid函数,此时,公式(4)变为如下形式:
Figure BDA0003686380460000111
其中,e表示常数;a1,a2,a3表示加密前的系数。
作为本发明实施例一种可选的实施方式,步骤S106,包括:将所述第一密文更新梯度值和第一预设随机数进行组合后发送至所述数据源方以使所述数据源方对所述第一密文更新梯度值和第一预设随机数形成的组合进行解密得到对应的第一解密数据值;对所述第一解密数据值进行处理得到对应的第一梯度值并根据所述第一梯度值更新所述纵向逻辑回归算法中对应的第一梯度。
具体地,对该第一密文更新梯度值进行加盐处理:
Figure BDA0003686380460000112
其中r表示一个只有数据需求方知道的随机数,将该
Figure BDA0003686380460000121
发送至对应的数据源方进行解密得到dwA+r,然后,数据需求方接收到该dwA+r后,去除掉该随机数r,既可以得到对应的梯度值dwA,并同时利用该梯度值dwA更新纵向逻辑回归算法中对应的第一梯度wA
本发明实施例还提供一种去第三方的隐私计算下纵向逻辑回归模型训练方法,如图2所示,该方法包括如下步骤:
步骤S201:当获取到数据需求方发送的数据使用请求,对所述数据使用请求对应的第二用户特征数据进行预处理得到对应的第二数据值。具体的实施过程参考步骤S102中对第二用户特征数据进行预处理的过程,此处不再赘述。其中,第二数据值即为公式(2)中的ZB
步骤S202:根据预设第二同态密钥对所述第二数据值进行加密得到对应的第一加密数据值并将所述第一加密数据值发送至对应的数据需求方。具体的实施过程参考步骤S102中的加密过程,此处不再赘述。其中,预设第二同态密钥即为(pk,sk)B
步骤S203:接收所述数据需求方发送的第二加密数据值,所述第二加密数据值为所述数据需求方根据预设第一同态加密公钥对所述数据需求方中用于纵向逻辑回归算法中梯度计算的第一密文数据值进行加密得到,所述第一密文数据值为所述数据需求方对所述第一加密数据值进行处理得到。具体地,根据第一加密数据值得到第一密文数据值的过程参考步骤S103至步骤S105的实施过程;根据第一密文数据值得到第二加密数据值的过程参考步骤S107的加密过程;此处不再赘述。
步骤S204:利用所述预设第一同态密钥对所述第二加密数据值进行解密得到对应的第二解密数据值。具体的解密过程参考步骤S107中的解密过程,此处不再赘述。其中,步骤S107中得到的
Figure BDA0003686380460000122
即为第二解密数据值。
步骤S205:根据所述第二解密数据值和所述用户特征数据计算得到对应的第二密文更新梯度值并对所述第二密文更新梯度值加盐处理后更新所述纵向逻辑回归算法中对应的第二梯度。
具体地,参考公式(6),通过下式计算得到对应的第二密文更新梯度值:
Figure BDA0003686380460000131
其中,
Figure BDA0003686380460000133
表示第二密文更新梯度值;m表示样本量;
Figure BDA0003686380460000132
表示对XB做转置处理。
本发明实施例提供的去第三方的隐私计算下纵向逻辑回归模型训练方法,利用了可交换的同态加密手段的方式,成功去除了“可信第三方”的要求,解决了第三方潜在的串谋风险所引起的安全性隐患等问题;参与计算的两方都是实际拥有数据的两方,可以更好的估计实施计算所需要的花费,避免了出现算力浪费等情况。因此,通过实时本发明,利用可交换的同态加密手段进行中间步骤的计算和数值的交换,降低了数据泄露的风险。
作为本发明实施例一种可选的实施方式,步骤S205,包括:将所述第二密文更新梯度值和第二预设随机数进行组合后发送至所述数据需求方以使所述数据需求方对所述第二密文更新梯度值和第二预设随机数形成的组合进行解密得到对应的第三解密数据值;对所述第三解密数据值进行处理得到对应的第二梯度值并根据所述第二梯度值更新所述纵向逻辑回归算法中对应的第二梯度。
具体地,对该第二密文更新梯度值进行加盐处理:
Figure BDA0003686380460000134
其中r1表示一个只有数据源方知道的随机数,将该
Figure BDA0003686380460000135
发送至对应的数据需求方进行解密得到dwB+r1,然后,数据需求方接收到该dwB+r1后,去除掉该随机数r1,既可以得到对应的梯度值dwB,并同时利用该梯度值dwB更新纵向逻辑回归算法中对应的第二梯度wB。通过利用加盐的手段保证了中间步骤的***露性。
本发明实施例还提供一种去第三方的隐私计算下纵向逻辑回归模型训练装置,如图3所示,该装置包括:
第一获取模块301,用于获取隐私计算中的第一用户特征数据并根据所述第一用户特征数据计算得到对应的第一数据值;详细内容参见上述方法实施例中步骤S101的相关描述。
第一接收模块302,用于接收数据源方发送的第一加密数据值,所述第一加密数据值为所述数据源方根据数据需求方发起的数据使用请求,对所述数据使用请求对应的第二用户特征数据进行预处理并加密得到;详细内容参见上述方法实施例中步骤S102的相关描述。
第一计算模块303,用于根据所述第一数据值和所述第一加密数据值计算得到对应的目标加密数据值;详细内容参见上述方法实施例中步骤S103的相关描述。
第二计算模块304,用于利用预设基于联邦学习的纵向逻辑回归算法对所述目标加密数据值进行计算得到对应的第一密文预测值;详细内容参见上述方法实施例中步骤S104的相关描述。
第三计算模块305,用于根据所述第一密文预测值和目标标签变量计算得到用于纵向逻辑回归算法中梯度计算的第一密文数据值并对所述第一密文数据值进行计算得到对应的第一密文更新梯度值;详细内容参见上述方法实施例中步骤S105的相关描述。
第一处理模块306,用于对所述第一密文更新梯度值加盐处理后更新所述纵向逻辑回归算法中对应的第一梯度;详细内容参见上述方法实施例中步骤S106的相关描述。
第二处理模块307,用于当更新所述第一梯度后,根据预设第一同态密钥对所述第一密文数据值进行加密得到对应的第二加密数据值并将所述第二加密数据值发送至所述数据源方使得所述数据源方利用所述预设第一同态密钥对所述第二加密数据值进行解密;详细内容参见上述方法实施例中步骤S107的相关描述。
本发明实施例提供的去第三方的隐私计算下纵向逻辑回归模型训练装置,利用了可交换的同态加密手段的方式,成功去除了“可信第三方”的要求,解决了第三方潜在的串谋风险所引起的安全性隐患等问题;参与计算的两方都是实际拥有数据的两方,可以更好的估计实施计算所需要的花费,避免了出现算力浪费等情况。因此,通过实时本发明,利用可交换的同态加密手段进行中间步骤的计算和数值的交换,降低了数据泄露的风险;利用加盐的手段也保证了中间步骤的***露性。
作为本发明实施例一种可选的实施方式,所述第一处理模块包括:第一解密子模块,用于将所述第一密文更新梯度值和第一预设随机数进行组合后发送至所述数据源方以使所述数据源方对所述第一密文更新梯度值和第一预设随机数形成的组合进行解密得到对应的第一解密数据值;第一更新子模块,用于对所述第一解密数据值进行处理得到对应的第一梯度值并根据所述第一梯度值更新所述纵向逻辑回归算法中对应的第一梯度。
作为本发明实施例一种可选的实施方式,所述第二计算模块包括:拟合模块,用于利用预设多项式函数拟合纵向逻辑回归算法中的激活函数得到对应的预设基于联邦学习的纵向逻辑回归算法;第一计算子模块,用于利用所述预设基于联邦学习的纵向逻辑回归算法对所述目标加密数据值计算得到对应的第一密文预测值。
本发明实施例提供的去第三方的隐私计算下纵向逻辑回归模型训练装置的功能描述详细参见上述实施例中去第三方的隐私计算下纵向逻辑回归模型训练方法描述。
本发明实施例还提供一种去第三方的隐私计算下纵向逻辑回归模型训练装置,如图4所示,该装置包括:
第三处理模块401,用于当获取到数据需求方发送的数据使用请求,对所述数据使用请求对应的第二用户特征数据进行预处理得到对应的第二数据值;详细内容参见上述方法实施例中步骤S201的相关描述。
第一加密模块402,用于根据预设第二同态密钥对所述第二数据值进行加密得到对应的第一加密数据值并将所述第一加密数据值发送至对应的数据需求方;详细内容参见上述方法实施例中步骤S202的相关描述。
第二接收模块403,用于接收所述数据需求方发送的第二加密数据值,所述第二加密数据值为所述数据需求方根据预设第一同态加密公钥对所述数据需求方中用于纵向逻辑回归算法中梯度计算的第一密文数据值进行加密得到,所述第一密文数据值为所述数据需求方对所述第一加密数据值进行处理得到;详细内容参见上述方法实施例中步骤S203的相关描述。
第二解密模块404,用于利用所述预设第一同态密钥对所述第二加密数据值进行解密得到对应的第二解密数据值;详细内容参见上述方法实施例中步骤S204的相关描述。
更新模块405,用于根据所述第二解密数据值和所述用户特征数据计算得到对应的第二密文更新梯度值并对所述第二密文更新梯度值加盐处理后更新所述纵向逻辑回归算法中对应的第二梯度;详细内容参见上述方法实施例中步骤S205的相关描述。
本发明实施例提供的去第三方的隐私计算下纵向逻辑回归模型训练装置,利用了可交换的同态加密手段的方式,成功去除了“可信第三方”的要求,解决了第三方潜在的串谋风险所引起的安全性隐患等问题;参与计算的两方都是实际拥有数据的两方,可以更好的估计实施计算所需要的花费,避免了出现算力浪费等情况。因此,通过实时本发明,利用可交换的同态加密手段进行中间步骤的计算和数值的交换,降低了数据泄露的风险。
作为本发明实施例一种可选的实施方式,所述更新模块包括:第二解密子模块,用于将所述第二密文更新梯度值和第二预设随机数进行组合后发送至所述数据需求方以使所述数据需求方对所述第二密文更新梯度值和第二预设随机数形成的组合进行解密得到对应的第三解密数据值;第二更新子模块,用于对所述第三解密数据值进行处理得到对应的第二梯度值并根据所述第二梯度值更新所述纵向逻辑回归算法中对应的第二梯度。
本发明实施例提供的去第三方的隐私计算下纵向逻辑回归模型训练装置的功能描述详细参见上述实施例中去第三方的隐私计算下纵向逻辑回归模型训练方法描述。
本发明实施例还提供一种存储介质,如图5所示,其上存储有计算机程序501,该指令被处理器执行时实现上述实施例中去第三方的隐私计算下纵向逻辑回归模型训练方法的步骤。该存储介质上还存储有音视频流数据,特征帧数据、交互请求信令、加密数据以及预设数据大小等。其中,存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(Random Access Memory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(Random AccessMemory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
本发明实施例还提供了一种电子设备,如图6所示,该电子设备可以包括处理器61和存储器62,其中处理器61和存储器62可以通过总线或者其他方式连接,图6中以通过总线连接为例。
处理器61可以为中央处理器(Central Processing Unit,CPU)。处理器61还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器62作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本发明实施例中的对应的程序指令/模块。处理器61通过运行存储在存储器62中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及数据处理,即实现上述方法实施例中的去第三方的隐私计算下纵向逻辑回归模型训练方法。
存储器62可以包括存储程序区和存储数据区,其中,存储程序区可存储操作装置、至少一个功能所需要的应用程序;存储数据区可存储处理器61所创建的数据等。此外,存储器62可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器62可选包括相对于处理器61远程设置的存储器,这些远程存储器可以通过网络连接至处理器61。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述一个或者多个模块存储在所述存储器62中,当被所述处理器61执行时,执行如图1-2所示实施例中的去第三方的隐私计算下纵向逻辑回归模型训练方法。
上述电子设备具体细节可以对应参阅图1至图2所示的实施例中对应的相关描述和效果进行理解,此处不再赘述。
虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。

Claims (10)

1.一种去第三方的隐私计算下纵向逻辑回归模型训练方法,其特征在于,包括如下步骤:
获取隐私计算中的第一用户特征数据并根据所述第一用户特征数据计算得到对应的第一数据值;
接收数据源方发送的第一加密数据值,所述第一加密数据值为所述数据源方根据数据需求方发起的数据使用请求,对所述数据使用请求对应的第二用户特征数据进行预处理并加密得到;
根据所述第一数据值和所述第一加密数据值计算得到对应的目标加密数据值;
利用预设基于联邦学习的纵向逻辑回归算法对所述目标加密数据值进行计算得到对应的第一密文预测值;
根据所述第一密文预测值和目标标签变量计算得到用于纵向逻辑回归算法中梯度计算的第一密文数据值并对所述第一密文数据值进行计算得到对应的第一密文更新梯度值;
对所述第一密文更新梯度值加盐处理后更新所述纵向逻辑回归算法中对应的第一梯度;
当更新所述第一梯度后,根据预设第一同态密钥对所述第一密文数据值进行加密得到对应的第二加密数据值并将所述第二加密数据值发送至所述数据源方使得所述数据源方利用所述预设第一同态密钥对所述第二加密数据值进行解密。
2.根据权利要求1所述的方法,其特征在于,对所述第一密文更新梯度值加盐处理后更新所述纵向逻辑回归算法中对应的第一梯度,包括:
将所述第一密文更新梯度值和第一预设随机数进行组合后发送至所述数据源方以使所述数据源方对所述第一密文更新梯度值和第一预设随机数形成的组合进行解密得到对应的第一解密数据值;
对所述第一解密数据值进行处理得到对应的第一梯度值并根据所述第一梯度值更新所述纵向逻辑回归算法中对应的第一梯度。
3.根据权利要求1所述的方法,其特征在于,所述利用预设基于联邦学习的纵向逻辑回归算法对所述目标加密数据值进行计算得到对应的第一密文预测值,包括:
利用预设多项式函数拟合纵向逻辑回归算法中的激活函数得到对应的预设基于联邦学习的纵向逻辑回归算法;
利用所述预设基于联邦学习的纵向逻辑回归算法对所述目标加密数据值计算得到对应的第一密文预测值。
4.一种去第三方的隐私计算下纵向逻辑回归模型训练方法,其特征在于,包括如下步骤:
当获取到数据需求方发送的数据使用请求,对所述数据使用请求对应的第二用户特征数据进行预处理得到对应的第二数据值;
根据预设第二同态密钥对所述第二数据值进行加密得到对应的第一加密数据值并将所述第一加密数据值发送至对应的数据需求方;
接收所述数据需求方发送的第二加密数据值,所述第二加密数据值为所述数据需求方根据预设第一同态加密公钥对所述数据需求方中用于纵向逻辑回归算法中梯度计算的第一密文数据值进行加密得到,所述第一密文数据值为所述数据需求方对所述第一加密数据值进行处理得到;
利用所述预设第一同态密钥对所述第二加密数据值进行解密得到对应的第二解密数据值;
根据所述第二解密数据值和所述用户特征数据计算得到对应的第二密文更新梯度值并对所述第二密文更新梯度值加盐处理后更新所述纵向逻辑回归算法中对应的第二梯度。
5.根据权利要求4所述的方法,其特征在于,对所述第二密文更新梯度值加盐处理后更新所述纵向逻辑回归算法中对应的第二梯度,包括:
将所述第二密文更新梯度值和第二预设随机数进行组合后发送至所述数据需求方以使所述数据需求方对所述第二密文更新梯度值和第二预设随机数形成的组合进行解密得到对应的第三解密数据值;
对所述第三解密数据值进行处理得到对应的第二梯度值并根据所述第二梯度值更新所述纵向逻辑回归算法中对应的第二梯度。
6.一种去第三方的隐私计算下纵向逻辑回归模型训练装置,其特征在于,包括:
第一获取模块,用于获取隐私计算中的第一用户特征数据并根据所述第一用户特征数据计算得到对应的第一数据值;
第一接收模块,用于接收数据源方发送的第一加密数据值,所述第一加密数据值为所述数据源方根据数据需求方发起的数据使用请求,对所述数据使用请求对应的第二用户特征数据进行预处理并加密得到;
第一计算模块,用于根据所述第一数据值和所述第一加密数据值计算得到对应的目标加密数据值;
第二计算模块,用于利用预设基于联邦学习的纵向逻辑回归算法对所述目标加密数据值进行计算得到对应的第一密文预测值;
第三计算模块,用于根据所述第一密文预测值和目标标签变量计算得到用于纵向逻辑回归算法中梯度计算的第一密文数据值并对所述第一密文数据值进行计算得到对应的第一密文更新梯度值;
第一处理模块,用于对所述第一密文更新梯度值加盐处理后更新所述纵向逻辑回归算法中对应的第一梯度;
第二处理模块,用于当更新所述第一梯度后,根据预设第一同态密钥对所述第一密文数据值进行加密得到对应的第二加密数据值并将所述第二加密数据值发送至所述数据源方使得所述数据源方利用所述预设第一同态密钥对所述第二加密数据值进行解密。
7.根据权利要求6所述的装置,其特征在于,所述第一处理模块包括:
第一计算子模块,用于根据所述第一密文数据值计算得到对应的第一密文更新梯度值;
第一解密子模块,用于将所述第一密文更新梯度值和第一预设随机数进行组合后发送至所述数据源方以使所述数据源方对所述第一密文更新梯度值和第一预设随机数形成的组合进行解密得到对应的第一解密数据值;
第一更新子模块,用于对所述第一解密数据值进行处理得到对应的第一梯度值并根据所述第一梯度值更新所述纵向逻辑回归算法中对应的第一梯度。
8.一种去第三方的隐私计算下纵向逻辑回归模型训练装置,其特征在于,包括:
第三处理模块,用于当获取到数据需求方发送的数据使用请求,对所述数据使用请求对应的第二用户特征数据进行预处理得到对应的第二数据值;
第一加密模块,用于根据预设第二同态密钥对所述第二数据值进行加密得到对应的第一加密数据值并将所述第一加密数据值发送至对应的数据需求方;
第二接收模块,用于接收所述数据需求方发送的第二加密数据值,所述第二加密数据值为所述数据需求方根据预设第一同态加密公钥对所述数据需求方中用于纵向逻辑回归算法中梯度计算的第一密文数据值进行加密得到,所述第一密文数据值为所述数据需求方对所述第一加密数据值进行处理得到;
第二解密模块,用于利用所述预设第一同态密钥对所述第二加密数据值进行解密得到对应的第二解密数据值;
更新模块,用于根据所述第二解密数据值和所述用户特征数据计算得到对应的第二密文更新梯度值并对所述第二密文更新梯度值加盐处理后更新所述纵向逻辑回归算法中对应的第二梯度。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行如权利要求1-5任一项所述的去第三方的隐私计算下纵向逻辑回归模型训练方法。
10.一种电子设备,其特征在于,包括:存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行如权利要求1-5任一项所述的去第三方的隐私计算下纵向逻辑回归模型训练方法。
CN202210650114.5A 2022-06-09 2022-06-09 一种去第三方的隐私计算下纵向逻辑回归模型训练方法 Pending CN115130121A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210650114.5A CN115130121A (zh) 2022-06-09 2022-06-09 一种去第三方的隐私计算下纵向逻辑回归模型训练方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210650114.5A CN115130121A (zh) 2022-06-09 2022-06-09 一种去第三方的隐私计算下纵向逻辑回归模型训练方法

Publications (1)

Publication Number Publication Date
CN115130121A true CN115130121A (zh) 2022-09-30

Family

ID=83378310

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210650114.5A Pending CN115130121A (zh) 2022-06-09 2022-06-09 一种去第三方的隐私计算下纵向逻辑回归模型训练方法

Country Status (1)

Country Link
CN (1) CN115130121A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115292739A (zh) * 2022-10-08 2022-11-04 江苏浚荣升新材料科技有限公司 一种金属模具设计***的数据管理方法
CN115580496A (zh) * 2022-12-09 2023-01-06 北京融数联智科技有限公司 无需第三方的隐私计算下逻辑回归训练方法、***及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115292739A (zh) * 2022-10-08 2022-11-04 江苏浚荣升新材料科技有限公司 一种金属模具设计***的数据管理方法
CN115580496A (zh) * 2022-12-09 2023-01-06 北京融数联智科技有限公司 无需第三方的隐私计算下逻辑回归训练方法、***及装置

Similar Documents

Publication Publication Date Title
CN110399742B (zh) 一种联邦迁移学习模型的训练、预测方法及装置
CN110189192B (zh) 一种信息推荐模型的生成方法及装置
US20210248244A1 (en) Model parameter training method, terminal, and system based on federation learning, and medium
Shankar et al. Adaptive optimal multi key based encryption for digital image security
WO2020248538A1 (zh) 基于联邦学习的模型参数训练方法及装置
CN112347495B (zh) 一种基于区块链的可信隐私智能服务计算***及方法
CN111898145B (zh) 一种神经网络模型训练方法、装置、设备及介质
CN115130121A (zh) 一种去第三方的隐私计算下纵向逻辑回归模型训练方法
WO2020248537A1 (zh) 基于联邦学习的模型参数的确定方法及装置
CN113836556B (zh) 面向联邦学习的去中心化函数加密隐私保护方法及***
CN112182644A (zh) 一种数据处理方法、装置和电子设备
TW201448551A (zh) 使用部份同態之加密及遮罩之隱私保護脊狀回歸
CN114696990B (zh) 基于全同态加密的多方计算方法、***及相关设备
CN111104968B (zh) 一种基于区块链的安全svm训练方法
CN113221153B (zh) 图神经网络训练方法、装置、计算设备及存储介质
CN111027981A (zh) 多方联合训练针对IoT机具的风险评估模型的方法及装置
CN112818369A (zh) 一种联合建模方法及装置
CN114301677B (zh) 秘钥协商方法、装置、电子设备及存储介质
CN113472805B (zh) 模型训练方法及装置、存储介质及电子设备
CN113055153B (zh) 一种基于全同态加密算法的数据加密方法、***和介质
CN113420886A (zh) 纵向联邦学习模型的训练方法、装置、设备及存储介质
CN117150539A (zh) 基于联邦学习的样本评估方法及其装置、电子设备
CN115021985B (zh) 一种无需第三方参与的逻辑回归模型训练方法及***
CN115580443A (zh) 一种图数据的处理方法、装置、设备和介质
CN113537516B (zh) 分布式机器学习模型的训练方法、装置、设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination