CN115481440B - 数据处理方法、装置、电子设备和介质 - Google Patents
数据处理方法、装置、电子设备和介质 Download PDFInfo
- Publication number
- CN115481440B CN115481440B CN202211166018.XA CN202211166018A CN115481440B CN 115481440 B CN115481440 B CN 115481440B CN 202211166018 A CN202211166018 A CN 202211166018A CN 115481440 B CN115481440 B CN 115481440B
- Authority
- CN
- China
- Prior art keywords
- data
- identifier
- bucket
- block
- data set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 30
- 238000000034 method Methods 0.000 claims abstract description 64
- 238000012545 processing Methods 0.000 claims abstract description 33
- 230000006870 function Effects 0.000 claims description 35
- 238000004364 calculation method Methods 0.000 claims description 22
- 238000004590 computer program Methods 0.000 claims description 3
- 238000000638 solvent extraction Methods 0.000 claims description 2
- 239000003999 initiator Substances 0.000 description 14
- 230000008569 process Effects 0.000 description 12
- 238000004891 communication Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 230000008901 benefit Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 230000001965 increasing effect Effects 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/602—Providing cryptographic facilities or services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Bioethics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开实施例提供了一种数据处理方法、装置、电子设备和介质,涉及数据安全技术领域。该方法包括:对第一数据集合中的第一数据进行计算,确定第一数据对应的第一桶标识和第一块标识;第一桶标识用于标记存储第一数据的目标桶,第一块标识用于标记目标桶内存储第一数据的目标块;接收第二参与方发送的第二桶标识和第二块标识,第二桶标识和第二块标识是对第二数据集合中的第二数据进行计算得到的;比对第一桶标识和第二桶标识、第一块标识和第二块标识,确定两个数据集合中不相交的数据。本公开实施例利用桶标识和块标识联合表示数据,桶标识和块标识作为数据的唯一表示,利用其可以在保证数据安全性的同时快速筛选数据,计算量小,节省了资源。
Description
技术领域
本公开涉及数据安全技术领域,具体而言,涉及一种数据处理方法、装置、电子设备和介质。
背景技术
在保证数据安全的前提下,数据孤岛现象随之出现,联邦学习作为目前主流的技术手段,将“孤岛”联盟起来,联合多家数据进行数据训练与建模。
在其过程中,隐私集合求交(Private Set Intersection,PSI)成为了一个必要的过程,也就是在不暴露各自数据的条件下,找到双方共有的样本成为了一个必要的过程。例如两方机构分别是当地的运营商与银行,用户交集较大,符合纵向联邦学***衡PSI,当前的非平衡PSI方案性能相比平衡PSI性能优势不是十分明显,因此考虑一种方法,进一步降低非平衡PSI情况下计算开销,提高性能,尽量将计算量交给数据量较大的一方。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开实施例提供一种数据处理方法、装置、电子设备和计算机可读存储介质,能够。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开的一个方面,提供一种数据处理方法,该方法应用于纵向联邦学习的第一参与方,所述第一参与方的第一数据集合大于所述纵向联邦学习的第二参与方的第二数据集合;所述数据处理方法包括:
基于预设的函数对所述第一数据集合中的每一第一数据进行计算,确定所述第一数据对应的第一桶标识和第一块标识;所述第一桶标识用于标记存储所述第一数据的目标桶,所述目标桶内包括多个块,所述第一块标识用于标记所述目标桶内存储所述第一数据的目标块;
接收所述第二参与方发送的第二桶标识和第二块标识,所述第二桶标识和所述第二块标识是所述第二参与方基于所述预设的函数对所述第二数据集合中的每一第二数据进行计算得到的;
比对所述第一桶标识和所述第二桶标识、所述第一块标识和所述第二块标识,确定所述第一数据集合与所述第二数据集合中不相交的数据。
在本公开的一些实施例中,比对所述第一桶标识和所述第二桶标识、所述第一块标识和所述第二块标识,确定所述第一数据集合与所述第二数据集合中不相交的数据,包括:比对所述第一桶标识和所述第二桶标识、所述第一块标识和所述第二块标识,确定相同的桶标识和相同的块标识;将所述相同的桶标识作为目标桶标识、所述相同的块标识作为目标块标识,所述目标桶标识和所述目标块标识指示的数据作为所述第一数据集合与所述第二数据集合中共有的数据,所述第一数据集合中除所述共有的数据之外的数据以及所述第二数据集合中除所述共有的数据之外的数据为所述第一数据集合与所述第二数据集合中不相交的数据;向所述第二参与方发送所述目标桶标识和所述目标块标识,以使所述第二参与方基于所述目标桶标识和所述目标块标识对应的数据与所述第一参与方进行隐私求交加密处理。
在本公开的一些实施例中,所述对所述第一数据集合中的每一第一数据进行计算,包括:对所述第一数据集合中的第一数据并行进行计算。
在本公开的一些实施例中,并行对所述第一数据集合中的第一数据进行计算,包括:根据单指令流多数据流方法,对所述第一数据集合中的第一数据并行进行计算。
在本公开的一些实施例中,所述对所述第一数据集合中的第一数据并行进行计算,包括:对所述第一数据集合进行分割,得到多个子数据集;同时对所述多个子数据集中的第一数据并行进行计算。
在本公开的一些实施例中,所述对所述第一数据集合进行分割,得到多个子数据集,包括:基于所述第二数据集合,对所述第一数据集合进行分割,得到多个子数据集。
在本公开的一些实施例中,所述比对所述第一桶标识和所述第二桶标识、所述第一块标识和所述第二块标识,包括:根据单指令流多数据流方法,并行比对所述第一桶标识和所述第二桶标识、所述第一块标识和所述第二块标识。
根据本公开的另一个方面,提供了一种数据处理方法,所述方法应用于纵向联邦学习的第二参与方,所述第二参与方的第二数据集合小于所述纵向联邦学习的第一参与方的第一数据集合;所述数据处理方法包括:
基于预设的函数对所述第二数据集合中的每一第二数据进行计算,确定所述第二数据对应的第二桶标识和第二块标识;所述第二桶标识用于标记存储所述第二数据的目标桶,所述目标桶内包括多个块,所述第二块标识用于标记所述目标桶内存储所述第二数据的目标块;
将所述第二桶标识和所述第二块标识发送至所述第一参与方;
接收所述第一参与方发送的目标桶标识和目标块标识;所述目标桶标识是所述第二桶标识和第一桶标识中相同的桶标识,所述目标块标识是所述第二块标识和第一块标识中相同的块标识,所述第一桶标识和所述第一块标识是所述第一参与方基于预设的函数对所述第一数据集合中的每一第一数据进行计算得到的。
在本公开的一些实施例中,所述对所述第二数据集合中的每一第二数据进行计算,包括:对所述第二数据集合中的第二数据并行进行计算。
在本公开的一些实施例中,所述对所述第二数据集合中的第二数据并行进行计算,包括:根据单指令流多数据流方法,对所述第二数据集合中的第二数据并行进行计算。
根据本公开的又一个方面,提供了一种数据处理装置,该装置应用于纵向联邦学习的第一参与方,所述第一参与方的第一数据集合大于所述纵向联邦学习的第二参与方的第二数据集合;所述数据处理装置包括:
第一计算模块,用于基于预设的函数对所述第一数据集合中的每一第一数据进行计算,确定所述第一数据对应的第一桶标识和第一块标识;所述第一桶标识用于标记存储所述第一数据的目标桶,所述目标桶内包括多个块,所述第一块标识用于标记所述目标桶内存储所述第一数据的目标块;
第一接收模块,用于接收所述第二参与方发送的第二桶标识和第二块标识,所述第二桶标识和所述第二块标识是所述第二参与方基于所述预设的函数对所述第二数据集合中的每一第二数据进行计算得到的;
比对模块,用于比对所述第一桶标识和所述第二桶标识、所述第一块标识和所述第二块标识,确定所述第一数据集合与所述第二数据集合中不相交的数据。
在本公开的一些实施例中,所述比对模块还用于:比对所述第一桶标识和所述第二桶标识、所述第一块标识和所述第二块标识,确定相同的桶标识和相同的块标识;将所述相同的桶标识作为目标桶标识、所述相同的块标识作为目标块标识,所述目标桶标识和所述目标块标识指示的数据作为所述第一数据集合与所述第二数据集合中共有的数据,所述第一数据集合中除所述共有的数据之外的数据以及所述第二数据集合中除所述共有的数据之外的数据为所述第一数据集合与所述第二数据集合中不相交的数据;向所述第二参与方发送所述目标桶标识和所述目标块标识,以使所述第二参与方基于所述共有的数据与所述第一参与方进行隐私求交加密处理。
在本公开的一些实施例中,所述第一计算模块还用于:对所述第一数据集合中的第一数据并行进行计算。
在本公开的一些实施例中,所述第一计算模块还用于:根据单指令流多数据流方法,对所述第一数据集合中的第一数据并行进行计算。
在本公开的一些实施例中,所述第一计算模块还用于:对所述第一数据集合进行分割,得到多个子数据集;同时对所述多个子数据集中的第一数据并行进行计算。
在本公开的一些实施例中,所述第一计算模块还用于:基于所述第二数据集合,对所述第一数据集合进行分割,得到多个子数据集。
在本公开的一些实施例中,所述比对模块还用于:根据单指令流多数据流方法,并行比对所述第一桶标识和所述第二桶标识、所述第一块标识和所述第二块标识。
根据本公开的又一个方面,提供了一种数据处理装置,所述装置应用于纵向联邦学习的第二参与方,所述第二参与方的第二数据集合小于所述纵向联邦学习的第一参与方的第一数据集合;所述数据处理装置包括:
第二计算模块,用于基于预设的函数对所述第二数据集合中的每一第二数据进行计算,确定所述第二数据对应的第二桶标识和第二块标识;所述第二桶标识用于标记存储所述第二数据的目标桶,所述目标桶内包括多个块,所述第二块标识用于标记所述目标桶内存储所述第二数据的目标块;
发送模块,用于将所述第二桶标识和所述第二块标识发送至所述第一参与方;
第二接收模块,用于接收所述第一参与方发送的目标桶标识和目标块标识;所述目标桶标识是所述第二桶标识和第一桶标识中相同的桶标识,所述目标块标识是所述第二块标识和第一块标识中相同的块标识,所述第一桶标识和所述第一块标识是所述第一参与方基于预设的函数对所述第一数据集合中的每一第一数据进行计算得到的。
在本公开的一些实施例中,所述第二计算模块还用于:对所述第二数据集合中的第二数据并行进行计算。
在本公开的一些实施例中,所述第二计算模块还用于:根据单指令流多数据流方法,对所述第二数据集合中的第二数据并行进行计算。
根据本公开的又一个方面,提供一种电子设备,包括:一个或多个处理器;存储装置,配置为存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述实施例中所述的方法。
根据本公开的又一个方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述实施例中所述的方法。
本公开实施例提供的数据处理方法,通过对第一数据集合中的第一数据进行计算,确定第一数据对应的第一桶标识和第一块标识;第一桶标识用于标记存储第一数据的目标桶,第一块标识用于标记目标桶内存储第一数据的目标块,即通过第一桶标识和第一块标识联合表示数据的存储位置,第一桶标识和第一块标识可以唯一指定第一数据;接收第二参与方发送的第二桶标识和第二块标识,第二桶标识和第二块标识是对第二数据集合中的第二数据进行计算得到的;比对第一桶标识和第二桶标识、第一块标识和第二块标识,确定第一数据集合与第二数据集合中不相交的数据的技术方案,在保证数据安全性的同时快速筛选数据,计算量小,通信量小,节省了资源。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1示出了相关技术中进行隐私集合求交过程的流程图;
图2示出了本公开一实施例的数据处理方法的流程图;
图3示出了本公开一实施例的数据处理方法中的桶块的示意图;
图4示出了本公开另一实施例的数据处理方法的流程图;
图5示出了本公开另一实施例的数据处理方法的流程图;
图6示出了本公开实施例的数据处理装置的结构示意图;
图7示出了本公开实施例的数据处理装置的结构示意图;
图8示出了本公开实施例中一种电子设备的结构框图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。
此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
为使本公开的技术方案更加清楚,下面对相关技术中进行纵向联邦学习的过程进行描述。
如图1所示,第一终端和第二终端是进行纵向联邦学习的两方,纵向联邦学习的主要流程包括:
步骤S101:第一终端对原始数据进行哈希,得到哈希表1;
步骤S102:第二终端对原始数据进行哈希,得到哈希表2。
步骤S103:第二终端向第一终端发起求交请求以及哈希表2。
步骤S104:第一终端求哈希表1与哈希表2的交集为哈希表3。
步骤S105:第一终端根据哈希表3确定数据,并进行私钥加密获得第一密文。
步骤S106:第一终端向第二终端发送公钥。
步骤S107:第二终端使用公钥对己方数据进行加密,获得第二密文。
步骤S108:第二终端向第一终端发送第二密文。
步骤S109:第一终端使用私钥加密第二密文,得到第三密文。
步骤S110:第一终端向第二终端发送第一密文和第三密文。
步骤S111:第二终端对第一密文与第三密文进行求交计算,获得密文求交结果,得到双方的数据交集。
在上述过程中,直接将元数据进行哈希后形成哈希表发送给对方,是一种安全性很差的方式,可以通过哈希碰撞推断出对方的部分数据,造成对方的数据隐私泄露,不符合PSI隐私求交协议的要求,而且进行的数据筛选过程只是去除了数据较小方的数据,数据量较大方没有筛减数据,依旧需要全部数据计算密文,计算开销依旧较大;数据量较大方的数据全部计算密文后发送给数据较小一方,通信开销较大,而且数据较小方要用私钥再全部加密,计算量较大,即第一终端需要计算两次加密以及密文传输,计算开销与通信开销都较大。
为解决上述技术问题,本公开实施例提供了一种数据处理方法,该方法可以在保证数据安全的同时,以极小的计算开销、通信开销筛选出两个数据集合中一定不相交的数据。
图2示出了本公开实施例的一种数据处理方法的流程图。该方法应用于纵向联邦学习的第一参与方,所述第一参与方的第一数据集合大于所述纵向联邦学习的第二参与方的第二数据集合;
如图2所示,该数据处理方法包括:
步骤S201:基于预设的函数,对第一数据集合中的每一第一数据进行计算,确定第一数据对应的第一桶标识和第一块标识,第一桶标识用于标记存储第一数据的目标桶,目标桶内包括多个块,第一块标识用于标记目标桶内存储第一数据的目标块。
在本实施例中,如图3所述,桶和块是用于存储数据的,每个桶内设置有多个块,块内可以设置有多个槽(slot)。桶和块可以确定数据的存储位置。本步骤通过预设的函数对第一数据进行计算,确定该第一数据对应的桶和块,即确定该第一数据的存储位置。其中,预设的函数可以是两个哈希函数,利用这两个哈希函数对第一数据进行计算,得到两个哈希码。其中一个哈希码作为桶标识(例如桶号),另一个哈希码作为块标识(例如块号)。桶标识用于标记存储该第一数据的目标桶,块标识用于标记该目标桶中存储第一数据的目标块。
在可选的实施例中,基于预设的函数对第一数据集合中的第一数据进行计算,可以是计算第一数据集合中的元数据,也可以是计算元数据加密后的加密数据。
步骤S202:接收第二参与方发送的第二桶标识和第二块标识,第二桶标识和第二块标识是第二参与方基于预设的函数对第二数据集合中的每一第二数据进行计算得到的。
在本实施例中,第一参与方可以将预设的函数发送至第二参与方。第二参与方根据该预设的函数对第二数据集合中的每一第二数据进行计算,得到第二数据对应的桶标识和块标识。
步骤S203:比对第一桶标识和第二桶标识、第一块标识和第二块标识,确定第一数据集合与第二数据集合中不相交的数据。
在本步骤中,可以先比对桶标识,在桶标识相同的情况下比较块标识。即先比较第一桶标识和第二桶标识,确定相同的桶标识,然后比对第一块标识和第二块标识,确定相同的块标识;将相同的桶标识作为目标桶标识、相同的块标识作为目标块标识,目标桶标识和目标块标识指示的数据为第一数据集合与第二数据集合中共有的数据,第一数据集合中除共有的数据之外的数据以及第二数据集合中除共有的数据之外的数据为第一数据集合与第二数据集合中不相交的数据。
本发明实施例的数据处理方法,通过对第一数据集合中的第一数据进行计算,确定第一数据对应的第一桶标识和第一块标识;第一桶标识用于标记存储第一数据的目标桶,第一块标识用于标记目标桶内存储第一数据的目标块,即通过第一桶标识和第一块标识联合表示数据的存储位置,第一桶标识和第一块标识可以唯一指定第一数据;接收第二参与方发送的第二桶标识和第二块标识,第二桶标识和第二块标识是对第二数据集合中的第二数据进行计算得到的;比对第一桶标识和第二桶标识、第一块标识和第二块标识,确定两个数据集合中一定不相交的数据的技术方案,在保证数据安全性的同时快速筛选数据,计算量小,通信量小,节省了资源。
在本公开的一些实施例中,在确定目标桶标识和目标块标识之后,该方法还可以包括:向第二参与方发送目标桶标识和目标块标识,以使第二参与方基于共有的数据与第一参与方进行隐私求交加密处理。在本实施例中,第一参与方将目标桶标识和目标块标识发送至第二参与方,双方基于共有的数据进行隐私求交加密处理,可以提前筛除部分一定不相交的数据,从而在保证PSI安全求交的条件下,尽可能减少计算量,而且双方根据目标桶标识和目标块标识保留所需要进行求交的数据,之后只需要一方发起计算求交,将求交结果发送给另一方即可,相比于现有技术,本实施例只需要一方计算交集,只需进行己方数据筛除后的求交过程所需的加密计算,减少了另一方的计算量。
在本公开的一些实施例中,在对第一数据集合中的第一数据进行计算时,可以对第一数据集合中的第一数据并行进行计算,从而提高计算效率。作为具体的示例,在对第一数据集合中的第一数据并行进行计算时,可以根据单指令流多数据流方法,对所述第一数据集合中的第一数据并行进行计算。其中,单指令流多数据流方法(Single InstructionMultiple Data,SIMD)是一种采用一个控制器来控制多个处理器,同时对一组数据(又称“数据矢量”)中的每一个分别执行相同的操作从而实现空间上的并行性的技术。即本实施例中,利用单指令流多数据流方法同时对第一数据集合中的多个第一数据进行计算,得到该多个第一数据对应的第一桶标识和第一块标识。
同样地,第二参与方对第二数据集合中的第二数据进行计算时,也可以对第二数据集合中的第二数据并行进行计算。进一步的,第二参与方也可以根据单指令流多数据流方法,对所述第二数据集合中的第二数据并行进行计算。
在本公开的一些实施例中,在对所述第一数据集合中的第一数据并行进行计算时,该方法还可以包括:
对第一数据集合进行分割,得到多个子数据集;
同时对多个子数据集中的第一数据并行进行计算。
为了进一步的提高计算效率,可以对数据量较大的第一数据集合进行分割,然后同时对分割得到的子数据集进行并行计算。例如,将第一数据集合分割成5个子数据集,同时利用单指令流多数据流方法对5个子数据集中的第一数据进行并行计算。
在本公开可选的实施例中,在对第一数据集进行分割时,可以基于第二数据集合,对第一数据集合进行分割,得到多个子数据集,使得该子数据集中的数据量等于或小于第二数据集合。即,可以根据下式对第一数据集合进行分割:
其中,k表示子数据集的个数,|N|表示第一数据集合的数据量,|M|表示第二数据集合的数据量。此时,第一数据集合分割为k个子数据集,前(k-1)个子数据集的数据量为|M|,最后一个子数据集的数据量小于或等于|M|。
在本公开的一些实施例中,在比对第一桶标识和第二桶标识、第一块标识和第二块标识时,也可以利用根据单指令流多数据流方法,比对第一桶标识和第二桶标识、第一块标识和第二块标识,从而加快比对速度。
图4示出了本公开另一实施例的数据处理方法的流程图。该数据处理方法可以应用于纵向联邦学习的第二参与方,第二参与方的第二数据集合小于纵向联邦学习的第一参与方的第一数据集合。
如图4所示,该数据处理方法包括:
步骤S401:基于预设的函数对第二数据集合中的每一第二数据进行计算,确定第二数据对应的第二桶标识和第二块标识;第二桶标识用于标记存储第二数据的目标桶,目标桶内包括多个块,第二块标识用于标记目标桶内存储第二数据的目标块。第二参与方计算第二数据对应的第二桶标识和第二块标识的过程,可以参考第一参与方计算第一数据对应的第一桶标识和第一块标识的过程,本公开在此不再赘述。
步骤S402:将第二桶标识和第二块标识发送至第一参与方。
步骤S403:接收第一参与方发送的目标桶标识和目标块标识;目标桶标识是第二桶标识和第一桶标识中相同的桶标识,目标块标识是第二块标识和第一块标识中相同的块标识,第一桶标识和第一块标识是第一参与方基于预设的函数对第一数据集合中的每一第一数据进行计算得到的。
第二参与方接收到第一参与方发送的目标桶标识和目标块标识,根据该目标桶标识和目标块标识,可以筛除双方不相交的数据,确定两者共有的数据。
本公开实施例的数据处理方法,第二参与方只需要将第二桶标识和第二块标识发送至第一参与方,并接收第一参与方发送的目标桶标识和目标块标识即可筛除双方不相交的数据,确定两者共有的数据,既保证了数据的安全性,由以极小的计算开销、通信开销筛除了双方不相交的数据。
为使本发明实施例的数据处理方法更加清楚,下面从整体角度对该数据处理方法进行描述。
在本实施例中,参与纵向联邦学习的有两个参与方,将数据集合较大的一方称为发起求交请求的一方,即发起方(即第一参与方),数据集合较小的一方称为接收方(即第二参与方)。发起方的数据量为|N|,接收方的数据量为|M|,满足|N|>>|M|。
如图5所示,该数据处理方法包括:
步骤S501:发起方基于第二数据集合,对第一数据集合进行分割,获得多个子数据集。
由于发起方的数据量远远大于接收方,于是将发起方的第一数据集合DA进行分割处理,个数设为k,
此时DA分为k个部分,每个部分长度为|M|,最后一个部分长度小于等于|M|。
步骤S502:发起方基于预设的函数对第一数据集合中的每一第一数据进行计算,确定第一数据对应的第一桶标识和第一块标识;第一桶标识用于标记存储第一数据的目标桶,目标桶内包括多个块,第一块标识用于标记目标桶内存储第一数据的目标块。
在本实施例中,可以预先设置一个存储空间,将该存储空间划分为多个用于存储数据的桶,每个桶内划分为多个块,每个块内划分为多个槽(slot),一个槽用于存放一个数据。每个桶都具备唯一的桶标识,桶内的每个块都具备不同的块标识。其中,块内是否有数据,可以利用预设的元素标识来指示,例如,利用true(1)指示块内有数据,false(0)指示块内没有数据。
发起方可以设置一个哈希函数,将分割出的数据进行哈希计算,对/>的每一个第一数据/>进行哈希,计算出两个哈希码,分别为/>与/>其中/>用来确定是哪个桶,/>用于标记为桶中哪个哈希块。
将第一桶标识、第一块标识和对应的元素标识以下述形式记录在信息表T1中:
步骤S503:发起方将预设值的哈希函数发送至接收方。
步骤S504:接收方根据该哈希函数,对第二数据集合DB中的每一第二数据dB进行计算,确定第二数据对应的第二桶标识和第二块标识/>第二桶标识用于标记存储第二数据的目标桶,目标桶内包括多个块,第二块标识用于标记目标桶内存储第二数据的目标块。
将第一桶标识、第一块标识和对应的元素标识以下述形式记录在信息表T2中:
步骤S505:接收方将信息表T2发送至发起方。
步骤S506:发起方比对信息表T1与信息表T2,确定两方共有的数据。
发起方首先比对桶标识,当桶标识相同时,比对块标识,块标识相同/>时,只要有一方的z=0,那么这个块中元素直接跳过比对,并对块中元素进行筛除。在比较过程中,可以使用单指令流多数据流方法并行比较桶号与块号,如果不同就对比下一个块,以加快比对速度。
步骤S507:发起方记录目标桶标识和目标块标识,并将目标桶标识和目标块标识发送给接收方。双方根据所保留的桶内块内元素,进行后续的求交计算。
步骤S508:求交结果得到后,发起方将最后的计算结果发送给参与方,整个隐私求交过程结束。
在步骤S502、S504、S506中都可以利用单指令流多数据流方法进行并行处理,以提高效率。
本公开实施例的数据处理方法,在参与纵向联邦学习的其中一方的数据量远大于另一方的情况下,在隐私求交之前,利用桶标识和块标识筛选部分一定不相交的数据,可以有效的减少数据量;在利用桶标识和块标识筛除部分一定不相交的数据时,传输的是包括桶标识和块标识以及元素标识的信息表,而不是直接传输哈希表,通信开销极低,又保证了数据安全性;双方根据信息表保留所需要进行求交的数据之后只需发起方计算交集,并将交集结果发送给接收方即可,相对比已有技术,本实施例接收方不需要计算交集,只需进行己方数据筛除后的求交过程所需的加密计算,减少了接收方的计算量。
图6示出了本公开实施例的数据处理装置600的结构示意图。该数据处理装置600应用于纵向联邦学习的第一参与方,所述第一参与方的第一数据集合大于所述纵向联邦学习的第二参与方的第二数据集合。该数据处理装置600包括:
第一计算模块601,用于基于预设的函数对所述第一数据集合中的每一第一数据进行计算,确定所述第一数据对应的第一桶标识和第一块标识;所述第一桶标识用于标记存储所述第一数据的目标桶,所述目标桶内包括多个块,所述第一块标识用于标记所述目标桶内存储所述第一数据的目标块;
第一接收模块602,用于接收所述第二参与方发送的第二桶标识和第二块标识,所述第二桶标识和所述第二块标识是所述第二参与方基于所述预设的函数对所述第二数据集合中的每一第二数据进行计算得到的;
比对模块603,用于比对所述第一桶标识和所述第二桶标识、所述第一块标识和所述第二块标识,确定所述第一数据集合与所述第二数据集合中不相交的数据。
在本公开的一些实施例中,所述比对模块还用于:比对所述第一桶标识和所述第二桶标识、所述第一块标识和所述第二块标识,确定相同的桶标识和相同的块标识;将所述相同的桶标识作为目标桶标识、所述相同的块标识作为目标块标识,所述目标桶标识和所述目标块标识指示的数据作为所述第一数据集合与所述第二数据集合中共有的数据,所述第一数据集合中除所述共有的数据之外的数据以及所述第二数据集合中除所述共有的数据之外的数据为所述第一数据集合与所述第二数据集合中不相交的数据,向所述第二参与方发送所述目标桶标识和所述目标块标识,以使所述第二参与方基于所述目标桶标识和所述目标块标识对应的数据与所述第一参与方进行隐私求交加密处理。
在本公开的一些实施例中,所述第一计算模块还用于:对所述第一数据集合中的第一数据并行进行计算。
在本公开的一些实施例中,所述第一计算模块还用于:根据单指令流多数据流方法,对所述第一数据集合中的第一数据并行进行计算。
在本公开的一些实施例中,所述第一计算模块还用于:对所述第一数据集合进行分割,得到多个子数据集;同时对所述多个子数据集中的第一数据并行进行计算。
在本公开的一些实施例中,所述第一计算模块还用于:基于所述第二数据集合,对所述第一数据集合进行分割,得到多个子数据集。
在本公开的一些实施例中,所述比对模块还用于:根据单指令流多数据流方法,比对所述第一桶标识和所述第二桶标识、所述第一块标识和所述第二块标识。
图7示出了本公开实施例的数据处理装置700的结构示意图。该数据处理装置700应用于纵向联邦学习的第二参与方,所述第二参与方的第二数据集合小于所述纵向联邦学习的第一参与方的第一数据集合;所述数据处理装置包括:
第二计算模块701,用于基于预设的函数对所述第二数据集合中的每一第二数据进行计算,确定所述第二数据对应的第二桶标识和第二块标识;所述第二桶标识用于标记存储所述第二数据的目标桶,所述目标桶内包括多个块,所述第二块标识用于标记所述目标桶内存储所述第二数据的目标块;
发送模块702,用于将所述第二桶标识和所述第二块标识发送至所述第一参与方;
第二接收模块703,用于接收所述第一参与方发送的目标桶标识和目标块标识;所述目标桶标识是所述第二桶标识和第一桶标识中相同的桶标识,所述目标块标识是所述第二块标识和第一块标识中相同的块标识,所述第一桶标识和所述第一块标识是所述第一参与方基于预设的函数对所述第一数据集合中的每一第一数据进行计算得到的。
在本公开的一些实施例中,所述第二计算模块还用于:对所述第二数据集合中的第二数据并行进行计算。
在本公开的一些实施例中,所述第二计算模块还用于:根据单指令流多数据流方法,对所述第二数据集合中的第二数据并行进行计算。
上述装置可执行本发明实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明实施例所提供的方法。
图8示出了本公开实施例中一种电子设备的结构框图。下面参照图8来描述根据本发明的这种实施方式的电子设备800。图8显示的电子设备800仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图8所示,电子设备800以通用计算设备的形式表现。电子设备800的组件可以包括但不限于:上述至少一个处理单元810、上述至少一个存储单元820、连接不同***组件(包括存储单元820和处理单元810)的总线830、显示单元840。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元810执行,使得所述处理单元810执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。
存储单元820可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)821和/或高速缓存存储单元822,还可以进一步包括只读存储单元(ROM)823。
存储单元820还可以包括具有一组(至少一个)程序模块825的程序/实用工具824,这样的程序模块825包括但不限于:操作***、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线830可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、***总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备800也可以与一个或多个外部设备870(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备800交互的设备通信,和/或与使得该电子设备800能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口850进行。并且,电子设备800还可以通过网络适配器860与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器860通过总线830与电子设备800的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备800使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储***等。
在本公开的示例性实施例中,还提供了一种计算机可读存储介质,其上存储有能够实现本说明书上述方法的程序产品。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的步骤。
根据本发明实施方式的用于实现上述方法的程序产品,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
此外,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本公开实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由所附的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (14)
1.一种数据处理方法,其特征在于,该方法应用于纵向联邦学习的第一参与方,所述第一参与方的第一数据集合大于所述纵向联邦学习的第二参与方的第二数据集合;
所述数据处理方法包括:
基于预设的函数对所述第一数据集合中的每一第一数据进行计算,确定所述第一数据对应的第一桶标识和第一块标识;所述第一桶标识用于标记存储所述第一数据的目标桶,所述目标桶内包括多个块,所述第一块标识用于标记所述目标桶内存储所述第一数据的目标块;
接收所述第二参与方发送的第二桶标识和第二块标识,所述第二桶标识和所述第二块标识是所述第二参与方基于所述预设的函数对所述第二数据集合中的每一第二数据进行计算得到的;
比对所述第一桶标识和所述第二桶标识、所述第一块标识和所述第二块标识,确定所述第一数据集合与所述第二数据集合中不相交的数据。
2.根据权利要求1所述的方法,其特征在于,比对所述第一桶标识和所述第二桶标识、所述第一块标识和所述第二块标识,确定所述第一数据集合与所述第二数据集合中不相交的数据,包括:
比对所述第一桶标识和所述第二桶标识、所述第一块标识和所述第二块标识,确定相同的桶标识和相同的块标识;
将所述相同的桶标识作为目标桶标识、所述相同的块标识作为目标块标识,所述目标桶标识和所述目标块标识指示的数据作为所述第一数据集合与所述第二数据集合中共有的数据,所述第一数据集合中除所述共有的数据之外的数据以及所述第二数据集合中除所述共有的数据之外的数据为所述第一数据集合与所述第二数据集合中不相交的数据;
向所述第二参与方发送所述目标桶标识和所述目标块标识,以使所述第二参与方基于所述共有的数据与所述第一参与方进行隐私求交加密处理。
3.根据权利要求1所述的方法,其特征在于,所述对所述第一数据集合中的每一第一数据进行计算,包括:
对所述第一数据集合中的第一数据并行进行计算。
4.根据权利要求3所述的方法,其特征在于,所述并行对所述第一数据集合中的第一数据进行计算,包括:
根据单指令流多数据流方法,对所述第一数据集合中的第一数据并行进行计算。
5.根据权利要求3所述的方法,其特征在于,所述对所述第一数据集合中的第一数据并行进行计算,包括:
对所述第一数据集合进行分割,得到多个子数据集;
同时对所述多个子数据集中的第一数据并行进行计算。
6.根据权利要求5所述的方法,其特征在于,所述对所述第一数据集合进行分割,得到多个子数据集,包括:
基于所述第二数据集合,对所述第一数据集合进行分割,得到多个子数据集。
7.根据权利要求2所述的方法,其特征在于,所述比对所述第一桶标识和所述第二桶标识、所述第一块标识和所述第二块标识,包括:
根据单指令流多数据流方法,并行比对所述第一桶标识和所述第二桶标识、所述第一块标识和所述第二块标识。
8.一种数据处理方法,其特征在于,所述方法应用于纵向联邦学习的第二参与方,所述第二参与方的第二数据集合小于所述纵向联邦学习的第一参与方的第一数据集合;
所述数据处理方法包括:
基于预设的函数对所述第二数据集合中的每一第二数据进行计算,确定所述第二数据对应的第二桶标识和第二块标识;所述第二桶标识用于标记存储所述第二数据的目标桶,所述目标桶内包括多个块,所述第二块标识用于标记所述目标桶内存储所述第二数据的目标块;
将所述第二桶标识和所述第二块标识发送至所述第一参与方;
接收所述第一参与方发送的目标桶标识和目标块标识;所述目标桶标识是所述第二桶标识和第一桶标识中相同的桶标识,所述目标块标识是所述第二块标识和第一块标识中相同的块标识,所述第一桶标识和所述第一块标识是所述第一参与方基于预设的函数对所述第一数据集合中的每一第一数据进行计算得到的。
9.根据权利要求8所述的方法,其特征在于,所述对所述第二数据集合中的每一第二数据进行计算,包括:
对所述第二数据集合中的第二数据并行进行计算。
10.根据权利要求9所述的方法,其特征在于,所述对所述第二数据集合中的第二数据并行进行计算,包括:
根据单指令流多数据流方法,对所述第二数据集合中的第二数据并行进行计算。
11.一种数据处理装置,其特征在于,该装置应用于纵向联邦学习的第一参与方,所述第一参与方的第一数据集合大于所述纵向联邦学习的第二参与方的第二数据集合;
所述数据处理装置包括:
第一计算模块,用于基于预设的函数对所述第一数据集合中的每一第一数据进行计算,确定所述第一数据对应的第一桶标识和第一块标识;所述第一桶标识用于标记存储所述第一数据的目标桶,所述目标桶内包括多个块,所述第一块标识用于标记所述目标桶内存储所述第一数据的目标块;
第一接收模块,用于接收所述第二参与方发送的第二桶标识和第二块标识,所述第二桶标识和所述第二块标识是所述第二参与方基于所述预设的函数对所述第二数据集合中的每一第二数据进行计算得到的;
比对模块,用于比对所述第一桶标识和所述第二桶标识、所述第一块标识和所述第二块标识,确定所述第一数据集合与所述第二数据集合中不相交的数据。
12.一种数据处理装置,其特征在于,所述装置应用于纵向联邦学习的第二参与方,所述第二参与方的第二数据集合小于所述纵向联邦学习的第一参与方的第一数据集合;
所述数据处理装置包括:
第二计算模块,用于对所述第二数据集合中的每一第二数据进行计算,确定所述第二数据对应的第二桶标识和第二块标识;所述第二桶标识用于标记存储所述第二数据的目标桶,所述目标桶内包括多个块,所述第二块标识用于标记所述目标桶内存储所述第二数据的目标块;
第二发送模块,用于将所述第二桶标识和所述第二块标识发送至所述第一参与方;
第二接收模块,用于接收所述第一参与方发送的目标桶标识和目标块标识;所述目标桶标识是所述第二桶标识和第一桶标识中相同的桶标识,所述目标块标识是所述第二块标识和第一块标识中相同的块标识,所述第一桶标识和所述第一块标识是所述第一参与方基于预设的函数对所述第一数据集合中的每一第一数据进行计算得到的。
13.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,配置为存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至10中任一项所述的方法。
14.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至10中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211166018.XA CN115481440B (zh) | 2022-09-23 | 2022-09-23 | 数据处理方法、装置、电子设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211166018.XA CN115481440B (zh) | 2022-09-23 | 2022-09-23 | 数据处理方法、装置、电子设备和介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115481440A CN115481440A (zh) | 2022-12-16 |
CN115481440B true CN115481440B (zh) | 2023-10-10 |
Family
ID=84393946
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211166018.XA Active CN115481440B (zh) | 2022-09-23 | 2022-09-23 | 数据处理方法、装置、电子设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115481440B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116647567A (zh) * | 2023-04-17 | 2023-08-25 | 瓴羊智能科技有限公司 | 隐私保护集合求交方法和装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110324321A (zh) * | 2019-06-18 | 2019-10-11 | 阿里巴巴集团控股有限公司 | 数据处理方法及装置 |
CN112231768A (zh) * | 2020-10-27 | 2021-01-15 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置、计算机设备及存储介质 |
CN113127916A (zh) * | 2021-05-18 | 2021-07-16 | 腾讯科技(深圳)有限公司 | 数据集合处理方法、数据处理方法、装置及存储介质 |
CN113395159A (zh) * | 2021-01-08 | 2021-09-14 | 腾讯科技(深圳)有限公司 | 一种基于可信执行环境的数据处理方法以及相关装置 |
CN113961961A (zh) * | 2021-10-11 | 2022-01-21 | 百保(上海)科技有限公司 | 一种基于scalable-ot的隐私集合求交方法及装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8572405B2 (en) * | 2012-03-15 | 2013-10-29 | Sap Ag | Collusion-resistant outsourcing of private set intersection |
WO2020220216A1 (en) * | 2019-04-29 | 2020-11-05 | Splunk Inc. | Search time estimate in data intake and query system |
-
2022
- 2022-09-23 CN CN202211166018.XA patent/CN115481440B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110324321A (zh) * | 2019-06-18 | 2019-10-11 | 阿里巴巴集团控股有限公司 | 数据处理方法及装置 |
CN112231768A (zh) * | 2020-10-27 | 2021-01-15 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置、计算机设备及存储介质 |
CN113395159A (zh) * | 2021-01-08 | 2021-09-14 | 腾讯科技(深圳)有限公司 | 一种基于可信执行环境的数据处理方法以及相关装置 |
CN113127916A (zh) * | 2021-05-18 | 2021-07-16 | 腾讯科技(深圳)有限公司 | 数据集合处理方法、数据处理方法、装置及存储介质 |
CN113961961A (zh) * | 2021-10-11 | 2022-01-21 | 百保(上海)科技有限公司 | 一种基于scalable-ot的隐私集合求交方法及装置 |
Non-Patent Citations (1)
Title |
---|
云环境下隐私保护的集合交集计算协议研究;黄雄波;CNKI硕士学位论文库(第08期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN115481440A (zh) | 2022-12-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111683071B (zh) | 区块链的隐私数据处理方法、装置、设备以及存储介质 | |
EP3114602B1 (en) | Method and apparatus for verifying processed data | |
CN109150499B (zh) | 动态加密数据的方法、装置、计算机设备和存储介质 | |
US20210049591A1 (en) | Cryptocurrency wallet and cryptocurrency account management | |
US9232394B2 (en) | Authentication of phone caller identity | |
US20210049690A1 (en) | Computer implemented voting process and system | |
JP2019505150A (ja) | デジタル署名を用いた変形ブロックチェーンについての方法及びシステム | |
CN112204557A (zh) | 用于自动去中心化多边交易处理的***和方法 | |
GB2585170A (en) | Oblivious pseudorandom function in a key management system | |
CN112784823B (zh) | 人脸图像识别方法、装置、计算设备和介质 | |
CN104504347A (zh) | 一种数据一致性匹配处理方法和设备 | |
CN111949998B (zh) | 对象检测及请求方法、数据处理***、装置及存储介质 | |
CN115481440B (zh) | 数据处理方法、装置、电子设备和介质 | |
US20230195940A1 (en) | Blockchain-based data processing method and apparatus, device, and storage medium | |
CN114884675A (zh) | 基于比特传输的多方隐私求交方法、装置、设备及介质 | |
CN110545542A (zh) | 基于非对称加密算法的主控密钥下载方法、装置和计算机设备 | |
CN117592078A (zh) | 多方隐私求交方法及计算机设备 | |
CN109684856B (zh) | 一种针对MapReduce计算的数据保密方法及*** | |
CN111931204A (zh) | 用于分布式***的加密去重存储方法、终端设备 | |
CN115906177A (zh) | 集合安全求交方法、装置、电子设备及存储介质 | |
US11902451B2 (en) | Cross-blockchain identity and key management | |
CN112434064B (zh) | 数据处理方法、装置、介质及电子设备 | |
CN115333753A (zh) | 互联网协议地址生成方法、装置、存储介质与电子设备 | |
CN116032458A (zh) | 用户隐私数据的处理方法及装置、存储介质、电子设备 | |
CN111030930B (zh) | 基于去中心化网络数据分片传输方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
EE01 | Entry into force of recordation of patent licensing contract | ||
EE01 | Entry into force of recordation of patent licensing contract |
Application publication date: 20221216 Assignee: Tianyiyun Technology Co.,Ltd. Assignor: CHINA TELECOM Corp.,Ltd. Contract record no.: X2024110000020 Denomination of invention: Data processing methods, devices, electronic devices, and media Granted publication date: 20231010 License type: Common License Record date: 20240315 |