CN113688354B - 一种基于安全多方计算的卡方分箱方法 - Google Patents

一种基于安全多方计算的卡方分箱方法 Download PDF

Info

Publication number
CN113688354B
CN113688354B CN202110999974.5A CN202110999974A CN113688354B CN 113688354 B CN113688354 B CN 113688354B CN 202110999974 A CN202110999974 A CN 202110999974A CN 113688354 B CN113688354 B CN 113688354B
Authority
CN
China
Prior art keywords
group
packet
data
samples
grouping
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110999974.5A
Other languages
English (en)
Other versions
CN113688354A (zh
Inventor
何道敬
孙黎彤
杜润萌
张民
张熙
廖清
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
East China Normal University
Original Assignee
East China Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by East China Normal University filed Critical East China Normal University
Priority to CN202110999974.5A priority Critical patent/CN113688354B/zh
Publication of CN113688354A publication Critical patent/CN113688354A/zh
Application granted granted Critical
Publication of CN113688354B publication Critical patent/CN113688354B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/20Ensemble learning
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioethics (AREA)
  • Mathematical Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Security & Cryptography (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Computer Hardware Design (AREA)
  • Computational Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Computation (AREA)
  • Algebra (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明公开了一种基于安全多方计算的卡方分箱方法,对于联邦学习的特征工程,提出一种新的卡方值计算方法,不需要加密所有的特征数据发送给数据应用方进行特征预处理,而是先将特征数据按类别分组,混入虚假分组,并对分组类别进行标记后加密发送给数据应用方,加密分组类别将会大幅度减少加密处理的数据量,数据应用方不需要解密所有特征数据,避免了巨大的资源损耗;数据提供方发送给数据应用方的是特征数据的分组信息,数据应用方解密后获取的是特征数据的分组信息,不包含特征数据的实际内容,并且该分组信息添加了虚假分组信息,将真实分组和虚假分组进行编码标记,相比传输脱敏数据和将真实数据加密后传输来说,提高了数据隐私的安全性。

Description

一种基于安全多方计算的卡方分箱方法
技术领域
本发明属于联邦学习领域,特别涉及一种基于安全多方计算的卡方分箱方法。
背景技术
在联邦学习开始前首先需要构建一个数据集,而不是直接使用原始数据进行建模。将原始数据转换为数据集的任务称为特征工程。
特征选择是特征工程中重要的一步,一般在建立分类模型时,首先,需要对连续变量离散化,特征离散化后,模型会更稳定,降低了模型过拟合的风险。在特征选择的过程中常常会进行分箱操作,分箱就是将连续型的特征数据离散化。分箱的好处有很多,例如:它对异常数据有更强的鲁棒性,解决了异常数据对建模的干扰;特征数据离散化之后,每个特征数据有单独的权重,为逻辑回归模型引入了非线性,能够提升模型表达能力;分箱还可以将特征的缺失值作为独立一类别带入模型,并且特征离散化之后形成的稀疏向量内积乘法运算速度快,计算结果方便存储,容易扩展等等。对于精确的离散化,将数据按照类别划分区间,如果两个相邻的区间具有非常相似的类分布,则这两个区间可以合并,否则他们应当保持分开,而低卡方值表明相邻两个区间内具有相似的类分布。特征数据分箱后计算特征数据的卡方值,卡方值越小,分布越相似,可以合并为一箱。
无论是特征离散化还是特征预测能力评估,在联邦学习特征预处理过程中,需要缺乏特征标签数据的一方将自己的特征数据发送给有特征标签的一方进行联合特征预处理。
现有的大多数联邦学习框架中,一部分方法为满足隐私保护需求在计算中令数据提供方使用公钥加密所有的特征矩阵,然后将密文矩阵发送给数据应用方,数据应用方拿到数据后使用私钥解密进行计算。在大规模数据收集中,这种方法显然会造成巨大的资源损耗和性能下降。另一部分直接传递脱敏数据进行计算,无法保护数据隐私安全,也不符合法律规范,还有一部分参与者自己单独进行训练,将训练结果融合,不能充分地发挥数据地价值。
发明内容
本发明的目的是提出一种新的基于安全多方计算的卡方分箱方法,对于数据精确的离散化,先将数据按照类别划分区间,如果两个相邻的区间具有非常相似的类分布,则这两个区间可以合并,否则他们应当保持分开,而低卡方值表明相邻两个区间内具有相似的类分布。特征数据分箱后计算特征数据的卡方值,卡方值越小,分布越相似,可以合并为一箱。
实现本发明目的的具体技术方案是:
一种基于安全多方计算的卡方分箱方法,包括下述步骤:
步骤1:数据提供方通过同态加密***生成一对公钥pk和私钥sk,将特征数据X={x0,x1,...,xn-1},id∈[0,n-1]进行分组,将特征数据X中类别相同的数据的id划分为一个区间,共记作s个分组,记作xt,t∈[0,s-1],其中n,s为正整数,并且标记真实分组xt的类别为1,使用公钥pk将该分组类别加密,记作Ex=E(1),得到真实分组信息Groupt(xt,Ex);
步骤2:构造虚假分组,将特征数据X的id随机划分s个分组区间,分组区间数目与真实分组个数保持一致,将区间记作xv,v∈[0,s-1],并且标记虚假分组的类别0,使用公钥pk将分组类别加密记作Ex=E(0),得到虚假分组信息为Groupv(xv,Ex);
步骤3:将真实分组信息和虚假分组信息按行连接,并且按行乱序,得到分组信息GroupX,数据提供方将分组信息GroupX(xi,Ex)发送给数据应用方;
步骤4:数据应用方将分组信息GroupX(xi,Ex)与标签数据Y={y0,y1,...,yi,...,yn-1},id∈[0,n-1]的id映射,得出每个分组区间xi对应的标签数据yi的值,将每个分组区间xi对应的标签数据yi的值相加,得出该分组区间内响应样本个数Groupy,根据该分组区间内数据总数Groups,计算得出该分组区间未响应样本的个数Groupn=Groups-Groupy,并且将所有分组区间的响应样本个数Groupy,未响应样本个数Groupn,样本总数Groups,以及分组区间对应的分组类别标记Ex发送给数据提供方;
步骤5:数据提供方使用私钥将分组类别标记Ex解密,得到解密后分组类别标记Dx,其中Dx=1则为真实分组,Dx=0则为虚假分组,删除虚假分组信息;
步骤6:数据提供方根据真实分组区间对应的响应样本个数Groupy,未响应样本个数Groupn,样本总数Groups,计算第i,i∈[0,2s-1]个分组第j个类别的期望样本个数Eij,此处j∈[0,2)表示响应样本和未响应样本两类;根据相邻两个真实分组的期望样本个数Eij,相邻两个真实分组的样本个数Aij,计算得出相邻两个真实分组的卡方值χ2
步骤7:数据提供方设置分箱数目限制,根据相邻分组的卡方值,卡方值最小的两个分组合并,合并后重新计算相邻分组的卡方值,直到分箱数目达到分箱数目限制后停止合并,得出卡方分箱结果。
步骤1所述真实分组xt,其中只包括特征数据的id,id∈[0,n-1],不包含特征数据的实际值,避免特征数据的实际值泄露。
步骤2所述将特征数据X的id随机划分s个分组区间,目的是构造虚假分组,将虚假分组混入真实分组中,保护真实分组信息。
步骤3所述分组信息GroupX(xi,Ex),其中将虚假分组信息与真实分组信息混合,并且将虚假分组和真实分组的类别进行加密,保护特征数据的隐私。
步骤4所述响应样本个数Groupy根据以下方式得到:分组信息xi中包含特征数据的id,将id对应到标签数据Y的id中,得出分组信息xi对应的标签值,若第i个分组信息中xi=[0,2],则对应的标签值为[y0,y2],由于响应样本标签值为1,未响应样本标签值为0,将该分组信息对应的标签值相加,得出该分组的响应样本个数Groupy
步骤4所述未响应样本个数Groupn的得到方式:每个分组中样本个数为分组信息xi中id的个数,即求分组信息中xi的长度得出该分组的样本个数Groups,根据该分组的样本个数减响应样本个数,得出未响应样本个数Groupn
步骤6所述第i个分组第j个类别的期望样本个数Eij的计算公式为:
Figure BDA0003233256960000031
其中,Ri表示第i个分组的第j、j+1个类别的样本个数之和,即Ri=Groups (i),Cj表示第i、i+1个分组中第j个类别的样本个数之和,当j表示响应样本类别时,Cj=Groupy (i)+Groupy (i+1),N表示相邻两个分组的样本总数,即N=Groups (i)+Groups (i+1)
步骤6所述卡方值χ2计算公式为:
Figure BDA0003233256960000032
其中,Aij是第i个分组、第j个类别的实际样本个数,如果j表示第i个分组的响应样本,那么Aij=Groupy (i),Eij是第i个分组、第j个类别的期望样本个数。
本发明的有益效果
在安全性方面,本发明保护了联邦学习特征工程阶段卡方分箱的数据隐私,将特征数据分组,将相同类别的数据索引id作为真实分组信息,添加虚假分组信息,将真实分组类别标记为1,将虚假分组类别标记为0,加密分组类别的0、1编码,将真实分组信息混合虚假分组信息后发送给数据应用方,数据应用方不知道该分组的特征数据具体值,只知道特征数据对应的id,并且混入了虚假分组,保护了特征数据的数据隐私。
在运算效率方面,本发明不需要加密所有的特征值发送给数据应用方,只加密了特征数据的分组类别,避免了加密和解密大量数据的计算开销,在大数据集的场景中,效率十分显著。
附图说明
图1为本发明流程图。
具体实施方式
结合以下具体实施例和附图,对本发明作进一步的详细说明。实施本发明的过程、条件、实验方法等,除以下专门提及的内容之外,均为本领域的普遍知识和公知常识,本发明没有特别限制内容。
实施例
数据提供方特征数据X={0,2,2,4,5,6,6,6},数据应用方标签数据Y={0,1,1,1,0,0,1,1},以计算数据提供方特征数据X的卡方分箱结果为例,基于安全多方计算的卡方分箱方法步骤具休说明:
首先,数据提供方将特征数据X类别相同的数据的id划分为一个区间,分组结果为:xt=[0],[1,2],[3],[4],[5,6,7],共5个分组,标汜这些分组为真实分组,并且使用公钏pk加密分组类别Ex=E(1),得到真实分组信息Groupt(xt,Ex),真实分组信息Groupt(xt,Ex)具体内容如下:
xt Ex
[0] E(1)
[1,2] E(1)
[3] E(1)
[4] E(1)
[5,6,7] E(1)
其次,构造虚假分组,将特征数据X的id随机划分s个区间,分组结果为:xv=[0,1,2],[3,4],[5],[6],[7],分组数目与真实分组个数保持一致,共5个分组。标记这些分组为虚假分组,并且使用公钥pk加密分组类别Ex=E(0),得到虚假分组信息Groupv(xv,Ex),虚假分组信息Groupv(xv,Ex)具体内容如下:
xv Ex
[0,1,2] E(0)
[3,4] E(0)
[5] E(0)
[6] E(0)
[7] E(0)
然后,将真实分组信息Groupt(xt,Ex)和虚假分组信息Groupv(xv,Ex)按行连接,并且按行乱序,得到分组信息GroupX(xi,Ex),并且将分组信息发送给数据应用方,分组信息GroupX(xi,Ex)具体内容如下:
xi Ex
[0,1,2] E(0)
[3,4] E(0)
[0] E(1)
[5] E(0)
[1,2] E(1)
[3] E(1)
[6] E(0)
[7] E(0)
[4] E(1)
[5,6,7] E(1)
然后,数据应用方将分组信息GroupX与标签数据Y={0,1,1,1,0,0,1,1}的id映射,得出每个分组区间对应的标签数据的值如下,将每个分组区间xi对应的标签数据yi相加,得出该分组区间内响应样本个数Groupy,根据该分组区间内数据总数Groups,计算得出该分组区间未响应样本的个数
Groupn=Groups-Groupy
Figure BDA0003233256960000051
/>
Figure BDA0003233256960000061
然后,将所有分组区间的响应样本个数Groupy,未响应样本个数Groupn,样本总数Groups,以及分组区间对应的分组类别标记Ex发送给数据提供方;
数据提供方使用私钥sk解密分组类别标记Ex,得出真实分组信息,解密分组类别标记得到1的分组是真实分组。根据每个真实分组区间对应的响应样本个数Groupy,未响应样本个数Groupn,样本总数Groups,计算第i个分组第j个类别的期望样本个数Eij,此处j∈[0,2)表示响应样本和未响应样本两类,此处以两个相邻真实分组区间[0]和[1,2]为例,计算两个分组的卡方值,两个相邻真实分组的信息如下:
分组编号 分组 Groupy Groupn Ri(Groups)
0 [0] 0 1 1
1 [1,2] 2 0 2
------------- Cj 2 1 3
分组区间[0]的响应样本个数Groupy (0)=0,样本总数为Groups (0)=1,未响应样本个数为Groupn (0)=1,则该分组的期望样本个数为:
Figure BDA0003233256960000062
分组[1,2]的期望样本个数为
Figure BDA0003233256960000063
根据相邻两个真实分组的期望样本个数Eij,相邻两个真实分组的样本个数Aij,最终计算得出相邻两个真实分组的卡方值χ2
Figure BDA0003233256960000071
数据提供方设置分箱数目限制,根据相邻分组的卡方值,卡方值χ2最小的两个分组合并,合并后重新计算相邻分组的卡方值,直到分箱数目达到分箱数目限制后停止合并,得出卡方分箱结果。

Claims (8)

1.一种基于安全多方计算的卡方分箱方法,其特征在于,包括下述步骤:
步骤1:数据提供方通过同态加密***生成一对公钥pk和私钥sk,将特征数据X={x0,x1,...,xn-1},id∈[0,n-1]进行分组,将特征数据X中类别相同的数据的id划分为一个区间,共记作s个分组,记作xt,t∈[0,s-1],n,s为正整数,并且标记真实分组xt的类别为1,使用公钥pk将该分组类别加密,记作Ex=E(1),得到真实分组信息Groupt(xt,Ex);
步骤2:构造虚假分组,将特征数据X的id随机划分s个分组区间,分组区间数目与真实分组个数保持一致,将区间记作xv,v∈[0,s-1],并且标记虚假分组的类别0,使用公钥pk将分组类别加密记作Ex=E(0),得到虚假分组信息为Groupv(xv,Ex);
步骤3:将真实分组信息和虚假分组信息按行连接,并且按行乱序,得到分组信息GroupX,数据提供方将分组信息GroupX(xi,Ex)发送给数据应用方;
步骤4:数据应用方将分组信息GroupX(xi,Ex)与标签数据Y={y0,y1,...,yi,...,yn-1},id∈[0,n-1]的id映射,得出每个分组区间xi对应的标签数据yi的值,将每个分组区间xi对应的标签数据yi的值相加,得出该分组区间内响应样本个数Groupy,根据该分组区间内数据总数Groups,计算得出该分组区间未响应样本的个数Groupn=Groups-Groupy,并且将所有分组区间的响应样本个数Groupy,未响应样本个数Groupn,样本总数Groups,以及分组区间对应的分组类别标记Ex发送给数据提供方;
步骤5:数据提供方使用私钥将分组类别标记Ex解密,得到解密后分组类别标记Dx,其中Dx=1则为真实分组,Dx=0则为虚假分组,删除虚假分组信息;
步骤6:数据提供方根据真实分组区间对应的响应样本个数Groupy,未响应样本个数Groupn,样本总数Groups,计算第i,i∈[0,2s-1]个分组第j个类别的期望样本个数Eij,此处j∈[0,2)表示响应样本和未响应样本两类;根据相邻两个真实分组的期望样本个数Eij,相邻两个真实分组的样本个数Aij,计算得出相邻两个真实分组的卡方值χ2
步骤7:数据提供方设置分箱数目限制,根据相邻分组的卡方值,卡方值最小的两个分组合并,合并后重新计算相邻分组的卡方值,直到分箱数目达到分箱数目限制后停止合并,得出卡方分箱结果。
2.根据权利要求1所述的一种基于安全多方计算的卡方分箱方法,其特征在于,步骤1所述真实分组xt,其中只包括特征数据的id,id∈[0,n-1],不包含特征数据的实际值,避免特征数据的实际值泄露。
3.根据权利要求1所述的一种基于安全多方计算的卡方分箱方法,其特征在于,步骤2所述将特征数据X的id随机划分s个分组区间,目的是构造虚假分组,将虚假分组混入真实分组中,保护真实分组信息。
4.根据权利要求1所述的一种基于安全多方计算的卡方分箱方法,其特征在于,步骤3所述分组信息GroupX(xi,Ex),其中将虚假分组信息与真实分组信息混合,并且将虚假分组和真实分组的类别进行加密,保护特征数据的隐私。
5.根据权利要求1所述的一种基于安全多方计算的卡方分箱方法,其特征在于,步骤4所述响应样本个数Groupy根据以下方式得到:分组信息xi中包含特征数据的id,将id对应到标签数据Y的id中,得出分组信息xi对应的标签值,若第i个分组信息中xi=[0,2],则对应的标签值为[y0,y2],由于响应样本标签值为1,未响应样本标签值为0,将该分组信息对应的标签值相加,得出该分组的响应样本个数Groupy
6.根据权利要求1所述的一种基于安全多方计算的卡方分箱方法,其特征在于,步骤4所述未响应样本个数Groupn的得到方式:每个分组中样本个数为分组信息xi中id的个数,即求分组信息中xi的长度得出该分组的样本个数Groups,根据该分组的样本个数减响应样本个数,得出未响应样本个数Groupn
7.根据权利要求1所述的一种基于安全多方计算的卡方分箱方法,其特征在于,步骤6所述第i个分组第j个类别的期望样本个数Eij的计算公式为:
Figure FDA0003233256950000021
其中,Ri表示第i个分组的第j、j+1个类别的样本个数之和,即Ri=Groups (i),Cj表示第i、i+1个分组中第j个类别的样本个数之和,当j表示响应样本类别时,Cj=Groupy (i)+Groupy (i +1),N表示相邻两个分组的样本总数,即N=Groups (i)+Groups (i+1)
8.根据权利要求1所述的一种基于安全多方计算的卡方分箱方法,其特征在于,步骤6所述卡方值χ2计算公式为:
Figure FDA0003233256950000031
其中,Aij是第i个分组、第j个类别的实际样本个数,如果j表示第i个分组的响应样本,那么Aij=Groupy (i),Eij是第i个分组、第j个类别的期望样本个数。
CN202110999974.5A 2021-08-27 2021-08-27 一种基于安全多方计算的卡方分箱方法 Active CN113688354B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110999974.5A CN113688354B (zh) 2021-08-27 2021-08-27 一种基于安全多方计算的卡方分箱方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110999974.5A CN113688354B (zh) 2021-08-27 2021-08-27 一种基于安全多方计算的卡方分箱方法

Publications (2)

Publication Number Publication Date
CN113688354A CN113688354A (zh) 2021-11-23
CN113688354B true CN113688354B (zh) 2023-06-09

Family

ID=78583726

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110999974.5A Active CN113688354B (zh) 2021-08-27 2021-08-27 一种基于安全多方计算的卡方分箱方法

Country Status (1)

Country Link
CN (1) CN113688354B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114021198B (zh) * 2021-12-29 2022-04-08 支付宝(杭州)信息技术有限公司 一种保护数据隐私的确定共有数据的方法及装置
CN114398671B (zh) * 2021-12-30 2023-07-11 翼健(上海)信息科技有限公司 基于特征工程iv值的隐私计算方法、***和可读存储介质
CN114329127B (zh) * 2021-12-30 2023-06-20 北京瑞莱智慧科技有限公司 特征分箱方法、装置及存储介质
CN115951165A (zh) * 2022-12-06 2023-04-11 南方电网数字电网研究院有限公司 基于电力设备多源传感器的故障诊断体系构建方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103826152A (zh) * 2012-11-16 2014-05-28 中兴通讯股份有限公司 一种利用机顶盒实现多方会议通话的方法、设备和***
WO2015094545A1 (en) * 2013-12-18 2015-06-25 Mun Johnathan System and method for modeling and quantifying regulatory capital, key risk indicators, probability of default, exposure at default, loss given default, liquidity ratios, and value at risk, within the areas of asset liability management, credit risk, market risk, operational risk, and liquidity risk for banks
CN111079283A (zh) * 2019-12-13 2020-04-28 四川新网银行股份有限公司 对信息饱和度不均衡数据的处理方法
CN111539009A (zh) * 2020-06-05 2020-08-14 支付宝(杭州)信息技术有限公司 保护隐私数据的有监督特征分箱方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103826152A (zh) * 2012-11-16 2014-05-28 中兴通讯股份有限公司 一种利用机顶盒实现多方会议通话的方法、设备和***
WO2015094545A1 (en) * 2013-12-18 2015-06-25 Mun Johnathan System and method for modeling and quantifying regulatory capital, key risk indicators, probability of default, exposure at default, loss given default, liquidity ratios, and value at risk, within the areas of asset liability management, credit risk, market risk, operational risk, and liquidity risk for banks
CN111079283A (zh) * 2019-12-13 2020-04-28 四川新网银行股份有限公司 对信息饱和度不均衡数据的处理方法
CN111539009A (zh) * 2020-06-05 2020-08-14 支付宝(杭州)信息技术有限公司 保护隐私数据的有监督特征分箱方法及装置

Also Published As

Publication number Publication date
CN113688354A (zh) 2021-11-23

Similar Documents

Publication Publication Date Title
CN113688354B (zh) 一种基于安全多方计算的卡方分箱方法
Shen et al. Secure SVM training over vertically-partitioned datasets using consortium blockchain for vehicular social networks
WO2020248537A1 (zh) 基于联邦学习的模型参数的确定方法及装置
CN103532701B (zh) 一种数值型数据的加密、解密方法
US11335213B2 (en) Method and apparatus for encrypting data, method and apparatus for decrypting data
CN104135362B (zh) 一种基于差分隐私发布的数据的可用性计算方法
CN101706947B (zh) 基于dna序列与多混沌映射的图像融合加密方法
US20170308580A1 (en) Data Aggregation/Analysis System and Method Therefor
CN111756522B (zh) 数据处理方法及***
EP2951945B1 (en) Method and system for providing encrypted data for searching of information therein and a method and system for searching of information on encrypted data
CN104917617A (zh) 一种加密群签名的混淆方法
CN105701755A (zh) 一种基于分形和dna序列操作的图像加密方法
CN110213202B (zh) 标识加密匹配方法和装置、标识处理方法和装置
Du et al. A privacy-protected image retrieval scheme for fast and secure image search
Hazarika et al. A novel partial image encryption using chaotic logistic map
Millen On the freedom of decryption
CN102594807A (zh) 信息空间中基于实体自身特征的网络基因识别方法
CN103310157A (zh) 基于rt-dna元胞自动机的图像加密方法
CN111177747B (zh) 一种基于区块链的社交网络隐私数据保护方法
CN103853946A (zh) 一种基于fcm聚类特征的gis矢量数据版权认证方法
Pradeepthi et al. Machine learning approach for analysing encrypted data
CN114629701B (zh) 基于信息加密的信息展示***
CN113159918B (zh) 一种基于联邦团渗透的银行客户群体挖掘方法
CN114154476A (zh) 一种大型仪器共享实验执行可信度判别方法
CN115860768A (zh) 一种基于区块链的溯源方法、装置及其电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant