CN112995076B - 一种离散数据频率估计方法、用户端、数据中心及*** - Google Patents

一种离散数据频率估计方法、用户端、数据中心及*** Download PDF

Info

Publication number
CN112995076B
CN112995076B CN201911298496.4A CN201911298496A CN112995076B CN 112995076 B CN112995076 B CN 112995076B CN 201911298496 A CN201911298496 A CN 201911298496A CN 112995076 B CN112995076 B CN 112995076B
Authority
CN
China
Prior art keywords
discrete data
codes
data
code
discrete
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911298496.4A
Other languages
English (en)
Other versions
CN112995076A (zh
Inventor
刘莹
朱洪斌
刘圣龙
赵涛
王衡
周鑫
王迪
毛一凡
崔硕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Big Data Center Of State Grid Corp Of China
Original Assignee
Big Data Center Of State Grid Corp Of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Big Data Center Of State Grid Corp Of China filed Critical Big Data Center Of State Grid Corp Of China
Priority to CN201911298496.4A priority Critical patent/CN112995076B/zh
Publication of CN112995076A publication Critical patent/CN112995076A/zh
Application granted granted Critical
Publication of CN112995076B publication Critical patent/CN112995076B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L25/00Baseband systems
    • H04L25/02Details ; arrangements for supplying electrical power along data transmission lines
    • H04L25/08Modifications for reducing interference; Modifications for reducing effects due to line faults ; Receiver end arrangements for detecting or overcoming line faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/04Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks
    • H04L63/0428Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks wherein the data content is protected, e.g. by encrypting or encapsulating the payload
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Power Engineering (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种离散数据频率估计方法、用户端、数据中心及***,包括:用户端根据向数据中心发送的离散数据的种类生成离散数据编码;用户端获取离散数据编码对应的扰乱编码,并将该离散数据编码对应的扰乱编码发送至数据中心;数据中心接收各用户端的离散数据编码对应的扰乱编码;数据中心根据所述各用户端的离散数据编码对应的扰乱编码确定各类离散数据的发生频率。该方案中用户终端根据松散本地差分隐私的定义,在原始数据上减少噪声的注入,在满足本地差分隐私的基础上,尽可能的降低数据的失真度,提高扰乱后数据的可用性,进而提高统计结果的准确率。

Description

一种离散数据频率估计方法、用户端、数据中心及***
技术领域
本发明涉及电网信息控制领域,具体涉及一种离散数据频率估计方法、用户端、数据中心及***。
背景技术
在生产控制领域,包括但不限于电网信息控制领域,经常需要不同区域、不同部门的业务数据汇集至数据中心,并通过联合分析,得出某种业务事件的发生频率,开展业务分析。其中涉及到数据所有权和数据使用权分离的情况,即数据的所有全分别数据不同区域、不同部门,而分析结果可以共享,因此需要在保障各方数据秘密的情况下进行联合数据分析。
当前同区域、不同部门的业务数据直接汇集至数据中心,存在敏感数据泄露风险,而且数据中心作为各方联合工作的关键节点,数据安全防护责任巨大。此外,各方为了维护自身数据安全以及规避数据安全责任,共享数据的积极性也会大打折扣,不利于数据业务的开展。因此迫切需要一种由独立各方根据自由数据情况完成本地差分隐私处理,在保护自身数据隐私的条件下进行联合分析的技术。
发明内容
针对现有技术的不足,本发明的目的是用户终端根据松散本地差分隐私的定义,在原始数据上减少噪声的注入,在满足本地差分隐私的基础上,尽可能的降低数据的失真度,提高扰乱后数据的可用性,进而提高统计结果的准确率。
本发明的目的是采用下述技术方案实现的:
本发明提供一种离散数据频率估计方法,该方法应用于用户端,其改进之处在于,所述方法包括:
根据向数据中心发送的离散数据的种类生成离散数据编码;
获取离散数据编码对应的扰乱编码,并将该离散数据编码对应的扰乱编码发送至数据中心。
优选的,所述离散数据编码的长度与离散数据种类总数相等。
进一步的,所述离散数据编码为(v1...vi...vn),其中,n为离散数据种类总数,vi为第i类离散数据对应的编码值,若用户端向数据中心发送的离散数据的种类为第i类离散数据,则vi=1,否则,vi=0。
优选的,所述获取离散数据编码对应的扰乱编码,包括:
获取离散数据编码中各类离散数据对应的编码值的转换概率;
基于所述离散数据编码中各类离散数据对应的编码值的转换概率确定所述离散数据编码对应的扰乱编码。
进一步的,所述获取离散数据编码中各类离散数据对应的编码值的转换概率,包括:
按下式确定离散数据编码中第i类离散数据对应的编码值转换为0的概率:
Figure BDA0002321239460000021
按下式确定离散数据编码中第i类离散数据对应的编码值转换为1的概率:
Figure BDA0002321239460000022
上式中,ε为隐私保护预算,δ为松散本地差分隐私下的参数,取值为0到1之间,
Figure BDA0002321239460000023
为离散数据编码对应的扰乱编码中第i类离散数据对应的扰乱编码值,
Figure BDA0002321239460000024
为离散数据编码中第i类离散数据对应的编码值转换为0的概率,
Figure BDA0002321239460000025
为离散数据编码中第i类离散数据对应的编码值转换为1的概率。
进一步的,所述基于所述离散数据编码中各类离散数据对应的编码值的转换概率确定所述离散数据编码对应的扰乱编码,包括:
在{0,1}集合中以
Figure BDA0002321239460000026
的概率抽取0,以
Figure BDA0002321239460000027
的概率抽取1,若抽中0,则
Figure BDA0002321239460000028
若抽中1,则
Figure BDA0002321239460000029
本发明提供一种应用于离散数据频率估计的用户端,其改进之处在于,所述用户端包括:
生成模块,用于根据向数据中心发送的离散数据的种类生成离散数据编码;
获取模块,用于获取离散数据编码对应的扰乱编码;
发送模块,用于将该离散数据编码对应的扰乱编码发送至数据中心。
优选的,所述离散数据编码的长度与离散数据种类总数相等。
进一步的,所述离散数据编码为(v1...vi...vn),其中,n为离散数据种类总数,vi为第i类离散数据对应的编码值,若用户端向数据中心发送的离散数据的种类为第i类离散数据,则vi=1,否则,vi=0。
优选的,所述获取模块,包括:
获取单元,用于获取离散数据编码中各类离散数据对应的编码值的转换概率;
确定单元,用于基于所述离散数据编码中各类离散数据对应的编码值的转换概率确定所述离散数据编码对应的扰乱编码。
进一步的,所述获取单元具体用于:
按下式确定离散数据编码中第i类离散数据对应的编码值转换为0的概率:
Figure BDA0002321239460000031
按下式确定离散数据编码中第i类离散数据对应的编码值转换为1的概率:
Figure BDA0002321239460000032
上式中,ε为隐私保护预算,δ为松散本地差分隐私下的参数,取值为0到1之间,
Figure BDA0002321239460000033
为离散数据编码对应的扰乱编码中第i类离散数据对应的扰乱编码值,
Figure BDA0002321239460000034
为离散数据编码中第i类离散数据对应的编码值转换为0的概率,
Figure BDA0002321239460000035
为离散数据编码中第i类离散数据对应的编码值转换为1的概率。
进一步的,所述确定单元具体用于:
在{0,1}集合中以
Figure BDA0002321239460000036
的概率抽取0,以
Figure BDA0002321239460000037
的概率抽取1,若抽中0,则
Figure BDA0002321239460000038
若抽中1,则
Figure BDA0002321239460000039
本发明提供一种离散数据频率估计方法,该方法应用于数据中心,其改进之处在于,所述方法包括:
接收各用户端的离散数据编码对应的扰乱编码;
根据所述各用户端的离散数据编码对应的扰乱编码确定各类离散数据的发生频率。
优选的,所述根据所述各用户端的离散数据编码对应的扰乱编码确定各类离散数据的发生频率,包括:
统计各用户端的离散数据编码对应的扰乱编码中第i类离散数据对应的扰乱编码值为0的频率
Figure BDA0002321239460000041
和扰乱编码值为1的频率
Figure BDA0002321239460000042
基于
Figure BDA0002321239460000043
Figure BDA0002321239460000044
建立第i类离散数据发生频率方程组;
求解所述第i类离散数据接收频率方程组,获取第i类离散数据的发生频率。
进一步的,所述第i类离散数据发生频率方程组为:
Figure BDA0002321239460000045
上式中,f0(i)为第i类离散数据不发生频率,f1(i)为第i类离散数据的发生频率,ε为隐私保护预算,δ为松散本地差分隐私下的参数,取值为0到1之间。
本发明提供一种应用于离散数据频率估计的数据中心,其改进之处在于,所述数据中心包括:
接收模块,用于接收各用户端的离散数据编码对应的扰乱编码;
确定模块,用于根据所述各用户端的离散数据编码对应的扰乱编码确定各类离散数据的发生频率。
优选的,所述确定模块,包括:
统计单元,用于统计各用户端的离散数据编码对应的扰乱编码中第i类离散数据对应的扰乱编码值为0的频率
Figure BDA0002321239460000046
和扰乱编码值为1的频率
Figure BDA0002321239460000047
建立单元,用于基于
Figure BDA0002321239460000048
Figure BDA0002321239460000049
建立第i类离散数据发生频率方程组;
求解单元,用于求解所述第i类离散数据接收频率方程组,获取第i类离散数据的发生频率。
进一步的,所述第i类离散数据发生频率方程组为:
Figure BDA00023212394600000410
上式中,f0(i)为第i类离散数据不发生频率,f1(i)为第i类离散数据的发生频率,ε为隐私保护预算,δ为松散本地差分隐私下的参数,取值为0到1之间。
本发明提供一种离散数据频率估计方法,其改进之处在于,所述方法包括:
用户端根据向数据中心发送的离散数据的种类生成离散数据编码;
用户端获取离散数据编码对应的扰乱编码,并将该离散数据编码对应的扰乱编码发送至数据中心;
数据中心接收各用户端的离散数据编码对应的扰乱编码;
数据中心根据所述各用户端的离散数据编码对应的扰乱编码确定各类离散数据的发生频率。
本发明提供一种离散数据频率估计***,其改进之处在于,所述***包括:上述用户端和数据中心。
与最接近的现有技术相比,本发明具有的有益效果:
本发明提供的技术方案中,用户终端根据向数据中心发送的离散数据的种类生成离散数据编码,并对离散数据编码中各类离散数据对应的编码值进行随机扰乱,再将扰乱后的扰乱编码发送给数据收集中心;通过上述方案处理后的数据满足隐私要求,避免了隐私的泄露的风险。
数据收集中心接收各用户端的离散数据编码对应的扰乱编码后,根据所述各用户端的离散数据编码对应的扰乱编码确定各类离散数据的发生频率,通过上述方案,能够在保证避免隐私泄露的同时,保证了估算的离散数据的频率结果具有较高的准确度。
附图说明
图1是本发明提供的离散数据频率估计方法流程图;
图2是本发明提供的应用于离散数据频率估计方法的用户端结构示意图;
图3是本发明提供的应用于离散数据频率估计方法的数据中心结构示意图;
图4是本发明提供的离散数据频率估计***结构示意图。
具体实施方式
下面结合附图对本发明的具体实施方式作进一步的详细说明。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
为了在保障各方数据秘密的情况下进行联合数据分析,本发明提供的离散数据频率估计方法在已有方案的基础上引入了松散本地差分隐私的定义,提出了满足松散本地差分隐私的离散数据频率估计方案。该方案的主要思想是用户终端根据松散本地差分隐私的定义,在原始数据上减少噪声的注入,在满足本地差分隐私的基础上,尽可能的降低数据的失真度,提高扰乱后数据的可用性,进而提高统计结果的准确率,如图1所示,所述方法包括:
101用户端根据向数据中心发送的离散数据的种类生成离散数据编码;
102用户端获取离散数据编码对应的扰乱编码,并将该离散数据编码对应的扰乱编码发送至数据中心;
103数据中心接收各用户端的离散数据编码对应的扰乱编码;
104数据中心根据所述各用户端的离散数据编码对应的扰乱编码确定各类离散数据的发生频率。
其中,所述离散数据编码的长度与离散数据种类总数相等。
所述离散数据编码为(v1...vi...vn),其中,n为离散数据种类总数,vi为第i类离散数据对应的编码值,若用户端向数据中心发送的离散数据的种类为第i类离散数据,则vi=1,否则,vi=0。
例如:每个用户终端均拥有离散数据集合S中的某一个离散数据。每个用户终端首先对自身所拥有的数据di进行独热编码,即,得到一个长度为m的单位向量vi,唯有自身数据di所对应的位置为1,其余位都为0。具体来说,若di是离散数据集合中的第j个数据(j≤m),则单位向量vi中的第j位为1,其余为0。
具体的,本发明提供的实施例中,可以将步骤101和步骤102应用于用户端,其中,所述步骤102中,获取离散数据编码对应的扰乱编码包括:
获取离散数据编码中各类离散数据对应的编码值的转换概率;
基于所述离散数据编码中各类离散数据对应的编码值的转换概率确定所述离散数据编码对应的扰乱编码。
进一步的,所述获取离散数据编码中各类离散数据对应的编码值的转换概率,包括:
按下式确定离散数据编码中第i类离散数据对应的编码值转换为0的概率:
Figure BDA0002321239460000071
按下式确定离散数据编码中第i类离散数据对应的编码值转换为1的概率:
Figure BDA0002321239460000072
上式中,ε为隐私保护预算,δ为松散本地差分隐私下的参数,取值为0到1之间,
Figure BDA0002321239460000073
为离散数据编码对应的扰乱编码中第i类离散数据对应的扰乱编码值,
Figure BDA0002321239460000074
为离散数据编码中第i类离散数据对应的编码值转换为0的概率,
Figure BDA0002321239460000075
为离散数据编码中第i类离散数据对应的编码值转换为1的概率。
其中,δ一般取大于0,远小于1的数值,当δ取0时,该隐私保护机制则满足严格定义下的本地差分隐私。在该申请中,主要论述满足松散本地差分隐私的离散数据频率估计方法。
进一步的,所述基于所述离散数据编码中各类离散数据对应的编码值的转换概率确定所述离散数据编码对应的扰乱编码,包括:
在{0,1}集合中以
Figure BDA0002321239460000076
的概率抽取0,以
Figure BDA0002321239460000077
的概率抽取1,若抽中0,则
Figure BDA0002321239460000078
若抽中1,则
Figure BDA0002321239460000079
基于步骤101和步骤102的技术方案,本发明提供一种应用于离散数据频率估计的用户端,如图2所示,所述用户端包括:
生成模块,用于根据向数据中心发送的离散数据的种类生成离散数据编码;
获取模块,用于获取离散数据编码对应的扰乱编码;
发送模块,用于将该离散数据编码对应的扰乱编码发送至数据中心。
优选的,所述离散数据编码的长度与离散数据种类总数相等。
进一步的,所述离散数据编码为(v1...vi...vn),其中,n为离散数据种类总数,vi为第i类离散数据对应的编码值,若用户端向数据中心发送的离散数据的种类为第i类离散数据,则vi=1,否则,vi=0。
优选的,所述获取模块,包括:
获取单元,用于获取离散数据编码中各类离散数据对应的编码值的转换概率;
确定单元,用于基于所述离散数据编码中各类离散数据对应的编码值的转换概率确定所述离散数据编码对应的扰乱编码。
进一步的,所述获取单元具体用于:
按下式确定离散数据编码中第i类离散数据对应的编码值转换为0的概率:
Figure BDA0002321239460000081
按下式确定离散数据编码中第i类离散数据对应的编码值转换为1的概率:
Figure BDA0002321239460000082
上式中,ε为隐私保护预算,δ为松散本地差分隐私下的参数,取值为0到1之间,
Figure BDA0002321239460000083
为离散数据编码对应的扰乱编码中第i类离散数据对应的扰乱编码值,
Figure BDA0002321239460000084
为离散数据编码中第i类离散数据对应的编码值转换为0的概率,
Figure BDA0002321239460000085
为离散数据编码中第i类离散数据对应的编码值转换为1的概率。
进一步的,所述确定单元具体用于:
在{0,1}集合中以
Figure BDA0002321239460000086
的概率抽取0,以
Figure BDA0002321239460000087
的概率抽取1,若抽中0,则
Figure BDA0002321239460000088
若抽中1,则
Figure BDA0002321239460000089
本发明提供的实施例中,可以将步骤103和步骤104应用于数据中心,其中,所述步骤104,包括:
统计各用户端的离散数据编码对应的扰乱编码中第i类离散数据对应的扰乱编码值为0的频率
Figure BDA00023212394600000810
和扰乱编码值为1的频率
Figure BDA00023212394600000811
基于
Figure BDA00023212394600000812
Figure BDA00023212394600000813
建立第i类离散数据发生频率方程组;
求解所述第i类离散数据接收频率方程组,获取第i类离散数据的发生频率。
进一步的,所述第i类离散数据发生频率方程组为:
Figure BDA0002321239460000091
上式中,f0(i)为第i类离散数据不发生频率,f1(i)为第i类离散数据的发生频率,ε为隐私保护预算,δ为松散本地差分隐私下的参数,取值为0到1之间。
基于步骤103和步骤104的技术方案,本发明提供一种应用于离散数据频率估计的数据中心,如图3所示,所述数据中心包括:
接收模块,用于接收各用户端的离散数据编码对应的扰乱编码;
确定模块,用于根据所述各用户端的离散数据编码对应的扰乱编码确定各类离散数据的发生频率。
优选的,所述确定模块,包括:
统计单元,用于统计各用户端的离散数据编码对应的扰乱编码中第i类离散数据对应的扰乱编码值为0的频率
Figure BDA0002321239460000092
和扰乱编码值为1的频率
Figure BDA0002321239460000093
建立单元,用于基于
Figure BDA0002321239460000094
Figure BDA0002321239460000095
建立第i类离散数据发生频率方程组;
求解单元,用于求解所述第i类离散数据接收频率方程组,获取第i类离散数据的发生频率。
进一步的,所述第i类离散数据发生频率方程组为:
Figure BDA0002321239460000096
上式中,f0(i)为第i类离散数据不发生频率,f1(i)为第i类离散数据的发生频率,ε为隐私保护预算,δ为松散本地差分隐私下的参数,取值为0到1之间。
同时,本发明还提供一种离散数据频率估计***,如图4所示,所述***包括:上述用户端和数据中心。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。

Claims (6)

1.一种离散数据频率估计方法,该方法应用于用户端,其特征在于,所述方法包括:
根据向数据中心发送的离散数据的种类生成离散数据编码;
获取离散数据编码对应的扰乱编码,并将该离散数据编码对应的扰乱编码发送至数据中心;
所述获取离散数据编码对应的扰乱编码,包括:
获取离散数据编码中各类离散数据对应的编码值的转换概率;
基于所述离散数据编码中各类离散数据对应的编码值的转换概率确定所述离散数据编码对应的扰乱编码;
所述获取离散数据编码中各类离散数据对应的编码值的转换概率,包括:
按下式确定离散数据编码中第i类离散数据对应的编码值转换为0的概率:
Figure FDA0003695328640000011
按下式确定离散数据编码中第i类离散数据对应的编码值转换为1的概率:
Figure FDA0003695328640000012
上式中,ε为隐私保护预算,δ为松散本地差分隐私下的参数,取值为0到1之间,
Figure FDA0003695328640000013
为离散数据编码对应的扰乱编码中第i类离散数据对应的扰乱编码值,
Figure FDA0003695328640000014
为离散数据编码中第i类离散数据对应的编码值转换为0的概率,
Figure FDA0003695328640000015
为离散数据编码中第i类离散数据对应的编码值转换为1的概率;
所述离散数据编码的长度与离散数据种类总数相等;
所述离散数据编码为(v1...vi...vn),其中,n为离散数据种类总数,vi为第i类离散数据对应的编码值,若用户端向数据中心发送的离散数据的种类为第i类离散数据,则vi=1,否则,vi=0;
所述基于所述离散数据编码中各类离散数据对应的编码值的转换概率确定所述离散数据编码对应的扰乱编码,包括:
在{0,1}集合中以
Figure FDA0003695328640000021
的概率抽取0,以
Figure FDA0003695328640000022
的概率抽取1,若抽中0,则
Figure FDA0003695328640000023
若抽中1,则
Figure FDA0003695328640000024
2.一种应用于离散数据频率估计的用户端,其特征在于,所述用户端包括:
生成模块,用于根据向数据中心发送的离散数据的种类生成离散数据编码;
获取模块,用于获取离散数据编码对应的扰乱编码;
发送模块,用于将该离散数据编码对应的扰乱编码发送至数据中心;
所述获取模块,包括:
获取单元,用于获取离散数据编码中各类离散数据对应的编码值的转换概率;
确定单元,用于基于所述离散数据编码中各类离散数据对应的编码值的转换概率确定所述离散数据编码对应的扰乱编码;
所述获取单元具体用于:
按下式确定离散数据编码中第i类离散数据对应的编码值转换为0的概率:
Figure FDA0003695328640000025
按下式确定离散数据编码中第i类离散数据对应的编码值转换为1的概率:
Figure FDA0003695328640000026
上式中,ε为隐私保护预算,δ为松散本地差分隐私下的参数,取值为0到1之间,
Figure FDA0003695328640000027
为离散数据编码对应的扰乱编码中第i类离散数据对应的扰乱编码值,
Figure FDA0003695328640000028
为离散数据编码中第i类离散数据对应的编码值转换为0的概率,
Figure FDA0003695328640000029
为离散数据编码中第i类离散数据对应的编码值转换为1的概率;
所述离散数据编码的长度与离散数据种类总数相等;
所述离散数据编码为(v1...vi...vn),其中,n为离散数据种类总数,vi为第i类离散数据对应的编码值,若用户端向数据中心发送的离散数据的种类为第i类离散数据,则vi=1,否则,vi=0;
所述确定单元具体用于:
在{0,1}集合中以
Figure FDA0003695328640000031
的概率抽取0,以
Figure FDA0003695328640000032
的概率抽取1,若抽中0,则
Figure FDA0003695328640000033
若抽中1,则
Figure FDA0003695328640000034
3.一种离散数据频率估计方法,该方法应用于数据中心,其特征在于,所述方法包括:
接收各用户端的离散数据编码对应的扰乱编码;
根据所述各用户端的离散数据编码对应的扰乱编码确定各类离散数据的发生频率;
所述根据所述各用户端的离散数据编码对应的扰乱编码确定各类离散数据的发生频率,包括:
统计各用户端的离散数据编码对应的扰乱编码中第i类离散数据对应的扰乱编码值为0的频率
Figure FDA0003695328640000035
和扰乱编码值为1的频率
Figure FDA0003695328640000036
基于
Figure FDA0003695328640000037
Figure FDA0003695328640000038
建立第i类离散数据发生频率方程组;
求解所述第i类离散数据接收频率方程组,获取第i类离散数据的发生频率;
所述第i类离散数据发生频率方程组为:
Figure FDA0003695328640000039
上式中,f0(i)为第i类离散数据不发生频率,f1(i)为第i类离散数据的发生频率,ε为隐私保护预算,δ为松散本地差分隐私下的参数,取值为0到1之间。
4.一种应用于离散数据频率估计的数据中心,其特征在于,所述数据中心包括:
接收模块,用于接收各用户端的离散数据编码对应的扰乱编码;
确定模块,用于根据所述各用户端的离散数据编码对应的扰乱编码确定各类离散数据的发生频率;
所述确定模块,包括:
统计单元,用于统计各用户端的离散数据编码对应的扰乱编码中第i类离散数据对应的扰乱编码值为0的频率
Figure FDA00036953286400000310
和扰乱编码值为1的频率
Figure FDA00036953286400000311
建立单元,用于基于
Figure FDA00036953286400000312
Figure FDA00036953286400000313
建立第i类离散数据发生频率方程组;
求解单元,用于求解所述第i类离散数据接收频率方程组,获取第i类离散数据的发生频率;
所述第i类离散数据发生频率方程组为:
Figure FDA0003695328640000041
上式中,f0(i)为第i类离散数据不发生频率,f1(i)为第i类离散数据的发生频率,ε为隐私保护预算,δ为松散本地差分隐私下的参数,取值为0到1之间。
5.一种离散数据频率估计方法,其特征在于,所述方法包括:
用户端根据向数据中心发送的离散数据的种类生成离散数据编码;
用户端获取离散数据编码对应的扰乱编码,并将该离散数据编码对应的扰乱编码发送至数据中心;
数据中心接收各用户端的离散数据编码对应的扰乱编码;
数据中心根据所述各用户端的离散数据编码对应的扰乱编码确定各类离散数据的发生频率;
所述获取离散数据编码对应的扰乱编码,包括:
获取离散数据编码中各类离散数据对应的编码值的转换概率;
基于所述离散数据编码中各类离散数据对应的编码值的转换概率确定所述离散数据编码对应的扰乱编码;
所述获取离散数据编码中各类离散数据对应的编码值的转换概率,包括:
按下式确定离散数据编码中第i类离散数据对应的编码值转换为0的概率:
Figure FDA0003695328640000042
按下式确定离散数据编码中第i类离散数据对应的编码值转换为1的概率:
Figure FDA0003695328640000043
上式中,ε为隐私保护预算,δ为松散本地差分隐私下的参数,取值为0到1之间,
Figure FDA0003695328640000044
为离散数据编码对应的扰乱编码中第i类离散数据对应的扰乱编码值,
Figure FDA0003695328640000045
为离散数据编码中第i类离散数据对应的编码值转换为0的概率,
Figure FDA0003695328640000051
为离散数据编码中第i类离散数据对应的编码值转换为1的概率;
所述根据所述各用户端的离散数据编码对应的扰乱编码确定各类离散数据的发生频率,包括:
统计各用户端的离散数据编码对应的扰乱编码中第i类离散数据对应的扰乱编码值为0的频率
Figure FDA0003695328640000052
和扰乱编码值为1的频率
Figure FDA0003695328640000053
基于
Figure FDA0003695328640000054
Figure FDA0003695328640000055
建立第i类离散数据发生频率方程组;
求解所述第i类离散数据接收频率方程组,获取第i类离散数据的发生频率;
所述第i类离散数据发生频率方程组为:
Figure FDA0003695328640000056
上式中,f0(i)为第i类离散数据不发生频率,f1(i)为第i类离散数据的发生频率,ε为隐私保护预算,δ为松散本地差分隐私下的参数,取值为0到1之间;
所述离散数据编码的长度与离散数据种类总数相等;
所述离散数据编码为(v1...vi...vn),其中,n为离散数据种类总数,vi为第i类离散数据对应的编码值,若用户端向数据中心发送的离散数据的种类为第i类离散数据,则vi=1,否则,vi=0;
所述基于所述离散数据编码中各类离散数据对应的编码值的转换概率确定所述离散数据编码对应的扰乱编码,包括:
在{0,1}集合中以
Figure FDA0003695328640000057
的概率抽取0,以
Figure FDA0003695328640000058
的概率抽取1,若抽中0,则
Figure FDA0003695328640000059
若抽中1,则
Figure FDA00036953286400000510
6.一种离散数据频率估计***,其特征在于,所述***包括:如权利要求2所述的用户端和如权利要求4所述的数据中心。
CN201911298496.4A 2019-12-17 2019-12-17 一种离散数据频率估计方法、用户端、数据中心及*** Active CN112995076B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911298496.4A CN112995076B (zh) 2019-12-17 2019-12-17 一种离散数据频率估计方法、用户端、数据中心及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911298496.4A CN112995076B (zh) 2019-12-17 2019-12-17 一种离散数据频率估计方法、用户端、数据中心及***

Publications (2)

Publication Number Publication Date
CN112995076A CN112995076A (zh) 2021-06-18
CN112995076B true CN112995076B (zh) 2022-09-27

Family

ID=76341887

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911298496.4A Active CN112995076B (zh) 2019-12-17 2019-12-17 一种离散数据频率估计方法、用户端、数据中心及***

Country Status (1)

Country Link
CN (1) CN112995076B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107302521A (zh) * 2017-05-23 2017-10-27 全球能源互联网研究院 一种用户隐私数据的发送方法和接收方法
CN108509627A (zh) * 2018-04-08 2018-09-07 腾讯科技(深圳)有限公司 数据离散化模型训练方法和装置、数据离散方法
CN109299436A (zh) * 2018-09-17 2019-02-01 北京邮电大学 一种满足本地差分隐私的偏好排序数据收集方法
CN110022531A (zh) * 2019-03-01 2019-07-16 华南理工大学 一种本地化差分隐私城市垃圾数据报告和隐私计算方法
WO2019172837A1 (en) * 2018-03-05 2019-09-12 Agency For Science, Technology And Research Method and system for deriving statistical information from encrypted data
CN110569286A (zh) * 2019-09-11 2019-12-13 哈尔滨工业大学(威海) 基于本地差分隐私的活动时序轨迹挖掘的方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107302521A (zh) * 2017-05-23 2017-10-27 全球能源互联网研究院 一种用户隐私数据的发送方法和接收方法
WO2019172837A1 (en) * 2018-03-05 2019-09-12 Agency For Science, Technology And Research Method and system for deriving statistical information from encrypted data
CN108509627A (zh) * 2018-04-08 2018-09-07 腾讯科技(深圳)有限公司 数据离散化模型训练方法和装置、数据离散方法
CN109299436A (zh) * 2018-09-17 2019-02-01 北京邮电大学 一种满足本地差分隐私的偏好排序数据收集方法
CN110022531A (zh) * 2019-03-01 2019-07-16 华南理工大学 一种本地化差分隐私城市垃圾数据报告和隐私计算方法
CN110569286A (zh) * 2019-09-11 2019-12-13 哈尔滨工业大学(威海) 基于本地差分隐私的活动时序轨迹挖掘的方法

Also Published As

Publication number Publication date
CN112995076A (zh) 2021-06-18

Similar Documents

Publication Publication Date Title
KR102045978B1 (ko) 얼굴 인증 방법, 장치 및 컴퓨터 기억매체
US9407435B2 (en) Cryptographic key generation based on multiple biometrics
CN106817358B (zh) 一种用户资源的加密、解密方法和设备
CN110011993B (zh) 一种基于动态多级加解密的二维码大数据安全传输装置
CN110852374A (zh) 数据检测方法、装置、电子设备以及存储介质
Merhav et al. Optimal watermark embedding and detection strategies under limited detection resources
CN112911290B (zh) 一种基于预测差值压缩编码的密文图像可逆数据隐藏方法
CN108648761B (zh) 一种在音频数字水印中嵌入区块链账本的方法
CN110635807A (zh) 一种数据编码方法及译码方法
CN111222158A (zh) 一种基于区块链的两方安全隐私比较方法
CN108322750B (zh) 基于残差系数调制的加密域hevc视频数据隐藏方法
CN115296862A (zh) 一种基于数据编码的网络数据安全传输方法
CN103593590A (zh) 基于云环境的混合加性多次水印嵌入方法及解码方法
CN112995076B (zh) 一种离散数据频率估计方法、用户端、数据中心及***
CN112398861B (zh) web组态化***中敏感数据的加密***及方法
CN116821967B (zh) 用于隐私保护的交集计算方法及***
CN116341582B (zh) 基于二维码的电子通行数据管理方法及***
CN113537516B (zh) 分布式机器学习模型的训练方法、装置、设备和介质
CN115292739B (zh) 一种金属模具设计***的数据管理方法
CN113271469B (zh) 一种安全可逆的视频隐私安全保护***及保护方法
CN112288757B (zh) 一种基于数据打包技术的加密域图像分割优化方法
CN115292726A (zh) 语义通信方法、装置、电子设备及存储介质
CN115001687A (zh) 一种基于秘密共享的身份隐私数据分布式存储方法和***
CN114003939A (zh) 一种用于纵向联邦场景的多重共线性分析方法
CN116737741B (zh) 一种平台商户余额数据实时更新处理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant