CN108363689A - 面向混合云的隐私保护多关键词Top-k密文检索方法及*** - Google Patents

面向混合云的隐私保护多关键词Top-k密文检索方法及*** Download PDF

Info

Publication number
CN108363689A
CN108363689A CN201810122376.8A CN201810122376A CN108363689A CN 108363689 A CN108363689 A CN 108363689A CN 201810122376 A CN201810122376 A CN 201810122376A CN 108363689 A CN108363689 A CN 108363689A
Authority
CN
China
Prior art keywords
document
vector
keyword
retrieval
cloud server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810122376.8A
Other languages
English (en)
Other versions
CN108363689B (zh
Inventor
戴华
朱向洋
杨庚
白双杰
史经启
孙彦珺
王敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Post and Telecommunication University
Nanjing University of Posts and Telecommunications
Original Assignee
Nanjing Post and Telecommunication University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Post and Telecommunication University filed Critical Nanjing Post and Telecommunication University
Priority to CN201810122376.8A priority Critical patent/CN108363689B/zh
Publication of CN108363689A publication Critical patent/CN108363689A/zh
Application granted granted Critical
Publication of CN108363689B publication Critical patent/CN108363689B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24147Distances to closest patterns, e.g. nearest neighbour classification
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/04Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks
    • H04L63/0428Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks wherein the data content is protected, e.g. by encrypting or encapsulating the payload
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/06Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computer Security & Cryptography (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Hardware Design (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Storage Device Security (AREA)

Abstract

本发明公开了一种面向混合云的隐私保护多关键词Top‑k密文检索方法及***。本发明主要解决检索效率低下的问题。其方案是:数据提供端利用关键词之间的相关关系通过聚簇技术生成关键词词典序列;每个文档生成高维的文档向量和低维的文档过滤向量,然后将密文文档和加密后的文档向量外包到不可信的公有云服务器,将明文的文档过滤向量存储到可信的私有云服务器。检索时,首先通过私有云服务器计算候选文档集,然后通过公有云服务器实现检索结果Top‑k文档计算。关键词词典序列中相关关键词聚集特性提高了私有云服务器过滤的效果,压缩了候选文档集的大小。本发明流程简单,安全性高,易于实现,能够在混合云环境中通过较少的计算开销实现高效的多关键词密文检索处理。

Description

面向混合云的隐私保护多关键词Top-k密文检索方法及***
技术领域
本发明涉及用户数据隐私保护,尤其涉及一种面向混合云的隐私保护多关键词Top-k密文检索方法及***。
背景技术
IT资源服务化的思想日益普及,呈现“一切皆服务”(X as a Service,XaaS)的趋势,“服务”成为云计算的核心概念。然而在云计算蓬勃发展的同时,云安全也成为被广泛关注的问题。在云环境中,由于用户无法直接控制放置在远程云服务器(Cloud Server,CS)中的数据,担心自己的外包数据被云服务提供商非法获取或滥用,尤其是对于私密性要求较高的敏感数据,例如电子病历、银行交易数据、用户邮件等。尽管云服务提供商宣称他们会提供一些安全对策来应对隐私泄露问题,例如访问控制技术、防火墙技术和入侵检测技术等,但是用户对数据安全问题的担心毫无疑问是制约云计算进一步发展的主要问题。
保护数据隐私的一种通用做法是在将数据加密处理后再外包到公有云服务器,但是这样严重制约了外包数据的使用。在信息检索研究领域中,现有的多关键词检索主要是面向明文数据的,无法直接应用到密文检索领域。而将所有加密数据从云端下载到本地进行解密显然是一种不切实际且资源浪费的处理方法。因此,研究并解决云环境中具备隐私保护功能的密文数据检索机制是一个挑战性问题,这也已成为近年来云计算研究领域关注的热点问题之一。
现有技术中大多方法默认都是采用公用云服务,基于公有云按照“半诚实模型”方式提供服务这一假设的,提出一系列加密云环境中多关键词密文检索处理方法,但是这些方法存在检索效率低、检索结果不精确、索引树构建复杂等一种或多种问题。
针对这些问题,申请号201710181664.6的中国发明专利申请公开了一种云计算中保护数据隐私的快速多关键词语义排序搜索方法,通过加入私有云服务器,在为每个文档创建文档向量的同时,创建与之对应的标识向量,将加密文档向量外包到公有云服务器,将明文标识向量存储到私有云服务器,通过私有云服务器实现文档集初步过滤操作,减少与检索向量相关度得分计算的文档向量个数,减少检索计算开销,但是该方法由于关键词字典中关键词的分布是随机的,私有云服务器过滤效果不佳,导致公有云中需要计算大量文档向量和检索向量之间的相关度得分。因此如何提高私有云服务器过滤效果,对于提高混合云中支持隐私保护的多关键词密文检索效率有重要作用。
发明内容
发明目的:本发明针对现有技术存在的问题,提供一种面向混合云的隐私保护多关键词Top-k密文检索方法及***,本发明可以有效地实现用户数据的隐私保护,提升多关键词密文检索的效率,实现精确地Top-k检索。
技术方案:本发明所述的面向混合云的隐私保护多关键词Top-k密文检索方法包括:
(1)数据提供端从提供的文档集中提取关键词集合,并通过聚簇分块生成关键词词典序列;再根据关键词词典序列为文档集中每个文档生成一对应的明文文档向量,并依据关键词词典序列的分块情况将明文文档向量分块,形成文档过滤向量;之后将明文文档向量加密形成加密文档向量,将文档集中的每一文档加密形成加密文档集;最后将文档过滤向量传输至私有云服务器,将加密文档向量和加密文档集传输至公有云服务器;
(2)数据检索端根据用户提供的多个关键词生成检索向量,进行归一化后采用安全算法生成检索陷门,连同用户需要检索的文档个数k传输至公有云服务器;再依据关键词词典序列中关键词的分块情况,将用户提供的多个关键词生成检索过滤向量,并传输至私有云服务器;
(3)私有云服务器将接收到的检索过滤向量和每个文档的文档过滤向量分别进行与运算,若运算得到的向量所有位不全为0,则将对应的文档编号添加到候选文档集中,并将候选文档集传输至公有云服务器;
(4)公有云服务器根据接收到的候选文档集、检索陷门和检索文档个数k,分别计算候选文档集中每个文档对应的加密文档向量和检索陷门之间的安全内积,根据安全内积选取候选文档集中与用户提供的关键词最相关的k个密文文档,将该k个密文文档返回至数据检索端;
(5)数据检索端对接收的k个密文文档进行解密,得到最相关的k个明文文档。
进一步的,步骤(1)具体包括:
(1-1)数据提供端从提供的文档集DS中提取关键词,得到关键词集合{w1,w2,…,wn};
(1-2)将关键词集合中的关键词根据相关关系进行聚簇操作,得到若干个聚类子簇{c1,c2,…,ct};
(1-3)将每个子簇作为一个分块,从而得到t个分块,分别为b1,b2,…,bt,再根据分块生成关键词词典序列W={w(b1,1),w(b1,2),…,w(b2,1),w(b2,2),…,w(bt,1),w(bt,2),…},其中w(bj,x)表示属于分块bj中的第x个关键词,每个块中的关键词无序;分块bj={w(bj,x)|0<x≤|bj|};
(1-4)采用TF-IDF算法和空间向量模型,根据关键词词典序列中关键词的位置,为文档集DS={D1,D2,…,Dm}中每个文档Di生成一个对应的明文文档向量Vi,并进行归一化处理;其中,Vi的维度为n,每位取值为该位对应的关键词在文档Di中的词频TF值;
(1-5)根据关键词词典序列的分块情况,将明文文档向量Vi分成t个分块,分块边界和关键词词典序列的分块边界相同,得到每个文档Di的文档过滤向量DFi={b1,b2,…,bt};其中,若Vi中分块bj对应的所有关键词所在的位置取值都为0,则bj块的取值为0,否则bj块的取值为1,DFi是t维的每位取值为0/1的向量;
(1-6)生成加密密钥SK(S,M1,M2,kf);其中,S是一个每位取值为0/1的随机向量,M1和M2是两个n×n可逆矩阵,n是关键词词典序列的长度,kf是文档加密密钥;
(1-7)通过安全KNN技术采用生成的加密密钥对每个明文文档向量Vi加密,得到对应的加密文档向量其中,当随机向量S中第j个元素S[j]=0时,Vi′+Vi″=Vi,当S[j]=1时,Vi′=Vi″=Vi
(1-8)通过对称加密算法加密文档集DS中每个文档,得到加密文档集ES={e1,e2,…,em};
(1-9)将文档过滤向量传输至私有云服务器进行存储,将加密文档向量和加密文档集传输至公有云服务器进行存储。
进一步的,步骤(2)具体包括:
(2-1)数据检索端根据用户提供的多个关键词{w1,w2,…,wx},采用TF-IDF算法和空间向量模型生成检索向量Q,并进行归一化;其中,Q的第j个元素Q[j]为第j位关键词wj在数据提供端提供的文档集DS中的逆文档频率IDF值;
(2-2)基于检索向量Q,采用安全KNN算法,生成检索陷门其中,其中当数据提供端生成的加密密钥中的随机向量的第j位S[j]=0时,Q′[j]=Q″[j]=Q[j],当S[j]=1时,Q′[j]+Q″[j]=Q[j];
(2-3)根据关键词词典序列中关键词的分块情况,生成检索过滤向量QF,QF={b1,b2,…,bt},QF是t维每位取值0/1的向量,若分块bj对应的所有关键词在检索向量Q中对应的所有位的取值都是0,则QF[j]=0,否则QF[j]=1;
(2-4)将检索陷门和用户需要检索的文档个数k传输至公有云服务器,将检索过滤向量传输至私有云服务器。
进一步的,步骤(3)具体包括:
(3-1)私有云服务器将接收到的检索过滤向量QF和每个文档的文档过滤向量DFi分别进行与运算,若QF&DFi的运算得到的向量所有位不全为0,则将DFi对应的文档编号Didi添加到候选文档集中,得到候选文档集CDS={d1,d2,…};
(3-2)将候选文档集CDS发送至公有云服务器。
本发明所述的面向混合云的隐私保护多关键词Top-k密文检索***,包括数据提供端、数据检索端、私有云服务器和公有云服务器,其中:
数据提供端用于从提供的文档集中提取关键词集合,并通过聚簇分块生成关键词词典序列;以及根据关键词词典序列为文档集中每个文档生成一对应的明文文档向量,并依据关键词词典序列的分块情况将明文文档向量分块,形成文档过滤向量;以及将明文文档向量加密形成加密文档向量,将文档集中的每一文档加密形成加密文档集;以及将文档过滤向量传输至私有云服务器,将加密文档向量和加密文档集传输至公有云服务器;
数据检索端用于根据用户提供的多个关键词生成检索向量,进行归一化后采用安全算法生成检索陷门,连同用户需要检索的文档个数k传输至公有云服务器;以及依据关键词词典序列中关键词的分块情况,将用户提供的多个关键词生成检索过滤向量,并传输至私有云服务器;
私有云服务器用于将接收到的检索过滤向量和每个文档的文档过滤向量分别进行与运算,若运算得到的向量所有位不全为0,则将对应的文档编号添加到候选文档集中,并将候选文档集传输至公有云服务器;
公有云服务器用于根据接收到的候选文档集、检索陷门和检索文档个数k,分别计算候选文档集中每个文档对应的加密文档向量和检索陷门之间的安全内积,根据安全内积选取候选文档集中与用户提供的关键词最相关的k个密文文档,将该k个密文文档返回至数据检索端;
数据检索端还用于对接收的k个密文文档进行解密,得到最相关的k个明文文档。
进一步的,所述数据提供端具体包括:
关键词提取模块,用于从提供的文档集DS中提取关键词,得到关键词集合{w1,w2,…,wn};
聚簇模块,用于将关键词集合中的关键词根据相关关系进行聚簇操作,得到若干个聚类子簇{c1,c2,…,ct};
关键词词典生成模块,用于将每个子簇作为一个分块,从而得到t个分块,分别为b1,b2,…,bt,再根据分块生成关键词词典序列W={w(b1,1),w(b1,2),…,w(b2,1),w(b2,2),…,w(bt,1),w(bt,2),…};其中w(bj,x)表示属于分块bj中的第x个关键词,每个块中的关键词无序;分块bj={w(bj,x)|0<x≤|bj|};
明文文档向量生成模块,用于采用TF-IDF算法和空间向量模型,根据关键词词典序列中关键词的位置,为文档集DS={D1,D2,…,Dm}中每个文档Di生成一个对应的明文文档向量Vi,并进行归一化处理;其中,Vi的维度为n,每位取值为该位对应的关键词在文档Di中的词频TF值;
文档过滤向量生成模块,用于根据关键词词典序列的分块情况,将明文文档向量Vi分成t个分块,分块边界和关键词词典序列的分块边界相同,得到每个文档Di的文档过滤向量DFi={b1,b2,…,bt};其中,若Vi中分块bj对应的所有关键词所在的位置取值都为0,则bj块的取值为0,否则bj块的取值为1,DFi是t维的每位取值为0/1的向量;
密钥生成模块,用于生成加密密钥SK(S,M1,M2,kf);其中,S是一个每位取值为0/1的随机向量,M1和M2是两个n×n可逆矩阵,n是关键词词典序列的长度,kf是文档加密密钥;
文档向量加密模块,用于通过安全KNN技术采用生成的加密密钥对每个明文文档向量Vi加密,得到对应的加密文档向量其中,当随机向量S中第j个元素S[j]=0时,Vi′+Vi″=Vi,当S[j]=1时,Vi′=Vi″=Vi
文档加密模块,用于通过对称加密算法加密文档集DS中每个文档,得到加密文档集ES={e1,e2,…,em};
传输模块,用于将文档过滤向量传输至私有云服务器进行存储,将加密文档向量和加密文档集传输至公有云服务器进行存储。
进一步的,所述数据检索端具体包括:
检索向量生成模块,用于根据用户提供的多个关键词{w1,w2,…,wx},采用TF-IDF算法和空间向量模型生成检索向量Q,并进行归一化;其中,Q的第j个元素Q[j]为第j位关键词wj在数据提供端提供的文档集DS中的逆文档频率IDF值;
检索陷门生成模块,用于基于检索向量Q,采用安全KNN算法,生成检索陷门其中,其中当数据提供端生成的加密密钥中的随机向量的第j位S[j]=0时,Q′[j]=Q″[j]=Q[j],当S[j]=1时,Q′[j]+Q″[j]=Q[j];
检索过滤向量生成模块,用于根据关键词词典序列中关键词的分块情况,生成检索过滤向量QF,QF={b1,b2,…,bt},QF是t维每位取值0/1的向量,若分块bj对应的所有关键词在检索向量Q中对应的所有位的取值都是0,则QF[j]=0,否则QF[j]=1;
传输模块,用于将检索陷门和用户需要检索的文档个数k传输至公有云服务器,将检索过滤向量传输至私有云服务器。
进一步的,所述私有云服务器具体包括:
与运算模块,用于将接收到的检索过滤向量QF和每个文档的文档过滤向量DFi分别进行与运算,若QF&DFi的运算得到的向量所有位不全为0,则将DFi对应的文档编号Didi添加到候选文档集中,得到候选文档集CDS={d1,d2,…};
传输模块,用于将候选文档集CDS发送至公有云服务器。
有益效果:本发明与现有技术相比,其显著优点是:
1、安全性高
本发明实现的是针对不可信公有云环境中,实现根据多关键词进行密文检索,通过安全KNN技术实现安全内积计算,可以实现两个加密向量之间的内积值等于两个明文向量之间的内积值,在公有云环境中不需要对检索陷门进行解密,也不需要对加密的文档向量进行解密操作,更不需要对加密的文档进行解密操作。在公有云部分,全程都是在密文下进行运算,最终得到的Top-k结果。因此,安全KNN技术的运用能够实现根据多关键词进行Top-k检索结果计算的同时,保护数据拥有者的数据隐私。安全KNN技术已经广泛应用于多关键词密文检索领域。
2、精确性高
本发明给出的面向混合云的隐私保护多关键词Top-k密文检索方法,在数据检索端提供感兴趣的多关键词进行检索时,是分成两个步骤进行的,首先私有云服务器生成候选文档集CDS,然后公有云服务器搜索候选文档集中和感兴趣的多关键词最相关的Top-k结果。私有云生成候选文档集时,对于全部文档集DS中的任一文档Di只要包含1个或多个数据使用者提供的感兴趣的多关键词,都会被添加到候选文档集,因此不存在满足条件的Top-k文档不在候选文档集的情况;而当公有云服务器得到私有云服务器发送过来的候选文档集时,是严格根据候选文档集中的每个文档的加密文档向量和检索陷门之间的内积计算结果得到的Top-k结果,因此,本发明私有云服务器和公有云服务器协作的方式能够对检索结果进行精确的排序并返回Top-k文档作为检索结果给数据检索端。
3、检索效率高
本发明给出的面向混合云的隐私保护多关键词Top-k密文检索方法,针对目前安全KNN计算、TF-IDF和空间向量模型等技术运用为主的可搜索加密方法效率不高的问题,通过加入了可信私有云服务器,给出了文档向量分块生成文档过滤向量的方法,将文档过滤向量上传到私有云服务器,因为文档过滤向量的维度较小,私有云服务器能够根据数据使用者提供的检索过滤向量,通过较少的运算开销就可以得到候选文档集,快速过滤掉大量无关文档(这些过滤掉的文档不可能是最终的Top-k结果),候选文档集相对于原始文档集来说要小的多,因此公有云服务器只需要进行少量的加密向量间的内积计算,能够大大节省公有云服务器的计算开销。除此之外,鉴于用户输入的感兴趣的多关键词往往是相关的这一事实,为了提高私有云服务器的过滤效果,进一步压缩候选文档集,关键词词典序列中关键词的位置并不是随机摆放的,而是根据关键词相关关系进行聚簇,然后得到多个子簇,每个子簇内关键词都位于关键词词典序列中相同的块中,这样生成的文档过滤向量和检索过滤向量,更有利于压缩候选文档集的大小,候选文档集中文档个数变少,则公有云服务器中需要计算加密向量之间的内积的次数就变小,自然降低了计算开销,提高了多关键词密文检索的效率。
附图说明
图1是本发明提供的面向混合云的隐私保护多关键词Top-k密文检索方法的架构图;
图2是本发明提供的面向混合云的隐私保护多关键词Top-k密文检索方法的流程示意图;
图3是关键词聚簇构造关键词词典序列示意图,图示中关键词集合聚簇成10个小簇,对应关键词词典序列为10个块,每个块中包含关键词个数不定,和对应小簇中关键词数量相同;
图4是未做归一化处理前的文档向量和文档过滤向量、以及检索向量和检索过滤向量的示意图;
图5是检索流程示意图,其中,首先私有云服务器通过文档过滤向量和检索过滤向量之间的与运算,得到候选文档集,然后将候选文档集发送给公有云服务器;公有云服务器在候选文档集中,通过计算文档向量和检索向量之间的相关度得分得到Top-k文档。为了画图简洁性,文档向量和检索向量没有进行归一化和加密处理。
具体实施方式
实施例1
本实施例提供了一种面向混合云的隐私保护多关键词Top-k密文检索方法,如图1和图2所示,包括以下步骤:
(1)数据提供端从提供的文档集中提取关键词集合,并通过聚簇分块生成关键词词典序列;再根据关键词词典序列为文档集中每个文档生成一对应的明文文档向量,并依据关键词词典序列的分块情况将明文文档向量分块,形成文档过滤向量;之后将明文文档向量加密形成加密文档向量,将文档集中的每一文档加密形成加密文档集;最后将文档过滤向量传输至私有云服务器,将加密文档向量和加密文档集传输至公有云服务器。
该步骤具体包括:
(1-1)数据提供端从提供的文档集DS中提取关键词,得到关键词集合{w1,w2,…,wn};
(1-2)将关键词集合中的关键词根据相关关系进行聚簇操作,得到若干个聚类子簇{c1,c2,…,ct};
(1-3)将每个子簇作为一个分块,从而得到t个分块,分别为b1,b2,…,bt,再根据分块生成关键词词典序列W={w(b1,1),w(b1,2),…,w(b2,1),w(b2,2),…,w(bt,1),w(bt,2),…},其中w(bj,x)表示属于分块bj中的第x个关键词,每个块中的关键词无序;分块bj={w(bj,x)|0<x≤|bj|};因为关键词聚簇特性,关键词词典序列中相关性强的关键词聚集在同一个块中。例如图3中,关键词集合一共聚簇成10个小自然簇,每个簇中的关键词数量不定,则关键词词典包含10个关键词块,每个关键词块中包含的关键词数量和对应簇中包含关键词数量相同,然后根据这些块,生成关键词词典序列;
(1-4)采用TF-IDF算法和空间向量模型,根据关键词词典序列中关键词的位置,为文档集DS={D1,D2,…,Dm}中每个文档Di生成一个对应的明文文档向量Vi,并进行归一化处理;其中,Vi的维度为n,每位取值为该位对应的关键词在文档Di中的词频TF值;
(1-5)根据关键词词典序列的分块情况,将明文文档向量Vi分成t个分块,分块边界和关键词词典序列的分块边界相同,得到每个文档Di的文档过滤向量DFi={b1,b2,…,bt};其中,若Vi中分块bj对应的所有关键词所在的位置取值都为0,则bj块的取值为0,否则bj块的取值为1,DFi是t维的每位取值为0/1的向量;例如图4中,给出了文档向量和对应文档过滤向量的具体示例,考虑到画图简洁性,没有对文档向量进行归一化处理,文档为Di,对应文档向量为Vi,根据关键词词典序列中块边界的位置,构成的文档过滤向量DFi如图4中所示;
(1-6)生成加密密钥SK(S,M1,M2,kf);其中,S是一个每位取值为0/1的n维随机列向量,M1和M2是两个n×n可逆矩阵,n是关键词词典序列的长度,kf是文档加密密钥;SK只提供DO,DU使用,对CS私密。
(1-7)通过安全KNN技术采用生成的加密密钥对每个明文文档向量Vi加密,得到对应的加密文档向量其中,当随机向量S中第j个元素S[j]=0时,Vi′+Vi″=Vi,当S[j]=1时,Vi′=Vi″=Vi
(1-8)通过对称加密算法加密文档集DS中每个文档,得到加密文档集ES={e1,e2,…,em};
(1-9)将文档过滤向量传输至私有云服务器进行存储,将加密文档向量和加密文档集传输至公有云服务器进行存储。
(2)数据检索端根据用户提供的多个关键词生成检索向量,进行归一化后采用安全算法生成检索陷门,连同用户需要检索的文档个数k传输至公有云服务器;再依据关键词词典序列中关键词的分块情况,将用户提供的多个关键词生成检索过滤向量,并传输至私有云服务器。
该步骤具体包括:
(2-1)数据检索端根据用户提供的多个关键词{w1,w2,…,wx},采用TF-IDF算法和空间向量模型生成检索向量Q,并进行归一化;其中,Q的第j个元素Q[j]为第j位关键词wj在数据提供端提供的文档集DS中的逆文档频率IDF值;
(2-2)基于检索向量Q,采用安全KNN算法,生成检索陷门其中,其中当数据提供端生成的加密密钥中的随机向量的第j位S[j]=0时,Q′[j]=Q″[j]=Q[j],当S[j]=1时,Q′[j]+Q″[j]=Q[j];
(2-3)根据关键词词典序列中关键词的分块情况,生成检索过滤向量QF,QF={b1,b2,…,bt},QF是t维每位取值0/1的向量,若分块bj对应的所有关键词在检索向量Q中对应的所有位的取值都是0,则QF[j]=0,否则QF[j]=1;
(2-4)将检索陷门和用户需要检索的文档个数k传输至公有云服务器,将检索过滤向量传输至私有云服务器。
(3)私有云服务器将接收到的检索过滤向量和每个文档的文档过滤向量分别进行与运算,若运算得到的向量所有位不全为0,则将对应的文档编号添加到候选文档集中,并将候选文档集传输至公有云服务器。
该步骤具体包括:
(3-1)私有云服务器将接收到的检索过滤向量QF和每个文档的文档过滤向量DFi分别进行与运算,若QF&DFi的运算得到的向量所有位不全为0,则将DFi对应的文档编号Didi添加到候选文档集中,得到候选文档集CDS={d1,d2,…};
(3-2)将候选文档集CDS发送至公有云服务器。图5给出一个具体的查询示例,私有云服务器通过对检索过滤向量和文档过滤向量做与运算,找到运算结果不全为0的文档过滤向量对应的文档编号,从而得到候选文档集CDS={Did1,Did5,Did6},然后将CDS发送给公有云服务器。
(4)公有云服务器根据接收到的候选文档集、检索陷门和检索文档个数k,分别计算候选文档集中每个文档对应的加密文档向量和检索陷门之间的安全内积,根据安全内积选取候选文档集中与用户提供的关键词最相关的k个密文文档,将该k个密文文档返回至数据检索端。
例如,图5中,公有云服务器接收到私有云服务器发送的候选文档集CDS=CDS={Did1,Did5,Did6},此时Top-k文档的搜索空间已经不是全集DS={D1,D2,…,D10},而变成了候选文档集{D1,D5,D6},搜索空间由原来的10个文档变成了现在的3个文档,因此只需要计算3次向量之间的内积运算,此时通过在候选文档集中逐一计算每个文档对应的加密文档向量和加密检索向量之间的点积,从而得到3个相关度得分,选择最大的k个对应的加密文档,返回给数据检索端。
(5)数据检索端对接收的k个密文文档采用对称密钥进行解密,得到最相关的k个明文文档。
实施例2
本实施例提供了一种面向混合云的隐私保护多关键词Top-k密文检索***,包括数据提供端、数据检索端、私有云服务器和公有云服务器,其中:
数据提供端用于从提供的文档集中提取关键词集合,并通过聚簇分块生成关键词词典序列;以及根据关键词词典序列为文档集中每个文档生成一对应的明文文档向量,并依据关键词词典序列的分块情况将明文文档向量分块,形成文档过滤向量;以及将明文文档向量加密形成加密文档向量,将文档集中的每一文档加密形成加密文档集;以及将文档过滤向量传输至私有云服务器,将加密文档向量和加密文档集传输至公有云服务器;
数据检索端用于根据用户提供的多个关键词生成检索向量,进行归一化后采用安全算法生成检索陷门,连同用户需要检索的文档个数k传输至公有云服务器;以及依据关键词词典序列中关键词的分块情况,将用户提供的多个关键词生成检索过滤向量,并传输至私有云服务器;
私有云服务器用于将接收到的检索过滤向量和每个文档的文档过滤向量分别进行与运算,若运算得到的向量所有位不全为0,则将对应的文档编号添加到候选文档集中,并将候选文档集传输至公有云服务器;
公有云服务器用于根据接收到的候选文档集、检索陷门和检索文档个数k,分别计算候选文档集中每个文档对应的加密文档向量和检索陷门之间的安全内积,根据安全内积选取候选文档集中与用户提供的关键词最相关的k个密文文档,将该k个密文文档返回至数据检索端;
数据检索端还用于对接收的k个密文文档进行解密,得到最相关的k个明文文档。
进一步的,所述数据提供端具体包括:
关键词提取模块,用于从提供的文档集DS中提取关键词,得到关键词集合{w1,w2,…,wn};
聚簇模块,用于将关键词集合中的关键词根据相关关系进行聚簇操作,得到若干个聚类子簇{c1,c2,…,ct};
关键词词典生成模块,用于将每个子簇作为一个分块,从而得到t个分块,分别为b1,b2,…,bt,再根据分块生成关键词词典序列W={w(b1,1),w(b1,2),…,w(b2,1),w(b2,2),…,w(bt,1),w(bt,2),…};其中w(bj,x)表示属于分块bj中的第x个关键词,每个块中的关键词无序;分块bj={w(bj,x)|0<x≤|bj|};
明文文档向量生成模块,用于采用TF-IDF算法和空间向量模型,根据关键词词典序列中关键词的位置,为文档集DS={D1,D2,…,Dm}中每个文档Di生成一个对应的明文文档向量Vi,并进行归一化处理;其中,Vi的维度为n,每位取值为该位对应的关键词在文档Di中的词频TF值;
文档过滤向量生成模块,用于根据关键词词典序列的分块情况,将明文文档向量Vi分成t个分块,分块边界和关键词词典序列的分块边界相同,得到每个文档Di的文档过滤向量DFi={b1,b2,…,bt};其中,若Vi中分块bj对应的所有关键词所在的位置取值都为0,则bj块的取值为0,否则bj块的取值为1,DFi是t维的每位取值为0/1的向量;
密钥生成模块,用于生成加密密钥SK(S,M1,M2,kf);其中,S是一个每位取值为0/1的随机向量,M1和M2是两个n×n可逆矩阵,n是关键词词典序列的长度,kf是文档加密密钥;
文档向量加密模块,用于通过安全KNN技术采用生成的加密密钥对每个明文文档向量Vi加密,得到对应的加密文档向量其中,当随机向量S中第j个元素S[j]=0时,Vi′+Vi″=Vi,当S[j]=1时,Vi′=Vi″=Vi
文档加密模块,用于通过对称加密算法加密文档集DS中每个文档,得到加密文档集ES={e1,e2,…,em};
传输模块,用于将文档过滤向量传输至私有云服务器进行存储,将加密文档向量和加密文档集传输至公有云服务器进行存储。
进一步的,所述数据检索端具体包括:
检索向量生成模块,用于根据用户提供的多个关键词{w1,w2,…,wx},采用TF-IDF算法和空间向量模型生成检索向量Q,并进行归一化;其中,Q的第j个元素Q[j]为第j位关键词wj在数据提供端提供的文档集DS中的逆文档频率IDF值;
检索陷门生成模块,用于基于检索向量Q,采用安全KNN算法,生成检索陷门其中,其中当数据提供端生成的加密密钥中的随机向量的第j位S[j]=0时,Q′[j]=Q″[j]=Q[j],当S[j]=1时,Q′[j]+Q″[j]=Q[j];
检索过滤向量生成模块,用于根据关键词词典序列中关键词的分块情况,生成检索过滤向量QF,QF={b1,b2,…,bt},QF是t维每位取值0/1的向量,若分块bj对应的所有关键词在检索向量Q中对应的所有位的取值都是0,则QF[j]=0,否则QF[j]=1;
传输模块,用于将检索陷门和用户需要检索的文档个数k传输至公有云服务器,将检索过滤向量传输至私有云服务器。
进一步的,所述私有云服务器具体包括:
与运算模块,用于将接收到的检索过滤向量QF和每个文档的文档过滤向量DFi分别进行与运算,若QF&DFi的运算得到的向量所有位不全为0,则将DFi对应的文档编号Didi添加到候选文档集中,得到候选文档集CDS={d1,d2,…};
传输模块,用于将候选文档集CDS发送至公有云服务器。
本***与实施例1的方法一一对应,其他部分不再赘述,参考实施例1即可。
以上所揭露的仅为本发明的较佳实施例而已,不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

Claims (8)

1.一种面向混合云的隐私保护多关键词Top-k密文检索方法,其特征在于该方法包括:
(1)数据提供端从提供的文档集中提取关键词集合,并通过聚簇分块生成关键词词典序列;再根据关键词词典序列为文档集中每个文档生成一对应的明文文档向量,并依据关键词词典序列的分块情况将明文文档向量分块,形成文档过滤向量;之后将明文文档向量加密形成加密文档向量,将文档集中的每一文档加密形成加密文档集;最后将文档过滤向量传输至私有云服务器,将加密文档向量和加密文档集传输至公有云服务器;
(2)数据检索端根据用户提供的多个关键词生成检索向量,进行归一化后采用安全算法生成检索陷门,连同用户需要检索的文档个数k传输至公有云服务器;再依据关键词词典序列中关键词的分块情况,将用户提供的多个关键词生成检索过滤向量,并传输至私有云服务器;
(3)私有云服务器将接收到的检索过滤向量和每个文档的文档过滤向量分别进行与运算,若运算得到的向量所有位不全为0,则将对应的文档编号添加到候选文档集中,并将候选文档集传输至公有云服务器;
(4)公有云服务器根据接收到的候选文档集、检索陷门和检索文档个数k,分别计算候选文档集中每个文档对应的加密文档向量和检索陷门之间的安全内积,根据安全内积选取候选文档集中与用户提供的关键词最相关的k个密文文档,将该k个密文文档返回至数据检索端;
(5)数据检索端对接收的k个密文文档进行解密,得到最相关的k个明文文档。
2.根据权利要求1所述的面向混合云的隐私保护多关键词Top-k密文检索方法,其特征在于:步骤(1)具体包括:
(1-1)数据提供端从提供的文档集DS中提取关键词,得到关键词集合{w1,w2,…,wn};
(1-2)将关键词集合中的关键词根据相关关系进行聚簇操作,得到若干个聚类子簇{c1,c2,…,ct};
(1-3)将每个子簇作为一个分块,从而得到t个分块,分别为b1,b2,…,bt,再根据分块生成关键词词典序列W={w(b1,1),w(b1,2),…,w(b2,1),w(b2,2),…,w(bt,1),w(bt,2),…},其中w(bj,x)表示属于分块bj中的第x个关键词,每个块中的关键词无序;分块bj={w(bj,x)|0<x≤|bj|};
(1-4)采用TF-IDF算法和空间向量模型,根据关键词词典序列中关键词的位置,为文档集DS={D1,D2,…,Dm}中每个文档Di生成一个对应的明文文档向量Vi,并进行归一化处理;其中,Vi的维度为n,每位取值为该位对应的关键词在文档Di中的词频TF值;
(1-5)根据关键词词典序列的分块情况,将明文文档向量Vi分成t个分块,分块边界和关键词词典序列的分块边界相同,得到每个文档Di的文档过滤向量DFi={b1,b2,…,bt};其中,若Vi中分块bj对应的所有关键词所在的位置取值都为0,则bj块的取值为0,否则bj块的取值为1,DFi是t维的每位取值为0/1的向量;
(1-6)生成加密密钥SK(S,M1,M2,kf);其中,S是一个每位取值为0/1的随机向量,M1和M2是两个n×n可逆矩阵,n是关键词词典序列的长度,kf是文档加密密钥;
(1-7)通过安全KNN技术采用生成的加密密钥对每个明文文档向量Vi加密,得到对应的加密文档向量其中,当随机向量S中第j个元素S[j]=0时,V′i+V″i=Vi,当S[j]=1时,V′i=V″i=Vi
(1-8)通过对称加密算法加密文档集DS中每个文档,得到加密文档集ES={e1,e2,…,em};
(1-9)将文档过滤向量传输至私有云服务器进行存储,将加密文档向量和加密文档集传输至公有云服务器进行存储。
3.根据权利要求1所述的面向混合云的隐私保护多关键词Top-k密文检索方法,其特征在于:步骤(2)具体包括:
(2-1)数据检索端根据用户提供的多个关键词{w1,w2,…,wx},采用TF-IDF算法和空间向量模型生成检索向量Q,并进行归一化;其中,Q的第j个元素Q[j]为第j位关键词wj在数据提供端提供的文档集DS中的逆文档频率IDF值;
(2-2)基于检索向量Q,采用安全KNN算法,生成检索陷门其中,其中当数据提供端生成的加密密钥中的随机向量的第j位S[j]=0时,Q′[j]=Q″[j]=Q[j],当S[j]=1时,Q′[j]+Q″[j]=Q[j];
(2-3)根据关键词词典序列中关键词的分块情况,生成检索过滤向量QF,QF={b1,b2,…,bt},QF是t维每位取值0/1的向量,若分块bj对应的所有关键词在检索向量Q中对应的所有位的取值都是0,则QF[j]=0,否则QF[j]=1;
(2-4)将检索陷门和用户需要检索的文档个数k传输至公有云服务器,将检索过滤向量传输至私有云服务器。
4.根据权利要求1所述的面向混合云的隐私保护多关键词Top-k密文检索方法,其特征在于:步骤(3)具体包括:
(3-1)私有云服务器将接收到的检索过滤向量QF和每个文档的文档过滤向量DFi分别进行与运算,若QF&DFi的运算得到的向量所有位不全为0,则将DFi对应的文档编号Didi添加到候选文档集中,得到候选文档集CDS={d1,d2,…};
(3-2)将候选文档集CDS发送至公有云服务器。
5.一种面向混合云的隐私保护多关键词Top-k密文检索***,其特征在于该***包括数据提供端、数据检索端、私有云服务器和公有云服务器,其中:
数据提供端用于从提供的文档集中提取关键词集合,并通过聚簇分块生成关键词词典序列;以及根据关键词词典序列为文档集中每个文档生成一对应的明文文档向量,并依据关键词词典序列的分块情况将明文文档向量分块,形成文档过滤向量;以及将明文文档向量加密形成加密文档向量,将文档集中的每一文档加密形成加密文档集;以及将文档过滤向量传输至私有云服务器,将加密文档向量和加密文档集传输至公有云服务器;
数据检索端用于根据用户提供的多个关键词生成检索向量,进行归一化后采用安全算法生成检索陷门,连同用户需要检索的文档个数k传输至公有云服务器;以及依据关键词词典序列中关键词的分块情况,将用户提供的多个关键词生成检索过滤向量,并传输至私有云服务器;
私有云服务器用于将接收到的检索过滤向量和每个文档的文档过滤向量分别进行与运算,若运算得到的向量所有位不全为0,则将对应的文档编号添加到候选文档集中,并将候选文档集传输至公有云服务器;
公有云服务器用于根据接收到的候选文档集、检索陷门和检索文档个数k,分别计算候选文档集中每个文档对应的加密文档向量和检索陷门之间的安全内积,根据安全内积选取候选文档集中与用户提供的关键词最相关的k个密文文档,将该k个密文文档返回至数据检索端;
数据检索端还用于对接收的k个密文文档进行解密,得到最相关的k个明文文档。
6.根据权利要求5所述的面向混合云的隐私保护多关键词Top-k密文检索***,其特征在于:所述数据提供端具体包括:
关键词提取模块,用于从提供的文档集DS中提取关键词,得到关键词集合{w1,w2,…,wn};
聚簇模块,用于将关键词集合中的关键词根据相关关系进行聚簇操作,得到若干个聚类子簇{c1,c2,…,ct};
关键词词典生成模块,用于将每个子簇作为一个分块,从而得到t个分块,分别为b1,b2,…,bt,再根据分块生成关键词词典序列W={w(b1,1),w(b1,2),…,w(b2,1),w(b2,2),…,w(bt,1),w(bt,2),…};其中w(bj,x)表示属于分块bj中的第x个关键词,每个块中的关键词无序;分块bj={w(bj,x)|0<x≤|bj|};
明文文档向量生成模块,用于采用TF-IDF算法和空间向量模型,根据关键词词典序列中关键词的位置,为文档集DS={D1,D2,…,Dm}中每个文档Di生成一个对应的明文文档向量Vi,并进行归一化处理;其中,Vi的维度为n,每位取值为该位对应的关键词在文档Di中的词频TF值;
文档过滤向量生成模块,用于根据关键词词典序列的分块情况,将明文文档向量Vi分成t个分块,分块边界和关键词词典序列的分块边界相同,得到每个文档Di的文档过滤向量DFi={b1,b2,…,bt};其中,若Vi中分块bj对应的所有关键词所在的位置取值都为0,则bj块的取值为0,否则bj块的取值为1,DFi是t维的每位取值为0/1的向量;
密钥生成模块,用于生成加密密钥SK(S,M1,M2,kf);其中,S是一个每位取值为0/1的随机向量,M1和M2是两个n×n可逆矩阵,n是关键词词典序列的长度,kf是文档加密密钥;
文档向量加密模块,用于通过安全KNN技术采用生成的加密密钥对每个明文文档向量Vi加密,得到对应的加密文档向量其中,当随机向量S中第j个元素S[j]=0时,V′i+V″i=Vi,当S[j]=1时,V′i=V″i=Vi
文档加密模块,用于通过对称加密算法加密文档集DS中每个文档,得到加密文档集ES={e1,e2,…,em};
传输模块,用于将文档过滤向量传输至私有云服务器进行存储,将加密文档向量和加密文档集传输至公有云服务器进行存储。
7.根据权利要求5所述的面向混合云的隐私保护多关键词Top-k密文检索***,其特征在于:所述数据检索端具体包括:
检索向量生成模块,用于根据用户提供的多个关键词{w1,w2,…,wx},采用TF-IDF算法和空间向量模型生成检索向量Q,并进行归一化;其中,Q的第j个元素Q[j]为第j位关键词wj在数据提供端提供的文档集DS中的逆文档频率IDF值;
检索陷门生成模块,用于基于检索向量Q,采用安全KNN算法,生成检索陷门其中,其中当数据提供端生成的加密密钥中的随机向量的第j位S[j]=0时,Q′[j]=Q″[j]=Q[j],当S[j]=1时,Q′[j]+Q″[j]=Q[j];
检索过滤向量生成模块,用于根据关键词词典序列中关键词的分块情况,生成检索过滤向量QF,QF={b1,b2,…,bt},QF是t维每位取值0/1的向量,若分块bj对应的所有关键词在检索向量Q中对应的所有位的取值都是0,则QF[j]=0,否则QF[j]=1;
传输模块,用于将检索陷门和用户需要检索的文档个数k传输至公有云服务器,将检索过滤向量传输至私有云服务器。
8.根据权利要求5所述的面向混合云的隐私保护多关键词Top-k密文检索***,其特征在于:所述私有云服务器具体包括:
与运算模块,用于将接收到的检索过滤向量QF和每个文档的文档过滤向量DFi分别进行与运算,若QF&DFi的运算得到的向量所有位不全为0,则将DFi对应的文档编号Didi添加到候选文档集中,得到候选文档集CDS={d1,d2,…};
传输模块,用于将候选文档集CDS发送至公有云服务器。
CN201810122376.8A 2018-02-07 2018-02-07 面向混合云的隐私保护多关键词Top-k密文检索方法及*** Active CN108363689B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810122376.8A CN108363689B (zh) 2018-02-07 2018-02-07 面向混合云的隐私保护多关键词Top-k密文检索方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810122376.8A CN108363689B (zh) 2018-02-07 2018-02-07 面向混合云的隐私保护多关键词Top-k密文检索方法及***

Publications (2)

Publication Number Publication Date
CN108363689A true CN108363689A (zh) 2018-08-03
CN108363689B CN108363689B (zh) 2021-03-19

Family

ID=63005057

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810122376.8A Active CN108363689B (zh) 2018-02-07 2018-02-07 面向混合云的隐私保护多关键词Top-k密文检索方法及***

Country Status (1)

Country Link
CN (1) CN108363689B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109194666A (zh) * 2018-09-18 2019-01-11 东北大学 一种基于LBS的安全kNN查询方法
CN109271485A (zh) * 2018-09-19 2019-01-25 南京邮电大学 一种支持语义的云环境加密文档排序检索方法
CN109739945A (zh) * 2018-12-13 2019-05-10 南京邮电大学 一种基于混合索引的多关键词密文排序检索方法
CN110727951A (zh) * 2019-10-14 2020-01-24 桂林电子科技大学 具有隐私保护的轻量级外包文件多关键词检索方法及***
CN112597268A (zh) * 2020-12-22 2021-04-02 南京邮电大学 一种面向云环境密文检索效率优化的检索过滤阈值选取方法
WO2021103708A1 (zh) * 2019-11-26 2021-06-03 支付宝(杭州)信息技术有限公司 基于隐私信息保护的数据查询方法、装置、设备及***
CN114189391A (zh) * 2022-02-14 2022-03-15 浙江易天云网信息科技有限公司 一种适用于混合云的私隐性资料控管方法
CN116521743A (zh) * 2023-06-27 2023-08-01 北京中科江南信息技术股份有限公司 密文检索方法及装置、存储介质及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120054485A1 (en) * 2010-08-25 2012-03-01 Sony Corporation Terminal device, server, data processing system, data processing method, and program
CN104765848A (zh) * 2015-04-17 2015-07-08 中国人民解放军空军航空大学 混合云存储中支持结果高效排序的对称可搜索加密方法
CN105681280A (zh) * 2015-12-29 2016-06-15 西安电子科技大学 一种云环境中基于中文的可搜索加密方法
CN106815350A (zh) * 2017-01-19 2017-06-09 安徽大学 一种云环境中动态的密文多关键词模糊搜索方法
CN107634829A (zh) * 2017-09-12 2018-01-26 南京理工大学 基于属性的可搜索加密电子病历***及加密方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120054485A1 (en) * 2010-08-25 2012-03-01 Sony Corporation Terminal device, server, data processing system, data processing method, and program
CN104765848A (zh) * 2015-04-17 2015-07-08 中国人民解放军空军航空大学 混合云存储中支持结果高效排序的对称可搜索加密方法
CN105681280A (zh) * 2015-12-29 2016-06-15 西安电子科技大学 一种云环境中基于中文的可搜索加密方法
CN106815350A (zh) * 2017-01-19 2017-06-09 安徽大学 一种云环境中动态的密文多关键词模糊搜索方法
CN107634829A (zh) * 2017-09-12 2018-01-26 南京理工大学 基于属性的可搜索加密电子病历***及加密方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
戴华 等: "面向云环境的多关键词密文排序检索研究综述", 《计算机科学》 *
李晖 等: "公共云存储服务数据安全及隐私保护技术综述", 《计算机研究与发展》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109194666A (zh) * 2018-09-18 2019-01-11 东北大学 一种基于LBS的安全kNN查询方法
CN109194666B (zh) * 2018-09-18 2021-06-01 东北大学 一种基于LBS的安全kNN查询方法
CN109271485A (zh) * 2018-09-19 2019-01-25 南京邮电大学 一种支持语义的云环境加密文档排序检索方法
CN109739945A (zh) * 2018-12-13 2019-05-10 南京邮电大学 一种基于混合索引的多关键词密文排序检索方法
CN109739945B (zh) * 2018-12-13 2022-11-08 南京邮电大学 一种基于混合索引的多关键词密文排序检索方法
CN110727951A (zh) * 2019-10-14 2020-01-24 桂林电子科技大学 具有隐私保护的轻量级外包文件多关键词检索方法及***
WO2021103708A1 (zh) * 2019-11-26 2021-06-03 支付宝(杭州)信息技术有限公司 基于隐私信息保护的数据查询方法、装置、设备及***
CN112597268A (zh) * 2020-12-22 2021-04-02 南京邮电大学 一种面向云环境密文检索效率优化的检索过滤阈值选取方法
CN112597268B (zh) * 2020-12-22 2022-09-20 南京邮电大学 一种面向云环境密文检索效率优化的检索过滤阈值选取方法
CN114189391A (zh) * 2022-02-14 2022-03-15 浙江易天云网信息科技有限公司 一种适用于混合云的私隐性资料控管方法
CN116521743A (zh) * 2023-06-27 2023-08-01 北京中科江南信息技术股份有限公司 密文检索方法及装置、存储介质及电子设备

Also Published As

Publication number Publication date
CN108363689B (zh) 2021-03-19

Similar Documents

Publication Publication Date Title
CN108363689A (zh) 面向混合云的隐私保护多关键词Top-k密文检索方法及***
Zhang et al. PIC: Enable large-scale privacy preserving content-based image search on cloud
US10013574B2 (en) Method and apparatus for secure storage and retrieval of encrypted files in public cloud-computing platforms
CN104408177B (zh) 基于云文档***的密文检索方法
US9313232B2 (en) System and method for data mining and security policy management
US11595435B2 (en) Methods and systems for detecting phishing emails using feature extraction and machine learning
CN106326360A (zh) 一种云环境中密文数据的模糊多关键词检索方法
Su et al. Privacy-preserving top-k spatial keyword queries in untrusted cloud environments
CN109063509A (zh) 一种基于关键词语义排序的可搜索加密方法
CN108959567A (zh) 一种云环境下适用于大规模图像的安全检索方法
CN109739945A (zh) 一种基于混合索引的多关键词密文排序检索方法
US20130246338A1 (en) System and method for indexing a capture system
CN102708216A (zh) 一种面向密文搜索的分词组织方法和聚类方法
Wang et al. A modified homomorphic encryption method for multiple keywords retrieval
CN109740378B (zh) 一种抗关键词隐私泄露的安全对索引构造及其检索方法
Abduljabbar et al. Secure biometric image retrieval in IoT-cloud
Gupta et al. A learning oriented DLP system based on classification model
CN108829714A (zh) 一种密文数据多关键词的模糊搜索方法
CN112966086A (zh) 一种基于位置敏感哈希函数的可验证模糊搜索方法
Hussain et al. A novel method for preserving privacy in big-data mining
Liu et al. Spatial‐Temporal Feature with Dual‐Attention Mechanism for Encrypted Malicious Traffic Detection
Yao et al. Topic-based rank search with verifiable social data outsourcing
Xia et al. A multi-keyword ranked search over encrypted cloud data supporting semantic extension
Jin et al. Efficient blind face recognition in the cloud
Li et al. Secure and verifiable multi-owner ranked-keyword search in cloud computing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20180803

Assignee: NUPT INSTITUTE OF BIG DATA RESEARCH AT YANCHENG

Assignor: NANJING University OF POSTS AND TELECOMMUNICATIONS

Contract record no.: X2021980013920

Denomination of invention: Hybrid cloud oriented privacy protection multi keyword Top-k ciphertext retrieval method and system

Granted publication date: 20210319

License type: Common License

Record date: 20211202

EE01 Entry into force of recordation of patent licensing contract