CN108363689A

CN108363689A - 面向混合云的隐私保护多关键词Top-k密文检索方法及***

Info

Publication number: CN108363689A
Application number: CN201810122376.8A
Authority: CN
Inventors: 戴华; 朱向洋; 杨庚; 白双杰; 史经启; 孙彦珺; 王敏
Original assignee: Nanjing Post and Telecommunication University
Current assignee: Nanjing Post and Telecommunication University; Nanjing University of Posts and Telecommunications
Priority date: 2018-02-07
Filing date: 2018-02-07
Publication date: 2018-08-03
Anticipated expiration: 2038-02-07
Also published as: CN108363689B

Abstract

本发明公开了一种面向混合云的隐私保护多关键词Top‑k密文检索方法及***。本发明主要解决检索效率低下的问题。其方案是：数据提供端利用关键词之间的相关关系通过聚簇技术生成关键词词典序列；每个文档生成高维的文档向量和低维的文档过滤向量，然后将密文文档和加密后的文档向量外包到不可信的公有云服务器，将明文的文档过滤向量存储到可信的私有云服务器。检索时，首先通过私有云服务器计算候选文档集，然后通过公有云服务器实现检索结果Top‑k文档计算。关键词词典序列中相关关键词聚集特性提高了私有云服务器过滤的效果，压缩了候选文档集的大小。本发明流程简单，安全性高，易于实现，能够在混合云环境中通过较少的计算开销实现高效的多关键词密文检索处理。

Description

面向混合云的隐私保护多关键词Top-k密文检索方法及***

技术领域

本发明涉及用户数据隐私保护，尤其涉及一种面向混合云的隐私保护多关键词Top-k密文检索方法及***。

背景技术

IT资源服务化的思想日益普及，呈现“一切皆服务”(X as a Service,XaaS)的趋势，“服务”成为云计算的核心概念。然而在云计算蓬勃发展的同时，云安全也成为被广泛关注的问题。在云环境中，由于用户无法直接控制放置在远程云服务器(Cloud Server,CS)中的数据，担心自己的外包数据被云服务提供商非法获取或滥用，尤其是对于私密性要求较高的敏感数据，例如电子病历、银行交易数据、用户邮件等。尽管云服务提供商宣称他们会提供一些安全对策来应对隐私泄露问题，例如访问控制技术、防火墙技术和入侵检测技术等，但是用户对数据安全问题的担心毫无疑问是制约云计算进一步发展的主要问题。

保护数据隐私的一种通用做法是在将数据加密处理后再外包到公有云服务器，但是这样严重制约了外包数据的使用。在信息检索研究领域中，现有的多关键词检索主要是面向明文数据的，无法直接应用到密文检索领域。而将所有加密数据从云端下载到本地进行解密显然是一种不切实际且资源浪费的处理方法。因此，研究并解决云环境中具备隐私保护功能的密文数据检索机制是一个挑战性问题，这也已成为近年来云计算研究领域关注的热点问题之一。

现有技术中大多方法默认都是采用公用云服务，基于公有云按照“半诚实模型”方式提供服务这一假设的，提出一系列加密云环境中多关键词密文检索处理方法，但是这些方法存在检索效率低、检索结果不精确、索引树构建复杂等一种或多种问题。

针对这些问题，申请号201710181664.6的中国发明专利申请公开了一种云计算中保护数据隐私的快速多关键词语义排序搜索方法，通过加入私有云服务器，在为每个文档创建文档向量的同时，创建与之对应的标识向量，将加密文档向量外包到公有云服务器，将明文标识向量存储到私有云服务器，通过私有云服务器实现文档集初步过滤操作，减少与检索向量相关度得分计算的文档向量个数，减少检索计算开销，但是该方法由于关键词字典中关键词的分布是随机的，私有云服务器过滤效果不佳，导致公有云中需要计算大量文档向量和检索向量之间的相关度得分。因此如何提高私有云服务器过滤效果，对于提高混合云中支持隐私保护的多关键词密文检索效率有重要作用。

发明内容

发明目的：本发明针对现有技术存在的问题，提供一种面向混合云的隐私保护多关键词Top-k密文检索方法及***，本发明可以有效地实现用户数据的隐私保护，提升多关键词密文检索的效率，实现精确地Top-k检索。

技术方案：本发明所述的面向混合云的隐私保护多关键词Top-k密文检索方法包括：

(1)数据提供端从提供的文档集中提取关键词集合，并通过聚簇分块生成关键词词典序列；再根据关键词词典序列为文档集中每个文档生成一对应的明文文档向量，并依据关键词词典序列的分块情况将明文文档向量分块，形成文档过滤向量；之后将明文文档向量加密形成加密文档向量，将文档集中的每一文档加密形成加密文档集；最后将文档过滤向量传输至私有云服务器，将加密文档向量和加密文档集传输至公有云服务器；

(2)数据检索端根据用户提供的多个关键词生成检索向量，进行归一化后采用安全算法生成检索陷门，连同用户需要检索的文档个数k传输至公有云服务器；再依据关键词词典序列中关键词的分块情况，将用户提供的多个关键词生成检索过滤向量，并传输至私有云服务器；

(3)私有云服务器将接收到的检索过滤向量和每个文档的文档过滤向量分别进行与运算，若运算得到的向量所有位不全为0，则将对应的文档编号添加到候选文档集中，并将候选文档集传输至公有云服务器；

(4)公有云服务器根据接收到的候选文档集、检索陷门和检索文档个数k，分别计算候选文档集中每个文档对应的加密文档向量和检索陷门之间的安全内积，根据安全内积选取候选文档集中与用户提供的关键词最相关的k个密文文档，将该k个密文文档返回至数据检索端；

(5)数据检索端对接收的k个密文文档进行解密，得到最相关的k个明文文档。

进一步的，步骤(1)具体包括：

(1-1)数据提供端从提供的文档集DS中提取关键词，得到关键词集合{w₁,w₂,…,w_n}；

(1-2)将关键词集合中的关键词根据相关关系进行聚簇操作，得到若干个聚类子簇{c₁,c₂,…,c_t}；

(1-3)将每个子簇作为一个分块，从而得到t个分块，分别为b₁,b₂,…,b_t，再根据分块生成关键词词典序列W＝{w(b₁,1),w(b₁,2),…,w(b₂,1),w(b₂,2),…,w(b_t,1),w(b_t,2),…}，其中w(b_j,x)表示属于分块b_j中的第x个关键词，每个块中的关键词无序；分块b_j＝{w(b_j,x)|0<x≤|b_j|}；

(1-4)采用TF-IDF算法和空间向量模型，根据关键词词典序列中关键词的位置，为文档集DS＝{D₁,D₂,…,D_m}中每个文档D_i生成一个对应的明文文档向量V_i，并进行归一化处理；其中，V_i的维度为n，每位取值为该位对应的关键词在文档D_i中的词频TF值；

(1-5)根据关键词词典序列的分块情况，将明文文档向量V_i分成t个分块，分块边界和关键词词典序列的分块边界相同，得到每个文档D_i的文档过滤向量DF_i＝{b₁,b₂,…,b_t}；其中，若V_i中分块b_j对应的所有关键词所在的位置取值都为0，则b_j块的取值为0，否则b_j块的取值为1，DF_i是t维的每位取值为0/1的向量；

(1-6)生成加密密钥SK(S,M₁,M₂,k_f)；其中，S是一个每位取值为0/1的随机向量，M₁和M₂是两个n×n可逆矩阵，n是关键词词典序列的长度，k_f是文档加密密钥；

(1-7)通过安全KNN技术采用生成的加密密钥对每个明文文档向量V_i加密，得到对应的加密文档向量其中，当随机向量S中第j个元素S[j]＝0时，V_i′+V_i″＝V_i，当S[j]＝1时，V_i′＝V_i″＝V_i；

(1-8)通过对称加密算法加密文档集DS中每个文档，得到加密文档集ES＝{e₁,e₂,…,e_m}；

(1-9)将文档过滤向量传输至私有云服务器进行存储，将加密文档向量和加密文档集传输至公有云服务器进行存储。

进一步的，步骤(2)具体包括：

(2-1)数据检索端根据用户提供的多个关键词{w₁,w₂,…,w_x}，采用TF-IDF算法和空间向量模型生成检索向量Q，并进行归一化；其中，Q的第j个元素Q[j]为第j位关键词w_j在数据提供端提供的文档集DS中的逆文档频率IDF值；

(2-2)基于检索向量Q，采用安全KNN算法，生成检索陷门其中，其中当数据提供端生成的加密密钥中的随机向量的第j位S[j]＝0时，Q′[j]＝Q″[j]＝Q[j]，当S[j]＝1时，Q′[j]+Q″[j]＝Q[j]；

(2-3)根据关键词词典序列中关键词的分块情况，生成检索过滤向量QF，QF＝{b₁,b₂,…,b_t}，QF是t维每位取值0/1的向量，若分块b_j对应的所有关键词在检索向量Q中对应的所有位的取值都是0，则QF[j]＝0，否则QF[j]＝1；

(2-4)将检索陷门和用户需要检索的文档个数k传输至公有云服务器，将检索过滤向量传输至私有云服务器。

进一步的，步骤(3)具体包括：

(3-1)私有云服务器将接收到的检索过滤向量QF和每个文档的文档过滤向量DF_i分别进行与运算，若QF&DF_i的运算得到的向量所有位不全为0，则将DF_i对应的文档编号Did_i添加到候选文档集中，得到候选文档集CDS＝{d₁,d₂,…}；

(3-2)将候选文档集CDS发送至公有云服务器。

本发明所述的面向混合云的隐私保护多关键词Top-k密文检索***，包括数据提供端、数据检索端、私有云服务器和公有云服务器，其中：

数据提供端用于从提供的文档集中提取关键词集合，并通过聚簇分块生成关键词词典序列；以及根据关键词词典序列为文档集中每个文档生成一对应的明文文档向量，并依据关键词词典序列的分块情况将明文文档向量分块，形成文档过滤向量；以及将明文文档向量加密形成加密文档向量，将文档集中的每一文档加密形成加密文档集；以及将文档过滤向量传输至私有云服务器，将加密文档向量和加密文档集传输至公有云服务器；

数据检索端用于根据用户提供的多个关键词生成检索向量，进行归一化后采用安全算法生成检索陷门，连同用户需要检索的文档个数k传输至公有云服务器；以及依据关键词词典序列中关键词的分块情况，将用户提供的多个关键词生成检索过滤向量，并传输至私有云服务器；

私有云服务器用于将接收到的检索过滤向量和每个文档的文档过滤向量分别进行与运算，若运算得到的向量所有位不全为0，则将对应的文档编号添加到候选文档集中，并将候选文档集传输至公有云服务器；

公有云服务器用于根据接收到的候选文档集、检索陷门和检索文档个数k，分别计算候选文档集中每个文档对应的加密文档向量和检索陷门之间的安全内积，根据安全内积选取候选文档集中与用户提供的关键词最相关的k个密文文档，将该k个密文文档返回至数据检索端；

数据检索端还用于对接收的k个密文文档进行解密，得到最相关的k个明文文档。

进一步的，所述数据提供端具体包括：

关键词提取模块，用于从提供的文档集DS中提取关键词，得到关键词集合{w₁,w₂,…,w_n}；

聚簇模块，用于将关键词集合中的关键词根据相关关系进行聚簇操作，得到若干个聚类子簇{c₁,c₂,…,c_t}；

关键词词典生成模块，用于将每个子簇作为一个分块，从而得到t个分块，分别为b₁,b₂,…,b_t，再根据分块生成关键词词典序列W＝{w(b₁,1),w(b₁,2),…,w(b₂,1),w(b₂,2),…,w(b_t,1),w(b_t,2),…}；其中w(b_j,x)表示属于分块b_j中的第x个关键词，每个块中的关键词无序；分块b_j＝{w(b_j,x)|0<x≤|b_j|}；

明文文档向量生成模块，用于采用TF-IDF算法和空间向量模型，根据关键词词典序列中关键词的位置，为文档集DS＝{D₁,D₂,…,D_m}中每个文档D_i生成一个对应的明文文档向量V_i，并进行归一化处理；其中，V_i的维度为n，每位取值为该位对应的关键词在文档D_i中的词频TF值；

文档过滤向量生成模块，用于根据关键词词典序列的分块情况，将明文文档向量V_i分成t个分块，分块边界和关键词词典序列的分块边界相同，得到每个文档D_i的文档过滤向量DF_i＝{b₁,b₂,…,b_t}；其中，若V_i中分块b_j对应的所有关键词所在的位置取值都为0，则b_j块的取值为0，否则b_j块的取值为1，DF_i是t维的每位取值为0/1的向量；

密钥生成模块，用于生成加密密钥SK(S,M₁,M₂,k_f)；其中，S是一个每位取值为0/1的随机向量，M₁和M₂是两个n×n可逆矩阵，n是关键词词典序列的长度，k_f是文档加密密钥；

文档向量加密模块，用于通过安全KNN技术采用生成的加密密钥对每个明文文档向量V_i加密，得到对应的加密文档向量其中，当随机向量S中第j个元素S[j]＝0时，V_i′+V_i″＝V_i，当S[j]＝1时，V_i′＝V_i″＝V_i；

文档加密模块，用于通过对称加密算法加密文档集DS中每个文档，得到加密文档集ES＝{e₁,e₂,…,e_m}；

传输模块，用于将文档过滤向量传输至私有云服务器进行存储，将加密文档向量和加密文档集传输至公有云服务器进行存储。

进一步的，所述数据检索端具体包括：

检索向量生成模块，用于根据用户提供的多个关键词{w₁,w₂,…,w_x}，采用TF-IDF算法和空间向量模型生成检索向量Q，并进行归一化；其中，Q的第j个元素Q[j]为第j位关键词w_j在数据提供端提供的文档集DS中的逆文档频率IDF值；

检索陷门生成模块，用于基于检索向量Q，采用安全KNN算法，生成检索陷门其中，其中当数据提供端生成的加密密钥中的随机向量的第j位S[j]＝0时，Q′[j]＝Q″[j]＝Q[j]，当S[j]＝1时，Q′[j]+Q″[j]＝Q[j]；

检索过滤向量生成模块，用于根据关键词词典序列中关键词的分块情况，生成检索过滤向量QF，QF＝{b₁,b₂,…,b_t}，QF是t维每位取值0/1的向量，若分块b_j对应的所有关键词在检索向量Q中对应的所有位的取值都是0，则QF[j]＝0，否则QF[j]＝1；

传输模块，用于将检索陷门和用户需要检索的文档个数k传输至公有云服务器，将检索过滤向量传输至私有云服务器。

进一步的，所述私有云服务器具体包括：

与运算模块，用于将接收到的检索过滤向量QF和每个文档的文档过滤向量DF_i分别进行与运算，若QF&DF_i的运算得到的向量所有位不全为0，则将DF_i对应的文档编号Did_i添加到候选文档集中，得到候选文档集CDS＝{d₁,d₂,…}；

传输模块，用于将候选文档集CDS发送至公有云服务器。

有益效果：本发明与现有技术相比，其显著优点是：

1、安全性高

本发明实现的是针对不可信公有云环境中，实现根据多关键词进行密文检索，通过安全KNN技术实现安全内积计算，可以实现两个加密向量之间的内积值等于两个明文向量之间的内积值，在公有云环境中不需要对检索陷门进行解密，也不需要对加密的文档向量进行解密操作，更不需要对加密的文档进行解密操作。在公有云部分，全程都是在密文下进行运算，最终得到的Top-k结果。因此，安全KNN技术的运用能够实现根据多关键词进行Top-k检索结果计算的同时，保护数据拥有者的数据隐私。安全KNN技术已经广泛应用于多关键词密文检索领域。

2、精确性高

本发明给出的面向混合云的隐私保护多关键词Top-k密文检索方法，在数据检索端提供感兴趣的多关键词进行检索时，是分成两个步骤进行的，首先私有云服务器生成候选文档集CDS，然后公有云服务器搜索候选文档集中和感兴趣的多关键词最相关的Top-k结果。私有云生成候选文档集时，对于全部文档集DS中的任一文档D_i只要包含1个或多个数据使用者提供的感兴趣的多关键词，都会被添加到候选文档集，因此不存在满足条件的Top-k文档不在候选文档集的情况；而当公有云服务器得到私有云服务器发送过来的候选文档集时，是严格根据候选文档集中的每个文档的加密文档向量和检索陷门之间的内积计算结果得到的Top-k结果，因此，本发明私有云服务器和公有云服务器协作的方式能够对检索结果进行精确的排序并返回Top-k文档作为检索结果给数据检索端。

3、检索效率高

本发明给出的面向混合云的隐私保护多关键词Top-k密文检索方法，针对目前安全KNN计算、TF-IDF和空间向量模型等技术运用为主的可搜索加密方法效率不高的问题，通过加入了可信私有云服务器，给出了文档向量分块生成文档过滤向量的方法，将文档过滤向量上传到私有云服务器，因为文档过滤向量的维度较小，私有云服务器能够根据数据使用者提供的检索过滤向量，通过较少的运算开销就可以得到候选文档集，快速过滤掉大量无关文档(这些过滤掉的文档不可能是最终的Top-k结果)，候选文档集相对于原始文档集来说要小的多，因此公有云服务器只需要进行少量的加密向量间的内积计算，能够大大节省公有云服务器的计算开销。除此之外，鉴于用户输入的感兴趣的多关键词往往是相关的这一事实，为了提高私有云服务器的过滤效果，进一步压缩候选文档集，关键词词典序列中关键词的位置并不是随机摆放的，而是根据关键词相关关系进行聚簇，然后得到多个子簇，每个子簇内关键词都位于关键词词典序列中相同的块中，这样生成的文档过滤向量和检索过滤向量，更有利于压缩候选文档集的大小，候选文档集中文档个数变少，则公有云服务器中需要计算加密向量之间的内积的次数就变小，自然降低了计算开销，提高了多关键词密文检索的效率。

附图说明

图1是本发明提供的面向混合云的隐私保护多关键词Top-k密文检索方法的架构图；

图2是本发明提供的面向混合云的隐私保护多关键词Top-k密文检索方法的流程示意图；

图3是关键词聚簇构造关键词词典序列示意图，图示中关键词集合聚簇成10个小簇，对应关键词词典序列为10个块，每个块中包含关键词个数不定，和对应小簇中关键词数量相同；

图4是未做归一化处理前的文档向量和文档过滤向量、以及检索向量和检索过滤向量的示意图；

图5是检索流程示意图，其中，首先私有云服务器通过文档过滤向量和检索过滤向量之间的与运算，得到候选文档集，然后将候选文档集发送给公有云服务器；公有云服务器在候选文档集中，通过计算文档向量和检索向量之间的相关度得分得到Top-k文档。为了画图简洁性，文档向量和检索向量没有进行归一化和加密处理。

具体实施方式

实施例1

本实施例提供了一种面向混合云的隐私保护多关键词Top-k密文检索方法，如图1和图2所示，包括以下步骤：

(1)数据提供端从提供的文档集中提取关键词集合，并通过聚簇分块生成关键词词典序列；再根据关键词词典序列为文档集中每个文档生成一对应的明文文档向量，并依据关键词词典序列的分块情况将明文文档向量分块，形成文档过滤向量；之后将明文文档向量加密形成加密文档向量，将文档集中的每一文档加密形成加密文档集；最后将文档过滤向量传输至私有云服务器，将加密文档向量和加密文档集传输至公有云服务器。

该步骤具体包括：

(1-3)将每个子簇作为一个分块，从而得到t个分块，分别为b₁,b₂,…,b_t，再根据分块生成关键词词典序列W＝{w(b₁,1),w(b₁,2),…,w(b₂,1),w(b₂,2),…,w(b_t,1),w(b_t,2),…}，其中w(b_j,x)表示属于分块b_j中的第x个关键词，每个块中的关键词无序；分块b_j＝{w(b_j,x)|0<x≤|b_j|}；因为关键词聚簇特性，关键词词典序列中相关性强的关键词聚集在同一个块中。例如图3中，关键词集合一共聚簇成10个小自然簇，每个簇中的关键词数量不定，则关键词词典包含10个关键词块，每个关键词块中包含的关键词数量和对应簇中包含关键词数量相同，然后根据这些块，生成关键词词典序列；

(1-5)根据关键词词典序列的分块情况，将明文文档向量V_i分成t个分块，分块边界和关键词词典序列的分块边界相同，得到每个文档D_i的文档过滤向量DF_i＝{b₁,b₂,…,b_t}；其中，若V_i中分块b_j对应的所有关键词所在的位置取值都为0，则b_j块的取值为0，否则b_j块的取值为1，DF_i是t维的每位取值为0/1的向量；例如图4中，给出了文档向量和对应文档过滤向量的具体示例，考虑到画图简洁性，没有对文档向量进行归一化处理，文档为D_i，对应文档向量为V_i，根据关键词词典序列中块边界的位置，构成的文档过滤向量DF_i如图4中所示；

(1-6)生成加密密钥SK(S,M₁,M₂,k_f)；其中，S是一个每位取值为0/1的n维随机列向量，M₁和M₂是两个n×n可逆矩阵，n是关键词词典序列的长度，k_f是文档加密密钥；SK只提供DO,DU使用，对CS私密。

(2)数据检索端根据用户提供的多个关键词生成检索向量，进行归一化后采用安全算法生成检索陷门，连同用户需要检索的文档个数k传输至公有云服务器；再依据关键词词典序列中关键词的分块情况，将用户提供的多个关键词生成检索过滤向量，并传输至私有云服务器。

该步骤具体包括：

(3)私有云服务器将接收到的检索过滤向量和每个文档的文档过滤向量分别进行与运算，若运算得到的向量所有位不全为0，则将对应的文档编号添加到候选文档集中，并将候选文档集传输至公有云服务器。

该步骤具体包括：

(3-2)将候选文档集CDS发送至公有云服务器。图5给出一个具体的查询示例，私有云服务器通过对检索过滤向量和文档过滤向量做与运算，找到运算结果不全为0的文档过滤向量对应的文档编号，从而得到候选文档集CDS＝{Did₁,Did₅,Did₆}，然后将CDS发送给公有云服务器。

(4)公有云服务器根据接收到的候选文档集、检索陷门和检索文档个数k，分别计算候选文档集中每个文档对应的加密文档向量和检索陷门之间的安全内积，根据安全内积选取候选文档集中与用户提供的关键词最相关的k个密文文档，将该k个密文文档返回至数据检索端。

例如，图5中，公有云服务器接收到私有云服务器发送的候选文档集CDS＝CDS＝{Did₁,Did₅,Did₆}，此时Top-k文档的搜索空间已经不是全集DS＝{D₁,D₂,…,D₁₀},而变成了候选文档集{D₁,D₅,D₆}，搜索空间由原来的10个文档变成了现在的3个文档，因此只需要计算3次向量之间的内积运算，此时通过在候选文档集中逐一计算每个文档对应的加密文档向量和加密检索向量之间的点积，从而得到3个相关度得分，选择最大的k个对应的加密文档，返回给数据检索端。

(5)数据检索端对接收的k个密文文档采用对称密钥进行解密，得到最相关的k个明文文档。

实施例2

本实施例提供了一种面向混合云的隐私保护多关键词Top-k密文检索***，包括数据提供端、数据检索端、私有云服务器和公有云服务器，其中：

进一步的，所述数据提供端具体包括：

进一步的，所述数据检索端具体包括：

进一步的，所述私有云服务器具体包括：

传输模块，用于将候选文档集CDS发送至公有云服务器。

本***与实施例1的方法一一对应，其他部分不再赘述，参考实施例1即可。

以上所揭露的仅为本发明的较佳实施例而已，不能以此来限定本发明之权利范围，因此依本发明权利要求所作的等同变化，仍属本发明所涵盖的范围。

Claims

1.一种面向混合云的隐私保护多关键词Top-k密文检索方法，其特征在于该方法包括：

2.根据权利要求1所述的面向混合云的隐私保护多关键词Top-k密文检索方法，其特征在于：步骤(1)具体包括：

(1-7)通过安全KNN技术采用生成的加密密钥对每个明文文档向量V_i加密，得到对应的加密文档向量其中，当随机向量S中第j个元素S[j]＝0时，V′_i+V″_i＝V_i，当S[j]＝1时，V′_i＝V″_i＝V_i；

3.根据权利要求1所述的面向混合云的隐私保护多关键词Top-k密文检索方法，其特征在于：步骤(2)具体包括：

4.根据权利要求1所述的面向混合云的隐私保护多关键词Top-k密文检索方法，其特征在于：步骤(3)具体包括：

(3-2)将候选文档集CDS发送至公有云服务器。

5.一种面向混合云的隐私保护多关键词Top-k密文检索***，其特征在于该***包括数据提供端、数据检索端、私有云服务器和公有云服务器，其中：

6.根据权利要求5所述的面向混合云的隐私保护多关键词Top-k密文检索***，其特征在于：所述数据提供端具体包括：

文档向量加密模块，用于通过安全KNN技术采用生成的加密密钥对每个明文文档向量V_i加密，得到对应的加密文档向量其中，当随机向量S中第j个元素S[j]＝0时，V′_i+V″_i＝V_i，当S[j]＝1时，V′_i＝V″_i＝V_i；

7.根据权利要求5所述的面向混合云的隐私保护多关键词Top-k密文检索***，其特征在于：所述数据检索端具体包括：

8.根据权利要求5所述的面向混合云的隐私保护多关键词Top-k密文检索***，其特征在于：所述私有云服务器具体包括：

传输模块，用于将候选文档集CDS发送至公有云服务器。