CN102325143B - 一种基于云平台的信息收集存储和加密检索*** - Google Patents

一种基于云平台的信息收集存储和加密检索*** Download PDF

Info

Publication number
CN102325143B
CN102325143B CN201110277785.3A CN201110277785A CN102325143B CN 102325143 B CN102325143 B CN 102325143B CN 201110277785 A CN201110277785 A CN 201110277785A CN 102325143 B CN102325143 B CN 102325143B
Authority
CN
China
Prior art keywords
module
information
data
retrieval
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201110277785.3A
Other languages
English (en)
Other versions
CN102325143A (zh
Inventor
祝烈煌
吴俊宏
杨震
李龙一佳
刘畅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Institute of Technology BIT
Original Assignee
Beijing Institute of Technology BIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Institute of Technology BIT filed Critical Beijing Institute of Technology BIT
Priority to CN201110277785.3A priority Critical patent/CN102325143B/zh
Publication of CN102325143A publication Critical patent/CN102325143A/zh
Application granted granted Critical
Publication of CN102325143B publication Critical patent/CN102325143B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Storage Device Security (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于云平台的信息收集存储和加密检索***,特别涉及一种智能收集网络上交互信息并将信息加密存储,不经过解密就可以实现信息检索的***,属于信息安全技术领域;具体包括数据信息收集模块、数据信息加密模块、数据信息检索模块和数据访问接口模块。本发明智能地收集用户所需的信息,加密信息检索方法不需要经过解密就可以检索到用户所需的信息,用户随时随地都可以访问获取所需的信息,既提高效率和节省大量的时间,又保证了信息的安全;适用于个人、公司和机关单位,可以安装在个人电脑或者移动设备上,为数据信息的收集、存储、加密和检索带来便利。

Description

一种基于云平台的信息收集存储和加密检索***
技术领域
本发明涉及一种基于云平台的信息收集存储和加密检索***,特别涉及一种智能收集网络上交互信息并将信息加密存储,不经过解密就可以实现信息检索的***,属于信息安全技术领域。
背景技术
随着网络社区技术的成熟,网络个体用户融入更多样化的群组集合。除了电子邮件,近几年诞生了几种新型的信息资讯交互形式,比如微博、SNS、即时通讯工具。这些信息都是分布在网络的各个信息服务提供商中,用户需要花费大量的时间登陆服务器去浏览信息,给用户的使用带来了很大的不便。
网络的发展还引起了网络信息量,特别是交互信息量的急速增长。无论是对企事业单位还是个人而言,数据的存储和管理变得越来越困难。采用传统的本地存储方法已经逐渐难于满足人们对数据的存储和管理需求。云存储技术是解决数据存储和管理的有效途径,而且将数据信息存储在云服务器中,无论你身在何处,都可以随时随地下载所需的数据信息,再也没有空间限制。但目前还没有云存储的有效实现途径。
网络的普及给人们带来了很大的便利,与此同时,正是因为网络的普及,网络上个人的信息和资料的安全正受到严峻的考验,人们也越来越重视网络信息资料的安全。虽然目前已经存在许多网络服务供应商提供信息加密服务,但是这些信息并不是用户个人加密的,所以信息的安全问题仍未解决,用户的信息资料仍存在泄露的危机。
信息的加密能提高安全性,但是却给信息的检索带来了困难。传统的方法是先将信息解密,然后再进行检索。这种方法不仅效率低,而且很难实际应用起来。
发明内容
本发明的目的是针对上述个人信息的浏览和加密检索问题,将云存储技术、信息数据加密技术和信息智能收集技术结合起来,提出一种基于云平台的带有加密功能的个人信息智能收集存储***。
一种基于云平台的信息收集存储和加密检索***,具体包括数据信息收集模块、数据信息加密模块、数据信息检索模块和数据访问接口模块;其中,数据信息收集模块包括收集模块和处理模块,两个模块顺次连接;数据信息检索模块包括模糊关键字集构造模块、检索模块和排序模块,三个模块顺次连接;数据访问接口模块包括上传模块、查找模块和下载模块,三个模块并联。***各部分的连接关系为:数据信息收集模块的处理模块与数据信息加密模块连接,数据信息加密模块与数据访问接口模块的上传模块连接,上传模块和下载模块与外界提供云存储的云存储服务器连接;数据信息检索模块通过检索模块与数据访问接口模块的查找模块互连,排序模块的输出传至用户。
所述的数据信息收集模块中,收集模块的功能为根据用户需求,利用信息服务提供商提供的API编程接口访问服务器,收集分布在网络各处的信息邮件、微博等个人信息,并将信息输入到处理模块。处理模块将所有收集到的信息转化为统一格式,分成多个数据文件保存到云存储服务器,以节省用户登录不同服务器所需的时间,并方便用户的浏览和管理。
所述的数据信息加密模块对信息进行加密,根据用户的选定的主密钥(MasterKey)生成数据文件的加密子密钥(key)。各个数据文件使用不同的密钥加密,即文件FILEi使用keyi进行加密,能有效地抵抗唯密文攻击,加强云存储服务器中数据的机密性。
所述的数据检索模块接收用户的检索请求,对云存储服务器中存储的数据信息进行检索,并将检索结果返回给用户。其中,模糊关键字集构造模块以编辑距离来衡量模糊度,所述编辑距离是指单词w1变换到单词w2所需要编辑的字母数。模糊关键字集构造模块根据用户预先设定的模糊度,从预先建立好的字典文件中选出符合模糊度的单词,连同用户输入的检索关键字构成模糊关键字集。所述的字典文件是通过从网上下载大量各个领域的文章作为语料,然后对语料进行分词,分词得到的单词按照字母顺序排序存储而得。字典文件存储在模糊关键字集构造模块中。检索模块通过数据访问接口模块访问存储在云存储服务器中的数据信息,对模糊关键字集中所有关键字进行检索,得出检索结果。排序模块根据检索结果与关键字的匹配程度对检索结果进行排序,返回给用户。上述的检索方法需要建立索引文件。在用户上传数据完毕后,***的上传模块会从上传数据中过滤信息量低的单词,提取信息量高的关键字,建立关键字到文件的映射,采用倒排索引结构,保存为索引子文件,然后再将索引子文件加密上传到云存储服务器中,与服务器中已有的索引文件进行合并,更新索引文件。用户每次上传数据后都需要对索引文件进行更新。索引文件也是加密的,保证用户个人数据信息的安全。通过查找索引文件得出检索结果,不需要对数据解密就可以进行检索,节省了数据解密时间,提高了检索的效率。
数据访问接口模块是利用云存储服务器的API编程接口去访问云存储服务器中的数据信息。上传模块将数据上传到云存储服务器中存储起来,并建立和更新索引文件;查找模块接收用户的检索关键字,在云存储服务器中查找索引文件,返回检索结果;下载模块将云存储服务器中文件下载下来。本发明所述的***上传到云服务器的数据信息都是经过用户加密的,而且在上传、下载及检索的过程中,数据信息也是加密的,解密只能由用户执行,比现在存在的云存储服务更具有安全性。
本发明的信息收集存储和加密检索***的工作流程为:用户发出收集指令,数据信息收集模块开始从用户设定的各信息服务提供商中收集信息并处理后,输入到数据信息加密模块进行加密;加密后的信息经数据访问接口模块中的上传模块传至提供云存储的云存储服务器。待用户输入所需信息的关键字,数据信息检索模块的模糊关键字集构造模块生成模糊关键字集,提供给检索模块;通过查找模块在云存储服务器中查找索引文件,将结果返回检索模块,输入到排序模块排序后输出至用户。
本发明的***根据用户的需要,还可以接受用户上传文件或信息存储在云存储服务器中,并建立索引文件。用户可以通过***登录云存储服务器,下载文件或信息。
有益效果
本发明可以智能地收集用户所需的信息,并将信息统一起来,方便用户浏览,提高效率和节省大量的时间;用户的个人信息是用户使用自己的密钥加密后存储在云服务器中,增强了信息的安全性,而且信息是存储在云服务器中,用户随时随地都可以访问获取所需的信息。加密信息检索方法不需要经过解密就可以检索到用户所需的信息,既保证了信息的安全,又不会降低检索效率和影响用户的使用体验。本发明适用于个人、公司和机关单位,可以安装在个人电脑或者移动设备上,为数据信息的收集、存储、加密和检索带来便利。
附图说明
图1为本发明的***架构图;
图2为本发明的***结构示意图;
图3为具体实施方式中信息收集存储和加密检索***的用户界面图;
图4为具体实施例中信息检索结果图。
具体实施方式
下面结合附图和具体实施例子,具体说明本发明的目的和优点。
本实施方式实现了一种基于云平台的信息收集存储和加密检索***,如图2所示,包括数据信息收集模块、数据信息加密模块、数据访问接口模块以及数据信息检索模块,其中数据信息收集模块包括收集模块和处理模块,数据信息检索模块包括模糊关键字集构造模块、检索模块和排序模块。
本实施方式采用C#程序语言编程及设计用户界面,生成的信息收集存储和加密检索***的用户界面如图3所示。用户只要登录***,点击“开始收集”按钮,就可以浏览所有设定的账户信息。只需在关键字输入框输入关键字,点击“检索”按钮就可以检索到所需的信息,方便快捷,节省大量的时间。本***还可以作为网络U盘使用,用户点击“文件上传”按钮,选择需要上传的文件上传到云存储服务器中。用户可以随时随地下载文件,点击“文件下载”按钮,选中需要下载的文件即可下载。
本实施例中,用户A有三个邮箱,两个微博账户。这三个邮箱由不同的三个信息服务提供商提供,两个微博账号分别是新浪和腾讯的微博。用户A需要分别登陆三个邮箱的服务器去查看邮件,分别登陆两个微博账号去关注好友。多次登陆服务器造成时间上的浪费。
用户A登陆本***,点击“开始收集”,***执行如下步骤收集信息:
1)调用数据信息收集模块中收集模块,将三个邮箱的邮件和两个微博账号的好友信息下载下来,输入到处理模块;
2)处理模块将收集到的各种格式的信息统一转化为txt格式,输入到数据信息加密模块;
3)数据信息加密模块将信息加密后,输入到数据访问接口模块的上传模块;
4)上传模块将加密后的数据信息上传到云存储服务器存储起来;
5)上传模块对上传数据信息建立索引子文件,并将索引子文件加密后上传到云存储服务器,更新已有的索引文件。
当三个邮箱和两个微博账户的邮件和信息都收集处理完毕后,用户A即可在***中浏览当天的所有信息,不需要多次登陆服务器,方便快捷。
若用户A只关心他朋友B的微博,他在检索框中输入B的名字,然后点击“检索”按钮,***执行如下步骤进行检索:
1)接收到用户输入的关键字“B”,模糊关键字集构造模块根据模糊度,从字典文件中选择符合模糊度的单词,构成模糊关键字集,输入到检索模块;
2)检索模块通过数据访问接口模块,通过查找云存储服务器中的索引文件,得出检索结果“B:今天和A去看了一部不错的电影!”输入到排序模块;
3)排序模块返回检索结果给用户;
整个检索过程只用不到0.1秒的时间。
如图4所示,当检索完毕,***显示检索结果,用户可以很快地获得需要的信息,不必浪费时间去一一浏览所有信息。当用户使用的交互服务越多,本***的优势就越明显。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进,或者对其中部分技术特征进行等同替换,这些改进和替换也应视为本发明的保护范围。

Claims (7)

1.一种基于云平台的信息收集存储和加密检索***,其特征在于:包括数据信息收集模块、数据信息加密模块、数据信息检索模块和数据访问接口模块;其中,数据信息收集模块包括收集模块和处理模块,两个模块顺次连接;数据信息检索模块包括模糊关键字集构造模块、检索模块和排序模块,三个模块顺次连接;数据访问接口模块包括上传模块、查找模块和下载模块,三个模块并联;上述各部分的连接关系为:数据信息收集模块的处理模块与数据信息加密模块连接,数据信息加密模块与数据访问接口模块的上传模块连接,上传模块和下载模块与外界提供云存储的云存储服务器连接;数据信息检索模块通过检索模块与数据访问接口模块的查找模块互连,排序模块的输出传至用户;
所述的数据信息收集模块中,收集模块根据用户需求,利用信息服务提供商提供的API编程接口访问服务器,收集分布在网络各处的个人信息,并将信息输入到处理模块;处理模块将所有收集到的信息转化为统一格式,分成多个数据文件保存到云存储服务器;
所述的数据信息加密模块对信息进行加密,根据用户的选定的主密钥生成数据文件的加密子密钥;
所述的数据信息检索模块接收用户的检索请求,对云存储服务器中存储的数据信息进行检索,并将检索结果返回用户;
数据访问接口模块利用云存储服务器的API编程接口去访问云存储服务器中的数据信息;其中,上传模块将数据上传到云存储服务器中存储,并建立和更新索引文件;查找模块接收用户的检索关键字,在云存储服务器中查找索引文件,返回检索结果;下载模块将云存储服务器中文件下载下来。
2.根据权利要求1所述的一种基于云平台的信息收集存储和加密检索***,其特征在于:所述的模糊关键字集构造模块以编辑距离来衡量模糊度,所述编辑距离是单词w1变换到单词w2所需要编辑的字母数;模糊关键字集构造模块根据用户预先设定的模糊度,从预先建立好的字典文件中选出符合模糊度的单词,连同用户输入的检索关键字构成模糊关键字集。
3.根据权利要求1所述的一种基于云平台的信息收集存储和加密检索***,其特征在于:所述的检索模块通过数据访问接口模块访问存储在云存储服务器中的数据信息,根据模糊关键字集中所有关键字在索引文件中进行检索,得出检索结果;排序模块根据检索结果与关键字的匹配程度对检索结果进行排序,返回给用户。
4.根据权利要求1所述的一种基于云平台的信息收集存储和加密检索***,其特征在于:所述的数据信息加密模块对各个数据文件使用不同的密钥加密。
5.根据权利要求1所述的一种基于云平台的信息收集存储和加密检索***,其特征在于:所述的上传、下载及检索的数据信息均为加密的,解密只能由用户执行。
6.根据权利要求2所述的一种基于云平台的信息收集存储和加密检索***,其特征在于:所述的字典文件的生成方法为:从网上下载各个领域的大量文章作为语料,对语料进行分词,得到的单词按照字母顺序排序存储而得;字典文件存储在模糊关键字集构造模块中。
7.根据权利要求3所述的一种基于云平台的信息收集存储和加密检索***,其特征在于:所述索引文件的建立方法为:***从上传数据中过滤信息量低的单词,提取信息量高的关键字,建立关键字到文件的映射,采用倒排索引结构,保存为索引子文件,再将索引子文件加密上传到云存储服务器中,与服务器中已有的索引文件合并,更新索引文件;用户每次上传数据后都更新索引文件;所述索引文件由上传模块生成,并加密。
CN201110277785.3A 2011-09-19 2011-09-19 一种基于云平台的信息收集存储和加密检索*** Expired - Fee Related CN102325143B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110277785.3A CN102325143B (zh) 2011-09-19 2011-09-19 一种基于云平台的信息收集存储和加密检索***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110277785.3A CN102325143B (zh) 2011-09-19 2011-09-19 一种基于云平台的信息收集存储和加密检索***

Publications (2)

Publication Number Publication Date
CN102325143A CN102325143A (zh) 2012-01-18
CN102325143B true CN102325143B (zh) 2014-02-12

Family

ID=45452812

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110277785.3A Expired - Fee Related CN102325143B (zh) 2011-09-19 2011-09-19 一种基于云平台的信息收集存储和加密检索***

Country Status (1)

Country Link
CN (1) CN102325143B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104765848B (zh) * 2015-04-17 2017-12-01 中国人民解放军空军航空大学 混合云存储中支持结果高效排序的对称可搜索加密方法
CN107291826A (zh) * 2017-05-26 2017-10-24 北京金山安全管理***技术有限公司 文件搜索处理方法及装置
CN107463631A (zh) * 2017-07-14 2017-12-12 太仓诚泽网络科技有限公司 一种企业数据管理方法
CN110519234A (zh) * 2019-07-31 2019-11-29 茂名市云计算研究院 一种基于云计算数据应用终端设备和***
CN110659469B (zh) * 2019-09-12 2022-07-15 路光贤 一种基于云平台的医学信息管理统计***及设备
CN114362999A (zh) * 2021-12-03 2022-04-15 北京云迹科技股份有限公司 数据传输方法、***、电子设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102014288A (zh) * 2010-12-24 2011-04-13 北京理工大学 一种可边录制边加密的视频编码芯片

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101192227B (zh) * 2006-11-30 2011-05-25 阿里巴巴集团控股有限公司 一种基于分布式计算网络的日志文件分析方法和***

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102014288A (zh) * 2010-12-24 2011-04-13 北京理工大学 一种可边录制边加密的视频编码芯片

Also Published As

Publication number Publication date
CN102325143A (zh) 2012-01-18

Similar Documents

Publication Publication Date Title
CN106127075B (zh) 一种云存储环境下基于隐私保护的可搜索加密方法
CN103593476B (zh) 一种面向云存储的多关键词明密文检索方法和***
CN104765848B (zh) 混合云存储中支持结果高效排序的对称可搜索加密方法
CN102325143B (zh) 一种基于云平台的信息收集存储和加密检索***
CN100424704C (zh) 基于密文的全文检索***
CN103107889B (zh) 一种可搜索的云计算环境数据加密存储***和方法
CN108885627A (zh) 向远程客户端提供查询结果数据的查询即服务***
CN103023875B (zh) 一种账户管理***及方法
US20200401554A1 (en) Selective data migration and sharing
US20120203733A1 (en) Method and system for personal cloud engine
Zawoad et al. Digital forensics in the age of big data: Challenges, approaches, and opportunities
CN108628867A (zh) 面向云存储的多关键词密文检索方法和***
RU2724293C2 (ru) Персональный поисковый индекс с повышенной конфиденциальностью
CN102479192A (zh) 通过电子书阅读器进行用户行为模式分析的***和方法
CN111782620A (zh) 一种信用链路自动跟踪平台及其方法
CN104992124A (zh) 一种用于云存储环境的文档安全存取方法
CN103581224A (zh) 推送信息的方法和装置
CN110968571A (zh) 面向金融信息服务的大数据分析与处理平台
CN107103063A (zh) 基于大数据的科技信息资源检索查询***
AlZu'bi et al. A multi-levels geo-location based crawling method for social media platforms
CN109885650A (zh) 一种外包云环境隐私保护密文排序检索方法
CN113721856A (zh) 一种数字化社区管理数据存储***
Dasic et al. Applications of the search as a service (SaaS)
CN112416875A (zh) 日志管理方法、装置、计算机设备及存储介质
Arora et al. Update enabled multi-keyword searchable encryption scheme for secure data outsourcing

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140212

Termination date: 20140919

EXPY Termination of patent right or utility model