CN106372182A - 一种文件管理方法、***及云平台 - Google Patents

一种文件管理方法、***及云平台 Download PDF

Info

Publication number
CN106372182A
CN106372182A CN201610786686.0A CN201610786686A CN106372182A CN 106372182 A CN106372182 A CN 106372182A CN 201610786686 A CN201610786686 A CN 201610786686A CN 106372182 A CN106372182 A CN 106372182A
Authority
CN
China
Prior art keywords
file
cloud platform
grader
classification
file management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610786686.0A
Other languages
English (en)
Inventor
杨瑞
高飞
王帅
杨勇涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Beijing Electronic Information Industry Co Ltd
Original Assignee
Inspur Beijing Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Beijing Electronic Information Industry Co Ltd filed Critical Inspur Beijing Electronic Information Industry Co Ltd
Priority to CN201610786686.0A priority Critical patent/CN106372182A/zh
Publication of CN106372182A publication Critical patent/CN106372182A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/61Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/71Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种云平台的文件管理方法,包括:预先创建分类器;获取云平台中保存的待分类文件;利用分类器,对待分类文件进行分类,得到相应的分类后文件。可见,本申请预先创建了分类器,在获取到云平台中保存的待分类文件后,便利用上述分类器对上述待分类文件进行分类处理,从而得到经过分类的文件,由此实现对云平台中文件的分类整合,这样当用户对云平台中的文件进行查找时,可以通过文件的类别信息快速地查找到所需文件,从而提高了云平台用户的文件查找效率。另外,本申请还相应公开了一种文件管理***以及包括该***的云平台。

Description

一种文件管理方法、***及云平台
技术领域
本发明涉及云技术领域,特别涉及一种文件管理方法、***及云平台。
背景技术
当前,随着网络技术和云计算的快速发展,人们可以通过各种云平台获取到非常丰富的数据文件服务。云平台中通常保存着大量的文件,包括视频、文档、应用、图片、音乐、压缩包等等,而云平台在对这些文件进行存储时,通常是按照用户的上传顺序来进行依次存储。然而,按照用户的上传顺序来进行存储时,会使得文件的保存位置非常凌乱,从而导致用户以后在云平台上需要消耗大量的时间方可查找出目标文件。
综上所述可以看出,如何提高云平台用户的文件查找效率是目前有待解决的问题。
发明内容
有鉴于此,本发明的目的在于提供一种文件管理方法、***及云平台,提高了云平台用户的文件查找效率。其具体方案如下:
一种云平台的文件管理方法,包括:
预先创建分类器;
获取云平台中保存的待分类文件;
利用所述分类器,对所述待分类文件进行分类,得到相应的分类后文件。
优选的,所述预先创建分类器的过程,包括:
预先利用初始分类算法,对预设文件集进行样本训练,得到相应的训练结果;其中,所述预设文件集中的文件均为所述云平台中保存的文件;
将所述训练结果与标准分类结果进行比对,并利用比对结果,对所述初始分类算法进行相应地优化调整,得到所述分类器。
优选的,所述初始分类算法为SVM算法。
优选的,所述文件管理方法,还包括:
按照预设的更新周期,定期对所述分类器进行更新操作。
优选的,所述获取云平台中保存的待分类文件的过程,包括:
按照预设的获取周期,定期从所述云平台中提取出未经过分类处理的文件,得到所述待分类文件。
优选的,所述定期从所述云平台中提取出未经过分类处理的文件的过程,包括:
定期利用网络爬虫技术,从所述云平台中提取出未经过分类处理的文件,得到所述待分类文件。
本发明还公开了一种云平台的文件管理***,包括:
分类器创建模块,用于预先创建分类器;
文件获取模块,用于获取云平台中保存的待分类文件;
文件分类模块,用于利用所述分类器,对所述待分类文件进行分类,得到相应的分类后文件。
优选的,所述分类器创建模块,包括:
样本训练单元,用于预先利用初始分类算法,对预设文件集进行样本训练,得到相应的训练结果;其中,所述预设文件集中的文件均为所述云平台中保存的文件;
结果比对单元,用于将所述训练结果与标准分类结果进行比对;
算法优化单元,用于利用所述结果比对单元的比对结果,对所述初始分类算法进行相应地优化调整,得到所述分类器。
优选的,所述文件管理***,还包括:
分类器更新模块,用于按照预设的更新周期,定期对所述分类器进行更新操作。
本发明还公开了一种云平台,包括前述公开的文件管理***。
本发明中,云平台的文件管理方法,包括:预先创建分类器;获取云平台中保存的待分类文件;利用分类器,对待分类文件进行分类,得到相应的分类后文件。可见,本发明预先创建了分类器,在获取到云平台中保存的待分类文件后,便利用上述分类器对上述待分类文件进行分类处理,从而得到经过分类的文件,由此实现对云平台中文件的分类整合,这样当用户对云平台中的文件进行查找时,可以通过文件的类别信息快速地查找到所需文件,从而提高了云平台用户的文件查找效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例公开的一种云平台的文件管理方法流程图;
图2为本发明实施例公开的一种云平台的文件管理***结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例公开了一种云平台的文件管理方法,参见图1所示,该方法包括:
步骤S11:预先创建分类器。
步骤S12:获取云平台中保存的待分类文件。
可以理解的是,上述待分类文件是云平台上保存的一份或多份还未经过分类处理的文件。
步骤S13:利用分类器,对待分类文件进行分类,得到相应的分类后文件。
也即,本实施例在获取到待分类文件后,便可以利用上述的分类器,对待分类文件进行分类处理。可以理解的是,本实施例在得到分类后文件之后,会将分类后文件呈现在云平台的客户端上,用户通过云平台的客户端,便可查看到经过分类后的文件。
本发明实施例中,云平台的文件管理方法包括:预先创建分类器;然后获取云平台中保存的待分类文件;接着利用上述分类器,对待分类文件进行分类,得到相应的分类后文件。可见,本发明实施例预先创建了分类器,在获取到云平台中保存的待分类文件后,便利用上述分类器对上述待分类文件进行分类处理,从而得到经过分类的文件,由此实现对云平台中文件的分类整合,这样当用户对云平台中的文件进行查找时,可以通过文件的类别信息快速地查找到所需文件,从而提高了云平台用户的文件查找效率。
本发明实施例公开了一种具体的云平台的文件管理方法,相对于上一实施例,本实施例对技术方案作了进一步的说明和优化。具体的:
上一实施例步骤S11中,需要预先创建分类器。本实施例中,预先创建分类器的过程,具体可以包括下面步骤S111和S112:
步骤S111:预先利用初始分类算法,对预设文件集进行样本训练,得到相应的训练结果;其中,预设文件集中的文件均为云平台中保存的文件;
步骤S112:将训练结果与标准分类结果进行比对,并利用比对结果,对初始分类算法进行相应地优化调整,得到分类器。
也即,本发明实施例中的分类器是对初始分类算法进行优化调整后得到的,也即,本发明实施例中的分类器是优化后的分类算法。
可以理解的是,当利用上述分类算法优化过程对初始分类算法进行一次优化调整后,若得到的优化后的分类算法还无法满足预设的分类精度,则可以对本次优化后的分类算法再次进行优化调整,反复多次,直到得到的优化后的分类算法满足预设的分类精度。另外,需要说明的是,上述标准分类结果具体可以是对上述预设文件集进行人工分类后得到的分类结果。
优选的,上述初始分类算法具体为SVM算法(SVM,Support Vector Machine,支持向量机),当然,也可以是现有技术中其他类型的分类算法。
进一步的,本实施例中的文件管理方法,还可以包括:按照预设的更新周期,定期对分类器进行更新操作。
可以理解的是,对分类器进行更新操作的过程包括利用当前云平台中新增类型的文件来作为当前分类器的训练集,进行相应的样本训练后,将相应的训练结果与标准的分类结果进行比对,然后利用本次比对结果对分类器进行优化更新。另外,上述预设的更新周期可以根据实际需要进行相应地设定,例如可以设为一星期或一个月等。
另外,上一实施例步骤S12中,需要获取云平台中保存的待分类文件。其中,上述获取云平台中保存的待分类文件的过程,具体包括:
按照预设的获取周期,定期从云平台中提取出未经过分类处理的文件,得到待分类文件。
其中,上述预设的获取周期可以根据实际应用需要来进行相应地设定,例如,可以将上述获取周期设为一天或一星期等。
本实施例中,上述定期从云平台中提取出未经过分类处理的文件的过程,具体可以包括:定期利用网络爬虫技术,从云平台中提取出未经过分类处理的文件,得到待分类文件。
另外,本实施例也可以定期利用大数据挖掘技术,从云平台中提取出未经过分类的文件。
相应的,本发明实施例还公开了一种云平台的文件管理***,参见图2所示,该***包括:
分类器创建模块21,用于预先创建分类器;
文件获取模块22,用于获取云平台中保存的待分类文件;
文件分类模块23,用于利用分类器,对待分类文件进行分类,得到相应的分类后文件。
可见,本发明实施例预先创建了分类器,在获取到云平台中保存的待分类文件后,便利用上述分类器对上述待分类文件进行分类处理,从而得到经过分类的文件,由此实现对云平台中文件的分类整合,这样当用户对云平台中的文件进行查找时,可以通过文件的类别信息快速地查找到所需文件,从而提高了云平台用户的文件查找效率。
具体的,上述分类器创建模块,包括样本训练单元、结果比对单元和算法优化单元;其中,
样本训练单元,用于预先利用初始分类算法,对预设文件集进行样本训练,得到相应的训练结果;其中,预设文件集中的文件均为云平台中保存的文件;
结果比对单元,用于将训练结果与标准分类结果进行比对;
算法优化单元,用于利用结果比对单元的比对结果,对初始分类算法进行相应地优化调整,得到分类器。
进一步的,本实施例中的文件管理***,还可以包括:
分类器更新模块,用于按照预设的更新周期,定期对分类器进行更新操作。
进一步的,本发明实施例还公开了一种云平台,包括前述实施例中公开的文件管理***。
最后,还需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本发明所提供的一种文件管理方法、***及云平台进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种云平台的文件管理方法,其特征在于,包括:
预先创建分类器;
获取云平台中保存的待分类文件;
利用所述分类器,对所述待分类文件进行分类,得到相应的分类后文件。
2.根据权利要求1所述的云平台的文件管理方法,其特征在于,所述预先创建分类器的过程,包括:
预先利用初始分类算法,对预设文件集进行样本训练,得到相应的训练结果;其中,所述预设文件集中的文件均为所述云平台中保存的文件;
将所述训练结果与标准分类结果进行比对,并利用比对结果,对所述初始分类算法进行相应地优化调整,得到所述分类器。
3.根据权利要求2所述的云平台的文件管理方法,其特征在于,所述初始分类算法为SVM算法。
4.根据权利要求1至3任一项所述的云平台的文件管理方法,其特征在于,还包括:
按照预设的更新周期,定期对所述分类器进行更新操作。
5.根据权利要求1至3任一项所述的云平台的文件管理方法,其特征在于,所述获取云平台中保存的待分类文件的过程,包括:
按照预设的获取周期,定期从所述云平台中提取出未经过分类处理的文件,得到所述待分类文件。
6.根据权利要求5所述的云平台的文件管理方法,其特征在于,所述定期从所述云平台中提取出未经过分类处理的文件的过程,包括:
定期利用网络爬虫技术,从所述云平台中提取出未经过分类处理的文件,得到所述待分类文件。
7.一种云平台的文件管理***,其特征在于,包括:
分类器创建模块,用于预先创建分类器;
文件获取模块,用于获取云平台中保存的待分类文件;
文件分类模块,用于利用所述分类器,对所述待分类文件进行分类,得到相应的分类后文件。
8.根据权利要求7所述的云平台的文件管理***,其特征在于,所述分类器创建模块,包括:
样本训练单元,用于预先利用初始分类算法,对预设文件集进行样本训练,得到相应的训练结果;其中,所述预设文件集中的文件均为所述云平台中保存的文件;
结果比对单元,用于将所述训练结果与标准分类结果进行比对;
算法优化单元,用于利用所述结果比对单元的比对结果,对所述初始分类算法进行相应地优化调整,得到所述分类器。
9.根据权利要求7或8所述的云平台的文件管理***,其特征在于,还包括:
分类器更新模块,用于按照预设的更新周期,定期对所述分类器进行更新操作。
10.一种云平台,其特征在于,包括如权利要求7至9任一项所述的文件管理***。
CN201610786686.0A 2016-08-30 2016-08-30 一种文件管理方法、***及云平台 Pending CN106372182A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610786686.0A CN106372182A (zh) 2016-08-30 2016-08-30 一种文件管理方法、***及云平台

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610786686.0A CN106372182A (zh) 2016-08-30 2016-08-30 一种文件管理方法、***及云平台

Publications (1)

Publication Number Publication Date
CN106372182A true CN106372182A (zh) 2017-02-01

Family

ID=57900577

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610786686.0A Pending CN106372182A (zh) 2016-08-30 2016-08-30 一种文件管理方法、***及云平台

Country Status (1)

Country Link
CN (1) CN106372182A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108932343A (zh) * 2018-07-24 2018-12-04 南京甄视智能科技有限公司 人脸图像数据库的数据集清洗方法与***
CN109062996A (zh) * 2018-07-05 2018-12-21 贵州威爱教育科技有限公司 一种云端文件的管理方法及***

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101923561A (zh) * 2010-05-24 2010-12-22 中国科学技术信息研究所 一种文件自动分类方法
CN103379164A (zh) * 2012-04-26 2013-10-30 深圳市腾讯计算机***有限公司 照相机及其处理文件的方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101923561A (zh) * 2010-05-24 2010-12-22 中国科学技术信息研究所 一种文件自动分类方法
CN103379164A (zh) * 2012-04-26 2013-10-30 深圳市腾讯计算机***有限公司 照相机及其处理文件的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
无: "Google Photos谷歌相册 免费且无限空间容量的图片照片视频云存储服务", 《HTTPS://WWW.IPLAYSOFT.COM/GOOGLE-PHOTOS.HTML》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109062996A (zh) * 2018-07-05 2018-12-21 贵州威爱教育科技有限公司 一种云端文件的管理方法及***
CN108932343A (zh) * 2018-07-24 2018-12-04 南京甄视智能科技有限公司 人脸图像数据库的数据集清洗方法与***
CN108932343B (zh) * 2018-07-24 2020-03-27 南京甄视智能科技有限公司 人脸图像数据库的数据集清洗方法与***

Similar Documents

Publication Publication Date Title
CN109145216A (zh) 网络舆情监控方法、装置及存储介质
CN105468744B (zh) 一种实现税务舆情分析和全文检索的大数据平台
CN106489149A (zh) 一种基于数据挖掘和众包的数据标注方法及***
CN108776671A (zh) 一种网络舆情监控***及方法
CN104182465A (zh) 一种基于网络的大数据处理方法
CN103106287A (zh) 一种用户检索语句的处理方法及***
CN106227792A (zh) 用于推送信息的方法和装置
US20200334314A1 (en) Emergency disposal support system
CN104166701A (zh) 机器学习方法及***
CN106528641A (zh) 一种数据存储方法、装置及通信网关机
CN113742496B (zh) 一种基于异构资源融合的电力知识学习***及方法
CN114491168B (zh) 调控云样本数据共享方法、***、计算机设备及存储介质
CN106372182A (zh) 一种文件管理方法、***及云平台
CN108415971B (zh) 采用知识图谱推荐供求信息的方法和装置
CN104462322B (zh) 字符串比对方法和装置
CN105956069A (zh) 一种网络资讯的采集和分析方法及***
CN109492088A (zh) 搜索结果优化排序方法、装置及计算机可读存储介质
US20230056131A1 (en) Server and method for classifying entities of a query
CN104123393A (zh) 一种短信文本的分类方法和***
CN103164491B (zh) 一种数据处理和检索的方法及设备
CN109815475B (zh) 文本匹配方法、装置、计算设备及***
CN105426431A (zh) 一种面向分布式资源站点的搜索***及其实现方法
CN106599244B (zh) 通用的原始日志清洗装置及方法
US20220284052A1 (en) Extracting and surfacing topic descriptions from regionally separated data stores
Rückemann Creation of Objects and Concordances for Knowledge Processing and Advanced Computing

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170201