CN107908762A - 一种自定义关键词串并历史数据的方法及*** - Google Patents

一种自定义关键词串并历史数据的方法及*** Download PDF

Info

Publication number
CN107908762A
CN107908762A CN201711199006.6A CN201711199006A CN107908762A CN 107908762 A CN107908762 A CN 107908762A CN 201711199006 A CN201711199006 A CN 201711199006A CN 107908762 A CN107908762 A CN 107908762A
Authority
CN
China
Prior art keywords
keyword
file
string
historical data
typing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711199006.6A
Other languages
English (en)
Inventor
胡嘉俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Huiruisitong Information Technology Co Ltd
Original Assignee
Guangzhou Huiruisitong Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Huiruisitong Information Technology Co Ltd filed Critical Guangzhou Huiruisitong Information Technology Co Ltd
Priority to CN201711199006.6A priority Critical patent/CN107908762A/zh
Publication of CN107908762A publication Critical patent/CN107908762A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种自定义关键词串并历史数据的方法,包括以下步骤:用户把已有的历史数据文件拷贝到文档库目录下;录入需要进行串并的关键词;通过已录入的关键词,选择N个关键词对文档库的文件内容进行关联串并,其中N≥1;设置定时串并的时间;根据关键词遍历文档库中的文档内容,把文件根据关键词进行归类展示,关键词高亮,从而发现有价值的历史数据文件。本发明搜索时间较短且能有效发现有价值的历史数据文件。

Description

一种自定义关键词串并历史数据的方法及***
技术领域
本发明涉及文字数据搜索以及储存领域,特别涉及一种自定义关键词串并历史数据的方法及***。
背景技术
目前,大多数工作单位对于文字类的数据,大多以word的文档进行录入以及保存其文档,但面对日益增长的数据量、文档量,随着时间的推移人们对于历史的文件逐渐忘记,并且没有一个很好的保存习惯及规律,所以重新在其电脑或者服务器搜索历史文件的时候,由于数据量大往往需要花费很长的一段时间,并且不一定能找到。
对于一些特殊的单位(例如警种单位、律师单位),其历史数据往往能发掘出有巨大价值的信息,若由于保存不善以及搜索时间过长,而丢失此类文件无疑是一大损失。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提供一种自定义关键词串并历史数据的方法。
本发明的另一目的在于提供一种自定义关键词串并历史数据的***。
本发明的目的通过以下的技术方案实现:
一种自定义关键词串并历史数据的方法,包括以下步骤:
S1、用户把已有的历史数据文件拷贝到文档库目录下;
S2、录入需要进行串并的关键词;
S3、通过已录入的关键词,选择N个关键词对文档库的文件内容进行关联串并,其中N≥1;
S4、设置定时串并的时间;
S5、根据关键词遍历文档库中的文档内容,把文件根据关键词进行归类展示,关键词高亮,从而发现有价值的历史数据文件。
所述历史数据文件的类型包括word、excel,txt。
所述步骤S3,还包括通过设置文件类型集合来进行关联串并。
本发明的另一目的通过以下的技术方案实现:
一种自定义关键词串并历史数据的***,包括顺序连接的存储模块、接收模块、定时模块、执行模块;其中
存储模块,用户把已有的历史数据文件拷贝到该***的文档库目录下;
接收模块,通过***提供的文本框,录入需要进行串并的关键词并进行存储;当接收到用户录入的新关键词后,给用户展示曾录入过的关键词;让用户可以更好的对关键词进行管理,不再需要的关键词,可以进行删除;同时选择N个关键词对文档库的文件内容进行关联串并,其中N≥1;
定时模块,设置关键词串并的开始时间;此操作可减少占用电脑的资源,可在电脑空闲的时候进行串并;
执行模块,根据已选择的关键词,对文档库里的所有文件内容进行串并,串并后关键词高亮显示,并且把文件根据关键词进行归类展示,从而发现有价值的历史文件。
所述给用户展示曾录入过的关键词,其排列方式包括按照字母顺序、数字大小顺序。
本发明与现有技术相比,具有如下优点和有益效果:
本发明首先把大量的历史文件拷入***的文档库中,根据用户录入的关键词,选择需要进行串并的关键词进行串并,串并出的每个文件内容中的关键词高亮显示,并且文件名也根据关键词归类排列,更方便进行筛选。传统的检索功能过于单一,并不支持多关键词检索,已经不能满足现在日益增长的庞大数据量,本发明很好的解决了该问题,并且可以选择空闲的时间串并历史文件,充分的利用时间。
附图说明
图1是本发明所述一种自定义关键词串并历史数据的方法的流程图。
图2是本发明所述一种自定义关键词串并历史数据的***的结构框图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
如图1,一种自定义关键词串并历史数据的方法,包括如下步骤:
步骤S1,用户把已有的历史数据文件拷贝到文档库目录下,以后新的文件也可以陆续存放进。
步骤S2,通过提供的文本框,录入需要进行串并的关键词,把录入的关键词进行存储;当接收到用户录入的新关键词后,按照字母、数字的排列方式,给用户展示曾录入过的关键词,让用户可以更好的对关键词进行管理,不再需要的关键词,可以进行删除,减少串并的工作量。
步骤S3,通过已录入的关键词,选择一个或多个关键词对文档库的文件内容进行关联串并。
作为一个较好的实施例,在用户选择完需要串并的关键词后,还可以设置另外一个条件:文件类型集合。传统的文件内容搜索方法,只能支持有限格式文件的内容搜索,在使用的时候可能存在不能支持所有文档内容的搜索的问题。而本发明中则可以选择使用两个以上的文件类型的集合作为搜索条件,因此有效解决了上述问题,并且可以有效过滤操作某些类型的文件(例如当前仅选择在Doc、Xls类型的文件中进行串并),真正实现了根据用户选择支持各种格式文件内容串并的目的。
需要说明的是,上述文件类型集合除了设置成两个以上的文件类型外,也是可以设置为选择一个单独的文件类型(如单独选择在Doc类型的文件中进行串并,或者选择在Xls类型的文件中进行串并等)来作为串并条件的。
步骤S4,设置定时串并的时间。作为一个较好的实施例,必须站在用户的体验去设计功能,由于串并时往往会占用较大的电脑资源,所以需要给用户提供一个选择执行时间的功能:定时执行(例如:凌晨执行),因此可以充分利用用户电脑闲置时运行***,达到电脑资源的合理分配。
步骤S5,根据关键词遍历文档库中的文档内容,把文件根据关键词进行归类展示,关键词高亮,从而发现有价值的历史文件;通过对文档库的文件内容遍历串并,提取出含有所需关键词的文档,并且把文档中关键词邻近的文字内容进行展示,关键词高亮显示,让用户了解该关键词所关联的信息。若用户是进行多个关键词的串并,串并后提取出的内容较多时,可以根据关键词逐一筛选,分别查看。
需要说明的是,本方法中的***支持直接录入文本数据进行存储,把本应存储在Word、Excel、Txt文件中的文本数据直接拷入***当中,分别有两个文本框,一个文本框录入文件的名称,另一文本框录入文件内的文本内容,同时自定义需要串并的关键词,与历史数据进行串并,更好的显示录入的文本内容与历史数据所串并出的效果,这就是为何该方法叫串并数据,非传统检索数据的原因。
于此,与上述一种自定义关键词串并历史数据方法相对应的,本发明还提供一种自定义关键词串并历史数据的***,如图2所示,包括:
存储模块,用于接收用户的历史数据文件,存入或拷贝到该***的文档库目录下;
接收模块,通过***提供的文本框,用于接收用户需要串并的关键词;
定时模块,用户可根据实际的情况,设置关键词串并的开始时间,此操作可减少占用电脑的资源,可在电脑空闲的时候进行串并。
执行模块,根据已选择的关键词(可选择多个关键词),对文档库里的所有文件内容进行遍历串并,串并后关键词高亮显示,并且把文件根据关键词进行归类展示,从而发现有价值的历史文件。
本发明中,为何叫串并***而非搜索或者检索***,本***支持直接录入文本数据进行存储,分别有两个文本框,一个文本框录入文件的名称,另一文本框录入文件内的文本内容,同时自定义需要串并的关键词后,与历史数据进行遍历串并,更好的显示录入的文本内容与历史数据所串并出的直观效果。
作为一个较好的实施例,所述串并条件还可以包括:文件类型集合。本发明中可以同时选择使用两个以上的文件类型的集合作为串并条件,例如当前选择在DOC类型、XLS类型的文件中同时进行串并,这样一来可以有效过滤操作某些类型的文件,真正实现根据用户选择支持各种格式文件内容的串并。
本发明的一种自定义关键词串并历史数据***的特征与上述一种自定义关键词串并历史数据方法相同,此处不予赘述。
通过以上方案可以看出,本发明首先自定义好需要串并的关键词,然后对文档库的文件内容进行遍历串并。若是进行多个关键词的串并,串并后提取出的内容较多时,可以根据关键词逐一筛选,分别查看。同时该***支持存储文档内容,把原本直接存放在Word,Excel文字内容,录入***里面,设置好串并的自定义关键词,如斯,更好的显示录入的文本内容与历史数据所串并出的直观效果。传统的检索功能过于单一,并不支持多关键词检索,已经不能满足现在日益增长的庞大数据量,该***很好的解决了问题,并且可以定时串并历史文件,充分的利用时间。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (5)

1.一种自定义关键词串并历史数据的方法,其特征在于,包括以下步骤:
S1、用户把已有的历史数据文件拷贝到文档库目录下;
S2、录入需要进行串并的关键词;
S3、通过已录入的关键词,选择N个关键词对文档库的文件内容进行关联串并,其中N≥1;
S4、设置定时串并的时间;
S5、根据关键词遍历文档库中的文档内容,把文件根据关键词进行归类展示,关键词高亮,从而发现有价值的历史数据文件。
2.根据权利要求1所述自定义关键词串并历史数据的方法,其特征在于,所述历史数据文件的类型包括word、excel,txt。
3.根据权利要求1所述自定义关键词串并历史数据的方法,其特征在于,所述步骤S3,还包括通过设置文件类型集合来进行关联串并。
4.一种自定义关键词串并历史数据的***,用于实现权利要求1至3任一要求所述自定义关键词串并历史数据的方法,其特征在于,包括顺序连接的存储模块、接收模块、定时模块、执行模块;其中
存储模块,用户把已有的历史数据文件拷贝到该***的文档库目录下;
接收模块,通过***提供的文本框,录入需要进行串并的关键词并进行存储;当接收到用户录入的新关键词后,给用户展示曾录入过的关键词;同时选择N个关键词对文档库的文件内容进行关联串并,其中N≥1;
定时模块,设置关键词串并的开始时间;执行模块,根据已选择的关键词,对文档库里的所有文件内容进行串并,串并后关键词高亮显示,并且把文件根据关键词进行归类展示,从而发现有价值的历史文件。
5.根据权利要求4所述自定义关键词串并历史数据的***,其特征在于,所述给用户展示曾录入过的关键词,其排列方式包括按照字母顺序、数字大小顺序。
CN201711199006.6A 2017-11-17 2017-11-17 一种自定义关键词串并历史数据的方法及*** Pending CN107908762A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711199006.6A CN107908762A (zh) 2017-11-17 2017-11-17 一种自定义关键词串并历史数据的方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711199006.6A CN107908762A (zh) 2017-11-17 2017-11-17 一种自定义关键词串并历史数据的方法及***

Publications (1)

Publication Number Publication Date
CN107908762A true CN107908762A (zh) 2018-04-13

Family

ID=61848578

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711199006.6A Pending CN107908762A (zh) 2017-11-17 2017-11-17 一种自定义关键词串并历史数据的方法及***

Country Status (1)

Country Link
CN (1) CN107908762A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109999509A (zh) * 2019-04-12 2019-07-12 网易(杭州)网络有限公司 信息处理方法及装置、存储介质和处理器

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101000617A (zh) * 2006-12-06 2007-07-18 华为技术有限公司 一种媒体内容管理***及方法
CN101116072A (zh) * 2005-02-03 2008-01-30 英国电讯有限公司 用于分类呈现搜索结果的方法和***
CN101319909A (zh) * 2007-06-08 2008-12-10 爱信艾达株式会社 导航装置以及导航用程序
CN101477568A (zh) * 2009-02-12 2009-07-08 清华大学 一种结构化数据和非结构化数据综合检索的方法
US20090299968A1 (en) * 2008-06-03 2009-12-03 The Directv Group, Inc. Methods and apparatus to save search data
CN102088635A (zh) * 2009-12-04 2011-06-08 深圳Tcl新技术有限公司 网络电视机记录历史搜索关键字的方法
CN103903210A (zh) * 2014-03-31 2014-07-02 安徽新华博信息技术股份有限公司 一种案件特征串并的分析方法
CN105160046A (zh) * 2015-10-30 2015-12-16 成都博睿德科技有限公司 基于文本的数据检索方法
CN106055540A (zh) * 2016-06-01 2016-10-26 比美特医护在线(北京)科技有限公司 一种数据处理方法及装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101116072A (zh) * 2005-02-03 2008-01-30 英国电讯有限公司 用于分类呈现搜索结果的方法和***
CN101000617A (zh) * 2006-12-06 2007-07-18 华为技术有限公司 一种媒体内容管理***及方法
CN101319909A (zh) * 2007-06-08 2008-12-10 爱信艾达株式会社 导航装置以及导航用程序
US20090299968A1 (en) * 2008-06-03 2009-12-03 The Directv Group, Inc. Methods and apparatus to save search data
CN101477568A (zh) * 2009-02-12 2009-07-08 清华大学 一种结构化数据和非结构化数据综合检索的方法
CN102088635A (zh) * 2009-12-04 2011-06-08 深圳Tcl新技术有限公司 网络电视机记录历史搜索关键字的方法
CN103903210A (zh) * 2014-03-31 2014-07-02 安徽新华博信息技术股份有限公司 一种案件特征串并的分析方法
CN105160046A (zh) * 2015-10-30 2015-12-16 成都博睿德科技有限公司 基于文本的数据检索方法
CN106055540A (zh) * 2016-06-01 2016-10-26 比美特医护在线(北京)科技有限公司 一种数据处理方法及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109999509A (zh) * 2019-04-12 2019-07-12 网易(杭州)网络有限公司 信息处理方法及装置、存储介质和处理器

Similar Documents

Publication Publication Date Title
US8600997B2 (en) Method and framework to support indexing and searching taxonomies in large scale full text indexes
US20060041606A1 (en) Indexing system for a computer file store
US20120246135A1 (en) Image search engine augmenting search text based upon category selection
JP2006244493A (ja) データベース内で表現されるファイル・システム
CN108255972A (zh) 一种全文检索方法及***
JP2008130084A (ja) 最適化されたインデックス検索方法及び装置
US6694302B2 (en) System, method and article of manufacture for personal catalog and knowledge management
US9378304B2 (en) Searchable, mutable data structure
Abramowicz et al. Filtering the Web to feed data warehouses
Lee et al. A social inverted index for social-tagging-based information retrieval
CN102508857B (zh) 一种基于事件关联的桌面云搜索方法
CN107908762A (zh) 一种自定义关键词串并历史数据的方法及***
Hodges Keyword in title indexes: effectiveness of retrieval in computer searches
TWI509433B (zh) Filter the collection of files
Bojars Case study: towards a linked digital collection of Latvian cultural heritage.
CN100407204C (zh) 一种标注计算机资源的方法及其***
US20090187576A1 (en) Tag syndicates
CN109359173A (zh) 一种裁判文书的检索方法
Zhao et al. ICRA: index based cache replacement algorithm for cloud storage
Tudhope et al. Towards Terminology Services: experiences with a pilot web service thesaurus browser
Mishra et al. Improved search technique using wildcards or truncation
JP2003091535A (ja) データ管理方法及びプログラム並びに装置
Abel et al. Social semantic web at work: Annotating and grouping social media content
KR100322300B1 (ko) 유동속성트리와부분결과행렬에의한영상데이터검색방법
Oldenburg Comparative Studies of Social Classification Systems Using RSS Feeds.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180413