CN113360459A - 文件半自动标注与存储的方法、***及装置 - Google Patents

文件半自动标注与存储的方法、***及装置 Download PDF

Info

Publication number
CN113360459A
CN113360459A CN202110774196.XA CN202110774196A CN113360459A CN 113360459 A CN113360459 A CN 113360459A CN 202110774196 A CN202110774196 A CN 202110774196A CN 113360459 A CN113360459 A CN 113360459A
Authority
CN
China
Prior art keywords
module
files
receiving
file
keywords
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110774196.XA
Other languages
English (en)
Inventor
孔维政
代红才
赵留军
王春明
张希凤
赵龙
郑志杰
曹相阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Energy Research Institute Co Ltd
Economic and Technological Research Institute of State Grid Shandong Electric Power Co Ltd
Original Assignee
State Grid Energy Research Institute Co Ltd
Economic and Technological Research Institute of State Grid Shandong Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Energy Research Institute Co Ltd, Economic and Technological Research Institute of State Grid Shandong Electric Power Co Ltd filed Critical State Grid Energy Research Institute Co Ltd
Priority to CN202110774196.XA priority Critical patent/CN113360459A/zh
Publication of CN113360459A publication Critical patent/CN113360459A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • G06F16/148File search processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/172Caching, prefetching or hoarding of files

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Human Computer Interaction (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明公开了一种文件半自动标注与存储的方法、***及装置,包括:接收模块接收发送模块发来的文件;接收模块收到发送模块发送的所述文件后,发送关键字需求指令到发送模块;发送模块接收到所述指令后,发送关键字到接收模块;接收模块接收到发送模块发送的关键字后,将关键字作为所述文件的标签存入存储模块。本发明比监督学习、半监督学习下,为文件打标签准确,提高准确率30%以上;为及时文件分类存储提供了方法和装置,避免了个人和集体在分享文件时,文件杂乱无序,仅增加文件发送人较少的工作量,就可以便捷地分类存储文件;为文件的后续检索、查找提供便利。

Description

文件半自动标注与存储的方法、***及装置
技术领域
本发明涉及文件标注领域,尤其是涉及一种文件半自动标注与存储的方法、***及装置。
背景技术
在现有技术中,在线文档协同编辑技术,文件打标签技术,监督学习技术,半监督学习技术,即时聊天工具中传送文件的技术,从即时聊天工具中获取文件的技术,电子邮件传送文件的技术,从电子邮件中获取文件的技术很常见。
在现有技术在,存在监督学习下打标签不准确;半监督学习下一方面不准确,另一方面人工量仍然较大;即时通讯、邮件***中有众多的文件需要打标签以便存储,但没有很好的分类存储方式的问题。
发明内容
本发明的目的在于提供一种文件半自动标注与存储的方法,旨在解决文件半自动标注与存储。
本发明提供一种文件半自动标注与存储的方法,包括:
S1、接收模块接收发送模块发来的文件;
S2、接收模块收到发送模块发送的所述文件后,发送关键字需求指令发送模块;
S3、发送模块接收到所述指令后,发送关键字到接收模块;
S4、接收模块接收到发送模块发送的关键字后,将关键字作为所述文件的标签存入存储模块。
本发明还提供一种文件半自动标注与存储的***,包括:
接收模块,用于接收发送模块发来的文件,收到发送模块发送的文件后,发送关键字需求指令到发送模块,接收到发送模块发送的关键字后,将关键字作为对应文件的标签存入存储模块;
发送模块,用于接收关键字指令后,发送关键字到接收模块。
本发明实施例还提供一种文件半自动标注与存储装置,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述方法的步骤。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有信息传递的实现程序,所述程序被处理器执行时实现上述方法的步骤。
采用本发明实施例,比监督学习、半监督学习下,为文件打标签准确,提高准确率30%以上;为及时文件分类存储提供了方法和装置,避免了个人和集体在分享文件时,文件杂乱无序,仅增加文件发送人较少的工作量,就可以便捷地分类存储文件;为文件的后续检索、查找提供便利。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例的文件半自动标注与存储方法的流程图;
图2是本发明实施例的文件半自动标注与存储***的示意图;
图3是本发明实施例的文件半自动标注与存储装置的示意图。
附图标记说明:
210:发送模块;220:接收模块。
具体实施方式
下面将结合实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”、“顺时针”、“逆时针”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个所述特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。此外,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
方法实施例
根据本发明实施例,提供了一种文件半自动标注与存储的方法,图1是本发明实施例的一种文件半自动标注与存储的方法的流程图,如图1所示,具体包括:
S1、接收模块接收发送模块发来的文件;
S1具体包括:接收模块接收发送模块发来的群对人发送的文件或/和单独人对人发送的文件。
S2、接收模块收到发送模块发送的所述文件后,发送关键字需求指令到发送模块;
S3、发送模块接收到所述指令后,发送关键字到接收模块;
S4、接收模块接收到发送模块发送的关键字后,将关键字作为所述文件的标签存入存储模块。
S4进一步包括:将关键字作为对应文件的标签存入存储模块后,利用关键字建立标签库。
S4进一步包括:将关键字作为对应文件的标签存入存储模块后,利用关键字建立词语库和语义库。
比监督学习、半监督学习下,为文件打标签准确,提高准确率30%以上;
为及时文件分类存储提供了方法和装置,避免了个人和集体在分享文件时,文件杂乱无序,仅增加文件发送人较少的工作量,就可以便捷地分类存储文件;为文件的后续检索、查找提供便利,建立标签库、词语库、语义库奠定了基础。
根据上述方法,具体实施如下:
一种为文件半自动标注与存储的方法。该方法基于即时通讯工具和/或邮件***,接收文件发送人发来的文件,文件可发送于即时通讯工具的群中、和/或单独人对人发送,该方法用于在接收到文件时,向文件发送人提示再次发送文件的关键词;文件发送人发送关键词后,自动将关键词作为所述文件的标签,并存储。
一种为文件半自动标注与存储的***。该***基于即时通讯工具和/或邮件***开发,嵌入即时通讯工具和/或邮件***,接收文件发送人发来的文件,文件可发送于即时通讯工具的群中、和/或单独人对人发送,该***用于在接收到文件时,向文件发送人提示再次发送文件的关键词;文件发送人发送关键词后,***自动将关键词作为所述文件的标签,并存储于***中。
一种为文件半自动标注与存储的装置。该装置为单独的软件模块,可嵌入即时通讯工具和/或邮件***,用于接收文件发送人发来的文件,文件可发送于即时通讯工具的群中、和/或单独人对人发送,该装置用于在接收到文件时,向文件发送人提示再次发送文件的关键词;文件发送人发送关键词后,装置自动将关键词作为所述文件的标签,并存储于装置中。
比监督学习、半监督学习下,为文件打标签准确,提高准确率30%以上;
为及时文件分类存储提供了方法和装置,避免了个人和集体在分享文件时,文件杂乱无序,仅增加文件发送人较少的工作量,就可以便捷地分类存储文件;为文件的后续检索、查找提供便利,为人为建立标签库、词语库、语义库奠定了基础。
***实施例
根据本发明实施例,提供了一种文件半自动标注与存储的***,图2是本发明实施例的文件半自动标注与存储的***的示意图,如图2所示,具体包括:
接收模块210,用于接收发送模块220发来的文件,收到发送模块220发送的文件后,发送关键字需求指令到发送模块220,接收到发送模块220发送的关键字后,将关键字作为对应文件的标签存入存储模块;
接收模块210具体用于:接收模块210接收发送模块220发来的群对人发送的文件或/和单独人对人发送的文件。
接收模块210还包括标签库模块,将关键字作为存入存储模块后,标签库模块用于利用关键字建立标签库。
接收模块210还包括词语语义模块,将关键字作为对应文件的标签存入存储模块后,词语语义模块用于利用关键字建立词语库和语义库。
发送模块220,用于接收关键字指令后,发送关键字到接收模块210。
本发明实施例是与上述方法实施例对应的***实施例,各个模块的具体操作可以参照方法实施例的描述进行理解,在此不再赘述。
装置实施例一
本发明实施例提供一种文件半自动标注与存储的装置,如图3所示,包括:存储器30、处理器32及存储在存储器30上并可在处理器32上运行的计算机程序,计算机程序被处理器执行时实现上述方法实施例中的步骤。
装置实施例二
本发明实施例提供一种计算机可读存储介质,计算机可读存储介质上存储有信息传输的实现程序,程序被处理器32执行时实现上述方法实施例中的步骤。
本实施例所述计算机可读存储介质包括但不限于为:ROM、RAM、磁盘或光盘等。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替本发明各实施例技术方案,并不使相应技术方案的本质脱离本方案的范围。

Claims (10)

1.一种文件半自动标注与存储的方法,其特征在于,包括,如下步骤:
S1、接收模块接收发送模块发来的文件;
S2、接收模块收到发送模块发送的所述文件后,发送关键字需求指令到发送模块;
S3、发送模块接收到所述指令后,发送关键字到接收模块;
S4、接收模块接收到发送模块发送的关键字后,将关键字作为所述文件的标签存入存储模块。
2.根据权利要求1所述的方法,其特征在于,所述S1具体包括:接收模块接收发送模块发来的群对人发送的文件或/和单独人对人发送的文件。
3.根据权利要求1所述的方法,其特征在于,所述S4进一步包括:将关键字作为对应文件的标签存入存储模块后,利用关键字建立标签库。
4.根据权利要求1所述的方法,其特征在于,所述S4进一步包括:将关键字作为对应文件的标签存入存储模块后,利用关键字建立词语库和语义库。
5.一种文件半自动标注与存储的***,其特征在于,包括,
接收模块,用于接收发送模块发来的文件,收到发送模块发送的文件后,发送关键字需求指令到发送模块,接收到发送模块发送的关键字后,将关键字作为对应文件的标签存入存储模块;
发送模块,用于接收关键字指令后,发送关键字到接收模块。
6.根据权利要求5所述的***,其特征在于,所述接收模块具体用于:接收模块接收发送模块发来的群对人发送的文件或/和单独人对人发送的文件。
7.根据权利要求5所述的***,其特征在于,所述接收模块还包括标签库模块,将关键字作为对应文件的标签存入存储模块后,标签库模块用于利用关键字建立标签库。
8.根据权利要求5所述的***,其特征在于,所述接收模块还包括词语语义模块,将关键字作为对应文件的标签存入存储模块后,词语语义模块用于利用关键字建立词语库和语义库。
9.一种文件半自动标注与存储的装置,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至4中任一项所述的文件半自动标注与存储的方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有信息传递的实现程序,所述程序被处理器执行时实现如权利要求1至4中任一项所述的文件半自动标注与存储的方法的步骤。
CN202110774196.XA 2021-07-08 2021-07-08 文件半自动标注与存储的方法、***及装置 Pending CN113360459A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110774196.XA CN113360459A (zh) 2021-07-08 2021-07-08 文件半自动标注与存储的方法、***及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110774196.XA CN113360459A (zh) 2021-07-08 2021-07-08 文件半自动标注与存储的方法、***及装置

Publications (1)

Publication Number Publication Date
CN113360459A true CN113360459A (zh) 2021-09-07

Family

ID=77538570

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110774196.XA Pending CN113360459A (zh) 2021-07-08 2021-07-08 文件半自动标注与存储的方法、***及装置

Country Status (1)

Country Link
CN (1) CN113360459A (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104537116A (zh) * 2015-01-23 2015-04-22 浙江大学 一种基于标签的图书搜索方法
CN109299227A (zh) * 2018-11-07 2019-02-01 平安医疗健康管理股份有限公司 基于语音识别的信息查询方法和装置
CN109992752A (zh) * 2019-03-07 2019-07-09 平安科技(深圳)有限公司 合同文件的标签标记方法、装置、计算机装置及存储介质
CN110119383A (zh) * 2019-04-15 2019-08-13 维沃移动通信有限公司 一种文件管理方法及终端设备
CN110399339A (zh) * 2019-06-18 2019-11-01 平安科技(深圳)有限公司 知识库管理***的文件分类方法、装置、设备及存储介质
CN110413771A (zh) * 2019-06-18 2019-11-05 平安科技(深圳)有限公司 基于solr的分类索引方法、装置、设备及存储介质
CN110750656A (zh) * 2019-10-29 2020-02-04 上海德拓信息技术股份有限公司 一种基于知识图谱的多媒体检测方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104537116A (zh) * 2015-01-23 2015-04-22 浙江大学 一种基于标签的图书搜索方法
CN109299227A (zh) * 2018-11-07 2019-02-01 平安医疗健康管理股份有限公司 基于语音识别的信息查询方法和装置
CN109992752A (zh) * 2019-03-07 2019-07-09 平安科技(深圳)有限公司 合同文件的标签标记方法、装置、计算机装置及存储介质
CN110119383A (zh) * 2019-04-15 2019-08-13 维沃移动通信有限公司 一种文件管理方法及终端设备
CN110399339A (zh) * 2019-06-18 2019-11-01 平安科技(深圳)有限公司 知识库管理***的文件分类方法、装置、设备及存储介质
CN110413771A (zh) * 2019-06-18 2019-11-05 平安科技(深圳)有限公司 基于solr的分类索引方法、装置、设备及存储介质
CN110750656A (zh) * 2019-10-29 2020-02-04 上海德拓信息技术股份有限公司 一种基于知识图谱的多媒体检测方法

Similar Documents

Publication Publication Date Title
US7596594B2 (en) System and method for displaying and acting upon email conversations across folders
KR101863981B1 (ko) 텍스트 메시지를 사용하여 스프레드시트와 상호작용하는 기법
US8429542B2 (en) Switching of emails in a conversation thread
US8499051B2 (en) Multiple messaging communication optimization
US20060168061A1 (en) Server, server system, and e-mail delivery method
CN102272788A (zh) 用于处理电子邮件的方法和***
CN104468833B (zh) 请求信息统一处理的方法和装置
CN108920675A (zh) 一种信息处理的方法、装置、计算机存储介质及终端
CN106293554A (zh) 一种云打印***及云打印机
CN111917560B (zh) 通信方法、装置和设备
US9774553B2 (en) Systems and methods for estimating message similarity
US20240020305A1 (en) Systems and methods for automatic archiving, sorting, and/or indexing of secondary message content
CN111767396A (zh) 数据处理方法、装置、设备及计算机可读存储介质
KR100903853B1 (ko) 서지정보를 이용한 도서관리 방법
CN104869048A (zh) 微博数据的分组处理方法、装置及***
CN111159530A (zh) 自动推送金融产品消息的***、设备、方法及存储介质
CN106789597A (zh) 即时通讯消息转发方法及装置、显示方法及装置
CN109547322A (zh) ***提示控制方法、装置、计算机及计算机可读存储介质
CN110011898B (zh) 电子邮件的回复方法、装置、存储介质及计算机设备
US20100057855A1 (en) Tracking subject matter in an e-mail discussion
US20230409459A1 (en) Distributed virtual data tank for cross service quota management
CN113360459A (zh) 文件半自动标注与存储的方法、***及装置
CN104077363A (zh) 邮件服务器及其进行邮件全文搜索的方法
KR20140013892A (ko) 복수의 정보 시스템에서의 출력 비교 방법
CN113360657B (zh) 一种公文智能分发办理方法、装置及计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination