CN110399339A - 知识库管理***的文件分类方法、装置、设备及存储介质 - Google Patents

知识库管理***的文件分类方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN110399339A
CN110399339A CN201910524705.6A CN201910524705A CN110399339A CN 110399339 A CN110399339 A CN 110399339A CN 201910524705 A CN201910524705 A CN 201910524705A CN 110399339 A CN110399339 A CN 110399339A
Authority
CN
China
Prior art keywords
target data
data file
file
target
management system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910524705.6A
Other languages
English (en)
Inventor
王建华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201910524705.6A priority Critical patent/CN110399339A/zh
Publication of CN110399339A publication Critical patent/CN110399339A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/13File access structures, e.g. distributed indices
    • G06F16/137Hash-based
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • G06F16/148File search processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及人工智能领域,公开了知识库管理***的文件分类方法、装置、设备及存储介质,能够通过自然语言处理技术对知识库管理***中的新旧资料设置标签并分类,有利于资料员便捷的管理资料,提高了管理效率,同时也方便用户进行资料检索,提高了检索效率。本发明方法包括:获取知识库管理***中的目标资料文件;获取目标资料文件中的目标资料文本;通过预置知识库分类模型分析目标资料文本的关键信息;根据目标资料文件的关键信息设置目标资料文件的分类标签;通过建立索引将目标资料文件的分类标签与目标资料文件关联;若接收到用户的检索指令,则根据用户的检索指令中携带的目标分类标签在检索页面显示目标资料文件。

Description

知识库管理***的文件分类方法、装置、设备及存储介质
技术领域
本发明涉及自然语言处理领域,尤其涉及知识库管理***的文件分类方法、装置、设备及存储介质。
背景技术
在知识库管理领域,知识库管理***(knowledge base management system)存储了海量企事业单位共享的资料,良好得管理知识库数据便于用户检索资料,也有利于企事业单位的管理员便捷地处理资料。
现有的知识库管理***,资料的分类大多是人工进行,并且新资料和老资料的分类整理难度很高,管理效率低。
发明内容
本发明提供一种知识库管理***的文件分类方法,能够通过自然语言处理技术对知识库管理***中的新旧资料设置标签并分类,有利于资料员便捷的管理资料,提高了管理效率,同时也方便用户进行资料检索,提高了检索效率。
本发明实施例的第一方面提供一种知识库管理***的文件分类方法,包括:获取知识库管理***中的目标资料文件;获取所述目标资料文件中的目标资料文本;通过预置知识库分类模型分析所述目标资料文本的关键信息;根据所述目标资料文件的关键信息设置所述目标资料文件的分类标签;通过建立索引将所述目标资料文件的分类标签与所述目标资料文件关联;若接收到用户的检索指令,则根据所述用户的检索指令中携带的目标分类标签在检索页面显示所述目标资料文件。
可选的,在本发明实施例第一方面的第一种实现方式中,所述获取所述目标资料文件中的目标资料文本,包括:判断所述目标资料文件的文件类型,所述文件类型包括文档文件、音视频文件以及图片文件;若所述目标资料文件是文档文件,则获取所述目标资料文件中包含的文本,将所述目标资料文件中包含的文本作为所述目标资料文件;若所述目标资料文件为音视频文件,则通过预置的语音识别工具将所述音视频文件转换成所述目标资料文本;若所述目标资料文件是图片文件,则通过预置的文字识别工具从所述图片文件中获取所述目标资料文本。
可选的,在本发明实施例第一方面的第二种实现方式中,所述通过预置知识库分类模型分析所述目标资料文件的关键信息,包括:将所述目标资料文件的目标资料文本进行预处理,将自然语言组成的目标资料文本转换成离散数据格式的目标资料文本;将所述离散数据格式的目标资料文本输入到预置知识库分类模型中;获取所述预置知识库分类模型的输出词组,将所述预置知识库分类模型的输出词组作为所述目标资料文件的关键信息。
可选的,在本发明实施例第一方面的第三种实现方式中,所述将所述目标资料文件的目标资料文本进行预处理,将自然语言组成的目标资料文本转换成离散数据格式的目标资料文本,包括:对所述目标资料文本进行分词处理,得到预处理词汇集;删除所述预处理词汇集中出现次数高于第一阈值的词汇,删除所述预处理词汇集中出现次数低于第二阈值的词汇,得到目标词汇集;通过预置的词典索引表,将所述目标词汇集转换成目标数据集,将所述目标数据集作为所述离散数据格式的目标资料文本。
可选的,在本发明实施例第一方面的第四种实现方式中,所述根据所述目标资料文件的关键信息设置所述目标资料文件的分类标签,包括:设置所述目标资料文件的标识集合,所述标识集合用于存储目标资料文件的分类关键词;将所述目标文件的关键信息去重后添加到所述目标资料文件的标识集合,将所述标识集合中的每个分类关键词作为所述目标资料文件的分类标签。
可选的,在本发明实施例第一方面的第五种实现方式中,所述若接收到用户的检索指令,则根据所述用户的检索指令中携带的目标分类标签在检索页面显示所述目标资料文件,包括:识别所述检索指令中携带的目标分类标签;获取目标分类标签索引指向的存储地址;从所述存储地址中读取与所述目标分类标签相关联的资料文件;在检索页面显示与所述目标分类标签相关联的资料文件。
可选的,在本发明实施例第一方面的第六种实现方式中,所述方法还包括:按照预置的时间间隔更新知识库管理***中资料文件的分类标签。
本发明实施例的第二方面提供了一种知识库管理***的文件分类装置,包括:第一获取单元,用于获取知识库管理***中的目标资料文件;第二获取单元,用于获取所述目标资料文件中的目标资料文本;分析单元,用于通过预置知识库分类模型分析所述目标资料文件的关键信息;设置单元,用于根据所述目标资料文件的关键信息设置所述目标资料文件的分类标签;关联单元,用于通过建立索引将所述目标资料文件的分类标签与所述目标资料文件关联;显示单元,若接收到用户的检索指令,则用于根据所述用户的检索指令中携带的目标分类标签在检索页面显示所述目标资料文件。
可选的,在本发明实施例第二方面的第一种实现方式中,第二获取单元具体用于:判断所述目标资料文件的文件类型,所述文件类型包括文档文件、音视频文件以及图片文件;若所述目标资料文件是文档文件,则获取所述目标资料文件中包含的文本,将所述目标资料文件中包含的文本作为所述目标资料文件;若所述目标资料文件为音视频文件,则通过预置的语音识别工具将所述音视频文件转换成所述目标资料文本;若所述目标资料文件是图片文件,则通过预置的文字识别工具从所述图片文件中获取所述目标资料文本。
可选的,在本发明实施例第二方面的第二种实现方式中,分析单元具体包括:转换模块,用于将所述目标资料文件的目标资料文本进行预处理,将自然语言组成的目标资料文本转换成离散数据格式的目标资料文本;输入模块,用于将所述离散数据格式的目标资料文本输入到预置知识库分类模型中;获取模块,用于获取所述预置知识库分类模型的输出词组,将所述预置知识库分类模型的输出词组作为所述目标资料文件的关键信息。
可选的,在本发明实施例第二方面的第三种实现方式中,转换模块具体用于:对所述目标资料文本进行分词处理,得到预处理词汇集;删除所述预处理词汇集中出现次数高于第一阈值的词汇,删除所述预处理词汇集中出现次数低于第二阈值的词汇,得到目标词汇集;通过预置的词典索引表,将所述目标词汇集转换成目标数据集,将所述目标数据集作为所述离散数据格式的目标资料文本。
可选的,在本发明实施例第二方面的第四种实现方式中,设置单元具体用于:设置所述目标资料文件的标识集合,所述标识集合用于存储目标资料文件的分类关键词;将所述目标文件的关键信息去重后添加到所述目标资料文件的标识集合,将所述标识集合中的每个分类关键词作为所述目标资料文件的分类标签。
可选的,在本发明实施例第二方面的第五种实现方式中,显示单元具体用于:识别所述检索指令中携带的目标分类标签;获取目标分类标签索引指向的存储地址;从所述存储地址中读取与所述目标分类标签相关联的资料文件;在检索页面显示与所述目标分类标签相关联的资料文件。
可选的,在本发明实施例第二方面的第六种实现方式中,知识库管理***的文件分类装置还包括:更新单元,用于按照预置的时间间隔更新知识库管理***中资料文件的分类标签。
本发明实施例的第三方面提供了一种知识库管理***的文件分类设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任一实施方式所述的知识库管理***的文件分类方法。
本发明实施例的第四方面提供了一种计算机可读存储介质,包括指令,当所述指令在计算机上运行时,使得计算机执行上述任一实施方式所述的知识库管理***的文件分类方法的步骤。
本发明实施例提供的技术方案中,获取知识库管理***中的目标资料文件;获取所述目标资料文件中的目标资料文本;通过预置知识库分类模型分析所述目标资料文本的关键信息;根据所述目标资料文件的关键信息设置所述目标资料文件的分类标签;通过建立索引将所述目标资料文件的分类标签与所述目标资料文件关联;若接收到用户的检索指令,则根据所述用户的检索指令中携带的目标分类标签在检索页面显示所述目标资料文件。本发明实施例,能够通过自然语言处理技术对知识库管理***中的新旧资料设置标签并分类,有利于资料员便捷的管理资料,提高了管理效率,同时也方便用户进行资料检索,提高了检索效率。
附图说明
图1为本发明实施例中知识库管理***的文件分类方法的一个实施例示意图;
图2为本发明实施例中知识库管理***的文件分类方法的另一个实施例示意图;
图3为本发明实施例中知识库管理***的文件分类装置的一个实施例示意图;
图4为本发明实施例中知识库管理***的文件分类装置的另一个实施例示意图;
图5为本发明实施例中知识库管理***的文件分类设备的一个实施例示意图。
具体实施方式
本发明实施例提供了一种知识库管理***的文件分类方法、装置、设备及存储介质,能够在面试过程中向面试官推荐面试问题,根据应聘者的面试内容进行评分并将面试评分发送给面试官作为参考依据,提高了面试效率,也有助于规范面试官的面试过程。
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例进行描述。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
请参阅图1,本发明实施例提供的一种知识库管理***的文件分类方法的流程图,具体包括:
101、获取知识库管理***中的目标资料文件。
服务器获取知识库管理***中的目标资料文件。知识库管理***中的目标资料文件是可转换为文本的文件。知识库管理***为企事业单位为实现统一的文档共享而搭建海量文档集中存储的平台。
知识库管理***中的资料文件包括各类Office文件,多媒体文件以及电子文档,资料文件支持的格式包括Word、Excel、PowerPoint、WPS、Visio、PDF、AVI、WAV、MID、MPEG、MP3、DWF以及JPG。
102、获取目标资料文件中的目标资料文本。
服务器获取目标资料文件中的目标资料文本。具体的,服务器判断目标资料文件的文件类型,文件类型包括文档文件、音视频文件以及图片文件;若目标资料文件是文档文件,则服务器获取目标资料文件中包含的文本,将目标资料文件中包含的文本作为目标资料文件;若目标资料文件为音视频文件,则服务器通过预置的语音识别工具将该音视频文件转换成目标资料文本;若目标资料文件是图片文件,则服务器通过预置的文字识别工具从该图片文件中获取目标资料文本。
需要说明得是,预置知识库分类模型的输入为文本形式,服务器在通过预置知识库分类模型提取文件的关系信息之前,需要提取文件的文本信息,例如当目标资料文件为一首歌时,服务器需要提前提取这首歌的歌词。
103、通过预置知识库分类模型分析目标资料文本的关键信息。
服务器通过预置知识库分类模型分析目标资料文本的关键信息。关键信息为预置词库中的多个关键词。预置词库为根据知识库管理***中资料文件的分类需求设置的分类关键词数据库。具体的,服务器通过预置知识库分类模型分析目标资料文件的关键信息,包括:服务器将目标资料文件的目标资料文本进行预处理,将自然语言组成的目标资料文本表示成离散数据格式;服务器将离散数据格式的目标资料文本输入到预置知识库分类模型中;服务器获取预置知识库分类模型的输出词组,将预置知识库分类模型的输出词组作为目标资料文件的关键信息。
其中,预置知识库分类模型是以知识库管理***中不断更新的全部文件作为语料库进行训练而得到正确率达到百分之九十以上的文本分类卷积神经网络(textconvolutional neural networks,TextCNN)模型,且预置知识库模型的输出为预置词库中的多个关键词,TextCNN模型是利用卷积神经网络对文本进行分类的算法。
104、根据目标资料文件的关键信息设置目标资料文件的分类标签。
服务器根据目标资料文件的关键信息设置目标资料文件的分类标签。具体的,服务器设置目标资料文件的标识集合,标识结合用于存储目标资料文件的分类关键词;服务器将目标文件的关键信息去重后添加到目标资料文件的标识集合,将该标识集合中的每个分类关键词作为目标资料文件的分类标签。
需要说明得是,服务器根据不同的分类需求,在每个的分类依据下,设置目标资料文件不同的标识集合,并将目标资料文件所有的标识集合存储到预置的分类索引表中。举例说明,在预置的分类索引表中,当分类依据为作者时,目标资料文件的标识集合为:{作者A、作者B、作者C}。
105、通过建立索引将目标资料文件的分类标签与目标资料文件关联。
服务器通过建立索引将目标资料文件的分类标签与目标资料文件关联。该索引提供一种与分类标签关联的数据指针,该数据指针指向存储目标资料文件的地址。
在知识库管理***中,服务器可以通过建立哈希(hash)索引、B+Ttree索引或者函数索引将分类标签与目标资料文件关联,服务器也可以通过其他类型的索引将分类标签与目标资料文件关联,例如位图索引或者降序索引,具体此处不做限制。
需要说明得是,预置词库中包含所有的分类标签,每个分类标签通过索引与所有包含该分类标签的资料文件关联。
106、若接收到用户的检索指令,则根据用户的检索指令中携带的目标分类标签在检索页面显示目标资料文件。
若接收到用户的检索指令,则服务器根据用户的检索指令中携带的目标分类标签在检索页面显示目标资料文件。具体的,服务器识别检索指令中携带的目标分类标签;服务器获取目标分类标签索引指向的存储地址;服务器从存储地址中读取与目标分类标签相关联的资料文件;服务器在检索页面显示与目标分类标签相关联的资料文件。
需要说明得是,服务器在检索页面显示与该目标分类标签相关联的资料文件时,支持根据资料文件的标题、大小、日期以及上传人等属性进行排序。
本发明实施例,能够通过自然语言处理技术对知识库管理***中的新旧资料设置标签并分类,有利于资料员便捷的管理资料,提高了管理效率,同时也方便用户进行资料检索,提高了检索效率。
请参阅图2,本发明实施例中知识库管理***的文件分类方法的另一个实施例包括:
201、获取知识库管理***中的目标资料文件。
服务器获取知识库管理***中的目标资料文件。知识库管理***中的目标资料文件是可转换为文本的文件。知识库管理***为企事业单位为实现统一的文档共享而搭建海量文档集中存储的平台。
知识库管理***中的资料文件包括各类Office文件,多媒体文件以及电子文档,资料文件支持的格式包括Word、Excel、PowerPoint、WPS、Visio、PDF、AVI、WAV、MID、MPEG、MP3、DWF以及JPG等。
202、获取目标资料文件中的目标资料文本。
服务器获取目标资料文件中的目标资料文本。具体的,服务器判断目标资料文件的文件类型,文件类型包括文档文件、音视频文件以及图片文件;若目标资料文件是文档文件,则服务器获取目标资料文件中包含的文本,将目标资料文件中包含的文本作为目标资料文件;若目标资料文件为音视频文件,则服务器通过预置的语音识别工具将该音视频文件转换成目标资料文本;若目标资料文件是图片文件,则服务器通过预置的文字识别工具从该图片文件中获取目标资料文本。
需要说明得是,预置知识库分类模型的输入为文本形式,服务器在通过预置知识库分类模型提取文件的关系信息之前,需要提取文件的文本信息,例如当目标资料文件为一首歌时,服务器需要提前提取这首歌的歌词。
203、将目标资料文件的目标资料文本进行预处理,将自然语言组成的目标资料文本转换成离散数据格式的目标资料文本。
服务器将目标资料文件的目标资料文本进行预处理,将自然语言组成的目标资料文本转换成离散数据格式的目标资料文本。具体的,服务器对目标资料文本进行分词处理,得到预处理词汇集,例如将“乐视网明日复牌:5%以上的股东无减持计划”进行分词处理,得到的预处理词汇集为{乐视网、明日、复牌、5%、以上、的、股东、无、减持、计划};服务器删除预处理词汇集中出现次数高于第一阈值的词汇,删除预处理词汇集中出现次数低于第二阈值的词汇,得到目标词汇集;服务器通过预置的词典索引表,将目标词汇集转换成目标数据集,将目标数据集作为离散数据格式的目标资料文本,例如将目标词汇集{乐视网、复牌}转换成目标数据集{0,1}。
其中,服务器对目标资料文本进行分词处理的分词算法,可以是最大匹配算法、最大概率分词算法或者最少切分算法,还可以是其他的分词算法,具体此处不做限制。
204、将离散数据格式的目标资料文本输入到预置知识库分类模型中。
服务器将离散数据格式的目标资料文本输入到预置知识库分类模型中。预置知识库分类模型用于提取目标资料文本的特征。
可以理解的是,预置知识库分类模型将理算数据格式的目标资料文本组合成目标矩阵集后,利用预置卷积核进行卷积运算提取目标矩阵集的特征,再通过池化层去除部分特征后将得到的特征拼接得到离散数据格式的关键信息。
需要说明的是预置的知识库分类模型是以知识库管理***中不断更新的全部文件作为语料库进行训练而得到正确率达到百分之九十以上的TextCNN模型,且预置知识库模型的输出为预置词库中的多个关键词,TextCNN模型是利用卷积神经网络对文本进行分类的算法。
205、获取预置知识库分类模型的输出词组,将预置知识库分类模型的输出词组作为目标资料文件的关键信息。
服务器获取预置知识库分类模型的输出词组,将预置知识库分类模型的输出词组作为目标资料文件的关键信息。
需要说明得是,预置知识库分类模型的输出词组为离散数据格式,服务器需要通过预置的索引词典,将离散数据格式的输出词组转换为自然语言形式的输出词组。
206、根据目标资料文件的关键信息设置目标资料文件的分类标签。
服务器根据目标资料文件的关键信息设置目标资料文件的分类标签。具体的,服务器设置目标资料文件的标识集合,标识结合用于存储目标资料文件的分类关键词;服务器将目标文件的关键信息去重后添加到目标资料文件的标识集合,将该标识集合中的每个分类关键词作为目标资料文件的分类标签。
需要说明得是,服务器根据不同的分类需求,在每个的分类依据下,设置目标资料文件不同的标识集合,并将目标资料文件所有的标识集合存储到预置的分类索引表中。举例说明,在预置的分类索引表中,当分类依据为作者时,目标资料文件的标识集合为:{作者A、作者B、作者C}。
207、通过建立索引将目标资料文件的分类标签与目标资料文件关联。
服务器通过建立索引将目标资料文件的分类标签与目标资料文件关联。该索引提供一种与分类标签关联的数据指针,该数据指针指向存储目标资料文件的地址。
在知识库管理***中,服务器可以通过建立哈希(hash)索引、B+Ttree索引或者函数索引将分类标签与目标资料文件关联,服务器也可以通过其他类型的索引将分类标签与目标资料文件关联,例如位图索引或者降序索引,具体此处不做限制。
需要说明得是,预置词库中包含所有的分类标签,每个分类标签通过索引与所有包含该分类标签的资料文件关联。
208、若接收到用户的检索指令,则根据用户的检索指令中携带的目标分类标签在检索页面显示目标资料文件。
若接收到用户的检索指令,则服务器根据用户的检索指令中携带的目标分类标签在检索页面显示目标资料文件。具体的,服务器识别检索指令中携带的目标分类标签;服务器获取目标分类标签索引指向的存储地址;服务器从存储地址中读取与目标分类标签相关联的资料文件;服务器在检索页面显示与目标分类标签相关联的资料文件。
需要说明得是,服务器在检索页面显示与该目标分类标签相关联的资料文件时,支持根据资料文件的标题、大小、日期以及上传人等属性进行排序。
209、按照预置的时间间隔更新知识库管理***中资料文件的分类标签。
服务器按照预置的时间间隔更新知识库管理***中资料文件的分类标签。具体的,服务器根据预置的时间间隔获取管理者更新的分类标签;服务器将管理者更新的分类标签更新到预置词库中;基于更新的预置词库对预置知识库分类模型进行训练,得到目标知识库分类模型;通过目标知识库分类模型更新知识库管理***中资料文件的标识集合。
需要说明得是,服务器将管理者更新的分类标签更新到预置词库中,包括:服务器根据管理者更新的分类标签,修改预置词库中已有的分类标签;服务器根据管理者更新的分类标签,删除预置词库中已有的分类标签;服务器根据管理者更新的分类标签,添加新的分类标签到预置词库。
其中,预置的时间间隔可根据实际情况进行调整,例如24小时或者48小时,还可以是其他时长,具体此处不做限制。
本发明实施例,能够通过自然语言处理技术对知识库管理***中的新旧资料设置标签并分类,有利于资料员便捷的管理资料,提高了管理效率,同时也方便用户进行资料检索,提高了检索效率。
上面对本发明实施例中知识库管理***的文件分类方法进行了描述,下面对本发明实施例中知识库管理***的文件分类装置进行描述,请参阅图3,本发明实施例中知识库管理***的文件分类装置的一个实施例包括:
第一获取单元301,用于获取知识库管理***中的目标资料文件;
第二获取单元302,用于获取所述目标资料文件中的目标资料文本;
分析单元303,用于通过预置知识库分类模型分析所述目标资料文件的关键信息;
设置单元304,用于根据所述目标资料文件的关键信息设置所述目标资料文件的分类标签;
关联单元305,用于通过建立索引将所述目标资料文件的分类标签与所述目标资料文件关联;
显示单元306,若接收到用户的检索指令,则用于根据所述用户的检索指令中携带的目标分类标签在检索页面显示所述目标资料文件。
本发明实施例能够通过自然语言处理技术对知识库管理***中的新旧资料设置标签并分类,有利于资料员便捷的管理资料,提高了管理效率,同时也方便用户进行资料检索,提高了检索效率。
请参阅图4,本发明实施例中知识库管理***的文件分类装置的一个实施例包括:
第二获取单元302,用于获取所述目标资料文件中的目标资料文本;
分析单元303,用于通过预置知识库分类模型分析所述目标资料文件的关键信息;
设置单元304,用于根据所述目标资料文件的关键信息设置所述目标资料文件的分类标签;
关联单元305,用于通过建立索引将所述目标资料文件的分类标签与所述目标资料文件关联;
显示单元306,若接收到用户的检索指令,则用于根据所述用户的检索指令中携带的目标分类标签在检索页面显示所述目标资料文件。
可选的,第二获取单元302具体用于:
判断所述目标资料文件的文件类型,所述文件类型包括文档文件、音视频文件以及图片文件;若所述目标资料文件是文档文件,则获取所述目标资料文件中包含的文本,将所述目标资料文件中包含的文本作为所述目标资料文件;若所述目标资料文件为音视频文件,则通过预置的语音识别工具将所述音视频文件转换成所述目标资料文本;若所述目标资料文件是图片文件,则通过预置的文字识别工具从所述图片文件中获取所述目标资料文本。
可选的,分析单元303具体包括:
转换模块3031,用于将所述目标资料文件的目标资料文本进行预处理,将自然语言组成的目标资料文本转换成离散数据格式的目标资料文本;
输入模块3032,用于将所述离散数据格式的目标资料文本输入到预置知识库分类模型中;
获取模块3033,用于获取所述预置知识库分类模型的输出词组,将所述预置知识库分类模型的输出词组作为所述目标资料文件的关键信息。
可选的,转换模块3031具体用于:
对所述目标资料文本进行分词处理,得到预处理词汇集;删除所述预处理词汇集中出现次数高于第一阈值的词汇,删除所述预处理词汇集中出现次数低于第二阈值的词汇,得到目标词汇集;通过预置的词典索引表,将所述目标词汇集转换成目标数据集,将所述目标数据集作为所述离散数据格式的目标资料文本。
可选的,设置单元304具体用于:
设置所述目标资料文件的标识集合,所述标识集合用于存储目标资料文件的分类关键词;将所述目标文件的关键信息去重后添加到所述目标资料文件的标识集合,将所述标识集合中的每个分类关键词作为所述目标资料文件的分类标签。
可选的,显示单元306具体用于:
识别所述检索指令中携带的目标分类标签;获取目标分类标签索引指向的存储地址;从所述存储地址中读取与所述目标分类标签相关联的资料文件;在检索页面显示与所述目标分类标签相关联的资料文件。
可选的,知识库管理***的文件分类装置还包括:
更新单元307,用于按照预置的时间间隔更新知识库管理***中资料文件的分类标签。
本发明实施例,能够通过自然语言处理技术对知识库管理***中的新旧资料设置标签并分类,有利于资料员便捷的管理资料,提高了管理效率,同时也方便用户进行资料检索,提高了检索效率。
上面图3至图4从模块化功能实体的角度对本发明实施例中的知识库管理***的文件分类装置进行详细描述,下面从硬件处理的角度对本发明实施例中知识库管理***的文件分类设备进行详细描述。
图5是本发明实施例提供的一种知识库管理***的文件分类设备的结构示意图,该知识库管理***的文件分类设备500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processing units,CPU)501(例如,一个或一个以上处理器)和存储器509,一个或一个以上存储应用程序507或数据506的存储介质508(例如一个或一个以上海量存储设备)。其中,存储器509和存储介质508可以是短暂存储或持久存储。存储在存储介质508的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对知识库管理***的文件分类设备中的一系列指令操作。更进一步地,处理器501可以设置为与存储介质508通信,在知识库管理***的文件分类设备500上执行存储介质508中的一系列指令操作。
知识库管理***的文件分类设备500还可以包括一个或一个以上电源502,一个或一个以上有线或无线网络接口503,一个或一个以上输入输出接口504,和/或,一个或一个以上操作***505,例如Windows Serve,Mac OS X,Unix,Linux,FreeBSD等等。本领域技术人员可以理解,图5中示出的知识库管理***的文件分类设备结构并不构成对知识库管理***的文件分类设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。处理器501可以执行上述实施例中第一获取单元301、第二获取单元302、分析单元303、设置单元304、关联单元305和显示单元306的功能。
下面结合图5对知识库管理***的文件分类设备的各个构成部件进行具体的介绍:
处理器501是知识库管理***的文件分类设备的控制中心,可以按照设置的知识库管理***的文件分类方法进行处理。处理器501利用各种接口和线路连接整个知识库管理***的文件分类设备的各个部分,通过运行或执行存储在存储器509内的软件程序和/或模块,以及调用存储在存储器509内的数据,执行知识库管理***的文件分类设备的各种功能和处理数据,从而实现知识库管理***的文件分类。存储介质508和存储器509都是存储数据的载体,实施例中,存储介质508可以是指储存容量较小,但速度快的内存储器,而存储器509可以是储存容量大,但储存速度慢的外存储器。
存储器509可用于存储软件程序以及模块,处理器501通过运行存储在存储器509的软件程序以及模块,从而执行知识库管理***的文件分类设备500的各种功能应用以及数据处理。存储器509可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序(比如获取目标资料文件中的目标资料文本等)等;存储数据区可存储根据知识库管理***的文件分类设备的使用所创建的数据(比如分类标签)等。此外,存储器509可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。在本发明实施例中提供的知识库管理***的文件分类方法程序和接收到的数据流存储在存储器中,当需要使用时,处理器501从存储器509中调用。
在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、双绞线)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,光盘)、或者半导体介质(例如固态硬盘(solid state disk,SSD))等。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的***,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种知识库管理***的文件分类方法,其特征在于,包括:
获取知识库管理***中的目标资料文件;
获取所述目标资料文件中的目标资料文本;
通过预置知识库分类模型分析所述目标资料文本的关键信息;
根据所述目标资料文件的关键信息设置所述目标资料文件的分类标签;
通过建立索引将所述目标资料文件的分类标签与所述目标资料文件关联;
若接收到用户的检索指令,则根据所述用户的检索指令中携带的目标分类标签在检索页面显示所述目标资料文件。
2.根据权利要求1所述的知识库管理***的文件分类方法,其特征在于,所述获取所述目标资料文件中的目标资料文本,包括:
判断所述目标资料文件的文件类型,所述文件类型包括文档文件、音视频文件以及图片文件;
若所述目标资料文件是文档文件,则获取所述目标资料文件中包含的文本,将所述目标资料文件中包含的文本作为所述目标资料文件;
若所述目标资料文件为音视频文件,则通过预置的语音识别工具将所述音视频文件转换成所述目标资料文本;
若所述目标资料文件是图片文件,则通过预置的文字识别工具从所述图片文件中获取所述目标资料文本。
3.根据权利要求1所述的知识库管理***的文件分类方法,其特征在于,所述通过预置知识库分类模型分析所述目标资料文件的关键信息,包括:
将所述目标资料文件的目标资料文本进行预处理,将自然语言组成的目标资料文本转换成离散数据格式的目标资料文本;
将所述离散数据格式的目标资料文本输入到预置知识库分类模型中;
获取所述预置知识库分类模型的输出词组,将所述预置知识库分类模型的输出词组作为所述目标资料文件的关键信息。
4.根据权利要求3所述的知识库管理***的文件分类方法,其特征在于,所述将所述目标资料文件的目标资料文本进行预处理,将自然语言组成的目标资料文本转换成离散数据格式的目标资料文本,包括:
对所述目标资料文本进行分词处理,得到预处理词汇集;
删除所述预处理词汇集中出现次数高于第一阈值的词汇,删除所述预处理词汇集中出现次数低于第二阈值的词汇,得到目标词汇集;
通过预置的词典索引表,将所述目标词汇集转换成目标数据集,将所述目标数据集作为所述离散数据格式的目标资料文本。
5.根据权利要求1所述的知识库管理***的文件分类方法,其特征在于,所述根据所述目标资料文件的关键信息设置所述目标资料文件的分类标签,包括:
设置所述目标资料文件的标识集合,所述标识集合用于存储目标资料文件的分类关键词;
将所述目标文件的关键信息去重后添加到所述目标资料文件的标识集合,将所述标识集合中的每个分类关键词作为所述目标资料文件的分类标签。
6.根据权利要求1-5中任一所述的知识库管理***的文件分类方法,其特征在于,所述若接收到用户的检索指令,则根据所述用户的检索指令中携带的目标分类标签在检索页面显示所述目标资料文件,包括:
识别所述检索指令中携带的目标分类标签;
获取目标分类标签索引指向的存储地址;
从所述存储地址中读取与所述目标分类标签相关联的资料文件;
在检索页面显示与所述目标分类标签相关联的资料文件。
7.根据权利要求1-5中任一所述的知识库管理***的文件分类方法,其特征在于,所述方法还包括:
按照预置的时间间隔更新知识库管理***中资料文件的分类标签。
8.一种知识库管理***的文件分类装置,其特征在于,包括:
第一获取单元,用于获取知识库管理***中的目标资料文件;
第二获取单元,用于获取所述目标资料文件中的目标资料文本;
分析单元,用于通过预置知识库分类模型分析所述目标资料文件的关键信息;
设置单元,用于根据所述目标资料文件的关键信息设置所述目标资料文件的分类标签;
关联单元,用于通过建立索引将所述目标资料文件的分类标签与所述目标资料文件关联;
显示单元,若接收到用户的检索指令,则用于根据所述用户的检索指令中携带的目标分类标签在检索页面显示所述目标资料文件。
9.一种知识库管理***的文件分类设备,其特征在于,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1-7中任意一项所述的知识库管理***的文件分类方法。
10.一种计算机可读存储介质,其特征在于,包括指令,当所述指令在计算机上运行时,使得计算机执行如权利要求1-7中任意一项所述的知识库管理***的文件分类方法。
CN201910524705.6A 2019-06-18 2019-06-18 知识库管理***的文件分类方法、装置、设备及存储介质 Pending CN110399339A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910524705.6A CN110399339A (zh) 2019-06-18 2019-06-18 知识库管理***的文件分类方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910524705.6A CN110399339A (zh) 2019-06-18 2019-06-18 知识库管理***的文件分类方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN110399339A true CN110399339A (zh) 2019-11-01

Family

ID=68323232

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910524705.6A Pending CN110399339A (zh) 2019-06-18 2019-06-18 知识库管理***的文件分类方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN110399339A (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111046225A (zh) * 2019-12-20 2020-04-21 网易(杭州)网络有限公司 音频资源处理方法、装置、设备及存储介质
CN111125016A (zh) * 2019-12-24 2020-05-08 普世(南京)智能科技有限公司 一种基于标签组织的磁光混合文件存储方法及***
CN111523289A (zh) * 2020-04-24 2020-08-11 支付宝(杭州)信息技术有限公司 一种文本格式生成方法、装置、设备和可读介质
CN111881100A (zh) * 2020-07-10 2020-11-03 棕榈设计有限公司 知识库管理框架***及管理方法、设备及存储介质
CN112256669A (zh) * 2020-09-27 2021-01-22 北京三快在线科技有限公司 数据处理方法、装置、电子设备及可读存储介质
CN112445782A (zh) * 2020-12-10 2021-03-05 深圳市中博科创信息技术有限公司 一种面向客户服务的企业知识库管理方法
CN112559670A (zh) * 2020-12-22 2021-03-26 江苏鼎岳智慧信息技术有限公司 一种资料管理***
CN112597100A (zh) * 2020-09-17 2021-04-02 武汉大学 一种基于对象代理标签的文件管理方法及装置
CN113360459A (zh) * 2021-07-08 2021-09-07 国网能源研究院有限公司 文件半自动标注与存储的方法、***及装置
CN113392250A (zh) * 2021-06-30 2021-09-14 合肥高维数据技术有限公司 一种基于深度学习的矢量图检索方法及***
CN115422131A (zh) * 2022-11-04 2022-12-02 北京国电通网络技术有限公司 业务审核知识库检索方法、装置、设备和计算机可读介质
CN115934880A (zh) * 2022-10-31 2023-04-07 永道工程咨询有限公司 一种工程造价文档数据库构建和工程造价文档检索方法
CN117454396A (zh) * 2023-10-24 2024-01-26 深圳市马博士网络科技有限公司 一种私有云***的强制访问控制***及方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010250439A (ja) * 2009-04-13 2010-11-04 Kanagawa Univ 検索システム、データ生成方法、プログラムおよびプログラムを記録した記録媒体
CN103034667A (zh) * 2011-10-08 2013-04-10 英业达股份有限公司 依据网页索引标签建立资料库的***及其方法
CN104123366A (zh) * 2014-07-23 2014-10-29 谢建平 一种搜索方法及搜索服务器
CN107038480A (zh) * 2017-05-12 2017-08-11 东华大学 一种基于卷积神经网络的文本情感分类方法
CN107944559A (zh) * 2017-11-24 2018-04-20 国家计算机网络与信息安全管理中心 一种实体关系自动识别方法及***
CN108255972A (zh) * 2017-12-27 2018-07-06 浪潮通用软件有限公司 一种全文检索方法及***
CN108829765A (zh) * 2018-05-29 2018-11-16 平安科技(深圳)有限公司 一种信息查询方法、装置、计算机设备及存储介质
CN108932294A (zh) * 2018-05-31 2018-12-04 平安科技(深圳)有限公司 基于索引的简历数据处理方法、装置、设备及存储介质
CN109558492A (zh) * 2018-10-16 2019-04-02 中山大学 一种适于事件归因的上市公司知识图谱构建方法及装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010250439A (ja) * 2009-04-13 2010-11-04 Kanagawa Univ 検索システム、データ生成方法、プログラムおよびプログラムを記録した記録媒体
CN103034667A (zh) * 2011-10-08 2013-04-10 英业达股份有限公司 依据网页索引标签建立资料库的***及其方法
CN104123366A (zh) * 2014-07-23 2014-10-29 谢建平 一种搜索方法及搜索服务器
CN107038480A (zh) * 2017-05-12 2017-08-11 东华大学 一种基于卷积神经网络的文本情感分类方法
CN107944559A (zh) * 2017-11-24 2018-04-20 国家计算机网络与信息安全管理中心 一种实体关系自动识别方法及***
CN108255972A (zh) * 2017-12-27 2018-07-06 浪潮通用软件有限公司 一种全文检索方法及***
CN108829765A (zh) * 2018-05-29 2018-11-16 平安科技(深圳)有限公司 一种信息查询方法、装置、计算机设备及存储介质
CN108932294A (zh) * 2018-05-31 2018-12-04 平安科技(深圳)有限公司 基于索引的简历数据处理方法、装置、设备及存储介质
CN109558492A (zh) * 2018-10-16 2019-04-02 中山大学 一种适于事件归因的上市公司知识图谱构建方法及装置

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111046225A (zh) * 2019-12-20 2020-04-21 网易(杭州)网络有限公司 音频资源处理方法、装置、设备及存储介质
CN111046225B (zh) * 2019-12-20 2024-01-26 网易(杭州)网络有限公司 音频资源处理方法、装置、设备及存储介质
CN111125016A (zh) * 2019-12-24 2020-05-08 普世(南京)智能科技有限公司 一种基于标签组织的磁光混合文件存储方法及***
CN111523289A (zh) * 2020-04-24 2020-08-11 支付宝(杭州)信息技术有限公司 一种文本格式生成方法、装置、设备和可读介质
CN111523289B (zh) * 2020-04-24 2023-05-09 支付宝(杭州)信息技术有限公司 一种文本格式生成方法、装置、设备和可读介质
CN111881100A (zh) * 2020-07-10 2020-11-03 棕榈设计有限公司 知识库管理框架***及管理方法、设备及存储介质
CN112597100B (zh) * 2020-09-17 2022-07-15 武汉大学 一种基于对象代理标签的文件管理方法及装置
CN112597100A (zh) * 2020-09-17 2021-04-02 武汉大学 一种基于对象代理标签的文件管理方法及装置
CN112256669A (zh) * 2020-09-27 2021-01-22 北京三快在线科技有限公司 数据处理方法、装置、电子设备及可读存储介质
CN112445782A (zh) * 2020-12-10 2021-03-05 深圳市中博科创信息技术有限公司 一种面向客户服务的企业知识库管理方法
CN112559670A (zh) * 2020-12-22 2021-03-26 江苏鼎岳智慧信息技术有限公司 一种资料管理***
CN113392250A (zh) * 2021-06-30 2021-09-14 合肥高维数据技术有限公司 一种基于深度学习的矢量图检索方法及***
CN113392250B (zh) * 2021-06-30 2024-01-12 合肥高维数据技术有限公司 一种基于深度学习的矢量图检索方法及***
CN113360459A (zh) * 2021-07-08 2021-09-07 国网能源研究院有限公司 文件半自动标注与存储的方法、***及装置
CN115934880A (zh) * 2022-10-31 2023-04-07 永道工程咨询有限公司 一种工程造价文档数据库构建和工程造价文档检索方法
CN115422131A (zh) * 2022-11-04 2022-12-02 北京国电通网络技术有限公司 业务审核知识库检索方法、装置、设备和计算机可读介质
CN117454396A (zh) * 2023-10-24 2024-01-26 深圳市马博士网络科技有限公司 一种私有云***的强制访问控制***及方法
CN117454396B (zh) * 2023-10-24 2024-07-05 深圳市马博士网络科技有限公司 一种私有云***的强制访问控制***及方法

Similar Documents

Publication Publication Date Title
CN110399339A (zh) 知识库管理***的文件分类方法、装置、设备及存储介质
Hidayat et al. Sentiment analysis of twitter data related to Rinca Island development using Doc2Vec and SVM and logistic regression as classifier
AU2024204609A1 (en) System and engine for seeded clustering of news events
US9390086B2 (en) Classification system with methodology for efficient verification
CN106095928B (zh) 一种事件类型识别方法及装置
Jiang et al. An improved K-nearest-neighbor algorithm for text categorization
Al Qadi et al. Arabic text classification of news articles using classical supervised classifiers
JP2022534377A (ja) テキスト分類方法、装置及びコンピュータ読み取り可能な記憶媒体
Bisandu et al. Clustering news articles using efficient similarity measure and N-grams
CN111125086B (zh) 获取数据资源的方法、装置、存储介质及处理器
US10706030B2 (en) Utilizing artificial intelligence to integrate data from multiple diverse sources into a data structure
CA2956627A1 (en) System and engine for seeded clustering of news events
CN111026870A (zh) 一种综合文本分类和图像识别的ict***故障分析方法
CN111783861A (zh) 数据分类方法、模型训练方法、装置和电子设备
CN115098690B (zh) 一种基于聚类分析的多数据文档分类方法及***
CN111522950A (zh) 一种针对非结构化海量文本敏感数据的快速识别***
Hassan et al. Automatic document topic identification using wikipedia hierarchical ontology
CN116401338A (zh) 一种基于数据资产智能检索输入输出要求设计特征提取和注意力机制及其方法
CN114266255A (zh) 基于聚类模型的语料分类方法、装置、设备及存储介质
Ilic et al. Suffix tree clustering–data mining algorithm
Bhatt et al. An improved optimized web page classification using firefly algorithm with nb classifier (wpcnb)
Desai et al. Analysis of Health Care Data Using Natural Language Processing
Singh et al. Intra News Category Classification using N-gram TF-IDF Features and Decision Tree Classifier
CN111259150A (zh) 一种基于词频共现分析的文献表示方法
CN109947941A (zh) 一种基于电梯客服文本分类的方法和***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20191101

RJ01 Rejection of invention patent application after publication