CN109753655A - 基于语义概念关联的文献检索方法、***、存储介质及终端 - Google Patents

基于语义概念关联的文献检索方法、***、存储介质及终端 Download PDF

Info

Publication number
CN109753655A
CN109753655A CN201811634420.XA CN201811634420A CN109753655A CN 109753655 A CN109753655 A CN 109753655A CN 201811634420 A CN201811634420 A CN 201811634420A CN 109753655 A CN109753655 A CN 109753655A
Authority
CN
China
Prior art keywords
semantic concept
word
document
association
search result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811634420.XA
Other languages
English (en)
Other versions
CN109753655B (zh
Inventor
耿亦兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI BANPO NETWORK TECHNOLOGIES Ltd
Original Assignee
SHANGHAI BANPO NETWORK TECHNOLOGIES Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI BANPO NETWORK TECHNOLOGIES Ltd filed Critical SHANGHAI BANPO NETWORK TECHNOLOGIES Ltd
Priority to CN201811634420.XA priority Critical patent/CN109753655B/zh
Publication of CN109753655A publication Critical patent/CN109753655A/zh
Application granted granted Critical
Publication of CN109753655B publication Critical patent/CN109753655B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种基于语义概念关联的文献检索方法、***、存储介质及终端,包括以下步骤:当实时获取与搜索词对应的第一预设数量的第一文献检索结果之后,在所述第一文献检索结果的文献文本内容中提取第二预设数量的语义概念词;构建所述语义概念词之间互为关联揭示;构建所述第一文献检索结果中的任一文献与所述任一语义概念词互为关联揭示。本发明的基于语义概念关联的文献检索方法、***、存储介质及终端是在传统文献搜索结果的基础上实时介入的一种基于语义概念互为关联、语义概念与文献互为关联的检索方法、***、存储介质及终端,以辅助用户实现更为高效的文献检索。

Description

基于语义概念关联的文献检索方法、***、存储介质及终端
技术领域
本发明涉及文献检索的技术领域,特别是涉及一种基于语义概念关联的文献检索方法、***、存储介质及终端。
背景技术
文献是指具有历史价值的文章和论著或与某一学科有关的重要资料。文献检索(Information Retrieval)是指根据学习和工作的需要获取文献的过程。随着现代网络技术的发展,文献检索更多是通过计算机技术来完成。
现有技术中,通常通过搜索引擎在文献数据库中基于搜索词进行文献检索。该方法虽然能够满足基本的文献检索需求,但文献检索结果仅仅是单一维度的一篇篇文献的线性排列,文献之间除了先后顺序外,没有文献内容之间的交叉关联揭示。
事实上,同属于一个搜索结果的各篇文献之间在内容层面上必然存在某种程度的知识关联。而上述知识关联必然有益于用户进一步获取所需的文献。因此,如何基于文献内容的知识关联进一步进行文献检索成为当前研究的热点课题。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种基于语义概念关联的文献检索方法、***、存储介质及终端,能够在文献内容语义概念基础上进一步实现对文献的聚类细分和对语义概念的关联揭示。从而辅助用户实现更为高效的文献检索。
为实现上述目的及其他相关目的,本发明提供一种基于语义概念关联的文献检索方法,包括以下步骤:当实时获取与搜索词对应的第一预设数量的第一文献检索结果之后,在所述第一文献检索结果的文献文本内容中提取第二预设数量的语义概念词;构建所述语义概念词之间互为关联揭示;构建所述第一文献检索结果中的任一文献与所述任一语义概念词互为关联揭示。
于本发明一实施例中,所述第一文献检索结果至少来自一个文献数据库。
于本发明一实施例中,在所述第一文献检索结果的文献文本内容中提取第二预设数量的语义概念词包括以下步骤:
识别所述文献文本内容中的文本语词,所述文本语词的提取不依赖于术语词典,并且无需事先训练;
赋予所述文本语词以权重;
按照从大到小的权重顺序提取第二预设数量的文本词语作为语义概念词。
于本发明一实施例中,所述第一文献检索结果中的任一文献包含有一组至少一个语义概念词的语义概念词子集。
于本发明一实施例中,所述任一语义概念词对应所述第一文献检索结果中的一组至少一篇文献的文献子集;并且所述任一语义概念词由相关文献数量N和1对应N模式的相关文献链接指引所表达。
于本发明一实施例中,所述语义概念词之间的互为关联揭示包括:
所述任一语义概念词对应一组第三预设数量的关联语义概念词子集;
所述关联语义概念词子集中的任一语义概念词能够重构一组新的第三预设数量的关联语义概念词子集。
于本发明一实施例中,所述任一文献与所述任一语义概念词之间的互为关联揭示包括:
在所述第一文献检索结果中的任一文献中的任一语义概念词对应一组新的文献检索结果子集;
在所述文献检索结果子集中的任一语义概念词对应一组新的关联语义概念词子集;
在所述关联语义概念词子集中的任一语义概念词对应一组新的文献检索结果子集。
于本发明一实施例中,还包括能够追溯基于语义概念词的文献浏览历史以及基于语义概念词的关联语义概念子集的浏览历史。
本发明提供一种基于语义概念关联的文献检索***,包括实时文献获取模块、语义概念词提取及其关联分析模块和语义概念及其文献关联揭示模块;
所述实时文献获取模块用于实时动态截获与用户当前搜索词对应的第一预设数量的第一文献检索结果;
所述语义概念词提取和关联分析模块用于在所述第一文献检索结果的文献文本内容中提取第二预设数量的关联的语义概念词,包括识别所述文献文本内容中的文本语词;赋予文本语词以权重;按照从大到小的权重顺序提取第二预设数量的文本词语作为语义概念词;以及构建所述语义概念词之间关联关系;
所述语义概念与关联文献揭示模块用于由所述任一语义概念词揭示对应的一组第三预设数量的关联语义概念词子集;由所述关联语义概念词子集中的任一语义概念词重构揭示一组新的第三预设数量的关联语义概念词子集;在所述任一文献中的任一语义概念词揭示对应的一组新的文献检索结果子集;在所述文献检索结果子集中的任一语义概念词揭示对应的一组新的关联语义概念词子集;在所述关联语义概念词子集中的任一语义概念词揭示对应的一组新的文献检索结果子集。
本发明提供一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述的基于语义概念关联的文献检索方法。
最后,本发明提供一种终端,包括:处理器及存储器;
所述存储器用于存储计算机程序;
所述处理器用于执行所述存储器存储的计算机程序,以使所述终端执行上述的基于语义概念关联的文献检索方法。
如上所述,本发明所述的基于语义概念关联的文献检索方法、***、存储介质及终端,具有以下有益效果:
(1)能够基于文献内容的语义概念关联对文献进行进一步检索,从而实现文献内容的聚类细分,得到可追溯的启发式发散关联的文献检索结果;
(2)语义概念的提取不基于词典,无需事先训练,保证了所提取语义概念的实时性和原始语汇的准确性;
(3)能够实现文献的快速定位,辅助用户实现更为高效的文献检索;
(4)能够记录文献的浏览历史,帮助用户追溯文献浏览,极大地提升了用户体验;
(5)基于客户端实现,不增加搜索引擎服务器的工作负荷;当这种检索模式嵌入原始搜索引擎时,是对当前搜索引擎读者服务界面的扩充;当这种检索模式应用于宏搜索引擎时,是对多个搜索引擎跨库搜索结果统一的读者服务界面的扩充。
附图说明
图1显示为本发明的基于语义概念关联的文献检索方法于一实施例中的流程图;
图2显示为本发明的基于语义概念关联的文献检索方法于一实施例中的框架结构图;
图3显示为本发明的基于语义概念关联的文献检索***于一实施例中的结构示意图;
图4显示为本发明的终端于一实施例中的结构示意图。
元件标号说明
31 实时文献获取模块
32 语义概念词提取及其关联分析模块
33 语义概念及其文献关联揭示模块
41 处理器
42 存储器
具体实施方式
以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
本发明的基于语义概念关联的文献检索方法、***、存储介质及终端能够基于文献内容的语义概念关联对文献检索结果进行进一步检索,能够在已有文献检索结果的基础上实现文献内容的聚类细分和相互关联,有助于用户实现更为高效的文献检索和文献阅读,极大地提升了用户体验。
如图1所示,于一实施例中,本发明的基于语义概念关联的文献检索方法包括以下步骤:
步骤S1、当实时获取与搜索词对应的第一预设数量的第一文献检索结果之后,在所述第一文献检索结果的文献文本内容中提取第二预设数量的语义概念词。
具体地,基于作为客户端的终端的搜索引擎在一个或多个数据库中针对某一搜索词进行文献检索,获取所述一个或多个数据库返回的第一预设数量的第一文献检索结果。其中,所述搜索引擎可以是单个搜索引擎,也可以是宏搜索引擎。当涉及多个数据库时,每个数据库返回的文献数量可预先指定。所述一个或多个数据库基于所述搜索词进行文献检索,并按照相关度从高到低的顺序返回指定数量的文献。将所述一个或多个数据库返回的文献组合起来并得到所述第一文献检索结果,即所述搜索词对应的top-N篇文献。
于本发明一实施例中,所述第一文献检索结果至少包含文献数量、文献名称、文献链接。优选地,所述第一文献检索结果还包括文献摘要、文献作者、发表信息、文献全文等。
于本发明一实施例中,在所述第一文献检索结果的文献文本内容中提取第二预设数量的语义概念词包括以下步骤:
11)识别所述文献文本内容中的文本语词,所述文本语词的提取不依赖于术语词典,并且无需事先训练。
具体地,所述终端对于所获取的所述第一文献检索结果进行进一步分析,提取其中的文本语词。优选地,本发明中所涉及的文本语词提取不依赖于词典,不需要事先训练,从而保证了所提取语义概念的实时性和原始语汇的准确性,避免了遗漏,保证了文献检索时对文献内容的进一步理解和分析。
12)赋予所述文本语词以权重。
具体地,根据所述文本词语在各篇文献中的文本位置、文献出版时间、文献自身影响等信息来确定所述文本词语的权重。
首先,获取所述文本词语出现的文献位置信息。如标题,摘要。不同的位置,对应不同的权重。例如,语义概念词在标题中出现,则其权重为2;语义概念词在摘要中出现,则其权重为1。需要说明的是,若同一语义概念词同时在多个位置出现,则其对应的权重为多个位置对应的权重中的最高值。例如,语义概念词同时出现在标题和摘要,则对应的权重为2。
其次,确定所述文本词语所在文献的文献出版信息,如文献出版年代、文献影响因子等。不同的文献出版信息,对应不同的权重。例如,文献出版年代越近,权重越大;文献出版年代越远,权重越小。文献影响因子越大,权重越大;文献影响因子越小,权重越小。
最后,计算各篇文献中的所述文献位置信息和所述文献出版信息以及所述文献自身影响的权重累加均值,作为所述文本词语的权重。例如,在某一篇文献中,文本词语A的文献位置信息权重为2,文献出版年代权重为1,文献影响因子权重为3,则所述文本词语A对应的当前权重累加均值为2。
13)按照从大到小的权重顺序提取第二预设数量的文本词语作为语义概念词。
具体地,选择权重累加均值最高的前第二预设数量的文本词语作为语义概念词,以对文献进行进一步分析和归类。
需要说明的是,由于所提取的语义概念词的数量较多,为了兼顾计算复杂度和信息有效性,设定所提取的语义概念词的个数为所述第二预设数量。
于本发明一实施例中,所述第一文献检索结果中的任一文献包含有一组至少一个语义概念词的语义概念词子集。同时,所述任一语义概念词对应所述第一文献检索结果中的一组至少一篇文献的文献子集;并且所述任一语义概念词由相关文献数量N和1对应N模式的相关文献链接指引所表达。具体地,对应任一文献中的任一语义概念词,其可表示为对应的文献子集中的文献数量和1:N的文献链接。也就是说,基于所述语义概念词,可以获取所述第一文献检索结果中包含该语义概念词的文献数量和对应文献数量的文献链接,以使用户可以进一步浏览所述语义概念词的相关文献,从而辅助用户进行文献的精准定位和深度阅读。
步骤S2、构建所述语义概念词之间互为关联揭示。
具体地,构建所述语义概念词之间关联关系时,在同一语句或同一文献中共现的语义概念词构成语义上的互为关联关系。例如语义概念词A和语义概念词B出现在同一句子或同一文献中,则语义概念词A和语义概念词B互为关联关系。
进一步地,于本发明一实施例中,所述语义概念词之间的互为关联揭示包括:所述任一语义概念词对应一组第三预设数量的关联语义概念词子集;所述关联语义概念词子集中的任一语义概念词能够重构一组新的第三预设数量的关联语义概念词子集。例如,对于语义概念词“人工智能”,其关联的语义关联词可以包括“算法”、“应用”、“效果”等等。需要说明的是,所述语义关联词可以是一维的,也可以是多维的,即针对不同角度对语义概念词进行纵深层次发散,从而构建基于所述语义概念词的语义关联导航图。
步骤S3、构建所述第一文献检索结果中的任一文献与所述任一语义概念词互为关联揭示。
具体地,所述第一文献检索结果中任一文献与所述任一语义概念词之间的互为关联揭示包括:在所述第一文献检索结果中的任一文献中的任一语义概念词对应一组新的文献检索结果子集;在所述文献检索结果子集中的任一语义概念词对应一组新的关联语义概念词子集;在所述关联语义概念词子集中的任一语义概念词对应一组新的文献检索结果子集。也就是说,基于文献检索结果和关联语义概念,可以反复进行对应,从而进行扩展和延伸。
于本发明一实施例中,本发明的基于语义概念关联的文献检索方法还包括能够追溯基于语义概念词的文献浏览历史以及基于语义概念词的关联语义概念子集的浏览历史。具体地,用户的文献浏览记录都会记录在本地,以便于用户反复查看所阅读的文献,避免了文献的反复查找,提升了用户的浏览体验。
本发明的基于语义概念关联的文献检索方法的架构如图2所示。首先,基于单个搜索引擎或宏搜索引擎进行文献检索,获取搜索结果并进行详细展示;然后,选取Top-N个搜索结果作为第一检索结果,对所述第一检索结果进行语义概念感知和语义关系分析,从而基于语义概念获取第二检索结果,并进行语义概念词展示、文献数量说明、文献展示,同时记录浏览历史;同时,也可以对所述第一检索结果进行语义概念的关联,从而基于语义关联获取第三文献检索结果,并进行语义关联词展示、文献数量说明、文献展示,同时记录浏览历史。
下面通过具体实施例来进一步阐释本发明的基于语义概念关联的文献检索方法的流程。
在该实施例中,用户在一个或多个数据库中以“肾炎”为搜索词进行检索,则***显示“肾炎”的最前100篇相关文献,其中,所述100篇相关文献按照相关程度从高到低依次排列。同时在每篇文献上显示所提取到的每个语义概念词,如“儿科”、“过敏性紫癜肾炎”、“继发性肾小球疾病”、“免疫”等。当选取某一语义概念词如“过敏性紫癜”时,显示在所述100篇相关文献中,有5篇具有同一语义概念的相关文献。通过点击链接,即可揭示对应的5篇文献。同时,构建“过敏性紫癜”的语义关联词,优选地,可以通过绘制导航的方式构建语义关联词,则构建了以“过敏性紫癜”为起始节点的新的语义概念导航图。其中,本发明中的语义概念的关联表达可以是一个维度的,也可以是多个维度的。基于每个具体的语义关联词,可获取所述100篇相关文献中包含所述语义关联词的文献的数量及链接指引。同时,***还显示文献浏览历史,语义概念词的浏览历史,以便用户及时回顾。
如图3所示,于一实施例中,本发明的基于语义概念关联的文献检索***包括实时文献获取模块31、语义概念词提取及其关联分析模块32和语义概念及其文献关联揭示模块33。
所述实时文献获取模块31用于实时动态截获与用户当前搜索词对应的第一预设数量的第一文献检索结果。
所述语义概念词提取和关联分析模块32与相连,用于在所述第一文献检索结果的文献文本内容中提取第二预设数量的关联的语义概念词,包括识别所述文献文本内容中的文本语词;赋予文本语词以权重;按照从大到小的权重顺序提取第二预设数量的文本词语作为语义概念词;以及构建所述语义概念词之间关联关系;
所述语义概念与关联文献揭示模块33与所述实时文献获取模块31和所述语义概念词提取及其关联分析模块32相连,用于由所述任一语义概念词揭示对应的一组第三预设数量的关联语义概念词子集;由所述关联语义概念词子集中的任一语义概念词重构揭示一组新的第三预设数量的关联语义概念词子集;在所述任一文献中的任一语义概念词揭示对应的一组新的文献检索结果子集;在所述文献检索结果子集中的任一语义概念词揭示对应的一组新的关联语义概念词子集;在所述关联语义概念词子集中的任一语义概念词揭示对应的一组新的文献检索结果子集。
需要说明的是,所述实时文献获取模块31、所述语义概念词提取及其关联分析模块32和所述语义概念及其文献关联揭示模块33的结构和原理与本发明的基于语义概念关联的文献检索方法的步骤一一对应,故在此不再赘述。
需要说明的是,应理解以上装置的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现,也可以全部以硬件的形式实现,还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。例如:x模块可以为单独设立的处理元件,也可以集成在上述装置的某一个芯片中实现。此外,x模块也可以以程序代码的形式存储于上述装置的存储器中,由上述装置的某一个处理元件调用并执行以上x模块的功能。其它模块的实现与之类似。这些模块全部或部分可以集成在一起,也可以独立实现。这里所述的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称ASIC),一个或多个微处理器(Digital Singnal Processor,简称DSP),一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称FPGA)等。当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,如中央处理器(CentralProcessing Unit,简称CPU)或其它可以调用程序代码的处理器。这些模块可以集成在一起,以片上***(System-on-a-chip,简称SOC)的形式实现。
本发明的存储介质上存储有计算机程序,该程序被处理器执行时实现上述的基于语义概念关联的文献检索方法。所述存储介质包括:ROM、RAM、磁碟、U盘、存储卡或者光盘等各种可以存储程序代码的介质。
如图4所示,于一实施例中,本发明的终端包括:处理器41及存储器42。
所述存储器42用于存储计算机程序。
所述存储器42包括:ROM、RAM、磁碟、U盘、存储卡或者光盘等各种可以存储程序代码的介质。
所述处理器41与所述存储器42相连,用于执行所述存储器42存储的计算机程序,以使所述终端执行上述的基于语义概念关联的文献检索方法。
优选地,所述处理器41可以是通用处理器,包括中央处理器(CentralProcessingUnit,简称CPU)、网络处理器(NetworkProcessor,简称NP)等;还可以是数字信号处理器(DigitalSignalProcessor,简称DSP)、专用集成电路(ApplicationSpecificIntegratedCircuit,简称ASIC)、现场可编程门阵列(Field-ProgrammableGateArray,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
需要说明的是,本发明的基于语义概念关联的文献检索方法是基于终端浏览器的本地化实现,并不涉及文献数据库服务端负荷增加,从而保证了其实现的负荷稳定和有效性。
综上所述,本发明的基于语义概念关联的文献检索方法、***、存储介质及终端能够基于文献内容的语义概念关联对文献进行进一步检索,从而实现文献内容的聚类细分,得到可追溯的启发式发散关联的文献检索结果;语义概念的提取不基于术语词典,无需事先训练,保证了所提取语义概念的实时性和原始语汇的准确性;能够实现文献的快速定位,辅助用户实现更为高效的文献检索;能够记录文献的浏览历史,帮助用户反复进行文献浏览,极大地提升了用户体验;基于客户端的实现,不增加搜索引擎服务器的工作负荷;当这种检索模式嵌入原始搜索引擎时,是对当前搜索引擎读者服务界面的扩充;当这种检索模式应用于宏搜索引擎时,是对多个搜索引擎跨库搜索结果统一的读者服务界面的扩充。因此,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。
上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。

Claims (11)

1.一种基于语义概念关联的文献检索方法,其特征在于:包括以下步骤:
当实时获取与搜索词对应的第一预设数量的第一文献检索结果之后,在所述第一文献检索结果的文献文本内容中提取第二预设数量的语义概念词;
构建所述语义概念词之间互为关联揭示;
构建所述第一文献检索结果中的任一文献与所述任一语义概念词互为关联揭示。
2.根据权利要求1所述的基于语义概念关联的文献检索方法,其特征在于,所述第一文献检索结果至少来自一个文献数据库。
3.根据权利要求1所述的基于语义概念关联的文献检索方法,其特征在于,在所述第一文献检索结果的文献文本内容中提取第二预设数量的语义概念词包括以下步骤:
识别所述文献文本内容中的文本语词,所述文本语词的提取不依赖于术语词典,并且无需事先训练;
赋予所述文本语词以权重;
按照从大到小的权重顺序提取第二预设数量的文本词语作为语义概念词。
4.根据权利要求1所述的基于语义概念关联的文献检索方法,其特征在于,所述第一文献检索结果中的任一文献包含有一组至少一个语义概念词的语义概念词子集。
5.根据权利要求1所述的基于语义概念关联的文献检索方法,其特征在于,所述任一语义概念词对应所述第一文献检索结果中的一组至少一篇文献的文献子集;并且所述任一语义概念词由相关文献数量N和1对应N模式的相关文献链接指引所表达。
6.根据权利要求1所述的基于语义概念关联的文献检索方法,其特征在于,所述语义概念词之间的互为关联揭示包括:
所述任一语义概念词对应一组第三预设数量的关联语义概念词子集;
所述关联语义概念词子集中的任一语义概念词能够重构一组新的第三预设数量的关联语义概念词子集。
7.根据权利要求1所述的基于语义概念关联的文献检索方法,其特征在于,所述任一文献与所述任一语义概念词之间的互为关联揭示包括:
在所述第一文献检索结果中的任一文献中的任一语义概念词对应一组新的文献检索结果子集;
在所述文献检索结果子集中的任一语义概念词对应一组新的关联语义概念词子集;
在所述关联语义概念词子集中的任一语义概念词对应一组新的文献检索结果子集。
8.根据权利要求1所述的基于语义概念关联的文献检索方法,其特征在于,还包括能够追溯基于语义概念词的文献浏览历史以及基于语义概念词的关联语义概念子集的浏览历史。
9.一种基于语义概念关联的文献检索***,其特征在于,包括实时文献获取模块、语义概念词提取及其关联分析模块和语义概念及其文献关联揭示模块;
所述实时文献获取模块用于实时动态截获与用户当前搜索词对应的第一预设数量的第一文献检索结果;
所述语义概念词提取和关联分析模块用于在所述第一文献检索结果的文献文本内容中提取第二预设数量的关联的语义概念词,包括识别所述文献文本内容中的文本语词;赋予文本语词以权重;按照从大到小的权重顺序提取第二预设数量的文本词语作为语义概念词;以及构建所述语义概念词之间关联关系;
所述语义概念与关联文献揭示模块用于由所述任一语义概念词揭示对应的一组第三预设数量的关联语义概念词子集;由所述关联语义概念词子集中的任一语义概念词重构揭示一组新的第三预设数量的关联语义概念词子集;在所述任一文献中的任一语义概念词揭示对应的一组新的文献检索结果子集;在所述文献检索结果子集中的任一语义概念词揭示对应的一组新的关联语义概念词子集;在所述关联语义概念词子集中的任一语义概念词揭示对应的一组新的文献检索结果子集。
10.一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1至8中任一项所述的基于语义概念关联的文献检索方法。
11.一种终端,其特征在于,包括:处理器及存储器;
所述存储器用于存储计算机程序;
所述处理器用于执行所述存储器存储的计算机程序,以使所述终端执行权利要求1至8中任一项所述的基于语义概念关联的文献检索方法。
CN201811634420.XA 2018-12-29 2018-12-29 基于语义概念关联的文献检索方法、***、存储介质及终端 Active CN109753655B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811634420.XA CN109753655B (zh) 2018-12-29 2018-12-29 基于语义概念关联的文献检索方法、***、存储介质及终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811634420.XA CN109753655B (zh) 2018-12-29 2018-12-29 基于语义概念关联的文献检索方法、***、存储介质及终端

Publications (2)

Publication Number Publication Date
CN109753655A true CN109753655A (zh) 2019-05-14
CN109753655B CN109753655B (zh) 2023-02-28

Family

ID=66404342

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811634420.XA Active CN109753655B (zh) 2018-12-29 2018-12-29 基于语义概念关联的文献检索方法、***、存储介质及终端

Country Status (1)

Country Link
CN (1) CN109753655B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102955848A (zh) * 2012-10-29 2013-03-06 北京工商大学 一种基于语义的三维模型检索***和方法
CN103838833A (zh) * 2014-02-24 2014-06-04 华中师范大学 基于相关词语语义分析的全文检索***
CN105095469A (zh) * 2015-08-07 2015-11-25 薛德军 一种基于反馈的文献检索方法
CN108446367A (zh) * 2018-03-15 2018-08-24 湖南工业大学 一种基于知识图谱的包装行业数据搜索方法及设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102955848A (zh) * 2012-10-29 2013-03-06 北京工商大学 一种基于语义的三维模型检索***和方法
CN103838833A (zh) * 2014-02-24 2014-06-04 华中师范大学 基于相关词语语义分析的全文检索***
CN105095469A (zh) * 2015-08-07 2015-11-25 薛德军 一种基于反馈的文献检索方法
CN108446367A (zh) * 2018-03-15 2018-08-24 湖南工业大学 一种基于知识图谱的包装行业数据搜索方法及设备

Also Published As

Publication number Publication date
CN109753655B (zh) 2023-02-28

Similar Documents

Publication Publication Date Title
CN111488467B (zh) 地理知识图谱的构建方法、装置、存储介质及计算机设备
CN112667794A (zh) 一种基于孪生网络bert模型的智能问答匹配方法及***
CN102567509B (zh) 视觉信息辅助的即时通信方法及***
CN110929498B (zh) 一种短文本相似度的计算方法及装置、可读存储介质
CN109960756A (zh) 新闻事件信息归纳方法
Xin et al. The implementation of an AI-driven advertising push system based on a NLP algorithm
CN110807326A (zh) 结合gpu-dmm与文本特征的短文本关键词提取方法
CN110909140B (zh) 一种图谱问答与检索问答结合的中枢路由方法及装置
CN109977175B (zh) 数据配置查询方法和装置
CN112487161A (zh) 一种面向企业需求的专家推荐方法、装置、介质及设备
CN101661469A (zh) 学术文献关键词标引和检索***及方法
CN116975615A (zh) 基于视频多模态信息的任务预测方法和装置
CN109033272A (zh) 一种基于概念的知识自动关联方法及装置
CN104679784A (zh) 一种o2b智能搜索方法及***
CN117951274A (zh) 一种基于融合向量和关键词检索的rag知识问答方法和装置
CN107368500A (zh) 数据抽取方法及***
CN103593334A (zh) 一种用于判断文本情感程度的方法和***
CN109753655A (zh) 基于语义概念关联的文献检索方法、***、存储介质及终端
CN116361428A (zh) 一种问答召回方法、装置和存储介质
CN115757735A (zh) 一种面向电网数字化建设成果资源的智能检索方法及***
Zhang et al. Answering product-related questions with heterogeneous information
Goh et al. From English to ASIC: Hardware Implementation with Large Language Model
CN107622058A (zh) 制作外文地名库的方法、装置、电子导航芯片及服务器
Ilyas et al. A similarity measurement framework for requirements engineering
Gonçalves de Pontes et al. PPMark: An Architecture to Generate Privacy Labels Using TF-IDF Techniques and the Rabin Karp Algorithm

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant