CN104346446A - 一种基于知识图谱的论文关联信息推荐方法及装置 - Google Patents

一种基于知识图谱的论文关联信息推荐方法及装置 Download PDF

Info

Publication number
CN104346446A
CN104346446A CN201410585040.7A CN201410585040A CN104346446A CN 104346446 A CN104346446 A CN 104346446A CN 201410585040 A CN201410585040 A CN 201410585040A CN 104346446 A CN104346446 A CN 104346446A
Authority
CN
China
Prior art keywords
paper
papers
scholar
attribute information
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410585040.7A
Other languages
English (en)
Inventor
张晓婧
任伟帅
张扬
曹冰
苑雪冉
高一鸣
刘初
李�浩
马晋
沈健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baidu Online Network Technology Beijing Co Ltd
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201410585040.7A priority Critical patent/CN104346446A/zh
Publication of CN104346446A publication Critical patent/CN104346446A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种基于知识图谱的论文关联信息推荐方法及装置,该方法包括:对用户的查询内容进行解析,得到所述查询内容的类型,以及,对所述查询内容进行检索,得到包含所述查询内容的多篇论文;根据所述多篇论文的属性信息从知识图谱中获取与所述类型相对应的边关系;根据所述边关系为所述用户推荐与所述查询内容相关联的论文信息。本发明实施例可以使得用户从所感兴趣的查询内容就能从知识图谱中获取到与该查询内容相关联的更多的论文信息,使用户能够更好的从事科研工作,提高了用户获取相关论文信息的效率。

Description

一种基于知识图谱的论文关联信息推荐方法及装置
技术领域
本发明涉及互联网络技术领域,尤其涉及一种基于知识图谱的论文关联信息推荐方法及装置。
背景技术
在学术科研领域,学者/学生/科研工作者等对某个知识的研究成果最终会以论文的方式进行发表,而发表的论文本身包含了很多属性,图1为图书馆记录的一篇论文信息的示意图,如图1所示,图书馆记录的一篇论文中最主要的属性为:论文作者(大于等于1个作者)及作者机构、论文发表处(包括期刊、会议、学校(即学位论文))、论文关键词、引用文献和引证文献、研究领域。
多篇论文的相同属性之间又构成了各自的属性集合,论文集和属性集之间的关联形成了论文的知识图谱,目前国内外中英文论文有上亿篇,科研学者们在做科研获取科研资料的时候仍然停留在利用搜索引擎做关键词检索、导师推荐、学术研讨会交流等方式,庞大的论文知识因数据量大,归一难度高等问题目前没有被很好的利用起来。
发明内容
本发明实施例提供一种基于知识图谱的论文关联信息推荐方法及装置,使用户能够更好的从事科研工作,提高了用户获取相关论文信息的效率。
为达到上述目的,本发明的实施例采用如下技术方案:
一种基于知识图谱的论文关联信息推荐方法,该方法包括:
对用户的查询内容进行解析,得到所述查询内容的类型,以及,对所述查询内容进行检索,得到包含所述查询内容的多篇论文;
根据所述多篇论文的属性信息从知识图谱中获取与所述类型相对应的边关系;
根据所述边关系为所述用户推荐与所述查询内容相关联的论文信息。
一种基于知识图谱的论文关联信息推荐装置,该装置包括:
预处理模块,用于对用户的查询内容进行解析,得到所述查询内容的类型,以及,对所述查询内容进行检索,得到包含所述查询内容的多篇论文;
第一获取模块,用于根据所述多篇论文的属性信息从知识图谱中获取与所述类型相对应的边关系;
推荐模块,用于根据所述边关系为所述用户推荐与所述查询内容相关联的论文信息。
本发明实施例提供的基于知识图谱的论文关联信息推荐方法及装置,通过查询内容从知识图谱中为用户推荐论文信息,让用户在检索论文的同时能够获取到基于知识图谱推荐的论文信息,从而使得用户从所感兴趣的查询内容就能从知识图谱中获取到与该查询内容相关联的更多的论文信息,使用户能够更好的从事科研工作,提高了用户获取相关论文信息的效率。
附图说明
图1为图书馆记录的一篇论文信息的示意图。
图2为本发明实施例中的知识图谱的示意图。
图3为本发明实施例一提供的基于知识图谱的论文关联信息推荐方法的流程示意图。
图4为本发明实施例以专业名词“动作识别”进行搜索的结果示意图。
图5为本发明实施例以学者“徐光佑”进行搜索的结果示意图。
图6为本发明实施例以期刊“情报杂志”进行搜索的结果示意图。
图7为本发明实施例二提供的基于知识图谱的论文关联信息推荐方法的流程示意图。
图8为本发明实施例三提供的基于知识图谱的论文关联信息推荐装置的结构示意图。
图9为本发明实施例四提供的基于知识图谱的论文关联信息推荐装置的结构示意图。
具体实施方式
下面结合附图对本发明实施例提供的基于知识图谱的论文关联信息推荐方法及装置进行详细描述。
图2为本发明实施例中的知识图谱的示意图;如图2所示,本发明实施例中的知识图谱包括了论文、学者、期刊、会议、机构五类实体;其中,实体之间建立边关系(本发明实施例也可以称为关联关系);其中,在本发明实施例的知识图谱中,在一个实施例中,知识图谱还可以包括:学者图谱、学者-期刊图谱、学者-会议图谱、学者—机构图谱。
具体地,在学者图谱中,如果两个学者有共同发表的论文,就表示两个学者所表示的实体之间有关联,则为两个学者之间建立一条边,如图2中的学者A与学者B之间的边关系、学者A与学者C之间的边关系、学者B与学者C之间的边关系;两个学者共同发表的论文越多,则边关系的权重越大,表示该两个学者之间的关联关系越紧密。
在学者-期刊图谱中,若有学者在该期刊发表过论文,则表示该期刊和该学者之间有关联,则确定二者之间的边关系(如图2中的学者A与期刊M之间的边关系、学者B与期刊N之间的边关系),由此,每个期刊根据学者之间的关系会有很多条边;反之,从学者的角度看,若该学者在很多个期刊均有论文发表,则该学者与多个期刊之间也相应的有多个边关系。
在学者-会议图谱中,若学者在该会议发表过论文,则表示该会议和学者之间有关联,则建立一条边,如图2所示的学者B与会议E之间的边关系、学者B与会议F之间的边关系、学者C与会议E之间的边关系,因此在每个会议有很多条边;反过来从学者的角度来看,若学者在很多个会议均有论文发表,则每个学者也有很多条边。
在学者-机构图谱中,每个学者都有一个对应的学者机构,从机构来看,每个机构下有很多个学者,则每个机构实体有很多边;如图2所示,学者C与机构D之间的边关系,学者A与机构G之间的边关系。
从图2所示的知识图谱中,多个实体之间构建成了知识网络的图谱,从任何一个实体的点出发,都能有很多边与另外的实体之间相关联,每条边代表了不同的权重关系,也就意味着可以依据不同的权重关系向用户推荐论文信息。
实施例一:
图3为本发明实施例一提供的基于知识图谱的论文关联信息推荐方法的流程示意图,图4为本发明实施例以专业名词“动作识别”进行搜索的结果示意图,图5为本发明实施例以学者“徐光佑”进行搜索的结果示意图,图6为本发明实施例以期刊“情报杂志”进行搜索的结果示意图;下面结合图2所示的知识图谱和图4-图6对本发明实施例的技术方案进行描述,如图3所示,本发明实施例包括如下步骤:
步骤101,对用户的查询内容进行解析,得到查询内容的类型,以及,对查询内容进行检索,得到包含查询内容的多篇论文。
步骤102,根据多篇论文的属性信息从知识图谱中获取与类型相对应的边关系;
步骤103,根据边关系为用户推荐与查询内容相关联的论文信息。
在步骤101中,如图4所示,用户的查询内容为“动作识别”,通过对查询内容“动作识别”进行解析,确定该查询内容的类型为专业名词中的专业名词,对“动作识别”进行检索,得到多篇含有“动作识别”的多篇论文,在该多篇论文中,包含了多篇论文的“属性信息”,在一个实施例中,“属性信息”可以包括论文中的“关键词集合、学者、会议或者期刊”等,此外,还需要通过对该“动作识别”进行检索,从而得到包含该“动作识别”的多篇论文。在另一实施例中,类型还可以为学者,例如,如图5所示,通过搜索引擎的界面输入“徐光佑”,则可以通过“徐光佑”进行检索,从而得到包含“徐光佑”的多篇论文,在再一个实施例中,类型还可以为期刊,如图6所示,通过搜索引擎的界面输入“情报杂志”,则可以通过“情报杂志”进行检索,从而得到包含“情报杂志”相关的多篇论文。在另一个实施例中,还可以从相应的期刊数据库的界面输入“动作识别”或者“徐光佑”,从而在相应的数据库中获取到多篇论文。
在步骤102中,可以先获取多篇论文的属性信息,进一步获取属性信息在知识图谱中的位置,在知识图谱中的位置处获取与类型相对应的边关系,本发明实施例中的边关系也可以成为权重关系;在一个实施例中,由于“动作识别”的类型为专业名词,在通过“动作识别”检索到多篇论文后,从多篇论文中获取到相应的属性信息,如图4所示,在检索到多篇论文后,可以获取到多篇论文的属性信息包括“智能空间、时空特征、无线体域网、…”等关键词集合,还可以获取到多篇论文的属性信息包括“《计算机工程与应用》、《软件学报》、《上海交通大学学报》、《电子工程》”等期刊名称,还可以获取到“杨杰、张宗麟、徐光佑、覃良证、刘宏”等与“动作识别”所在技术领域相关的学者的名字。本领域技术人员可以理解的是,上述举例是以已经推荐出来的为例进行示例性说明的,还需要通过步骤103才能够得到图4所示的推荐信息。在通过上述属性信息后,可以从知识图谱中获取与类型相对应的边关系,例如,“动作识别”的类型为专业名词,根据该专业名词得到了多篇论文后,从该多篇论文中又可以获取到相应的属性信息,再根据属性信息“关键词集合”从知识图谱中获取与该专业名词“动作识别”相对应的边关系。
在步骤103中,结合图2所示,再根据边关系为用户推荐与“动作识别”相关联的论文信息,推荐的内容如图4右侧所示的“关键词、相关期刊、相关学者”中的与“动作识别”相关联的论文信息。
本发明实施例提供的基于知识图谱的论文关联信息推荐方法,通过查询内容从知识图谱中为用户推荐论文信息,让用户在检索论文的同时能够获取到基于知识图谱推荐的论文信息,从而使得用户从所感兴趣的查询内容就能从知识图谱中获取到与该查询内容相关联的更多的论文信息,使用户能够更好的从事科研工作,提高了用户获取相关论文信息的效率。
下面通过图4对本发明实施例的有益技术效果进行详细说明,现有技术中的搜索引擎只是通过主题词搜索提供与论文相关的信息,并不能够看到论文相关联的内容,例如:搜索与“动作识别”相关的论文,现有的搜索引擎仅仅对“动作识别”进行信息汇聚,用户可以获得到包含“动作识别”主题词的相关论文,并不知道与“动作识别”相关联的研究有哪些,也不知道“动作识别”这个领域内的知名学者和优秀的期刊有哪些。
如图4所示,同样是用户搜索“动作识别”这个主题词,本发明实施例除了对查询内容进行检索外,还可以为用户推荐与查询内容相关联的论文信息,从而使用户从一个查询内容所表达的主题词出发,获取到更丰富更全面的知识,使用户能够更好的从事科研工作,提高了用户获取相关论文信息的效率。如图4所示,在搜索页面上,包括了如下的论文信息:
1)关键词:推荐与“动作识别”相关的关键词,表示与“动作识别”相关的研究,例如“稀疏编码”、“小波变换”,用户可以很容易的知道和“动作识别”相关联的研究有哪些,从而拓展了用户的知识面;
2)相关期刊:表示对“动作识别”进行研究并发表的论文,这些论文主要发表在所推荐的权威期刊上,从而使用户可以参考所推荐期刊上的其他相关论文。
3)相关学者:代表研究“动作识别”技术领域的知名学者,用户可以通过这些学者获取到其发表的与“动作识别”相关联的论文。
实施例二:
图5为本发明实施例二提供的基于知识图谱的论文关联信息推荐方法的流程示意图;如图5所示,本发明实施例包括如下步骤:
步骤201,对用户的查询内容进行解析,得到查询内容的类型,以及,对查询内容进行检索,得到包含查询内容的多篇论文,执行步骤201。
本发明实施例中的步骤201的详细描述请参考上述实施例一中步骤101的描述,在此不再赘述。
步骤202,确定多篇论文的属性信息,其中,属性信息包括多篇论文的关键词集合、多名学者、期刊或者会议;如果属性信息包括多篇论文的关键词集合,执行步骤203,如果属性信息包括与多篇论文相关的多名学者,执行步骤206,如果属性信息包括与多篇论文相关联的多个期刊,执行步骤209。
在步骤202中,论文的属性信息可以通过图1所示的一篇论文中所包括的论文作者(大于等于1个作者)及作者机构、论文发表处(包括期刊、会议、学校(即学位论文))、论文关键词、引用文献和引证文献、研究领域等属性进行分类识别,当有多篇领域相近或者相同的论文时,则每一篇论文的属性信息所形成的集合,形成多篇论文的属性信息。
步骤203,对关键词集合共同出现的论文篇数进行排序,其中,论文篇数表示边关系的权重,执行步骤204。
步骤204,从关键词组合中获取排在前第一设定个数的关键词,执行步骤205。
步骤205,向用户推荐前第一设定个数的关键词,关键词为论文信息,流程结束。
在步骤203-步骤205中,在一个实施例中,查询内容的类型为专业名词,则检索包含该查询内容的所有论文,根据论文的作者、期刊、会议等属性信息,获取上述属性信息在知识图谱中的位置,并根据类别信息获取与该查询内容相关联的论文信息。在一个实施例中,若通过查询内容获取到与查询内容相关联的多篇论文中的关键词集合,则通过多篇论文可以获取到包含当前查询内容的论文同时包含的其他关键词(例如,机器视觉等),则按多个关键词(动作识别、机器视觉等)共同出现的多篇论文中的次数从高到低排序,可以获取第一设定个数的关键词(例如,第一设定个数最大为15个,最少为3个),从而通过该第一设定个数的关键词获取到与当前查询内容所在领域最相关的研究内容。在另一个实施例中,查询内容的类型为学者,检索该学者发表的多篇论文,根据多篇论文的作者、期刊、会议信息找到多篇论文的属性信息在知识图谱中的位置,并根据类型获取与查询内容相关联的论文信息。在一个实施例中,该学者发表的多篇论文中包含的多个关键词,按多个关键词共同在多篇论文中出现的次数从高到低排序,可以取第一设定个数的关键词(例如,第一设定个数最大为15个,最少为3个),从而通过该第一设定个数的关键词获取到与当前查询的学者所发表论文最相关的研究内容。
步骤206,对多名学者相关联的论文的第一被引频次之和进行排序,其中,第一被引频次表示边关系的权重,执行步骤207。
步骤207,从多名学者中获取排在前第二设定个数的学者,执行步骤208。
步骤208,向用户推荐前第二设定个数的学者,其中,第二设定个数的学者为论文信息,流程结束。
在步骤206-步骤208中,在一个实施例中,如图5所示,查询内容的类型为学者“徐光佑”,则首先检索到该学者已经发表的多篇论文,根据多篇论文的作者、期刊、会议信息等属性信息获取该属性信息在知识图谱中的位置,并根据类别获取与该学者相关联的论文信息,可以根据多个论文中的每个作者涉及到的论文的被引频次之和排序,取前第二设定个数的学者(例如,第二设定个数最大为6个,最小为3个),该前第二设定个数的学者代表了与当前查询内容最相关的知名学者。在另一个实施例中,检索该学者发表的多篇论文,根据多篇论文的作者、期刊、会议信息获取该属性信息在知识图谱中的位置,并根据类别获取与该学者相关的知识内容。如图5所示,通过“徐光佑”,可以向用户推荐的关键词包括:支持向量机、普通计算等,相关期刊包括:《软件学报》、《计算机学报》、《计算机研究与发展》等,相关学者包括:赵海、杨士强等。
步骤209,对多个期刊被引频次之和进行排序,其中,第二被引频次表示边关系的权重,执行步骤210。
步骤210,从多个期刊中获取排在前第三设定个数的期刊,执行步骤211。
步骤211,向用户推荐前第三设定个数的期刊,流程结束。
在步骤209-步骤211中,在一个实施例中,如图6所示,查询内容的类型为期刊,则首先检索到该学者已经发表的多篇论文,根据多篇论文的作者、期刊、会议信息等属性信息获取该属性信息在知识图谱中的位置,并根据类别获取与该学者相关联的论文信息,可以根据多个论文中的每个作者涉及到的论文的被引频次之和排序,取前第三设定个数的期刊名称(例如,第三设定个数最大为6个,最小为3个),该前第三设定个数的期刊表示与当前查询内容最相关的多篇论文所能发表的最佳期刊。在另一个实施例中,检索该学者发表的多篇论文,根据多篇论文的作者、期刊、会议信息获取该属性信息在知识图谱中的位置,并根据类别获取与该学者相关的知识内容。如图6所示,通过“情报杂志”,可以向用户推荐的关键词包括:编辑部、预防医学等,相关期刊包括:《情报杂志》、《预防医学情报杂志》、《现代情报》等,相关学者包括:杨华、张静海等。
进一步地,在上述实施例一和实施例二的基础上,还可以包括知识图谱的构建过程,具体可以包括:
首先,获取论文库中的每一篇论文的属性信息;
其次,根据每一篇论文的属性信息构建知识图谱,其中,知识图谱通过边关系形成网状结构。
在一个实施例中,可以解析出论文库中的每篇论文的属性信息,每一个属性信息通过点表示一个实体(如图2所示的论文、学者、期刊、机构、会议等),通过建立相互之间的边关系,使得多个实体之间建立起联系,最终形成网状结构,即本发明实施例中的知识图谱。
实施例三:
图8为本发明实施例三提供的基于知识图谱的论文关联信息推荐装置的结构示意图;如图8所示,本发明实施例包括:
预处理模块31,用于对用户的查询内容进行解析,得到所述查询内容的类型,以及,对所述查询内容进行检索,得到包含所述查询内容的多篇论文;
第一获取模块32,用于根据所述多篇论文的属性信息从知识图谱中获取与所述类型相对应的边关系;
推荐模块33,用于根据所述边关系为所述用户推荐与所述查询内容相关联的论文信息。
本发明实施例的有益技术效果可以参考上述实施例一中的有益技术效果,在此不再赘述。
实施例四:
图9为本发明实施例四提供的基于知识图谱的论文关联信息推荐装置的结构示意图;如图9所示,本发明实施例在上述实施例三的基础上,第一获取模块32包括:
第一获取单元321,用于获取所述多篇论文的属性信息;
第二获取单元322,用于获取所述属性信息在知识图谱中的位置;
第三获取单元323,用于在所述知识图谱中的位置处获取与所述类型相对应的边关系。
进一步地,所述属性信息为所述多篇论文的关键词集合,推荐模块33可包括:
第一排序单元331,用于对所述关键词集合共同出现的论文篇数进行排序,其中,所述论文篇数表示所述边关系的权重;
第四获取单元332,用于从所述关键词组合中获取排在前第一设定个数的关键词;
第一推荐单元333,用于向所述用户推荐所述前第一设定个数的关键词,所述关键词为所述论文信息。
进一步地,所述属性信息为与所述多篇论文相关的多名学者,推荐模块33可包括:
第二排序单元334,用于对所述多名学者相关联的论文的第一被引频次之和进行排序,其中,所述第一被引频次表示所述边关系的权重;
第五获取单元335,用于从所述多名学者中获取排在前第二设定个数的学者;
第二推荐单元336,用于向所述用户推荐所述前第二设定个数的学者,所述第二设定个数的学者为所述论文信息。
进一步地,所述属性信息为与所述多篇论文相关联的多个期刊,推荐模块33可包括:
第三排序单元337,用于对所述多个期刊被引频次之和进行排序,其中,所述第二被引频次表示所述边关系的权重;
第六获取单元338,用于从所述多个期刊中获取排在前第三设定个数的期刊;
第三推荐单元339,用于向所述用户推荐所述前第三设定个数的期刊。
此外,本发明实施例还可包括:
第二获取模块34,用于获取论文库中的每一篇论文的属性信息;
构建模块35,用于根据所述每一篇论文的属性信息构建所述知识图谱,其中,所述知识图谱通过所述边关系形成网状结构。
本发明实施例的有益技术效果可以参考上述实施例二中的有益技术效果,在此不再赘述。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (12)

1.一种基于知识图谱的论文关联信息推荐方法,其特征在于,所述方法包括:
对用户的查询内容进行解析,得到所述查询内容的类型,以及,对所述查询内容进行检索,得到包含所述查询内容的多篇论文;
根据所述多篇论文的属性信息从知识图谱中获取与所述类型相对应的边关系;
根据所述边关系为所述用户推荐与所述查询内容相关联的论文信息。
2.根据权利要求1所述的方法,其特征在于,所述根据所述多篇论文的属性信息从知识图谱中获取与所述类型相对应的边关系的步骤包括:
获取所述多篇论文的属性信息;
获取所述属性信息在知识图谱中的位置;
在所述知识图谱中的位置处获取与所述类型相对应的边关系。
3.根据权利要求1所述的方法,其特征在于,所述属性信息为所述多篇论文的关键词集合,所述根据所述边关系为所述用户推荐与所述查询内容相关联的论文信息的步骤包括:
对所述关键词集合共同出现的论文篇数进行排序,其中,所述论文篇数表示所述边关系的权重;
从所述关键词组合中获取排在前第一设定个数的关键词。
4.根据权利要求1所述的方法,其特征在于,所述属性信息为与所述多篇论文相关的多名学者,所述根据所述边关系为所述用户推荐与所述查询内容相关联的论文信息的步骤包括:
对所述多名学者相关联的论文的第一被引频次之和进行排序,其中,所述第一被引频次表示所述边关系的权重;
从所述多名学者中获取排在前第二设定个数的学者;
向所述用户推荐所述前第二设定个数的学者,所述第二设定个数的学者为所述论文信息。
5.根据权利要求1所述的方法,其特征在于,所述属性信息为与所述多篇论文相关联的多个期刊,所述根据所述边关系为所述用户推荐与所述查询内容相关联的论文信息的步骤包括:
对所述多个期刊被引频次之和进行排序,其中,所述第二被引频次表示所述边关系的权重;
从所述多个期刊中获取排在前第三设定个数的期刊;
向所述用户推荐所述前第三设定个数的期刊。
6.根据权利要求1-5任一所述的方法,其特征在于,所述方法还包括:
获取论文库中的每一篇论文的属性信息;
根据所述每一篇论文的属性信息构建所述知识图谱,其中,所述知识图谱通过所述边关系形成网状结构。
7.一种基于知识图谱的论文关联信息推荐装置,其特征在于,所述装置包括:
预处理模块,用于对用户的查询内容进行解析,得到所述查询内容的类型,以及,对所述查询内容进行检索,得到包含所述查询内容的多篇论文;
第一获取模块,用于根据所述多篇论文的属性信息从知识图谱中获取与所述类型相对应的边关系;
推荐模块,用于根据所述边关系为所述用户推荐与所述查询内容相关联的论文信息。
8.根据权利要求7所述的装置,其特征在于,所述第一获取模块的步骤包括:
第一获取单元,用于获取所述多篇论文的属性信息;
第二获取单元,用于获取所述属性信息在知识图谱中的位置;
第三获取单元,用于在所述知识图谱中的位置处获取与所述类型相对应的边关系。
9.根据权利要求7所述的装置,其特征在于,所述属性信息为所述多篇论文的关键词集合,所述推荐模块包括:
第一排序单元,用于对所述关键词集合共同出现的论文篇数进行排序,其中,所述论文篇数表示所述边关系的权重;
第四获取单元,用于从所述关键词组合中获取排在前第一设定个数的关键词;
第一推荐单元,用于向所述用户推荐所述前第一设定个数的关键词,所述关键词为所述论文信息。
10.根据权利要求7所述的装置,其特征在于,所述属性信息为与所述多篇论文相关的多名学者,所述推荐模块包括:
第二排序单元,用于对所述多名学者相关联的论文的第一被引频次之和进行排序,其中,所述第一被引频次表示所述边关系的权重;
第五获取单元,用于从所述多名学者中获取排在前第二设定个数的学者;
第二推荐单元,用于向所述用户推荐所述前第二设定个数的学者,所述第二设定个数的学者为所述论文信息。
11.根据权利要求7所述的装置,其特征在于,所述属性信息为与所述多篇论文相关联的多个期刊,所述推荐模块包括:
第三排序单元,用于对所述多个期刊被引频次之和进行排序,其中,所述第二被引频次表示所述边关系的权重;
第六获取单元,用于从所述多个期刊中获取排在前第三设定个数的期刊;
第三推荐单元,用于向所述用户推荐所述前第三设定个数的期刊。
12.根据权利要求7-11任一所述的装置,其特征在于,所述装置还包括:
第二获取模块,用于获取论文库中的每一篇论文的属性信息;
构建模块,用于根据所述每一篇论文的属性信息构建所述知识图谱,其中,所述知识图谱通过所述边关系形成网状结构。
CN201410585040.7A 2014-10-27 2014-10-27 一种基于知识图谱的论文关联信息推荐方法及装置 Pending CN104346446A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410585040.7A CN104346446A (zh) 2014-10-27 2014-10-27 一种基于知识图谱的论文关联信息推荐方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410585040.7A CN104346446A (zh) 2014-10-27 2014-10-27 一种基于知识图谱的论文关联信息推荐方法及装置

Publications (1)

Publication Number Publication Date
CN104346446A true CN104346446A (zh) 2015-02-11

Family

ID=52502037

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410585040.7A Pending CN104346446A (zh) 2014-10-27 2014-10-27 一种基于知识图谱的论文关联信息推荐方法及装置

Country Status (1)

Country Link
CN (1) CN104346446A (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104866593A (zh) * 2015-05-29 2015-08-26 中国电子科技集团公司第二十八研究所 一种基于知识图谱的数据库搜索方法
CN105335519A (zh) * 2015-11-18 2016-02-17 百度在线网络技术(北京)有限公司 模型生成方法及装置、推荐方法及装置
CN105550216A (zh) * 2015-12-03 2016-05-04 百度在线网络技术(北京)有限公司 学术研究信息的搜索方法、挖掘方法及装置
WO2017005196A1 (zh) * 2015-07-08 2017-01-12 谭红 基于知识点结构的搜索装置
CN106934040A (zh) * 2017-03-15 2017-07-07 中国科学技术信息研究所 团队信息的确定方法和确定装置
CN107133276A (zh) * 2017-04-12 2017-09-05 安徽富驰信息技术有限公司 一种司法类案检索***及其检索方法
CN108920556A (zh) * 2018-06-20 2018-11-30 华东师范大学 基于学科知识图谱的推荐专家方法
CN109033132A (zh) * 2018-06-05 2018-12-18 中证征信(深圳)有限公司 利用知识图谱计算文本和主体相关度的方法以及装置
CN109255033A (zh) * 2018-11-05 2019-01-22 桂林电子科技大学 一种基于位置服务领域的知识图谱的推荐方法
CN109522551A (zh) * 2018-11-09 2019-03-26 天津新开心生活科技有限公司 实体链接方法、装置、存储介质及电子设备
CN110147437A (zh) * 2019-05-23 2019-08-20 北京金山数字娱乐科技有限公司 一种基于知识图谱的搜索方法及装置
CN110209779A (zh) * 2018-02-05 2019-09-06 索意互动(北京)信息技术有限公司 一种客户端、服务器、检索方法及其***
CN110362692A (zh) * 2019-07-23 2019-10-22 中南大学 一种基于知识图谱的学术圈构建方法
CN110502671A (zh) * 2019-08-29 2019-11-26 南京智慧光信息科技研究院有限公司 基于人工智能的学术关系知识图谱生成方法和机器人***
CN110737774A (zh) * 2018-07-03 2020-01-31 百度在线网络技术(北京)有限公司 图书知识图谱的构建、图书推荐方法、装置、设备及介质
CN111859125A (zh) * 2020-07-09 2020-10-30 威海天鑫现代服务技术研究院有限公司 一个面向知识产权技术资源领域的语义网络构建和服务推荐方法
CN113434706A (zh) * 2020-03-23 2021-09-24 北京国双科技有限公司 学术合作关系分析方法及装置
CN113806597A (zh) * 2021-09-10 2021-12-17 浙江创邻科技有限公司 一种基于图数据库的金融搜索***及方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101308499A (zh) * 2008-07-04 2008-11-19 华中科技大学 一种基于关联分析的文献检索方法
CN102156706A (zh) * 2011-01-28 2011-08-17 清华大学 一种指导者推荐***及方法
CN103412921A (zh) * 2013-08-12 2013-11-27 同方光盘股份有限公司 文献资源知网节的展示结构
CN103530316A (zh) * 2013-09-12 2014-01-22 浙江大学 一种基于多视图学习的科学主题提取方法
CN103995847A (zh) * 2014-05-06 2014-08-20 百度在线网络技术(北京)有限公司 信息搜索方法及其装置
US20140280576A1 (en) * 2013-03-14 2014-09-18 Google Inc. Determining activities relevant to groups of individuals

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101308499A (zh) * 2008-07-04 2008-11-19 华中科技大学 一种基于关联分析的文献检索方法
CN102156706A (zh) * 2011-01-28 2011-08-17 清华大学 一种指导者推荐***及方法
US20140280576A1 (en) * 2013-03-14 2014-09-18 Google Inc. Determining activities relevant to groups of individuals
CN103412921A (zh) * 2013-08-12 2013-11-27 同方光盘股份有限公司 文献资源知网节的展示结构
CN103530316A (zh) * 2013-09-12 2014-01-22 浙江大学 一种基于多视图学习的科学主题提取方法
CN103995847A (zh) * 2014-05-06 2014-08-20 百度在线网络技术(北京)有限公司 信息搜索方法及其装置

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104866593A (zh) * 2015-05-29 2015-08-26 中国电子科技集团公司第二十八研究所 一种基于知识图谱的数据库搜索方法
CN104866593B (zh) * 2015-05-29 2018-05-22 中国电子科技集团公司第二十八研究所 一种基于知识图谱的数据库搜索方法
WO2017005196A1 (zh) * 2015-07-08 2017-01-12 谭红 基于知识点结构的搜索装置
CN105335519A (zh) * 2015-11-18 2016-02-17 百度在线网络技术(北京)有限公司 模型生成方法及装置、推荐方法及装置
CN105335519B (zh) * 2015-11-18 2021-08-17 百度在线网络技术(北京)有限公司 模型生成方法及装置、推荐方法及装置
CN105550216A (zh) * 2015-12-03 2016-05-04 百度在线网络技术(北京)有限公司 学术研究信息的搜索方法、挖掘方法及装置
CN106934040A (zh) * 2017-03-15 2017-07-07 中国科学技术信息研究所 团队信息的确定方法和确定装置
CN106934040B (zh) * 2017-03-15 2020-06-16 中国科学技术信息研究所 团队信息的确定方法和确定装置
CN107133276A (zh) * 2017-04-12 2017-09-05 安徽富驰信息技术有限公司 一种司法类案检索***及其检索方法
CN110209779A (zh) * 2018-02-05 2019-09-06 索意互动(北京)信息技术有限公司 一种客户端、服务器、检索方法及其***
CN109033132A (zh) * 2018-06-05 2018-12-18 中证征信(深圳)有限公司 利用知识图谱计算文本和主体相关度的方法以及装置
CN109033132B (zh) * 2018-06-05 2020-12-11 中证征信(深圳)有限公司 利用知识图谱计算文本和主体相关度的方法以及装置
CN108920556B (zh) * 2018-06-20 2021-11-19 华东师范大学 基于学科知识图谱的推荐专家方法
CN108920556A (zh) * 2018-06-20 2018-11-30 华东师范大学 基于学科知识图谱的推荐专家方法
CN110737774B (zh) * 2018-07-03 2024-05-24 百度在线网络技术(北京)有限公司 图书知识图谱的构建、图书推荐方法、装置、设备及介质
CN110737774A (zh) * 2018-07-03 2020-01-31 百度在线网络技术(北京)有限公司 图书知识图谱的构建、图书推荐方法、装置、设备及介质
CN109255033A (zh) * 2018-11-05 2019-01-22 桂林电子科技大学 一种基于位置服务领域的知识图谱的推荐方法
CN109255033B (zh) * 2018-11-05 2021-10-08 桂林电子科技大学 一种基于位置服务领域的知识图谱的推荐方法
CN109522551A (zh) * 2018-11-09 2019-03-26 天津新开心生活科技有限公司 实体链接方法、装置、存储介质及电子设备
CN109522551B (zh) * 2018-11-09 2024-02-20 天津新开心生活科技有限公司 实体链接方法、装置、存储介质及电子设备
CN110147437A (zh) * 2019-05-23 2019-08-20 北京金山数字娱乐科技有限公司 一种基于知识图谱的搜索方法及装置
CN110362692A (zh) * 2019-07-23 2019-10-22 中南大学 一种基于知识图谱的学术圈构建方法
CN110502671A (zh) * 2019-08-29 2019-11-26 南京智慧光信息科技研究院有限公司 基于人工智能的学术关系知识图谱生成方法和机器人***
CN113434706A (zh) * 2020-03-23 2021-09-24 北京国双科技有限公司 学术合作关系分析方法及装置
CN111859125A (zh) * 2020-07-09 2020-10-30 威海天鑫现代服务技术研究院有限公司 一个面向知识产权技术资源领域的语义网络构建和服务推荐方法
CN113806597A (zh) * 2021-09-10 2021-12-17 浙江创邻科技有限公司 一种基于图数据库的金融搜索***及方法

Similar Documents

Publication Publication Date Title
CN104346446A (zh) 一种基于知识图谱的论文关联信息推荐方法及装置
CN105653706B (zh) 一种基于文献内容知识图谱的多层引文推荐方法
Jomsri et al. A framework for tag-based research paper recommender system: an IR approach
CN108647276B (zh) 一种搜索方法
Ni et al. Short text clustering by finding core terms
CN102968465B (zh) 网络信息服务平台及其基于该平台的搜索服务方法
Rakesh et al. Personalized recommendation of twitter lists using content and network information
CN103838756A (zh) 一种确定推送信息的方法及装置
CN105593851A (zh) 用于跟踪与通过关联的文本和图像可识别的实体相关的微博消息的方法和装置
Patak et al. Taking Mendeley as multimedia-based application in academic writing
CN103399862B (zh) 确定目标查询序列所对应的搜索引导信息的方法与设备
CN101799830A (zh) 可实现多维度自由剖析的流量数据处理方法
Zubiaga et al. Content-based clustering for tag cloud visualization
Alghamdi et al. Topic detections in Arabic dark websites using improved vector space model
CN106294358A (zh) 一种信息的检索方法及***
Adamu et al. A survey on big data indexing strategies
Pratama et al. Weighted inverse document frequency and vector space model for hadith search engine
Huynh et al. Automatic keywords-based classification of vietnamese texts
Padilla et al. Intuitive large image database browsing using perceptual similarity enriched by crowds
CN105159899B (zh) 一种搜索的方法和装置
Landia et al. Extending FolkRank with content data
Yan et al. A NOVEL SOCIAL IMAGE DATA MINING ALGORITHM BASED ON MULTI-MODEL DATA FUSION.
CN108345605B (zh) 一种文本搜索方法及装置
Jomsri et al. Improving research paper searching with social tagging—A preliminary investigation
CN105912584B (zh) 一种基于网页信息数据的数据索引***

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20150211

RJ01 Rejection of invention patent application after publication