CN110321446B - 相关数据推荐方法、装置、计算机设备及存储介质 - Google Patents

相关数据推荐方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN110321446B
CN110321446B CN201910609979.5A CN201910609979A CN110321446B CN 110321446 B CN110321446 B CN 110321446B CN 201910609979 A CN201910609979 A CN 201910609979A CN 110321446 B CN110321446 B CN 110321446B
Authority
CN
China
Prior art keywords
graph database
recommendation
entity
target entity
original
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910609979.5A
Other languages
English (en)
Other versions
CN110321446A (zh
Inventor
向坤
温凯雯
吕仲琪
顾正
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Huayun Zhongsheng Technology Co ltd
Original Assignee
Shenzhen Huayun Zhongsheng Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Huayun Zhongsheng Technology Co ltd filed Critical Shenzhen Huayun Zhongsheng Technology Co ltd
Priority to CN201910609979.5A priority Critical patent/CN110321446B/zh
Publication of CN110321446A publication Critical patent/CN110321446A/zh
Application granted granted Critical
Publication of CN110321446B publication Critical patent/CN110321446B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及相关数据推荐方法、装置、计算机设备及存储介质,该方法包括获取用户查询请求;根据用户查询请求利用图数据库推荐模型获取相关数据,以得到推荐结果;将推荐结果发送至终端以进行显示;其中,图数据库推荐模型是通过若干原始数据集进行分析和构建而成的。本发明通过构建基于图数据库进行推荐的图数据库推荐模型,获取用户查询请求后,利用该图数据库推荐模型根据该用户查询请求,便可快速地查询到相关数据,形成推荐结果,并予以显示,实现提高推荐效率以及提升推荐结果的准确性。

Description

相关数据推荐方法、装置、计算机设备及存储介质
技术领域
本发明涉及信息处理方法,更具体地说是指相关数据推荐方法、装置、计算机设备及存储介质。
背景技术
在现如今大数据和人工智能技术蓬勃发展下,人们越来越深刻认识到数据的价值。数据的价值不仅仅在于数据本身,其数据对象之间的直接或间接的联系及数据所处的上下文信息,能提供给数据处理及挖掘工具更多有价值的信息。
当用户获取到某一数据时,会希望得到相关的数据,以便于全部分析该数据代表的价值,但是,现有的技术在推荐和计算某一数据相关的信息等时,一般需要用户自行输入大量的特征数据,且使用的是传统关系型数据库,需要大量数据表的合并关联操作,这些操作通常是极其耗时的,不适用于构建一个高效的数据推荐方式。
因此,有必要设计一种新的方法,实现提高推荐效率以及提升推荐结果的准确性。
发明内容
本发明的目的在于克服现有技术的缺陷,提供相关数据推荐方法、装置、计算机设备及存储介质。
为实现上述目的,本发明采用以下技术方案:相关数据推荐方法,包括:
获取用户查询请求;
根据用户查询请求利用图数据库推荐模型获取相关数据,以得到推荐结果;
将推荐结果发送至终端以进行显示;
其中,所述图数据库推荐模型是通过若干原始数据集进行分析和构建而成的。
其进一步技术方案为:所述图数据库推荐模型是通过若干原始数据集进行分析和构建而成的,包括:
获取原始数据集;
对原始数据集进行分析,以得到分析结果;
根据分析结果构建原始图数据库;
对原始图数据库构建索引,以得到标准图数据库;
对标准图数据库设计推荐引擎,以得到图数据库推荐模型。
其进一步技术方案为:所述对原始数据集进行分析,以得到分析结果,包括:
对原始数据集内的文本信息进行文本处理,以得到第一数据集;
对第一数据集进行规则匹配以及分词处理,以得到目标实体和关系信息,形成所述分析结果。
其进一步技术方案为:所述根据分析结果构建原始图数据库,包括:
遍历检索与所述目标实体相关的其他实体,以得到相关实体;
抽取相关实体与目标实体之间的关系,以得到原始图数据库。
其进一步技术方案为:所述对标准图数据库设计推荐引擎,以得到图数据库推荐模型,包括:
抽取相关实体以及目标实体的原本属性,以得到新实体;
根据新实体扩展目标实体与相关实体之间潜在的关联关系;
利用标准图数据库内目标实体的相邻对象构建目标实体的邻接向量,以得到邻接向量;
计算邻接向量的相似度,以得到推荐的相关数据;
根据推荐的相关数据优化当前的邻接向量,以得到推荐引擎;
整合所述标准图数据库以及对应的推荐引擎,以得到图数据库推荐模型。
其进一步技术方案为:所述对标准图数据库设计推荐引擎,以得到图数据库推荐模型,包括:
抽取相关实体以及目标实体的原本属性,以得到新实体;
根据新实体扩展目标实体与相关实体之间潜在的关联关系;
采用PageRank算法计算标准图数据库内目标实体的相关节点的排名值;
过滤排名值不满足要求的节点,以得到标准图数据库相关子图;
利用标准图数据库相关子图内目标实体的相邻对象构建目标实体的邻接向量,以得到邻接向量;
计算邻接向量的相似度,以得到推荐的相关数据;
根据推荐的相关数据优化当前的邻接向量,以得到推荐引擎;
整合所述标准图数据库相关子图以及对应的推荐引擎,以得到图数据库推荐模型。
其进一步技术方案为:所述用户查询请求包括所需要查询的目标实体相关信息以及推荐条件。
本发明还提供了相关数据推荐装置,包括:
请求获取单元,用于获取用户查询请求;
推荐结果形成单元,用于根据用户查询请求利用图数据库推荐模型获取相关数据,以得到推荐结果;
推荐结果显示单元,用于将推荐结果发送至终端以进行显示。
本发明还提供了一种计算机设备,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法。
本发明还提供了一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时可实现上述的方法。
本发明与现有技术相比的有益效果是:本发明通过构建基于图数据库进行推荐的图数据库推荐模型,获取用户查询请求后,利用该图数据库推荐模型根据该用户查询请求,便可快速地查询到相关数据,形成推荐结果,并予以显示,实现提高推荐效率以及提升推荐结果的准确性。
下面结合附图和具体实施例对本发明作进一步描述。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的相关数据推荐方法的应用场景示意图;
图2为本发明实施例提供的相关数据推荐方法的流程示意图;
图3为本发明实施例提供的相关数据推荐方法的子流程示意图;
图4为本发明实施例提供的相关数据推荐方法的子流程示意图;
图5为本发明实施例提供的相关数据推荐方法的子流程示意图;
图6为本发明实施例提供的相关数据推荐方法的子流程示意图;
图7为本发明另一实施例提供的相关数据推荐方法的子流程示意图;
图8为本发明实施例提供的相关数据推荐装置的示意性框图;
图9为本发明实施例提供的计算机设备的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1和图2,图1为本发明实施例提供的相关数据推荐方法的应用场景示意图。图2为本发明实施例提供的相关数据推荐方法的示意性流程图。该相关数据推荐方法应用于服务器中。该服务器与终端进行数据交互,用户通过终端输入查询请求后,由服务器内设的图数据库推荐模型进行查询后推荐,并将推荐结果显示于终端。
图2是本发明实施例提供的相关数据推荐方法的流程示意图。如图2所示,该方法包括以下步骤S110至S150。
S110、获取用户查询请求。
在本实施例中,用户查询请求是用户通过终端输入的,用户查询请求包括所需要查询的目标实体相关信息以及推荐条件。该推荐条件是指需要推荐的实体与目标实体之间的相似度所满足的条件,比如相似度为前十名的推荐条件,或者相似度为90%的推荐条件等。
S120、根据用户查询请求利用图数据库推荐模型获取相关数据,以得到推荐结果。
在本实施例中,推荐结果是指与目标实体的相似度满足推荐条件的相关实体以及其对应的相似度形成的列表。
其中,所述图数据库推荐模型是通过若干原始数据集进行分析和构建而成的。
图数据库推荐模型主要是基于图形成的数据库,分析原始数据集内实体之间的关联关系,图的抽象方式和相关理论始源于欧拉于十八世纪建立的图论,但随着信息技术的发展和新的数据处理需要,以图的方式思考和建模,也是一种相对新的数据技术;图数据库将对象(即实体)之间的联系作为第一类对象存储,在查询对象关联信息时不需要进行表合并等操作,能够直接查询得到,通过图的模式来对数据建模,能够更高效、更直观地表示数据之间复杂、动态的互联关系,更有利于从全局上发现数据的组织模式,更深刻的理解数据,给数据处理带来更多的灵感,图数据库在实时推荐、风险探测、地理寻路、社交关系及数据可视化等方向上都有着广阔的应用前景。
在一实施例中,请参阅图3,上述的图数据库推荐模型是通过若干原始数据集进行分析和构建而成的,可包括步骤S121~S125。
S121、获取原始数据集。
在本实施例中,原始数据集是指从互联网上爬取所得的海量数据,可以根据不同的行业建立不同的图数据库推荐模型,根据实际情况而定,能更好地提高整个推荐的效率。
S122、对原始数据集进行分析,以得到分析结果。
在本实施例中,分析结果是指原始数据集内的实体以及实体与该原始数据集的关系。
在一实施例中,请参阅图4,上述的步骤S122可包括步骤S1221~S1222。
S1221、对原始数据集内的文本信息进行文本处理,以得到第一数据集;
在本实施例中,第一数据集是指除去影响后续规则匹配的特殊字符以及无用字符后的文本信息,因此,文本处理包括去除一些影响后续规则匹配的特殊字符以及无用字符等。
S1222、对第一数据集进行规则匹配以及分词处理,以得到目标实体和关系信息,形成所述分析结果。
在本实施例中,目标实体是指作为图数据库内图的中心节点的对象,每个图都有一个中间节点,该中间节点则为目标实体。
实体对象的提取是从关系数据库的记录中,逐个识别重要的实体。例如,提取涉及到的判决书、法律条目、法人、自然人、地址、机构组织等。而关系信息的提取是从数据库记录中识别重要实体之间的关系。例如,识别出判决书所关联的审批人员、涉案人员、判决地址、判决法院等关系。
规则匹配包括识别判决书文本信息中的类似法律条目、审判员、判决机构等,并抽取相关实体。分词工具具体指类似jieba-analysis的中文分词工具,结合规则匹配使用,能有效提升抽取实体的准确率。当然,上述的判决书还可以为其他法律文件或者其他行业的文件等。
源数据库提取文本信息,并过滤掉冗余、无用信息;从预处理后的文本信息中,通过关键字提取、规则匹配结合中文分词工具,进行实体的识别及关系的抽取得到图的主要信息。
S123、根据分析结果构建原始图数据库。
在本实施例中,原始图数据库是指仅包括目标实体的图。通过图数据库提供的JDBC接口,编写程序将实体及关系导入图数据库,构建原始图数据库。
在一实施例中,请参阅图5,上述的步骤S123可包括步骤S1231~S1232。
S1231、遍历检索与所述目标实体相关的其他实体,以得到相关实体。
在本实施例中,相关实体是指与目标实体有一定关联关系的实体。
根据实际应用场景,例如此处需要根据某一判决书得到最相似的判决书推荐列表,因此以构建判决书为数据起始点的图数据库,也就是该判决书作为目标实体,遍历检索与判决书实体相关的其他实体。
S1232、抽取相关实体与目标实体之间的关系,以得到原始图数据库。
遍历检索与判决书实体相关的其他实体后,抽取相关实体与目标实体之间的联系,为了扩展图数据库的实体网络层次,还需要深度遍历其他实体的相关实体,构建具有较深层次的图网络结构。以这里的判决书数据为例,需要提取包括判决书的发布机构、审判的审判员、审判的法律法条、相关的案件案由,涉及的人员或其他组织机构等实体联系,实现从点到线再到面的扩展,使得整个图数据库具备较深层次的图网络结构,进而可提高整个推荐的准确率。
导入图数据时,需要设计合适的原始图数据库,考虑图的连通性及丰富的层次结构,多样的互联关系,尽量避免关系隔离的数据孤岛产生,也就是出现无关联关系的目标实体或相关实体的出现。
S124、对原始图数据库构建索引,以得到标准图数据库。
在本实施例中,标准图数据库是指既具备有图还具备对应索引的数据库。
根据预先设计的原始图数据库,设计目标实体的索引以优化检索性能,增加实体之间的联系以扩展图的网络层次,合并、删除冗余关系,完善原始图数据库;具体地,对需要检索的目标实体设置索引以优化查询速度,例如,判决书实体可设置以判决书标题作为索引。
每个图都有一个目标实体,因此,都需要设置索引,以便于快速地检索到相关实体和提高推荐效率。
S125、对标准图数据库设计推荐引擎,以得到图数据库推荐模型。
选择合适的实体的相似度计算方式和高效的相关实体检索算法,综合考虑效用和效率,提供高效且有用的推荐结果,以形成图数据库推荐模型,该图数据库推荐模型的推荐过程综合了基于内容的推荐和协同过滤的做法,通过构建多层次知识图网络,设计基于图的推荐过程。
在一实施例中,请参阅图6,上述的步骤S125可包括步骤S1251~S1256。
S1251、抽取相关实体以及目标实体的原本属性,以得到新实体。
在本实施例中,新实体是指基于相关实体以及目标实体的原本属性生成的实体。
S1252、根据新实体扩展目标实体与相关实体之间潜在的关联关系。
综合了基于内容的推荐和协同过滤的过程。在标准图数据库中,关系和实体统一作为第一类对象,因此可以将实体原本的属性,当作新的实体抽取出来,并建立新的实体联系,以丰富图的内容层次,扩展目标实体之间潜在的关联关系。例如,分析判决书正文属性中涉及到的人员、地点、组织机构等,考虑将其提取出来,作为新的实体,并同时将其与原判决书实体建立新的关联。抽取的内容实体越多,对推荐对象的基于内容的表示越充分,因此基于内容的推荐效果越好。
S1253、利用标准图数据库内目标实体的相邻对象构建目标实体的邻接向量,以得到邻接向量;
S1254、计算邻接向量的相似度,以得到推荐的相关数据;
S1255、根据推荐的相关数据优化当前的邻接向量,以得到推荐引擎;
S1256、整合所述标准图数据库以及对应的推荐引擎,以得到图数据库推荐模型。
上述的推荐的相关数据是根据初始输入的截选相似度满足要求的对应的相关实体。
协同过滤的做法是利用标准图数据库检索目标实体的相邻对象即相邻节点或实体,构建目标实体的邻接向量,并计算Jaccard相似度,以此来构建的推荐引擎的推荐计算过程。
图是边和顶点的集合,而标准图数据库通过节点来表达实体,通过节点之间的连线来表达关系。使用图的好处在于能够直接描述实体之间复杂的互联关系,方便于研究人员更直观地观察数据。同时,图数据库作为一种非结构化数据库,能够更加方便的进行数据的扩展,不需要像结构化数据库那样建立复杂的依赖关系。同时,使用图能够高效查询、遍历复杂的实体关系网络,避免了关系数据库中的沉重、低效的合表关联过程,使得实时的查询要求得以实现。
完成标准图数据库的建立之后,设计基于图的实时推荐引擎模块。充分利用图数据库技术在关系检索和图算法上的巨大优势,设计合适的推荐模块,以同时满足高相关性和高效的推荐结果要求,完成实时推荐的过程。
通过从传统的结构化数据库到非结构化的图数据库的转化,利用图数据库技术和相关图计算的优势,设计了图数据库推荐模型。图数据库推荐模型具有高效性、准确性和可扩展性。图算法的应用能有效提升算法的效率,而在结合对象本身属性及关系对象的考虑,能提升推荐结果的准确性。同时,图数据库非结构化的特点具有良好的可扩展性。
S130、将推荐结果发送至终端以进行显示;
具体地,通过Web API(应用程序编程接口,Application ProgrammingInterface)以JSON(数据交换格式,JavaScript Object Notation)的文本数据格式获得,也可以通过使用相关的图的可视化界面技术,直接看到推荐的相关实体。
在实际运用中,将用户查询请求输入到该图数据库推荐模型内后,该图数据库模型会自动定位到对应的目标实体所在的图,并结合推荐条件快速筛选出满足要求的推荐结果,并输出,高效且准确率高。
上述的相关数据推荐方法,通过构建基于图数据库进行推荐的图数据库推荐模型,获取用户查询请求后,利用该图数据库推荐模型根据该用户查询请求,便可快速地查询到相关数据,形成推荐结果,并予以显示,实现提高推荐效率以及提升推荐结果的准确性。
图7是本发明另一实施例提供的一种相关数据推荐方法的流程示意图。如图7所示,本实施例的相关数据推荐方法包括步骤S210-S230。其中步骤S210-S230与上述实施例中的步骤S110-S130类似,在此不再赘述。下面详细说明本实施例中修改的步骤S2251~S2258。
S2251、抽取相关实体以及目标实体的原本属性,以得到新实体;
S2252、根据新实体扩展目标实体与相关实体之间潜在的关联关系;
S2253、采用PageRank算法计算标准图数据库内目标实体的相关节点的排名值;
S2254、过滤排名值不满足要求的节点,以得到标准图数据库相关子图;
S2255、利用标准图数据库相关子图内目标实体的相邻对象构建目标实体的邻接向量,以得到邻接向量;
S2256、计算邻接向量的相似度,以得到推荐的相关数据;
S2257、根据推荐的相关数据优化当前的邻接向量,以得到推荐引擎;
S2258、整合所述标准图数据库相关子图以及对应的推荐引擎,以得到图数据库推荐模型。
其中,S2251~S2252与上述实施例中的步骤S1251~S1252类似,在此不再赘述。
对于S2253~S2258,首先,利用完善的图网络,构建推荐对象的相邻对象组成的邻接向量。然后根据Jaccard相似度原理,计算邻接向量相似度。由于一般的相似度计算效率随着数据增加而增长,在大数据集下效率低下。考虑到图网络的特性和实时计算的要求,通过加入第三方依赖包,一些图数据库支持PageRank算法的直接调用。PageRank算法是一种常用的网络中心节点算法,能计算图网络节点的全局PageRank值,来得到网络的中心节点。还可以通过设置不同的起始扩散节点,使用其衍生的Personalized PageRank算法,来计算网络中相关节点的PageRank值即排名值。使用图的映射功能,过滤掉低PageRank值的一部分节点,来提取相关子图,减少检索目标空间来提升推荐过程的效率,使得推荐引擎达到实时推荐的计算效率。使用图数据库的映射生成相关对象的子图,以支持Jaccard相似度的计算,使用子图映射,能有效提升推荐的效率,达到实时性的要求。
图8是本发明实施例提供的一种相关数据推荐装置300的示意性框图。如图8所示,对应于以上相关数据推荐方法,本发明还提供一种相关数据推荐装置300。该相关数据推荐装置300包括用于执行上述相关数据推荐方法的单元,该装置可以被配置于服务器中。
具体地,请参阅图8,该相关数据推荐装置300包括:
请求获取单元301,用于获取用户查询请求;
推荐结果形成单元302,用于根据用户查询请求利用图数据库推荐模型获取相关数据,以得到推荐结果;
推荐结果显示单元303,用于将推荐结果发送至终端以进行显示。
在一实施例中,所述装置还包括:
模型构建单元,用于通过若干原始数据集进行分析和构建,以形成图数据库推荐模型。
在一实施例中,所模型构建单元包括:
数据集获取子单元,用于获取原始数据集;
分析子单元,用于对原始数据集进行分析,以得到分析结果;
原始图数据库构建子单元,用于根据分析结果构建原始图数据库;
索引构建子单元,用于对原始图数据库构建索引,以得到标准图数据库;
引擎设计子单元,用于对标准图数据库设计推荐引擎,以得到图数据库推荐模型。
在一实施例中,所述分析子单元包括:
文本处理模块,用于对原始数据集内的文本信息进行文本处理,以得到第一数据集;
匹配模块,用于对第一数据集进行规则匹配以及分词处理,以得到目标实体和关系信息,形成所述分析结果。
在一实施例中,所述原始图数据库构建子单元包括:
相关实体形成模块,用于遍历检索与所述目标实体相关的其他实体,以得到相关实体;
关系抽取模块,用于抽取相关实体与目标实体之间的关系,以得到原始图数据库。
在一实施例中,所述引擎设计子单元包括:
第一抽取模块,用于抽取相关实体以及目标实体的原本属性,以得到新实体;
第一关系扩展模块,用于根据新实体扩展目标实体与相关实体之间潜在的关联关系;
第一向量构建模块,用于利用标准图数据库内目标实体的相邻对象构建目标实体的邻接向量,以得到邻接向量;
第一相似度计算模块,用于计算邻接向量的相似度,以得到推荐的相关数据;
第一优化模块,用于根据推荐的相关数据优化当前的邻接向量,以得到推荐引擎;
第一整合模块,用于整合所述标准图数据库以及对应的推荐引擎,以得到图数据库推荐模型。
于其他实施例中,所述引擎设计子单元包括:
第二抽取模块,用于抽取相关实体以及目标实体的原本属性,以得到新实体;
第二关系扩展模块,用于根据新实体扩展目标实体与相关实体之间潜在的关联关系;
排名值计算模块,用于采用PageRank算法计算标准图数据库内目标实体的相关节点的排名值;
过滤模块,用于过滤排名值不满足要求的节点,以得到标准图数据库相关子图;
第二向量构建模块,用于利用标准图数据库相关子图内目标实体的相邻对象构建目标实体的邻接向量,以得到邻接向量;
第一相似度计算模块,用于计算邻接向量的相似度,以得到推荐的相关数据;
第一优化模块,用于根据推荐的相关数据优化当前的邻接向量,以得到推荐引擎;
第一整合模块,用于整合所述标准图数据库相关子图以及对应的推荐引擎,以得到图数据库推荐模型。
需要说明的是,所属领域的技术人员可以清楚地了解到,上述相关数据推荐装置300和各单元的具体实现过程,可以参考前述方法实施例中的相应描述,为了描述的方便和简洁,在此不再赘述。
上述相关数据推荐装置300可以实现为一种计算机程序的形式,该计算机程序可以在如图9所示的计算机设备上运行。
请参阅图9,图9是本申请实施例提供的一种计算机设备的示意性框图。该计算机设备500是服务器。
参阅图9,该计算机设备500包括通过***总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括非易失性存储介质503和内存储器504。
该非易失性存储介质503可存储操作***5031和计算机程序5032。该计算机程序5032包括程序指令,该程序指令被执行时,可使得处理器502执行一种相关数据推荐方法。
该处理器502用于提供计算和控制能力,以支撑整个计算机设备500的运行。
该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行一种相关数据推荐方法。
该网络接口505用于与其它设备进行网络通信。本领域技术人员可以理解,图9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现如下步骤:
获取用户查询请求;
根据用户查询请求利用图数据库推荐模型获取相关数据,以得到推荐结果;
将推荐结果发送至终端以进行显示;
其中,所述图数据库推荐模型是通过若干原始数据集进行分析和构建而成的。
所述用户查询请求包括所需要查询的目标实体相关信息以及推荐条件。
在一实施例中,处理器502在实现所述图数据库推荐模型是通过若干原始数据集进行分析和构建而成的步骤时,具体实现如下步骤:
获取原始数据集;
对原始数据集进行分析,以得到分析结果;
根据分析结果构建原始图数据库;
对原始图数据库构建索引,以得到标准图数据库;
对标准图数据库设计推荐引擎,以得到图数据库推荐模型。
在一实施例中,处理器502在实现所述对原始数据集进行分析,以得到分析结果步骤时,具体实现如下步骤:
对原始数据集内的文本信息进行文本处理,以得到第一数据集;
对第一数据集进行规则匹配以及分词处理,以得到目标实体和关系信息,形成所述分析结果。
在一实施例中,处理器502在实现所述根据分析结果构建原始图数据库步骤时,具体实现如下步骤:
遍历检索与所述目标实体相关的其他实体,以得到相关实体;
抽取相关实体与目标实体之间的关系,以得到原始图数据库。
在一实施例中,处理器502在实现所述对标准图数据库设计推荐引擎,以得到图数据库推荐模型步骤时,具体实现如下步骤:
抽取相关实体以及目标实体的原本属性,以得到新实体;
根据新实体扩展目标实体与相关实体之间潜在的关联关系;
利用标准图数据库内目标实体的相邻对象构建目标实体的邻接向量,以得到邻接向量;
计算邻接向量的相似度,以得到推荐的相关数据;
根据推荐的相关数据优化当前的邻接向量,以得到推荐引擎;
整合所述标准图数据库以及对应的推荐引擎,以得到图数据库推荐模型。
在一实施例中,处理器502在实现所述对标准图数据库设计推荐引擎,以得到图数据库推荐模型步骤时,具体实现如下步骤:
抽取相关实体以及目标实体的原本属性,以得到新实体;
根据新实体扩展目标实体与相关实体之间潜在的关联关系;
采用PageRank算法计算标准图数据库内目标实体的相关节点的排名值;
过滤排名值不满足要求的节点,以得到标准图数据库相关子图;
利用标准图数据库相关子图内目标实体的相邻对象构建目标实体的邻接向量,以得到邻接向量;
计算邻接向量的相似度,以得到推荐的相关数据;
根据推荐的相关数据优化当前的邻接向量,以得到推荐引擎;
整合所述标准图数据库相关子图以及对应的推荐引擎,以得到图数据库推荐模型。
应当理解,在本申请实施例中,处理器502可以是中央处理单元(CentralProcessing Unit,CPU),该处理器502还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成。该计算机程序包括程序指令,计算机程序可存储于一存储介质中,该存储介质为计算机可读存储介质。该程序指令被该计算机***中的至少一个处理器执行,以实现上述方法的实施例的流程步骤。
因此,本发明还提供一种存储介质。该存储介质可以为计算机可读存储介质。该存储介质存储有计算机程序,其中该计算机程序被处理器执行时使处理器执行如下步骤:
获取用户查询请求;
根据用户查询请求利用图数据库推荐模型获取相关数据,以得到推荐结果;
将推荐结果发送至终端以进行显示;
其中,所述图数据库推荐模型是通过若干原始数据集进行分析和构建而成的。
所述用户查询请求包括所需要查询的目标实体相关信息以及推荐条件。
在一实施例中,所述处理器在执行所述计算机程序而实现所述图数据库推荐模型是通过若干原始数据集进行分析和构建而成的步骤时,具体实现如下步骤:
获取原始数据集;
对原始数据集进行分析,以得到分析结果;
根据分析结果构建原始图数据库;
对原始图数据库构建索引,以得到标准图数据库;
对标准图数据库设计推荐引擎,以得到图数据库推荐模型。
在一实施例中,所述处理器在执行所述计算机程序而实现所述对原始数据集进行分析,以得到分析结果步骤时,具体实现如下步骤:
对原始数据集内的文本信息进行文本处理,以得到第一数据集;
对第一数据集进行规则匹配以及分词处理,以得到目标实体和关系信息,形成所述分析结果。
在一实施例中,所述处理器在执行所述计算机程序而实现所述根据分析结果构建原始图数据库步骤时,具体实现如下步骤:
遍历检索与所述目标实体相关的其他实体,以得到相关实体;
抽取相关实体与目标实体之间的关系,以得到原始图数据库。
在一实施例中,所述处理器在执行所述计算机程序而实现所述对标准图数据库设计推荐引擎,以得到图数据库推荐模型步骤时,具体实现如下步骤:
抽取相关实体以及目标实体的原本属性,以得到新实体;
根据新实体扩展目标实体与相关实体之间潜在的关联关系;
利用标准图数据库内目标实体的相邻对象构建目标实体的邻接向量,以得到邻接向量;
计算邻接向量的相似度,以得到推荐的相关数据;
根据推荐的相关数据优化当前的邻接向量,以得到推荐引擎;
整合所述标准图数据库以及对应的推荐引擎,以得到图数据库推荐模型。
在一实施例中,所述处理器在执行所述计算机程序而实现所述对标准图数据库设计推荐引擎,以得到图数据库推荐模型步骤时,具体实现如下步骤:
抽取相关实体以及目标实体的原本属性,以得到新实体;
根据新实体扩展目标实体与相关实体之间潜在的关联关系;
采用PageRank算法计算标准图数据库内目标实体的相关节点的排名值;
过滤排名值不满足要求的节点,以得到标准图数据库相关子图;
利用标准图数据库相关子图内目标实体的相邻对象构建目标实体的邻接向量,以得到邻接向量;
计算邻接向量的相似度,以得到推荐的相关数据;
根据推荐的相关数据优化当前的邻接向量,以得到推荐引擎;
整合所述标准图数据库相关子图以及对应的推荐引擎,以得到图数据库推荐模型。
所述存储介质可以是U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的计算机可读存储介质。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的。例如,各个单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本发明实施例装置中的单元可以根据实际需要进行合并、划分和删减。另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。
该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (8)

1.相关数据推荐方法,其特征在于,包括:
获取用户查询请求;
根据用户查询请求利用图数据库推荐模型获取相关数据,以得到推荐结果;
将推荐结果发送至终端以进行显示;
其中,所述图数据库推荐模型是通过若干原始数据集进行分析和构建而成的;
所述图数据库推荐模型是通过若干原始数据集进行分析和构建而成的,包括:
获取原始数据集;
对原始数据集进行分析,以得到分析结果;
根据分析结果构建原始图数据库;
对原始图数据库构建索引,以得到标准图数据库;
对标准图数据库设计推荐引擎,以得到图数据库推荐模型;
所述对标准图数据库设计推荐引擎,以得到图数据库推荐模型,包括:
抽取相关实体以及目标实体的原本属性,以得到新实体;
根据新实体扩展目标实体与相关实体之间潜在的关联关系;
采用PageRank算法计算标准图数据库内目标实体的相关节点的排名值;
过滤排名值不满足要求的节点,以得到标准图数据库相关子图;
利用标准图数据库相关子图内目标实体的相邻对象构建目标实体的邻接向量,以得到邻接向量;
计算邻接向量的相似度,以得到推荐的相关数据;
根据推荐的相关数据优化当前的邻接向量,以得到推荐引擎;
整合所述标准图数据库相关子图以及对应的推荐引擎,以得到图数据库推荐模型。
2.根据权利要求1所述的相关数据推荐方法,其特征在于,所述对原始数据集进行分析,以得到分析结果,包括:
对原始数据集内的文本信息进行文本处理,以得到第一数据集;
对第一数据集进行规则匹配以及分词处理,以得到目标实体和关系信息,形成所述分析结果。
3.根据权利要求1所述的相关数据推荐方法,其特征在于,所述根据分析结果构建原始图数据库,包括:
遍历检索与所述目标实体相关的其他实体,以得到相关实体;
抽取相关实体与目标实体之间的关系,以得到原始图数据库。
4.根据权利要求1所述的相关数据推荐方法,其特征在于,所述对标准图数据库设计推荐引擎,以得到图数据库推荐模型,包括:
抽取相关实体以及目标实体的原本属性,以得到新实体;
根据新实体扩展目标实体与相关实体之间潜在的关联关系;
利用标准图数据库内目标实体的相邻对象构建目标实体的邻接向量,以得到邻接向量;
计算邻接向量的相似度,以得到推荐的相关数据;
根据推荐的相关数据优化当前的邻接向量,以得到推荐引擎;
整合所述标准图数据库以及对应的推荐引擎,以得到图数据库推荐模型。
5.根据权利要求1至4任一项所述的相关数据推荐方法,其特征在于,所述用户查询请求包括所需要查询的目标实体相关信息以及推荐条件。
6.相关数据推荐装置,其特征在于,包括:
请求获取单元,用于获取用户查询请求;
推荐结果形成单元,用于根据用户查询请求利用图数据库推荐模型获取相关数据,以得到推荐结果;
推荐结果显示单元,用于将推荐结果发送至终端以进行显示;
所述装置还包括:
模型构建单元,用于通过若干原始数据集进行分析和构建,以形成图数据库推荐模型;
所模型构建单元包括:
数据集获取子单元,用于获取原始数据集;
分析子单元,用于对原始数据集进行分析,以得到分析结果;
原始图数据库构建子单元,用于根据分析结果构建原始图数据库;
索引构建子单元,用于对原始图数据库构建索引,以得到标准图数据库;
引擎设计子单元,用于对标准图数据库设计推荐引擎,以得到图数据库推荐模型;
所述引擎设计子单元包括:
第二抽取模块,用于抽取相关实体以及目标实体的原本属性,以得到新实体;
第二关系扩展模块,用于根据新实体扩展目标实体与相关实体之间潜在的关联关系;
排名值计算模块,用于采用PageRank算法计算标准图数据库内目标实体的相关节点的排名值;
过滤模块,用于过滤排名值不满足要求的节点,以得到标准图数据库相关子图;
第二向量构建模块,用于利用标准图数据库相关子图内目标实体的相邻对象构建目标实体的邻接向量,以得到邻接向量;
第一相似度计算模块,用于计算邻接向量的相似度,以得到推荐的相关数据;
第一优化模块,用于根据推荐的相关数据优化当前的邻接向量,以得到推荐引擎;
第一整合模块,用于整合所述标准图数据库相关子图以及对应的推荐引擎,以得到图数据库推荐模型。
7.一种计算机设备,其特征在于,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至5中任一项所述的方法。
8.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时可实现如权利要求1至5中任一项所述的方法。
CN201910609979.5A 2019-07-08 2019-07-08 相关数据推荐方法、装置、计算机设备及存储介质 Active CN110321446B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910609979.5A CN110321446B (zh) 2019-07-08 2019-07-08 相关数据推荐方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910609979.5A CN110321446B (zh) 2019-07-08 2019-07-08 相关数据推荐方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN110321446A CN110321446A (zh) 2019-10-11
CN110321446B true CN110321446B (zh) 2021-09-14

Family

ID=68123072

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910609979.5A Active CN110321446B (zh) 2019-07-08 2019-07-08 相关数据推荐方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN110321446B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112749296B (zh) * 2019-10-31 2024-01-26 北京达佳互联信息技术有限公司 一种视频推荐方法、装置、服务器及存储介质
CN111984627A (zh) * 2020-08-28 2020-11-24 北京明略昭辉科技有限公司 一种数据获取的方法、装置、计算机设备和介质
CN112069412B (zh) * 2020-09-11 2023-08-04 腾讯科技(深圳)有限公司 信息推荐方法、装置、计算机设备及存储介质
CN113190718A (zh) * 2021-04-28 2021-07-30 百度在线网络技术(北京)有限公司 图数据库的数据处理方法、装置、电子设备及存储介质
CN115797020B (zh) * 2023-02-06 2023-05-02 网思科技股份有限公司 基于图数据库的数据处理的零售推荐方法、***和介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103218407A (zh) * 2013-03-22 2013-07-24 南京信通科技有限责任公司 一种基于兴趣图谱的推荐引擎
CN105335374A (zh) * 2014-06-19 2016-02-17 北大方正集团有限公司 知识点关联方法及装置、及包含该装置的服务器和客户端
CN107239665A (zh) * 2017-06-09 2017-10-10 京东方科技集团股份有限公司 医疗信息查询***及方法
CN108763321A (zh) * 2018-05-02 2018-11-06 深圳智能思创科技有限公司 一种基于大规模相关实体网络的相关实体推荐方法
CN108920544A (zh) * 2018-06-13 2018-11-30 桂林电子科技大学 一种基于知识图谱的个性化职位推荐方法
CN108932262A (zh) * 2017-05-26 2018-12-04 北京小唱科技有限公司 一种歌曲推荐方法及装置
CN109446362A (zh) * 2018-09-05 2019-03-08 北京费马科技有限公司 基于外存的图数据库结构、图数据存储方法、装置
CN109508419A (zh) * 2018-11-23 2019-03-22 成都品果科技有限公司 一种基于知识学习的推荐方法和***

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050144114A1 (en) * 2000-09-30 2005-06-30 Ruggieri Thomas P. System and method for providing global information on risks and related hedging strategies
US9208155B2 (en) * 2011-09-09 2015-12-08 Rovi Technologies Corporation Adaptive recommendation system
US20130268290A1 (en) * 2012-04-02 2013-10-10 David Jackson Systems and methods for disease knowledge modeling
CN104796270B (zh) * 2014-01-16 2018-03-27 国际商业机器公司 在云应用的问题诊断中推荐可疑组件的方法及装置
CN104462504A (zh) * 2014-12-19 2015-03-25 北京奇虎科技有限公司 基于搜索中提供推理过程数据的方法和装置
CN105589976B (zh) * 2016-03-08 2019-03-12 重庆文理学院 基于语义相关度的目标实体确定方法及装置
CN106547887B (zh) * 2016-10-27 2020-04-07 北京百度网讯科技有限公司 基于人工智能的搜索推荐方法和装置
CN109558468B (zh) * 2018-12-13 2022-04-01 北京百度网讯科技有限公司 资源的处理方法、装置、设备和存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103218407A (zh) * 2013-03-22 2013-07-24 南京信通科技有限责任公司 一种基于兴趣图谱的推荐引擎
CN105335374A (zh) * 2014-06-19 2016-02-17 北大方正集团有限公司 知识点关联方法及装置、及包含该装置的服务器和客户端
CN108932262A (zh) * 2017-05-26 2018-12-04 北京小唱科技有限公司 一种歌曲推荐方法及装置
CN107239665A (zh) * 2017-06-09 2017-10-10 京东方科技集团股份有限公司 医疗信息查询***及方法
CN108763321A (zh) * 2018-05-02 2018-11-06 深圳智能思创科技有限公司 一种基于大规模相关实体网络的相关实体推荐方法
CN108920544A (zh) * 2018-06-13 2018-11-30 桂林电子科技大学 一种基于知识图谱的个性化职位推荐方法
CN109446362A (zh) * 2018-09-05 2019-03-08 北京费马科技有限公司 基于外存的图数据库结构、图数据存储方法、装置
CN109508419A (zh) * 2018-11-23 2019-03-22 成都品果科技有限公司 一种基于知识学习的推荐方法和***

Also Published As

Publication number Publication date
CN110321446A (zh) 2019-10-11

Similar Documents

Publication Publication Date Title
CN110321446B (zh) 相关数据推荐方法、装置、计算机设备及存储介质
CN104881424B (zh) 一种基于正则表达式的电力大数据采集、存储及分析方法
US8311999B2 (en) System and method for knowledge research
WO2018072071A1 (zh) 知识图谱构建***及方法
US11455313B2 (en) Systems and methods for intelligent prospect identification using online resources and neural network processing to classify organizations based on published materials
CN105468605A (zh) 一种实体信息图谱生成方法及装置
WO2017096892A1 (zh) 索引构建方法、查询方法及对应装置、设备、计算机存储介质
JPWO2008146807A1 (ja) オントロジ処理装置、オントロジ処理方法、及びオントロジ処理プログラム
JP2005521954A (ja) リレーショナルデータベースをクエリーする方法および装置
US9754015B2 (en) Feature rich view of an entity subgraph
CN111488406A (zh) 一种图数据库管理方法
JP4324650B2 (ja) 情報資源検索装置、情報資源検索方法及び情報資源検索プログラム
CN107704620B (zh) 一种档案管理的方法、装置、设备和存储介质
JP5844824B2 (ja) Sparqlクエリ最適化方法
WO2019110654A1 (en) Systems and methods for querying databases using interactive search paths
Pandey Challenges of big data to big data mining with their processing framework
JP5639417B2 (ja) 情報処理装置、情報処理方法、及びプログラム
CN107391690B (zh) 一种处理文献信息的方法
CN112214615A (zh) 基于知识图谱的政策文件处理方法、装置和存储介质
CN102915304A (zh) 文档检索设备和方法
CN116628228A (zh) 一种rpa流程推荐方法以及计算机可读存储介质
KR101592670B1 (ko) 인덱스를 이용하는 데이터 검색 장치 및 이를 이용하는 방법
CN103891244B (zh) 一种进行数据存储和检索的方法及装置
Goyal Qp-subdue: Processing queries over graph databases
KR20150057497A (ko) 온라인 텍스트 문서의 계층적 트리 기반 주제탐색 방법 및 시스템

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 518000 room 701, building 11, Shenzhen Software Park (phase 2), No.1, kejizhong 2 Road, Gaoxin Central District, Maling community, Yuehai street, Nanshan District, Shenzhen City, Guangdong Province

Applicant after: Shenzhen Huayun Zhongsheng Technology Co.,Ltd.

Address before: 601, devison building, No. 016, Gaoxin South 7th Road, community, high tech Zone, Yuehai street, Nanshan District, Shenzhen City, Guangdong Province

Applicant before: SHENZHEN HUAYUN ZHONGSHENG TECHNOLOGY Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant