CN114780752A - 联邦知识图谱构建方法、***、设备及存储介质 - Google Patents
联邦知识图谱构建方法、***、设备及存储介质 Download PDFInfo
- Publication number
- CN114780752A CN114780752A CN202210514582.XA CN202210514582A CN114780752A CN 114780752 A CN114780752 A CN 114780752A CN 202210514582 A CN202210514582 A CN 202210514582A CN 114780752 A CN114780752 A CN 114780752A
- Authority
- CN
- China
- Prior art keywords
- target
- map
- knowledge graph
- federal
- entity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/957—Browsing optimisation, e.g. caching or content distillation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种联邦知识图谱构建方法、***、设备及存储介质,所述联邦知识图谱构建方法包括:获取目标领域的多源异构数据,并基于所述多源异构数据,生成各多源数据表,对各所述多源数据表进行归类分析,得到目标图谱信息,其中,所述目标图谱信息包括不同类型的图谱实体、实体属性、不同类型的图谱边以及边属性,基于所述目标图谱信息,生成不同的实体文件和边关系文件,基于所述不同的实体文件和边关系文件,构建目标联邦知识图谱。本申请解决了由于各类数据较为分散且数据间缺少关联,导致难以联合多方数据构建知识图谱的技术问题。
Description
技术领域
本申请涉及互联网技术领域,尤其涉及一种联邦知识图谱构建方法、***、设备及存储介质。
背景技术
知识图谱(Knowledge Graph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,在构建知识图谱过程中需要识别出各类数据的实体以及对应的关联关系,然而在大量金融行业应用场景中,因为缺少统一的知识框架,各类数据较为分散,并且数据间缺少关联,进而导致难以联合多方数据构建知识图谱。
发明内容
本申请的主要目的在于提供一种联邦知识图谱构建方法、***、设备及存储介质,旨在解决现有技术中的由于各类数据较为分散且数据间缺少关联,导致难以联合多方数据构建知识图谱的技术问题。
为实现上述目的,本申请提供一种联邦知识图谱构建方法,所述联邦知识图谱构建方法包括:
获取目标领域的多源异构数据,并基于所述多源异构数据,生成各多源数据表;
对各所述多源数据表进行归类分析,得到目标图谱信息,其中,所述目标图谱信息包括不同类型的图谱实体、实体属性、不同类型的图谱边以及边属性;
基于所述目标图谱信息,生成不同的实体文件和边关系文件;
基于所述不同的实体文件和边关系文件,构建目标联邦知识图谱。
可选地,所述对所述多源数据表进行归类分析,得到目标图谱信息的步骤包括:
在所述多源数据表中,结合当前目标领域的业务场景,选取查询频次满足预设频次阈值的各目标字段作为所述不同类型的图谱实体,并确定各所述图谱实体对应的实体属性;
基于各所述图谱实体,在所述多源数据表中,选取关联相同类型图谱实体以及关联不同类型图谱实体的各目标字段作为所述不同类型的图普边,并确定各所述图谱边对应的边属性,其中,所述图谱边表征图谱实体之间的关联关系。
可选地,所述基于所述目标图谱信息,生成不同的实体文件和边关系文件的步骤包括:
根据所述目标图谱信息中不同图谱实体对应的目标字段,生成各所述实体文件;
以及根据所述目标图谱信息中不同图谱边对应的目标字段,生成各所述边关系文件。
可选地,所述基于所述多源异构数据,生成各多源数据表的步骤包括:
通过预设自然语言处理方法,对所述多源异构数据进行处理,生成各所述多源数据表。
可选地,在所述基于所述不同的实体文件和边关系文件,构建目标联邦知识图谱的步骤之后,还包括:
构建所述目标联邦知识图谱的可视化网页;
获取目标用户在所述可视化网页的操作指令;
在所述目标联邦知识图谱中查询所述操作指令对应的目标返回信息;
基于所述目标返回信息,通过预设绘制算法在所述可视化网页中进行可视化绘制。
可选地,所述基于所述目标返回信息,通过预设绘制算法进行可视化绘制,得到目标绘制图的步骤包括:
将所述目标返回信息导入预设构建的力导向图布局;
动态调用所述力导向图布局中预先设置的绘制函数,并基于所述绘制函数,对所述目标返回信息进行绘制。
可选地,所述基于所述绘制函数,对所述目标返回信息进行绘制,得到所述目标绘制图的步骤包括:
若所述目标返回信息存在图谱实体,则基于所述图谱实体数据进行预设节点样式进行节点绘制;
若所述目标返回信息存在图谱边,则基于图谱实体之间图谱边的数量,按照预设边样式进行边绘制。
本申请还提供一种联邦知识图谱构建***,所述联邦知识图谱构建***为虚拟***,所述联邦知识图谱构建***包括:
获取模块,用于获取多源异构数据,并基于所述多源异构数据,生成各多源数据表;
分析模块,用于对各所述多源数据表进行归类分析,得到目标图谱信息,其中,所述目标图谱信息包括不同类型的图谱实体、实体属性、不同类型的图谱边以及边属性;
生成模块,用于基于所述目标图谱信息,生成不同的实体文件和边关系文件;
构建模块,用于基于所述不同的实体文件和边关系文件,构建目标联邦知识图谱。
可选地,所述分析模块还用于;
在所述多源数据表中,结合当前目标领域的业务场景,选取查询频次满足预设频次阈值的各目标字段作为所述不同类型的图谱实体,并确定各所述图谱实体对应的实体属性;
基于各所述图谱实体,在所述多源数据表中,选取关联相同类型图谱实体以及关联不同类型图谱实体的各目标字段作为所述不同类型的图普边,并确定各所述图谱边对应的边属性,其中,所述图谱边表征图谱实体之间的关联关系。
可选地,所述生成模块还用于;
根据所述目标图谱信息中不同图谱实体对应的目标字段,生成各所述实体文件;
以及根据所述目标图谱信息中不同图谱边对应的目标字段,生成各所述边关系文件。
可选地,所述获取模块还用于;
通过预设自然语言处理方法,对所述多源异构数据进行处理,生成各所述多源数据表。
可选地,所述联邦知识图谱构建***还用于:
构建所述目标联邦知识图谱的可视化网页;
获取目标用户在所述可视化网页的操作指令;
在所述目标联邦知识图谱中查询所述操作指令对应的目标返回信息;
基于所述目标返回信息,通过预设绘制算法在所述可视化网页中进行可视化绘制。
可选地,所述联邦知识图谱构建***还用于:
将所述目标返回信息导入预设构建的力导向图布局;
动态调用所述力导向图布局中预先设置的绘制函数,并基于所述绘制函数,对所述目标返回信息进行绘制。
可选地,所述联邦知识图谱构建***还用于:
若所述目标返回信息存在图谱实体,则基于所述图谱实体数据进行预设节点样式进行节点绘制;
若所述目标返回信息存在图谱边,则基于图谱实体之间图谱边的数量,按照预设边样式进行边绘制。
本申请还提供一种联邦知识图谱构建设备,所述联邦知识图谱构建设备为实体设备,所述联邦知识图谱构建设备包括:存储器、处理器以及存储在所述存储器上的联邦知识图谱构建程序,所述联邦知识图谱构建程序被所述处理器执行实现如上述的联邦知识图谱构建方法的步骤。
本申请还提供一种存储介质,所述存储介质为计算机可读存储介质,所述计算机可读存储介质上存储联邦知识图谱构建程序,所述联邦知识图谱构建程序被处理器执行实现如上述的联邦知识图谱构建方法的步骤。
本申请提供了一种联邦知识图谱构建方法、***、设备及存储介质,本申请首先获取目标领域的多源异构数据,并基于所述多源异构数据,生成各多源数据表,进而对各所述多源数据表进行归类分析,得到目标图谱信息,其中,所述目标图谱信息包括不同类型的图谱实体、实体属性、不同类型的图谱边以及边属性,进一步地,基于所述目标图谱信息,生成不同的实体文件和边关系文件,进而基于所述不同的实体文件和边关系文件,构建目标联邦知识图谱,实现了通过对多源异构数据对应的数据表进行归类分析,选取构建图谱对应的不同类型的图谱实体、实体属性、不同类型的图谱边以及边属性等信息,从而生成不同的实体文件和边关系文件,构建出包含各类数据的目标联邦知识图谱,从而使得业务人员可基于联邦知识图谱的关联信息更好地进行业务的扩展。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域默认技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请联邦知识图谱构建方法第一实施例的流程示意图;
图2为本申请联邦知识图谱构建方法第二实施例的流程示意图;
图3为本申请联邦知识图谱构建方法第三实施例的流程示意图;
图4为本申请联邦知识图谱构建方法的***框架图;
图5为本申请实施例方案涉及的硬件运行环境的联邦知识图谱构建设备结构示意图;
图6为本申请联邦知识图谱构建装置的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
本申请实施例提供一种联邦知识图谱构建方法,在本申请联邦知识图谱构建方法的第一实施例中,参照图1,所述联邦知识图谱构建方法包括:
步骤S10,获取目标领域的多源异构数据,并基于所述多源异构数据,生成各多源数据表;
在本实施例中,需要说明的是,所述目标领域包括医疗、金融、航天等领域,在本申请中,以金融领域作为所述目标领域进行阐述,所述多源异构数据为通过统一的知识框架聚合对公、零售等数据,所述对公数据包括公司与公司之间的数据信息,以及公司与个人之间的数据信息。
获取目标领域的多源异构数据,并基于所述多源异构数据,生成各多源数据表,具体地,获取构建图谱需要的对公、零售等多源异构数据,依据统一的知识框架,结合NLP(自然语言处理)方法对公、零售等数据进行分析,生成各多源数据表。
步骤S20,对各所述多源数据表进行归类分析,得到目标图谱信息,其中,所述目标图谱信息包括不同类型的图谱实体、实体属性、不同类型的图谱边以及边属性;
在本实施例中,需要说明的是,目标图谱信息为知识图谱schema,限定待加入知识图谱数据的格式,相当于领域对应的数据模型。
各所述多源数据表进行归类分析,得到目标图谱信息,具体地,依据当前目标领域的业务场景,选取当前业务场景下查询频次较高的字段信息,进而将所述字段信息进行归类分析,进而基于归类后的字段信息中选择能够满足构建实体条件的字段作为图谱实体,进一步地,基于各所述图谱实体,在各个多源数据表中选择用于描述图谱实体的字段信息作为实体属性,另外地,在各个多源数据表中选取能够关联相同图谱实体之间,以及关联不同图谱实体的字段信息作为谱图边,并在各个多源数据表中选择用于描述图谱边的字段信息作为边属性,从而挖掘出公司-公司(交易、投资等关系)、公司-个人(法人、股东、董高监等关系)以及个人-个人(子女、父母、业务等关系)之间丰富的关联关系。
例如,在金融贷款场景中,A为B公司的法人,B公司的地址、B公司的创建时间,B公司投资C公司,则将B公司、C公司设置为图谱实体,创建时间、地址即为所述B公司的实体属性,B公司和C公司之间关联为投资关系,并将所述投资关系作为所述图谱边,投资时间、投资金额等作为图谱边的边属性。
步骤S30,基于所述目标图谱信息,生成不同的实体文件和边关系文件;
在本实施例中,基于所述目标图谱信息,生成不同的实体文件和边关系文件,具体地,选取不同实体的对应字段分别生成个人、公司、集团等实体文件。同时选择schema中不同边的对应字段生成公司-公司(交易、集团、私募投资等关系)、公司-个人(法人、股东、董高监等关系)以及个人-个人(子女、父母、业务等关系)边关系文件。
其中,步骤S30:基于所述目标图谱信息,生成不同的实体文件和边关系文件,具体包括:
步骤S31,根据所述目标图谱信息中不同图谱实体对应的目标字段,生成各所述实体文件;
步骤S32,以及根据所述目标图谱信息中不同图谱边对应的目标字段,生成各所述边关系文件。
在本实施例中,具体地,依据目标图谱信息选取不同图谱实体对应目标字段,分别生成个人、公司、集团等实体文件,同时选择目标图谱信息中不同图谱边的对应的目标字段生成多个边关系文件。
步骤S40,基于所述不同的实体文件和边关系文件,构建目标联邦知识图谱。
在本实施例中,需要说明的是,知识图谱,本质上是一种表征实体之间关系的语义网络,知识图谱是由一条条知识组成,每条知识表示为一个SPO三元组(Subject-Predicate-Object),例如:(实体1,关系,实体2)、(实体、属性,属性值)等三元组,在知识图谱中的节点表示实体,边为实体之间的关联关系,进一步地,节点和边还可具有对应的标签,所述标签为节点和边对应的类别的标识。
具体地,基于所述不同的实体文件和边关系文件,确定构建图谱所需的节点、节点属性以及节点标签,以及确定所述节点之间的关联关系、关系属性和关系标签,进而基于所述节点、节点属性以及节点标签,以及确定所述节点之间的关联关系、关系属性和关系标签,构建包含公司与公司、公司与个人、个人与个人之间关联的目标联邦知识图谱,例如:通过Linux的ssh命令连接到一台部署neo4j数据库的机器,进而通过Linux的scp命令将不同的实体文件和边关系文件拷贝到neo4j机器中,进而使用neo4j stop命令关闭neo4j服务,进一步地,使用neo4j-admin import命令导入实体文件和边关系文件,导入完成后,使用neo4j start命令重新启动neo4j构建所述目标联邦知识图谱。
本申请实施例提供了一种联邦知识图谱构建方法,本申请实施例首先获取目标领域的多源异构数据,并基于所述多源异构数据,生成各多源数据表,进而对各所述多源数据表进行归类分析,得到目标图谱信息,其中,所述目标图谱信息包括不同类型的图谱实体、实体属性、不同类型的图谱边以及边属性,进一步地,基于所述目标图谱信息,生成不同的实体文件和边关系文件,进而基于所述不同的实体文件和边关系文件,构建目标联邦知识图谱,实现了通过对多源异构数据对应的数据表进行归类分析,选取构建图谱对应的不同类型的图谱实体、实体属性、不同类型的图谱边以及边属性等信息,从而生成不同的实体文件和边关系文件,构建出包含各类数据的目标联邦知识图谱,从而使得业务人员可基于联邦知识图谱的关联信息更好地进行业务的扩展。
进一步地,参照图2,步骤S20:对所述多源数据表进行归类分析,得到目标图谱信息,具体包括:
步骤S21,在所述多源数据表中,结合当前目标领域的业务场景,选取查询频次满足预设频次阈值的各目标字段作为所述不同类型的图谱实体,并确定各所述图谱实体对应的实体属性;
步骤S22,基于各所述图谱实体,在所述多源数据表中,选取关联相同类型图谱实体以及关联不同类型图谱实体的各目标字段作为所述不同类型的图普边,并确定各所述图谱边对应的边属性,其中,所述图谱边表征图谱实体之间的关联关系。
在本实施例中,具体地,结合当前目标领域的业务场景,在所述多源数据表中,选取当前业务场景下查询频次超过预设频次阈值的目标字段,进而将各所述目标字段进行归类分析,得到归类后的字段信息,进而从所述归类后的字段信息中,选取满足实体构建条件的字段信息作为所述图谱实体,进一步地,基于各个图谱实体,选取预设数量用于描述该图谱实体对应的字段信息作为该图谱实体的实体属性,进一步地,在确定各个图谱实体之后,对各个多源数据表进行整体分析,选取关联相同图谱实体、以及关联不同图谱实体的字段信息作为图谱边,也即,所述图谱边用于表征实体之间的关联关系,进而选取预设数量用于描述该图谱边对应的字段信息作为该图谱实体的边属性。
本申请实施例通过上述方案,也即,在所述多源数据表中,结合当前目标领域的业务场景,选取查询频次满足预设频次阈值的各目标字段作为所述不同类型的图谱实体,并确定各所述图谱实体对应的实体属性,进而基于各所述图谱实体,在所述多源数据表中,选取关联相同类型图谱实体以及关联不同类型图谱实体的各目标字段作为所述不同类型的图普边,并确定各所述图谱边对应的边属性,其中,所述图谱边表征图谱实体之间的关联关系,实现了聚合各类数据,结合当前目标领域的业务场景确定出实体,并分析出实体间的关联性,从而可基于实体与各自之间的关联关系,构建饿到联邦知识图谱。
进一步地,参照图3,基于本申请中第一实施例,在本申请的另一实施例中,在所述基于所述不同的实体文件和边关系文件,构建目标联邦知识图谱的步骤之后,还包括:
步骤A10,构建所述目标联邦知识图谱的可视化网页;
在本实施例中,需要说明的是,在可视化网页构建之前,开发人员将所述目标联邦知识图谱的查询语句封装成函数接口的形式,以供用户在点击前端(可视化网页)时进行调用接口获取标联邦知识图谱中的数据,例如:节点查询,通过外部传入具体节点的名称,查询距离该中心节点距离为1的全部节点,并且按照边关系类型进行分类后返回结果。图算法查询,通过外部传入的若干节点的名称,通过生成查询语句,执行社区发现、最短路径、节点相似度等图算法,返回执行结果。
步骤A20,获取目标用户在所述可视化网页的操作指令;
在本实施例,需要说明的是,所述操作指令包括单击、双击、右键等操作指令。
步骤A30,在所述目标联邦知识图谱中查询所述操作指令对应的目标返回信息;
在本实施例中,需要说明的是,不同操作指令所返回的数据不同。例如,当目标用户为单击指令时,检测单击坐标位置,判断所述单击坐标位置是否属于某一节点内或某一边上,从而在所述目标联邦知识图谱中获取该节点或该边的对应的字段信息,当目标用户为双击指令时,检测双击坐标位置,判断所述双击坐标位置是否属于某一节点内,当双击坐标位置作为在节点内时,则扩展该节点,也即,在所述目标联邦知识图谱中获取距离该节点距离为1的全部节点,并且按照节点之间边的关系类型进行分类后的返回结果等。
步骤A40,基于所述目标返回信息,通过预设绘制算法在所述可视化网页中进行可视化绘制。
在本实施例中,需要说明的是,预设绘制算法包括力导向图布局算法,力导向图布局算法是指将节点当作电荷,通过对每个节点的计算,算出引力和排斥力综合的合力,再由此合力来移动节点的位置。
步骤A40:基于所述目标返回信息,通过预设绘制算法进行可视化绘制,得到目标绘制图,具体包括:
步骤A41,将所述目标返回信息导入预设构建的力导向图布局;
步骤A42,动态调用所述力导向图布局中预先设置的绘制函数,并基于所述绘制函数,对所述目标返回信息进行绘制。
在本实施例中,具体地,创建力导向图布局,并在所述力导向图布局中设置绘制函数,进而将所述目标返回信息导入所述力导向图布局,基于所述绘制函数,对所述目标返回信息进行可视化绘制,并且结合预设的力学仿真模型,对节点的坐标位置进行动态调整。
其中,步骤A42:基于所述绘制函数,对所述目标返回信息进行绘制,得到所述目标绘制图,具体包括:
步骤A421,若所述目标返回信息存在图谱实体,则基于所述图谱实体数据进行预设节点样式进行节点绘制;
步骤A422,若所述目标返回信息存在图谱边,则基于图谱实体之间图谱边的数量,按照预设边样式进行边绘制。
在本实施例中,具体地,当所述目标返回信息存在图谱实体时,在绘制节点(图谱实体)时,按照图谱实体的类型控制节点绘制的色彩、高亮等样式,例如,使用arc函数控制2D Canvas状态机,图谱实体包括个人和公司的实体,个人对应的图谱实体和公司对应的图片实体可采用不同的色彩进行绘制。
进一步地,当所述目标返回信息存在图谱边时,在绘制边(图谱边)时,根据节点间的边数量采用不同的绘制方式进行绘制,具体绘制过程:节点间单边的情况,根据预设边样式字段绘制连接线,例如:采用lineTo函数控制2D Canvas状态机进行绘制,节点间多边的情况,第一条边采用单边的方法绘制执行,其余边以预设连接线绘制方式进行绘制,采用quadraticCurveTo方法绘制贝塞尔二次曲线,例如,A和B是朋友以及交易关系,可采用直线绘制朋友关系对应的边,采用曲线绘制交易关系对应的边。
本申请实施例通过上述方案,也即,构建所述目标联邦知识图谱的可视化网页,进而获取目标用户在所述可视化网页的操作指令,进一步地,在所述目标联邦知识图谱中查询所述操作指令对应的目标返回信息,进而基于所述目标返回信息,通过预设绘制算法在所述可视化网页中进行可视化绘制,从而实现了知识图谱的可视化绘制,降低业务人员使用该类技术的门槛,使得对于技术基础较浅的业务人员而言,也可方便快捷地利用联邦式知识图谱进行业务拓展。
进一步地,参考图4,图4为本申请联邦知识图谱构建方法的***框架图,具体地,收集不同数据源的数据(多源异构数据),生成多个数据表(多源数据表),基于各个多源数据表,利用NLP技术抽取得到图谱实体以及图谱实体之间的关联关系,进而生成多个实体文件和边关系文件,从而基于各个实体文件和边关系文件,通过neo4j图数据库构建所述目标联邦知识图谱,并存储所述目标联邦知识图谱,设计查询语句对应的接口函数,进而通过用户在前端页面上进行点击操作,触发对应的接口函数,以获取目标联邦知识图谱对应的目标返回数据,进而将所述目标返回数据进行可视化绘制。
参照图5,图5是本申请实施例方案涉及的硬件运行环境的联邦知识图谱构建设备结构示意图。
如图5所示,该联邦知识图谱构建设备可以包括:处理器1001,例如CPU,存储器1005,通信总线1002。其中,通信总线1002用于实现处理器1001和存储器1005之间的连接通信。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储设备。
可选地,该联邦知识图谱构建设备还可以包括矩形用户接口、网络接口、相机、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块等等。矩形用户接口可以包括显示屏(Display)、输入子模块比如键盘(Keyboard),可选矩形用户接口还可以包括标准的有线接口、无线接口。网络接口可选的可包括标准的有线接口、无线接口(如WIFI接口)。
本领域技术人员可以理解,图5中示出的联邦知识图谱构建设备结构并不构成对联邦知识图谱构建设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图5所示,作为一种计算机存储介质的存储器1005中可以包括操作***、网络通信模块以及联邦知识图谱构建程序。操作***是管理和控制联邦知识图谱构建设备硬件和软件资源的程序,支持联邦知识图谱构建程序以及其它软件和/或程序的运行。网络通信模块用于实现存储器1005内部各组件之间的通信,以及与联邦知识图谱构建***中其它硬件和软件之间通信。
在图5所示的联邦知识图谱构建设备中,处理器1001用于执行存储器1005中存储的联邦知识图谱构建程序,实现上述任一项所述的联邦知识图谱构建方法的步骤。
本申请联邦知识图谱构建设备具体实施方式与上述联邦知识图谱构建方法各实施例基本相同,在此不再赘述。
此外,请参照图6,图6是本申请联邦知识图谱构建装置的功能模块示意图,本申请还提供一种联邦知识图谱构建***,所述联邦知识图谱构建***包括:
获取模块,用于获取多源异构数据,并基于所述多源异构数据,生成各多源数据表;
分析模块,用于对各所述多源数据表进行归类分析,得到目标图谱信息,其中,所述目标图谱信息包括不同类型的图谱实体、实体属性、不同类型的图谱边以及边属性;
生成模块,用于基于所述目标图谱信息,生成不同的实体文件和边关系文件;
构建模块,用于基于所述不同的实体文件和边关系文件,构建目标联邦知识图谱。
可选地,所述分析模块还用于;
在所述多源数据表中,结合当前目标领域的业务场景,选取查询频次满足预设频次阈值的各目标字段作为所述不同类型的图谱实体,并确定各所述图谱实体对应的实体属性;
基于各所述图谱实体,在所述多源数据表中,选取关联相同类型图谱实体以及关联不同类型图谱实体的各目标字段作为所述不同类型的图普边,并确定各所述图谱边对应的边属性,其中,所述图谱边表征图谱实体之间的关联关系。
可选地,所述生成模块还用于;
根据所述目标图谱信息中不同图谱实体对应的目标字段,生成各所述实体文件;
以及根据所述目标图谱信息中不同图谱边对应的目标字段,生成各所述边关系文件。
可选地,所述获取模块还用于;
通过预设自然语言处理方法,对所述多源异构数据进行处理,生成各所述多源数据表。
可选地,所述联邦知识图谱构建***还用于:
构建所述目标联邦知识图谱的可视化网页;
获取目标用户在所述可视化网页的操作指令;
在所述目标联邦知识图谱中查询所述操作指令对应的目标返回信息;
基于所述目标返回信息,通过预设绘制算法在所述可视化网页中进行可视化绘制。
可选地,所述联邦知识图谱构建***还用于:
将所述目标返回信息导入预设构建的力导向图布局;
动态调用所述力导向图布局中预先设置的绘制函数,并基于所述绘制函数,对所述目标返回信息进行绘制。
可选地,所述联邦知识图谱构建***还用于:
若所述目标返回信息存在图谱实体,则基于所述图谱实体数据进行预设节点样式进行节点绘制;
若所述目标返回信息存在图谱边,则基于图谱实体之间图谱边的数量,按照预设边样式进行边绘制。
本申请联邦知识图谱构建***的具体实施方式与上述联邦知识图谱构建方法各实施例基本相同,在此不再赘述。
本申请实施例提供了一种存储介质,所述存储介质为计算机可读存储介质,且所述计算机可读存储介质存储有一个或者一个以上程序,所述一个或者一个以上程序还可被一个或者一个以上的处理器执行以用于实现上述任一项所述的联邦知识图谱构建方法的步骤。
本申请计算机可读存储介质具体实施方式与上述联邦知识图谱构建方法各实施例基本相同,在此不再赘述。
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利处理范围内。
Claims (10)
1.一种联邦知识图谱构建方法,其特征在于,所述联邦知识图谱构建方法包括:
获取目标领域的多源异构数据,并基于所述多源异构数据,生成各多源数据表;
对各所述多源数据表进行归类分析,得到目标图谱信息,其中,所述目标图谱信息包括不同类型的图谱实体、实体属性、不同类型的图谱边以及边属性;
基于所述目标图谱信息,生成不同的实体文件和边关系文件;
基于所述不同的实体文件和边关系文件,构建目标联邦知识图谱。
2.如权利要求1所述的联邦知识图谱构建方法,其特征在于,所述对各所述多源数据表进行归类分析,得到目标图谱信息的步骤包括:
在所述多源数据表中,结合当前目标领域的业务场景,选取查询频次满足预设频次阈值的各目标字段作为所述不同类型的图谱实体,并确定各所述图谱实体对应的实体属性;
基于各所述图谱实体,在所述多源数据表中,选取关联相同类型图谱实体以及关联不同类型图谱实体的各目标字段作为所述不同类型的图普边,并确定各所述图谱边对应的边属性,其中,所述图谱边表征图谱实体之间的关联关系。
3.如权利要求1所述的联邦知识图谱构建方法,其特征在于,所述基于所述目标图谱信息,生成不同的实体文件和边关系文件的步骤包括:
根据所述目标图谱信息中不同图谱实体对应的目标字段,生成各所述实体文件;
以及根据所述目标图谱信息中不同图谱边对应的目标字段,生成各所述边关系文件。
4.如权利要求1所述的联邦知识图谱构建方法,其特征在于,所述基于所述多源异构数据,生成各多源数据表的步骤包括:
通过预设自然语言处理方法,对所述多源异构数据进行处理,生成各所述多源数据表。
5.如权利要求1所述的联邦知识图谱构建方法,其特征在于,在所述基于所述不同的实体文件和边关系文件,构建目标联邦知识图谱的步骤之后,还包括:
构建所述目标联邦知识图谱的可视化网页;
获取目标用户在所述可视化网页的操作指令;
在所述目标联邦知识图谱中查询所述操作指令对应的目标返回信息;
基于所述目标返回信息,通过预设绘制算法在所述可视化网页中进行可视化绘制。
6.如权利要求5所述的联邦知识图谱构建方法,其特征在于,所述基于所述目标返回信息,通过预设绘制算法进行可视化绘制,得到目标绘制图的步骤包括:
将所述目标返回信息导入预设构建的力导向图布局;
动态调用所述力导向图布局中预先设置的绘制函数,并基于所述绘制函数,对所述目标返回信息进行绘制。
7.如权利要求6所述的联邦知识图谱构建方法,其特征在于,所述基于所述绘制函数,对所述目标返回信息进行绘制,得到所述目标绘制图的步骤包括:
若所述目标返回信息存在图谱实体,则基于所述图谱实体数据进行预设节点样式进行节点绘制;
若所述目标返回信息存在图谱边,则基于图谱实体之间图谱边的数量,按照预设边样式进行边绘制。
8.一种联邦知识图谱构建***,其特征在于,所述联邦知识图谱构建***包括:
获取模块,用于获取多源异构数据,并基于所述多源异构数据,生成各多源数据表;
分析模块,用于对各所述多源数据表进行归类分析,得到目标图谱信息,其中,所述目标图谱信息包括不同类型的图谱实体、实体属性、不同类型的图谱边以及边属性;
生成模块,用于基于所述目标图谱信息,生成不同的实体文件和边关系文件;
构建模块,用于基于所述不同的实体文件和边关系文件,构建目标联邦知识图谱。
9.一种联邦知识图谱构建设备,其特征在于,所述联邦知识图谱构建设备包括:存储器、处理器以及存储在存储器上的联邦知识图谱构建程序,
所述联邦知识图谱构建程序被所述处理器执行实现如权利要求1至7中任一项所述联邦知识图谱构建方法的步骤。
10.一种存储介质,所述存储介质为计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有联邦知识图谱构建程序,所述联邦知识图谱构建程序被处理器执行实现如权利要求1至7中任一项所述联邦知识图谱构建方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210514582.XA CN114780752A (zh) | 2022-05-12 | 2022-05-12 | 联邦知识图谱构建方法、***、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210514582.XA CN114780752A (zh) | 2022-05-12 | 2022-05-12 | 联邦知识图谱构建方法、***、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114780752A true CN114780752A (zh) | 2022-07-22 |
Family
ID=82437502
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210514582.XA Pending CN114780752A (zh) | 2022-05-12 | 2022-05-12 | 联邦知识图谱构建方法、***、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114780752A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115329612A (zh) * | 2022-10-17 | 2022-11-11 | 中国电子科技集团公司信息科学研究院 | 信号处理异构集成微***知识图谱构建方法及仿真方法 |
-
2022
- 2022-05-12 CN CN202210514582.XA patent/CN114780752A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115329612A (zh) * | 2022-10-17 | 2022-11-11 | 中国电子科技集团公司信息科学研究院 | 信号处理异构集成微***知识图谱构建方法及仿真方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9575950B2 (en) | Systems and methods for managing spreadsheet models | |
Ghani et al. | Visual analytics for multimodal social network analysis: A design study with social scientists | |
CN101488151B (zh) | 一种聚合Web站点内容的***和方法 | |
US20150127677A1 (en) | Enterprise graph search based on object and actor relationships | |
CN104699742B (zh) | 使能扩展大型数据集的极端可视化的方法、***和产品 | |
US9466041B2 (en) | User selected flow graph modification | |
KR101773574B1 (ko) | 데이터 테이블의 차트 시각화 방법 | |
CN112199086A (zh) | 自动编程控制***、方法、装置、电子设备及存储介质 | |
CN114510611A (zh) | 一种构建元数据血缘图谱的方法、装置及相关设备 | |
CN117057318A (zh) | 领域模型生成方法、装置、设备以及存储介质 | |
CN108572817B (zh) | 基于业务建模的资源动态配置的方法、装置和介质 | |
CN114780752A (zh) | 联邦知识图谱构建方法、***、设备及存储介质 | |
CN112966099B (zh) | 关系图谱展示方法、装置及计算机可读存储介质 | |
CN113158619B (zh) | 文档处理方法、装置、计算机可读存储介质及计算机设备 | |
CN114201144A (zh) | 基于领域驱动设计的微服务***构建方法、设备及介质 | |
Szekely et al. | Exploiting semantics of web services for geospatial data fusion | |
US8694918B2 (en) | Conveying hierarchical elements of a user interface | |
US9384285B1 (en) | Methods for identifying related documents | |
WO2023045412A1 (zh) | 页面创建方法、装置和***、计算机装置和存储介质 | |
JP2019528522A (ja) | タスク処理方法及び分散コンピューティングフレームワーク | |
CN110941662A (zh) | 科研合作关系的图示化方法、***、存储介质、及终端 | |
CN114297443B (zh) | 图数据查询语句的处理方法、装置、设备及存储介质 | |
KR101107582B1 (ko) | 웹기반의 온톨로지 편집 운영 시스템 | |
CN114020852A (zh) | 知识图谱的展示方法和装置 | |
TWI643083B (zh) | 電子應用程式開發之方法、非暫時性電腦可讀儲存媒體及系統 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |