CN113934729A - 一种基于知识图谱的数据管理方法、相关设备及介质 - Google Patents

一种基于知识图谱的数据管理方法、相关设备及介质 Download PDF

Info

Publication number
CN113934729A
CN113934729A CN202111224839.XA CN202111224839A CN113934729A CN 113934729 A CN113934729 A CN 113934729A CN 202111224839 A CN202111224839 A CN 202111224839A CN 113934729 A CN113934729 A CN 113934729A
Authority
CN
China
Prior art keywords
data
metadata
vertex
entity
resource
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111224839.XA
Other languages
English (en)
Inventor
刘建林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An International Smart City Technology Co Ltd
Original Assignee
Ping An International Smart City Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An International Smart City Technology Co Ltd filed Critical Ping An International Smart City Technology Co Ltd
Priority to CN202111224839.XA priority Critical patent/CN113934729A/zh
Publication of CN113934729A publication Critical patent/CN113934729A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例公开了一种基于知识图谱的数据管理方法、相关设备及介质,涉及大数据技术领域。该方法可以包括:获取多个资源数据,并获取每个资源数据对应的至少一个元数据,根据每个资源数据、每个元数据对应的元数据项目以及元数据项目对应的元数据内容构建针对每个资源数据的至少一个三元组数据;接收用户客户端提交的数据查询指令,并查询数据查询指令所指示的待查询的三元组数据集合;根据三元组数据集合中的各个三元组数据确定各个三元组数据对应的实体和关系,并根据实体和关系构建针对数据查询指令的目标知识图谱。通过本方法实施例有助于提高数据管理的效率。本发明涉及区块链技术,如可将数据写入区块链中,以用于数据取证等场景。

Description

一种基于知识图谱的数据管理方法、相关设备及介质
技术领域
本申请涉及大数据技术领域,尤其涉及一种基于知识图谱的数据管理方法、相关设备及介质。
背景技术
随着大数据时代的到来,对于数据的管理在生活中越来越重要,各种数据在业务管理过程中有着重要的作用,且数据量越来越庞大。目标,针对数据的管理主要是基于关系数据库存储数据,提前按照数据库三范式对数据设计关系表格,进行实体-联系图(ER图)建模。在实践过程中发现,由于ER关系建模设计太复杂,不能提前设计完整、可扩展的ER关系模型,导致后续的使用、变更困难,使得数据管理的效率较低。因此,如何提升数据管理的效率成为亟待解决的问题。
发明内容
本申请实施例提供了一种基于知识图谱的数据管理方法、相关设备及介质,有助于提高数据管理的效率。
一方面,本申请实施例公开了一种基于知识图谱的数据管理方法,所述方法包括:
获取多个资源数据,并获取所述多个资源数据中每个资源数据对应的至少一个元数据,每个元数据包括元数据项目以及所述元数据项目对应的元数据内容;
根据所述每个资源数据、所述每个元数据对应的元数据项目以及所述元数据项目对应的元数据内容构建针对所述每个资源数据的至少一个三元组数据;
接收用户客户端提交的数据查询指令,并从所述至少一个三元组数据中查询所述数据查询指令所指示的待查询的三元组数据集合;
根据所述三元组数据集合中的各个三元组数据确定所述各个三元组数据对应的实体和关系,并根据所述实体和所述关系构建针对所述数据查询指令的目标知识图谱。
另一方面,本申请实施例公开了一种基于知识图谱的数据管理装置,所述装置包括:
获取单元,用于获取多个资源数据,并获取所述多个资源数据中每个资源数据对应的至少一个元数据,每个元数据包括元数据项目以及所述元数据项目对应的元数据内容;
处理单元,用于根据所述每个资源数据、所述每个元数据对应的元数据项目以及所述元数据项目对应的元数据内容构建针对所述每个资源数据的至少一个三元组数据;
接收单元,用于接收用户客户端提交的数据查询指令,并从所述至少一个三元组数据中查询所述数据查询指令所指示的待查询的三元组数据集合;
所述处理单元,还用于根据所述三元组数据集合中的各个三元组数据确定所述各个三元组数据对应的实体和关系,并根据所述实体和所述关系构建针对所述数据查询指令的目标知识图谱。
又一方面,本申请实施例提供了一种电子设备,电子设备包括处理器、存储器,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于执行如下步骤:
获取多个资源数据,并获取所述多个资源数据中每个资源数据对应的至少一个元数据,每个元数据包括元数据项目以及所述元数据项目对应的元数据内容;
根据所述每个资源数据、所述每个元数据对应的元数据项目以及所述元数据项目对应的元数据内容构建针对所述每个资源数据的至少一个三元组数据;
接收用户客户端提交的数据查询指令,并从所述至少一个三元组数据中查询所述数据查询指令所指示的待查询的三元组数据集合;
根据所述三元组数据集合中的各个三元组数据确定所述各个三元组数据对应的实体和关系,并根据所述实体和所述关系构建针对所述数据查询指令的目标知识图谱。
又一方面,本申请实施例提供了一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序指令,计算机程序指令被处理器执行时,用于执行如下步骤:
获取多个资源数据,并获取所述多个资源数据中每个资源数据对应的至少一个元数据,每个元数据包括元数据项目以及所述元数据项目对应的元数据内容;
根据所述每个资源数据、所述每个元数据对应的元数据项目以及所述元数据项目对应的元数据内容构建针对所述每个资源数据的至少一个三元组数据;
接收用户客户端提交的数据查询指令,并从所述至少一个三元组数据中查询所述数据查询指令所指示的待查询的三元组数据集合;
根据所述三元组数据集合中的各个三元组数据确定所述各个三元组数据对应的实体和关系,并根据所述实体和所述关系构建针对所述数据查询指令的目标知识图谱。
又一方面,本申请实施例公开了一种计算机程序产品或计算机程序,所述计算机程序产品或计算机程序包括计算机指令,所述计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取所述计算机指令,处理器执行所述计算机指令,使得所述计算机设备执行上述基于知识图谱的数据管理方法。
本申请实施例中,数据管理装置能够获取多个资源数据,并获取多个资源数据中每个资源数据对应的至少一个元数据,根据每个资源数据、每个元数据对应的元数据项目以及元数据项目对应的元数据内容构建针对每个资源数据的至少一个三元组数据;接收用户客户端提交的数据查询指令,并从至少一个三元组数据中查询数据查询指令所指示的待查询的三元组数据集合;根据三元组数据集合中的各个三元组数据确定各个三元组数据对应的实体和关系,并根据实体和关系构建针对数据查询指令的目标知识图谱。由此通过基于元数据构建知识图谱展示各资源数据之间的关系实现对数据的管理,有助于提高对于数据管理的效率。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种基于知识图谱的数据管理***的效果示意图;
图2是本申请实施例提供的一种基于知识图谱的数据管理方法的流程示意图;
图3是本申请实施例提供的一种知识图谱的效果示意图;
图4是本申请实施例提供的一种知识图谱的效果示意图;
图5是本申请实施例提供的一种知识图谱的效果示意图;
图6是本申请实施例提供的一种知识图谱的效果示意图;
图7是本申请实施例提供的另一种基于知识图谱的数据管理方法的流程示意图;
图8是本申请实施例提供的一种目标知识图谱显示界面的效果示意图;
图9是本申请实施例提供的一种基于知识图谱的数据管理装置的结构示意图;
图10是本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请提供一种基于知识图谱的数据管理方案,能够获取多个资源数据,并获取多个资源数据中每个资源数据对应的至少一个元数据,根据每个资源数据、每个元数据对应的元数据项目以及元数据项目对应的元数据内容构建针对每个资源数据的至少一个三元组数据;接收用户客户端提交的数据查询指令,并从至少一个三元组数据中查询数据查询指令所指示的待查询的三元组数据集合;根据三元组数据集合中的各个三元组数据确定各个三元组数据对应的实体和关系,并根据实体和关系构建针对数据查询指令的目标知识图谱。本方案通过基于元数据构建知识图谱展示各资源数据之间的关系以实现对元数据的管理,不需要提前对元数据设计关系表格,进行实体-联系图(ER图)建模,由此有助于提高对于元数据的管理的效率。
本申请中的元数据(Metadata),又称中介数据、中继数据,为描述数据的数据(data about data),主要是描述数据属性(property)的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。
本申请的技术方案可运用在电子设备中,该电子设备可以是终端,也可以是服务器,或者也可以是用于基于知识图谱进行策略确定的其他设备,本申请不做限定。本申请可用于众多通用或专用的计算机***环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器***、基于微处理器的***、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何***或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
在一种可能的实施方式中,本申请的技术方案可以应用于基于知识图谱的数据管理***中,请参见图1,图1是本申请实施例提供的一种基于知识图谱的数据管理***的效果示意图。该基于知识图谱的数据管理***可包括上述电子设备以及用户客户端。该电子设备可以用于获取多个资源数据以及每个资源数据对应的至少一个元数据,并根据至少一个元数据构建对应的三元组数据;还用于在接收到用户客户端的提交的数据查询指令时,获取三元组数据集合,并根据三元组数据集合构建对应的目标知识图谱,并可以向用户客户端返回构建的目标知识图谱,以便于用户客户端显示该目标知识图谱。该用户客户端可以用于响应于目标对象的数据查询操作向上述电子设备提交数据查询指令,并接收电子设备返回的目标知识图谱,以显示该目标知识图谱。由此通过知识图谱展示各资源数据之间的关系实现对元数据的管理,有助于提高数据管理的效率。
基于上述的描述,本申请实施例提出一种基于知识图谱的数据管理方法。请参见图2,图2是本申请实施例提供的一种基于知识图谱的数据管理方法的流程示意图。该方法可以由上述所提及的电子设备执行。该方法可以包括步骤S201-S204。
S201、获取多个资源数据,并获取多个资源数据中每个资源数据对应的至少一个元数据。
其中,该资源数据可以为业务、技术实施、管理等过程中产生的数据,如一些单据、数据表格、文档等等信息,此处不做限制。资源数据对应的元数据可以为用于描述该资源数据的数据,每个资源数据对应至少一个元数据。
每个元数据包括元数据项目以及元数据项目对应的元数据内容。也就是说,一个元数据可以由元数据项目以及元数据内容组成。例如,获取一个表格数据对应的至少一个元数据,该表格数据对应的至少一个元数据可以为{创建人:张三;创建日期:2021-xx-xx;字段:F1、F2、F3;存储地址:C:\oracle},则该表格数据对应的至少一个元数据中,“创建人”“创建日期”“字段”“存储地址”均可以称为对应的元数据的元数据项目,“张三”“2021-xx-xx”“F1”“F2”“F3”“C:\oracle”称为对应的元数据项目所对应的元数据内容。可选的,针对同一元数据项目可以对应有多个元数据内容。
在一种可能的实施方式中,每个资源数据对应的至少一个元数据分别有对应的元数据类型,该元数据类型可以为技术元数据、业务元数据或管理元数据。
其中,该技术元数据是用于描述资源数据在技术领域相关概念、关系、规则的数据,主要包括对数据结构、数据处理方面的特征描述,常见的技术元数据包括:字段、存储位置、数据模型、数据库表、字段长度、ETL脚本、SQL脚本、接口程序、数据关系等;业务元数据是用于描述资源数据在业务领域相关的概念、关系和规则的数据,常见的业务元数据包括:业务定义、业务术语、业务规则、业务指标等;管理元数据是用于描述资源数据在管理领域的相关概念、关系和规则的数据,常见的管理元数据包括:数据所有者、数据质量定责、数据安全等级等。
在一种可能的实施方式中,获取每个资源数据对应的至少一个元数据,可以基于预先构建的目标元数据获取方案进行获取。该目标元数据获取方案可以用于指示获取哪些资源数据的元数据,还可以指示获取哪些元数据项目所对应的元数据,还可以从哪些数据源或数据库中获取元数据,此处不做限制。可选的,在构建元数据获取方案时,可以根据元数据需求构建初始的元数据获取方案,并将初始的元数据获取方案提交至审核客户端进行审核,若审核通过,则将初始的元数据获取方案作为该目标元数据获取方案,若审核不通过,则对初始的元数据进行调整后再次提交审核,直至审核通过,将初始的元数据获取方案作为目标元数据获取方案。可选的,根据目标元数据获取方案每个资源数据对应的至少一个元数据时,可以根据该目标元数据获取方案人工采集该多个元数据,也可以通过API等接口从该目标元数据获取方案所指示的数据源中自动获取该多个元数据。在一些场景中,通过API等接口从该目标元数据获取方案所指示的数据源中自动获取该多个元数据时,可以每间隔一定时间段获取一次上述多个元数据,以对获取的元数据进行更新,保持获取的元数据的实时性。
S202、根据每个资源数据、每个元数据对应的元数据项目以及元数据项目对应的元数据内容构建针对每个资源数据的至少一个三元组数据。
其中,三元组数据可以包括第一实体、关系和第二实体。该三元组数据可以表示为{第一实体,关系,第二实体}。在一些场景中,该三元组数据也可表示为{实体,属性,属性值}。此处不做限制。
在一种可能的实施方式中,根据每个资源数据、每个元数据对应的元数据项目以及元数据项目对应的元数据内容构建针对每个资源数据的至少一个三元组数据,包括以下步骤:将每个资源数据确定为第一实体,并将元数据项目对应的元数据内容确定为第二实体,以及根据每个元数据对应的元数据项目确定第一实体与第二实体之间的关系;根据第一实体、第二实体以及第一实体与第二实体之间的关系构建针对每个资源数据的至少一个三元组数据。
其中,将每个资源数据确定为第一实体,可以通过资源数据对应的唯一编码或数据名称表示该第一实体;将元数据项目对应的元数据内容确定为第二实体,可以通过元数据内容对应的唯一编码或内容文本表示该第二实体;根据每个元数据对应的元数据项目确定第一实体与第二实体之间的关系,可以通过该元数据项目对应的唯一编码或项目名称表示该第一实体与第二实体之间的关系。该唯一编码可以为针对每个资源数据、元数据项目、元数据内容对应的唯一的编码,该编码可以由数字、字母或字符组成,此处不做限制。该数据名称可以为资源数据的所对应的名称;该内容文本为元数据中的元数据内容所对应的文本;该项目名称为元数据中元数据项目所对应的名称。
例如,资源数据的名称为“2021年职工信息统计表”,资源数据“2021年职工信息统计表”所对应的至少一个元数据中,存在项目名称为“存储地址”的元数据项目,元数据项目“存储地址”的元数据内容为“C:\oracle”,则该第一实体可以表示为“2021年职工信息统计表”,该第二实体可以表示为“C:\oracle”,该第一实体与第二实体之间的关系可以表示为“存储地址”,进而得到的针对资源数据“2021年职工信息统计表”的一个三元组数据为{2021年职工信息统计表,存储地址,C:\oracle”}。
可以理解的是,针对每个资源数据的每个元数据均可以构建一个三元组数据,该三元组数据中的第一实体为资源数据,第二实体为元数据的元数据内容,关系为元数据的元数据项目。由此可以得到每个资源数据分别对应的至少一个三元组数据。
在一种可能的实施方式中,若构建三元组数据时,是根据资源数据、技术元数据的元数据项目以及技术元数据的元数据项目对应的元数据内容构建的三元组数据,也就是根据资源数据以及资源数据的技术元数据构建的三元组数据,则该三元组数据为技术三元组数据。若构建三元组数据时,是根据资源数据、业务元数据的元数据项目以及业务元数据的元数据项目对应的元数据内容构建的三元组数据,也就是根据资源数据以及资源数据的业务元数据构建的三元组数据,则该三元组数据为业务三元组数据。若构建三元组数据时,是根据资源数据、管理元数据的元数据项目以及管理元数据的元数据项目对应的元数据内容构建的三元组数据,也就是根据资源数据以及资源数据的管理元数据构建的三元组数据,则该三元组数据为管理三元组数据。由此可以得到技术三元组数据、业务三元组数据以及管理三元组数据等不同类别三元组数据,以便于后续根据三元组数据的类别获取三元组数据集合。
在一种可能的实施方式中,在获取到针对每个资源对象的至少一个三元组数据后,可以将该每个资源对象的至少一个三元组数据存储至区块链中,也就是对该每个资源对象的至少一个三元组数据进行数据上链处理。其中,将对该每个资源对象的至少一个三元组数据进行数据上链处理可以包括但不限于内容存证、哈希存证、链接存证、隐私存证、分享隐私存证等方式,此处不做限制。由此可以提高数据的安全性,避免数据被篡改。
S203、接收用户客户端提交的数据查询指令,并从至少一个三元组数据中查询数据查询指令所指示的待查询的三元组数据集合。
其中,该用户客户端为提交数据查询指令的任一客户端。该用户客户端登录有目标对象所对应的账号,用户客户端响应于目标对象的数据查询操作,可以向电子设备提交数据查询指令。该数据查询操作可以为针对用于指示查询三元组数据集合的控件的触控操作,也可以为用于指示查询三元组数据集合的语音指令,此处不做限制。
该数据查询指令可以为用于查询待查询的三元组数据集合的指令,该待查询的三元组数据集合为数据查询指令所指示需要查询的至少一个三元组数据的集合。
在一种可能的实施方式中,该查询数据查询指令携带用于指示待查询的三元组数据集合的标识信息。该标识信息可以用于指示待查询的三元组数据集合中的每个三元组数据是哪些三元组数据。则从至少一个三元组数据中查询数据查询指令所指示的待查询的三元组数据集合时,可以从该至少一个三元组数据中,获取该标识信息所指示的至少一个三元组数据。例如,该标识信息可以标识待查询的三元组数据集合中每个三元组数据的类别,如该三元组数据的类别为技术三元组数据、业务三元组数据以及管理三元组数据等,则可以从至少一个三元组数据中,查询到属于该标识信息所指示的三元组数据的类别的三元组数据集合;又如,该标识信息还可以标识待查询的三元组数据集合中每个三元组数据中的第一实体所对应的资源数据的类型,如该资源数据的类型为单据、表格、文档等等,则可以从至少一个三元组数据中,查询到该标识信息所指示的资源数据的类型所对应的三元组数据集合。该标识信息还可以标识其他的信息,此处不做限制。
在一种可能的实施方式中,该数据查询指携带目标对象的权限信息以及用于指示待查询的三元组数据集合的标识信息。则从至少一个三元组数据中查询数据查询指令所指示的待查询的三元组数据集合,可以包括以下步骤:检测数据查询指令携带的目标对象的权限信息是否指示目标对象具有查询标识信息所指示的三元组数据集合的权限;若检测结果为权限信息指示目标对象具有查询标识信息所指示的三元组数据集合的权限,则从至少一个三元组数据中查询数据查询指令所指示的待查询的三元组数据集合。其中,该目标对象为用户客户端中登录的账号所对应的对象,目标对象具有对应的权限信息,该权限信息用于指示目标对象具有查询哪些三元组数据的权限,也就是该目标对象能够查询到哪些三元组数据。该检测结果为检测数据查询指令携带的目标对象的权限信息是否指示目标对象具有查询标识信息所指示的三元组数据集合的权限所得到的结果,该检测结果可以为权限信息指示目标对象具有查询标识信息所指示的三元组数据集合的权限,或者权限信息指示目标对象不具有查询标识信息所指示的三元组数据集合的权限。若检测结果为权限信息指示目标对象具有查询标识信息所指示的三元组数据集合的权限,则从至少一个三元组数据中查询数据查询指令所指示的待查询的三元组数据集合,也就是从至少一个三元组数据中查询标识信息所指示的三元组数据集合。
可选的,若检测结果为权限信息指示目标对象不具有查询标识信息所指示的三元组数据集合的权限,则可以生成提示信息,并将该提示信息发送至该目标对象对应的用户客户端,以提示目标对象不具有查询权限。其中,该提示信息可以为提示目标对象不具有查询权限的文本信息。由此可以避免由不具有权限的对象获取到三元组数据集合,提升数据的隐私性和安全性,避免数据泄露。
可选的,该权限信息可以根据目标对象所属的对象分组进行确定,该对象分组可以根据对象的职责、岗位、部门等信息进行划分,每个对象分组下可以有至少一个对象,每个对象分组具有对应的权限信息,进而目标对象的权限信息的确定方式可以为,确定目标对象所属的对象分组,将目标对象所属的对象分组对应的权限信息确定为该目标对象的权限信息。
S204、根据三元组数据集合中的各个三元组数据确定各个三元组数据对应的实体和关系,并根据实体和关系构建针对数据查询指令的目标知识图谱。
其中,该实体可以包括三元组数据集合中的各个三元组数据中的第一实体以及第二实体,该关系可以为三元组数据集合中的各个三元组数据中的关系。该目标知识图谱可以为根据查询到的三元组数据集合中的各个三元组数据构成的知识图谱,该目标知识图谱中包括多个顶点,以及连接该多个顶点之间的边。例如,可以将三元组数据中的第一实体和第二实体确定为对应的顶点,将三元组数据中的关系确定为该三元组数据中的第一实体与第二实体分别对应的顶点之间的边。
在一种可能的实施方式中,根据三元组数据集合中的各个三元组数据确定各个三元组数据对应的实体和关系,并根据实体和关系构建针对数据查询指令的目标知识图谱,可以包括以下步骤:确定三元组数据集合中的每个三元组数据中的第一实体为第一顶点,并确定三元组数据集合中的每个三元组数据中的第二实体为第二顶点;基于三元组数据集合中的每个三元组数据中第一实体与第二实体之间的关系,确定第一顶点和第二顶点之间的边;将第一顶点和第二顶点中相同的顶点进行合并处理,得到第一目标顶点;根据第一顶点、第二顶点、第一目标顶点以及各个顶点之间的边构建针对数据查询指令的目标知识图谱。
其中,该第一顶点根据三元组数据中的第一实体确定的顶点,该第二顶点为根据三元组数据中的第二实体确定的顶点,该第一顶点和第二顶点之间的边可以根据对应的三元组数据中的关系确定。可以理解的是,三元组数据集合中的每个三元组数据具有对应的第一顶点、第二顶点以及边,也就是说,若三元组数据集合中包括多个三元组数据,该三元组数据集合对应有多个第一顶点,每个第一顶点对应的第二顶点(即多个第二顶点),以及每个第一顶点与对应的第二顶点之间的边(即多条边)。
该第一目标顶点为根据三元组数据集合对应的各个第一顶点与各个第二顶点之间相同的顶点合并处理得到的,也就是说,若一个三元组数据对应的第一顶点与另一个三元组数据对应的第二顶点相同,则可以将该第一顶点与另一个三元组数据对应的第二顶点合并处理。对相同的顶点合并处理可以为将相同的顶点在知识图谱中合并为同一个顶点。由此通过对第一顶点与第二顶点中相同的顶点进行合并处理,可以使得各个资源数据能够关联起来,有利于确定各资源数据之间的关系。
例如,请参见图3,图3是本申请实施例提供的一种知识图谱的效果示意图。若有一个三元组数据A{单据A,上游单据,单据B}和另一个三元组数据B{单据B,创建人,张三},将三元组数据A中的第一实体“单据A”确定为一个第一顶点,将三元组数据A中的第二实体“单据B”确定为该第一顶点对应的第二顶点,将三元组数据A中的关系“上游单据”确定为该第一顶点与该第一顶点对应的第二顶点之间的关系;将三元组数据B中的第一实体“表格B”确定为另一第一顶点,将三元组数据B中的第二实体“张三”确定为该另一第一顶点对应的第二顶点,将三元组数据B中的关系“创建人”确定为该另一第一顶点与该另一第一顶点对应的第二顶点之间的关系。可以看到,三元组数据A的第二实体对应的第二顶点,与三元组数据B的第一实体对应的第一顶点均为“单据B”,则可以将两个三元组数据对应的相同的顶点进行合并处理得到第一目标顶点,即可以得到包括三元组数据A和三元组数据B的知识图谱如图3所示,图3中的301为合并处理后的第一目标顶点。
在一种可能的实施方式中,根据三元组数据集合中的各个三元组数据确定各个三元组数据对应的实体和关系,并根据实体和关系构建针对数据查询指令的目标知识图谱,还可以包括以下步骤:确定三元组数据集合中的每个三元组数据中的第一实体为第一顶点,并确定三元组数据集合中的每个三元组数据中的第二实体为第二顶点;基于三元组数据集合中的每个三元组数据中第一实体与第二实体之间的关系,确定第一顶点和第二顶点之间的边;将各个第二顶点中相同的顶点进行合并处理,得到第二目标顶点;根据第一顶点、第二顶点、第二目标顶点以及各个顶点之间的边构建针对数据查询指令的目标知识图谱。
其中,该第一顶点、第二顶点的相关描述与上述针对第一顶点与第二顶点的相关描述相同,此处不做赘述。
该第二目标顶点为根据三元组数据集合对应的各个第二顶点之间相同的顶点合并处理得到的,也就是说,若一个三元组数据对应的第二顶点与另一个三元组数据对应的第二顶点相同,则可以将两个第二顶点合并处理。由此通过对各第二顶点中相同的顶点进行合并处理,可以使得各个资源数据的元数据内容能够关联起来,有利于确定各资源数据的属性之间的关系。
例如,请参见图4,图4是本申请实施例提供的一种知识图谱的效果示意图。若有一个三元组数据C{单据A,创建人,张三}和另一个三元组数据D{单据B,创建人,张三},将三元组数据C中的第一实体“单据A”确定为一个第一顶点,将三元组数据C中的第二实体“张三”确定为该第一顶点对应的第二顶点,将三元组数据C中的关系“创建人”确定为该第一顶点与该第一顶点对应的第二顶点之间的关系;将三元组数据D中的第一实体“单据B”确定为另一第一顶点,将三元组数据D中的第二实体“张三”确定为该另一第一顶点对应的第二顶点,将三元组数据D中的关系“创建人”确定为该另一第一顶点与该另一第一顶点对应的第二顶点之间的关系。可以看到,三元组数据C的第二实体对应的第二顶点,与三元组数据D的第二实体对应的第二顶点均为“张三”,则可以将两个三元组数据对应的相同的第二顶点进行合并处理得到第二目标顶点,即可以得到包括三元组数据C和三元组数据D的知识图谱如图4所示,图4中的401为合并处理后的第二目标顶点。
在一种可能的实施方式中,根据三元组数据集合中的各个三元组数据确定各个三元组数据对应的实体和关系,并根据实体和关系构建针对数据查询指令的目标知识图谱,还可以包括以下步骤:确定三元组数据集合中的每个三元组数据中的第一实体为第一顶点,并确定三元组数据集合中的每个三元组数据中的第二实体为第二顶点;基于三元组数据集合中的每个三元组数据中第一实体与第二实体之间的关系,确定第一顶点和第二顶点之间的边;将各个第一顶点中相同的顶点进行合并处理,得到第三目标顶点;根据第一顶点、第二顶点、第三目标顶点以及各个顶点之间的边构建针对数据查询指令的目标知识图谱。
其中,该第一顶点、第二顶点的相关描述与上述针对第一顶点与第二顶点的相关描述相同,此处不做赘述。
该第三目标顶点为根据三元组数据集合对应的各个第一顶点之间相同的顶点合并处理得到的,也就是说,若一个三元组数据对应的第一顶点与另一个三元组数据对应的第一顶点相同,则可以将两个第一顶点合并处理。由此通过对各第一顶点中相同的顶点进行合并处理,可以避免得到的知识图谱中存在同一的资源数据对应的多个第一顶点。
例如,请参见图5,图5是本申请实施例提供的一种知识图谱的效果示意图。若有一个三元组数据E{单据A,存储地址,C:\oracle}和另一个三元组数据F{单据A,创建人,张三},将三元组数据E中的第一实体“单据A”确定为一个第一顶点,将三元组数据E中的第二实体“C:\oracle”确定为该第一顶点对应的第二顶点,将三元组数据E中的关系“存储地址”确定为该第一顶点与该第一顶点对应的第二顶点之间的关系;将三元组数据F中的第一实体“单据A”确定为另一第一顶点,将三元组数据F中的第二实体“张三”确定为该另一第一顶点对应的第二顶点,将三元组数据F中的关系“创建人”确定为该另一第一顶点与该另一第一顶点对应的第二顶点之间的关系。可以看到,三元组数据E的第一实体对应的第一顶点,与三元组数据F的一实体对应的第一顶点均为“单据A”,则可以将两个三元组数据对应的相同的第一顶点进行合并处理得到第三目标顶点,即可以得到包括三元组数据E和三元组数据F的知识图谱如图5所示,图5中的501为合并处理后的第三目标顶点。
在一种可能的实施方式中,在得到确定三元组数据集合中的每个三元组数据中的第一顶点、第二顶点,以及第一顶点和第二顶点之间的边后,还可以获取第一目标顶点、第二目标顶点以及第三目标顶点,进而可以根据第一顶点、第二顶点、第一目标顶点、第二目标顶点、第三目标顶点以及各个顶点之间的边构建针对数据查询指令的目标知识图谱。也就是说,可以同时对三元组数据集合中,各个三元组数据对应的多个顶点(包括各个第一顶点和各个第二顶点)中相同的顶点进行合并处理。可选的,还可以获取第一目标顶点和第二目标顶点,或者,获取第一目标顶点和第三目标顶点,或者,获取第二目标顶点和第三目标顶点,此处不做限制。
例如,请参见图6,图6是本申请实施例提供的一种知识图谱的效果示意图。若有一个三元组数据A{单据A,上游单据,单据B},三元组数据B{单据B,创建人,张三},三元组数据C{单据A,创建人,张三},三元组数据E{单据A,存储地址,C:\oracle},若获取上述多个三元组数据中的第一目标顶点,第二目标顶点以及第三目标顶点,进而根据各个第一顶点、第二顶点、第一目标顶点、第二目标顶点、第三目标顶点以及各个顶点之间的边构建针对数据查询指令的目标知识图谱,如图6所示,图6中的601为一个第一目标顶点,602为一个第二目标顶点,603为一个第三目标顶点。
可以理解的是,确定三元组数据集合中的每个三元组数据中的第一实体为第一顶点,并确定三元组数据集合中的每个三元组数据中的第二实体为第二顶点,基于三元组数据集合中的每个三元组数据中第一实体与第二实体之间的关系,确定第一顶点和第二顶点之间的边,也就是相当于,针对每个资源数据,将资源数据确定为第一顶点,将资源数据对应的元数据的元数据内容确定为第二顶点,将资源数据对应的元数据的元数据项目确定为第一顶点与第二顶点之间的边。
采用本申请实施例,能够获取多个资源数据,并获取多个资源数据中每个资源数据对应的至少一个元数据,根据每个资源数据、每个元数据对应的元数据项目以及元数据项目对应的元数据内容构建针对每个资源数据的至少一个三元组数据;接收用户客户端提交的数据查询指令,并从至少一个三元组数据中查询数据查询指令所指示的待查询的三元组数据集合;根据三元组数据集合中的各个三元组数据确定各个三元组数据对应的实体和关系,并根据实体和关系构建针对数据查询指令的目标知识图谱。由此通过基于元数据构建知识图谱展示各资源数据之间的关系实现对数据的管理,有助于提高对于数据管理的效率。
请参见图7,图7是本申请实施例提供的另一种基于知识图谱的数据管理方法的流程示意图,可以由上述电子设备执行。该方法可以包括以下步骤。
S701、获取多个资源数据,并获取多个资源数据中每个资源数据对应的至少一个元数据。
其中,针对步骤S701的相关描述,可以参照步骤S201的相关描述,此处不做赘述。
在一种可能的实施方式中,若资源数据中包括第一资源数据和第二资源数据,则本申请实施例还可以包括,获取第一资源数据中携带的数据来源标识,数据来源标识用于指示第一资源数据中的数据的获取位置;当数据来源标识用于指示第二资源数据中的数据时,从第一资源数据所对应的至少一个元数据中确定与数据来源标识对应的第一元数据。由此可以获取每个资源数据中用于指示数据来源的元数据,以便于后续对各个资源数据进行溯源。
其中,该第一资源数据可以为获取的多个资源数据中的任一资源数据,该第二资源数据可以为获取的多个资源数据中除第一资源数据外的任一资源数据,并且该第二资源数据中的数据为第一资源数据的数据来源。该数据来源标识用于指示第一资源数据中的数据的获取位置,如该第一资源数据中的部分数据的获取位置为第二资源数据,则该第一资源数据的数据来源标识可以指示第二资源数据中的数据,也就是说第一资源数据中的部分数据来源于第二资源数据中的数据。
该第一元数据为第一资源数据所对应的至少一个元数据中与数据来源标识对象的元数据。与数据来源标识对象的元数据,可以为元数据的元数据内容为数据来源标识对应的所指示的内容,如该数据来源标识用于指示第二资源数据中的数据,则该第一元数据的元数据内容即为第二资源数据。进而从第一资源数据的至少一个资源数据中确定出元数据内容包括第二资源数据的元数据作为上述针对第一资源数据的第一元数据。可选的,还可以从第一资源数据对应的至少一个元数据中确定出元数据内容包括第二资源数据,且元数据项目的项目名称用于表示数据来源的元数据,作为上述针对第一资源数据的第一元数据,该用于表示数据来源的项目名称可以为“数据来源”“数据获取源”“上游数据”等,此处不做限制。例如,表格S的数据来源标识用于指示表格R中的数据,则从表格S所对应的至少一个元数据中确定与数据来源标识对应的第一元数据,该第一元数据为{数据来源,表格R}。
可选的,若第一资源数据携带的数据来源标识为空或者该第一资源数据未携带数据来源标识,则可以表示该第一资源数据中的数据不是来源于其他的资源数据,进而不需要确定第一资源数据对应的第一元数据。
可选的,本申请还可以直接从资源数据的至少一个元数据中确定项目名称用于表示数据来源的元数据为第一元数据,如项目名称为“数据来源”“数据获取源”“上游数据”等,此处不做限制。也就是不通过数据来源标识确定对应的第一元数据,而是直接根据第一资源数据的至少一个元数据的元数据项目确定对应的第一元数据。
在一种可能的实施方式中,资源数据包括第一表类资源数据和第二表类资源数据,则本申请实施例还可以包括,当检测到第一表类资源数据和第二表类资源数据中均包括目标字段时,从第一表类资源数据所对应的至少一个元数据中获取与目标字段对应的第二元数据,并从第二表类资源数据所对应的至少一个元数据中获取与目标字段对应的第三元数据。由此可以通过确定每个表类资源数据中所包括的字段中的相同的字段,以便于后续对各个表类资源数据的每个字段的数据关系确定。
其中,该第一表类资源数据可以为获取的多个资源数据中的任一表类资源数据,该第二表类资源数据可以为获取的多个资源数据中除第一表类资源数据外的任一表类资源数据,并且第一表类资源数据和第二表类资源数据中均包括目标字段。该表类资源数据可以为表格类的资源数据,表类资源数据中包括多个字段,通常每个表类资源数据中的每一列数据均可对应一个字段,如一个表类资源数据中,每列数据分别用于表示“职员名称”“岗位”“年龄”“性别”,则“用户名称”“岗位”“年龄”“性别”可以分别代表一个字段。
该目标字段为第一表类资源数据与第二表类资源数据中相同的字段。该第二元数据为第一表类资源数据所对应的至少一个元数据中与目标字段对应的元数据。该第三元数据为第二表类资源数据所对应的至少一个元数据中与目标字段对应的元数据。与目标字段对应的元数据,可以为元数据内容为目标字段的字段名称或唯一字段编码的元数据,则该第二元数据和第三元数据的元数据内容均为目标字段的字段名称或唯一字段编码。可选的,还可以从第一表类资源数据的至少一个元数据中确定出元数据内容包括目标字段,且元数据项目的项目名称用于表示字段信息的元数据,作为上述针对第一表类资源数据的第二元数据,并且从第二表类资源数据的至少一个元数据中确定出元数据内容包括目标字段,且元数据项目的项目名称用于表示字段信息的元数据,作为上述针对第二表类资源数据的第三元数据。该用于表示字段信息的项目名称可以为“字段信息”“字段类型”“所含字段”等,此处不做限制。例如,表格S中包括字段“职员名称”,表格R中也包括字段“职员名称”,则从表格S所对应的至少一个元数据中确定出与字段“职员名称”对应的第二元数据{字段,职员名称},从表格R所对应的至少一个元数据中确定出与字段“职员名称”对应的第三元数据{字段,职员名称}。
S702、将每个资源数据确定为第一实体,并将元数据项目对应的元数据内容确定为第二实体,以及根据每个元数据对应的元数据项目确定第一实体与第二实体之间的关系。
S703、根据第一实体、第二实体以及第一实体与第二实体之间的关系构建针对每个资源数据的至少一个三元组数据。
其中,针对步骤S702-S703的相关描述,可以参照步骤S202-203的相关描述,此处不做赘述。
在一种可能的实施方式中,针对第一资源数据的第一元数据将第一资源数据确定为第一实体,将第一元数据中的元数据内容确定为第二实体,根据第一元数据中的元数据项目确定关系,由此得到第一元数据对应的三元组数据。针对第二资源数据,可以将该第二资源数据确定为该第二资源数据对应的任一元数据对应的三元组数据中的第一实体,例如,针对表格S的第一元数据为{数据来源,表格R},则该第一元数据对应的三元组数据为{表格S,数据来源,表格R},针对表格R,可以将该表格R确定为表格R所对应的任一元数据所对应的三元组数据中的第一实体。
在一种可能的实施方式中,针对第一表类资源数据的第二元数据可以构建对应的三元组数据,针对第二表类资源数据的第三元数据可以构建对应的三元组数据。具体的,将第一表类资源数据确定为第一实体,将第二元数据中的元数据内容确定为第二实体,根据第二元数据中的元数据项目确定关系,由此得到第二元数据对应的三元组数据。将第二表类资源数据确定为第一实体,将第三元数据中的元数据内容确定为第二实体,根据第一元数据中的元数据项目确定关系,由此得到第三元数据对应的三元组数据。例如,表格S对应的第二元数据为{字段,职员名称},则该表格S对应的第二元数据对应的三元组数据为{表格S,字段,职员名称},表格R对应的第三元数据为{字段,职员名称},则表格S对应的第三元数据对应的三元组数据为{表格R,字段,职员名称}。
S704、接收用户客户端提交的数据查询指令,并从至少一个三元组数据中查询数据查询指令所指示的待查询的三元组数据集合。
S705、根据三元组数据集合中的各个三元组数据确定各个三元组数据对应的实体和关系,并根据实体和关系构建针对数据查询指令的目标知识图谱。
其中,针对步骤S704-S705的相关描述可以参照步骤S203-S204的相关描述,此处不做赘述。
在一种可能的实施方式中,针对上述第一资源数据确定了对应的第一元数据,该第一元数据的元数据内容为第二资源数据。则可以将第二资源数据所对应的第一实体确定为对应的第一顶点,将第一元数据包括的元数据内容对应的第二实体确定为对应的第二顶点。并且可以将第一元数据包括的第一资源数据对应的第一实体确定为另一第一顶点,基于第一元数据中的关系确定该第一元数据对应的第一顶点和第二顶点之间的边。
进而将第一顶点和第二顶点中相同的顶点进行合并处理,得到第一目标顶点,可以为将第二资源数据对应的第一顶点与第一元数据对应的第二顶点进行合并处理,得到第一目标顶点。由此可以将第一资源数据对应的顶点与第二资源数据对应的顶点之间建立边,该第一资源数据与第二资源对象之间的关系为第一资源数据的数据来源为第二资源对象。若针对每个资源对象均进行上述操作,则可以对确定每个资源数据的数据来源,并在知识图谱中进行体现,实现对资源数据中的数据的溯源。
在一种可能的实施方式中,针对上述第一表类资源数据确定了对应的第二元数据,第二表类资源数据确定了对应的第三元数据,该第二元数据的元数据内容与第三元数据的元数据内容相同,该元数据内容即为目标字段。则可以将第二元数据包括的元数据内容对应的第二实体确定为对应的第二顶点,将第三元数据包括的元数据内容对应的第二实体确定为另一第二顶点。并且可以将第二元数据包括的第一表类资源数据对应的第一实体确定为一个第一顶点,基于第二元数据中的关系确定该第二元数据对应的第一顶点和第二顶点之间的边,将第三元数据包括的第二表类资源数据对应的第一实体确定为另一第一顶点,基于第三元数据中的关系确定该第三元数据对应的第一顶点和第二顶点之间的边。
进而将将各个第二顶点中相同的顶点进行合并处理,得到第二目标顶点,得到第一目标顶点,可以为将第二元数据对应的第二顶点与第三元数据对应的另一第二顶点进行合并处理,得到第二目标顶点。由此可以将第一表类资源数据中的目标字段对应的顶点与第二表类资源数据中的目标字段对应的顶点进行合并处理,有利于发现第一表类资源和第二表类资源包括的目标字段之间的关联关系。若针对每个表类资源对象均进行上述操作,则可以确定每个资源数据的数据来源中的字段与其他资源数据的字段之间的关系,并在知识图谱中进行体现,实现对表类资源数据中的字段的关系的发现。
在一种可能的实施方式中,在构建目标知识图谱后,可以向用户客户端返回该目标知识图谱,以便于用户客户端显示该目标知识图谱。例如,请参见图8,图8是本申请实施例提供的一种目标知识图谱显示界面的效果示意图。如图8所示目标知识图谱显示界面中包括如801所示的图谱类型选择区域,如802所示的搜索区域,如图803所示的知识图谱显示区域。
其中,该图谱类型选择区域可以用选择获取怎样的知识图谱,如全部元数据图谱,业务元数据图谱,技术元数据图谱,管理元数据图谱。该全部元数据图谱为根据全部的三元组数据构建的知识图谱,业务元数据图谱为根据业务三元组数据构建的知识图谱,该技术元数据图谱为根据技术三元组数据构建的知识图谱,该管理元数据图谱为根据管理三元组数据构建的知识图谱。进而当用户客户端检测到点击对应的控件时,可以向电子设备提交数据查询指令,该数据查询指令中携带的标识信息可以用于指示待查询的三元组数据集合中的每个三元组数据为对应的三元组数据的类型。例如,目标对象点击用于指示查询业务元数据图谱的控件,则用户客户端向电子设备提交数据查询指令,该数据查询指令中携带的标识信息可以用于指示待查询的三元组数据集合中的每个三元组数据为业务三元组数据。
该图谱显示区域可以为显示电子设备发送的目标知识图谱的区域。在该目标知识图谱区域中可以显示接收到的目标知识图谱。该搜索区域可以用于搜索知识图谱中的任意顶点,以便于从目标知识图谱中快速定位到搜索的顶点在知识图谱中的位置。
采用本申请实施例,能够获取多个资源数据,并获取多个资源数据中每个资源数据对应的至少一个元数据,根据每个资源数据、每个元数据对应的元数据项目以及元数据项目对应的元数据内容构建针对每个资源数据的至少一个三元组数据;接收用户客户端提交的数据查询指令,并从至少一个三元组数据中查询数据查询指令所指示的待查询的三元组数据集合;根据三元组数据集合中的各个三元组数据确定各个三元组数据对应的实体和关系,并根据实体和关系构建针对数据查询指令的目标知识图谱。由此通过基于元数据构建知识图谱展示各资源数据之间的关系实现对数据的管理,有助于提高对于数据管理的效率。
请参见图9,图9是本申请实施例提供的一种基于知识图谱的数据管理装置的结构示意图。可选的,该基于知识图谱的数据管理装置可以设置于上述电子设备中。如图9所示,本实施例中所描述的基于知识图谱的数据管理装置可以包括:
获取单元901,用于获取多个资源数据,并获取所述多个资源数据中每个资源数据对应的至少一个元数据,每个元数据包括元数据项目以及所述元数据项目对应的元数据内容;
处理单元902,用于根据所述每个资源数据、所述每个元数据对应的元数据项目以及所述元数据项目对应的元数据内容构建针对所述每个资源数据的至少一个三元组数据;
接收单元903,用于接收用户客户端提交的数据查询指令,并从所述至少一个三元组数据中查询所述数据查询指令所指示的待查询的三元组数据集合;
所述处理单元902,还用于根据所述三元组数据集合中的各个三元组数据确定所述各个三元组数据对应的实体和关系,并根据所述实体和所述关系构建针对所述数据查询指令的目标知识图谱。
在一种实现方式中,所述三元组数据包括第一实体、关系和第二实体;所述处理单元902具体用于:
将所述每个资源数据确定为第一实体,并将所述元数据项目对应的元数据内容确定为第二实体,以及根据所述每个元数据对应的元数据项目确定所述第一实体与所述第二实体之间的关系;
根据所述第一实体、所述第二实体以及所述第一实体与所述第二实体之间的关系构建针对所述每个资源数据的至少一个三元组数据。
在一种实现方式中,所述处理单元902具体用于:
确定所述三元组数据集合中的每个三元组数据中的第一实体为第一顶点,并确定所述三元组数据集合中的每个三元组数据中的第二实体为第二顶点;
基于所述三元组数据集合中的每个三元组数据中所述第一实体与所述第二实体之间的关系,确定所述第一顶点和所述第二顶点之间的边;
将所述第一顶点和所述第二顶点中相同的顶点进行合并处理,得到第一目标顶点;
根据所述第一顶点、所述第二顶点、所述第一目标顶点以及各个顶点之间的边构建针对所述数据查询指令的所述目标知识图谱。
在一种实现方式中,所述资源数据包括第一资源数据和第二资源数据所述处理单元902还用于:
获取所述第一资源数据中携带的数据来源标识,所述数据来源标识用于指示所述第一资源数据中的数据的获取位置;
当所述数据来源标识用于指示所述第二资源数据中的数据时,从所述第一资源数据所对应的至少一个元数据中确定与所述数据来源标识对应的第一元数据;
确定所述第二资源数据对应的第一实体为所述第一顶点,并确定所述第一元数据包括的元数据内容对应的第二实体为所述第二顶点;
所述处理单元902具体用于:
将所述第二资源数据对应的所述第一顶点与所述第一元数据对应的所述第二顶点进行合并处理,得到所述第一目标顶点。
在一种实现方式中,所述处理单元902具体用于:
确定所述三元组数据集合中的每个三元组数据中的第一实体为第一顶点,并确定所述三元组数据集合中的每个三元组数据中的第二实体为第二顶点;
基于所述三元组数据集合中的每个三元组数据中所述第一实体与所述第二实体之间的关系,确定所述第一顶点和所述第二顶点之间的边;
将各个所述第二顶点中相同的顶点进行合并处理,得到第二目标顶点;
根据所述第一顶点、所述第二顶点、所述第二目标顶点以及各个顶点之间的边构建针对所述数据查询指令的所述目标知识图谱。
在一种实现方式中,所述资源数据包括第一表类资源数据和第二表类资源数据;所述处理单元902还用于:
当检测到所述第一表类资源数据和所述第二表类资源数据中均包括目标字段时,从所述第一表类资源数据所对应的至少一个元数据中获取与所述目标字段对应的第二元数据,并从所述第二表类资源数据所对应的至少一个元数据中获取与所述目标字段对应的第三元数据;
确定所述第二元数据中的元数据内容对应的第二实体为第二顶点,并确定所述第三元数据中的元数据内容对应的第二实体为另一第二顶点;
所述处理单元902具体用于:
将所述第二元数据对应的所述第二顶点与所述第三元数据对应的所述另一第二顶点进行合并处理,得到所述第二目标顶点。
在一种实现方式中,所述数据查询指令携带目标对象的权限信息以及用于指示待查询的三元组数据集合的标识信息;所述处理单元902具体用于:
检测所述数据查询指令携带的所述目标对象的权限信息是否指示所述目标对象具有查询所述标识信息所指示的三元组数据集合的权限;
若检测结果为所述权限信息指示所述目标对象具有查询所述标识信息所指示的三元组数据集合的权限,则从所述至少一个三元组数据中查询所述数据查询指令所指示的待查询的三元组数据集合。
请参见图10,图10是本申请实施例提供的一种电子设备的结构示意图。本实施例中所描述的电子设备,包括:处理器1001、存储器1002。可选的,该电子设备还可包括网络接口1003或供电模块等结构。上述处理器1001、存储器1002以及网络接口1003之间可以交互数据。
上述处理器1001可以是中央处理单元(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
上述网络接口1003可以包括输入设备和/或输出设备,例如该输入设备是可以是控制面板、麦克风、接收器等,输出设备可以是显示屏、发送器等,此处不一一列举。例如,在申请实施例中,该网络接口可包括接收器和发送器。
上述存储器1002可以包括只读存储器和随机存取存储器,并向处理器1001提供程序指令和数据。存储器1002的一部分还可以包括非易失性随机存取存储器。其中,所述处理器1001调用所述程序指令时用于执行:
获取多个资源数据,并获取所述多个资源数据中每个资源数据对应的至少一个元数据,每个元数据包括元数据项目以及所述元数据项目对应的元数据内容;
根据所述每个资源数据、所述每个元数据对应的元数据项目以及所述元数据项目对应的元数据内容构建针对所述每个资源数据的至少一个三元组数据;
接收用户客户端提交的数据查询指令,并从所述至少一个三元组数据中查询所述数据查询指令所指示的待查询的三元组数据集合;
根据所述三元组数据集合中的各个三元组数据确定所述各个三元组数据对应的实体和关系,并根据所述实体和所述关系构建针对所述数据查询指令的目标知识图谱。
在一种实现方式中,所述三元组数据包括第一实体、关系和第二实体;所述处理器1001具体用于:
将所述每个资源数据确定为第一实体,并将所述元数据项目对应的元数据内容确定为第二实体,以及根据所述每个元数据对应的元数据项目确定所述第一实体与所述第二实体之间的关系;
根据所述第一实体、所述第二实体以及所述第一实体与所述第二实体之间的关系构建针对所述每个资源数据的至少一个三元组数据。
在一种实现方式中,所述处理器1001具体用于:
确定所述三元组数据集合中的每个三元组数据中的第一实体为第一顶点,并确定所述三元组数据集合中的每个三元组数据中的第二实体为第二顶点;
基于所述三元组数据集合中的每个三元组数据中所述第一实体与所述第二实体之间的关系,确定所述第一顶点和所述第二顶点之间的边;
将所述第一顶点和所述第二顶点中相同的顶点进行合并处理,得到第一目标顶点;
根据所述第一顶点、所述第二顶点、所述第一目标顶点以及各个顶点之间的边构建针对所述数据查询指令的所述目标知识图谱。
在一种实现方式中,所述资源数据包括第一资源数据和第二资源数据所述处理器1001还用于:
获取所述第一资源数据中携带的数据来源标识,所述数据来源标识用于指示所述第一资源数据中的数据的获取位置;
当所述数据来源标识用于指示所述第二资源数据中的数据时,从所述第一资源数据所对应的至少一个元数据中确定与所述数据来源标识对应的第一元数据;
确定所述第二资源数据对应的第一实体为所述第一顶点,并确定所述第一元数据包括的元数据内容对应的第二实体为所述第二顶点;
所述处理器1001具体用于:
将所述第二资源数据对应的所述第一顶点与所述第一元数据对应的所述第二顶点进行合并处理,得到所述第一目标顶点。
在一种实现方式中,所述处理器1001具体用于:
确定所述三元组数据集合中的每个三元组数据中的第一实体为第一顶点,并确定所述三元组数据集合中的每个三元组数据中的第二实体为第二顶点;
基于所述三元组数据集合中的每个三元组数据中所述第一实体与所述第二实体之间的关系,确定所述第一顶点和所述第二顶点之间的边;
将各个所述第二顶点中相同的顶点进行合并处理,得到第二目标顶点;
根据所述第一顶点、所述第二顶点、所述第二目标顶点以及各个顶点之间的边构建针对所述数据查询指令的所述目标知识图谱。
在一种实现方式中,所述资源数据包括第一表类资源数据和第二表类资源数据;所述处理器1001还用于:
当检测到所述第一表类资源数据和所述第二表类资源数据中均包括目标字段时,从所述第一表类资源数据所对应的至少一个元数据中获取与所述目标字段对应的第二元数据,并从所述第二表类资源数据所对应的至少一个元数据中获取与所述目标字段对应的第三元数据;
确定所述第二元数据中的元数据内容对应的第二实体为第二顶点,并确定所述第三元数据中的元数据内容对应的第二实体为另一第二顶点;
所述处理器1001具体用于:
将所述第二元数据对应的所述第二顶点与所述第三元数据对应的所述另一第二顶点进行合并处理,得到所述第二目标顶点。
在一种实现方式中,所述数据查询指令携带目标对象的权限信息以及用于指示待查询的三元组数据集合的标识信息;所述处理器1001具体用于:
检测所述数据查询指令携带的所述目标对象的权限信息是否指示所述目标对象具有查询所述标识信息所指示的三元组数据集合的权限;
若检测结果为所述权限信息指示所述目标对象具有查询所述标识信息所指示的三元组数据集合的权限,则从所述至少一个三元组数据中查询所述数据查询指令所指示的待查询的三元组数据集合。
可选的,该程序指令被处理器执行时还可实现上述实施例中方法的其他步骤,这里不再赘述。
本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行上述方法,比如执行上述电子设备执行的方法,此处不赘述。
可选的,本申请涉及的存储介质如计算机可读存储介质可以是非易失性的,也可以是易失性的。
可选的,该计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。其中,本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
需要说明的是,对于前述的各个方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某一些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random AccessMemory,RAM)、磁盘或光盘等。
本申请实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各方法的实施例中所执行的步骤。例如,该计算机设备可以为终端,或者可以为服务器。
以上对本申请实施例所提供的一种基于知识图谱的数据管理方法、相关设备及介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种基于知识图谱的数据管理方法,其特征在于,包括:
获取多个资源数据,并获取所述多个资源数据中每个资源数据对应的至少一个元数据,每个元数据包括元数据项目以及所述元数据项目对应的元数据内容;
根据所述每个资源数据、所述每个元数据对应的元数据项目以及所述元数据项目对应的元数据内容构建针对所述每个资源数据的至少一个三元组数据;
接收用户客户端提交的数据查询指令,并从所述至少一个三元组数据中查询所述数据查询指令所指示的待查询的三元组数据集合;
根据所述三元组数据集合中的各个三元组数据确定所述各个三元组数据对应的实体和关系,并根据所述实体和所述关系构建针对所述数据查询指令的目标知识图谱。
2.根据权利要求1所述方法,其特征在于,所述三元组数据包括第一实体、关系和第二实体;所述根据所述每个资源数据、所述每个元数据对应的元数据项目以及所述元数据项目对应的元数据内容构建针对所述每个资源数据的至少一个三元组数据,包括:
将所述每个资源数据确定为第一实体,并将所述元数据项目对应的元数据内容确定为第二实体,以及根据所述每个元数据对应的元数据项目确定所述第一实体与所述第二实体之间的关系;
根据所述第一实体、所述第二实体以及所述第一实体与所述第二实体之间的关系构建针对所述每个资源数据的至少一个三元组数据。
3.根据权利要求2所述方法,其特征在于,所述根据所述三元组数据集合中的各个三元组数据确定所述各个三元组数据对应的实体和关系,并根据所述实体和所述关系构建针对所述数据查询指令的目标知识图谱,包括:
确定所述三元组数据集合中的每个三元组数据中的第一实体为第一顶点,并确定所述三元组数据集合中的每个三元组数据中的第二实体为第二顶点;
基于所述三元组数据集合中的每个三元组数据中所述第一实体与所述第二实体之间的关系,确定所述第一顶点和所述第二顶点之间的边;
将所述第一顶点和所述第二顶点中相同的顶点进行合并处理,得到第一目标顶点;
根据所述第一顶点、所述第二顶点、所述第一目标顶点以及各个顶点之间的边构建针对所述数据查询指令的所述目标知识图谱。
4.根据权利要求3所述方法,其特征在于,所述资源数据包括第一资源数据和第二资源数据;所述方法还包括:
获取所述第一资源数据中携带的数据来源标识,所述数据来源标识用于指示所述第一资源数据中的数据的获取位置;
当所述数据来源标识用于指示所述第二资源数据中的数据时,从所述第一资源数据所对应的至少一个元数据中确定与所述数据来源标识对应的第一元数据;
确定所述第二资源数据对应的第一实体为所述第一顶点,并确定所述第一元数据包括的元数据内容对应的第二实体为所述第二顶点;
所述将所述第一顶点和所述第二顶点中相同的顶点进行合并处理,得到第一目标顶点,包括:
将所述第二资源数据对应的所述第一顶点与所述第一元数据对应的所述第二顶点进行合并处理,得到所述第一目标顶点。
5.根据权利要求2所述方法,其特征在于,所述根据所述三元组数据集合中的各个三元组数据确定所述各个三元组数据对应的实体和关系,并根据所述实体和所述关系构建针对所述数据查询指令的目标知识图谱,包括:
确定所述三元组数据集合中的每个三元组数据中的第一实体为第一顶点,并确定所述三元组数据集合中的每个三元组数据中的第二实体为第二顶点;
基于所述三元组数据集合中的每个三元组数据中所述第一实体与所述第二实体之间的关系,确定所述第一顶点和所述第二顶点之间的边;
将各个所述第二顶点中相同的顶点进行合并处理,得到第二目标顶点;
根据所述第一顶点、所述第二顶点、所述第二目标顶点以及各个顶点之间的边构建针对所述数据查询指令的所述目标知识图谱。
6.根据权利要求5所述方法,其特征在于,所述资源数据包括第一表类资源数据和第二表类资源数据;所述方法还包括:
当检测到所述第一表类资源数据和所述第二表类资源数据中均包括目标字段时,从所述第一表类资源数据所对应的至少一个元数据中获取与所述目标字段对应的第二元数据,并从所述第二表类资源数据所对应的至少一个元数据中获取与所述目标字段对应的第三元数据;
确定所述第二元数据中的元数据内容对应的第二实体为第二顶点,并确定所述第三元数据中的元数据内容对应的第二实体为另一第二顶点;
所述将各个所述第二顶点中相同的顶点进行合并处理,得到第二目标顶点,包括:
将所述第二元数据对应的所述第二顶点与所述第三元数据对应的所述另一第二顶点进行合并处理,得到所述第二目标顶点。
7.根据权利要求1所述方法,其特征在于,所述数据查询指令携带目标对象的权限信息以及用于指示待查询的三元组数据集合的标识信息;所述从所述至少一个三元组数据中查询所述数据查询指令所指示的待查询的三元组数据集合,包括:
检测所述数据查询指令携带的所述目标对象的权限信息是否指示所述目标对象具有查询所述标识信息所指示的三元组数据集合的权限;
若检测结果为所述权限信息指示所述目标对象具有查询所述标识信息所指示的三元组数据集合的权限,则从所述至少一个三元组数据中查询所述数据查询指令所指示的待查询的三元组数据集合。
8.一种基于知识图谱的数据管理装置,其特征在于,包括:
获取单元,用于获取多个资源数据,并获取所述多个资源数据中每个资源数据对应的至少一个元数据,每个元数据包括元数据项目以及所述元数据项目对应的元数据内容;
处理单元,用于根据所述每个资源数据、所述每个元数据对应的元数据项目以及所述元数据项目对应的元数据内容构建针对所述每个资源数据的至少一个三元组数据;
接收单元,用于接收用户客户端提交的数据查询指令,并从所述至少一个三元组数据中查询所述数据查询指令所指示的待查询的三元组数据集合;
所述处理单元,还用于根据所述三元组数据集合中的各个三元组数据确定所述各个三元组数据对应的实体和关系,并根据所述实体和所述关系构建针对所述数据查询指令的目标知识图谱。
9.一种电子设备,其特征在于,包括处理器、存储器,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求1-7任一项所述的方法。
CN202111224839.XA 2021-10-20 2021-10-20 一种基于知识图谱的数据管理方法、相关设备及介质 Pending CN113934729A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111224839.XA CN113934729A (zh) 2021-10-20 2021-10-20 一种基于知识图谱的数据管理方法、相关设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111224839.XA CN113934729A (zh) 2021-10-20 2021-10-20 一种基于知识图谱的数据管理方法、相关设备及介质

Publications (1)

Publication Number Publication Date
CN113934729A true CN113934729A (zh) 2022-01-14

Family

ID=79280996

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111224839.XA Pending CN113934729A (zh) 2021-10-20 2021-10-20 一种基于知识图谱的数据管理方法、相关设备及介质

Country Status (1)

Country Link
CN (1) CN113934729A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115357656A (zh) * 2022-10-24 2022-11-18 太极计算机股份有限公司 基于大数据的信息处理方法、设备和存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190018849A1 (en) * 2017-07-14 2019-01-17 Guangzhou Shenma Mobile Information Technology Co., Ltd. Information query method and apparatus
US20190018839A1 (en) * 2017-07-14 2019-01-17 Guangzhou Shenma Mobile Information Technology Co., Ltd. Knowledge map-based question-answer method, device, and storage medium
CN109992672A (zh) * 2019-04-11 2019-07-09 华北科技学院 基于灾害场景的知识图谱构建方法
CN110489561A (zh) * 2019-07-12 2019-11-22 平安科技(深圳)有限公司 知识图谱构建方法、装置、计算机设备和存储介质
CN111324609A (zh) * 2020-02-17 2020-06-23 腾讯云计算(北京)有限责任公司 知识图谱构建方法、装置、电子设备及存储介质
CN111651614A (zh) * 2020-07-16 2020-09-11 宁波方太厨具有限公司 药膳知识图谱的构建方法、***、电子设备及存储介质
CN111767440A (zh) * 2020-09-03 2020-10-13 平安国际智慧城市科技股份有限公司 基于知识图谱的车辆画像方法、计算机设备和存储介质
CN112269883A (zh) * 2020-10-19 2021-01-26 北京希瑞亚斯科技有限公司 人员信息的查询方法、装置、电子设备及存储介质
CN112948547A (zh) * 2021-01-26 2021-06-11 中国石油大学(北京) 测井知识图谱构建查询方法、装置、设备及存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190018849A1 (en) * 2017-07-14 2019-01-17 Guangzhou Shenma Mobile Information Technology Co., Ltd. Information query method and apparatus
US20190018839A1 (en) * 2017-07-14 2019-01-17 Guangzhou Shenma Mobile Information Technology Co., Ltd. Knowledge map-based question-answer method, device, and storage medium
CN109992672A (zh) * 2019-04-11 2019-07-09 华北科技学院 基于灾害场景的知识图谱构建方法
CN110489561A (zh) * 2019-07-12 2019-11-22 平安科技(深圳)有限公司 知识图谱构建方法、装置、计算机设备和存储介质
CN111324609A (zh) * 2020-02-17 2020-06-23 腾讯云计算(北京)有限责任公司 知识图谱构建方法、装置、电子设备及存储介质
CN111651614A (zh) * 2020-07-16 2020-09-11 宁波方太厨具有限公司 药膳知识图谱的构建方法、***、电子设备及存储介质
CN111767440A (zh) * 2020-09-03 2020-10-13 平安国际智慧城市科技股份有限公司 基于知识图谱的车辆画像方法、计算机设备和存储介质
CN112269883A (zh) * 2020-10-19 2021-01-26 北京希瑞亚斯科技有限公司 人员信息的查询方法、装置、电子设备及存储介质
CN112948547A (zh) * 2021-01-26 2021-06-11 中国石油大学(北京) 测井知识图谱构建查询方法、装置、设备及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115357656A (zh) * 2022-10-24 2022-11-18 太极计算机股份有限公司 基于大数据的信息处理方法、设备和存储介质

Similar Documents

Publication Publication Date Title
CN110472068B (zh) 基于异构分布式知识图谱的大数据处理方法、设备及介质
US20120023586A1 (en) Determining privacy risk for database queries
CN110659282B (zh) 数据路由的构建方法、装置、计算机设备和存储介质
CN107015987B (zh) 一种更新和搜索数据库的方法及设备
US20230244653A1 (en) Semantic compliance validation for blockchain
CN111046237A (zh) 用户行为数据处理方法、装置、电子设备及可读介质
EP3188051B1 (en) Systems and methods for search template generation
US9998450B2 (en) Automatically generating certification documents
CN112579578A (zh) 基于元数据的数据质量管理方法、装置、***及服务器
CN115544183A (zh) 数据可视化方法、装置、计算机设备和存储介质
US11113267B2 (en) Enforcing path consistency in graph database path query evaluation
CN116719799A (zh) 环保数据治理方法、装置、计算机设备和存储介质
CN113934729A (zh) 一种基于知识图谱的数据管理方法、相关设备及介质
CN109947797B (zh) 一种数据检查装置及方法
CN112597168A (zh) 多源客户数据的处理方法、装置、平台及存储介质
CN112508119A (zh) 特征挖掘组合方法、装置、设备及计算机可读存储介质
CN111611230A (zh) 主数据***的建立方法、装置、计算机设备及存储介质
CN116701355A (zh) 数据视图处理方法、装置、计算机设备及可读存储介质
CN116414854A (zh) 数据资产查询方法、装置、计算机设备和存储介质
CN115481026A (zh) 测试案例的生成方法、装置、计算机设备、存储介质
US9489438B2 (en) Systems and methods for visualizing master data services information
US20200201829A1 (en) Systems and methods for compiling a database
CN112328575B (zh) 数据资产血缘生成方法、装置、电子设备
WO2019168677A1 (en) Multi-dimensional organization of data for efficient analysis
CN115423595B (zh) 文件信息处理方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination