CN111324609A - 知识图谱构建方法、装置、电子设备及存储介质 - Google Patents

知识图谱构建方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN111324609A
CN111324609A CN202010096405.5A CN202010096405A CN111324609A CN 111324609 A CN111324609 A CN 111324609A CN 202010096405 A CN202010096405 A CN 202010096405A CN 111324609 A CN111324609 A CN 111324609A
Authority
CN
China
Prior art keywords
entity
name
column
relation
association
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010096405.5A
Other languages
English (en)
Other versions
CN111324609B (zh
Inventor
熊俊宇
魏琪康
周煜
钟黎
刘黎春
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Cloud Computing Beijing Co Ltd
Original Assignee
Tencent Cloud Computing Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Cloud Computing Beijing Co Ltd filed Critical Tencent Cloud Computing Beijing Co Ltd
Priority to CN202010096405.5A priority Critical patent/CN111324609B/zh
Publication of CN111324609A publication Critical patent/CN111324609A/zh
Application granted granted Critical
Publication of CN111324609B publication Critical patent/CN111324609B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2237Vectors, bitmaps or matrices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/258Data format conversion from or to a database
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种知识图谱构建方法、装置、电子设备及存储介质,以降低创建知识图谱的难度,所述方法包括:获取至少两个实体类别分别对应的表格,各个表格包括名称列和至少一个关系列,名称列包括属于对应实体类别的实体的实体名称,各个关系列包括表格中的实体与任一其他表格中的实体之间的关联关系;根据从各个表格的名称列中提取的实体名称,分别生成各个实体名称对应的第一语句,每个第一语句用于在图形数据库中添加实体名称对应的实体节点;根据从各个表格的关系列中提取的关联关系,分别生成各个关联关系对应的第二语句,每个第二语句用于在实体节点之间添加表征关联关系的边;调用图形数据库解析生成的第一语句和第二语句,获得知识图谱。

Description

知识图谱构建方法、装置、电子设备及存储介质
技术领域
本申请涉及计算机技术领域,尤其涉及一种知识图谱构建方法、装置、电子设备及存储介质。
背景技术
知识图谱的构建通常包含比较繁杂的流程:首先,专业人员按照图形数据库的要求,将待处理数据处理成符合图形数据库导入要求的数据形式;然后,人工编写复杂的导入语句,使用导入语句将符合导入要求的待处理数据导入图形数据库,由图形数据库生成相应的知识图谱。但是,人工处理数据的过程中极易出错,数据维护难度较大,且需要用户学习图形数据库的使用方法,使用门槛非常高。
发明内容
本申请实施例提供一种知识图谱构建方法、装置、电子设备及存储介质,以降低创建知识图谱的难度,使普通用户也可以便捷高效地完成知识图谱的创建。
一方面,本申请一实施例提供了一种知识图谱构建方法,包括:
获取至少两个实体类别分别对应的表格,各个表格包括名称列和至少一个关系列,所述名称列包括属于对应实体类别的实体的实体名称,各个关系列包括表格中的实体与任一其他表格中的实体之间的关联关系;
根据从各个表格的名称列中提取的实体名称,分别生成各个实体名称对应的第一语句,每个第一语句用于在图形数据库中添加实体名称对应的实体节点;
根据从各个表格的关系列中提取的关联关系,分别生成各个关联关系对应的第二语句,每个第二语句用于在实体节点之间添加表征关联关系的边;
调用图形数据库解析生成的第一语句和第二语句,获得知识图谱。
一方面,本申请一实施例提供了一种知识图谱构建方法,包括:
响应通过文件上传页面输入的构建图谱指令,将待上传文件发送给后台服务器,所述待上传文件包括:至少两个实体类别分别对应的表格,各个表格包括名称列和至少一个关系列,所述名称列包括属于对应实体类别的实体的实体名称,各个关系列包括表格中的实体与任一其他表格中的实体之间的关联关系;
展示所述后台服务器发送的知识图谱,所述知识图谱是所述后台服务器根据所述待上传文件生成的用于描绘各个实体间的关联关系的图。
一方面,本申请一实施例提供了一种知识图谱构建装置,包括:
获取模块,用于获取至少两个实体类别分别对应的表格,各个表格包括名称列和至少一个关系列,所述名称列包括属于对应实体类别的实体的实体名称,各个关系列包括表格中的实体与任一其他表格中的实体之间的关联关系;
第一生成模块,用于根据从各个表格的名称列中提取的实体名称,分别生成各个实体名称对应的第一语句,每个第一语句用于在图形数据库中添加实体名称对应的实体节点;
第二生成模块,用于根据从各个表格的关系列中提取的关联关系,分别生成各个关联关系对应的第二语句,每个第二语句用于在实体节点之间添加表征关联关系的边;
解析模块,用于调用图形数据库解析生成的第一语句和第二语句,获得知识图谱。
可选地,其中,各个表格的表格名称为对应的实体类别的类名;各个表格中的各个名称列的第一个单元格中包括名称列标识,各个名称列中除第一个单元格以外的单元格包括实体名称;各个表格中的各个关系列的第一个单元格包括关系列标识、以及与关系列所属表格对应的实体类别具有关联关系的一个实体类别的类名,各个关系列中除第一个单元格以外的任一单元格分别包括与所述任一单元格对应的实体具有关联关系、且属于第一个单元格中的类名对应的表格中的实体名称。
可选地,所述第二生成模块还用于:通过如下方式从任一表格的任一关系列中提取关联关系:
针对所述任一关系列中除第一个单元格以外的任一单元格,从所述任一单元格所在的行和所述名称列所在的列相交的单元格中提取第一实体名称,从所述任一单元中提取第二实体名称,确定所述第一实体名称对应的实体和所述第二实体名称对应的实体之间存在关联关系。
可选地,各个关系列的第一个单元格还包括描述关联关系的关系名。
相应地,所述第二生成模块,还用于从所述任一关系列的第一个单元格中提取关系名,所述第二语句中还包括在知识图谱的边上显示的关系名。
可选地,所述装置还包括纲要图创建模块,用于:
根据各个表格对应的实体类别的类名,创建各个实体类别对应的类别节点;
针对任一表格的任一关系列,从所述任一关系列的第一个单元格中提取类名,确定提取的类名对应的实体类别和所述任一表格对应的实体类别之间存在关联关系;
在具有关联关系的类别节点之间创建边,得到表征实体类别间关联关系的纲要图。
可选地,所述装置还包括校验模块,用于在生成所述第一语句和所述第二语句之前,对各个表格中的数据进行校验,若发现表格中存在错误数据,则生成相应的出错信息。
可选地,各个表格还包括属性列,所述属性列用于存储表格中各个实体名称对应的属性描述信息;各个实体名称对应的第一语句中还包括各个实体名称对应的属性描述信息。
可选地,所述装置还包括词典生成模块,用于根据各个表格名称列中的实体名称和实体名称对应的实体类别,生成实体对应的词典文件。
可选地,各个表格还包括同义词列,所述同义词列用于存储表格中各个实体名称对应的别名。
相应地,所述装置还包括同义词生成模块,用于根据从各个表格的名称列的实体名称和同义词列中提取出的实体名称对应的别名,生成同义词文件。
可选地,其中,每个实体类别对应的表格为同一表格文件中的一个工作表。
一方面,本申请一实施例提供了一种知识图谱构建装置,包括:
上传模块,用于响应通过文件上传页面输入的构建图谱指令,将待上传文件发送给后台服务器,所述待上传文件包括:至少两个实体类别分别对应的表格,各个表格包括名称列和至少一个关系列,所述名称列包括属于对应实体类别的实体的实体名称,各个关系列包括表格中的实体与任一其他表格中的实体之间的关联关系;
展示模块,用于展示所述后台服务器发送的知识图谱,所述知识图谱是所述后台服务器根据所述待上传文件生成的用于描绘各个实体间的关联关系的图。
可选地,所述展示模块,还用于:
在接收到所述后台服务器发送的出错信息后,展示出错提示信息,所述出错信息包括存在错误数据的错误表格;
响应针对所述错误提示信息的操作,展示所述错误表格,其中,所述错误表格中的错误数据以特殊状态显示。
一方面,本申请一实施例提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,处理器执行计算机程序时实现上述任一种方法的步骤。
一方面,本申请一实施例提供了一种计算机可读存储介质,其上存储有计算机程序指令,该计算机程序指令被处理器执行时实现上述任一种方法的步骤。
一方面,本申请一实施例提供了一种计算机程序产品,所述计算机程序产品包括存储在计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,所述程序指令被处理器执行时实现上述任一种方法的步骤。
本申请实施例提供的知识图谱构建方法、装置、电子设备及存储介质,用户只需要按照预设的格式将数据输入表格,并将表格上传至后台服务器或终端设备中的知识图谱构建工具,该知识图谱构建工具即可自动从用户编辑的各个表格的名称列和关系列中提取出实体名称和关联关系,自动生成创建节点和边的语句,并调用图形数据库完成知识图谱的创建,避免了创建知识图谱时复杂的数据操作以及导入语句编写等工作,使得非知识图谱相关专业的人士也能够便捷高效地创建知识图谱。此外,表格的格式简单直观,易于数据的维护和修改,不懂知识图谱的用户也能够很快完成数据的整理,大大降低了使用门槛。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,显而易见地,下面所介绍的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1A为利用Neo4j创建知识图谱时所需准备的部分文件;
图1B为一个csv类型的实体文件的内部数据的示意图;
图1C为一个csv类型的关系文件的内部数据的示意图;
图1D为用户手动编写的导入语句的示意图;
图2为本申请实施例提供的知识图谱构建方法的应用场景示意图;
图3为本申请一实施例提供的知识图谱构建方法的流程示意图;
图4为本申请一实施例提供的用于构建知识图谱的表格的示意图;
图5为通过本申请一实施例提供的知识图谱构建方法获得的知识图谱的局部示意图;
图6为本申请一实施例提供的知识图谱构建方法的流程示意图;
图7为通过本申请一实施例提供的知识图谱构建方法获得的纲要图;
图8为本申请一实施例提供的知识图谱构建方法的流程示意图;
图9A为本申请一实施例提供的文件上传工具的界面示意图;
图9B为本申请一实施例提供的文件上传工具的界面示意图;
图10为本申请一实施例提供的知识图谱构建装置的结构示意图;
图11为本申请一实施例提供的知识图谱构建装置的结构示意图;
图12为本申请一实施例提供的电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
为了方便理解,下面对本申请实施例中涉及的名词进行解释:
图形数据库:是NoSQL数据库的一种类型,它应用图形理论存储实体之间的关系信息。图形数据库是一种非关系型数据库,它应用图形理论存储实体之间的关系信息。常见的图形数据库有Neo4j、FlockDB、AllegroGrap、GraphDB、InfiniteGraph等。
知识图谱(Knowledge Graph):在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。知识图谱中的每个节点代表一个实体,通过节点间的边表示实体之间的关联关系。
附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。
在具体实践过程中,知识图谱的构建通常包含比较繁杂的流程:首先,专业人员按照图形数据库的要求,将待处理数据处理成符合图形数据库导入要求的数据形式;然后,人工编写复杂的导入语句,使用导入语句将符合导入要求的待处理数据导入图形数据库,由图形数据库生成相应的知识图谱。参考图1A,为利用Neo4j创建一个商业地产的知识图谱时所需准备的部分文件,其中,每个后缀为“.csv”的文件代表着实体文件和关系文件,其中实体文件为记录某一实体类别包含的所有实体的相关信息的文件,关系文件为记录实体间关系的文件,例如,实体文件“merchant.csv”中记录有所有商家的相关信息,文件“statium.csv”中记录有所有展馆的信息,关系文件“merchant_to_statium.csv”中记录有商家和展馆之间的关系,即关系文件“merchant_to_statium.csv”中记录了每个商家所处的展馆。参考图1B,实体文件“merchant.csv”中的一行数据对应一个商家,每一行数据具体包含:编号、每个商家的名称、所属类别、所处展馆、所处楼层、商家简介等信息。参考图1C,关系文件“merchant_to_statium.csv”中每一行包括“merchant.csv”文件中的一个商家的编号和“statium.csv”文件中的一个展馆的编号,例如,第一行数据“1,1”表示:“merchant.csv”文件中编号为“1”的商家“HLKD”和“statium.csv”文件中编号为“2”的展馆“二号馆”之间具有关联关系。基于图1B和图1C可知,当需要绘制的知识图谱包含的实体类别、实体、以及实体间的关联关系很多时,用户需要编辑的文件数量较大,构建效率十分低,且现有的数据组织方式过于复杂,而整理数据时难免会出现一些不合法的字符以及一些不易察觉的数据缺失、数据错误或格式错误,这会导致构建图谱失败,但是用户又很难检查出文件中的错误,进一步减低了构建效率,同时,复杂的数据组织方式导致数据不易维护和更改。在准备完所需要的数据后,还需要用户手动编写相应的导入语句,导入语句的形式可参考图1D,这需要用户了解图形数据库的使用方法以及数据组织形式,且具备一定的编程能力,此外,当需要绘制的知识图谱包含的实体类别、实体、以及实体间的关联关系很多时,需要编写和执行很多复杂的导入语句,一旦编写的导入语句出错,就需要花费很多的时间和精力查找出错误并修改。因此,现有的知识图谱构建方法,在处理数据的过程中极易出错,数据维护和修改的难度较大,且需要用户学习图形数据库的使用方法,创建知识图谱的效率低且使用门槛非常高。
为此,本申请提出了一种知识图谱构建方法,该方法预先规定了一种通过表格实现的简单直观的数据组织形式,具体的,可通过一个表格存储一个实体类别所包含的实体的相关信息,例如,表格中的一行对应一个实体,表格中可包括名称列和至少一个关系列,名称列包括属于对应实体类别的实体的实体名称,各个关系列包括表格中的实体与某一其他表格中的实体之间的关联关系,用户可按照上述格式将各个实体的信息添加到相应表格的相应单元格中,以将杂乱的数据整理成符合要求的形式。然后,知识图谱构建工具获取用户整理的多个实体类别对应的表格,根据从各个表格的名称列中提取的实体名称,分别生成各个实体名称对应的第一语句,并根据从各个表格的关系列中提取的关联关系,分别生成各个关联关系对应的第二语句,调用图形数据库解析生成的第一语句和第二语句,获得知识图谱,其中,每个第一语句用于在图形数据库中添加实体名称对应的实体节点,每个第二语句用于在实体节点之间添加表征关联关系的边。为此,用户只需要按照预设的格式编辑表格,知识图谱构建工具即可自动从用户编辑的各个表格的名称列和关系列中提取出实体名称和关联关系,自动生成创建节点和边的语句,并调用图形数据库完成知识图谱的创建,使得非知识图谱相关专业的人士也能够便捷高效地创建知识图谱,避免了创建知识图谱时复杂的数据操作以及导入语句编写等工作,且表格的格式简单直观,易于数据的维护和修改,不懂知识图谱的用户也能够很快完成数据的整理,大大降低了使用门槛。
在介绍完本申请实施例的设计思想之后,下面对本申请实施例的技术方案能够适用的应用场景做一些简单介绍,需要说明的是,以下介绍的应用场景仅用于说明本申请实施例而非限定。在具体实施时,可以根据实际需要灵活地应用本申请实施例提供的技术方案。
参考图2,其为本申请实施例提供的知识图谱构建方法的应用场景示意图。该应用场景包括终端设备201和后台服务器202。其中,终端设备201和后台服务器202之间可通过无线或有线网络连接,终端设备201包括但不限于桌面计算机、移动电话、移动电脑、平板电脑等电子设备。后台服务器202可以是一台服务器、若干台服务器组成的服务器集群或云计算中心。终端设备201中安装有可编辑表格的应用程序,如EXCEL,用户可通过该应用程序为每个实体类别创建一个表格,并将各个实体的相关信息填写到对应的表格中,在完成各个实体类别对应的表格后,可通过后台服务器202提供的文件上传工具将表格发送给后台服务器202。后台服务器202内安装有知识图谱构建工具,知识图谱构建工具解析表格中的数据,以生成在图形数据库中添加节点和边的导入语句,并调用图形数据库解析生成的导入语句,获得知识图谱,后台服务器202将该知识图谱发送给终端设备201,以便用户通过终端设备201查看生成的知识图谱。
当然,知识图谱构建工具也可以安装在终端设备201内,以通过终端设备201完成知识图谱的构建。用户在终端设备201中完成表格的编辑后,可启动知识图谱构建工具,通过知识图谱构建工具指定需要解析的表格,知识图谱构建工具获取需要解析的表格并进行解析,生成在图形数据库中添加节点和边的导入语句,并调用图形数据库解析生成的导入语句,获得知识图谱,通过终端设备201展示获得的知识图谱。
当然,本申请实施例提供的方法并不限用于图2所示的应用场景中,还可以用于其它可能的应用场景,本申请实施例并不进行限制。对于图2所示的应用场景的各个设备所能实现的功能将在后续的方法实施例中一并进行描述,在此先不过多赘述。
为进一步说明本申请实施例提供的技术方案,下面结合附图以及具体实施方式对此进行详细的说明。虽然本申请实施例提供了如下述实施例或附图所示的方法操作步骤,但基于常规或者无需创造性的劳动在所述方法中可以包括更多或者更少的操作步骤。在逻辑上不存在必要因果关系的步骤中,这些步骤的执行顺序不限于本申请实施例提供的执行顺序。
下面结合图2所示的应用场景,对本申请实施例提供的技术方案进行说明。
参考图3,本申请实施例提供了一种知识图谱构建方法,可应用于图2所示的终端设备或后台服务器,具体包括以下步骤:
S301、获取至少两个实体类别分别对应的表格,各个表格包括名称列和至少一个关系列,名称列包括属于对应实体类别的实体的实体名称,各个关系列包括表格中的实体与任一其他表格中的实体之间的关联关系。
具体实施时,一个表格对应一个实体类别,即属于同一实体类别的多个实体的相关信息存储在同一表格中,表格中的一行单元格用于存储一个实体的相关信息。实体的相关信息至少包括:实体名称、以及该实体与其他实体类别中的实体的关联关系,当然,实体的相关信息可根据应用场景确定,例如还可以包括实体的别名和属性描述信息等,不限于上述列举的内容。
为了快速便捷地从对表格中提取需要的信息,预先在表格中规定了每一类信息对应的列,通过专属的列存储不同类型的信息,例如,名称列用于存储实体的实体名称,关系列用于存储实体的关联关系,属性列用于存储表格中各个实体名称对应的属性描述信息,这样用户可以更加清晰直观地了解表格中的数据形式,协助用户快速完成数据的录入,同时降低了表格中数据的复杂度,这样可以从表格的指定列中提取对应的信息。
需要说明的是,一个关系列中只存储固定的两个实体类别的实体之间的关联关系。例如,针对实体类别A,可以规定实体类别A对应表格的第一列用于存储属于实体类别A的实体的实体名称,第二列用于存储各个实体对应的属性描述信息,第三列用于存储各个实体与实体类别B中的实体的关联关系,第四列用于存储各个实体与实体类别C中的实体的关联关系。
以某一商业地产中各商家的分布情况为例,表格的具体格式可参考图4,该应用场景中需要统计的实体类别包括:商家(Merchant)、展馆(Statium)、位置(Location)、经营类别(GFirst)和经营子类别(Genre)。图4所示的表格为实体类别“商家”所对应的表格,每一行单元格中记录了一个商家的相关信息,第一列为商家的名称,第二列为商家的别名,第三列为商家与经营子类别之间的关联关系,第四列为商家与展馆之间的关联关系,第五列为商家的属性描述信息,第六列为商家与位置之间的关联关系,其中,第一列即为名称列,第三列、第四列和第六列即为关系列,第五列即为属性列。以表格中的第一行数据为例,该商家的名称为“HLKD”,别名为“KD”,所属的经营子类别为“涂料墙漆”,位于二号馆,具***置为二号馆1楼。
实际应用中,可预先确定表格中各个列的定义,用户也可以通过在各个列的第一个单元格中输入相应的预设字段实现对各个列的自由设定,对此本申请实施例不作限定。其中,不同类型的列对应不同的预设字段,以图4为例,名称列对应的预设字段可以是“name”,属性列对应的预设字段可以是“property”,别名列对应的预设字段可以是“synonym”,关系列对应的预设字段可以是“relationTo XX”,其中“XX”代表与该关系列所属表格对应的实体类别存在关联关系的实体类别,用户可自行填写“XX”的内容,但是,XX必须是实体类别的类名,例如Merchant对应的表格的第四列的预设字段为“relationToStatium”,表示第四列用于存储商家与展馆之间的关联关系。
S302、根据从各个表格的名称列中提取的实体名称,分别生成各个实体名称对应的第一语句,每个第一语句用于在图形数据库中添加实体名称对应的实体节点。
S303、根据从各个表格的关系列中提取的关联关系,分别生成各个关联关系对应的第二语句,每个第二语句用于在实体节点之间添加表征关联关系的边。
具体实施时,一个实体名称对应生成一个第一语句,一个关联关系对应生成一个第二语句。例如,总共提取了100个实体名称和200个关联关系,则生成100个第一语句和200个第二语句。
具体实施时,可根据对表格中各个列的定义,识别出表格中的名称列、关系列、属性列等。例如,预先确定表格中的第一列为名称列,第二列为关系列,则从第一列中提取实体名称,从第二列中提取关联关系。当然,还可以根据预设字段识别出表格中的名称列、关系列、属性列等。
具体实施时,不同的图形数据库的导入语句的格式不同,因此,第一语句和第二语句的格式可根据图形数据库的要求确定,本申请实施例不作限定。
以neo4j为例,从图4所示的表格Merchant中确定出第一列为名称列,从名称列的各个单元格中提取出各个商家的实体名称,提取出的实体名称包括“HLKD”、“YSWY”、“JYLYJ”等,需要为每个实体名称创建一个实体节点,即为每个实体名称生成一个创建实体节点的第一语句,以实体名称“HLKD”为例,生成的第一语句可以是:CREATE(n:Merchant{name:'HLKD'},neo4j获取到该第一语句后,创建一个名为“HLKD”的实体节点。从图4所示的表格Merchant中确定出第三列为关系列,根据第三列的预设字段“relationTo Genre”,可确定第三列存储的是商家和经营子类别之间的关联关系,从第三列的各个单元格中提取出关联关系。以表格Merchant中的第一行数据为例,第一行数据为商家“HLKD”对应的相关信息,且第一行的第三列中的信息为“涂料墙漆”,其中,“涂料墙漆”为经营子类别(Genre)中的一个实体节点,因此,确定实体节点“HLKD”和实体节点“涂料墙漆”之间具有关联关系,生成在实体节点“HLKD”和实体节点“涂料墙漆”之间添加边的第二语句,例如创建边的第二语句可以是:
MATCH(a:Merchant),(b:Genre)
WHERE a.name='HLKD'AND b.name='涂料墙漆'
CREATE(a)>(b)。
neo4j获取到该第二语句后,在实体节点“HLKD”和实体节点“涂料墙漆”之间创建一条边,以此表示这两个实体节点之间存在关联关系。
S304、调用图形数据库解析生成的第一语句和第二语句,获得知识图谱。
具体实施时,后台服务器或终端设备将生成的第一语句和第二语句输入图形数据库,图形数据库通过解析第一语句创建实体节点,并通过解析第二语句在实体节点之间创建边,从而完成知识图谱的创建。其中,第一语句和第二语句均是根据图形数据库对导入语句的要求生成的,图形数据库根据第一语句和第二语句创建知识图谱的具体过程由图形数据库执行,具体过程为现有技术,不再赘述。
通过本申请实施例的知识图谱构建方法,用户只需要按照预设的格式将数据输入表格,并将表格上传至后台服务器或终端设备中的知识图谱构建工具,该知识图谱构建工具即可自动从用户编辑的各个表格的名称列和关系列中提取出实体名称和关联关系,自动生成创建节点和边的语句,并调用图形数据库完成知识图谱的创建,避免了创建知识图谱时复杂的数据操作以及导入语句编写等工作,使得非知识图谱相关专业的人士也能够便捷高效地创建知识图谱。此外,表格的格式简单直观,易于数据的维护和修改,不懂知识图谱的用户也能够很快完成数据的整理,大大降低了使用门槛。
为了协助用户更加方便地填写和维护表格中的信息,下面对表格的格式做出进一步的限定。
例如,用于绘制同一知识图谱的各个表格的表格名称为对应的实体类别的类名。仍以某一商业地产中各商家的分布情况为例,实体类别包括:商家(Merchant)、展馆(Statium)、位置(Location)、经营类别(GFirst)和经营子类别(Genre),参考图4,商家对应的表格的名称为“Merchant”,展馆对应的表格的名称为“Statium”,位置对应的表格的名称为“Location”,经营类别对应的表格的名称为“GFirst”,经营子类别对应的表格的名称为“Genre”。这样,知识图谱创建工具只需要根据表格名称即可确定表格所对应的实体类别,也方便用户对表进行维护。
又如,用于绘制同一知识图谱的各个表格中的各个名称列的第一个单元格中包括名称列标识,各个名称列中除第一个单元格以外的单元格包括实体名称。
再如,用于绘制同一知识图谱的各个表格中的各个关系列的第一个单元格包括关系列标识、以及与关系列所属表格对应的实体类别具有关联关系的一个实体类别的类名,各个关系列中除第一个单元格以外的任一单元格分别包括与任一单元格对应的实体具有关联关系、且属于第一个单元格中的类名对应的表格中的实体名称。
具体可参考图4,表格的第一行用于填写各个列对应的标识,通过标识可以快速识别各个列存储的数据类型。例如,名称列标识可以是预设字段“name”,关系列标识可以是预设字段“relationTo”,此外,属性列标识可以是预设字段“property”,别名列标识可以是预设字段“synonym”。其中,关系列标识“relationTo”和字符“_”之间的字段为与表格对应的实体类别存在关联关系的实体类别的类名,用户可自行填写,例如Merchan表格的第三列的第一个单元格中的字段为“relationTo Genre_是什么经营子类别”,表示第三列用于存储商家与经营子类别之间的关联关系,“_”之后的内容即为描述关联关系的关系名,关系名可以由用户自由填写,以方便用户获知第三列所表示关联关系的具体含义,此处通过字段“是什么经营子类别”,用户即可快速获知第三列表示的是“该商家是何种经营子类别”;例如,Merchant表格的第四列的第一个单元格中的字段为“relationTo Stadium_位于哪个馆”,表示第四列用于存储商家与展馆之间的关联关系,同样“_”之后的内容可以由用户自由填写,此处通过字段“位于哪个馆”,用户即可快速获知第四列表示的是“该商家位于哪个馆”。按照图4所示的方式在表格第一行的各个列中填写好对应的字段后,只需要按照对各个列的定义,将各个商家的数据填写到对应行的各个单元格中即可。
基于此,用户可根据上述这些字段,按照一定的约定格式编辑表格,表格中的具体内容可根据不同领域的数据进行调整,使得整理数据的方式更加灵活、通用,同时可提高前期整理数据的效率,还可以提高后期对数据进行修改、纠错的成本。
基于上述对表格格式的限定,可通过如下方式从任一表格的任一关系列中提取关联关系:针对任一关系列中除第一个单元格以外的任一单元格,从任一单元格所在的行和名称列所在的列相交的单元格中提取第一实体名称,从任一单元中提取第二实体名称,确定第一实体名称对应的实体和第二实体名称对应的实体之间存在关联关系。
以图4所示的表格Merchant为例,根据表格第一行第一列的字段可以确定第一列为名称列,因此,从第一列的各个单元格中提取出各个商家的实体名称。根据表格第一行第二列的字段可以确定第三列为关系列,且第三列存储的是商家和经营子类别之间的关联关系,针对第三列中的第n行的单元格Cn,3,j将该单元格Cn,3中的实体名称作为第二实体名称,将第n行第一列的单元格C1,3中的实体名称作为第一实体名称,确定该第一实体名称对应的实体和该第二实体名称对应的实体之间存在关联关系,进而根据该关联关系,生成在第一实体名称对应的实体节点和第二实体名称对应的实体节点之间添加表征关联关系的边的第二语句。以图4所示表格的第一行数据为例,说明从表格中提取关联关系的方法,从第一行第一列中提取“HLKD”作为第一实体名称,从第一行第三列中提取“涂料墙漆”作为第二实体名称,确定该第一实体名称“HLKD”对应的实体和该第二实体名称“涂料墙漆”对应的实体之间存在关联关系,即需要再实体节点“HLKD”和“涂料墙漆”之间创建一条边。基于上述方式,依次提取出所有关系列中存储的关联关系。
因此,本申请提供的知识图谱创建方法具有很好的通用型和复用性,不同行业领域的用户只需要按照约定的简单的格式字段对数据进行编辑,就可以自动构建相应的知识图谱,提高了构建效率。
进一步地,基于表格中各关系列的第一个单元格中的描述关联关系的关系名,本申请实施例的知识图谱构建方法还包括如下步骤:从任一关系列的第一个单元格中提取关系名,第二语句中还包括在知识图谱的边上显示的关系名。
以neo4j为例,图4所示的表格Merchant中第三列的第一各单元格中的信息为“relationTo Genre_是什么经营子类别”,表示第三列为关系列,根据第三列的预设字段“relationTo Genre”,可确定第三列存储的是商家和经营子类别之间的关联关系,关系名为“是什么经营子类型”。以表格Merchant中的第一行数据为例,第一行数据为商家“HLKD”对应的相关信息,且第一行的第三列中的信息为“涂料墙漆”,其中,“涂料墙漆”为经营子类别中的一个实体节点,因此,确定实体节点“HLKD”和实体节点“涂料墙漆”之间具有关联关系,生成在实体节点“HLKD”和实体节点“涂料墙漆”之间添加边的第二语句,例如创建边的第二语句可以是:
MATCH(a:Merchant),(b:Genre)
WHERE a.name='HLKD'AND b.name='涂料墙漆'
CREATE(a)-[r:是什么经营子类别]->(b)。
neo4j获取到该第二语句后,在实体节点“HLKD”和实体节点“涂料墙漆”之间创建一条边,并在创建的边上显示关系名“是什么经营子类别”,以此向用户展示这两个实体节点之间存在的关联关系,具体显示方式可参考图5。图5为知识图谱的局部示意图,图5中每个圈代表一个实体节点,圈中显示的字段为实体节点的实体名称,实体节点之间的连线即为表示实体节点间关联关系的边,边上显示的内容即为边对应的关系名。
基于上述对表格格式的限定,参考图6,本申请实施例的知识图谱创建方法还包括如下步骤:
S601、根据各个表格对应的实体类别的类名,创建各个实体类别对应的类别节点。
具体实施时,用于绘制同一知识图谱的各个表格的表格名称为对应的实体类别的类名,因此,知识图谱创建工具可获取各个表格的表格名称,从而获得各个表格对应的实体类别的类名。然后,由知识图谱工具为每个实体类别创建类别节点,每个类别节点的名称为其对应的类名。参考图7,其给出了创建完成的类别节点的示意图,图7中每个圈代表一个类别节点,圈中显示的字段为类别节点的类名。
S602、针对任一表格的任一关系列,从任一关系列的第一个单元格中提取类名,确定提取的类名对应的实体类别和任一表格对应的实体类别之间存在关联关系。
具体实施时,以图4所示的Merchant表格为例,该表格对应的实体类别的类名为Merchant,从关系列的第一个单元的字段中提取出属于类名的字段,其中“relationTo”和字符“_”之间的字段即为需要提取的类名,即可确定Merchant和从关系列中提取的类名对应的实体类别之间存储关联关系。以图4中的第三列为例,获取第三列第一个单元格中关系列表示“relationTo”和字符“_”之间的字段“Genre”,以此确定实体类别Merchant和实体类别Genre之间存在关联关系。以图4中的第四列为例,获取第四列第一个单元格中关系列表示“relationTo”和字符“_”之间的字段“Stadium”,以此确定实体类别Merchant和实体类别Stadium之间存在关联关系。对于图4所示的Merchant表格中的其他关系列以及其他实体类别对应的表格中的关系列,同样可采用上述方式确定各个实体类别间的关联关系,不再赘述。
S603、在具有关联关系的类别节点之间创建边,得到表征实体类别间关联关系的纲要图(Schema)。
具体实施时,根据步骤S602确定出的关联关系,在具有关联关系的类别节点之间创建边,以将具有关联关系的类别节点连接在一起,得到对应的纲要图,使得用户可通过纲要图清晰直观地了解各个实体类别之间的关系。
具体实施时,连接类别节点之间的边可以是有向边。此时,从表格中提取的关联关系为有向关联关系,即步骤S602具体包括:针对任一表格的任一关系列,从任一关系列的第一个单元格中提取类名,确定提取的类名对应的实体类别A和任一表格对应的实体类别B之间的关联关系为:A指向B。相应地,在创建类别节点之间的边时,在实体类别A对应的实体节点和实体类别B对应的类别节点之间创建一条有向边,该有向边的方向为:A指向B,即根据从表格中提取到的有向关联关系,在类别节点之间创建对应的有向边。
具体实施时,还可以从关系列中提取出关系名,将关系名显示在纲要图中对应的边上,其中,关系列的第一个单元格中字符“_”之后的字段即为关系名。
图7为基于图4所示的表格创建的纲要图,基于图4所示的表格可以确定出以下几个有向关联关系:(1)Merchant指向Genre,对应关系名为“是什么经营子类别”,(2)Merchant指向Stadium,对应关系名为“位于哪个馆”,(3)Merchant指向Location,对应关系名为“在什么位置”,(4)Location指向Stadium,对应的关系名为“位于哪个馆”,(5)Genre指向Location,对应关系名为“处于”,(6)Genre指向GFirst,对应关系名为“属于哪个经营类别”,其中,(4)、(5)以及(6)对应的关联关系未在图4所示的表格中示出。根据确定出的有向关联关系,在相应的类别节点之间创建有向边,并在创建的有向边上显示对应的关系名,获得的纲要图参考图7。
为方便描述,将基于表格中的关联关系创建的边称为正向边。在图7的基础上,可为纲要图中的每一条正向边创建一条对应的反向边,其中,每一条反向边的指向方向与其对应的正向边的指向方向相反,每一条反向边上除了显示其对应的正向边的关系名以外,还显示有反向标识符,以便与正向边进行区分。例如,反向标识符可以是图7所示的显示在关系名之前的前缀字符“r”,显示有前缀字符“r”的边即为反向边,没有显示前缀字符“r”的边即为正向边。
本申请实施例的知识图谱创建方法,可自动根据表格生成表征实体类别之间关联关系的纲要图,在编辑图数据时,用户不需要事先构思知识图谱的Schema模式,只需要按照数据间的关系填写表格即可,减少了用户的工作量。
在上述任一实施方式的基础上,本申请提供的知识图谱构建方法还包括如下步骤:在生成第一语句和第二语句之前,对各个表格中的数据进行校验,若发现表格中存在错误数据,则生成相应的出错信息。
具体实施时,可在用户上传的所有表格均通过校验后,再执行上述步骤S302-S304,防止构建失败。
具体实施时,知识图谱构建工具可对各个表格中的数据进行校验,例如校验文件格式、文件大小等信息,校验通过才可以对表格进行解析,并生成第一语句和第二语句。若上传的文件格式不是指定的格式,如不是EXCEL,则确定校验不通过,此时可生成提示文件格式错误的出错信息,并将出错信息展示给用户,以使用户根据出错信息修改上传的文件。若上传的文件的文件大小小于最小阈值或者超过最大阈值,则确定校验不通过,此时可生成提示文件过小或过大的出错信息,并将出错信息展示给用户,以使用户根据出错信息修改上传的文件。
进一步地,还可以通过如下方式进行数据校验:针对任一表格中的任一关系列,提取该关系列的第一个单元格中的类名,若提取的类名与任一表格的类名均不同,则确定该表格中存在错误数据,并将该关系列的第一个单元格中的类名标记为错误数据,还可以将该表格标记为错误表格。此时生成的出错信息包括错误表格和错误数据。终端设备在收到出错信息后,可展示错误表格,并以特殊状态显示错误表格中的错误数据,特殊状态可以是对错误数据进行高亮显示、加粗显示或用提示框进行框选等。
进一步地,还可以通过如下方式进行数据校验:针对任一表格中的任一关系列,确定该关系列的第一个单元格中的类名对应的目标表格,若该关系列中的实体名称未出现在对应的目标表格中,则确定该表格中存在错误数据,并将该关系列中未出现在对应的目标表格中的实体名称标记为错误数据,还可以将该表格标记为错误表格。此时生成的出错信息包括错误表格和错误数据。终端设备在收到出错信息后,可展示错误表格,并以特殊状态显示错误表格中的错误数据,特殊状态可以是对错误数据进行高亮显示、加粗显示或用提示框进行框选等。
实际应用中,进行数据校验的方式不限于上述列举的多种方式。
进一步地,还可以按照约定的转换方式,对表格中的一些数据进行转换,例如将日期、数字等转换为统一的标准化格式。此外,还可以对表格中出现的一些非法字符进行替换,例如,将英文格式下的标点符号(如顿号、逗号)替换成中文格式下的标点符号,这样可以防止构建失败。
在上述任一实施方式的基础上,还可以从表格的属性列中提取各个实体名称对应的属性描述信息,根据从各个表格的名称列中提取的实体名称以及实体名称对应的属性描述信息,分别生成各个实体名称对应的第一语句,每个第一语句用于在图形数据库中添加实体名称对应的实体节点,且各个实体名称对应的第一语句中还包括各个实体名称对应的属性描述信息。
以neo4j为例,从图4所示的表格Merchant中确定出第一列为名称列,从名称列的各个单元格中提取出各个商家的实体名称,并从属性列中提取各个实体名称对应的属性描述信息,提取出的实体名称包括“HLKD”、“YSWY”、“JYLYJ”等,需要为每个实体名称创建一个实体节点,即为每个实体名称生成一个创建实体节点的第一语句,以实体名称“HLKD”为例,生成的第一语句可以是:(n:Merchant{name:'荷兰蔻帝',描述:'#####'})。这样,在用户查看知识图谱时,用户可通过点击知识图谱中的实体节点,查看实体节点对应的属性描述信息。
在上述任一实施方式的基础上,本申请提供的知识图谱构建方法还包括如下步骤:根据各个表格名称列中的实体名称和实体名称对应的实体类别,生成实体对应的词典文件。
具体实施时,词典文件中包括各个表格中的所有实体的实体名称和实体类别,词典文件可按实体类别对所有实体的实体名称进行分类存储,方便后续应用查询时,可通过词典文件快速实现分类展示和查询。
在上述任一实施方式的基础上,各个表格还包括同义词列,同义词列用于存储表格中各个实体名称对应的别名。以图4为例,其中第二列即为各个商家的别名,即第二列为同义词列,以表格中的第一个商家为例,该商家的实体名称为“HLKD”,别名为“KD”。
基于此,本申请提供的知识图谱构建方法还包括如下步骤:根据从各个表格的名称列的实体名称和同义词列中提取出的实体名称对应的别名,生成同义词文件。
具体实施时,将从各个表格中提取出的各个实体的实体名称和别名作为同义词关联存储在同义词文件中。例如,图4所示表格中的第一个商家的实体名称“HLKD”和其别名“KD”作为同义词关联存储到同义词文件中,第二个商家的实体名称“YSWY”和其别名“YS”作为同义词关联存储到同义词文件中,以此类推。这样,在后续查询过程中,若用户输入的是商家的别名时,可通过同义词文件确定该输入的别名所对应的商家,进而将该商家的信息反馈给用户。
具体实施时,对于同一商家,同义词列中可以存储多个别名,各个别名之间可通过指定符号隔开,例如通过逗号或分号等隔开。当同一商家存在多个别名时,将该商家的实体名称和对应的多个别名作为同义词,并关联存储到同义词文件中,查询时,用户只需要输入该商家的任一别名,即可通过同义词文件确定该商家,进而将该商家的信息反馈给用户。
在上述任一实施方式的基础上,在创建一个知识图谱过程中,每个实体类别对应的表格可以是同一表格文件中的一个工作表(sheet),并以实体类别的类名对其对应的工作表进行命名。以图4为例,表格文件中共创建了5个工作表,第一个工作表的名称为Genre,用于存储经营子类别中的实体的相关信息,第二个工作表的名称为GFirst,用于存储经营类别中的实体的相关信息,第三个工作表的名称为Location,用于存储位置类别中的实体的相关信息,第四个工作表的名称为Statium,用于存储展馆类别中的实体的相关信息,第五个工作表的名称为Merchant,用于存储商家类别中的实体的相关信息。在提取表格名称时,提取表格文件中的每个工作表的名称,从而获得各个工作表对应的实体类别的类名。
这样,用户只需要创建一个表格文件,将该知识图谱相关的信息都存储在这一个表格文件中,上传数据时也只需要上传一个表格文件,防止出现表格过多导致数据丢失的情况,使得数据维护更加方便高效。
参考图8,本申请实施例还提供了一种知识图谱构建方法,可应用于图2所示的终端设备,具体包括如下步骤:
S801、响应通过文件上传页面输入的构建图谱指令,将待上传文件发送给后台服务器,待上传文件包括:至少两个实体类别分别对应的表格,各个表格包括名称列和至少一个关系列,名称列包括属于对应实体类别的实体的实体名称,各个关系列包括表格中的实体与任一其他表格中的实体之间的关联关系。
具体实施时,用户可通过终端设备中安装的可编辑表格的应用程序,如EXCEL,为每个实体类别创建一个表格,并将各个实体的相关信息填写到对应的表格中。在完成各个实体类别对应的表格后,用户可通过后台服务器提供的文件上传工具与后台服务器连接,并将表格发送给后台服务器。
具体实施时,文件上传工具的界面可参考图9A,用户通过点击浏览按钮,从终端设备本地存储的文件中选择待上传文件,点击提交按钮,文件上传工具会对待上传文件进行初步的校验,如校验文件格式、文件大小等信息,校验通过后生成校验通过的提示信息,此时用户可点击构建图谱按钮,文件上传工具收到构建图谱指令后,将待上传文件发送给后台服务器。若待上传文件的文件格式不是指定的格式,如不是EXCEL,则确定校验不通过,此时可生成提示文件格式错误的出错信息,并将出错信息展示给用户,以使用户根据出错信息修改待上传文件的文件格式。若上传的文件的文件大小小于最小阈值或者超过最大阈值,则确定校验不通过,此时可生成用于提示待长传文件过小或过大的出错信息,并将出错信息展示给用户,以使用户根据出错信息修改待上传文件或重新选择待上传文件。
后台服务器收到待上传文件后,根据从各个表格的名称列中提取的实体名称,分别生成各个实体名称对应的第一语句,每个第一语句用于在图形数据库中添加实体名称对应的实体节点,根据从各个表格的关系列中提取的关联关系,分别生成各个关联关系对应的第二语句,每个第二语句用于在实体节点之间添加表征关联关系的边,并调用图形数据库解析生成的第一语句和第二语句,获得知识图谱。具体实施方式可参考步骤S301-S304,不再赘述。后台服务器将获得的知识图谱发送给终端设备。
S802、展示后台服务器发送的知识图谱,该知识图谱是后台服务器根据待上传文件生成的用于描绘各个实体间的关联关系的图。
具体实施时,终端设备收到台服务器发送的知识图谱后,可直接展示该知识图谱。参考图9B,终端设备也可以在收到台服务器发送的知识图谱后生成构建成功的提示信息,在用户点击该提示信息中的查看按钮后,展示该知识图谱。文件上传工具还可以向用户提供图谱查询按钮,用户通过图谱查询按钮可以直接访问后台服务器,并获取到构建成功的知识图谱。用户还可以选择将知识图谱保存在终端设备本地,方便后续查看。
通过文件上传工具,用户可以便捷地与后台服务器进行交互,并查看构建的知识图谱。
进一步地,后台服务器会对待上传文件中的数据进行校验,具体校验的方法已在前文阐述。后台服务器会将生成的出错信息发送给终端设备,其中,出错信息包括存在错误数据的错误表格;终端设备在接收到后台服务器发送的出错信息后,展示相应的出错提示信息;在用户先点击出错提示信息后,终端设备响应针对错误提示信息的操作,展示错误表格,其中,错误表格中的错误数据以特殊状态显示,以提示用户表格中的哪些数据存在异常,协助用户快速定位表格中的错误数据,并进行修改。
进一步地,后台服务器在生成纲要图后,还可以向终端设备发送纲要图构建成功的消息,终端设备内的文件上传工具在收到纲要图构建成功的消息后,可展示纲要图构建成功的提示消息,用户可通过点击该提示消息查看纲要图。或者,文件上传工具还可以向用户提供纲要图查询按钮,用户通过纲要图查询按钮可以直接访问后台服务器,并获取到构建成功的纲要图。用户还可以选择将纲要图保存在终端设备本地,方便后续查看。
此外,文件上传工具还可以向用户提供查询词典文件和同义词文件的按钮,方便用户获取到词典文件和同义词文件。
需要说明的是,知识图谱构建工具是本申请实施例中的知识图谱构建方法对应的应用程序,可安装在任一终端设备或后台服务器中,该任一终端设备或后台服务器在运行该应用程序时执行本申请实施例中提供的任一知识图谱构建方法所包含的步骤。
本申请实施例提供了一种通过编辑简单格式的表格就可以一键构建知识图谱的工具,大大简化了各个领域知识图谱构建中非知识图谱专业工作人员的数据准备门槛,他们只需要按照一些简单的字段约定,理解自己的数据场景,即可利用本申请提供的知识图谱构建工具中构建自己想要的知识图谱,该知识图谱构建工具可应用于诸如地产、酒店、金融、人力资源、电力、政务、水利等各个领域。
如图10所示,基于与上述知识图谱构建方法相同的发明构思,本申请实施例还提供了一种知识图谱构建装置100,具体包括:获取模块1001、第一生成模块1002、第二生成模块1003和解析模块1004。
获取模块1001,用于获取至少两个实体类别分别对应的表格,各个表格包括名称列和至少一个关系列,名称列包括属于对应实体类别的实体的实体名称,各个关系列包括表格中的实体与任一其他表格中的实体之间的关联关系。
第一生成模块1002,用于根据从各个表格的名称列中提取的实体名称,分别生成各个实体名称对应的第一语句,每个第一语句用于在图形数据库中添加实体名称对应的实体节点。
第二生成模块1003,用于根据从各个表格的关系列中提取的关联关系,分别生成各个关联关系对应的第二语句,每个第二语句用于在实体节点之间添加表征关联关系的边。
解析模块1004,用于调用图形数据库解析生成的第一语句和第二语句,获得知识图谱。
可选地,其中,各个表格的表格名称为对应的实体类别的类名;各个表格中的各个名称列的第一个单元格中包括名称列标识,各个名称列中除第一个单元格以外的单元格包括实体名称;各个表格中的各个关系列的第一个单元格包括关系列标识、以及与关系列所属表格对应的实体类别具有关联关系的一个实体类别的类名,各个关系列中除第一个单元格以外的任一单元格分别包括与任一单元格对应的实体具有关联关系、且属于第一个单元格中的类名对应的表格中的实体名称。
可选地,第二生成模块1003还用于:通过如下方式从任一表格的任一关系列中提取关联关系:
针对任一关系列中除第一个单元格以外的任一单元格,从任一单元格所在的行和名称列所在的列相交的单元格中提取第一实体名称,从任一单元中提取第二实体名称,确定第一实体名称对应的实体和第二实体名称对应的实体之间存在关联关系。
可选地,各个关系列的第一个单元格还包括描述关联关系的关系名。
相应地,第二生成模块1003,还用于从任一关系列的第一个单元格中提取关系名,第二语句中还包括在知识图谱的边上显示的关系名。
可选地,本申请实施例的知识图谱构建装置100还包括纲要图创建模块,用于:
根据各个表格对应的实体类别的类名,创建各个实体类别对应的类别节点;
针对任一表格的任一关系列,从任一关系列的第一个单元格中提取类名,确定提取的类名对应的实体类别和任一表格对应的实体类别之间存在关联关系;
在具有关联关系的类别节点之间创建边,得到表征实体类别间关联关系的纲要图。
可选地,本申请实施例的知识图谱构建装置100还包括校验模块,用于在生成第一语句和第二语句之前,对各个表格中的数据进行校验,若发现表格中存在错误数据,则生成相应的出错信息。
可选地,各个表格还包括属性列,属性列用于存储表格中各个实体名称对应的属性描述信息;各个实体名称对应的第一语句中还包括各个实体名称对应的属性描述信息。
可选地,本申请实施例的知识图谱构建装置100还包括词典生成模块,用于根据各个表格名称列中的实体名称和实体名称对应的实体类别,生成实体对应的词典文件。
可选地,各个表格还包括同义词列,同义词列用于存储表格中各个实体名称对应的别名。
相应地,本申请实施例的知识图谱构建装置100还包括同义词生成模块,用于根据从各个表格的名称列的实体名称和同义词列中提取出的实体名称对应的别名,生成同义词文件。
可选地,每个实体类别对应的表格为同一表格文件中的一个工作表。
如图11所示,基于与上述知识图谱构建方法相同的发明构思,本申请实施例还提供了一种知识图谱构建装置110,具体包括上传模块1101和展示模块1102。
上传模块1101,用于响应通过文件上传页面输入的构建图谱指令,将待上传文件发送给后台服务器,待上传文件包括:至少两个实体类别分别对应的表格,各个表格包括名称列和至少一个关系列,名称列包括属于对应实体类别的实体的实体名称,各个关系列包括表格中的实体与任一其他表格中的实体之间的关联关系。
展示模块1102,用于展示后台服务器发送的知识图谱,知识图谱是后台服务器根据待上传文件生成的用于描绘各个实体间的关联关系的图。
可选地,展示模块1102,还用于:在接收到后台服务器发送的出错信息后,展示出错提示信息,出错信息包括存在错误数据的错误表格;响应针对错误提示信息的操作,展示错误表格,其中,错误表格中的错误数据以特殊状态显示。
本申请实施例提的知识图谱构建装置与上述知识图谱构建方法采用了相同的发明构思,能够取得相同的有益效果,在此不再赘述。
基于与上述知识图谱构建方法相同的发明构思,本申请实施例还提供了一种电子设备,该电子设备具体可以为桌面计算机、便携式计算机、智能手机、平板电脑、个人数字助理(Personal Digital Assistant,PDA)、服务器等。如图12所示,该电子设备120可以包括处理器1201和存储器1202。
处理器1201可以是通用处理器,例如中央处理器(CPU)、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件,可以实现或者执行本申请实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器1202作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块。存储器可以包括至少一种类型的存储介质,例如可以包括闪存、硬盘、多媒体卡、卡型存储器、随机访问存储器(Random Access Memory,RAM)、静态随机访问存储器(Static Random Access Memory,SRAM)、可编程只读存储器(Programmable Read Only Memory,PROM)、只读存储器(Read Only Memory,ROM)、带电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、磁性存储器、磁盘、光盘等等。存储器是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。本申请实施例中的存储器1202还可以是电路或者其它任意能够实现存储功能的装置,用于存储程序指令和/或数据。
本申请实施例提供了一种计算机可读存储介质,用于储存为上述电子设备所用的计算机程序指令,其包含用于执行上述知识图谱构建方法的程序。
上述计算机存储介质可以是计算机能够存取的任何可用介质或数据存储设备,包括但不限于磁性存储器(例如软盘、硬盘、磁带、磁光盘(MO)等)、光学存储器(例如CD、DVD、BD、HVD等)、以及半导体存储器(例如ROM、EPROM、EEPROM、非易失性存储器(NAND FLASH)、固态硬盘(SSD))等。
以上,以上实施例仅用以对本申请的技术方案进行了详细介绍,但以上实施例的说明只是用于帮助理解本申请实施例的方法,不应理解为对本申请实施例的限制。本技术领域的技术人员可轻易想到的变化或替换,都应涵盖在本申请实施例的保护范围之内。

Claims (15)

1.一种知识图谱构建方法,其特征在于,包括:
获取至少两个实体类别分别对应的表格,各个表格包括名称列和至少一个关系列,所述名称列包括属于对应实体类别的实体的实体名称,各个关系列包括表格中的实体与任一其他表格中的实体之间的关联关系;
根据从各个表格的名称列中提取的实体名称,分别生成各个实体名称对应的第一语句,每个第一语句用于在图形数据库中添加实体名称对应的实体节点;
根据从各个表格的关系列中提取的关联关系,分别生成各个关联关系对应的第二语句,每个第二语句用于在实体节点之间添加表征关联关系的边;
调用图形数据库解析生成的第一语句和第二语句,获得知识图谱。
2.根据权利要求1所述的方法,其特征在于,其中,各个表格的表格名称为对应的实体类别的类名;
各个表格中的各个名称列的第一个单元格中包括名称列标识,各个名称列中除第一个单元格以外的单元格包括实体名称;
各个表格中的各个关系列的第一个单元格包括关系列标识、以及与关系列所属表格对应的实体类别具有关联关系的一个实体类别的类名,各个关系列中除第一个单元格以外的任一单元格分别包括与所述任一单元格对应的实体具有关联关系、且属于第一个单元格中的类名对应的表格中的实体名称。
3.根据权利要求2所述的方法,其特征在于,通过如下方式从任一表格的任一关系列中提取关联关系:
针对所述任一关系列中除第一个单元格以外的任一单元格,从所述任一单元格所在的行和所述名称列所在的列相交的单元格中提取第一实体名称,从所述任一单元中提取第二实体名称,确定所述第一实体名称对应的实体和所述第二实体名称对应的实体之间存在关联关系。
4.根据权利要求3所述的方法,其特征在于,各个关系列的第一个单元格还包括描述关联关系的关系名;
所述方法还包括:
从所述任一关系列的第一个单元格中提取关系名,所述第二语句中还包括在知识图谱的边上显示的关系名。
5.根据权利要求2所述的方法,其特征在于,所述方法还包括:
根据各个表格对应的实体类别的类名,创建各个实体类别对应的类别节点;
针对任一表格的任一关系列,从所述任一关系列的第一个单元格中提取类名,确定提取的类名对应的实体类别和所述任一表格对应的实体类别之间存在关联关系;
在具有关联关系的类别节点之间创建边,得到表征实体类别间关联关系的纲要图。
6.根据权利要求1至5任一所述的方法,其特征在于,所述方法还包括:
在生成所述第一语句和所述第二语句之前,对各个表格中的数据进行校验,若发现表格中存在错误数据,则生成相应的出错信息。
7.根据权利要求1至5任一所述的方法,其特征在于,各个表格还包括属性列,所述属性列用于存储表格中各个实体名称对应的属性描述信息;
各个实体名称对应的第一语句中还包括各个实体名称对应的属性描述信息。
8.根据权利要求1至5任一所述的方法,其特征在于,所述方法还包括:
根据各个表格名称列中的实体名称和实体名称对应的实体类别,生成实体对应的词典文件。
9.根据权利要求1至5任一所述的方法,其特征在于,各个表格还包括同义词列,所述同义词列用于存储表格中各个实体名称对应的别名;
所述方法还包括:
根据从各个表格的名称列的实体名称和同义词列中提取出的实体名称对应的别名,生成同义词文件。
10.根据权利要求1至5任一所述的方法,其特征在于,其中,每个实体类别对应的表格为同一表格文件中的一个工作表。
11.一种知识图谱构建方法,其特征在于,包括:
响应通过文件上传页面输入的构建图谱指令,将待上传文件发送给后台服务器,所述待上传文件包括:至少两个实体类别分别对应的表格,各个表格包括名称列和至少一个关系列,所述名称列包括属于对应实体类别的实体的实体名称,各个关系列包括表格中的实体与任一其他表格中的实体之间的关联关系;
展示所述后台服务器发送的知识图谱,所述知识图谱是所述后台服务器根据所述待上传文件生成的用于描绘各个实体间的关联关系的图。
12.根据权利要求11所述的方法,其特征在于,所述方法还包括:
在接收到所述后台服务器发送的出错信息后,展示出错提示信息,所述出错信息包括存在错误数据的错误表格;
响应针对所述错误提示信息的操作,展示所述错误表格,其中,所述错误表格中的错误数据以特殊状态显示。
13.一种知识图谱构建装置,其特征在于,包括:
获取模块,用于获取至少两个实体类别分别对应的表格,各个表格包括名称列和至少一个关系列,所述名称列包括属于对应实体类别的实体的实体名称,各个关系列包括表格中的实体与任一其他表格中的实体之间的关联关系;
第一生成模块,用于根据从各个表格的名称列中提取的实体名称,分别生成各个实体名称对应的第一语句,每个第一语句用于在图形数据库中添加实体名称对应的实体节点;
第二生成模块,用于根据从各个表格的关系列中提取的关联关系,分别生成各个关联关系对应的第二语句,每个第二语句用于在实体节点之间添加表征关联关系的边;
解析模块,用于调用图形数据库解析生成的第一语句和第二语句,获得知识图谱。
14.一种知识图谱构建装置,其特征在于,包括:
上传模块,用于响应通过文件上传页面输入的构建图谱指令,将待上传文件发送给后台服务器,所述待上传文件包括:至少两个实体类别分别对应的表格,各个表格包括名称列和至少一个关系列,所述名称列包括属于对应实体类别的实体的实体名称,各个关系列包括表格中的实体与任一其他表格中的实体之间的关联关系;
展示模块,用于展示所述后台服务器发送的知识图谱,所述知识图谱是所述后台服务器根据所述待上传文件生成的用于描绘各个实体间的关联关系的图。
15.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,该计算机程序指令被处理器执行时实现权利要求1至12任一项所述方法的步骤。
CN202010096405.5A 2020-02-17 2020-02-17 知识图谱构建方法、装置、电子设备及存储介质 Active CN111324609B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010096405.5A CN111324609B (zh) 2020-02-17 2020-02-17 知识图谱构建方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010096405.5A CN111324609B (zh) 2020-02-17 2020-02-17 知识图谱构建方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN111324609A true CN111324609A (zh) 2020-06-23
CN111324609B CN111324609B (zh) 2023-07-14

Family

ID=71172685

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010096405.5A Active CN111324609B (zh) 2020-02-17 2020-02-17 知识图谱构建方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN111324609B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111753027A (zh) * 2020-06-29 2020-10-09 中国科学院文献情报中心 一种面向多实体的隐式知识图谱表示的方法及装置
CN111914101A (zh) * 2020-08-17 2020-11-10 南方电网数字电网研究院有限公司 档案关联关系的异常识别方法、装置和计算机设备
CN112182236A (zh) * 2020-09-18 2021-01-05 成都数联铭品科技有限公司 一种知识图谱的构建方法、***及电子设备
CN112632106A (zh) * 2020-12-29 2021-04-09 重庆农村商业银行股份有限公司 一种知识图谱查询方法、装置、设备及存储介质
CN113792152A (zh) * 2021-08-23 2021-12-14 南京信息工程大学 一种三角图与知识图谱的融合方法
CN113934729A (zh) * 2021-10-20 2022-01-14 平安国际智慧城市科技股份有限公司 一种基于知识图谱的数据管理方法、相关设备及介质
WO2022051996A1 (zh) * 2020-09-10 2022-03-17 西门子(中国)有限公司 知识图谱构建方法和装置
CN115309789A (zh) * 2022-10-11 2022-11-08 浩鲸云计算科技股份有限公司 一种基于业务对象智能动态化实时生成关联数据图的方法

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140351261A1 (en) * 2013-05-24 2014-11-27 Sap Ag Representing enterprise data in a knowledge graph
US20150310073A1 (en) * 2014-04-29 2015-10-29 Microsoft Corporation Finding patterns in a knowledge base to compose table answers
WO2017185887A1 (en) * 2016-04-29 2017-11-02 Boe Technology Group Co., Ltd. Apparatus and method for analyzing natural language medical text and generating medical knowledge graph representing natural language medical text
JP2017207853A (ja) * 2016-05-17 2017-11-24 日本電信電話株式会社 表セル検索装置、方法、及びプログラム
US20180082183A1 (en) * 2011-02-22 2018-03-22 Thomson Reuters Global Resources Machine learning-based relationship association and related discovery and search engines
CN108549731A (zh) * 2018-07-11 2018-09-18 中国电子科技集团公司第二十八研究所 一种基于本体模型的知识图谱构建方法
CN109446341A (zh) * 2018-10-23 2019-03-08 国家电网公司 知识图谱的构建方法及装置
CN109471947A (zh) * 2018-11-06 2019-03-15 北京锐安科技有限公司 一种数据的知识谱图构建方法、装置、设备及存储介质
US20190102430A1 (en) * 2017-10-04 2019-04-04 Accenture Global Solutions Limited Knowledge Enabled Data Management System
CN109710725A (zh) * 2018-12-13 2019-05-03 中国科学院信息工程研究所 一种基于文本分类的中文表格列标签恢复方法和***
CN110275966A (zh) * 2019-07-01 2019-09-24 科大讯飞(苏州)科技有限公司 一种知识抽取方法及装置
CN110362692A (zh) * 2019-07-23 2019-10-22 中南大学 一种基于知识图谱的学术圈构建方法
CN110489560A (zh) * 2019-06-19 2019-11-22 民生科技有限责任公司 基于知识图谱技术的小微企业画像生成方法及装置
US10496678B1 (en) * 2016-05-12 2019-12-03 Federal Home Loan Mortgage Corporation (Freddie Mac) Systems and methods for generating and implementing knowledge graphs for knowledge representation and analysis
CN110633364A (zh) * 2019-09-23 2019-12-31 中国农业大学 基于图数据库的食品安全知识图谱构建方法和展示模式
EP3608795A1 (en) * 2018-08-08 2020-02-12 Beijing Baidu Netcom Science and Technology Co., Ltd. Method and apparatus for generating knowledge graph, device and computer readable storage medium

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180082183A1 (en) * 2011-02-22 2018-03-22 Thomson Reuters Global Resources Machine learning-based relationship association and related discovery and search engines
US20140351261A1 (en) * 2013-05-24 2014-11-27 Sap Ag Representing enterprise data in a knowledge graph
US20150310073A1 (en) * 2014-04-29 2015-10-29 Microsoft Corporation Finding patterns in a knowledge base to compose table answers
WO2017185887A1 (en) * 2016-04-29 2017-11-02 Boe Technology Group Co., Ltd. Apparatus and method for analyzing natural language medical text and generating medical knowledge graph representing natural language medical text
US10496678B1 (en) * 2016-05-12 2019-12-03 Federal Home Loan Mortgage Corporation (Freddie Mac) Systems and methods for generating and implementing knowledge graphs for knowledge representation and analysis
JP2017207853A (ja) * 2016-05-17 2017-11-24 日本電信電話株式会社 表セル検索装置、方法、及びプログラム
US20190102430A1 (en) * 2017-10-04 2019-04-04 Accenture Global Solutions Limited Knowledge Enabled Data Management System
CN108549731A (zh) * 2018-07-11 2018-09-18 中国电子科技集团公司第二十八研究所 一种基于本体模型的知识图谱构建方法
EP3608795A1 (en) * 2018-08-08 2020-02-12 Beijing Baidu Netcom Science and Technology Co., Ltd. Method and apparatus for generating knowledge graph, device and computer readable storage medium
CN109446341A (zh) * 2018-10-23 2019-03-08 国家电网公司 知识图谱的构建方法及装置
CN109471947A (zh) * 2018-11-06 2019-03-15 北京锐安科技有限公司 一种数据的知识谱图构建方法、装置、设备及存储介质
CN109710725A (zh) * 2018-12-13 2019-05-03 中国科学院信息工程研究所 一种基于文本分类的中文表格列标签恢复方法和***
CN110489560A (zh) * 2019-06-19 2019-11-22 民生科技有限责任公司 基于知识图谱技术的小微企业画像生成方法及装置
CN110275966A (zh) * 2019-07-01 2019-09-24 科大讯飞(苏州)科技有限公司 一种知识抽取方法及装置
CN110362692A (zh) * 2019-07-23 2019-10-22 中南大学 一种基于知识图谱的学术圈构建方法
CN110633364A (zh) * 2019-09-23 2019-12-31 中国农业大学 基于图数据库的食品安全知识图谱构建方法和展示模式

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
高广尚;: "面向实体对象的情报检索技术研究", no. 08, pages 97 - 105 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111753027A (zh) * 2020-06-29 2020-10-09 中国科学院文献情报中心 一种面向多实体的隐式知识图谱表示的方法及装置
CN111753027B (zh) * 2020-06-29 2023-03-14 中国科学院文献情报中心 一种面向多实体的隐式知识图谱表示的方法及装置
CN111914101A (zh) * 2020-08-17 2020-11-10 南方电网数字电网研究院有限公司 档案关联关系的异常识别方法、装置和计算机设备
CN111914101B (zh) * 2020-08-17 2023-10-20 南方电网数字电网研究院有限公司 档案关联关系的异常识别方法、装置和计算机设备
WO2022051996A1 (zh) * 2020-09-10 2022-03-17 西门子(中国)有限公司 知识图谱构建方法和装置
CN112182236A (zh) * 2020-09-18 2021-01-05 成都数联铭品科技有限公司 一种知识图谱的构建方法、***及电子设备
CN112632106A (zh) * 2020-12-29 2021-04-09 重庆农村商业银行股份有限公司 一种知识图谱查询方法、装置、设备及存储介质
CN112632106B (zh) * 2020-12-29 2023-05-23 重庆农村商业银行股份有限公司 一种知识图谱查询方法、装置、设备及存储介质
CN113792152A (zh) * 2021-08-23 2021-12-14 南京信息工程大学 一种三角图与知识图谱的融合方法
CN113792152B (zh) * 2021-08-23 2023-07-04 南京信息工程大学 一种三角图与知识图谱的融合方法
CN113934729A (zh) * 2021-10-20 2022-01-14 平安国际智慧城市科技股份有限公司 一种基于知识图谱的数据管理方法、相关设备及介质
CN115309789A (zh) * 2022-10-11 2022-11-08 浩鲸云计算科技股份有限公司 一种基于业务对象智能动态化实时生成关联数据图的方法

Also Published As

Publication number Publication date
CN111324609B (zh) 2023-07-14

Similar Documents

Publication Publication Date Title
CN111324609B (zh) 知识图谱构建方法、装置、电子设备及存储介质
CN109992589B (zh) 基于可视化页面生成sql语句的方法、装置、服务器及介质
CN108519967B (zh) 图表可视化方法、装置、终端和存储介质
CN110347953B (zh) 页面生成方法、装置、计算机设备及存储介质
US11238099B2 (en) Method and device for obtaining answer, and computer device
US8601438B2 (en) Data transformation based on a technical design document
US8984339B2 (en) System and method for test case generation using components
US9081899B2 (en) System and method for processing web service test cases
WO2019179021A1 (zh) Excel数据导入数据库的方法、装置、计算机设备及存储介质
US20140181154A1 (en) Generating information models in an in-memory database system
US20100121883A1 (en) Reporting language filtering and mapping to dimensional concepts
CN107798123B (zh) 知识库及其建立、修改、智能问答方法、装置及设备
US9646004B2 (en) Hierarchical database report generation with automated query generation for placeholders
WO2019153555A1 (zh) Er关系生成方法、装置、计算机设备及存储介质
US20170212942A1 (en) Database grid search methods and systems
CN115576974B (zh) 数据处理方法、装置、设备和介质
CN108958731B (zh) 一种应用程序界面生成方法、装置、设备和存储介质
CN114003843A (zh) 一种页面生成方法、装置、设备及存储介质
CN117057318A (zh) 领域模型生成方法、装置、设备以及存储介质
JP2022093293A (ja) エクセルツールを用いたオンラインレポート作成システム
CN111506594B (zh) 一种大数据查询平台及其管理方法和数据查询方法
CN116974929A (zh) 自动化测试工具构建方法、自动化测试方法及其相关设备
WO2023202704A1 (zh) 一种业务信息处理方法、装置及电子设备
CN112783582A (zh) 报表生成方法、装置、电子设备及存储介质
WO2019242167A1 (zh) 一种需求管理方法及计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40024419

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant