CN115658910A - 知识问答方法、装置、电子设备和可读存储介质 - Google Patents

知识问答方法、装置、电子设备和可读存储介质 Download PDF

Info

Publication number
CN115658910A
CN115658910A CN202211074171.XA CN202211074171A CN115658910A CN 115658910 A CN115658910 A CN 115658910A CN 202211074171 A CN202211074171 A CN 202211074171A CN 115658910 A CN115658910 A CN 115658910A
Authority
CN
China
Prior art keywords
entity
abstract
tail
original
relation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211074171.XA
Other languages
English (en)
Inventor
王子康
李林静
薛文芳
曾大军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Zhongke Intelligent Identification Co ltd
Institute of Automation of Chinese Academy of Science
Original Assignee
Tianjin Zhongke Intelligent Identification Co ltd
Institute of Automation of Chinese Academy of Science
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin Zhongke Intelligent Identification Co ltd, Institute of Automation of Chinese Academy of Science filed Critical Tianjin Zhongke Intelligent Identification Co ltd
Priority to CN202211074171.XA priority Critical patent/CN115658910A/zh
Publication of CN115658910A publication Critical patent/CN115658910A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种知识问答方法、装置、电子设备和可读存储介质,涉及计算机技术领域,该方法包括:基于原始知识图谱构建抽象知识图谱,抽象知识图谱由抽象头实体、抽象尾实体以及抽象头实体与抽象尾实体之间的关联关系构成;获取待查询语句,待查询语句由预设头实体以及目标关联关系构成,目标关联关系表示预设头实体与待确定的目标尾实体之间的关联关系;基于待查询语句和抽象知识图谱确定至少一条满足目标关联关系的实体关系链;基于原始知识图谱以及至少一条实体关系链确定出至少一个备选尾实体,并基于至少一个备选尾实体确定待查询语句对应的目标尾实体,解决了现有技术中知识问答效率过低的缺陷。

Description

知识问答方法、装置、电子设备和可读存储介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种知识问答方法、装置、电子设备和可读存储介质。
背景技术
贸易知识图谱广泛应用于金融贸易分析领域,用于存储丰富的贸易行业知识,并支持贸易领域的语义理解以及知识搜索,通过贸易知识图谱可以发现隐藏的深层贸易知识,从而发现企业之间的深层联系、寻求贸易机会以及提前预知贸易风险,可以为贸易决策提供丰富的知识支持,从而可以提高贸易企业的经济效益。
在现有技术中,采用基于符号的逻辑推理方法来获取需要的贸易知识,然而,这种推理方法的复杂度会随着贸易知识图谱的规模呈指数增长,从而导致贸易知识问答效率过低的缺陷。
发明内容
本发明提供一种知识问答方法、装置、电子设备和可读存储介质,用以解决现有技术中知识问答效率过低的缺陷。
本发明提供一种知识问答方法,包括:
基于原始知识图谱构建抽象知识图谱,所述抽象知识图谱由抽象头实体、抽象尾实体以及所述抽象头实体与所述抽象尾实体之间的关联关系构成;
获取待查询语句,所述待查询语句由预设头实体以及目标关联关系构成,所述目标关联关系表示所述预设头实体与待确定的目标尾实体之间的关联关系;
基于所述待查询语句和所述抽象知识图谱确定至少一条满足所述目标关联关系的实体关系链;
基于所述原始知识图谱以及至少一条实体关系链确定出至少一个备选尾实体,并基于至少一个备选尾实体确定所述待查询语句对应的目标尾实体。
根据本发明提供的一种知识问答方法,所述基于原始知识图谱构建抽象知识图谱,包括:
获取所述原始知识图谱中的每一个原始实体组,所述原始实体组包括原始头实体、原始尾实体以及所述原始头实体与所述原始尾实体之间的关联关系;
针对每一个原始实体组,基于所述原始实体组中的原始头实体和关联关系定义原始尾实体对应的抽象尾实体;
将多个原始实体组中的每一个原始尾实体替换为其对应的抽象尾实体,形成多个抽象实体组,并基于多个抽象实体组构建抽象知识图谱。
根据本发明提供的一种知识问答方法,所述基于所述待查询语句和所述抽象知识图谱确定至少一条满足所述目标关联关系的实体关系链,包括:
基于所述抽象知识图谱和所述待查询语句,获取满足所述目标关联关系的最短路径,得到至少一条最短路径,所述最短路径的起始节点为所述预设头实体对应的节点;
针对每一条所述最短路径,依次获取所述最短路径中相邻两个节点之间的子关联关系,得到多个依次排列的子关联关系,并基于多个依次排列的子关联关系形成所述最短路径对应的实体关系链。
根据本发明提供的一种知识问答方法,所述方法还包括:
针对所述实体关系链中的任意两个相邻子关联关系,判断所述两个相邻子关联关系是否构成互逆关联关系组;
在所述两个相邻子关联关系构成互逆关联关系组的情况下,将所述两个相邻子关联关系从所述实体关系链中删除。
根据本发明提供的一种知识问答方法,所述基于所述原始知识图谱以及至少一条实体关系链确定出至少一个备选尾实体,并基于至少一个备选尾实体确定所述待查询语句对应的目标尾实体,包括:
针对每一条实体关系链,从所述原始知识图谱中确定出所述实体关系链对应的尾实体,并确定所述尾实体为备选尾实体;
获取每一个备选尾实体的第一权重,并确定所述第一权重最高的备选尾实体为所述待查询语句对应的目标尾实体。
根据本发明提供的一种知识问答方法,所述获取每一个备选尾实体的第一权重,包括:
针对每一个备选尾实体,获取所述备选尾实体所属的每一个实体关系链对应的第二权重;
针对所述备选尾实体所属的每一个实体关系链,基于所述实体关系链中每一个中间实体的第三权重以及其对应的第二权重,获取所述实体关系链对应的权重乘积项;
将所述备选尾实体所属的每一个实体关系链对应的权重乘积项进行叠加,得到所述备选尾实体的第一权重。
本发明还提供一种贸易知识推理装置,包括:
图谱构建模块,用于基于原始知识图谱构建抽象知识图谱,所述抽象知识图谱由抽象头实体、抽象尾实体以及所述抽象头实体与所述抽象尾实体之间的关联关系构成;
数据获取模块,用于获取待查询语句,所述待查询语句由预设头实体以及目标关联关系构成,所述目标关联关系表示所述预设头实体与待确定的目标尾实体之间的关联关系;
关系链确定模块,用于基于所述待查询语句和所述抽象知识图谱确定至少一条满足所述目标关联关系的实体关系链;
实体确定模块,用于基于所述原始知识图谱以及至少一条实体关系链确定出至少一个备选尾实体,并基于至少一个备选尾实体确定所述待查询语句对应的目标尾实体。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述的知识问答方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述的知识问答方法。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述的知识问答方法。
本发明提供的知识问答方法、装置、电子设备和可读存储介质,通过将原始知识图谱中含有相似语义的多个实体抽象为同一概念,以构建抽象知识图谱,实现在保留原始知识图谱中的大部分语义信息的同时降低知识图谱的复杂程度,从而能够基于抽象后的知识图谱快速确定满足条件的实体关系链,进而基于获取到的实体关系链和原始知识图谱快速确定待查询语句对应的目标尾实体,解决了现有技术中知识问答效率过低的缺陷,提高了知识问答效率。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的知识问答方法的流程示意图之一;
图2是本发明实施例提供的知识问答方法的流程示意图之二;
图3是本发明实施例提供的知识问答方法的流程示意图之三;
图4是本发明实施例提供的知识问答方法的流程示意图之四;
图5是本发明实施例提供的知识问答方法的流程示意图之五;
图6是本发明实施例提供的知识问答方法的流程示意图之六;
图7是本发明实施例提供的知识问答装置的结构示意图;
图8是本发明实施例提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合图1-图6描述本发明的知识问答方法。如图1所示,本发明提供一种知识问答方法,包括:
步骤S1,基于原始知识图谱构建抽象知识图谱,抽象知识图谱由抽象头实体、抽象尾实体以及抽象头实体与抽象尾实体之间的关联关系构成。
其中,原始知识图谱由原始头实体h、原始尾实体t以及原始头实体与原始尾实体之间的关联关系r构成。抽象尾实体是基于原始头实体h和关联关系r确定的,因此,该抽象尾实体可以表示为hr
需要说明的是,原始头实体h和原始尾实体t均代表现实世界中的一个具体的事物,而抽象尾实体hr则是对多个具有相似语义的原始尾实体t的抽象表达,即抽象尾实体hr对应一个或者多个具有相似语义的原始尾实体t。
步骤S2,获取待查询语句,待查询语句由预设头实体以及目标关联关系构成,目标关联关系表示预设头实体与待确定的目标尾实体之间的关联关系。
其中,待查询语句可以表示为(h1,r1,t1),其中,h1表示预设头实体,r1表示目标关联关系,t1表示待确定的目标尾实体,即预设头实体h1和目标关联关系r1是已知的,而目标尾实体是未知的。
步骤S3,基于待查询语句和抽象知识图谱确定至少一条满足目标关联关系的实体关系链。
其中,实体关系链是由多个依次排列的子关联关系构成的关系链。子关联关系表示相邻两个节点对应的实体之间的关联关系。该相邻两个节点是基于预设头实体对应的头节点与目标尾实体对应的尾节点所确定的节点区间内的任意两个相邻节点,该节点区间为闭区间。该子关联关系包括预设头实体与中间实体之间的关联关系、两个中间实体之间的关联关系以及中间实体与目标尾实体之间的关联关系,该中间实体是基于目标关联关系确定的。
步骤S4,基于原始知识图谱以及至少一条实体关系链确定出至少一个备选尾实体,并基于至少一个备选尾实体确定待查询语句对应的目标尾实体。
上述步骤S1至步骤S4,通过将原始知识图谱中含有相似语义的多个实体抽象为同一概念,以构建抽象知识图谱,实现在保留原始知识图谱中的大部分语义信息的同时降低知识图谱的复杂程度,从而能够基于抽象后的知识图谱快速确定满足条件的实体关系链,进而基于获取到的实体关系链和原始知识图谱快速确定待查询语句对应的目标尾实体,解决了现有技术中知识问答效率过低的缺陷,提高了知识问答效率。
进一步地,原始知识图谱中的关联关系可以通过专家标注或者文本抽取等方式获取。
进一步地,原始知识图谱为原始贸易知识图谱,原始贸易知识图谱中的实体可以是一个公司、一个员工或者一个行业。而实体与实体之间的关联关系可以是公司与公司之间的竞争关系或者合作关系,也可以是员工与员工之间的领导关系。
在一个实施例中,如图2所示,上述步骤S1包括步骤S11至步骤S13,其中:
步骤S11,获取原始知识图谱中的每一个原始实体组,原始实体组包括原始头实体、原始尾实体以及原始头实体与原始尾实体之间的关联关系。
其中,原始实体组是一个三元数组,可以表示为(h,r,t),h表示原始头实体,t表示原始尾实体,r表示原始头实体与原始尾实体之间的关联关系。原始头实体h和原始尾实体t分别是原始知识图谱中的头节点和尾节点,关联关系r是原始知识图谱中的边。
步骤S12,针对每一个原始实体组,基于原始实体组中的原始头实体和关联关系定义原始尾实体对应的抽象尾实体。
具体地,将原始知识图谱中与该原始头实体h具有相同关联关系r的多个原始尾实体t视为具有相同或者相似的语义,并将多个原始尾实体t映射到一个抽象概念节点,即为抽象尾实体hr
进一步地,可以将多个原始尾实体t与抽象尾实体hr之间的映射关系存储至预先定义的映射字典或者其他存储器中,以便于后续使用时方便查找。
步骤S13,将多个原始实体组中的每一个原始尾实体替换为其对应的抽象尾实体,形成多个抽象实体组,并基于多个抽象实体组构建抽象知识图谱。
其中,抽象实体组是一个三元数组,可以表示为(h′,r,h′r),h′表示抽象头实体,h′r表示抽象尾实体,r表示抽象头实体与抽象尾实体之间的关联关系。
具体地,以抽象头实体h′为头节点、以抽象尾实体h′r为尾节点以及以关联关系r为边,构建知识图谱,其中,关联关系r对应的边用于将抽象头实体h′对应的头节点与抽象尾实体h′r对应的尾节点连接起来。
需要说明的是,虽然只定义每一个原始实体组中的原始尾实体对应的抽象尾实体,但在原始知识图谱中,原始实体组a的尾实体可能也是原始实体组b的头实体,因此,最终能够得到原始知识图谱中每一个原始实体对应的抽象实体,进而将原始知识图谱中每一个原始实体替换为其对应的抽象实体,从而能够得到替换后的抽象知识图谱。
上述步骤S11至步骤S13,通过将具有相同关联关系的多个原始实体映射到同一个抽象概念节点,从而能够得到多个原始实体与抽象实体之间的对应关系,从而在后续步骤中能够基于该对应关系以及逻辑推理得到的抽象实体一次性查找到所有符合条件的原始实体,进而可以进一步提高了知识问答效率。
在一个实施例中,如图3所示,上述步骤S3包括步骤S31至步骤S32,其中:
步骤S31,基于抽象知识图谱和待查询语句,获取满足目标关联关系的最短路径,得到至少一条最短路径,最短路径的起始节点为预设头实体对应的节点。
在一个实施例中,判断抽象知识图谱中是否存在满足目标关联关系的最短路径;在抽象知识图谱中不存在满足目标关联关系的最短路径的情况下,基于原始知识图谱和待查询语句,获取满足目标关联关系的最短路径,以在抽象知识图谱中不存在满足目标关联关系的最短路径的情况下,通过替代的方案实现最短路径的提取,提高了本申请提供的知识问答方法的包容性,从而便于在各种不同的场景下实现知识问答。
步骤S32,针对每一条最短路径,依次获取最短路径中相邻两个节点之间的子关联关系,得到多个依次排列的子关联关系,并基于多个依次排列的子关联关系形成最短路径对应的实体关系链。
在一个实施例中,以公式(1)所示的最短路径以及公式(2)所示的实体关系链为例,对本实施例进行说明:
Figure BDA0003830825150000091
R1(x,z1)∧R2(z1,z2)∧…∧Rn(zn-1,y)→R(x,y) (2)
其中,x表示预设头实体,y表示待确定的目标尾实体,z1至zn-1表示基于目标关联关系R从抽象知识图谱中查找到的中间实体,而R1表示预设头实体x与中间实体z1之间的子关联关系,R2表示中间实体z1与中间实体z2之间的子关联关系,Rn表示中间实体zn-1与目标尾实体y之间的子关联关系。
由此可见,在公式(1)所示的最短路径存在的情况下,x和y具有关联关系R,并且在从最短路径中提取实体关系链时只关注实体关系链R1∧R2∧…∧Rn→R本身,而忽略抽象实体和原始实体,以提高实体关系链的提取效率。
上述步骤S31至步骤S32,通过基于抽象知识图谱和待查询语句确定至少一条满足目标关联关系的最短路径,在从最短路径中提取实体关系链时只关注实体关系链本身,而忽略抽象实体和原始实体,从而可以提高实体关系链的提取效率,进而可以进一步提高了知识问答效率。
在一个实施例中,如图4所示,本发明提供的知识问答方法还包括步骤S33至步骤S34,其中:
步骤S33,针对实体关系链中的任意两个相邻子关联关系,判断两个相邻子关联关系是否构成互逆关联关系组。
步骤S34,在两个相邻子关联关系构成互逆关联关系组的情况下,将两个相邻子关联关系从实体关系链中删除。
例如,子关联关系R1和子关联关系R2是两个相邻的子关联关系,并且这两个相邻的子关联关系是互逆的,则可以将R1∧R2∧R3简化为R3,即在实体关系链中删除子关联关系R1和子关联关系R2
上述步骤S33至步骤S34,通过判断实体关系链中的任意两个相邻子关联关系是否构成互逆关联关系组,并在两个相邻子关联关系构成互逆关联关系组的情况下,将两个相邻子关联关系从实体关系链中删除,以简化提取到的实体关系链,从而能够通过简化后的实体关系链快速确定出待查询语句对应的目标尾实体,提高了知识问答的处理效率。
在一个实施例中,如图5所示,上述步骤S4包括步骤S41至步骤S42,其中:
步骤S41,针对每一条实体关系链,从原始知识图谱中确定出实体关系链对应的尾实体,并确定尾实体为备选尾实体。
例如,对于一条实体关系链l:R1∧R2∧R3,在原始知识图谱中存在该实体关系链l对应的路径
Figure BDA0003830825150000101
的情况下,则确定尾实体t是一个备选尾实体。
步骤S42,获取每一个备选尾实体的第一权重,并确定第一权重最高的备选尾实体为待查询语句对应的目标尾实体。
在一个实施例中,基于备选尾实体所属的每一个实体关系链的权值以及所属的每一个实体关系链中的实体的权值,获取该备选尾实体的第一权重。
上述步骤S41至步骤S42,通过基于至少一条实体关系链从原始知识图谱中确定出多个符合条件的备选尾实体,并从多个备选尾实体中筛选出权重值最高的备选尾实体为待查询语句对应的目标尾实体,可以提高知识问答结果的准确度。
在一个实施例中,如图6所示,上述步骤S42包括步骤S421至步骤S423,其中:
步骤S421,针对每一个备选尾实体,获取备选尾实体所属的每一个实体关系链对应的第二权重。
在一个实施例中,获取每一条实体关系链在满足目标关联关系的所有实体关系链中的出现次数以及满足目标关联关系的实体关系链的关系链总数,基于每一条实体关系链对应的出现次数与该关系链总数相除,得到每一条实体关系链对应的第二权重。
具体地,对于一个目标关联关系,由于知识图谱中存在多个满足该目标关联关系的实体对,例如对目标关联关系R,有实体对(z1,y)满足目标关联关系R,也有实体对(z2,y)满足目标关联关系R。根据这些不同的实体对,可以抽取到多条实体关系链,其中,有些实体关系链是相同的。对某一条实体关系链,假设被抽取到的次数是f1,抽取到的所有实体关系链的总次数是f2,则这一条实体关系链的频率等于f1除以f2。
步骤S422,针对备选尾实体所属的每一个实体关系链,基于实体关系链中每一个中间实体的第三权重以及其对应的第二权重,获取实体关系链对应的权重乘积项。
在一个实施例中,对于任意一个实体关系链中的任意一个中间实体,获取该中间实体所在位置上可选的中间实体的实体总数,并将1除以该实体总数的概率作为该中间实体的第三权重。
步骤S423,将备选尾实体所属的每一个实体关系链对应的权重乘积项进行叠加,得到备选尾实体的第一权重。
在一个实施例中,备选尾实体的第一权重可以由以下公式(3)表示:
Figure BDA0003830825150000111
其中,ωt表示备选尾实体t的第一权重,li表示第i条实体关系链,
Figure BDA0003830825150000112
表示实体关系链集合,ej表示第i条实体关系链中的第j个中间实体,
Figure BDA0003830825150000113
表示实体关系链li的第二权重,
Figure BDA0003830825150000114
表示实体关系链li中的中间实体e1的第三权重,
Figure BDA0003830825150000121
表示实体关系链li中的中间实体e2的第三权重,
Figure BDA0003830825150000122
表示实体关系链li中的中间实体
Figure BDA0003830825150000123
的第三权重。
Figure BDA0003830825150000124
表示实体关系链li对应的权重乘积项。
具体地,在j=1的情况下,
Figure BDA0003830825150000125
表示实体关系链li对应的最短路径中的第一个中间实体是e1的概率;在j=2的情况下,
Figure BDA0003830825150000126
表示实体关系链li对应的最短路径中的第二个中间实体是e2的概率;实体关系链li的长度可以表示为|li|,即实体关系链中有|li|个子关联关系,则最短路径中的最后一个实体可以表示为第|li|+1个实体,即在j=|li|+1的情况下,
Figure BDA0003830825150000127
表示实体关系链li对应的最短路径中的最后一个实体是实体
Figure BDA0003830825150000128
的概率。
上述步骤S421至步骤S423,通过在计算每一个备选尾实体的权重时考虑了其所属的每一个实体关系链的权重以及其所属的每一个实体关系链中的每一个中间实体的权值,从而能够准确地计算出每一个备选尾实体对应的权重,进一步提高知识问答结果的准确度。
下面提供一个应用于贸易知识问答领域的具体实施例,以对本发明提供的知识问答方法作进一步说明。
在具体实施例中,基于原始贸易知识图谱构建抽象贸易知识图谱,抽象贸易知识图谱由抽象头实体、抽象尾实体以及抽象头实体与抽象尾实体之间的关联关系构成。获取待查询语句(x,R,y),待查询语句由预设头实体x以及目标关联关系R构成,目标关联关系R表示预设头实体x与待确定的目标尾实体y之间的关联关系。基于待查询语句(x,R,y)和抽象贸易知识图谱确定至少一条满足目标关联关系的实体关系链,基于原始贸易知识图谱以及至少一条实体关系链确定出至少一个备选尾实体,并基于至少一个备选尾实体确定待查询语句对应的目标尾实体,并将目标尾实体作为待查询语句的答案输出。其中一条实体关系链l为R1(x,z1)∧R2(z1,y)→R(x,y),节点x表示公司a,节点z1表示公司b,R1(x,z1)表示公司a是公司b的子公司,y表示服务业,R2(z1,y)表示公司b隶属于服务业,则可以由实体关系链l推断出:公司a也属于服务业。通过实体关系链l可以发现原始贸易知识图谱中不存在的(公司x,隶属于,公司y)等知识,从而发现隐藏的贸易知识,进一步提高了贸易知识问答结果的准确度和可靠性。
下面对本发明提供的知识问答装置进行描述,下文描述的知识问答装置与上文描述的知识问答方法可相互对应参照。
如图7所示,本发明提供一种知识问答装置100,知识问答装置100包括:
图谱构建模块10,用于基于原始知识图谱构建抽象知识图谱,所述抽象知识图谱由抽象头实体、抽象尾实体以及所述抽象头实体与所述抽象尾实体之间的关联关系构成。
数据获取模块20,用于获取待查询语句,待查询语句由预设头实体以及目标关联关系构成,目标关联关系表示预设头实体与待确定的目标尾实体之间的关联关系。
关系链确定模块30,用于基于待查询语句和抽象知识图谱确定至少一条满足目标关联关系的实体关系链。
实体确定模块40,用于基于原始知识图谱以及至少一条实体关系链确定出至少一个备选尾实体,并基于至少一个备选尾实体确定待查询语句对应的目标尾实体。
在一个实施例中,图谱构建模块10包括实体组获取单元、实体抽象单元和图谱构建单元,其中:
实体组获取单元,用于获取所述原始知识图谱中的每一个原始实体组,所述原始实体组包括原始头实体、原始尾实体以及所述原始头实体与所述原始尾实体之间的关联关系。
实体抽象单元,用于针对每一个原始实体组,基于所述原始实体组中的原始头实体和关联关系定义原始尾实体对应的抽象尾实体。
图谱构建单元,用于将多个原始实体组中的每一个原始尾实体替换为其对应的抽象尾实体,形成多个抽象实体组,并基于多个抽象实体组构建抽象知识图谱。
在一个实施例中,关系链确定模块30包括路径确定单元和关系链确定单元,其中:
路径确定单元,用于基于抽象知识图谱和待查询语句,获取满足目标关联关系的最短路径,得到至少一条最短路径,最短路径的起始节点为预设头实体对应的节点。
关系链确定单元,用于针对每一条最短路径,依次获取最短路径中相邻两个节点之间的子关联关系,得到多个依次排列的子关联关系,并基于多个依次排列的子关联关系形成最短路径对应的实体关系链。
在一个实施例中,知识问答装置100还包括互逆判定模块和关系链简化模块,其中:
互逆判定模块,用于针对实体关系链中的任意两个相邻子关联关系,判断两个相邻子关联关系是否构成互逆关联关系组。
关系链简化模块,用于在两个相邻子关联关系构成互逆关联关系组的情况下,将两个相邻子关联关系从实体关系链中删除。
在一个实施例中,实体确定模块40包括备选确定单元和目标确定单元,其中:
备选确定单元,用于针对每一条实体关系链,从原始知识图谱中确定出实体关系链对应的尾实体,并确定尾实体为备选尾实体。
目标确定单元,用于获取每一个备选尾实体的第一权重,并确定第一权重最高的备选尾实体为待查询语句对应的目标尾实体。
在一个实施例中,目标确定单元包括权重获取单元、权重相乘单元和权重叠加单元,其中:
权重获取单元,用于针对每一个备选尾实体,获取备选尾实体所属的每一个实体关系链对应的第二权重。
权重相乘单元,用于针对备选尾实体所属的每一个实体关系链,基于实体关系链中每一个中间实体的第三权重以及其对应的第二权重,获取实体关系链对应的权重乘积项。
权重叠加单元,用于将备选尾实体所属的每一个实体关系链对应的权重乘积项进行叠加,得到备选尾实体的第一权重。
图8示例了一种电子设备的实体结构示意图,如图8所示,该电子设备可以包括:处理器(processor)810、通信接口(Communications Interface)820、存储器(memory)830和通信总线840,其中,处理器810,通信接口820,存储器830通过通信总线840完成相互间的通信。处理器810可以调用存储器830中的逻辑指令,以执行知识问答方法,该方法包括基于原始知识图谱构建抽象知识图谱,抽象知识图谱由抽象头实体、抽象尾实体以及抽象头实体与抽象尾实体之间的关联关系构成;获取待查询语句,待查询语句由预设头实体以及目标关联关系构成,目标关联关系表示预设头实体与待确定的目标尾实体之间的关联关系;基于待查询语句和抽象知识图谱确定至少一条满足目标关联关系的实体关系链;基于原始知识图谱以及至少一条实体关系链确定出至少一个备选尾实体,并基于至少一个备选尾实体确定待查询语句对应的目标尾实体。
此外,上述的存储器830中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,计算机程序被处理器执行时,计算机能够执行上述各方法所提供的知识问答方法,该方法包括:基于原始知识图谱构建抽象知识图谱,抽象知识图谱由抽象头实体、抽象尾实体以及抽象头实体与抽象尾实体之间的关联关系构成;获取待查询语句,待查询语句由预设头实体以及目标关联关系构成,目标关联关系表示预设头实体与待确定的目标尾实体之间的关联关系;基于待查询语句和抽象知识图谱确定至少一条满足目标关联关系的实体关系链;基于原始知识图谱以及至少一条实体关系链确定出至少一个备选尾实体,并基于至少一个备选尾实体确定待查询语句对应的目标尾实体。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的知识问答方法,该方法包括:基于原始知识图谱构建抽象知识图谱,抽象知识图谱由抽象头实体、抽象尾实体以及抽象头实体与抽象尾实体之间的关联关系构成;获取待查询语句,待查询语句由预设头实体以及目标关联关系构成,目标关联关系表示预设头实体与待确定的目标尾实体之间的关联关系;基于待查询语句和抽象知识图谱确定至少一条满足目标关联关系的实体关系链;基于原始知识图谱以及至少一条实体关系链确定出至少一个备选尾实体,并基于至少一个备选尾实体确定待查询语句对应的目标尾实体。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种知识问答方法,其特征在于,包括:
基于原始知识图谱构建抽象知识图谱,所述抽象知识图谱由抽象头实体、抽象尾实体以及所述抽象头实体与所述抽象尾实体之间的关联关系构成;
获取待查询语句,所述待查询语句由预设头实体以及目标关联关系构成,所述目标关联关系表示所述预设头实体与待确定的目标尾实体之间的关联关系;
基于所述待查询语句和所述抽象知识图谱确定至少一条满足所述目标关联关系的实体关系链;
基于所述原始知识图谱以及至少一条实体关系链确定出至少一个备选尾实体,并基于至少一个备选尾实体确定所述待查询语句对应的目标尾实体。
2.根据权利要求1所述的知识问答方法,其特征在于,所述基于原始知识图谱构建抽象知识图谱,包括:
获取所述原始知识图谱中的每一个原始实体组,所述原始实体组包括原始头实体、原始尾实体以及所述原始头实体与所述原始尾实体之间的关联关系;
针对每一个原始实体组,基于所述原始实体组中的原始头实体和关联关系定义原始尾实体对应的抽象尾实体;
将多个原始实体组中的每一个原始尾实体替换为其对应的抽象尾实体,形成多个抽象实体组,并基于多个抽象实体组构建抽象知识图谱。
3.根据权利要求1所述的知识问答方法,其特征在于,所述基于所述待查询语句和所述抽象知识图谱确定至少一条满足所述目标关联关系的实体关系链,包括:
基于所述抽象知识图谱和所述待查询语句,获取满足所述目标关联关系的最短路径,得到至少一条最短路径,所述最短路径的起始节点为所述预设头实体对应的节点;
针对每一条所述最短路径,依次获取所述最短路径中相邻两个节点之间的子关联关系,得到多个依次排列的子关联关系,并基于多个依次排列的子关联关系形成所述最短路径对应的实体关系链。
4.根据权利要求1至3任一项所述的知识问答方法,其特征在于,所述方法还包括:
针对所述实体关系链中的任意两个相邻子关联关系,判断所述两个相邻子关联关系是否构成互逆关联关系组;
在所述两个相邻子关联关系构成互逆关联关系组的情况下,将所述两个相邻子关联关系从所述实体关系链中删除。
5.根据权利要求1所述的知识问答方法,其特征在于,所述基于所述原始知识图谱以及至少一条实体关系链确定出至少一个备选尾实体,并基于至少一个备选尾实体确定所述待查询语句对应的目标尾实体,包括:
针对每一条实体关系链,从所述原始知识图谱中确定出所述实体关系链对应的尾实体,并确定所述尾实体为备选尾实体;
获取每一个备选尾实体的第一权重,并确定所述第一权重最高的备选尾实体为所述待查询语句对应的目标尾实体。
6.根据权利要求5所述的知识问答方法,其特征在于,所述获取每一个备选尾实体的第一权重,包括:
针对每一个备选尾实体,获取所述备选尾实体所属的每一个实体关系链对应的第二权重;
针对所述备选尾实体所属的每一个实体关系链,基于所述实体关系链中每一个中间实体的第三权重以及其对应的第二权重,获取所述实体关系链对应的权重乘积项;
将所述备选尾实体所属的每一个实体关系链对应的权重乘积项进行叠加,得到所述备选尾实体的第一权重。
7.一种贸易知识推理装置,其特征在于,包括:
图谱构建模块,用于基于原始知识图谱构建抽象知识图谱,所述抽象知识图谱由抽象头实体、抽象尾实体以及所述抽象头实体与所述抽象尾实体之间的关联关系构成;
数据获取模块,用于获取待查询语句,所述待查询语句由预设头实体以及目标关联关系构成,所述目标关联关系表示所述预设头实体与待确定的目标尾实体之间的关联关系;
关系链确定模块,用于基于所述待查询语句和所述抽象知识图谱确定至少一条满足所述目标关联关系的实体关系链;
实体确定模块,用于基于所述原始知识图谱以及至少一条实体关系链确定出至少一个备选尾实体,并基于至少一个备选尾实体确定所述待查询语句对应的目标尾实体。
8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述的知识问答方法。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的知识问答方法。
10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的知识问答方法。
CN202211074171.XA 2022-09-02 2022-09-02 知识问答方法、装置、电子设备和可读存储介质 Pending CN115658910A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211074171.XA CN115658910A (zh) 2022-09-02 2022-09-02 知识问答方法、装置、电子设备和可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211074171.XA CN115658910A (zh) 2022-09-02 2022-09-02 知识问答方法、装置、电子设备和可读存储介质

Publications (1)

Publication Number Publication Date
CN115658910A true CN115658910A (zh) 2023-01-31

Family

ID=85024461

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211074171.XA Pending CN115658910A (zh) 2022-09-02 2022-09-02 知识问答方法、装置、电子设备和可读存储介质

Country Status (1)

Country Link
CN (1) CN115658910A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117494806A (zh) * 2023-12-28 2024-02-02 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 基于知识图谱和大语言模型的关系抽取方法、***及介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117494806A (zh) * 2023-12-28 2024-02-02 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 基于知识图谱和大语言模型的关系抽取方法、***及介质
CN117494806B (zh) * 2023-12-28 2024-03-08 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 基于知识图谱和大语言模型的关系抽取方法、***及介质

Similar Documents

Publication Publication Date Title
CN110032641B (zh) 计算机执行的、利用神经网络进行事件抽取的方法及装置
CN111597314B (zh) 推理问答方法、装置以及设备
CN111523831B (zh) 风险团伙的识别方法、装置、存储介质和计算机设备
CN112926990A (zh) 欺诈识别的方法和装置
CN111522915A (zh) 中文事件的抽取方法、装置、设备及存储介质
US9009029B1 (en) Semantic hashing in entity resolution
CN109948140B (zh) 一种词向量嵌入方法及装置
CN116501898B (zh) 适用于少样本和有偏数据的金融文本事件抽取方法和装置
CN111291187A (zh) 一种情感分析方法、装置、电子设备及存储介质
CN112507139B (zh) 基于知识图谱的问答方法、***、设备及存储介质
CN109885180A (zh) 纠错方法和装置、计算机可读介质
CN115658910A (zh) 知识问答方法、装置、电子设备和可读存储介质
CN113190746B (zh) 推荐模型的评估方法、装置及电子设备
CN116992052B (zh) 用于威胁情报领域的长文本摘要方法、装置和电子设备
US20240221727A1 (en) Voice recognition model training method, voice recognition method, electronic device, and storage medium
CN116127974A (zh) 一种面向雷达的实体关系联合抽取方法
CN111737425B (zh) 一种应答方法、装置、服务器及存储介质
CN115577147A (zh) 可视化情报图谱检索方法、装置、电子设备及存储介质
CN111737419B (zh) 机器阅读理解中的数值推理方法和装置
CN114387088A (zh) 一种基于知识图谱的贷款风险识别方法及装置
CN112307205A (zh) 基于自动摘要的文本分类方法、***及计算机存储介质
CN111061924A (zh) 词组提取方法、装置、设备和存储介质
CN113505889B (zh) 图谱化知识库的处理方法、装置、计算机设备和存储介质
CN116257760A (zh) 一种数据划分方法、***、设备及计算机可读存储介质
CN117371445A (zh) 一种信息纠错方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination