CN115422346A - 基于知识图谱的多轮话题推荐方法 - Google Patents
基于知识图谱的多轮话题推荐方法 Download PDFInfo
- Publication number
- CN115422346A CN115422346A CN202211065167.7A CN202211065167A CN115422346A CN 115422346 A CN115422346 A CN 115422346A CN 202211065167 A CN202211065167 A CN 202211065167A CN 115422346 A CN115422346 A CN 115422346A
- Authority
- CN
- China
- Prior art keywords
- topic
- target
- subgraph
- user
- sub
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 239000011159 matrix material Substances 0.000 claims description 26
- 239000013598 vector Substances 0.000 claims description 20
- 238000005516 engineering process Methods 0.000 claims description 12
- 238000003062 neural network model Methods 0.000 claims description 12
- 238000004458 analytical method Methods 0.000 claims description 8
- 230000011218 segmentation Effects 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000004422 calculation algorithm Methods 0.000 claims description 4
- 238000005295 random walk Methods 0.000 claims description 4
- 239000002775 capsule Substances 0.000 description 9
- 239000003205 fragrance Substances 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 239000002304 perfume Substances 0.000 description 8
- 230000008569 process Effects 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 230000003993 interaction Effects 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本说明书提供一种基于知识图谱的多轮话题推荐方法、装置、电子设备及可读存储介质,通过在人工问答***维护了预先构建的用于进行话题推荐的知识图谱,所述知识图谱包括分别对应不同的话题类型的若干子图;所述若干子图中的任一子图包含若干存在关系的同一话题类型的话题节点;并可以由人工问答***获取用户输入的话题;从所述若干子图中确定与用户输入的话题的话题类型对应的第一目标子图;将所述第一目标子图中包含的话题节点对应的话题向所述用户进行话题推荐,并在所述第一目标子图中的话题节点对应的话题均推荐完成之后,将与所述第一目标子图的相似度最高的邻近子图中包含的话题节点,向所述用户进行话题推荐。
Description
技术领域
本说明书一个或多个实施例涉及计算机技术领域,尤其涉及一种基于知识图谱的多轮话题推荐方法及装置。
背景技术
随着计算机技术和网络技术的发展,人机交互的场景越来越广泛。人机问答***是人机交互领域的重要课题,人机问答***可以根据用户的输入的问题,自动的选择或者生成相应的回复。在人机问答***中,通常是由用户输入问题,***回答问题,而如何由人机问答***基于用户输入的内容推进话题,引导用户与人机问答***进行多轮对话,是本领域亟待解决的问题。
发明内容
有鉴于此,本说明书一个或多个实施例提供一种基于知识图谱的多轮话题推荐方法及装置,以解决相关技术中存在的问题。
为实现上述目的,本说明书一个或多个实施例提供技术方案如下:
根据本说明书一个或多个实施例的第一方面,提出了一种基于知识图谱的多轮话题推荐方法,应用于人机问答***,所述人机问答***维护了预先构建的用于进行话题推荐的知识图谱,所述知识图谱包括分别对应不同的话题类型的若干子图;所述若干子图中的任一子图包含若干存在关系的同一话题类型的话题节点,所述方法包括:
获取用户输入的话题;
从所述若干子图中确定与用户输入的话题的话题类型对应的第一目标子图;
将所述第一目标子图中包含的话题节点对应的话题向所述用户进行话题推荐,并在所述第一目标子图中的话题节点对应的话题均推荐完成之后,将与所述第一目标子图的相似度最高的邻近子图中包含的话题节点,向所述用户进行话题推荐。
根据本说明书一个或多个实施例的第二方面,提出了一种基于知识图谱的多轮话题推荐装置,应用于人机问答***,所述人机问答***维护了预先构建的用于进行话题推荐的知识图谱,将所述知识图谱包括分别对应不同的话题类型的若干子图;所述若干子图中的任一子图包含若干存在关系的话题节点,所述装置包括:
话题获取单元,获取用户输入的话题;
子图确定单元,从所述若干子图中确定与用户输入的话题的话题类型对应的第一目标子图;
话题推荐单元,将所述第一目标子图中包含的话题节点对应的话题向所述用户进行话题推荐,并在所述第一目标子图中的话题节点对应的话题均推荐完成之后,将与所述第一目标子图的相似度最高的邻近子图中包含的话题节点,向所述用户进行话题推荐。
根据本说明书一个或多个实施例的第三方面,提出了一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器通过运行所述可执行指令以实现如第一方面所述的方法。
根据本说明书一个或多个实施例的第四方面,提出了一种计算机可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现如第一方面所述方法的步骤。
本申请的有益效果:
本申请通过将知识图谱分割若干子图,先从与用户输入话题的话题类型对应的子图中进行话题推荐,再从其他相关度最高的子图中进行话题推荐,可以结合知识图谱中丰富的数据信息,使得人与机器谈论的话题更加深入,同时也可以实现了推荐的话题的丰富性和多样性。
附图说明
图1是一示例性实施例提供的一种用于进行话题推荐的知识图谱的子图的示意图。
图2是一示例性实施例提供的一种基于知识图谱的多轮话题推荐方法的流程图。
图3是一示例性实施例提供的一种展示知识图谱中各个子图之间关系的示意图。
图4是一示例性实施例提供的一种电子设备的示意结构图。
图5是一示例性实施例提供的一种基于知识图谱的多轮话题推荐装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本说明书一个或多个实施例相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本说明书一个或多个实施例的一些方面相一致的装置和方法的例子。
需要说明的是:在其他实施例中并不一定按照本说明书示出和描述的顺序来执行相应方法的步骤。在一些其他实施例中,其方法所包括的步骤可以比本说明书所描述的更多或更少。此外,本说明书中所描述的单个步骤,在其他实施例中可能被分解为多个步骤进行描述;而本说明书中所描述的多个步骤,在其他实施例中也可能被合并为单个步骤进行描述。
人机问答***,可以应用于诸多领域,例如电商平台的客服服务,智能汽车搭载的中控显示,智能音箱搭载的人工智能语音交互引擎等等,均可以作为一种人机问答***。现有的人机问答***通常是由用户提出问题,由人机问答***识别用户输入的问题,再从预设的问答库中选择问题的答案;或是由人机问答***识别用户输入的问题中的相关实体,再从预设的知识图谱中找到与实体具有关系的其他实体,并基于自然语言处理技术组织为问题的答案。
而现有技术中的人机问答***通常是由用户提出问题,再由人机问答***给出问题的答案,不能进行话题推荐。或是人机问答***在给出问题的答案后,只能基于预设的问题库中的问题进行提问,在进行多轮对话后,再次提出的问题往往是重复的问题,并不能做到人与机器谈论的话题更加深入。
有鉴于此,本说明书提出一种基于知识图谱的多轮对话方法,通过将知识图谱切割为具有若干话题类型的子图,先从与用户输入话题的话题类型对应的子图中进行话题推荐,再从其他相关度最高的子图中进行话题推荐的技术方案。
在实现时,可以获取用户输入的话题;从所述若干子图中确定与用户输入的话题的话题类型对应的第一目标子图;将所述第一目标子图中包含的话题节点对应的话题向所述用户进行话题推荐,并在所述第一目标子图中的话题节点对应的话题均推荐完成之后,将与所述第一目标子图的相似度最高的邻近子图中包含的话题节点,向所述用户进行话题推荐。
下面结合附图对本说明书的基于知识图谱的多轮话题推荐方法进行详细说明。
在本说明书中,人机问答***可以维护预先构建的用于进行话题推荐的知识图谱,其中知识图谱可以包括若干个话题节点,每个话题节点之间存在关系。人机问答***可以基于知识图谱中的话题节点对应的话题进行话题推荐。在本说明书中,构建知识图谱的具体方式不做具体限定,例如,可以通过多种渠道获取结构化数据源,构建用于进行话题推荐的知识图谱;也可以通过技术手段,从百科类网站或数据中心采集数据,构建知识库,再进一步构建进行话题推荐的知识图谱等等。
其中,上述知识图谱还可以包括分别对应不同话题类型的若干子图,所述若干子图中的任一子图包含存在关系的同一话题类型的话题节点。以应用在智能汽车搭载的中控显示的人机问答***为例,可以将与智能汽车的空调相关设置的节点划分为同一话题类型,因此该话题类型可以是“空调”;以应用在电商平台的客服服务的人机问答***为例,可以将与A商品相关参数的节点划分为同一话题类型,因此该话题类型可以是“A商品”。
图1是一示例性实施例提供的一种用于进行话题推荐知识图谱的子图的示意图。如图1所示,该子图的可以包括与空调相关设置的若干话题节点,因此该子图的话题类型可以是“空调”。人机问答***可以基于该子图中的话题节点,针对用于输入的话题进行话题推荐。
在一种实施方式中,可以基于随机游走分割算法,将人机问答***维护的预先构建的用于进行话题推荐的知识图谱分割为若干子图。其中,随机游走分割算法的具体实现方式,在本说明书中不再详细赘述。具体的,可以由用户指定知识图谱中的若干话题节点,作为标记节点,基于标记节点和与标记节点相邻的未标记的邻接节点之间的关系,计算从标记节点转移到邻接节点的概率,根据概率大小,划分未标记节点,得到最终分割结果,将预先构建的用于进行话题推荐的知识图谱分割为若干子图。图2是一示例性实施例提供的一种基于知识图谱的多轮话题推荐方法的流程图。如图2所示,该方法可以包括以下步骤:
步骤202,获取用户输入的话题。
在本说明书中,人机问答***可以基于用户输入的内容,获取用户输入的话题;其中,用户可以输入文本形式的内容、音频形式的内容等等。针对文本形式的内容,人机问答***可以基于语义分析等技术,从文本形式内容中提取出用户输入的话题;针对音频形式的内容,人机问答***可以先将音频转化为文本,再从文本形式内容中提取出用户输入的话题。
例如,当用户输入“请打开空调。”,人机问答***可以基于语义分析等技术,确定当前话题为“打开”。又例如,当用户输入“A商品的价格是多少?”,人机问答***可以确定当前话题为“价格”。
在一种实施方式中,还可以获取用户输入的内容,以及用户在人机问答***中的历史输入内容,并基于语义分析技术,对所述用户的输入内容,以及所述用户在所述问答***中的历史输入内容进行语义分析,以确定用户的输入内容对应的话题。
例如,当用户输入“请打开空调。”后,经过一段时间后,用户再次输入“关闭。”,人机问答***可以结合用户当前输入的内容以及用户历史输入的内容,确定当前话题为空调的“关闭”。又例如,当用户输入“A商品的价格是多少?”后,再次输入“是否具有其他优惠?”,人机问答***可以结合用户当前输入的内容以及用户历史输入的内容,确定当前话题为A商品的“优惠”。
步骤204,从所述若干子图中确定与用户输入的话题的话题类型对应的第一目标子图。
在获取到用户输入的话题后,可以确定该话题对应的话题类型,并根据该话题的话题类型确定第一目标子图。在本说明书中,目标子图是指与话题类型对应的子图,例如图1示出的子图,其话题类型为“空调”。
例如,当用户输入“请打开空调。”后,再次输入“调整温度为26度。”,此时可以确定当前话题为空调的“温度”,由于与“温度”相关的话题节点,属于与空调相关的子图,因此可以确定当前话题类型为“空调”,可以通过话题类型进一步确定与“空调”对应的第一目标子图。又例如,当用户输入“A商品的价格是多少?”后,再次输入“A商品的材质是?”,此时可以确定当前话题为A商品的“材质”,由于与“材质”相关的话题节点,属于与A商品相关的子图,因此可以确定当前话题类型为“A商品”,可以通过话题类型进一步确定与“A商品”对应的第一目标子图。
步骤206,将所述第一目标子图中包含的话题节点对应的话题向所述用户进行话题推荐,并在所述第一目标子图中的话题节点对应的话题均推荐完成之后,将与所述第一目标子图的相似度最高的邻近子图中包含的话题节点,向所述用户进行话题推荐。
在获取到用户输入的话题,确定该话题对应的第一目标子图后,可以从第一目标子图中选择话题节点进行推荐。其中,话题节点的具体选择方式在本说明书不做具体限定,例如,可以基于第一目标子图中各个话题节点之间的关系计算关系权重,基于关系权重进行推荐话题节点,也可以随机选择第一目标子图内的话题节点进行推荐,还可以在子图分割过程中由用户指定各个话题节点的推荐顺序等等。
在本说明书中,确定用于进行话题推荐的话题节点后,人机问答***可以基于自然语言处理领域的相关技术,将话题节点对应的话题组织为完整的语句向用户进行输出展示。
在一种实施方式中,可以确定所述用户输入的话题在所述第一目标子图中对应的目标话题节点。在本说明书中,目标话题节点可以指与话题类型之直接对应的话题节点。通常情况下,在确定用户输入的话题后,可以在第一目标子图中确定对应的话题节点。
例如,当用户输入“请打开空调。”可以确定话题类型为“空调”,因此第一目标子图为与空调相关的子图,目标节点即为第一目标子图中的“空调”节点。
当确定目标话题节点后,可以基于所述目标话题节点与所述第一目标子图中各个话题节点之间的关系,计算第一目标子图中各个话题节点的关系权重。所述关系权重用于指示所述目标话题节点与所述第一目标子图中各个话题节点的关联程度。基于所述关系权重,选择所述第一目标子图中的话题节点,并将所述话题节点对应的话题作为目标话题对所述用户进行推荐。
其中,目标话题节点与所述第一目标子图中各个话题节点之间的关系可以为知识图谱中获取的三元组关系;可以将所述三元组结构输入预先训练的神经网络模型,得到每个三元组结构对应的权重值,作为计算第一目标子图中各个话题节点的关系权重。其中,神经网络模型可以使用Word2vec等模型,本说明书对此不作限定。关系权重用于指示所述目标话题节点与所述第一目标子图中各个话题节点的关联程度,关系权重越大,目标话题节点与第一目标子图中的话题节点的关联程度越高。
例如,以图1示出的子图为例,可以将三元组“空调”控制“温度”作为目标话题节点“空调”与第一目标子图中的话题节点“温度”之间的关系,可以将该三元组关系输入预先训练的神经网络模型,得到三元组结构对应的权重值,作为话题节点“温度”的关系权重。需要说明的是,以图1示出的子图为例,“9号香水”与目标话题节点“温度”并没有直接关系,而存在间接关系,因此可以将三元组“空调”控制“香氛胶囊”和“香氛胶囊”的味道是“9号香水”两组三元组结构均输入神经网络模型,分别得到两组三元组结构对应的两个权重值,可以计算两个权重值的乘积,作为“9号香水”对应的权重值。同时,计算存在间接关系的话题节点的关系权重时,还可以话题节点间路径的距离,额外设置乘法因子,以使得到的关系权重更加准确。
在确定第一目标子图中各个话题节点的关系权重后,可以基于关系权重选择第一目标子图中的话题节点,并将话题节点对应的话题进行推荐。具体的,可以基于计算出的关系权重的大小,直接选择用于话题推荐的话题节点。
例如,以图1示出的子图为例,“打开/关闭”节点的关系权重为0.9,“香氛胶囊”节点的关系权重为0.8,“温度”节点的关系权重为0.75,“9号香水”节点的关系权重为0.72,当目标话题节点为“空调时”,可以基于“打开/关闭”,“香氛胶囊”,“温度”的顺序向用户进行话题推荐。
需要说明的是,问答***还可以存储已经进行推荐过的话题节点,并存储该话题节点对应的关系权重。当基于关系权重进行话题推荐某一话题节点后,还需要判断其他话题节点与该被推荐过话题节点是否存在关系,如果某一话题节点与被推荐过话题节点存在关系则需要将该话题节点的关系权重与推荐过话题节点的关系权重进行除法运算得到新的关系权重,并更新该节点的关系权重。同时,如果预先设置乘法因子,也需要与乘法因子进行除法运算,并更新该节点的关系权重。
例如,以图1示出的子图为例,“打开/关闭”节点的关系权重为0.9,“香氛胶囊”节点的关系权重为0.8,“温度”节点的关系权重为0.75,“9号香水”节点的关系权重为0.72,当目标话题节点为“空调时”,可以基于“打开/关闭”,“香氛胶囊”,“温度”的顺序向用户进行话题推荐。当向用户推荐了“香氛胶囊”后,由于“9号香水”与“香氛胶囊”之间存在关系,因此需要将“9号香水”的关系权重与“香氛胶囊”的关系权重进行除法运算得到新的关系权重0.9,此时可以基于“9号香水”,“温度”的顺序向用户进行话题推荐。
当第一目标子图中的包含的话题节点对应的话题均向用户进行推荐后,可以找到与第一目标子图相似度最高的邻近子图,并从邻近子图中确定用于进行话题推荐的话题节点。
在一种实施方式中,可以遍历与所述第一目标子图相邻的邻近子图,计算第一目标子图与邻近子图之间的相似度,并将与所述将与所述第一目标子图的相似度最高的邻近子图中包含的话题节点,向所述用户进行话题推荐。需要说明的是,在遍历邻近子图时,可以基于子图之间路径的距离,优先计算与第一目标子图之间路径的距离较短的邻近子图,与第一目标子图之间的相似度,再进一步与第一目标子图之间路径的距离较长的邻近子图,与第一目标子图之间的相似度。其中,计算第一目标子图与邻近子图之间的相似度的具体方式,在本说明书中不做限定,例如,可以基于计算第一目标子图与邻近子图中各个节点的之间的相似度综合计算第一目标子图与邻近子图之间的相似度,也可以基于第一目标子图与邻近子图的图结构生成第一目标子图与邻近子图对应的向量,并计算向量之间的相似度作为第一目标子图与邻近子图之间的相似度。
图3是一示例性实施例提供的一种展示知识图谱中各个子图之间关系的示意图。如图3所示,由于第一邻近子图、第三邻近子图、第四邻近子图与第一目标子图之间的路径的距离为1,而第二邻近子图与第一目标子图之间的路径的距离为2,因此,可以分别计算第一目标子图与第一邻近子图、第三邻近子图、第四邻近子图之间的相似度,再计算第一目标子图与第二邻近子图之间的相似度。
在一种实施方式中,可以分别计算所述第一目标子图和所述邻近子图的拉普拉斯矩阵,并分别基于所述第一目标子图和所述邻近子图的拉普拉斯矩阵;其中,可以分别计算第一目标子图和所述邻近子图的度矩阵以及邻接矩阵,将度矩阵减去邻接矩阵即可得到拉普拉斯矩阵。
在计算出第一目标子图和邻近子图拉普拉斯矩阵后,可以计算第一目标子图对应的矩阵向量和所述邻近子图对应的矩阵向量;其中,通过矩阵计算矩阵向量的具体计算方式可以参考线性代数相关内容,在本说明书中不再赘述。
计算所述第一目标子图和所述邻近子图的矩阵向量后,可以计算矩阵向量之间的相似度,将矩阵向量之间的相似度作为第一目标子图和所述邻近子图之间的相似度。其中,可以计算矩阵向量之间的距离作为矩阵向量之间的相似度,例如,可以计算矩阵向量之间的曼哈顿距离作为矩阵向量之间的相似度,或者计算矩阵向量之间的余弦距离作为矩阵向量之间的相似度。
在一种实施方式中,可以预先设定第一目标子图和邻近子图之间的相似度的阈值。将上述第一目标子图和邻近子图之间的相似度高于预设的相似度阈值,且相似度最高的所述邻近子图确定为第二目标子图;并从第二目标子图中选择话题节点,向用户进行话题推荐。需要说明的是,可以优先计算与第一目标子图之间路径的距离较短的邻近子图,与第一目标子图之间的相似度,当所有路径的距离较短的邻近子图与第一目标子图之间的相似度均小于预设的相似度阈值时,再计算与第一目标子图之间路径的距离更大的邻近子图,与第一目标子图之间的相似度。
例如,以图3为例,由于第一邻近子图、第三邻近子图、第四邻近子图与第一目标子图之间的路径的距离为1,而第二邻近子图与第一目标子图之间的路径的距离为2,因此,可以优先计算第一目标子图与第一邻近子图、第三邻近子图、第四邻近子图之间的相似度,当上述相似度均低于阈值时,再计算第一目标子图与第二邻近子图之间的相似度。
在一种实施方式中,在确定第二目标子图后,需要从第二目标子图中确定用于进行话题推荐的话题节点。在本说明书中,可以计算所述目标话题节点与所述第二目标子图中各个话题节点之间的相似度。其中,目标话题节点与所述第二目标子图中各个话题节点之间的相似度的计算方式,在本说明书中不做具体限定,例如,可以通关预先训练用于计算各个话题节点之间相似度的图神经网络,还可以直接获取话题节点所代表的语义,计算话题节点之间的语义的相似度作为目标话题节点与所述第二目标子图中各个话题节点之间的相似度等等。
在一种实施方式中,本说明书还提供一种图神经网络的训练方法,用于计算各个话题节点之间相似度。
其中,可以获取任意知识图谱作为图神经网络的训练样本,基于以下公式进行训练:
然后可以选择第二个知识图谱作为训练样本,基于以下公式进一步进行训练:
最后,对知识图谱样本中的节点之间的关系集合进行更新:
在计算出目标话题节点与所述第二目标子图中各个话题节点之间的相似度之后,可以基于所述相似度确定所述第二目标子图中各个话题节点的相似度权重;所述相似度权重用于指示目标话题节点与所述第二目标子图中各个话题节点的关联程度。其中,可以将目标话题节点与所述第二目标子图中各个话题节点之间的相似度的数值大小,直接作为各个话题节点的相似度权重,所述相似度权重越大,说明目标话题节点与第二目标子图中的话题节点的关联程度越高。还可以额外设置乘法因子,将目标话题节点与所述第二目标子图中各个话题节点之间的相似度与预设的乘法因子进行计算,以使得到的相似度权重更加准确。
在确定第而目标子图中各个话题节点的相似度权重后,可以基于相似度权重选择第二目标子图中的话题节点,并将话题节点对应的话题进行推荐。具体的,可以基于计算出的相似度权重的大小,直接选择相似度权重最大的话题节点,进行话题推荐。
需要说明的是,从第二目标子图选择出话题节点后,再次进行话题推荐需要从第二目标子图中选择话题节点。因此,上述目标话题节点变更为与第二目标子图的话题类型直接对应的话题节点,可以通过计算目标话题节点与第二目标子图中各个话题节点的关系权重,进一步从第二目标子图中选择话题节点进行推荐,在此处不再赘述。
例如,可以通过上述第一目标子图和邻近子图之间的相似度,确定第三邻接子图为第二目标子图;然后可以计算目标话题节点“空调”与第三邻接子图中各个话题节点之间的相似度,基于目标话题节点与第三邻接子图中各个话题节点计算每个话题节点之间的相似度权重,将相似度权重最大的话题节点对应的话题向用户进行推荐。
在一种实施方式中,可以将将所述第一目标子图和所述第二目标子图输入预先训练的图神经网络模型进行相似度计算,以分别计算出所述目标话题节点与所述第二目标子图中各个话题节点之间的相似度。其中,图神经网络模型可以是GCN模型,compGCN模型等图神经网络模型。将所述第一目标子图和所述第二目标子图输入图神经网络模型后,可以直接计算目标话题节点与所述第二目标子图中各个话题节点之间的相似度。
图4是一示例性实施例提供的一种电子设备的示意结构图。请参考图4,在硬件层面,该设备包括处理器402、内部总线404、网络接口406、内存408以及非易失性存储器410,当然还可能包括其他任务所需要的硬件。本说明书一个或多个实施例可以基于软件方式来实现,比如由处理器402从非易失性存储器410中读取对应的计算机程序到内存408中然后运行。当然,除了软件实现方式之外,本说明书一个或多个实施例并不排除其他实现方式,比如逻辑器件亦或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
请参考图5,图5是一示例性实施例提供的一种基于知识图谱的多轮话题推荐的框图。
话题获取单元502,用于获取用户输入的话题;
子图确定单元504,用于从所述若干子图中确定与用户输入的话题的话题类型对应的第一目标子图;
话题推荐单元506,用于将所述第一目标子图中包含的话题节点对应的话题向所述用户进行话题推荐,并在所述第一目标子图中的话题节点对应的话题均推荐完成之后,将与所述第一目标子图的相似度最高的邻近子图中包含的话题节点,向所述用户进行话题推荐。
可选的,所述话题推荐单元506,具体用于确定所述用户输入的话题在所述第一目标子图中对应的目标话题节点;
基于所述目标话题节点与所述第一目标子图中各个话题节点之间的关系,计算所述第一目标子图中各个话题节点的关系权重;所述关系权重用于指示所述目标话题节点与所述第一目标子图中各个话题节点的关联程度;
基于所述关系权重,选择所述第一目标子图中的话题节点,并将所述话题节点对应的话题作为目标话题对所述用户进行推荐。
可选的,所述话题推荐单元506,具体用于遍历与所述第一目标子图相邻的邻近子图,计算所述第一目标子图和所述邻近子图之间的相似度;
将与所述第一目标子图的相似度最高的邻近子图中包含的话题节点,向所述用户进行话题推荐。
可选的,所述话题推荐单元506,具体用于分别计算所述第一目标子图和所述邻近子图的拉普拉斯矩阵;
分别基于所述第一目标子图和所述邻近子图的拉普拉斯矩阵,计算第一目标子图对应的矩阵向量和所述邻近子图对应的矩阵向量;
计算所述第一目标子图和所述邻近子图的矩阵向量之间的相似度,作为所述第一目标子图和所述邻近子图之间的相似度。
可选的,所述话题推荐单元506,具体用于:将所述相似度高于预设的相似度阈值,且相似度最高的所述邻近子图确定为第二目标子图;
将所述第二目标子图中包含的话题节点,向所述用户进行话题推荐。
可选的,所述话题推荐单元506,具体用于计算所述目标话题节点与所述第二目标子图中各个话题节点之间的相似度;
基于所述相似度确定所述第二目标子图中各个话题节点的相似度权重;所述相似度权重用于指示目标话题节点与所述第二目标子图中各个话题节点的关联程度。
基于所述相似度权重,选择所述第二目标子图中的话题节点,并将所述话题节点对应的话题作为目标话题对所述用户进行推荐。
可选的,所述话题推荐单元506,具体用于将所述第一目标子图和所述第二目标子图输入预先训练的图神经网络模型进行相似度计算,以分别计算出所述目标话题节点与所述第二目标子图中各个话题节点之间的相似度。
可选的,所述装置还包括子图分割单元,用于基于随机游走分割算法,将所述知识图谱分割为若干子图。
可选的,话题获取单元502具体用于获取用户的输入内容,以及所述用户在所述问答***中的历史输入内容;
基于语义分析技术,对所述用户的输入内容,以及所述用户在所述问答***中的历史输入内容进行语义分析,以确定用户的输入内容对应的话题。
上述实施例阐明的***、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机,计算机的具体形式可以是个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件收发设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任意几种设备的组合。
在一个典型的配置中,计算机包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带、磁盘存储、量子存储器、基于石墨烯的存储介质或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
在本说明书一个或多个实施例使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书一个或多个实施例可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
以上所述仅为本说明书一个或多个实施例的较佳实施例而已,并不用以限制本说明书一个或多个实施例,凡在本说明书一个或多个实施例的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本说明书一个或多个实施例保护的范围之内。
Claims (12)
1.一种基于知识图谱的多轮话题推荐方法,应用于人机问答***,所述人机问答***维护了预先构建的用于进行话题推荐的知识图谱,所述知识图谱包括分别对应不同的话题类型的若干子图;所述若干子图中的任一子图包含若干存在关系的同一话题类型的话题节点,所述方法包括:
获取用户输入的话题;
从所述若干子图中确定与用户输入的话题的话题类型对应的第一目标子图;
将所述第一目标子图中包含的话题节点对应的话题向所述用户进行话题推荐,并在所述第一目标子图中的话题节点对应的话题均推荐完成之后,将与所述第一目标子图的相似度最高的邻近子图中包含的话题节点,向所述用户进行话题推荐。
2.根据权利要求1所述的方法,将所述第一目标子图中包含的话题节点对应的话题向所述用户进行话题推荐,包括:
确定所述用户输入的话题在所述第一目标子图中对应的目标话题节点;
基于所述目标话题节点与所述第一目标子图中各个话题节点之间的关系,计算所述第一目标子图中各个话题节点的关系权重;所述关系权重用于指示所述目标话题节点与所述第一目标子图中各个话题节点的关联程度;
基于所述关系权重,选择所述第一目标子图中的话题节点,并将所述话题节点对应的话题作为目标话题对所述用户进行推荐。
3.根据权利要求1所述的方法,将与所述第一目标子图的相似度最高的邻近子图中包含的话题节点,向所述用户进行话题推荐,包括:
遍历与所述第一目标子图相邻的邻近子图,计算所述第一目标子图和所述邻近子图之间的相似度;
将与所述第一目标子图的相似度最高的邻近子图中包含的话题节点,向所述用户进行话题推荐。
4.根据权利要求3所述的方法,计算所述第一目标子图和所述邻近子图之间的相似度,包括:
分别计算所述第一目标子图和所述邻近子图的拉普拉斯矩阵;
分别基于所述第一目标子图和所述邻近子图的拉普拉斯矩阵,计算第一目标子图对应的矩阵向量和所述邻近子图对应的矩阵向量;
计算所述第一目标子图和所述邻近子图的矩阵向量之间的相似度,作为所述第一目标子图和所述邻近子图之间的相似度。
5.根据权利要求3所述的方法,将与所述第一目标子图的相似度最高的邻近子图中包含的话题节点,向所述用户进行话题推荐,包括:
将所述相似度高于预设的相似度阈值,且相似度最高的所述邻近子图确定为第二目标子图;
将所述第二目标子图中包含的话题节点,向所述用户进行话题推荐。
6.根据权利要求5所述的方法,将所述第二目标子图中包含的话题节点,向所述用户进行话题推荐,包括:
计算所述目标话题节点与所述第二目标子图中各个话题节点之间的相似度;
基于所述相似度确定所述第二目标子图中各个话题节点的相似度权重;所述相似度权重用于指示目标话题节点与所述第二目标子图中各个话题节点的关联程度;
基于所述相似度权重,选择所述第二目标子图中的话题节点,并将所述话题节点对应的话题作为目标话题对所述用户进行推荐。
7.根据权利要求6所述的方法,计算所述目标话题节点与所述第二目标子图中各个话题节点之间的相似度,包括:
将所述第一目标子图和所述第二目标子图输入预先训练的图神经网络模型进行相似度计算,以分别计算出所述目标话题节点与所述第二目标子图中各个话题节点之间的相似度。
8.根据权利要求1所述的方法,所述方法还包括:
基于随机游走分割算法,将所述知识图谱分割为若干子图。
9.根据权利要求1所述的方法,所述获取用户输入的话题,包括:
获取用户的输入内容,以及所述用户在所述问答***中的历史输入内容;
基于语义分析技术,对所述用户的输入内容,以及所述用户在所述问答***中的历史输入内容进行语义分析,以确定用户的输入内容对应的话题。
10.一种基于知识图谱的多轮话题推荐装置,应用于人机问答***,所述人机问答***维护了预先构建的用于进行话题推荐的知识图谱,将所述知识图谱包括分别对应不同的话题类型的若干子图;所述若干子图中的任一子图包含若干存在关系的话题节点,所述装置包括:
话题获取单元,用于获取用户输入的话题;
子图确定单元,用于从所述若干子图中确定与用户输入的话题的话题类型对应的第一目标子图;
话题推荐单元,用于将所述第一目标子图中包含的话题节点对应的话题向所述用户进行话题推荐,并在所述第一目标子图中的话题节点对应的话题均推荐完成之后,将与所述第一目标子图的相似度最高的邻近子图中包含的话题节点,向所述用户进行话题推荐。
11.一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器通过运行所述可执行指令以实现如权利要求1-9中任一项所述的方法。
12.一种计算机可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现如权利要求1-9中任一项所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211065167.7A CN115422346A (zh) | 2022-08-29 | 2022-08-29 | 基于知识图谱的多轮话题推荐方法 |
PCT/CN2023/109627 WO2024045964A1 (zh) | 2022-08-29 | 2023-07-27 | 基于知识图谱的多轮话题推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211065167.7A CN115422346A (zh) | 2022-08-29 | 2022-08-29 | 基于知识图谱的多轮话题推荐方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115422346A true CN115422346A (zh) | 2022-12-02 |
Family
ID=84202491
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211065167.7A Pending CN115422346A (zh) | 2022-08-29 | 2022-08-29 | 基于知识图谱的多轮话题推荐方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN115422346A (zh) |
WO (1) | WO2024045964A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024045964A1 (zh) * | 2022-08-29 | 2024-03-07 | 浙江极氪智能科技有限公司 | 基于知识图谱的多轮话题推荐方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111639169A (zh) * | 2020-05-29 | 2020-09-08 | 京东方科技集团股份有限公司 | 人机交互方法及装置、计算机可读存储介质及电子设备 |
CN112765322B (zh) * | 2021-01-25 | 2023-05-23 | 河海大学 | 基于水利领域知识图谱的遥感影像搜索推荐方法 |
CN113297369B (zh) * | 2021-07-26 | 2022-04-01 | 中国科学院自动化研究所 | 基于知识图谱子图检索的智能问答*** |
CN114550705B (zh) * | 2022-02-18 | 2024-04-12 | 北京百度网讯科技有限公司 | 对话推荐方法、模型的训练方法、装置、设备及介质 |
CN115422346A (zh) * | 2022-08-29 | 2022-12-02 | 浙江极氪智能科技有限公司 | 基于知识图谱的多轮话题推荐方法 |
-
2022
- 2022-08-29 CN CN202211065167.7A patent/CN115422346A/zh active Pending
-
2023
- 2023-07-27 WO PCT/CN2023/109627 patent/WO2024045964A1/zh unknown
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024045964A1 (zh) * | 2022-08-29 | 2024-03-07 | 浙江极氪智能科技有限公司 | 基于知识图谱的多轮话题推荐方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2024045964A1 (zh) | 2024-03-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108920654B (zh) | 一种问答文本语义匹配的方法和装置 | |
US20150278350A1 (en) | Recommendation System With Dual Collaborative Filter Usage Matrix | |
CN110619044B (zh) | 一种情感分析方法、***、存储介质及设备 | |
CN107492008A (zh) | 信息推荐方法、装置、服务器及计算机存储介质 | |
CN110019668A (zh) | 一种文本检索方法及装置 | |
JP7484141B2 (ja) | 電子文書の分類 | |
CN110795613B (zh) | 商品搜索方法、装置、***及电子设备 | |
Vinhas et al. | Fitness and novelty in evolutionary art | |
Burtini et al. | Improving online marketing experiments with drifting multi-armed bandits | |
CN112434211A (zh) | 一种数据处理方法、装置、存储介质及设备 | |
CN112015909A (zh) | 知识图谱的构建方法及装置、电子设备、存储介质 | |
CN112100400A (zh) | 基于知识图谱的节点推荐方法及装置 | |
WO2024045964A1 (zh) | 基于知识图谱的多轮话题推荐方法 | |
CN110019670A (zh) | 一种文本检索方法及装置 | |
CN116764236A (zh) | 游戏道具推荐方法、装置、计算机设备和存储介质 | |
CN112819154B (zh) | 一种应用于图学习领域的预训练模型的生成方法及装置 | |
CN111611409B (zh) | 一种融入场景知识的事例分析方法及相关设备 | |
CN111144098B (zh) | 扩展问句的召回方法和装置 | |
CN115391489A (zh) | 基于知识图谱的话题推荐方法 | |
CN108229572B (zh) | 一种参数寻优方法及计算设备 | |
CN110851600A (zh) | 基于深度学习的文本数据处理方法及装置 | |
CN110210030B (zh) | 语句分析的方法及装置 | |
CN113919979A (zh) | 知识追踪方法、装置、非易失性存储介质及电子装置 | |
CN106776529B (zh) | 业务情感分析方法及装置 | |
CN107451662A (zh) | 优化样本向量的方法及装置、计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |