CN110008326A - 会话***中的知识摘要生成方法及*** - Google Patents

会话***中的知识摘要生成方法及*** Download PDF

Info

Publication number
CN110008326A
CN110008326A CN201910255435.3A CN201910255435A CN110008326A CN 110008326 A CN110008326 A CN 110008326A CN 201910255435 A CN201910255435 A CN 201910255435A CN 110008326 A CN110008326 A CN 110008326A
Authority
CN
China
Prior art keywords
knowledge
knowledge point
session
theme
abstract
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910255435.3A
Other languages
English (en)
Other versions
CN110008326B (zh
Inventor
缪庆亮
初敏
葛付江
郭涛涛
殷晨鑫
豆家敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sipic Technology Co Ltd
Original Assignee
AI Speech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AI Speech Ltd filed Critical AI Speech Ltd
Priority to CN201910255435.3A priority Critical patent/CN110008326B/zh
Publication of CN110008326A publication Critical patent/CN110008326A/zh
Application granted granted Critical
Publication of CN110008326B publication Critical patent/CN110008326B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种会话***中的知识摘要生成方法及***,所述方法包括:预先构建知识组织结构,所述知识组织结构包括主题图谱和知识点图谱;记录用户在会话过程中所涉及的会话主题和多个会话知识点;至少基于所述主题和所述多个会话知识点生成所述知识摘要。本发明中通过预先构建主体图谱和知识点图谱用于知识摘要的生成,从而生成的摘要形式是结构化文本,生成的摘要粒度是知识点级,便于用户的使用和大规模自动分析。

Description

会话***中的知识摘要生成方法及***
技术领域
本发明涉及人工智能技术领域,尤其涉及一种会话***中的知识摘要 生成方法及***。
背景技术
目前已有技术或产品主要的摘要生成方法大多基于文本摘要模型,即 将用户会话分成若干会话组,每个会话组包括多个句子,然后利用主题模 型、主题聚类、神经网络技术自动生成文本摘要或利用信息抽取技术从文 本中抽取重要的句子组合成摘要。因此传统技术利用文本摘要的方法,生 成的摘要形式是非结构化文本,缺少结构信息;生成的摘要粒度是篇章, 段落或句子级,而不是知识点级,因而不利于用户的使用和大规模自动分析。
发明内容
本发明实施例提供一种会话***中的知识摘要生成方法及***,用于 至少解决上述技术问题之一。
第一方面,本发明实施例提供一种会话***中的知识摘要生成方法, 包括:
预先构建知识组织结构,所述知识组织结构包括主题图谱和知识点图 谱;
记录用户在会话过程中所涉及的会话主题和多个会话知识点;
至少基于所述主题和所述多个会话知识点生成所述知识摘要。
第二方面,本发明实施例提供一种会话***中的知识摘要生成***, 包括:
图谱构建程序模块,用于预先构建知识组织结构,所述知识组织结构 包括主题图谱和知识点图谱;
记录程序模块,用于记录用户在会话过程中所涉及的会话主题和多个 会话知识点;
摘要生成程序模块,用于至少基于所述主题和所述多个会话知识点生 成所述知识摘要。
第三方面,本发明实施例提供一种存储介质,所述存储介质中存储有 一个或多个包括执行指令的程序,所述执行指令能够被电子设备(包括但 不限于计算机,服务器,或者网络设备等)读取并执行,以用于执行本发 明上述任一项会话***中的知识摘要生成方法。
第四方面,提供一种电子设备,其包括:至少一个处理器,以及与所 述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述 至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使 所述至少一个处理器能够执行本发明上述任一项会话***中的知识摘要 生成方法。
第五方面,本发明实施例还提供一种计算机程序产品,所述计算机程 序产品包括存储在存储介质上的计算机程序,所述计算机程序包括程序指 令,当所述程序指令被计算机执行时,使所述计算机执行上述任一项会话 ***中的知识摘要生成方法。
本发明实施例的有益效果在于:本发明中通过预先构建主体图谱和知 识点图谱用于知识摘要的生成,从而生成的摘要形式是结构化文本,生成 的摘要粒度是知识点级,便于用户的使用和大规模自动分析。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中 所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发 明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的 前提下,还可以根据这些附图获得其他的附图。
图1为本发明的会话***中的知识摘要生成方法的一实施例的流程 图;
图2为本发明的会话***中的知识摘要生成方法的另一实施例的流程 图;
图3为本发明的会话***中的知识摘要生成方法的又一实施例的流程 图;
图4为本发明实施例中的会话过程中知识点路径示意图;
图5为本发明实施例中的知识摘要可视化图形形式的示意图;
图6为本发明实施例中的主题和知识点的组织结构示意图;
图7为本发明实施例中的主题图谱中主题之间的关系的示意图;
图8为本发明实施例中的主题图谱的节点和知识点图谱的节点之间的 关系示意图;
图9为本发明实施例中的知识点图谱中知识点间关系的示意图;
图10为本发明的会话***中的知识摘要生成***的一实施例的原理 框图;
图11为本发明中的会话***中的知识摘要生成***的另一实施例的 原理框图;
图12为本发明中的扩展程序模块的一实施例的原理框图;
图13为本发明中的会话***中的知识摘要生成***的另一实施例的 原理框图;
图14为本发明的电子设备的一实施例的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本 发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描 述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。 基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提 下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的 特征可以相互组合。
本发明可以在由计算机执行的计算机可执行指令的一般上下文中描 述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象 数据类型的例程、程序、对象、元件、数据结构等等。也可以在分布式计 算环境中实践本发明,在这些分布式计算环境中,由通过通信网络而被连 接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于 包括存储设备在内的本地和远程计算机存储介质中。
在本发明中,“模块”、“装置”、“***”等指应用于计算机的相关实体, 如硬件、硬件和软件的组合、软件或执行中的软件等。详细地说,例如, 元件可以、但不限于是运行于处理器的过程、处理器、对象、可执行元件、 执行线程、程序和/或计算机。还有,运行于服务器上的应用程序或脚本 程序、服务器都可以是元件。一个或多个元件可在执行的过程和/或线程 中,并且元件可以在一台计算机上本地化和/或分布在两台或多台计算机 之间,并可以由各种计算机可读介质运行。元件还可以根据具有一个或多 个数据包的信号,例如,来自一个与本地***、分布式***中另一元件交 互的,和/或在因特网的网络通过信号与其它***交互的数据的信号通过 本地和/或远程过程来进行通信。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术 语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定 要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而 且,术语“包括”、“包含”,不仅包括那些要素,而且还包括没有明确列出 的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要 素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除 在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本专利希望构建一种结构化的,知识点粒度的,可扩展延伸的知识摘 要方法及装置。首先对会话***中的知识点进行主题化组织和细粒度化, 建立主题、知识点之间的关联关系及关联强度。然后基于会话***中主题 和知识点的组织结构,同时结合用户在会话过程中提及的知识点,以及相 关知识点,自动构建用户的知识摘要,并对知识摘要进行可视化,从而完 成更高效知识总结和整理,提高用户获得知识的效率,提高用户满意度。
如图1所示,本发明的实施例提供一种会话***中的知识摘要生成方 法,包括:
S11、预先构建知识组织结构,所述知识组织结构包括主题图谱和知 识点图谱;
S12、记录用户在会话过程中所涉及的会话主题和多个会话知识点;
S13、至少基于所述会话主题和所述多个会话知识点生成所述知识摘 要。
本发明实施例中通过预先构建主体图谱和知识点图谱用于知识摘要 的生成,从而生成的摘要形式是结构化文本,生成的摘要粒度是知识点级, 便于用户的使用和大规模自动分析。
在一些实施例中,本发明的会话***中的知识摘要生成方法还包括: 根据所述知识点图谱中的知识点与所述多个会话知识点之间的关联强度 确定多个扩展知识点;
所述至少基于所述会话主题和所述多个会话知识点生成所述知识摘 要包括:基于所述会话主题、所述多个会话知识点和所述多个扩展知识点 生成所述知识摘要。
如图2所示,在一些实施例中,所述根据所述知识点图谱中的知识点 与所述多个会话知识点之间的关联强度确定多个扩展知识点包括:
S21、选取所述多个会话知识点所构成的跳转路径中的最后n个会话 知识点;
S22、计算所述最后n个会话知识点中的每个知识点Ki(0<i<n)与Ki 的近邻知识点集合的关联强度,近邻知识点集合取与Ki距离为1的知识 点,相似度计算公式如下:
Sim(Ki,Kj)=e-λtS(Ki,Kj)D(Ki,Kj),i≠j,j∈Set(Ki) (1)
公式(1)中,Set(Ki)表示知识点路径为i的知识点Ki的近邻知识点 集合,Sim(Ki,Kj)是Ki与Kj的关联强度;e-λt为时间衰减因子,t=n-i,路径 上最后一个知识点i=n,t=n-i=0;S(Ki,Kj)为Ki与Kj的静态关联强度, D(Ki,Kj)为Ki与Kj的动态关联强度;
S23、取关联强度大的前k个知识点作为所述多个扩展知识点。
本专利和已有技术有四点主要区别:
第一:知识摘要的形式是结构化的;
第二:知识摘要的粒度在知识点级;
第三:知识摘要不但包括会话中的知识点,而且根据知识点做必要的 延伸和扩展;
第四:知识摘要可以进行主题和知识点层级的可视化。
如图3所示,为本发明的会话***中的知识摘要生成方法的另一实施 例的流程图,包括以下步骤:
步骤1.主题和知识点的组织结构及动态更新。会话***中知识组织 结构包括主题图谱和知识点图谱,主题图谱的节点是主题,关系包括父子 关系,兄弟关系等;知识点图谱的节点包括不限于知识三元组或问答对, 也包括他形式的知识点,如<问题,操作步骤>等。知识组织结构包括关系 及关系强度。
步骤2.初始知识摘要生成。在用户和会话***交互过程中,用户会 话中涉及的主题和知识点会在主题图谱和知识点图谱中做标记。一个会话 结束后,标记的知识点作为初始知识摘要。
示例性地,会话过程中提及的知识点在主题图谱和知识点图谱中的路 径,即为初始知识摘要。如图4所示,用户在会话过程中开始聊了知识点 <S1,P1,O1>,然后跳转到<Q1,A1>,最后跳转到<S2,P2,O2>。那么初始知识 摘要为[<S1,P1,O1>,<Q1,A1>,<S2,P2,O2>]。
步骤3.基于主题和知识点相关度的知识摘要扩展。根据主题和知识 点的关联关系,对初始知识摘要进行必要的扩展。
示例性地,主题图谱和知识点图谱的匹配同时考虑静态关联强度、动 态关联强度和知识点在会话过程中知识点的路径位置。选择会话过程中知 识点路径的最后n个知识点,n是个超参数,可以设置的。比如用户从刚 开始到结束对话涉及的知识点有10个,那么n可以取3个。计算每个知 识点Ki(0<i<n)与Ki的近邻知识点集合的关联强度,近邻知识点集合可以 取与Ki距离为1的知识点,相似度计算公式如下:
Sim(Ki,Kj)=e-λtS(Ki,Kj)D(Ki,Kj),i≠j,j∈Set(Ki) (1)
公式(1)中Set(Ki)表示知识点路径为i的知识点Ki的近邻知识点集 合,Sim(Ki,Kj)是Ki与Kj的关联强度。
e-λt为时间衰减因子,t=n-i,路径上最后一个知识点i=n,t=n-i=0。
S(Ki,Kj)为Ki与Kj的静态关联强度,D(Ki,Kj)为Ki与Kj的动态关联 强度。
取关联强度大的前k个知识点作为知识点摘要扩展,k也是超参数, 可以预设。
步骤4.知识摘要的可视化,对步骤3构建的知识摘要进行可视化。
在一些实施例中,本发明的会话***中的知识摘要生成方法还包括: 将所述知识摘要进行可视化展示,所述可视化展示包括表格形式(如下表 1)和/或图形形式(如图5所示)。
表1表格可视化示例
以下对上述实施例中的步骤1-4分别进行进一步举例说明:
对于步骤1,如图6所示,为本发明实施例中的主题和知识点的组织 结构示意图。其中,包括主题图谱和知识点图谱,下面从节点和关系两方 面介绍:
节点定义:
主题图谱的节点表示主题,关系包括父子关系,兄弟关系;知识点图 谱的节点包括但不限于知识三元组(空心节点)或问答对(实心节点)或其 他形式的知识点。
三元组有2种形式<实体、关系、实体>,<实体、属性、属性值>;<实 体、关系、实体>如<中国,首都,北京>,其中“中国”和“北京”分别 表示实体,“首都”表示关系。<实体、属性、属性值>如<中国、海岸线 长度、1.8万千米>其中“中国”表示实体,“海岸线长度”表示属性,“1.8 万千米”表示属性值。
问答对形式为<Q,A>,Q表示问题,A表示答案,如<“请简单介绍一 下中国?”,“中华人民共和国位于亚洲东部,太平洋西岸”>。
关系定义:
如图7所示,为本发明中的主题图谱中主题之间的关系的示意图,示 例性地,对于主题“人工智能”,其包括子主题“深度学习技术”。
如图8所示,为本发明中的主题图谱的节点和知识点图谱的节点之间 的关系示意图。示例性地,主题图谱的节点和知识点图谱的节点有包含关 系,表示主题包括哪些知识点。例如,主题谱中的节点“地理”包含了知 识点图谱中的知识点<中国,首都,北京>。
如图9所示,为本发明中的知识点图谱中知识点间关系的示意图。示 例性地,三元组和问答对之间的关联关系,如三元组中包括实体“中国”, 问答对中也包括实体“中国”,那么三元组和问答对建立实体的等价关联 关系。除了等价关联关系外,还包括其他类型的实体关系。构建方法为: 将问答对中和三元组中的实体做实体链接找到等价关联,根据三元组之间 的实体关系,构建三元组中的实体和问答对中的实体的关系。
三元组之间的关联关系:三元组中实体的关联关系。
问答对之间也有关联关系:问答对中实体的关联关系。
关系强度分为静态关系强度(如下表2所示)和动态关系强度(如下 表3所示)。动态关系强度指依赖会话过程调整关系强度。静态关系强度 表示的客观世界中知识的关联强度,不随会话过程变化。
表2静态关联强度
表3动态关联强度
示例性地,动态关联强度会随着会话过程动态更新,当从知识点A跳 转到B时,A到B的动态关联强度增加;同时A,B对应的主题关系也做 相应调整。A跳转到B的场景包括,用户问完A知识点后问B知识点。 用户问完A知识点后,会话***推荐反问了B知识点,且被用户选中。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都 表述为一系列的动作合并,但是本领域技术人员应该知悉,本发明并不受 所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序 或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实 施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须 的。在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没 有详述的部分,可以参见其他实施例的相关描述。
如图10所示,本发明的实施例还提供一种会话***中的知识摘要生成 ***100,包括:
图谱构建程序模块110,用于预先构建知识组织结构,所述知识组织 结构包括主题图谱和知识点图谱;
记录程序模块120,用于记录用户在会话过程中所涉及的会话主题和 多个会话知识点;
摘要生成程序模块130,用于至少基于所述主题和所述多个会话知识 点生成所述知识摘要。
本发明中通过预先构建主体图谱和知识点图谱用于知识摘要的生成, 从而生成的摘要形式是结构化文本,生成的摘要粒度是知识点级,便于用 户的使用和大规模自动分析。
如图11所示,在一些实施例中,会话***中的知识摘要生成***100 还包括:扩展程序模块140,用于根据所述知识点图谱中的知识点与所述 多个会话知识点之间的关联强度确定多个扩展知识点;所述至少基于所述 会话主题和所述多个会话知识点生成所述知识摘要包括:基于所述会话主 题、所述多个会话知识点和所述多个扩展知识点生成所述知识摘要。
如图12所示,在一些实施例中,所述扩展程序模块140包括:
知识点选择程序单元141,用于选取所述多个会话知识点所构成的跳 转路径中的最后n个会话知识点;
计算程序单元142,用于计算所述最后n个会话知识点中的每个知识 点Ki(0<i<n)与Ki的近邻知识点集合的关联强度,近邻知识点集合取与Ki 距离为1的知识点,相似度计算公式如下:
Sim(Ki,Kj)=e-λtS(Ki,Kj)D(Ki,Kj),i≠j,j∈Set(Ki) (1)
其中,Set(Ki)表示知识点路径为i的知识点Ki的近邻知识点集合, Sim(Ki,Kj)是Ki与Kj的关联强度;e-λt为时间衰减因子,t=n-i,路径上最后 一个知识点i=n,t=n-i=0;S(Ki,Kj)为Ki与Kj的静态关联强度,D(Ki,Kj)为 Ki与Kj的动态关联强度;
扩展程序单元143,用于取关联强度大的前k个知识点作为所述多个 扩展知识点。
如图13所示,在一些实施例中,会话***中的知识摘要生成***100 还包括:可视化程序模块150,用于将所述知识摘要进行可视化展示,所 述可视化展示包括表格形式和/或图形形式。
在一些实施例中,本发明实施例提供一种非易失性计算机可读存储介 质,所述存储介质中存储有一个或多个包括执行指令的程序,所述执行指 令能够被电子设备(包括但不限于计算机,服务器,或者网络设备等)读 取并执行,以用于执行本发明上述任一项会话***中的知识摘要生成方 法。
在一些实施例中,本发明实施例还提供一种计算机程序产品,所述计 算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序, 所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述 计算机执行上述任一项会话***中的知识摘要生成方法。
在一些实施例中,本发明实施例还提供一种电子设备,其包括:至少 一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述 存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少 一个处理器执行,以使所述至少一个处理器能够执行会话***中的知识摘 要生成方法。
在一些实施例中,本发明实施例还提供一种存储介质,其上存储有计 算机程序,其特征在于,该程序被处理器执行时会话***中的知识摘要生 成方法。
上述本发明实施例的会话***中的知识摘要生成***可用于执行本 发明实施例的会话***中的知识摘要生成方法,并相应的达到上述本发明 实施例的实现会话***中的知识摘要生成方法所达到的技术效果,这里不 再赘述。本发明实施例中可以通过硬件处理器(hardware processor)来实 现相关功能模块。
图14是本申请另一实施例提供的执行会话***中的知识摘要生成方 法的电子设备的硬件结构示意图,如图14所示,该设备包括:
一个或多个处理器1410以及存储器1420,图14中以一个处理器1410 为例。
执行会话***中的知识摘要生成方法的设备还可以包括:输入装置 1430和输出装置1440。
处理器1410、存储器1420、输入装置1430和输出装置1440可以通 过总线或者其他方式连接,图14中以通过总线连接为例。
存储器1420作为一种非易失性计算机可读存储介质,可用于存储非 易失性软件程序、非易失性计算机可执行程序以及模块,如本申请实施例 中的会话***中的知识摘要生成方法对应的程序指令/模块。处理器1410 通过运行存储在存储器1420中的非易失性软件程序、指令以及模块,从 而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例会话 ***中的知识摘要生成方法。
存储器1420可以包括存储程序区和存储数据区,其中,存储程序区 可存储操作***、至少一个功能所需要的应用程序;存储数据区可存储根 据会话***中的知识摘要生成装置的使用所创建的数据等。此外,存储器 1420可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至 少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些 实施例中,存储器1420可选包括相对于处理器1410远程设置的存储器, 这些远程存储器可以通过网络连接至会话***中的知识摘要生成装置。上 述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及 其组合。
输入装置1430可接收输入的数字或字符信息,以及产生与会话*** 中的知识摘要生成装置的用户设置以及功能控制有关的信号。输出装置 1440可包括显示屏等显示设备。
所述一个或者多个模块存储在所述存储器1420中,当被所述一个或 者多个处理器1410执行时,执行上述任意方法实施例中的会话***中的 知识摘要生成方法。
上述产品可执行本申请实施例所提供的方法,具备执行方法相应的功 能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本申请 实施例所提供的方法。
本申请实施例的电子设备以多种形式存在,包括但不限于:
(1)移动通信设备:这类设备的特点是具备移动通信功能,并且以提供 话音、数据通信为主要目标。这类终端包括:智能手机(例如iPhone)、多媒 体手机、功能性手机,以及低端手机等。
(2)超移动个人计算机设备:这类设备属于个人计算机的范畴,有计算 和处理功能,一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC 设备等,例如iPad。
(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备 包括:音频、视频播放器(例如iPod),掌上游戏机,电子书,以及智能玩具 和便携式车载导航设备。
(4)服务器:提供计算服务的设备,服务器的构成包括处理器、硬盘、 内存、***总线等,服务器和通用的计算机架构类似,但是由于需要提供 高可靠的服务,因此在处理能力、稳定性、可靠性、安全性、可扩展性、 可管理性等方面要求较高。
(5)其他具有数据交互功能的电子装置。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说 明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以 是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多 个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现 本实施例方案的目的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各 实施方式可借助软件加通用硬件平台的方式来实现,当然也可以通过硬 件。基于这样的理解,上述技术方案本质上或者说对相关技术做出贡献的 部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算 机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使 得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行 各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对 其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通 技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修 改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不 使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (10)

1.一种会话***中的知识摘要生成方法,包括:
预先构建知识组织结构,所述知识组织结构包括主题图谱和知识点图谱;
记录用户在会话过程中所涉及的会话主题和多个会话知识点;
至少基于所述会话主题和所述多个会话知识点生成所述知识摘要。
2.根据权利要求1所述的方法,其中,还包括:
根据所述知识点图谱中的知识点与所述多个会话知识点之间的关联强度确定多个扩展知识点;
所述至少基于所述会话主题和所述多个会话知识点生成所述知识摘要包括:
基于所述会话主题、所述多个会话知识点和所述多个扩展知识点生成所述知识摘要。
3.根据权利要求2所述的方法,其中,所述根据所述知识点图谱中的知识点与所述多个会话知识点之间的关联强度确定多个扩展知识点包括:
选取所述多个会话知识点所构成的跳转路径中的最后n个会话知识点;
计算所述最后n个会话知识点中的每个知识点Ki(0<i<n)与Ki的近邻知识点集合的关联强度,近邻知识点集合取与Ki距离为1的知识点,相似度计算公式如下:
Sim(Ki,Kj)=e-λtS(Ki,Kj)D(Ki,Kj),i≠j,j∈Set(Ki) (1)
公式(1)中,Set(Ki)表示知识点路径为i的知识点Ki的近邻知识点集合,Sim(Ki,Kj)是Ki与Kj的关联强度;
e-λt为时间衰减因子,t=n-i,路径上最后一个知识点i=n,t=n-i=0;
S(Ki,Kj)为Ki与Kj的静态关联强度,D(Ki,Kj)为Ki与Kj的动态关联强度;
取关联强度大的前k个知识点作为所述多个扩展知识点。
4.根据权利要求1-3中任意一项所述的方法,其中,还包括:将所述知识摘要进行可视化展示,所述可视化展示包括表格形式和/或图形形式。
5.一种会话***中的知识摘要生成***,包括:
图谱构建程序模块,用于预先构建知识组织结构,所述知识组织结构包括主题图谱和知识点图谱;
记录程序模块,用于记录用户在会话过程中所涉及的会话主题和多个会话知识点;
摘要生成程序模块,用于至少基于所述会话主题和所述多个会话知识点生成所述知识摘要。
6.根据权利要求5所述的***,其中,还包括:
扩展程序模块,用于根据所述知识点图谱中的知识点与所述多个会话知识点之间的关联强度确定多个扩展知识点;
所述至少基于所述会话主题和所述多个会话知识点生成所述知识摘要包括:基于所述会话主题、所述多个会话知识点和所述多个扩展知识点生成所述知识摘要。
7.根据权利要求6所述的***,其中,所述扩展程序模块包括:
知识点选择程序单元,用于选取所述多个会话知识点所构成的跳转路径中的最后n个会话知识点;
计算程序单元,用于计算所述最后n个会话知识点中的每个知识点Ki(0<i<n)与Ki的近邻知识点集合的关联强度,近邻知识点集合取与Ki距离为1的知识点,相似度计算公式如下:
Sim(Ki,Kj)=e-λtS(Ki,Kj)D(Ki,Kj),i≠j,j≠j,j∈Set(Ki) (1)
其中,Set(Ki)表示知识点路径为i的知识点Ki的近邻知识点集合,Sim(Ki,Kj)是Ki与Kj的关联强度;e-λt为时间衰减因子,t=n-i,路径上最后一个知识点i=n,t=n-i=0;S(Ki,Kj)为Ki与Kj的静态关联强度,D(Ki,Kj)为Ki与Kj的动态关联强度;
扩展程序单元,用于取关联强度大的前k个知识点作为所述多个扩展知识点。
8.根据权利要求5-7中任意一项所述的***,其中,还包括:
可视化程序模块,用于将所述知识摘要进行可视化展示,所述可视化展示包括表格形式和/或图形形式。
9.一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-4中任意一项所述方法的步骤。
10.一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-4中任意一项所述方法的步骤。
CN201910255435.3A 2019-04-01 2019-04-01 会话***中的知识摘要生成方法及*** Active CN110008326B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910255435.3A CN110008326B (zh) 2019-04-01 2019-04-01 会话***中的知识摘要生成方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910255435.3A CN110008326B (zh) 2019-04-01 2019-04-01 会话***中的知识摘要生成方法及***

Publications (2)

Publication Number Publication Date
CN110008326A true CN110008326A (zh) 2019-07-12
CN110008326B CN110008326B (zh) 2020-11-03

Family

ID=67169157

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910255435.3A Active CN110008326B (zh) 2019-04-01 2019-04-01 会话***中的知识摘要生成方法及***

Country Status (1)

Country Link
CN (1) CN110008326B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111159382A (zh) * 2019-12-27 2020-05-15 苏州思必驰信息科技有限公司 会话***知识模型的构建和使用方法及装置
CN112597285A (zh) * 2020-12-10 2021-04-02 太极计算机股份有限公司 一种基于知识图谱的人机交互方法及***
WO2021098794A1 (zh) * 2019-11-21 2021-05-27 邝俊伟 文本搜索方法、装置、服务器及存储介质
CN112911073A (zh) * 2019-04-30 2021-06-04 五竹科技(北京)有限公司 外呼流程对话内容的智能化知识图谱构建方法及装置
WO2021121020A1 (zh) * 2019-12-18 2021-06-24 华为技术有限公司 问答方法、装置及设备

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106447346A (zh) * 2016-08-29 2017-02-22 北京中电普华信息技术有限公司 一种智能电力客服***的构建方法及***
CN106919674A (zh) * 2017-02-20 2017-07-04 广东省中医院 一种基于Wiki语义网络构建的知识问答***及智能检索方法
CN107845422A (zh) * 2017-11-23 2018-03-27 郑州大学第附属医院 一种基于多模态线索融合的远程会诊会话理解与摘要方法
CN107870994A (zh) * 2017-10-31 2018-04-03 北京光年无限科技有限公司 用于智能机器人的人机交互方法及***
CN108763494A (zh) * 2018-05-30 2018-11-06 苏州思必驰信息科技有限公司 对话***间的知识分享方法、对话方法及装置
CN108874915A (zh) * 2018-05-30 2018-11-23 苏州思必驰信息科技有限公司 知识组织方法、***、电子设备及存储介质
CN109062939A (zh) * 2018-06-20 2018-12-21 广东外语外贸大学 一种面向汉语国际教育的智能导学方法
CN109284363A (zh) * 2018-12-03 2019-01-29 北京羽扇智信息科技有限公司 一种问答方法、装置、电子设备及存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106447346A (zh) * 2016-08-29 2017-02-22 北京中电普华信息技术有限公司 一种智能电力客服***的构建方法及***
CN106919674A (zh) * 2017-02-20 2017-07-04 广东省中医院 一种基于Wiki语义网络构建的知识问答***及智能检索方法
CN107870994A (zh) * 2017-10-31 2018-04-03 北京光年无限科技有限公司 用于智能机器人的人机交互方法及***
CN107845422A (zh) * 2017-11-23 2018-03-27 郑州大学第附属医院 一种基于多模态线索融合的远程会诊会话理解与摘要方法
CN108763494A (zh) * 2018-05-30 2018-11-06 苏州思必驰信息科技有限公司 对话***间的知识分享方法、对话方法及装置
CN108874915A (zh) * 2018-05-30 2018-11-23 苏州思必驰信息科技有限公司 知识组织方法、***、电子设备及存储介质
CN109062939A (zh) * 2018-06-20 2018-12-21 广东外语外贸大学 一种面向汉语国际教育的智能导学方法
CN109284363A (zh) * 2018-12-03 2019-01-29 北京羽扇智信息科技有限公司 一种问答方法、装置、电子设备及存储介质

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112911073A (zh) * 2019-04-30 2021-06-04 五竹科技(北京)有限公司 外呼流程对话内容的智能化知识图谱构建方法及装置
CN112911073B (zh) * 2019-04-30 2023-04-25 五竹科技(北京)有限公司 外呼流程对话内容的智能化知识图谱构建方法及装置
WO2021098794A1 (zh) * 2019-11-21 2021-05-27 邝俊伟 文本搜索方法、装置、服务器及存储介质
WO2021121020A1 (zh) * 2019-12-18 2021-06-24 华为技术有限公司 问答方法、装置及设备
CN111159382A (zh) * 2019-12-27 2020-05-15 苏州思必驰信息科技有限公司 会话***知识模型的构建和使用方法及装置
CN111159382B (zh) * 2019-12-27 2022-07-12 思必驰科技股份有限公司 会话***知识模型的构建和使用方法及装置
CN112597285A (zh) * 2020-12-10 2021-04-02 太极计算机股份有限公司 一种基于知识图谱的人机交互方法及***
CN112597285B (zh) * 2020-12-10 2021-08-10 太极计算机股份有限公司 一种基于知识图谱的人机交互方法及***

Also Published As

Publication number Publication date
CN110008326B (zh) 2020-11-03

Similar Documents

Publication Publication Date Title
CN110008326A (zh) 会话***中的知识摘要生成方法及***
CN108829797A (zh) 多智能体对话策略***构建方法及自适应方法
CN108763495B (zh) 人机对话方法、***、电子设备及存储介质
JP6896690B2 (ja) マルチメディアコンテンツにおける文脈探索
CN109145153A (zh) 意图类别的识别方法和装置
US8972265B1 (en) Multiple voices in audio content
CN110349572A (zh) 一种语音关键词识别方法、装置、终端及服务器
CN115082602B (zh) 生成数字人的方法、模型的训练方法、装置、设备和介质
CN109948151A (zh) 构建语音助手的方法
CN109389870A (zh) 一种应用于电子教学中的数据自适应调整方法及其装置
CN111159382B (zh) 会话***知识模型的构建和使用方法及装置
CN109416690A (zh) 用于对话期间的任务状态跟踪的策略创作
JP7488871B2 (ja) 対話推薦方法、装置、電子機器、記憶媒体ならびにコンピュータプログラム
WO2018094952A1 (zh) 一种内容推荐方法与装置
CN109192212A (zh) 语音控制方法及装置
CN109902187A (zh) 一种特征知识图谱的构建方法及装置、终端设备
US20230029687A1 (en) Dialog method and system, electronic device and storage medium
US20210335357A1 (en) Method for controlling intelligent speech apparatus, electronic device and storage medium
CN109559749A (zh) 用于语音识别***的联合解码方法及***
Varitimiadis et al. Towards implementing an AI chatbot platform for museums
CN108874915A (zh) 知识组织方法、***、电子设备及存储介质
CN109324515A (zh) 一种控制智能电器的方法及控制终端
CN116431780A (zh) 一种人机对话方法、***、电子设备及存储介质
CN108491380A (zh) 用于口语理解的对抗多任务训练方法
CN105118345A (zh) 一种云智能交互学习***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 215123 14 Tengfei Innovation Park, 388 Xinping street, Suzhou Industrial Park, Suzhou, Jiangsu.

Patentee after: Sipic Technology Co.,Ltd.

Address before: 215123 14 Tengfei Innovation Park, 388 Xinping street, Suzhou Industrial Park, Suzhou, Jiangsu.

Patentee before: AI SPEECH Ltd.