CN111159382A - 会话***知识模型的构建和使用方法及装置 - Google Patents

会话***知识模型的构建和使用方法及装置 Download PDF

Info

Publication number
CN111159382A
CN111159382A CN201911407443.1A CN201911407443A CN111159382A CN 111159382 A CN111159382 A CN 111159382A CN 201911407443 A CN201911407443 A CN 201911407443A CN 111159382 A CN111159382 A CN 111159382A
Authority
CN
China
Prior art keywords
knowledge
user
model
question
tree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911407443.1A
Other languages
English (en)
Other versions
CN111159382B (zh
Inventor
缪庆亮
初敏
葛付江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AI Speech Ltd
Original Assignee
AI Speech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AI Speech Ltd filed Critical AI Speech Ltd
Priority to CN201911407443.1A priority Critical patent/CN111159382B/zh
Publication of CN111159382A publication Critical patent/CN111159382A/zh
Application granted granted Critical
Publication of CN111159382B publication Critical patent/CN111159382B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开会话***知识模型的构建和使用方法及装置,其中,一种会话***知识模型的构建方法,包括:由会话***中的知识点抽象出与所述知识点关联的至少一个主题;基于所述至少一个主题构建***主题树;基于所述***主题树确定各知识点之间的关联关系;至少基于所述***主题树和所述各知识点之间的关联关系构建会话***知识模型。本实施例的方法通过将知识点抽象成至少一个主题,之后利用主题构建主题树,再根据主题树确定各知识点之间的关联关系,然后可以构建会话***知识模型,用于后续的启发式会话过程中对用户进行问题或者答案的推荐,从而可以向用户推荐更符合用户兴趣的问题或内容。

Description

会话***知识模型的构建和使用方法及装置
技术领域
本发明属于会话***技术领域,尤其涉及会话***知识模型的构建和使用方法及装置。
背景技术
相关技术中,在一般的会话***应用场景中,比如在智能音箱、智能电视,包括现在车载的设备等,当用户说了一个问句,智能客服自动的问答和对话,这样的***的基本流程是它接收到用户的一个问句或者用户说的一句话,然后***里做一些处理,给用户一个答复。
启发式会话通过获取问题背后的一些联系,能让会话一直持续下去。
发明人在实现本申请的过程中发现:目前已有产品或技术主要是基于主题或场景的启发式会话,没有考虑用户自身的兴趣点。
发明内容
本发明实施例提供一种会话***知识模型的构建和使用方法及装置,用于至少解决上述技术问题之一。
第一方面,本发明实施例提供一种会话***知识模型的构建方法,包括:由会话***中的知识点抽象出与所述知识点关联的至少一个主题;基于所述至少一个主题构建***主题树;基于所述***主题树确定各知识点之间的关联关系;以及至少基于所述***主题树和所述各知识点之间的关联关系构建会话***知识模型。
第二方面,本发明实施例提供一种会话***知识模型的使用方法,包括:基于用户的基本信息和所述用户的历史会话数据构建用户兴趣模型,其中,所述用户兴趣模型中包含至少一个知识点;对所述用户兴趣模型中的知识点和根据第一方面所述的方法构建的所述会话***知识模型中的知识点进行基于语义图的匹配;根据语义图的匹配结果生成至少一个匹配的知识点,其中,所述知识点与至少一个问题关联;以及将与所述至少一个匹配的知识点关联的问题推荐给所述用户。
第三方面,本发明实施例提供一种会话***知识模型的构建装置,包括:知识点抽象模块,配置为由会话***中的知识点抽象出与所述知识点关联的至少一个主题;主题树构建模块,配置为基于所述至少一个主题构建***主题树;关联关系确定模块,配置为基于所述***主题树确定各知识点之间的关联关系;以及知识模型构建模块,配置为至少基于所述***主题树和所述各知识点之间的关联关系构建会话***知识模型。
第四方面,本发明实施例提供一种会话***知识模型的使用装置,包括:用户兴趣模型构建模块,配置为基于用户的基本信息和所述用户的历史会话数据构建用户兴趣模型,其中,所述用户兴趣模型中包含至少一个知识点;语义图匹配模块,配置为对所述用户兴趣模型中的知识点和根据第一方面所述的方法构建的所述会话***知识模型中的知识点进行基于语义图的匹配;匹配知识点生成模块,配置为根据语义图的匹配结果生成至少一个匹配的知识点,其中,所述知识点与至少一个问题关联;以及推荐模块,配置为将与所述至少一个匹配的知识点关联的问题推荐给所述用户。
第五方面,提供一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例的会话***知识模型的构建方法的步骤。
第六方面,本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行本发明任一实施例的会话***知识模型的构建方法的步骤。
本实施例的方法通过将知识点抽象成至少一个主题,之后利用主题构建主题树,再根据主题树确定各知识点之间的关联关系,然后可以构建会话***知识模型,用于后续的启发式会话过程中对用户进行问题或者答案的推荐,从而可以向用户推荐更符合用户兴趣的问题或内容。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的一种会话***知识模型的构建方法的流程图;
图2为本发明一实施例提供的另一种会话***知识模型的构建方法的流程图;
图3为本发明一实施例提供的一种会话***知识模型的使用方法的流程图;
图4为本发明一实施例提供的另一种会话***知识模型的使用方法的流程图;
图5为本发明一实施例提供的又一种会话***知识模型的使用方法的流程图;
图6为本发明一实施例提供的***具体流程图;
图7为本发明一实施例提供的基于主题和知识点的用户兴趣点模型结构的具体示例图;
图8为本发明一实施例提供的用户问题的语义表示和对话***知识体系语义表示;
图9为本发明一实施例提供的一种会话***知识模型的构建装置框图;
图10位本发明一实施例提供的一种会话***知识模型的使用装置框图;
图11是本发明一实施例提供的电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1,其示出了本申请的会话***知识模型的构建方法一实施例的流程图,本实施例的会话***知识模型的构建方法可以适用于具备智能语音对话功能的终端,如智能儿童故事机、智能对话玩具、包含智能故事播放的设备等。
如图1所示,在步骤101中,由会话***中的知识点抽象出与知识点关联的至少一个主题;
在步骤102中,基于至少一个主题构建***主题树;
在步骤103中,基于***主题树确定各知识点之间的关联关系;
在步骤104中,至少基于***主题树和各知识点之间的关联关系构建会话***知识模型。
在本实施例中,对于步骤101,会话***知识模型的构建装置由会话***中的知识点抽象出与知识点关联的至少一个主题,其中,知识点可以例如是李白,它可以抽象成是诗人,或者可以抽象成一个游戏角色,从而构建一个主题,这个主题例如是诗人或者游戏角色。
之后,对于步骤102,基于至少一个主题构建***主题树,例如从诗人李白衍生出杜甫等各大诗人从而构建主题树。或者从游戏角色李白衍生出狄仁杰等各大游戏角色从而构建的主题树。
然后,对于步骤103,基于***主题树确定各知识点之间的关联关系,例如基于诗人的主题树确定李白和杜甫等各大诗人的关联关系,或者基于游戏角色的主题树从而确定李白和狄仁杰等各大游戏角色的关联关系。
最后,对于步骤104,至少基于***主题树和各知识点之间的关联关系构建会话***知识模型,例如,基于诗人主题树和各知识点之间的关联关系构建会话***知识模型,其中,知识模型就是将知识进行形式化和结构化的抽象。
本实施例的方法通过将知识点抽象成至少一个主题,之后利用主题构建主题树,再根据主题树确定各知识点之间的关联关系,然后可以构建会话***知识模型,用于后续的启发式会话过程中对用户进行问题或者答案的推荐,从而可以向用户推荐更符合用户兴趣的问题或内容。
进一步参考图2,其示出了本申请一实施例提供的另一种会话***知识模型的构建方法的流程图。该流程图主要是针对流程图1中步骤103进一步限定的步骤的流程图。其中,知识点包括问答对和知识图谱,问答对包括第一实体,知识图谱包括第二实体以及第二实体之间的关联关系。
如图2所示,在步骤201中,当主题树中的第一实体与第二实体相同时,将第一实体与第二实体进行关联融合;
在步骤202中,基于关联融合后的主题树确定各知识点之间的关联关系。
在本实施例中,对于步骤201,会话***知识模型的构建装置当主题树中的第一实体与第二实体相同时,将第一实体与第二实体进行关联融合,例如将主题树中的诗人白居易作为第一实体,将影视角色白居易作为第二实体,然后将他们进行关联融合,从而形成融合后的主题树;
最后,对于步骤202,基于关联融合后的主题树确定各知识点之间的关联关系,例如基于诗人和影视角色融合后的主题树确定各知识点之间的关联关系构建会话***知识模型。
本实施例的方案通过对主题树种相同的实体进行关系融合,确定知识点之间的关联关系,从而将相同的实体进行融合可以使得各知识点之间的关系更加紧密,使原本没有关系的两个知识点建立联系。
请参考图3,其示出了本申请提供的一种会话***知识模型的使用方法一实施例的流程图。
如图3所示,在步骤301中,基于用户的基本信息和用户的历史会话数据构建用户兴趣模型,其中,用户兴趣模型中包含至少一个知识点;
在步骤302中,对用户兴趣模型中的知识点和以上实施例的方法构建的会话***知识模型中的知识点进行基于语义图的匹配;
在步骤303中,根据语义图的匹配结果生成至少一个匹配的知识点,其中,知识点与至少一个问题关联;
在步骤304中,将与至少一个匹配的知识点关联的问题推荐给用户。
在本实施例中,对于步骤301.会话***知识模型的构建装置基于用户的基本信息和用户的历史会话数据来收集用户的年龄、性别等基本信息和用户的历史会话数据构建用户兴趣模型,例如,基于用户的历史会话中出现的“李白”、“杜甫”等数据来构建用户的唐诗兴趣模型,或者基于用户的历史会话中“苏轼”、“李清照”等数据来构建用户的宋词兴趣模型。
之后,对于步骤302,对用户兴趣模型中的知识点和根据权利要求1或2的方法构建的会话***知识模型中的知识点进行基于语义图的匹配,然后,对于步骤303,根据语义图的匹配结果生成至少一个匹配的知识点,最后,对于步骤304,将与至少一个匹配的知识点关联的问题推荐给用户。
例如,根据上述实施例中的构建知识模型的方法对用户兴趣模型中的“唐诗”创建一个知识模型,之后再将“唐诗”中的知识点进行基于语义图的匹配,然后根据语义图的匹配结果生成例如“张九龄”。“杜牧”等至少一个匹配的知识点,最后再将与“张九龄”、“杜牧”等至少一个匹配的知识点关联的问题推荐给用户。
本实施例的方法通过根据用户已有的数据构建用户兴趣模型,之后将与用户兴趣模型中的知识点匹配的问题推荐给用户,从而可以根据基于用户数据构建的用户兴趣模型向用户推荐更符合用户兴趣的问题,推荐的问题与用户的匹配度更高,用户体验更好。
进一步参考图4,其示出了本申请提供的一种会话***知识模型的使用方法的另一实施例的流程图。该流程图主要是针对流程图3中步骤301“基于用户的基本信息和用户的历史会话数据构建用户兴趣模型”进一步限定的步骤的流程。其中,用户的历史会话数据包括用户主动问题及答案和用户接受的***推荐知识及答案。
如图4所示,在步骤401中,对用户基本信息和用户的历史会话数据进行层次聚类,生成用户主题树;
在步骤402中,将用户主动问题及答案和用户接受的***推荐知识及答案构造成包含问题、答案及问题和答案之间的关联关系的知识三元组,其中,问题和答案组成问答对;
在步骤403中,将知识三元组关联到用户主题树上;
在步骤404中,利用实体链接技术,将三元组中的问答对中的实体映射到会话***知识模型的知识三元组中,并将映射好的知识三元组加入到用户主题树下的知识点中,形成用户兴趣模型;
在步骤405中,计算各问答对之间的语义相似度,并将语义相似度加入用户兴趣模型中。
在本实施例中,对于步骤401,会话***知识模型的构建装置会对用户的性别、年龄等基本信息和用户的历史会话数据进行层次聚类,生成用户主题树,其中,层次聚类试图在不同层次对数据集进行划分,从而形成树形的聚类结构。数据集划分可采用"自底向上"的聚合策略,也可采用"自顶向下"的分拆策略。例如,“唐诗”为一个聚类,在下一层聚类中就包含了“李白”、“杜甫”、“张九龄”等聚类,又例如在“唐诗”这一聚类中就会包含“唐诗”、“宋词”等聚类,以此类推,在此不再赘述。
然后,对于步骤402,会话***知识模型的构建装置会将用户主动提问的问题及答案和用户接受的***推荐知识及答案构造成包含问题、答案及问题和答案之间的关联关系的知识三元组,例如,首先用户主动对设备提问“李白的静夜思全文是什么”,然后设备给出答案后还会询问用户是否接受***推荐的李白的其他诗词,如果用户接受了***推荐知识,则提问、答案和***推荐知识组成知识三元组,其中,问题和答案组成问答对;
之后,对于步骤403,会话***知识模型的构建装置会将知识三元组关联到用户主题树上;
然后,对于步骤404,会话***知识模型的构建装置利用实体链接技术,将三元组中的问答对中的实体映射到会话***知识模型的知识三元组中,并将映射好的知识三元组加入到用户主题树下的知识点中,形成用户兴趣模型;其中,实体链接技术是解决命名实体歧义问题的一种重要方法,该方法通过将具有歧义的实体指称项链接到给定的知识库中从而实现实体歧义的消除。
最后,对于步骤405,计算各问答对之间的语义相似度,并将语义相似度加入用户兴趣模型中。
本实施例的方法通过对用户已有的一些信息进行层次聚类,形成用户主题树,之后再构建知识三元组,将知识三元组关联到用户主题树上,构建用户兴趣模型,最后再计算用户兴趣模型中的问答对的语义相似度,加入到用户兴趣模型中,从而可以构建包含语义相似度的用户兴趣模型,便于后续的启发式会话中对用户推荐语音相似度更高的问题或答案。
进一步参考图5,其示出了本申请提供的一种会话***知识模型的使用方法的又一实施例的流程图。该流程图主要是针对流程图4中步骤401“对用户基本信息和用户的历史会话数据进行层次聚类,生成用户主题树”之前的步骤进一步限定的步骤的流程。主要适用于历史会话数据特别少的用户,例如该用户的历史会话数据可以是少于预设阈值。该预设阈值可以是由自定义的,本申请在此没有限制。
如图5所示,在步骤501中,根据用户的基本信息查找基本信息相同的用户;
在步骤502中,基于基本信息相同的用户的问答对集合和知识三元组集合构建用户的问答对集合和知识三元组集合;
在步骤503中,计算用户主动问题与所构建的问答对集合中的问题的语义相似度,选取语义相似度最高的前N个问题对应的问答对;
在步骤504中,计算用户接受的***推荐答案对应的答案三元组与所构建的知识三元组中问题的语义相似度,选取语义相似度最高的前M个知识三元组;
在步骤505中,将前N个问题对应的问答对和前M个知识三元组作为用户的初始历史会话数据。
在本实施例中,对于步骤501,如果用户的历史会话数据特别少,首先会话***知识模型的构建装置会根据用户的基本信息查找基本信息相同的用户;然后,对于步骤502,基于基本信息相同的用户的问答对集合和知识三元组集合构建用户的问答对集合和知识三元组集合;之后,对于步骤503,计算用户主动问题与所构建的问答对集合中的问题的语义相似度,选取语义相似度最高的前N个问题对应的问答对;在然后,对于步骤504,计算用户接受的***推荐答案对应的答案三元组与所构建的知识三元组中问题的语义相似度,选取语义相似度最高的前M个知识三元组;最后,对于步骤505,将前N个问题对应的问答对和前M个知识三元组作为用户的初始历史会话数据。
本申请实施例提供的方案综合考虑了用户关注的知识点,知识点之间的关联,实现更细粒度层次的建模,根据知识点的关联和用户之间的相似度以及对用户兴趣点和知识点统一建模可以利用图匹配算法,找到和用户兴趣点匹配的知识点,结合时间敏感,地点敏感和事件敏感度从而使得用户可以更加精准的对用户兴趣进行刻画和能快速准确的计算出用户的兴趣点,构建用户初始兴趣模型以及为用户推荐更准确的会话内容。
在一些可选的实施例中,语义图匹配包括节点语义相似度匹配和路径语义相似度匹配。
下面对通过描述发明人在实现本发明的过程中遇到的一些问题和对最终确定的方案的一个具体实施例进行说明,以使本领域技术人员更好地理解本申请的方案。
启发式会话的一个简单的流程如下:首先根据用户的问题主动引导对话交互,用户问了一个问题,***会根据这个问题把一些相关的问题列出来或者问用户他想不想了解。用户的问题是以多种形式连接到知识点,当然这个对话后面,我们叫知识点,以一个知识点的方式,连接一个知识点可能就是对于一个具体的问题,这个问题可能有各种不同的问法,我们都认为它是一个知识点。
本发明提出一种基于知识关联性和用户兴趣的个性化启发式对话技术。首先,本专利提出了基于主题和知识点的联合建模方法,基于用户历史会话记录数据,对用户兴趣进行分层建模,即包括主题层和知识点层,主题层支持层级结构。第二,本专利对知识点进行建模和组织,建模方法包括知识点的主题抽象,主题树构造,知识点的关联;第三,对新用户的兴趣点进行预测建模,构造初始兴趣模型。第四,将用户兴趣图和知识图做图匹配,同时结合时间敏感,地点敏感和事件敏感,找到用户潜在感兴趣的知识点,为用户推荐更精准的会话内容。
本发明通过对用户兴趣点和知识的主题关联和知识点的关联统一建模,实现了一种个性化的启发式会话方法,提高会话的效率,高效地达到用户的沟通目标。
本发明的技术创新点:
1、基于主题、知识点和用户兴趣点联合建模。
传统用户建模方法大多使用主题建模,本专利除了考虑主题信息外,还综合考虑了用户关注的知识点,知识点之间的关联,实现更细粒度层次的建模,可以更加精准的对用户兴趣进行刻画。
2、对新用户的兴趣点的预测。
传统的用户建模方法,利用用户的历史记录,往往会有冷启动问题,不适合只有少量用户历史记录的场景。本专利根据知识点的关联和用户之间的相似度,能快速准确的计算出用户的兴趣点,构建用户初始兴趣模型。
3、基于图匹配的用户兴趣点和知识点推荐。
对用户兴趣点和知识点统一建模,可以利用图匹配算法,找到和用户兴趣点匹配的知识点,结合时间敏感,地点敏感和事件敏感度,为用户推荐更准确的会话内容。
图6示出了本申请一实施例提供的***流程图。
如图6所示,***主要包括三部分,左侧的部分为历史会话数据缺乏的用户兴趣建模,这类用户只有用户基本信息或注册信息,有少量的会话记录。对于这类用户,***根据少量的会话记录和会话***知识模型预测用户兴趣模型,并给出一个初始化的用户兴趣模型。
中间的部分为历史会话数据丰富的用户,这类用户有丰富的会话历史,这里使用的是用户基本信息,用户主动的提问及答案,***推荐的知识及答案并且被用户接受过三类数据对用户进行兴趣建模。
右侧的部分是会话***中知识体系的建模流程,包括主题树构建,包括实体及关系的知识图谱构建,知识点和主题树关联;问答对知识的整理,包括问题与答案的对应关系,可能是一对一、一对多关系,问题之间的语义相似度,问答对中涉及的实体与知识图谱中的实体进行关联等等
然后对用户兴趣模型和***知识模型做基于语义图的匹配,计算出最匹配的知识点,将相关问题推荐给用户。
图7示出了基于主题和知识点的用户兴趣点模型结构。
用户兴趣建模的数据来源包括用户基本信息,用户主动的提问及答案,***推荐的知识及答案并且被用户接受过三类数据
用户兴趣模型用语义图的形式表示,图7展示了模型结构,包括主题,知识点,问答对,实体,属性5种元素,主题层支持层次结构,即一个主题可以有多个子主题,例如主题A包括主题B和主题C两个子主题;主题下面是知识点,例如主题D包括知识点1和知识点2;知识点可以属于多个主题;知识点包括问答对和知识图谱中的知识,以三元组的形式表示,包括实体,关系和属性,属性值,例如知识点1包括问答对1和实体E1,E2及他们之间的关系。
第一步:根据用户的用户主动的提问及答案,***推荐的知识及答案,做层次聚类,得到具有层次结构的主题树。同时将用户主动的提问和***推荐的知识构造成问答对或者知识三元组,关联到主题树上。
第二步:利用实体链接技术,将问答对中的实体提及映射到***知识模型中,并将映射好的知识三元组加入到对应的主题树下的知识点中。其中,实体提及的意思是,实体在文本中的表现形式。例如,北京大学这个实体,在文本中的形式可以能是北大。
第三步:计算问答对之间的语义相似度,并将语义相似度加入用户兴趣模型。
基于语义相似度传播的用户兴趣预测及兴趣模型初始化
对于用户历史会话数据较少的用户,提出一种基于语义相似度的用户兴趣传播模型,利用改模型来预测用户兴趣,并对兴趣模型做初始化。
为了便于说明,假设用户A只有一个主动提问Q1被问答对解决了,一个***推荐的且被A接受的问题Q2被知识三元组解决了。
第一步,根据用户注册/基本信息找到类似的用户,例如年龄段,性别,地理位置相近的用户集合C,将C中的用户的问答对构成集合CQA,知识三元组构成集合CKB。
第二步,计算Q1和CQA中问题的语义相似度,选择前N个问题作为候选。具体算法可以是简单的编辑距离,集合距离,也可以将问题表示成向量,计算向量的余弦距离。
第三步,计算Q2对应的答案三元组<e1,r1,e2>和CKB中问题的语义相似度。假设CKB中三元组为<e1*,r2,e2*>,计算方法可以是知识图谱中e1和e2到e1*和e2*的最小距离。
第四步,从第二步结果中取前N个相似度最高的问答对,从第三步的结果中取前M个距离最短的知识三元组,将N和M作为用户初始兴趣点,用前述实施例的构建模型的方法构造用户兴趣点模型。
***知识语义图和用户兴趣语义图的匹配:语义图匹配同时考虑节点语义相似度和路径语义相似度。
图8示出了用户问题的语义表示(上部分),对话***知识体系语义表示(下部分)。
上图给出了用户问题语义表示和对话***知识体系的语义表示。假设户接入***,问了一个问题Q时,并且命中问答1,即Q和问答1中的问题是语义等价的。
第一步,构建问答1到主题的路径T1,如图8的上部分所示,该路径包括了问答1的知识点A,子主题2,一级主题1,同时还包括了和问答1在同一个知识点下面的所有问答记为QA1和所有知识三元组KB1。
第二步,从***知识体系中选择主题路径T2,如图8下部分所示,例如一级主题1和子主题3,知识点B,问答集合QA2,知识点三元组KB2
第三步,计算第一步和第二步得到的主题路径相似度,同时考虑主题的权重,KB1和KB2的相似度取平均,QA1和QA2的相似度也取平均。相似度计算方法可以是编辑距离,也可以是词嵌入后的词向量余弦距离。
Sim(T1,T2)=w1*sim(主题1,主题3)+w2*sim(子主题2,子主题4)+average(sim(QA1,QA2))+average(sim(KB1,KB2)),其中,sim的意思是similarity,即相似度。
第四步,根据时间,地点,事件敏感增加相应QA或知识三元组的权重,例如,当前的时间是中秋节,那么会增加关于中秋节的QA或知识三元组会的权重。地点和事件处理方法类似。
会话***知识体系语义图和用户兴趣语义图的更新:当问题被推荐给某个用户后。当用户选择了***推荐的问题时,该问题会加入用户兴趣模型中。如果用户没有选择推荐的问题,那么用户兴趣模型中和该问题语义相似度较高的问题推荐指数降低某个值。
本专利通过整合知识的关联性和用户兴趣点,为用户推荐更感兴趣的知识点,从而完成更高效的个性化的启发式会话。个性化的启发式会话有以下几个好处:第一,提高沟通的效率,加快收敛到用户感兴趣的话题。第二,提高用户满意度。
请参考图9,其示出了本申请一实施例提供的会话***知识模型的构建装置的框图。
如图9所示,一种会话***知识模型的构建装置900,包括:知识点抽象模块910、主题树构建模块920、关联关系确定模块930和知识模型构建模块940。
其中,知识点抽象模块910,配置为由会话***中的知识点抽象出与所述知识点关联的至少一个主题;主题树构建模块920,配置为基于所述至少一个主题构建***主题树;关联关系确定模块930,配置为基于所述***主题树确定各知识点之间的关联关系;以及知识模型构建模块940,配置为至少基于所述***主题树和所述各知识点之间的关联关系构建会话***知识模型。
请参考图10,其示出了本申请一实施例提供的会话***知识模型的构建装置的框图。
如图10所示,一种会话***知识模型的使用装置1000,包括:用户兴趣模型构建模块1010、语义图匹配模块1020、匹配知识点生成模块1030和推荐模块1040。
其中,用户兴趣模型构建模块1010,配置为基于用户的基本信息和所述用户的历史会话数据构建用户兴趣模型,其中,所述用户兴趣模型中包含至少一个知识点;语义图匹配模块1020,配置为对所述用户兴趣模型中的知识点和根据权利要求1或2所述的方法构建的所述会话***知识模型中的知识点进行基于语义图的匹配;匹配知识点生成模块1030,配置为根据语义图的匹配结果生成至少一个匹配的知识点,其中,所述知识点与至少一个问题关联;以及推荐模块1040,配置为将与所述至少一个匹配的知识点关联的问题推荐给所述用户。
应当理解,图9和图10中记载的诸模块与参考图1、图2、图3、图4和图5中描述的方法中的各个步骤相对应。由此,上文针对方法描述的操作和特征以及相应的技术效果同样适用于图5中的诸模块,在此不再赘述。
值得注意的是,本公开的实施例中的模块并不用于限制本公开的方案,例如属性分析模块可以描述为基于获取的用户的声纹信息,分析用户的基础属性的模块。另外,还可以通过硬件处理器来实现相关功能模块,例如属性分析模块也可以用处理器实现,在此不再赘述。
在另一些实施例中,本发明实施例还提供了一种非易失性计算机存储介质,计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的会话***知识模型的构建方法;
作为一种实施方式,本发明的非易失性计算机存储介质存储有计算机可执行指令,计算机可执行指令设置为:
由会话***中的知识点抽象出与所述知识点关联的至少一个主题;
基于所述至少一个主题构建***主题树;
基于所述***主题树确定各知识点之间的关联关系;
至少基于所述***主题树和所述各知识点之间的关联关系构建会话***知识模型。
非易失性计算机可读存储介质可以包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需要的应用程序;存储数据区可存储根据会话***知识模型的构建装置的使用所创建的数据等。此外,非易失性计算机可读存储介质可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,非易失性计算机可读存储介质可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至会话***知识模型的构建装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
本发明实施例还提供一种计算机程序产品,计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序,计算机程序包括程序指令,当程序指令被计算机执行时,使计算机执行上述任一项会话***知识模型的构建方法。
图11是本发明实施例提供的电子设备的结构示意图,如图11所示,该设备包括:一个或多个处理器1110以及存储器1120,图11中以一个处理器1110为例。会话***知识模型的构建方法的设备还可以包括:输入装置1130和输出装置1140。处理器1110、存储器1120、输入装置1130和输出装置1140可以通过总线或者其他方式连接,图11中以通过总线连接为例。存储器1120为上述的非易失性计算机可读存储介质。处理器1110通过运行存储在存储器1120中的非易失性软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例会话***知识模型的构建方法。输入装置1130可接收输入的数字或字符信息,以及产生与上述装置的用户设置以及功能控制有关的键信号输入。输出装置1140可包括显示屏等显示设备。
上述产品可执行本发明实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明实施例所提供的方法。
作为一种实施方式,上述电子设备应用于会话***知识模型的构建装置中,用于客户端,包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够:
基于获取的用户的声纹信息,分析所述用户的基础属性;
基于所述用户的基础属性向所述用户推荐第一故事集合以供选择;
判断所述用户是否选择所述第一故事集合中的任一故事并记录所述用户的选择情况,其中,所述任一故事具有至少一个故事属性且每一个故事属性对应一个权重值;
基于所述用户的选择情况更新所述用户的各故事属性的权重值;
基于所述用户的基础属性和更新后的所述用户的各故事属性的权重值向所述用户推荐第二故事集合以供选择。
本申请实施例的电子设备以多种形式存在,包括但不限于:
(1)移动通信设备:这类设备的特点是具备移动通信功能,并且以提供话音、数据通信为主要目标。这类终端包括:智能手机(例如iPhone)、多媒体手机、功能性手机,以及低端手机等。
(2)超移动个人计算机设备:这类设备属于个人计算机的范畴,有计算和处理功能,一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC设备等,例如iPad。
(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放器(例如iPod),掌上游戏机,电子书,以及智能玩具和便携式车载导航设备。
(4)服务器:提供计算服务的设备,服务器的构成包括处理器、硬盘、内存、***总线等,服务器和通用的计算机架构类似,但是由于需要提供高可靠的服务,因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。
(5)其他具有数据交互功能的电子装置。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种会话***知识模型的构建方法,包括:
由会话***中的知识点抽象出与所述知识点关联的至少一个主题;
基于所述至少一个主题构建***主题树;
基于所述***主题树确定各知识点之间的关联关系;
至少基于所述***主题树和所述各知识点之间的关联关系构建会话***知识模型。
2.根据权利要求1所述的方法,其中,所述知识点包括问答对和知识图谱,所述问答对包括第一实体,所述知识图谱包括第二实体以及所述第二实体之间的关联关系,所述基于所述主题树确定各知识点之间的关联关系包括:
当所述主题树中的所述第一实体与所述第二实体相同时,将所述第一实体与所述第二实体进行关联融合;
基于关联融合后的主题树确定各知识点之间的关联关系。
3.一种会话***知识模型的使用方法,包括:
基于用户的基本信息和所述用户的历史会话数据构建用户兴趣模型,其中,所述用户兴趣模型中包含至少一个知识点;
对所述用户兴趣模型中的知识点和根据权利要求1或2所述的方法构建的所述会话***知识模型中的知识点进行基于语义图的匹配;
根据语义图的匹配结果生成至少一个匹配的知识点,其中,所述知识点与至少一个问题关联;
将与所述至少一个匹配的知识点关联的问题推荐给所述用户。
4.根据权利要求3所述的方法,其中,所述用户的历史会话数据包括用户主动问题及答案和用户接受的***推荐知识及答案,所述基于用户的基本信息和所述用户的历史会话数据构建用户兴趣模型包括:
对用户基本信息和所述用户的历史会话数据进行层次聚类,生成用户主题树;
将所述用户主动问题及答案和用户接受的***推荐知识及答案构造成包含问题、答案及问题和答案之间的关联关系的知识三元组,其中,问题和答案组成问答对;
将所述知识三元组关联到所述用户主题树上;
利用实体链接技术,将所述三元组中的问答对中的实体映射到所述会话***知识模型的知识三元组中,并将映射好的知识三元组加入到所述用户主题树下的知识点中,形成用户兴趣模型;
计算各问答对之间的语义相似度,并将所述语义相似度加入所述用户兴趣模型中。
5.根据权利要求4所述的方法,若所述用户的历史会话数据少于预设阈值,在所述对用户基本信息和所述用户的历史会话数据进行层次聚类,生成用户主题树之前,所述方法还包括:
根据所述用户的基本信息查找基本信息相同的用户;
基于所述基本信息相同的用户的问答对集合和知识三元组集合构建所述用户的问答对集合和知识三元组集合;
计算所述用户主动问题与所构建的问答对集合中的问题的语义相似度,选取语义相似度最高的前N个问题对应的问答对;
计算所述用户接受的***推荐答案对应的答案三元组与所构建的知识三元组中问题的语义相似度,选取语义相似度最高的前M个知识三元组;
将所述前N个问题对应的问答对和所述前M个知识三元组作为所述用户的初始历史会话数据。
6.根据权利要求3-5中任一项所述的方法,其中,所述语义图匹配包括节点语义相似度匹配和路径语义相似度匹配。
7.一种会话***知识模型的构建装置,包括:
知识点抽象模块,配置为由会话***中的知识点抽象出与所述知识点关联的至少一个主题;
主题树构建模块,配置为基于所述至少一个主题构建***主题树;
关联关系确定模块,配置为基于所述***主题树确定各知识点之间的关联关系;
知识模型构建模块,配置为至少基于所述***主题树和所述各知识点之间的关联关系构建会话***知识模型。
8.一种会话***知识模型的使用装置,包括:
用户兴趣模型构建模块,配置为基于用户的基本信息和所述用户的历史会话数据构建用户兴趣模型,其中,所述用户兴趣模型中包含至少一个知识点;
语义图匹配模块,配置为对所述用户兴趣模型中的知识点和根据权利要求1或2所述的方法构建的所述会话***知识模型中的知识点进行基于语义图的匹配;
匹配知识点生成模块,配置为根据语义图的匹配结果生成至少一个匹配的知识点,其中,所述知识点与至少一个问题关联;
推荐模块,配置为将与所述至少一个匹配的知识点关联的问题推荐给所述用户。
9.一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至6任一项所述方法的步骤。
10.一种存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1至6任一项所述方法的步骤。
CN201911407443.1A 2019-12-27 2019-12-27 会话***知识模型的构建和使用方法及装置 Active CN111159382B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911407443.1A CN111159382B (zh) 2019-12-27 2019-12-27 会话***知识模型的构建和使用方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911407443.1A CN111159382B (zh) 2019-12-27 2019-12-27 会话***知识模型的构建和使用方法及装置

Publications (2)

Publication Number Publication Date
CN111159382A true CN111159382A (zh) 2020-05-15
CN111159382B CN111159382B (zh) 2022-07-12

Family

ID=70559851

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911407443.1A Active CN111159382B (zh) 2019-12-27 2019-12-27 会话***知识模型的构建和使用方法及装置

Country Status (1)

Country Link
CN (1) CN111159382B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111814091A (zh) * 2020-07-17 2020-10-23 北京达佳互联信息技术有限公司 消息分发方法及相关装置
CN113704440A (zh) * 2021-09-06 2021-11-26 中国计量大学 一种基于物品图网络中路径表征的会话推荐方法
CN114549248A (zh) * 2022-02-22 2022-05-27 广州起祥科技有限公司 一种错因分析方法、装置及电子设备
CN118093788A (zh) * 2024-04-22 2024-05-28 成都同步新创科技股份有限公司 一种基于大模型的中小企业知识库的构建与搜索方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109086434A (zh) * 2018-08-13 2018-12-25 华中师范大学 一种基于主题图的知识聚合方法及***
CN110008326A (zh) * 2019-04-01 2019-07-12 苏州思必驰信息科技有限公司 会话***中的知识摘要生成方法及***
CN110377715A (zh) * 2019-07-23 2019-10-25 天津汇智星源信息技术有限公司 基于法律知识图谱的推理式精准智能问答方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109086434A (zh) * 2018-08-13 2018-12-25 华中师范大学 一种基于主题图的知识聚合方法及***
CN110008326A (zh) * 2019-04-01 2019-07-12 苏州思必驰信息科技有限公司 会话***中的知识摘要生成方法及***
CN110377715A (zh) * 2019-07-23 2019-10-25 天津汇智星源信息技术有限公司 基于法律知识图谱的推理式精准智能问答方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111814091A (zh) * 2020-07-17 2020-10-23 北京达佳互联信息技术有限公司 消息分发方法及相关装置
CN111814091B (zh) * 2020-07-17 2023-11-28 北京达佳互联信息技术有限公司 消息分发方法及相关装置
CN113704440A (zh) * 2021-09-06 2021-11-26 中国计量大学 一种基于物品图网络中路径表征的会话推荐方法
CN113704440B (zh) * 2021-09-06 2022-02-18 中国计量大学 一种基于物品图网络中路径表征的会话推荐方法
CN114549248A (zh) * 2022-02-22 2022-05-27 广州起祥科技有限公司 一种错因分析方法、装置及电子设备
CN118093788A (zh) * 2024-04-22 2024-05-28 成都同步新创科技股份有限公司 一种基于大模型的中小企业知识库的构建与搜索方法

Also Published As

Publication number Publication date
CN111159382B (zh) 2022-07-12

Similar Documents

Publication Publication Date Title
CN111159382B (zh) 会话***知识模型的构建和使用方法及装置
US11302337B2 (en) Voiceprint recognition method and apparatus
JP2020173462A (ja) コンピュータによるエージェントのための合成音声の選択
CN108763494B (zh) 对话***间的知识分享方法、对话方法及装置
US20160379106A1 (en) Human-computer intelligence chatting method and device based on artificial intelligence
CN112074857A (zh) 组合机器学习和社交数据以生成个性化推荐
US11188720B2 (en) Computing system including virtual agent bot providing semantic topic model-based response
CN112487173B (zh) 人机对话方法、设备和存储介质
CN107741976B (zh) 智能应答方法、装置、介质和电子设备
CN110234018B (zh) 多媒体内容描述生成方法、训练方法、装置、设备及介质
CN110399470B (zh) 会话消息处理
CN110008326B (zh) 会话***中的知识摘要生成方法及***
CN111798279A (zh) 基于对话的用户画像生成方法和装置
CN109948151A (zh) 构建语音助手的方法
JP7488871B2 (ja) 対話推薦方法、装置、電子機器、記憶媒体ならびにコンピュータプログラム
US20230352012A1 (en) Speech skill jumping method for man machine dialogue, electronic device and storage medium
US20190163816A1 (en) Electronic message text classification framework selection
CN111737449B (zh) 相似问题的确定方法和装置、存储介质及电子装置
US20160364733A1 (en) Attitude Inference
CN108306813B (zh) 会话消息的处理方法、服务器及客户端
KR20200096935A (ko) 다중 프로필을 제공하는 방법 및 시스템
CN117648422A (zh) 问答提示***、问答提示、库构建、模型训练方法和装置
CN111427444B (zh) 一种智能设备的控制方法和设备
US10872121B2 (en) Systems and methods for matching users
CN113360590B (zh) 兴趣点信息的更新方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 215123 building 14, Tengfei Innovation Park, 388 Xinping street, Suzhou Industrial Park, Suzhou City, Jiangsu Province

Applicant after: Sipic Technology Co.,Ltd.

Address before: 215123 building 14, Tengfei Innovation Park, 388 Xinping street, Suzhou Industrial Park, Suzhou City, Jiangsu Province

Applicant before: AI SPEECH Co.,Ltd.

GR01 Patent grant
GR01 Patent grant