CN113268580B - 会话主题迁移路径挖掘方法、装置、计算机设备及介质 - Google Patents

会话主题迁移路径挖掘方法、装置、计算机设备及介质 Download PDF

Info

Publication number
CN113268580B
CN113268580B CN202110799122.1A CN202110799122A CN113268580B CN 113268580 B CN113268580 B CN 113268580B CN 202110799122 A CN202110799122 A CN 202110799122A CN 113268580 B CN113268580 B CN 113268580B
Authority
CN
China
Prior art keywords
migration
conversation
session
node
topic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110799122.1A
Other languages
English (en)
Other versions
CN113268580A (zh
Inventor
侯晓龙
李茂昌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Life Insurance Company of China Ltd
Original Assignee
Ping An Life Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Life Insurance Company of China Ltd filed Critical Ping An Life Insurance Company of China Ltd
Priority to CN202110799122.1A priority Critical patent/CN113268580B/zh
Publication of CN113268580A publication Critical patent/CN113268580A/zh
Application granted granted Critical
Publication of CN113268580B publication Critical patent/CN113268580B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Economics (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • General Business, Economics & Management (AREA)
  • Technology Law (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及人工智能技术领域,提供一种会话主题迁移路径挖掘方法、装置、计算机设备及介质,包括:获取每个目标会话标识对应的多个会话主题;根据多个会话主题生成会话主题迁移次数矩阵;根据会话主题迁移次数矩阵生成会话主题迁移图;从会话主题迁移图中的开始节点进行搜索,确定开始节点指向的多个下一节点及开始节点指向的每个下一节点的有向边的权重;获取最大的权重的有向边对应的下一节点为目标节点,将目标节点作为新的开始节点进行搜索直至会话主题迁移图中的结束节点;连接开始节点、多个目标节点及结束节点得到第一最优迁移路径;将第一最优迁移路径确定为会话主题迁移路径。本发明能够从多个会话主题中挖掘出会话主题迁移路径。

Description

会话主题迁移路径挖掘方法、装置、计算机设备及介质
技术领域
本发明涉及人工智能技术领域,具体涉及一种会话主题迁移路径挖掘方法、装置、计算机设备及介质。
背景技术
智能拜访助手是一个为代理人提供远程拜访客户,对客户进行保险销售的工具。拜访的过程中,代理人会使用平台提供的保险产品计划方案或者建议书,和客户共享屏幕,语音讲解方案或建议书的内容。然而,因为运营策略的不同,以及代理人能力和偏好的不同,在和客户销售保险的过程中,给客户的讲解流程也不一样,保险销售的成功率也不一样。
发明人在实现本发明的过程中发现,现有技术基于客户关联强度进行社区划分,从而挖掘客户社区主题分布,达到从海量数据中高效获取信息的目的,但基于客户关联强度进行社区划分,容易导致挖掘出的主题分布分散,不聚焦,且针对不同社区挖掘的主题相互之间无迁移关系。
因此,有必要提供一种主题迁移路径的挖掘方法。
发明内容
鉴于以上内容,有必要提出一种会话主题迁移路径挖掘方法、装置、计算机设备及介质,能够确定会话主题迁移路径。
本发明的第一方面提供一种会话主题迁移路径挖掘方法,所述方法包括:
确定多个目标会话标识,并获取每个目标会话标识对应的多个会话主题;
根据所述多个会话主题生成会话主题迁移次数矩阵;
根据所述会话主题迁移次数矩阵生成会话主题迁移图;
从所述会话主题迁移图中的开始节点进行搜索,确定所述开始节点指向的多个下一节点及所述开始节点指向的每个下一节点的有向边的权重;
获取最大的权重的有向边对应的下一节点为目标节点,并将所述目标节点作为新的开始节点进行搜索,直至搜索到所述会话主题迁移图中的结束节点;
连接所述开始节点、多个所述目标节点及所述结束节点,得到第一最优迁移路径;
将所述第一最优迁移路径确定为会话主题迁移路径。
根据本发明的一个可选的实施例,所述根据所述多个会话主题生成会话主题迁移次数矩阵包括:
将每个目标会话标识对应的多个会话主题按照会话窗口的窗口时间进行顺序排序得到每个目标会话标识的会话主题队列;
判断所述会话主题队列中每两个相邻的会话窗口对应的会话主题是否一致;
当所述会话主题队列中任意两个相邻的会话窗口对应的会话主题不一致时,确定所述任意两个相邻的会话窗口对应的会话主题为迁移会话主题对;
当所述会话主题队列中任意两个相邻的会话窗口对应的会话主题一致时,删除所述任意两个相邻的会话窗口中下一个会话窗口对应的会话主题,并更新所述会话主题队列;
计算更新后的会话主题队列中相同的迁移会话主题对的个数,作为所述迁移会话主题对的迁移次数;
根据所述多个目标会话标识对应的多个会话主题及所述迁移会话主题对的迁移次数生成会话主题迁移次数矩阵。
根据本发明的一个可选的实施例,所述根据所述会话主题迁移次数矩阵生成会话主题迁移图包括:
对所述迁移会话主题对的迁移次数进行归一化处理得到归一化迁移次数;
设定所述多个会话主题为节点,在所述迁移会话主题对中的两个会话主题对应的两个节点之间建立有向边,将所述归一化迁移次数确定为所述有向边的权重,生成初始化会话主题迁移图;
计算所述初始化会话主题迁移图中每个节点的指向指数及指入指数,并获得最大指向指数和最大指入指数;
将所述最大指向指数对应的节点作为开始节点,将所述最大指入指数对应的节点作为结束节点;
断开所述初始化会话主题迁移图中指向所述开始节点的有向边及所述结束节点指向的有向边,得到所述会话主题迁移图。
根据本发明的一个可选的实施例,所述计算所述初始化会话主题迁移图中每个节点的指向指数及指入指数包括:
确定所述初始化会话主题迁移图中每个节点指向的多个第一有向边,及指向每个节点的多个第二有向边;
根据每个节点对应的所述多个第一有向边的权重进行加权计算得到每个节点的指向指数;
根据每个节点对应的所述多个第二有向边的权重进行加权计算得到每个节点的指入指数。
根据本发明的一个可选的实施例,所述方法还包括:
获取每个目标会话标识对应的多个会话关注点;
根据所述多个目标会话标识的多个标识会话关注点生成会话关注点迁移次数矩阵;
根据所述会话关注点迁移次数矩阵生成会话关注点迁移图;
搜索所述会话关注点迁移图中的第二最优迁移路径;
将所述第二最优迁移路径确定为会话关注点迁移路径。
根据本发明的一个可选的实施例,所述根据所述会话关注点迁移次数矩阵生成会话关注点迁移图包括:
将每个目标会话标识的多个会话关注点按照会话窗口的窗口时间进行顺序排序得到每个目标会话的会话关注点队列;
确定每个会话关注点队列中每个会话关注点的会话窗口;
根据所述会话主题队列中对应每个会话关注点的会话窗口的会话主题,将对应同一个会话窗口的会话主题和会话关注点确定为迁移会话关注点对;
计算多个所述会话关注点队列中同一个迁移会话关注点对的个数,作为所述迁移会话关注点对的迁移次数;
根据所述多个目标会话标识对应的多个会话主题及所述迁移会话关注点对的迁移次数生成会话关注点迁移次数矩阵。
根据本发明的一个可选的实施例,所述方法还包括:
获取待测用户的会话标识对应的多个测试会话主题;
根据所述多个测试会话主题生成测试会话主题迁移次数矩阵;
根据所述测试会话主题迁移次数矩阵生成测试会话迁移路径;
计算所述测试会话迁移路径与所述目标会话主题迁移路径之间的相似度;
判断所述相似度是否大于预设相似度阈值;
当所述相似度大于所述预设相似度阈值时,确定所述待测用户为目标对象。
本发明的第二方面提供一种会话主题迁移路径挖掘装置,所述装置包括:
主题获取模块,用于确定多个目标会话标识,并获取每个目标会话标识对应的多个会话主题;
矩阵生成模块,用于根据所述多个会话主题生成会话主题迁移次数矩阵;
迁移图生成模块,用于根据所述会话主题迁移次数矩阵生成会话主题迁移图;
路径搜索模块,用于搜索所述会话主题迁移图中的第一最优迁移路径,包括:从所述会话主题迁移图中的开始节点进行搜索,确定所述开始节点指向的多个下一节点及所述开始节点指向的每个下一节点的有向边的权重;获取最大的权重的有向边对应的下一节点为目标节点,并将所述目标节点作为新的开始节点进行搜索,直至搜索到所述会话主题迁移图中的结束节点;连接所述开始节点、多个所述目标节点及所述结束节点,得到第一最优迁移路径;
迁移确定模块,用于将所述第一最优迁移路径确定为会话主题迁移路径。
本发明的第三方面提供一种计算机设备,所述计算机设备包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现所述会话主题迁移路径挖掘方法。
本发明的第四方面提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述会话主题迁移路径挖掘方法。
综上所述,本发明所述的会话主题迁移路径挖掘方法、装置、计算机设备及介质,首先确定出多个目标会话标识,在获取每个目标会话标识对应的多个会话主题之后,根据所述多个会话主题生成会话主题迁移次数矩阵,从而根据所述会话主题迁移次数矩阵生成会话主题迁移图,通过从所述会话主题迁移图中搜索出第一最优迁移路径来得到目标会话主题迁移路径。本发明根据生成的会话主题迁移图中搜索第一最优迁移路径,从而确定会话主题迁移路径,从会话主题迁移路径中能够显示主题之间的迁移关系,即,在这条迁移路径中有哪些主题,从哪个主题迁移到哪个主题。
附图说明
图1是本发明实施例一提供的会话主题迁移路径挖掘方法的流程图。
图2是本发明实施例二提供的会话主题迁移路径挖掘装置的结构图。
图3是本发明实施例三提供的计算机设备的结构示意图。
图4是本发明实施例提供的会话主题迁移次数矩阵的示意图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施例对本发明进行详细描述。需要说明的是,在不冲突的情况下,本发明的实施例及实施例中的特征可以相互组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。
本发明实施例提供的会话主题迁移路径挖掘方法由计算机设备执行,相应地,会话主题迁移路径挖掘装置运行于计算机设备中。
图1是本发明实施例一提供的会话主题迁移路径挖掘方法的流程图。所述会话主题迁移路径挖掘方法具体包括以下步骤,根据不同的需求,该流程图中步骤的顺序可以改变,某些可以省略。
S11,确定多个目标会话标识,并获取每个目标会话标识对应的多个会话主题。
在保险代理人销售保险的场景中,保险代理人通过远程服务(例如,远程视频或者远程语音)的方式依据已备好的保险产品计划方案或者建议书为客户推荐保险产品,每个保险代理人每次触发远程服务功能时,计算机设备创建一个会话通道,并产生一个会话标识,用来唯一标识该通远程会话。
计算机设备首先确定多个目标会话标识,并以每个目标会话标识为查询关键词查询第一数据库表,得到每个目标会话标识对应的多个会话主题。其中,所述第一数据库表中关联存储了用户标识、会话标识、会话主题及会话远程音频链接,根据所述会话远程音频链接能够获取对应的会话音频。所述会话主题可以为:寒暄、现存风险、产品介绍、疑问解答、客户签约等。
在一个可选的实施例中,所述确定多个目标会话标识包括:
获取多个用户的历史数据;
对所述多个用户的历史数据进行聚类得到多个数据簇;
确定每个数据簇的中心并确定最大的中心对应的数据簇为目标数据簇;
获取所述目标数据簇中的历史数据对应的目标用户的多个目标会话标识。
其中,所述历史数据可以包括但不限于:用户行为数据、用户绩效数据等。所述用户行为数据可以包括:参会次数,培训次数等与保险销售相关的行为。
对多个用户的历史数据进行聚类,实现了对用户的聚类,将具有相同属性的用户聚为同一类,具有不同属性的用户聚为不同的类。
数据簇的中心越大,表明该数据簇对应的用户越属于优秀的代理人,数据簇的中心越小,表明该数据簇对应的用户越属于较差的代理人。将最大的中心对应的数据簇确定为会话主题迁移路径的挖掘对象,从而挖掘优秀的代理人的会话主题的迁移路径。
S12,根据所述多个会话主题生成会话主题迁移次数矩阵。
每个目标会话标识对应多个会话主题,多个会话主题之间发生会话主题变换的称之为会话主题迁移。
每个目标会话标识对应的多个会话主题可能不同,将所有的目标会话标识对应的多个会话主题进行整合,生成会话主题迁移次数矩阵。
在一个可选的实施例中,所述根据所述多个会话主题生成会话主题迁移次数矩阵包括:
将每个目标会话标识对应的多个会话主题按照会话窗口的窗口时间进行顺序排序得到每个目标会话标识的会话主题队列;
判断所述会话主题队列中每两个相邻的会话窗口对应的会话主题是否一致;
当所述会话主题队列中任意两个相邻的会话窗口对应的会话主题不一致时,确定所述任意两个相邻的会话窗口对应的会话主题为迁移会话主题对;
当所述会话主题队列中任意两个相邻的会话窗口对应的会话主题一致时,删除所述任意两个相邻的会话窗口中下一个会话窗口对应的会话主题,并更新所述会话主题队列;
计算更新后的会话主题队列中相同的迁移会话主题对的个数,作为所述迁移会话主题对的迁移次数;
根据所述多个目标会话标识对应的多个会话主题及所述迁移会话主题对的迁移次数生成会话主题迁移次数矩阵。
其中,所述会话窗口是指一次会话的起始与该次会话的结束之间的时间段。例如,代理人与客户远程沟通时,代理人“您好,接下来我为您介绍本保险产品的一些保障,XXXXX”,客户“这个要如何交费,交多久”,则“您好,接下来我为您介绍本保险产品的一些保障”称之为上一个会话窗口,“这个要如何交费,交多久”称之为下一个会话窗口。
针对每个目标会话标识的多个会话主题,将多个会话主题按照会话窗口的窗口结束时间进行顺序排序得到每个目标会话标识的会话主题队列。一个目标会话标识对应一个会话主题队列。
计算机设备判断每个目标会话标识的会话主题队列中下一个会话窗口对应的会话主题与上一个会话窗口对应的会话主题是否一致,当所述下一个会话窗口对应的会话主题与所述上一个会话窗口对应的会话主题一致时,确定所述下一个会话窗口对应的会话主题未迁移;当所述下一个会话窗口对应的会话主题与所述上一个会话窗口对应的会话主题不一致时,确定所述下一个会话窗口对应的会话主题已迁移。
示例性的,假设某一个目标会话标识对应的更新后的会话主题队列为a-b-c-d-a-b-d,则迁移会话主题对(主题a和主题b)的迁移次数为2,迁移会话主题对(主题b和主题c)的迁移次数为1,迁移会话主题对(主题c和主题d)的迁移次数为1,迁移会话主题对(主题d和主题a)的迁移次数为1,迁移会话主题对(主题b和主题d)的迁移次数为1,生成的该目标会话标识对应的会话主题迁移次数矩阵如图4所示。
对于多个目标会话标识,则将多个目标会话标识对应的更新后的会话主题队列进行整合,得到多个迁移会话主题队,计算多个迁移会话主题队中相同的迁移会话主题对的迁移次数,根据所述多个会话主题及所述迁移会话主题对的迁移次数生成会话主题迁移次数矩阵。即,根据多个目标会话标识对应的更新后的会话主题队列,生成一个总的会话主题迁移次数矩阵,整体上代表了优秀的代理人的会话主题迁移模型。
S13,根据所述会话主题迁移次数矩阵生成会话主题迁移图。
计算机设备在生成会话主题迁移次数矩阵之后,再根据会话主题迁移次数矩阵生成会话主题迁移图,来直观的表示整个会话主题的迁移网络结构。
在一个可选的实施例中,所述根据所述会话主题迁移次数矩阵生成会话主题迁移图包括:
对所述迁移会话主题对的迁移次数进行归一化处理得到归一化迁移次数;
设定所述多个会话主题为节点,在所述迁移会话主题对中的两个会话主题对应的两个节点之间建立有向边,将所述归一化迁移次数确定为所述有向边的权重,生成初始化会话主题迁移图;
计算所述初始化会话主题迁移图中每个节点的指向指数及指入指数,并获得最大指向指数和最大指入指数;
将所述最大指向指数对应的节点作为开始节点,将所述最大指入指数对应的节点作为结束节点;
断开所述初始化会话主题迁移图中指向所述开始节点的有向边及所述结束节点指向的有向边,得到所述会话主题迁移图。
计算机设备可以计算多个所述迁移次数的均值和方差,根据所述均值和方差对每个所述迁移次数进行归一化处理,得到归一化迁移次数,通过对迁移次数进行归一化处理,能够将迁移次数统一到同一个量纲,能够有效的提高会话主题迁移图的生成效率。
将每个会话主题作为一个节点,每两个节点对应的两个会话主题若为一个迁移会话主题对,则在这两个节点之间建立一条有向边,从上一个会话窗口的会话主题对应的节点指向下一个会话窗口的会话主题对应的节点。有向边的权重为迁移会话主题对的归一化迁移次数。
指向指数越大,表明对应的节点越作为开始节点的可能性越大,即有较多的代理人从该节点对应的会话主题开始进行远程会话,并迁移到其他会话主题;指向指数越小,表明对应的节点越作为开始节点的可能性越小,即没有或者有较少的代理人从该节点对应的会话主题开始进行远程会话。指入指数越大,表明对应的节点越作为结束节点的可能性越大,即有较多的代理人从其他节点对应的会话主题迁移到该节点对应的会话主题,结束远程会话。
计算机设备确定了开始节点和结束节点之后,将指向所述开始节点的有向边断开,及将所述结束节点指向的有向边断开,实现了将初始化会话主题迁移图更新为会话主题迁移图。
该可选的实施例中,通过计算每个节点的指向指数和指入指数,能够快速的确定初始化会话主题迁移图中的开始节点和结束节点,且从统计学的角度确定开始节点和接收节点更为直观和准确;再确定开始节点和结束节点之后,断开指向所述开始节点的有向边及断开所述结束节点指向的有向边,简化了会话主题迁移图的有向边的数量,有利于后续挖掘最优会话主题迁移路径。
在一个可选的实施例中,所述计算所述初始化会话主题迁移图中每个节点的指向指数及指入指数包括:
确定所述初始化会话主题迁移图中每个节点指向的多个第一有向边,及指向每个节点的多个第二有向边;
根据每个节点对应的所述多个第一有向边的权重进行加权计算得到每个节点的指向指数;
根据每个节点对应的所述多个第二有向边的权重进行加权计算得到每个节点的指入指数。
示例性的,假设节点A指向了节点B和节点C,其中,节点A指向节点B的有向边的权重为D1,节点A指向节点C的有向边的权重为D2,则节点A的指向指数为D1+D2。
假设节点F和节点T指向了节点H,其中,节点F指向节点H的有向边的权重为D3,节点T指向节点H的有向边的权重为D4,则节点H的指入指数为D3+D4。
S14,搜索所述会话主题迁移图中的第一最优迁移路径。
可以采用搜索算法搜索所述会话主题迁移图中的第一最优迁移路径,所述搜索算法可以,例如,最优路径搜索算法。
计算机设备在确定开始节点和结束节点之后,再根据所述开始节点和所述结束节点搜索所述会话主题迁移图中的第一最优迁移路径。所述第一最优迁移路径为所述会话主题迁移图中的主干网络图。
在一个可选的实施例中,所述搜索所述会话主题迁移图中的第一最优迁移路径包括:
从所述会话主题迁移图中的开始节点进行搜索,确定所述开始节点指向的多个下一节点及所述开始节点指向的每个下一节点的有向边的权重;
获取最大的权重的有向边对应的下一节点为目标节点,并将所述目标节点作为新的开始节点进行搜索,直至搜索到所述会话主题迁移图中的结束节点;
连接所述开始节点、多个所述目标节点及所述结束节点,得到第一最优迁移路径。
确定所述开始节点指向的多个第一节点及所述开始节点指向的每个第一节点的有向边的第一权重,获取最大的第一权重对应的第一节点为第一目标节点,确定所述第一目标节点指向的多个第二节点及所述第一目标节点指向的每个第二节点的有向边的第二权重,获取最大的第二权重对应的第二节点为第二目标节点,以此类推,重复上述过程,直至搜索到所述结束节点,将所述开始节点、所述第一目标节点、所述第二目标节点、……、所述结束节点连接起来,得到所述会话主题迁移图中的第一最优迁移路径。
S15,将所述第一最优迁移路径确定为会话主题迁移路径。
计算机设备通过搜索所述会话主题迁移图中的最优迁移路径能够确定优秀的代理人的会话主题迁移路径。
在一个可选的实施方式中,所述方法还包括:
获取每个目标会话标识对应的多个会话关注点;
根据所述多个目标会话标识的多个标识会话关注点生成会话关注点迁移次数矩阵;
根据所述会话关注点迁移次数矩阵生成会话关注点迁移图;
搜索所述会话关注点迁移图中的第二最优迁移路径;
将所述第二最优迁移路径确定为会话关注点迁移路径。
计算机设备在确定多个目标会话标识之后,以每个目标会话标识为查询关键词查询第二数据库表,得到每个目标会话标识对应的多个会话关注点。所述会话关注点为客户存在异议的点或者感兴趣的点。
计算机设备将每个目标会话标识的多个会话关注点按照会话窗口的窗口时间进行顺序排序得到每个目标会话的会话关注点队列,确定每个会话关注点队列中每个会话关注点的会话窗口,根据所述会话主题队列中对应每个会话关注点的会话窗口的会话主题,将对应同一个会话窗口的会话主题和会话关注点确定为迁移会话关注点对,计算多个所述会话关注点队列中同一个迁移会话关注点对的个数,作为所述迁移会话关注点对的迁移次数,根据所述多个目标会话标识对应的多个会话主题及所述迁移会话关注点对的迁移次数生成会话关注点迁移次数矩阵。
在一个可选的实施例中,所述方法还包括:
获取待测用户的会话标识对应的多个测试会话主题;
根据所述多个测试会话主题生成测试会话主题迁移次数矩阵;
根据所述测试会话主题迁移次数矩阵生成测试会话迁移路径;
计算所述测试会话迁移路径与所述目标会话主题迁移路径之间的相似度;
判断所述相似度是否大于预设相似度阈值;
当所述相似度大于所述预设相似度阈值时,确定所述待测用户为目标对象。
其中,所述待测用户可以是指模拟远程服务为客户推荐保险产品的代理人,例如,可以是实习期考核的代理人。
计算机设备获取待测用户的会话标识,并以待测用户的会话标识为查询关键词查询第一数据库表,得到多个测试会话主题。所述多个测试会话主题可以是待测用户一次模拟的会话主题,也可以是多次模拟的会话主题。
计算机设备根据所述多个测试会话主题生成测试会话主题迁移次数矩阵的过程与根据所述多个会话主题生成会话主题迁移次数矩阵的过程相同,本发明在此不再详细阐述。
该可选的实施例中,根据待测用户的会话标识对应的多个测试会话主题生成测试会话迁移路径,并通过计算所述测试会话迁移路径与所述目标会话主题迁移路径之间的相似度来确定所述待测用户是否为目标对象,即确定所述待测用户是否具备成为优秀代理人的潜质。
需要强调的是,为进一步保证上述会话主题的私密性和安全性,上述会话主题可存储于区块链的节点中。
图2是本发明实施例二提供的会话主题迁移路径挖掘装置的结构图。
在一些实施例中,所述会话主题迁移路径挖掘装置20可以包括多个由计算机程序段所组成的功能模块。所述会话主题迁移路径挖掘装置20中的各个程序段的计算机程序可以存储于计算机设备的存储器中,并由至少一个处理器所执行,以执行(详见图1描述)会话主题迁移路径挖掘的功能。
本实施例中,所述会话主题迁移路径挖掘装置20根据其所执行的功能,可以被划分为多个功能模块。所述功能模块可以包括:主题获取模块201、矩阵生成模块202、迁移图生成模块203、路径搜索模块204、迁移确定模块205及目标确定模块206。本发明所称的模块是指一种能够被至少一个处理器所执行并且能够完成固定功能的一系列计算机程序段,其存储在存储器中。在本实施例中,关于各模块的功能将在后续的实施例中详述。
所述主题获取模块201,用于确定多个目标会话标识,并获取每个目标会话标识对应的多个会话主题。
在保险代理人销售保险的场景中,保险代理人通过远程服务(例如,远程视频或者远程语音)的方式依据已备好的保险产品计划方案或者建议书为客户推荐保险产品,每个保险代理人每次触发远程服务功能时,计算机设备创建一个会话通道,并产生一个会话标识,用来唯一标识该通远程会话。
计算机设备首先确定多个目标会话标识,并以每个目标会话标识为查询关键词查询第一数据库表,得到每个目标会话标识对应的多个会话主题。其中,所述第一数据库表中关联存储了用户标识、会话标识、会话主题及会话远程音频链接,根据所述会话远程音频链接能够获取对应的会话音频。所述会话主题可以为:寒暄、现存风险、产品介绍、疑问解答、客户签约等。
在一个可选的实施例中,所述主题获取模块201确定多个目标会话标识包括:
获取多个用户的历史数据;
对所述多个用户的历史数据进行聚类得到多个数据簇;
确定每个数据簇的中心并确定最大的中心对应的数据簇为目标数据簇;
获取所述目标数据簇中的历史数据对应的目标用户的多个目标会话标识。
其中,所述历史数据可以包括但不限于:用户行为数据、用户绩效数据等。所述用户行为数据可以包括:参会次数,培训次数等与保险销售相关的行为。
对多个用户的历史数据进行聚类,实现了对用户的聚类,将具有相同属性的用户聚为同一类,具有不同属性的用户聚为不同的类。
数据簇的中心越大,表明该数据簇对应的用户越属于优秀的代理人,数据簇的中心越小,表明该数据簇对应的用户越属于较差的代理人。将最大的中心对应的数据簇确定为会话主题迁移路径的挖掘对象,从而挖掘优秀的代理人的会话主题的迁移路径。
所述矩阵生成模块202,用于根据所述多个会话主题生成会话主题迁移次数矩阵。
每个目标会话标识对应多个会话主题,多个会话主题之间发生会话主题变换的称之为会话主题迁移。
每个目标会话标识对应的多个会话主题可能不同,将所有的目标会话标识对应的多个会话主题进行整合,生成会话主题迁移次数矩阵。
在一个可选的实施例中,所述矩阵生成模块202根据所述多个会话主题生成会话主题迁移次数矩阵包括:
将每个目标会话标识对应的多个会话主题按照会话窗口的窗口时间进行顺序排序得到每个目标会话标识的会话主题队列;
判断所述会话主题队列中每两个相邻的会话窗口对应的会话主题是否一致;
当所述会话主题队列中任意两个相邻的会话窗口对应的会话主题不一致时,确定所述任意两个相邻的会话窗口对应的会话主题为迁移会话主题对;
当所述会话主题队列中任意两个相邻的会话窗口对应的会话主题一致时,删除所述任意两个相邻的会话窗口中下一个会话窗口对应的会话主题,并更新所述会话主题队列;
计算更新后的会话主题队列中相同的迁移会话主题对的个数,作为所述迁移会话主题对的迁移次数;
根据所述多个目标会话标识对应的多个会话主题及所述迁移会话主题对的迁移次数生成会话主题迁移次数矩阵。
其中,所述会话窗口是指一次会话的起始与该次会话的结束之间的时间段。例如,代理人与客户远程沟通时,代理人“您好,接下来我为您介绍本保险产品的一些保障,XXXXX”,客户“这个要如何交费,交多久”,则“您好,接下来我为您介绍本保险产品的一些保障”称之为上一个会话窗口,“这个要如何交费,交多久”称之为下一个会话窗口。
针对每个目标会话标识的多个会话主题,将多个会话主题按照会话窗口的窗口结束时间进行顺序排序得到每个目标会话标识的会话主题队列。一个目标会话标识对应一个会话主题队列。
计算机设备判断每个目标会话标识的会话主题队列中下一个会话窗口对应的会话主题与上一个会话窗口对应的会话主题是否一致,当所述下一个会话窗口对应的会话主题与所述上一个会话窗口对应的会话主题一致时,确定所述下一个会话窗口对应的会话主题未迁移;当所述下一个会话窗口对应的会话主题与所述上一个会话窗口对应的会话主题不一致时,确定所述下一个会话窗口对应的会话主题已迁移。
示例性的,假设某一个目标会话标识对应的更新后的会话主题队列为a-b-c-d-a-b-d,则迁移会话主题对(主题a和主题b)的迁移次数为2,迁移会话主题对(主题b和主题c)的迁移次数为1,迁移会话主题对(主题c和主题d)的迁移次数为1,迁移会话主题对(主题d和主题a)的迁移次数为1,迁移会话主题对(主题b和主题d)的迁移次数为1,生成的该目标会话标识对应的会话主题迁移次数矩阵如图4所示。
对于多个目标会话标识,则将多个目标会话标识对应的更新后的会话主题队列进行整合,得到多个迁移会话主题队,计算多个迁移会话主题队中相同的迁移会话主题对的迁移次数,根据所述多个会话主题及所述迁移会话主题对的迁移次数生成会话主题迁移次数矩阵。即,根据多个目标会话标识对应的更新后的会话主题队列,生成一个总的会话主题迁移次数矩阵,整体上代表了优秀的代理人的会话主题迁移模型。
所述迁移图生成模块203,用于根据所述会话主题迁移次数矩阵生成会话主题迁移图。
计算机设备在生成会话主题迁移次数矩阵之后,再根据会话主题迁移次数矩阵生成会话主题迁移图,来直观的表示整个会话主题的迁移网络结构。
在一个可选的实施例中,所述迁移图生成模块203根据所述会话主题迁移次数矩阵生成会话主题迁移图包括:
对所述迁移会话主题对的迁移次数进行归一化处理得到归一化迁移次数;
设定所述多个会话主题为节点,在所述迁移会话主题对中的两个会话主题对应的两个节点之间建立有向边,将所述归一化迁移次数确定为所述有向边的权重,生成初始化会话主题迁移图;
计算所述初始化会话主题迁移图中每个节点的指向指数及指入指数,并获得最大指向指数和最大指入指数;
将所述最大指向指数对应的节点作为开始节点,将所述最大指入指数对应的节点作为结束节点;
断开所述初始化会话主题迁移图中指向所述开始节点的有向边及所述结束节点指向的有向边,得到所述会话主题迁移图。
计算机设备可以计算多个所述迁移次数的均值和方差,根据所述均值和方差对每个所述迁移次数进行归一化处理,得到归一化迁移次数,通过对迁移次数进行归一化处理,能够将迁移次数统一到同一个量纲,能够有效的提高会话主题迁移图的生成效率。
将每个会话主题作为一个节点,每两个节点对应的两个会话主题若为一个迁移会话主题对,则在这两个节点之间建立一条有向边,从上一个会话窗口的会话主题对应的节点指向下一个会话窗口的会话主题对应的节点。有向边的权重为迁移会话主题对的归一化迁移次数。
指向指数越大,表明对应的节点越作为开始节点的可能性越大,即有较多的代理人从该节点对应的会话主题开始进行远程会话,并迁移到其他会话主题;指向指数越小,表明对应的节点越作为开始节点的可能性越小,即没有或者有较少的代理人从该节点对应的会话主题开始进行远程会话。指入指数越大,表明对应的节点越作为结束节点的可能性越大,即有较多的代理人从其他节点对应的会话主题迁移到该节点对应的会话主题,结束远程会话。
计算机设备确定了开始节点和结束节点之后,将指向所述开始节点的有向边断开,及将所述结束节点指向的有向边断开,实现了将初始化会话主题迁移图更新为会话主题迁移图。
该可选的实施例中,通过计算每个节点的指向指数和指入指数,能够快速的确定初始化会话主题迁移图中的开始节点和结束节点,且从统计学的角度确定开始节点和接收节点更为直观和准确;再确定开始节点和结束节点之后,断开指向所述开始节点的有向边及断开所述结束节点指向的有向边,简化了会话主题迁移图的有向边的数量,有利于后续挖掘最优会话主题迁移路径。
在一个可选的实施例中,所述计算所述初始化会话主题迁移图中每个节点的指向指数及指入指数包括:
确定所述初始化会话主题迁移图中每个节点指向的多个第一有向边,及指向每个节点的多个第二有向边;
根据每个节点对应的所述多个第一有向边的权重进行加权计算得到每个节点的指向指数;
根据每个节点对应的所述多个第二有向边的权重进行加权计算得到每个节点的指入指数。
示例性的,假设节点A指向了节点B和节点C,其中,节点A指向节点B的有向边的权重为D1,节点A指向节点C的有向边的权重为D2,则节点A的指向指数为D1+D2。
假设节点F和节点T指向了节点H,其中,节点F指向节点H的有向边的权重为D3,节点T指向节点H的有向边的权重为D4,则节点H的指入指数为D3+D4。
所述路径搜索模块204,用于搜索所述会话主题迁移图中的第一最优迁移路径。
可以采用搜索算法搜索所述会话主题迁移图中的第一最优迁移路径,所述搜索算法可以,例如,最优路径搜索算法。
计算机设备在确定开始节点和结束节点之后,再根据所述开始节点和所述结束节点搜索所述会话主题迁移图中的第一最优迁移路径。所述第一最优迁移路径为所述会话主题迁移图中的主干网络图。
在一个可选的实施例中,所述路径搜索模块204搜索所述会话主题迁移图中的第一最优迁移路径包括:
从所述会话主题迁移图中的开始节点进行搜索,确定所述开始节点指向的多个下一节点及所述开始节点指向的每个下一节点的有向边的权重;
获取最大的权重的有向边对应的下一节点为目标节点,并将所述目标节点作为新的开始节点进行搜索,直至搜索到所述会话主题迁移图中的结束节点;
连接所述开始节点、多个所述目标节点及所述结束节点,得到第一最优迁移路径。
确定所述开始节点指向的多个第一节点及所述开始节点指向的每个第一节点的有向边的第一权重,获取最大的第一权重对应的第一节点为第一目标节点,确定所述第一目标节点指向的多个第二节点及所述第一目标节点指向的每个第二节点的有向边的第二权重,获取最大的第二权重对应的第二节点为第二目标节点,以此类推,重复上述过程,直至搜索到所述结束节点,将所述开始节点、所述第一目标节点、所述第二目标节点、……、所述结束节点连接起来,得到所述会话主题迁移图中的第一最优迁移路径。
所述迁移确定模块205,用于将所述第一最优迁移路径确定为会话主题迁移路径。
计算机设备通过搜索所述会话主题迁移图中的最优迁移路径能够确定优秀的代理人的会话主题迁移路径。
在一个可选的实施方式中,所述主题获取模块201还用于获取每个目标会话标识对应的多个会话关注点;
所述矩阵生成模块202,还用于根据所述多个目标会话标识的多个标识会话关注点生成会话关注点迁移次数矩阵;
所述迁移图生成模块203,还用于根据所述会话关注点迁移次数矩阵生成会话关注点迁移图;
所述路径搜索模块204,还用于搜索所述会话关注点迁移图中的第二最优迁移路径;
所述迁移确定模块205,还用于将所述第二最优迁移路径确定为会话关注点迁移路径。
计算机设备在确定多个目标会话标识之后,以每个目标会话标识为查询关键词查询第二数据库表,得到每个目标会话标识对应的多个会话关注点。所述会话关注点为客户存在异议的点或者感兴趣的点。
计算机设备将每个目标会话标识的多个会话关注点按照会话窗口的窗口时间进行顺序排序得到每个目标会话的会话关注点队列,确定每个会话关注点队列中每个会话关注点的会话窗口,根据所述会话主题队列中对应每个会话关注点的会话窗口的会话主题,将对应同一个会话窗口的会话主题和会话关注点确定为迁移会话关注点对,计算多个所述会话关注点队列中同一个迁移会话关注点对的个数,作为所述迁移会话关注点对的迁移次数,根据所述多个目标会话标识对应的多个会话主题及所述迁移会话关注点对的迁移次数生成会话关注点迁移次数矩阵。
所述目标确定模块206,用于确定待测用户是否为目标对象。
在一个可选的实施例中,所述目标确定模块206确定待测用户是否为目标对象包括:
获取待测用户的会话标识对应的多个测试会话主题;
根据所述多个测试会话主题生成测试会话主题迁移次数矩阵;
根据所述测试会话主题迁移次数矩阵生成测试会话迁移路径;
计算所述测试会话迁移路径与所述目标会话主题迁移路径之间的相似度;
判断所述相似度是否大于预设相似度阈值;
当所述相似度大于所述预设相似度阈值时,确定所述待测用户为目标对象。
其中,所述待测用户可以是指模拟远程服务为客户推荐保险产品的代理人,例如,可以是实习期考核的代理人。
计算机设备获取待测用户的会话标识,并以待测用户的会话标识为查询关键词查询第一数据库表,得到多个测试会话主题。所述多个测试会话主题可以是待测用户一次模拟的会话主题,也可以是多次模拟的会话主题。
计算机设备根据所述多个测试会话主题生成测试会话主题迁移次数矩阵的过程与根据所述多个会话主题生成会话主题迁移次数矩阵的过程相同,本发明在此不再详细阐述。
该可选的实施例中,根据待测用户的会话标识对应的多个测试会话主题生成测试会话迁移路径,并通过计算所述测试会话迁移路径与所述目标会话主题迁移路径之间的相似度来确定所述待测用户是否为目标对象,即确定所述待测用户是否具备成为优秀代理人的潜质。
需要强调的是,为进一步保证上述会话的私密性和安全性,上述会话主题可存储于区块链的节点中。
参阅图3所示,为本发明实施例三提供的计算机设备的结构示意图。在本发明较佳实施例中,所述计算机设备3包括存储器31、至少一个处理器32、至少一条通信总线33及收发器34。
本领域技术人员应该了解,图3示出的计算机设备的结构并不构成本发明实施例的限定,既可以是总线型结构,也可以是星形结构,所述计算机设备3还可以包括比图示更多或更少的其他硬件或者软件,或者不同的部件布置。
在一些实施例中,所述计算机设备3是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路、可编程门阵列、数字处理器及嵌入式设备等。所述计算机设备3还可包括客户设备,所述客户设备包括但不限于任何一种可与客户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、数码相机等。
需要说明的是,所述计算机设备3仅为举例,其他现有的或今后可能出现的电子产品如可适应于本发明,也应包含在本发明的保护范围以内,并以引用方式包含于此。
在一些实施例中,所述存储器31中存储有计算机程序,所述计算机程序被所述至少一个处理器32执行时实现如所述的会话主题迁移路径挖掘方法中的全部或者部分步骤。所述存储器31包括只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable Read-Only Memory,PROM)、可擦除可编程只读存储器(ErasableProgrammable Read-Only Memory,EPROM)、一次可编程只读存储器(One-timeProgrammable Read-Only Memory,OTPROM)、电子擦除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
进一步地,所述计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作***、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
在一些实施例中,所述至少一个处理器32是所述计算机设备3的控制核心(Control Unit),利用各种接口和线路连接整个计算机设备3的各个部件,通过运行或执行存储在所述存储器31内的程序或者模块,以及调用存储在所述存储器31内的数据,以执行计算机设备3的各种功能和处理数据。例如,所述至少一个处理器32执行所述存储器中存储的计算机程序时实现本发明实施例中所述的会话主题迁移路径挖掘方法的全部或者部分步骤;或者实现会话主题迁移路径挖掘装置的全部或者部分功能。所述至少一个处理器32可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processingunit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。
在一些实施例中,所述至少一条通信总线33被设置为实现所述存储器31以及所述至少一个处理器32等之间的连接通信。
尽管未示出,所述计算机设备3还可以包括给各个部件供电的电源(比如电池),优选的,电源可以通过电源管理装置与所述至少一个处理器32逻辑相连,从而通过电源管理装置实现管理充电、放电、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述计算机设备3还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
上述以软件功能模块的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,计算机设备,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,既可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或,单数不排除复数。本发明陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

Claims (10)

1.一种会话主题迁移路径挖掘方法,其特征在于,所述方法包括:
确定多个目标会话标识,并获取每个目标会话标识对应的多个会话主题;
根据所述多个会话主题生成会话主题迁移次数矩阵;
根据所述会话主题迁移次数矩阵生成初始化会话主题迁移图,计算所述初始化会话主题迁移图中每个节点的指向指数及指入指数,并获得最大指向指数和最大指入指数,将所述最大指向指数对应的节点作为开始节点,将所述最大指入指数对应的节点作为结束节点,断开所述初始化会话主题迁移图中指向所述开始节点的有向边及所述结束节点指向的有向边,得到会话主题迁移图;
从所述会话主题迁移图中的所述开始节点进行搜索,确定所述开始节点指向的多个下一节点及所述开始节点指向的每个下一节点的有向边的权重;
获取最大的权重的有向边对应的下一节点为目标节点,并将所述目标节点作为新的开始节点进行搜索,直至搜索到所述会话主题迁移图中的所述结束节点;
连接所述开始节点、多个所述目标节点及所述结束节点,得到第一最优迁移路径;
将所述第一最优迁移路径确定为会话主题迁移路径。
2.如权利要求1所述的会话主题迁移路径挖掘方法,其特征在于,所述根据所述多个会话主题生成会话主题迁移次数矩阵包括:
将每个目标会话标识对应的多个会话主题按照会话窗口的窗口时间进行顺序排序得到每个目标会话标识的会话主题队列;
判断所述会话主题队列中每两个相邻的会话窗口对应的会话主题是否一致;
当所述会话主题队列中任意两个相邻的会话窗口对应的会话主题不一致时,确定所述任意两个相邻的会话窗口对应的会话主题为迁移会话主题对;
当所述会话主题队列中任意两个相邻的会话窗口对应的会话主题一致时,删除所述任意两个相邻的会话窗口中下一个会话窗口对应的会话主题,并更新所述会话主题队列;
计算更新后的会话主题队列中相同的迁移会话主题对的个数,作为所述迁移会话主题对的迁移次数;
根据所述多个目标会话标识对应的多个会话主题及所述迁移会话主题对的迁移次数生成会话主题迁移次数矩阵。
3.如权利要求2所述的会话主题迁移路径挖掘方法,其特征在于,所述根据所述会话主题迁移次数矩阵生成初始化会话主题迁移图包括:
对所述迁移会话主题对的迁移次数进行归一化处理得到归一化迁移次数;
设定所述多个会话主题为节点,在所述迁移会话主题对中的两个会话主题对应的两个节点之间建立有向边,将所述归一化迁移次数确定为所述有向边的权重,生成初始化会话主题迁移图。
4.如权利要求3所述的会话主题迁移路径挖掘方法,其特征在于,所述计算所述初始化会话主题迁移图中每个节点的指向指数及指入指数包括:
确定所述初始化会话主题迁移图中每个节点指向的多个第一有向边,及指向每个节点的多个第二有向边;
根据每个节点对应的所述多个第一有向边的权重进行加权计算得到每个节点的指向指数;
根据每个节点对应的所述多个第二有向边的权重进行加权计算得到每个节点的指入指数。
5.如权利要求2至4中任意一项所述的会话主题迁移路径挖掘方法,其特征在于,所述方法还包括:
获取每个目标会话标识对应的多个会话关注点;
根据所述多个目标会话标识的多个标识会话关注点生成会话关注点迁移次数矩阵;
根据所述会话关注点迁移次数矩阵生成会话关注点迁移图;
搜索所述会话关注点迁移图中的第二最优迁移路径;
将所述第二最优迁移路径确定为会话关注点迁移路径。
6.如权利要求5所述的会话主题迁移路径挖掘方法,其特征在于,所述根据所述会话关注点迁移次数矩阵生成会话关注点迁移图包括:
将每个目标会话标识的多个会话关注点按照会话窗口的窗口时间进行顺序排序得到每个目标会话的会话关注点队列;
确定每个会话关注点队列中每个会话关注点的会话窗口;
根据所述会话主题队列中对应每个会话关注点的会话窗口的会话主题,将对应同一个会话窗口的会话主题和会话关注点确定为迁移会话关注点对;
计算多个所述会话关注点队列中同一个迁移会话关注点对的个数,作为所述迁移会话关注点对的迁移次数;
根据所述多个目标会话标识对应的多个会话主题及所述迁移会话关注点对的迁移次数生成会话关注点迁移次数矩阵。
7.如权利要求1至4中任意一项所述的会话主题迁移路径挖掘方法,其特征在于,所述方法还包括:
获取待测用户的会话标识对应的多个测试会话主题;
根据所述多个测试会话主题生成测试会话主题迁移次数矩阵;
根据所述测试会话主题迁移次数矩阵生成测试会话迁移路径;
计算所述测试会话迁移路径与所述会话主题迁移路径之间的相似度;
判断所述相似度是否大于预设相似度阈值;
当所述相似度大于所述预设相似度阈值时,确定所述待测用户为目标对象。
8.一种会话主题迁移路径挖掘装置,其特征在于,所述装置包括:
主题获取模块,用于确定多个目标会话标识,并获取每个目标会话标识对应的多个会话主题;
矩阵生成模块,用于根据所述多个会话主题生成会话主题迁移次数矩阵;
迁移图生成模块,用于根据所述会话主题迁移次数矩阵生成初始化会话主题迁移图,计算所述初始化会话主题迁移图中每个节点的指向指数及指入指数,并获得最大指向指数和最大指入指数,将所述最大指向指数对应的节点作为开始节点,将所述最大指入指数对应的节点作为结束节点,断开所述初始化会话主题迁移图中指向所述开始节点的有向边及所述结束节点指向的有向边,得到会话主题迁移图;
路径搜索模块,用于搜索所述会话主题迁移图中的第一最优迁移路径,包括:从所述会话主题迁移图中的所述开始节点进行搜索,确定所述开始节点指向的多个下一节点及所述开始节点指向的每个下一节点的有向边的权重;获取最大的权重的有向边对应的下一节点为目标节点,并将所述目标节点作为新的开始节点进行搜索,直至搜索到所述会话主题迁移图中的所述结束节点;连接所述开始节点、多个所述目标节点及所述结束节点,得到第一最优迁移路径;
迁移确定模块,用于将所述第一最优迁移路径确定为会话主题迁移路径。
9.一种计算机设备,其特征在于,所述计算机设备包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1至7中任意一项所述的会话主题迁移路径挖掘方法。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任意一项所述的会话主题迁移路径挖掘方法。
CN202110799122.1A 2021-07-15 2021-07-15 会话主题迁移路径挖掘方法、装置、计算机设备及介质 Active CN113268580B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110799122.1A CN113268580B (zh) 2021-07-15 2021-07-15 会话主题迁移路径挖掘方法、装置、计算机设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110799122.1A CN113268580B (zh) 2021-07-15 2021-07-15 会话主题迁移路径挖掘方法、装置、计算机设备及介质

Publications (2)

Publication Number Publication Date
CN113268580A CN113268580A (zh) 2021-08-17
CN113268580B true CN113268580B (zh) 2021-11-09

Family

ID=77236571

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110799122.1A Active CN113268580B (zh) 2021-07-15 2021-07-15 会话主题迁移路径挖掘方法、装置、计算机设备及介质

Country Status (1)

Country Link
CN (1) CN113268580B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109844743A (zh) * 2017-06-26 2019-06-04 微软技术许可有限责任公司 在自动聊天中生成响应
CN111897935A (zh) * 2020-07-30 2020-11-06 北京文思海辉金信软件有限公司 基于知识图谱的话术路径选择方法、装置和计算机设备
CN112732911A (zh) * 2020-12-30 2021-04-30 平安科技(深圳)有限公司 基于语义识别的话术推荐方法、装置、设备及存储介质
CN112988994A (zh) * 2021-03-04 2021-06-18 网易(杭州)网络有限公司 对话处理方法、装置及电子设备

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7987091B2 (en) * 2002-12-02 2011-07-26 Sony Corporation Dialog control device and method, and robot device
CN106407178B (zh) * 2016-08-25 2019-08-13 中国科学院计算技术研究所 一种会话摘要生成方法、装置、服务器设备以及终端设备
CN108415932B (zh) * 2018-01-23 2023-12-22 思必驰科技股份有限公司 人机对话方法及电子设备
CN109815319A (zh) * 2018-12-24 2019-05-28 联想(北京)有限公司 信息处理方法及信息处理装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109844743A (zh) * 2017-06-26 2019-06-04 微软技术许可有限责任公司 在自动聊天中生成响应
CN111897935A (zh) * 2020-07-30 2020-11-06 北京文思海辉金信软件有限公司 基于知识图谱的话术路径选择方法、装置和计算机设备
CN112732911A (zh) * 2020-12-30 2021-04-30 平安科技(深圳)有限公司 基于语义识别的话术推荐方法、装置、设备及存储介质
CN112988994A (zh) * 2021-03-04 2021-06-18 网易(杭州)网络有限公司 对话处理方法、装置及电子设备

Also Published As

Publication number Publication date
CN113268580A (zh) 2021-08-17

Similar Documents

Publication Publication Date Title
CN112698971A (zh) 基于规则引擎的参数转换方法、装置、设备及介质
CN112445854A (zh) 多源业务数据实时处理方法、装置、终端及存储介质
CN112860989B (zh) 课程推荐方法、装置、计算机设备及存储介质
CN105812423B (zh) 一种云***配置方法、服务器及装置
CN104272327B (zh) 作业管理方法以及管理***
CN112486491A (zh) 页面生成方法、装置、计算机设备及存储介质
CN111986794A (zh) 基于人脸识别的防冒挂号方法、装置、计算机设备及介质
CN111950621A (zh) 基于人工智能的目标数据检测方法、装置、设备及介质
CN112102011A (zh) 基于人工智能的用户等级预测方法、装置、终端及介质
CN112634889A (zh) 基于人工智能的电子病例录入方法、装置、终端及介质
CN113887941A (zh) 业务流程生成方法、装置、电子设备及介质
CN114862520A (zh) 产品推荐方法、装置、计算机设备及存储介质
CN112235714B (zh) 基于人工智能的poi定位方法、装置、计算机设备及介质
CN111651452B (zh) 数据存储方法、装置、计算机设备及存储介质
CN112598135A (zh) 模型训练处理方法、装置、计算机设备及介质
CN112818028A (zh) 数据指标筛选方法、装置、计算机设备及存储介质
CN113268580B (zh) 会话主题迁移路径挖掘方法、装置、计算机设备及介质
CN115883392B (zh) 算力网络的数据感知方法、装置、电子设备及存储介质
CN116108276A (zh) 基于人工智能的信息推荐方法、装置及相关设备
CN115729965A (zh) 信息流处理方法、装置、流服务器及存储介质
CN114219663A (zh) 产品推荐方法、装置、计算机设备及存储介质
CN115061895A (zh) 业务流程编排方法、装置、电子设备及存储介质
CN114240677A (zh) 医疗数据风险识别方法、装置、电子设备及存储介质
CN114547182A (zh) 人员信息同步方法、终端设备及存储介质
CN112328752A (zh) 基于搜索内容的课程推荐方法、装置、计算机设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant