CN117709361A

CN117709361A - 会话场景的模型生成方法、装置及设备

Info

Publication number: CN117709361A
Application number: CN202410166522.2A
Authority: CN
Inventors: 沈鹏; 王之琢; 黄婷; 黄明星; 周晓波
Original assignee: Beijing Shuidi Technology Group Co ltd
Current assignee: Beijing Shuidi Technology Group Co ltd
Priority date: 2024-02-06
Filing date: 2024-02-06
Publication date: 2024-03-15
Anticipated expiration: 2044-02-06
Also published as: CN117709361B

Abstract

本申请公开了一种会话场景的模型生成方法、装置及设备，涉及智能会话技术领域，能够生成全面覆盖业务流程的信息交互模型，以使得模型控制的机器人客服能够引导用户触发更符合流程操作的文本话术。其中方法包括：获取会话场景在历史信息交互过程中形成的问答会话文本，这里问答会话文本包括多轮次的文本交互信息，然后在问答会话文本中添加标志化引导信息，这里标志化引导信息为信息交互页面中埋点记录经过处理得到的字段信息，最后使用添加有标志化引导信息的问答会话文本进行模型训练，生成会话场景的信息交互模型。

Description

会话场景的模型生成方法、装置及设备

技术领域

本申请涉及智能会话技术领域，尤其是涉及到一种会话场景的模型生成方法、装置及设备。

背景技术

智能会话场景中，机器人客服可通过服务器或者智能会话设备等模拟客服等人员与真实用户的终端进行语音或者会话等信息交互，引导用户进行一系列的操作，以将交互过程中的会话内容转译成文本应用至会话场景的模型生成中。会话场景的模型生成主要由模型驱动，通过模型控制机器人客服与用户进行会话的业务流程，包括业务介绍、流程引导、信息确认、异议回答等复杂的流程，具体来说，机器人客服发起与用户的会话，用户打开指定页面进行浏览、点击、填写等页面埋点操作，完成业务流程。

相关技术中，会话场景的模型可使用会话内容转译的文本信息进行训练生成，得到的模型具备与用户进行交互以及引导业务流程的能力。但是，在真实业务流程中，考虑到业务流程的时长，需要业务流程中引导节点较多且顺序排列各异，如果用户并不能按照语言表述进行业务流程操作，会话场景生成的模型是很难全面覆盖业务流程的，缺乏对会话流程的控制能力。

发明内容

有鉴于此，本申请提供了一种会话场景的模型生成方法、装置及设备，主要目的在于解决现有技术中会话场景生成的模型是很难全面覆盖业务流程的，缺乏对会话流程的控制能力的问题。

根据本申请的第一个方面，提供了一种会话场景的模型生成方法，包括：

获取会话场景在历史信息交互过程中形成的问答会话文本，所述问答会话文本包括多轮次的文本交互信息；

在所述问答会话文本中添加标志化引导信息，所述标志化引导信息为信息交互页面中埋点记录经过处理得到的字段信息；

使用添加有标志化引导信息的问答会话文本进行模型训练，生成会话场景的信息交互模型。

进一步地，在所述问答会话文本中添加标志化引导信息之前，所述方法还包括：

根据会话场景在信息交互页面进行埋点，以获取信息交互过程中各个流程操作的埋点记录；

将所述信息交互页面中各个流程操作的埋点记录处理为字段表示的标志化引导信息。

进一步地，所述根据会话场景在信息交互页面进行埋点，以获取信息交互过程中各个流程操作的埋点记录，包括：

根据会话场景定义埋点范围，在所述埋点范围内对信息交互页面中各个操作事件进行埋点，所述操作事件至少包括页面事件和点击事件；

响应于信息交互页面中埋点的操作事件的触发指令，根据埋点的操作事件捕获信息交互页面上报的用户行为数据；

根据所述用户行为数据还原用户在信息交互过程中的操作行为，得到信息交互过程中各个流程操作的埋点记录。

进一步地，所述将所述信息交互页面中各个流程操作的埋点记录处理为字段表示的标志化引导信息，包括：

根据所述信息交互页面中各个流程操作的埋点记录，确定用户在信息交互时触发各个操作行为的流转属性信息，所述流转属性信息包括用户当前的操作行为信息以及通过当前的操作行为所触发下一轮次的交互行为信息；

按照预设格式将所述流转属性信息处理为字段表示的标志化引导信息。

进一步地，所述在所述问答会话文本中添加标志化引导信息，包括：

根据会话场景在信息交互页面的埋点位置，在所述问答会话文本中相应的字段位置定义特殊植入标志；

利用所述特殊植入标志在所述问答会话文本中添加标志化引导信息。

进一步地，所述使用添加有标志化引导信息的问答会话文本进行模型训练，生成会话场景的信息交互模型，具体包括：

使用添加有标志化引导信息的问答会话文本进行模型训练，在训练过程中根据所述标志化引导信息强化会话场景中各个流程操作的控制能力；

当模型训练的迭代符合预设条件时，将训练得到的神经网络模型确定为会话场景的信息交互模型，所述信息交互模型用于在输入会话文本的基础上，生成具有流程操作引导的输出会话文本。

进一步地，每一轮次的文本交互信息包括输入会话文本和输出会话文本，在所述使用添加有标志化信息的问答会话文本进行模型训练，得到会话场景的信息交互模型之后，所述方法还包括：

响应于会话场景触发的信息交互指令，获取当前轮次的输入会话文本；

将所述当前轮次的输入会话文本输入至所述信息交互模型进行预测，得到当前轮次用于交互反馈的输出会话文本；

根据所述输出会话文本控制下一轮次的信息交互过程。

根据本申请的第二个方面，提供了一种会话场景的模型生成装置，包括：

获取单元，用于获取会话场景在历史信息交互过程中形成的问答会话文本，所述问答会话文本包括多轮次的文本交互信息；

添加单元，用于在所述问答会话文本中添加标志化引导信息，所述标志化引导信息为信息交互页面中埋点记录经过处理得到的字段信息；

生成单元，用于使用添加有标志化引导信息的问答会话文本进行模型训练，生成会话场景的信息交互模型。

进一步地，所述装置还包括：

埋点单元，用于在所述问答会话文本中添加标志化引导信息之前，根据会话场景在信息交互页面进行埋点，以获取信息交互过程中各个流程操作的埋点记录；

处理单元，用于将所述信息交互页面中各个流程操作的埋点记录处理为字段表示的标志化引导信息。

进一步地，所述埋点单元，具体用于根据会话场景定义埋点范围，在所述埋点范围内对信息交互页面中各个操作事件进行埋点，所述操作事件至少包括页面事件和点击事件；响应于信息交互页面中埋点的操作事件的触发指令，根据埋点的操作事件捕获信息交互页面上报的用户行为数据；根据所述用户行为数据还原用户在信息交互过程中的操作行为，得到信息交互过程中各个流程操作的埋点记录。

进一步地，所述处理单元，具体用于根据所述信息交互页面中各个流程操作的埋点记录，确定用户在信息交互时触发各个操作行为的流转属性信息，所述流转属性信息包括用户当前的操作行为信息以及通过当前的操作行为所触发下一轮次的交互行为信息；按照预设格式将所述流转属性信息处理为字段表示的标志化引导信息。

进一步地，所述添加单元，具体用于根据会话场景在信息交互页面的埋点位置，在所述问答会话文本中相应的字段位置定义特殊植入标志；利用所述特殊植入标志在所述问答会话文本中添加标志化引导信息。

进一步地，所述生成单元，具体用于使用添加有标志化引导信息的问答会话文本进行模型训练，在训练过程中根据所述标志化引导信息强化会话场景中各个流程操作的控制能力；当模型训练的迭代符合预设条件时，将训练得到的神经网络模型确定为会话场景的信息交互模型，所述信息交互模型用于在输入会话文本的基础上，生成具有流程操作引导的输出会话文本。

进一步地，每一轮次的文本交互信息包括输入会话文本和输出会话文本，所述装置还包括：

交互单元，用于在所述使用添加有标志化信息的问答会话文本进行模型训练，得到会话场景的信息交互模型之后，响应于会话场景触发的信息交互指令，获取当前轮次的输入会话文本；

预测单元，用于将所述当前轮次的输入会话文本输入至所述信息交互模型进行预测，得到当前轮次用于交互反馈的输出会话文本；

控制单元，用于根据所述输出会话文本控制下一轮次的信息交互过程。

根据本申请的第三个方面，提供了一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述第一方面所述方法的步骤。

根据本申请的第四个方面，提供了一种可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述第一方面所述的方法的步骤。

借由上述技术方案，本申请提供的一种会话场景的模型生成方法、装置及设备，与目前现有技术中使用会话内容转译的文本信息进行模型训练的方式相比，本申请通过获取会话场景在历史信息交互过程中形成的问答会话文本，这里问答会话文本包括多轮次的文本交互信息，然后在问答会话文本中添加标志化引导信息，这里标志化引导信息为信息交互页面中埋点记录经过处理得到的字段信息，最后使用添加有标志化引导信息的问答会话文本进行模型训练，生成会话场景的信息交互模型。整个过程在问答文本会话中添加标志化引导信息，通过标志化引导信息强化训练过程中信息交互模型对会话流程的控制能力，以使得模型控制的机器人客服能够引导用户触发更符合流程操作的文本话术，避免会话过程中出现操作流程的引导缺失。

上述说明仅是本申请技术方案的概述，为了能够更清楚了解本申请的技术手段，而可依照说明书的内容予以实施，并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂，以下特举本申请的具体实施方式。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1是本申请一实施例中会话场景的模型生成方法的流程示意图；

图2是本申请另一实施例中会话场景的模型生成方法的流程示意图；

图3是本申请一实施例中会话场景在信息交互页面进行埋点的流程框图；

图4是图2中步骤104的一具体实施方式流程示意图；

图5是图2中步骤105的一具体实施方式流程示意图；

图6是本申请另一实施例中会话场景的模型生成方法的流程示意图；

图7是本申请一实施例中会话场景的模型生成装置的结构示意图；

图8是本发明实施例提供的一种计算机设备的装置结构示意图。

具体实施方式

现在将参照若干示例性实施例来论述本发明的内容。应当理解，论述了这些实施例仅是为了使得本领域普通技术人员能够更好地理解且因此实现本发明的内容，而不是暗示对本发明的范围的任何限制。

如本文中所使用的，术语“包括”及其变体要被解读为意味着“包括但不限于”的开放式术语。术语“基于”要被解读为“至少部分地基于”。术语“一个实施例”和“一种实施例”要被解读为“至少一个实施例”。术语“另一个实施例”要被解读为“至少一个其他实施例”。

在会话场景的模型生成场景中，会话场景的模型可使用会话内容转译的文本信息进行训练生成，得到的模型具备与用户进行交互以及引导业务流程的能力。但是，在真实业务流程中，考虑到业务流程的时长，需要业务流程中引导节点较多且顺序排列各异，如果用户并不能按照语言表述进行业务流程操作，会话场景生成的模型是很难全面覆盖业务流程的，缺乏对会话流程的控制能力。

为了解决该问题，本实施例提供了一种会话场景的模型生成方法，如图1所示，该方法应用于智能会话的平台端，包括如下步骤：

101、获取会话场景在历史信息交互过程中形成的问答会话文本。

其中，会话场景可应用至智能语音技术的人工智能产品，通过人工智能产品可以帮助企业进行电话外呼和呼入类工作。在会话场景中，机器人客服可通过生成问答会话文本实现信息交互，通常情况下，问答会话文本包括多轮次的文本交互信息，每一轮次的文本交互信息包括输入会话文本和输出会话文本，这里输入会话文本相当于问题文本，输出会话文本相当于回答文本，每一组问题文本和回答文本形成会话场景中一个轮次的信息交互，以一个轮次的信息交互为例，输入文本为“去成都机场多少钱”，回答文本为“40块”。

可以理解的是，考虑到会话场景中业务流程的复杂性，机器人客服与用户往往需要多轮次的信息交互，而为了高效完成业务流程，每一轮次的信息交互后可触发用户在信息交互页面上执行相应的流程操作，例如，业务流程需要用户打开指定网页进行浏览、点击、填写等流程操作，以触发相应流程操作的规则，例如，对回复内容进行播报，对信息交互页面中按钮进行框选。

具体来说，会话场景在历史信息交互的过程中会生成大量交互任务形成的问答会话，每个交互任务相当于一次信息交互的过程，交互任务生成的问答会话文本包括多轮次的文本交互信息，这里文本交互信息包含有问答的上下文信息，表现为一问一答的形式。这里会话场景可应用至各行各业的场景，包括但不局限于产品的订单查询场景、售后的服务场景、预约场景、共享场景等。

对于本实施例的执行主体可以为会话场景的模型生成装置或设备，可以配置在智能会话的平台端，通过智能会话的平台端获取会话场景在历史信息交互过程中形成的问答会话文本，在问答会话文本的基础上探索会话场景的操作流程，将探索到的操作流程注入至信息交互模型的训练过程中，以提升信息交互模型对会话流程的控制能力。

102、在所述问答会话文本中添加标志化引导信息。

其中，标志化引导信息为信息交互页面中埋点记录经过处理得到的字段信息，该字段信息可以包括但不局限于信息交互页面中触发行为操作信息，例如，订单支付的操作信息、弹窗点击的操作信息、字段填写的操作信息。

具体来说，问答会话文本在多轮次的信息交互过程中通常会触发用户在信息交互页面执行各个行为操作，而这些行为操作在一定程度上能够反映出会话场景中流程操作的信息引导，这里可以通过在信息交互页面中添加埋点可以捕获到用户在页面中触发的各个行为操作，然后将用户在页面中触发的各个行为操作以埋点记录的方式生成标志化引导信息，将标志化引导信息作为流程操作的指引标签添加至问答会话文本中。

可以理解的是，用户在信息交互页面中触发的行为操作可反映出流程操作的内容引导和顺序引导，以内容引导为例，用户在咨询如何订单购买之后，在信息交互页面触发订单购买的按钮，以顺序引导为例，用户在咨询订单价钱之后，在信息交互页面触发订单填写的行为操作，然后用户在接收到订单价钱回复之后，在信息交互页面触发订单支付的行为操作。

103、使用添加有标志化引导信息的问答会话文本进行模型训练，生成会话场景的信息交互模型。

在本实施例中，添加有标志化引导信息的问答会话文本具有对信息交互页面中流程操作的引导作用，在问答会话文本进行模型训练的基础上，追加了多轮次交互中具有控制能力的标志化引导信息，可激活信息交互模型的流程控制能力，使得生成的信息交互模型能够更好地对会话场景中的流程操作进行引导。

具体在模型训练过程中，可使用监督微调的训练方式，通过利用模型的预测结果来生成伪标签，并将这些伪标签作为未标记数据的标签进行训练，这里可以先使用添加有标志化引导信息的问答会话文本作为有标签的数据对模型进行初步训练，得到一个初始模型，使用初始模型对未标记的数据进行预测，得到每个样本的预测标签，将预测标签与未标记的数据进行合并，形成伪标签数据集，使用伪标签数据集对模型进行进一步训练，得到一个更新后的模型，重复上述模型训练和更新的过程，直至模型收敛或达到预设的训练迭代次数后，生成会话场景的信息交互模型。

本申请实施例提供的会话场景的模型生成方法，与目前现有技术中使用会话内容转译的文本信息进行模型训练的方式相比，本申请通过获取会话场景在历史信息交互过程中形成的问答会话文本，这里问答会话文本包括多轮次的文本交互信息，然后在问答会话文本中添加标志化引导信息，这里标志化引导信息为信息交互页面中埋点记录经过处理得到的字段信息，最后使用添加有标志化引导信息的问答会话文本进行模型训练，生成会话场景的信息交互模型。整个过程在问答文本会话中添加标志化引导信息，通过标志化引导信息强化训练过程中信息交互模型对会话流程的控制能力，以使得模型控制的机器人客服能够引导用户触发更符合流程操作的文本话术，避免会话过程中出现操作流程的引导缺失。

在具体应用过程中，标志化引导信息包括会话场景中用户在信息交互页面中各个行为操作，可通过页面埋点的方式获取得到，为了能够更全面了解会话场景的业务流程，进一步地，上述实施例中，如图2所示，在步骤102之前，方法还包括如下步骤：

201、根据会话场景在信息交互页面进行埋点，以获取信息交互过程中各个流程操作的埋点记录。

202、将所述信息交互页面中各个流程操作的埋点记录处理为字段表示的标志化引导信息。

在本实施例中，会话场景在信息交互页面进行埋点的过程相当于是用户在信息交互页面中各个行为操作的数据采集过程，例如，采集用户在信息交互页面中点击了哪些按钮、浏览了哪些信息交互页面，在页面中执行了哪些行为操作等，该数据采集过程包括但不局限于针对用户行为或事件进行捕获、处理和发送相关技术及其实施过程。具体埋点方式可通过植入一段代码到某个页面或者按钮，从而监听用户行为并进行收集上报。示例性的，会话场景在信息交互页面进行埋点的流程如图3所示，图3中涉及6个轮次的信息交互过程，一共触发10个信息交互页面的操作埋点，通过操作埋点可采集到用户在信息交互页面中的行为数据。

具体在获取信息交互过程中各个流程操作的埋点记录过程中，可通过预先在业务流程中信息交互页面涉及到的各个行为操作进行事件埋点，获取到信息交互过程中各个流程操作的埋点记录，然后通过各个行为的操作顺序和操作时长等属性信息可统计业务流程中各个行为操作之间的依赖和/或引导，然后根据业务流程中各个行为操作之间的依赖和/或引导，将埋点记录处理为字段表示的标志化引导信息。

具体获取到的埋点记录可以包括但不局限于页面信息、用户信息、事件信息、设备信息、地理位置信息和异常信息等，页面信息可以记录当前页面URL、标题以及所属模块等基本信息，可用于识别和区分不同的页面，用户信息可以记录用户的唯一标识符、用户类型等信息，可用于追踪用户行为，事件信息可以记录用户在信息交互页面上的操作行为等信息，如点击按钮、滚动页面等，每个事件都会包含事件类型、触发元素、触发时间等信息，设备信息可以记录设备属性等信息，如操作***、浏览器类型、屏幕分辨率等，可用于分析用户设备特性和页面优化显示，地理位置信息可以记录用户的地理位置，如IP地址、城市、经纬度等，可用于定位用户所在区域和提供个性化服务，异常信息可以记录页面加载过程中的异常情况，如网络错误、脚本错误等，可用于排查和修复问题。

在上述实施例中，具体地，如图4所示，步骤201包括如下步骤：

301、根据会话场景定义埋点范围，在所述埋点范围内对信息交互页面中各个操作事件进行埋点。

302、响应于信息交互页面中埋点的操作事件的触发指令，根据埋点的操作事件捕获信息交互页面上报的用户行为数据。

303、根据所述用户行为数据还原用户在信息交互过程中的操作行为，得到信息交互过程中各个流程操作的埋点记录。

具体埋点范围可根据实际需求和目标确定，这里埋点范围可以是全局埋点，全局埋点可将埋点代码放置在网页的功能模板中，使其在每个页面加载时触发埋点，从而收集到全站的用户行为数据。这里埋点范围还可以是部分页面埋点，部分页面埋点可根据业务需求选择性地在特定页面上设置埋点，这些页面可以是关键页面、落地页面、注册页面等，通过对这些页面进行埋点，可以更加精确地分析用户行为操作的转换效果。这里埋点范围还可以是事件触发埋点，事件触发埋点可根据用户的具体操作行为来触发埋点，例如，当用户点击某个按钮、提交表单、触发特定事件时，通过埋点记录这些事件，以分析用户的行为路径和操作转化。

其中，信息交互页面中各个操作事件至少包括页面事件和点击事件，页面事件即为用户访问页面的信息，通过页面事件可获取到用户访问页面和/或通过页面上接口跳转至下一个页面，点击事件即为用户在页面上的点击行为，通过点击事件可获取到用户点击按钮后触发的内容，例如，如果想要获取到用户点击搜索按钮后输入哪些关键词，可在搜索按钮上埋点一个点击事件，通过字段上报的值可实现关键词的获取。

可以理解的是，用户在信息交互页面中各个操作行为是具有操作流程的，通过用户在信息交互页面中各个操作行为可以分析用户的行为路径，绘制用户在信息交互页面中的行为路径图，可使用该行为路径图还原用户在信息交互过程的操作行为，得到信息交互过程中各个流程操作的埋点记录。

在上述实施例中，具体地，如图5所示，步骤202包括如下步骤：

401、根据所述信息交互页面中各个流程操作的埋点记录，确定用户在信息交互时触发各个操作行为的流转属性信息。

402、按照预设格式将所述流转属性信息处理为字段表示的标志化引导信息。

其中，流转属性信息包括用户当前的操作行为信息以及通过当前的操作行为所触发下一轮次的交互行为信息，具体在埋点记录中，用户在信息交互页面中触发各个交互行为是具有流转顺序的，可根据埋点记录生成用户在信息交互页面中的操作行为轨迹，通过操作行为轨迹可追踪信息交互页面的流转路径，进而根据流转路径确定用户当前的操作行为信息以及通过当前的操作行为所触发下一轮次的交互行为信息。

例如，用户在信息交互页面中的操作行为轨迹包括浏览产品、加入购物车、然后提交订单，最后支付订单返回，通过操作行为轨迹追踪到信息交互页面的流转路径为产品页面A-购物车页面B-订单提交页面C-订单支付页面D，根据流转路径确定的流转属性信息包括页面A中浏览产品的操作信息、页面B中加入购物车的操作信息、页面C中顶贴提交的操作信息以及页面D中订单支付的操作信息。

进一步地，为了强化信息交互过程中的流程引导效果，可以根据当前轮次在信息交互过程中埋点事件的触发机制，设置用于控制流程操作的预设格式，对于页面事件的触发机制可将流转属性信息设置为跳转格式的字段表示，例如，当前轮次的信息交互过程触发事件包括链接图标触发的页面事件，可根据页面事件将流转属性信息关联的页面跳转信息处理为字段表示标志化引导信息，包括跳转页面地址、跳转页面标题等，对于点击事件可按照事件顺序设置为节点格式的字段表示，例如，当前轮次的信息交互过程触发事件包括手势图标触发的点击事件，可根据点击事件将流转属性信息关联的页面操作信息处理为字段表示标志化引导信息，包括页面操作内容、页面操作时长、页面操作位置等。

在上述实施例中，考虑到问答会话文本中包括多轮次信息交互，每一轮次信息交互都会对应有埋点处理得到的标准化引导信息，具体在步骤102中，包括如下步骤：根据会话场景在信息交互页面的埋点位置，在所述问答会话文本中相应的字段位置定义特殊植入标志；利用所述特殊植入标志在所述问答会话文本中添加标志化引导信息。这里特殊植入标志定义的形式可以是使用标签方式在问答会话文本上进行标记，还可以使用***方式将标志化引导信息***至问答会话文本中，在此对特殊植入标志定义的形式不进行限定。

在上述实施例中，具体在步骤103中，包括如下步骤：使用添加有标志化引导信息的问答会话文本进行模型训练，在训练过程中根据所述标志化引导信息强化会话场景中各个流程操作的控制能力；当模型训练的迭代符合预设条件时，将训练得到的神经网络模型确定为会话场景的信息交互模型。其中，信息交互模型用于在输入会话文本的基础上，生成具有流程操作引导的输出会话文本。通过在模型训练过程中加入实时埋点记录得到的标志化引导信息，能够激活模型的流程控制能力，以使得模型预测得到的输出会话文本能够强化对下一流程的引导效果。

考虑到连接池中连接数量能够满足会话***的同时也不会产生连接资源浪费，进一步地，上述实施例中，如图6所示，在步骤103之后，方法还包括如下步骤：

501、响应于会话场景触发的信息交互指令，获取当前轮次的输入会话文本。

502、将所述当前轮次的输入会话文本输入至所述信息交互模型进行预测，得到当前轮次用于交互反馈的输出会话文本。

503、根据所述输出会话文本控制下一轮次的信息交互过程。

在实际应用场景中，每一轮次的输入会话文本都会经过埋点记录处理到当前轮次的标志化引导信息，在获取到当前轮次的标志化引导信息后，将当前轮次的标志化引导信息加入至信息交互模型后，可预测得到当前轮次用于交互反馈的输出会话文本，由于在预测过程中加入标志化引导信息，输出会话文本可表现流程控制能力，避免了信息交互过程中的流程缺失，提升会话场景中信息交互的完整性。

进一步的，作为图1-6方法的具体实现，本申请实施例提供了一种会话场景的模型生成装置，如图7所示，该装置包括：获取单元61、添加单元62、生成单元63。

获取单元61，用于获取会话场景在历史信息交互过程中形成的问答会话文本，所述问答会话文本包括多轮次的文本交互信息；

添加单元62，用于在所述问答会话文本中添加标志化引导信息，所述标志化引导信息为信息交互页面中埋点记录经过处理得到的字段信息；

生成单元63，用于使用添加有标志化引导信息的问答会话文本进行模型训练，生成会话场景的信息交互模型。

本发明实施例提供的会话场景的模型生成装置，与目前现有技术中使用会话内容转译的文本信息进行模型训练的方式相比，本申请通过获取会话场景在历史信息交互过程中形成的问答会话文本，这里问答会话文本包括多轮次的文本交互信息，然后在问答会话文本中添加标志化引导信息，这里标志化引导信息为信息交互页面中埋点记录经过处理得到的字段信息，最后使用添加有标志化引导信息的问答会话文本进行模型训练，生成会话场景的信息交互模型。整个过程在问答文本会话中添加标志化引导信息，通过标志化引导信息强化训练过程中信息交互模型对会话流程的控制能力，以使得模型控制的机器人客服能够引导用户触发更符合流程操作的文本话术，避免会话过程中出现操作流程的引导缺失。

在具体的应用场景中，所述装置还包括：

在具体的应用场景中，所述埋点单元，具体用于根据会话场景定义埋点范围，在所述埋点范围内对信息交互页面中各个操作事件进行埋点，所述操作事件至少包括页面事件和点击事件；响应于信息交互页面中埋点的操作事件的触发指令，根据埋点的操作事件捕获信息交互页面上报的用户行为数据；根据所述用户行为数据还原用户在信息交互过程中的操作行为，得到信息交互过程中各个流程操作的埋点记录。

在具体的应用场景中，所述处理单元，具体用于根据所述信息交互页面中各个流程操作的埋点记录，确定用户在信息交互时触发各个操作行为的流转属性信息，所述流转属性信息包括用户当前的操作行为信息以及通过当前的操作行为所触发下一轮次的交互行为信息；按照预设格式将所述流转属性信息处理为字段表示的标志化引导信息。

在具体的应用场景中，所述添加单元，具体用于根据会话场景在信息交互页面的埋点位置，在所述问答会话文本中相应的字段位置定义特殊植入标志；利用所述特殊植入标志在所述问答会话文本中添加标志化引导信息。

在具体的应用场景中，所述生成单元，具体用于使用添加有标志化引导信息的问答会话文本进行模型训练，在训练过程中根据所述标志化引导信息强化会话场景中各个流程操作的控制能力；当模型训练的迭代符合预设条件时，将训练得到的神经网络模型确定为会话场景的信息交互模型，所述信息交互模型用于在输入会话文本的基础上，生成具有流程操作引导的输出会话文本。

在具体的应用场景中，每一轮次的文本交互信息包括输入会话文本和输出会话文本，所述装置还包括：

需要说明的是，本实施例提供的一种会话场景的模型生成装置所涉及各功能单元的其它相应描述，可以参考图1-图5中的对应描述，在此不再赘述。

基于上述如图1-图5所示方法，相应的，本申请实施例还提供了一种存储介质，其上存储有计算机程序，该程序被处理器执行时实现上述如图1-图5所示的会话场景的模型生成方法。

基于这样的理解，本申请的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质（可以是CD-ROM，U盘，移动硬盘等）中，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本申请各个实施场景所述的方法。

基于上述如图1-图5所示的方法，以及图7所示的虚拟装置实施例，为了实现上述目的，本申请实施例还提供了一种会话场景的模型生成的实体设备，具体可以为计算机，智能手机，平板电脑，智能手表，服务器，或者网络设备等，该实体设备包括存储介质和处理器；存储介质，用于存储计算机程序；处理器，用于执行计算机程序以实现上述如图1-图5所示的会话场景的模型生成方法。

可选的，该实体设备还可以包括用户接口、网络接口、摄像头、射频（RadioFrequency，RF）电路，传感器、音频电路、WI-FI模块等等。用户接口可以包括显示屏（Display）、输入单元比如键盘（Keyboard）等，可选用户接口还可以包括USB接口、读卡器接口等。网络接口可选的可以包括标准的有线接口、无线接口（如WI-FI接口）等。

在示例性实施例中，参见图8，上述实体设备包括通信总线、处理器、存储器和通信接口，还可以包括、输入输出接口和显示设备，其中，各个功能单元之间可以通过总线完成相互间的通信。该存储器存储有计算机程序，处理器，用于执行存储器上所存放的程序，执行上述实施例中的会话场景的模型生成方法。

本领域技术人员可以理解，本实施例提供的一种会话场景的模型生成的实体设备结构并不构成对该实体设备的限定，可以包括更多或更少的部件，或者组合某些部件，或者不同的部件布置。

存储介质中还可以包括操作***、网络通信模块。操作***是管理上述会话场景的模型生成的实体设备硬件和软件资源的程序，支持信息处理程序以及其它软件和/或程序的运行。网络通信模块用于实现存储介质内部各组件之间的通信，以及与信息处理实体设备中其它硬件和软件之间通信。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到本申请可以借助软件加必要的通用硬件平台的方式来实现，也可以通过硬件实现。通过应用本申请的技术方案，与目前现有方式相比，本申请在问答文本会话中添加标志化引导信息，通过标志化引导信息强化训练过程中信息交互模型对会话流程的控制能力，以使得模型控制的机器人客服能够引导用户触发更符合流程操作的文本话术，避免会话过程中出现操作流程的引导缺失。

本领域技术人员可以理解附图只是一个优选实施场景的示意图，附图中的模块或流程并不一定是实施本申请所必须的。本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中，也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块，也可以进一步拆分成多个子模块。

上述本申请序号仅仅为了描述，不代表实施场景的优劣。以上公开的仅为本申请的几个具体实施场景，但是，本申请并非局限于此，任何本领域的技术人员能思之的变化都应落入本申请的保护范围。

Claims

1.一种会话场景的模型生成方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，在所述问答会话文本中添加标志化引导信息之前，所述方法还包括：

3.根据权利要求2所述的方法，其特征在于，所述根据会话场景在信息交互页面进行埋点，以获取信息交互过程中各个流程操作的埋点记录，包括：

4.根据权利要求2所述的方法，其特征在于，所述将所述信息交互页面中各个流程操作的埋点记录处理为字段表示的标志化引导信息，包括：

5.根据权利要求1所述的方法，其特征在于，所述在所述问答会话文本中添加标志化引导信息，包括：

6.根据权利要求1-5中任一项所述的方法，其特征在于，所述使用添加有标志化引导信息的问答会话文本进行模型训练，生成会话场景的信息交互模型，具体包括：

7.根据权利要求1-5中任一项所述的方法，其特征在于，每一轮次的文本交互信息包括输入会话文本和输出会话文本，在所述使用添加有标志化信息的问答会话文本进行模型训练，得到会话场景的信息交互模型之后，所述方法还包括：

根据所述输出会话文本控制下一轮次的信息交互过程。

8.一种会话场景的模型生成装置，其特征在于，包括：

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述会话场景的模型生成方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述会话场景的模型生成方法的步骤。