CN115809669B

CN115809669B - 一种对话管理方法和电子设备

Info

Publication number: CN115809669B
Application number: CN202211728066.3A
Authority: CN
Inventors: 袁斌; 刘翠翠; 安旭; 杨晓阳; 岳保军
Original assignee: China Unicom Smart Connection Technology Ltd
Current assignee: China Unicom Smart Connection Technology Ltd
Priority date: 2022-12-30
Filing date: 2022-12-30
Publication date: 2024-03-29
Anticipated expiration: 2042-12-30
Also published as: CN115809669A

Abstract

本申请实施例提供一种对话管理以及电子设备。方法包括：获取当前的对话场景；根据所述当前的对话场景，获取对话目标；获取当前对话的对话上下文；根据所述当前对话的对话上下文，预测下一个对话场景。根据本申请实施例的对话管理方法，在对话场景转移时，考虑历史对话场景转移情况、当前对话情况和目标影响等因素，使用排序模型对候选场景进行精排，提高了对话场景转移转移的准确性，提高了人机对话交互的用户体验。

Description

一种对话管理方法和电子设备

技术领域

本申请涉及计算机技术领域，特别涉及一种对话管理方法和电子设备。

背景技术

随着人工智能的不断发展，在人机交互领域，引入了基于人工智能的对话自动生成机制，通过计算机自动生成对话，实现计算机与用户的人机交互，以节省人力成本。

但是，在现有技术条件下，通过计算机自动生成的对话，往往存在话题偏离用户对话目标、词不达意等情况，用户体验不佳。因此，需要一种新的对话管理方法，对人机交互过程中的对话进行管理，提高人机交互对话的用户体验。

发明内容

针对如何提高人机交互对话的用户体验的问题，本申请提供了一种对话管理方法和电子设备，本申请还提供一种计算机可读存储介质。

本申请实施例采用下述技术方案：

第一方面，本申请提供一种对话管理方法，所述方法包括：

获取当前的对话场景；

根据所述当前的对话场景，获取对话目标；

获取当前对话的对话上下文；

根据所述当前对话的对话上下文，预测下一个对话场景。

在第一方面的一种实现方式中，所述获取当前的对话场景，包括：

获取本次对话开始后，最初的多轮对话的对话文本；

从所述最初的多轮对话的对话文本中提取实体；

根据提取出的所述实体，识别所述对话场景。

在第一方面的一种实现方式中，所述获取本次对话开始后，最初的多轮对话的对话文本，包括：

获取本次对话开始后的前三轮对话的对话文本。

在第一方面的一种实现方式中，所述实体的类型包括以下任意一项或多项的组合：品牌、厂商、车型、车系、地名、称呼、价格、时间。

在第一方面的一种实现方式中，所述对话场景包括以下任意一项或多项的组合：开场白场景、意向判断场景、客户没时间场景、客户不感兴趣场景、询问城市场景、所在城市有经销商场景、所在城市无经销商场景、加联络方式推信息场景、结束语场景。

在第一方面的一种实现方式中，所述根据所述当前对话的对话上下文，预测下一个对话场景，包括：

计算对话场景转移概率并构建转移概率矩阵；

平滑所述转移概率矩阵，获取所述转移概率矩阵的平滑结果

根据所述转移概率矩阵的平滑结果，推荐下一个对话场景。

在第一方面的一种实现方式中，所述方法还包括：

当对话产生漂移现象时，将对话场景拉回到所述对话目标相关的对话场景上。

在第一方面的一种实现方式中，所述根据所述当前对话的对话上下文，预测下一个对话场景，包括，生成场景推荐列表；

所述将对话场景拉回到所述对话目标相关的对话场景上，包括：

基于所述场景推荐列表，使用所述场景推荐列表中第一位的对话场景推进对话后，若出现对话场景漂移，则使用所述场景推荐列表中第二位的对话场景推进对话。

第二方面，本申请提供一种电子设备，所述电子设备包括用于存储计算机程序指令的存储器和用于执行计算机程序指令的处理器，其中，当所述计算机程序指令被该处理器执行时，触发所述电子设备执行如第一方面所述的方法步骤。

第三方面，本申请提供一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机程序，当其在计算机上运行时，使得计算机执行如第一方面所述的方法。

根据本申请实施例所提出的上述技术方案，至少可以实现下述技术效果：

根据本申请实施例的对话管理方法，在对话场景转移时，考虑历史对话场景转移情况、当前对话情况和目标影响等因素，使用排序模型对候选场景进行精排，提高了对话场景转移转移的准确性，提高了人机对话交互的用户体验。例如，相比于对话管理(DialogManagement,DM)，准确率(accuracy)可以提高1.4％以上。

附图说明

图1所示为根据本申请一实施例的对话管理方法流程示意图；

图2所示为根据本申请一实施例的电子设备结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请的实施方式部分使用的术语仅用于对本申请的具体实施例进行解释，而非旨在限定本申请。

针对如何提高人机交互对话的用户体验问题，本申请一实施例提供一种对话管理方法。在本申请实施例的对话管理方法中，根据当前的对话场景获取对话目标；根据对话上下文，预测下一个对话场景，从而基于下一个对话场景生成相应的对话以实现人机交互。根据本申请实施例的对话管理方法，可以进行匹配用户对话目标的人机对话交互，提高人机对话交互的用户体验。

具体的，图1所示为根据本申请一实施例的对话管理方法流程示意图。

电子设备执行图1所示的下述流程以实现人机对话交互。

S100，获取当前的对话场景。

具体的，在S100中，执行S101～S103。

S101，获取本次对话开始后，最初的多轮对话的对话文本。

例如，在一实施例中，在S101中，获取本次对话开始后，前3轮对话的对话文本。

进一步的，如果本论对话之前的对话轮数小于3，则使用“START”字符串代替一轮对话的对话文本。

例如，在一实施例中，当前对话为本次对话的第三轮对话(本轮对话之前存在2轮对话)。在S101中，获取以下内容：

[

{"第一轮问句"："START"，"第一轮答句"："START"},

{"第二轮问句"："我是XXX，请问有什么需要我为您做的吗？"，"第二轮答句"："给我预定一下下周日的车展"},

"第三轮问句"："好的。请问预约几点的？"，"第三轮答句"："下周五上午10点。"}

]

S102，从S101所获取的对话文本中提取实体。

具体的，在S102中，使用预训练的语言表征模型(Bidirectional EncoderRepresentation from Transformers，bert)模型将对话文本表示成向量表示(embedding)作为模型输入。

使用两层的双向长短期记忆网络(BiLSTM)作为模型作为模型的隐藏层，使用条件随机场(Conditional Random Fields，CRF)层作为模型输出。

具体的，在S102的一种实现方式中，实体类型共八类，分别是：品牌、厂商、车型、车系、地名、称呼、价格、时间。

例如，["请问您现在在哪个城市？","我在青岛市北","那给您约下周日下午两点可以吗？"]，提取出的实体是：[""，[{city:青岛},area:市北区],"2022-11-27 14:00:00"](假设当前日期是2022-11015)。

S103，根据S102提取出的实体，识别对话场景。

对话场景是指对话内容讨论的主题。因为对话内容可能涉及多个主题，因此实现S103的识别模型是一个多标签多分类的任务模型。

在S103的一种实现方式中，包含以下流程：

使用实体识别模型识别出文本中的实体，构成实体列表；

使用bert模型将实体列表表示成embedding作为模型输入；

使用transformer结构作为模型的隐藏层，接入S型生长曲线(sigmoid)层作为模型输出。

在S103中，模型会对每个场景类别都预测出一个概率值，当预测的概率值＞阈值α时，则保留预测的场景，否则丢弃。

进一步的，在一实施例中，在S103中，阈值α的训练过程如下：

训练过程总共学习2000遍训练数据。

每学习一遍数据，遍历α∈[0.001,0.999]之间的每一个千分位值，保留当F1分值(score)最大时的α值。例如：当学习到2000遍时，α取0.049时F1 score最大且F1 score＝0.9172。

进一步的，在一实施例中，在S103中，对话场景列表如下：

a、开场白场景，指对话中客服人员打招呼的场景。

b、意向判断场景，指通过客户反馈判断到店/参与活动的意向。

c、客户没时间场景，指客户没有表达拒绝意向并表示没时间参与。

d、客户不感兴趣场景，指客户明确有拒绝意向。

e、询问城市场景，询问客户所在城市。

f、所在城市有经销商场景，指客户所在的城市有经销商。

g、所在城市无经销商场景，指客户所在的城市有经销商无法到店。

h、加联络方式推信息场景，指会话结束客服询问客户是否允许加联系方式(例如，微信)和推送营销信息(例如，营销短信)。

i、结束语场景，指会话结束。

S110，根据当前的对话场景，获取对话目标。

对话目标指对话双方从对话中获取的内容。如从对话中获取双方的态度，意图和观点，或者从对话中获取某种知识或实体。通常，对话目标在对话双方开始对话前已设定，在人机交互的应用场景中，在用户开始与计算机进行对话交互前，用户就已经确定好自身的对话目标。

S120，获取当前对话的对话上下文。

在S120中，包括，确定上下文范围。上下文范围由对话窗口确定。对话窗口是指的多轮对话的轮数范围，用m表示，在一实施例中，m的默认值是3。例如，当前对话到第10轮，当m＝3时，则取第8轮、第9轮、第10轮作为对话上下文。

S130，根据当前对话的对话上下文，预测下一个对话场景。

下一个对话场景预测是指基于当前对话内容下一个最可能出现的对话场景是什么。预测下一个对话场景可以提前预知对话内容，可以更好的引导对话向对话目标发展。

具体的，在一实施例中，S130包含S131～S133。

S131，计算对话场景转移概率并构建转移概率矩阵。

对话场景转移矩阵用于计算当前场景与前n个场景相关度，对话场景转移矩阵中的值表示场景转移概率。

假设当前对话场景是n，n-m表示当前对话n的前m轮对话。在S131中，分别计算n-1、n-2、n-3的场景转移概率。

n-m的场景转移概率的计算方法是：出现n-m的场景时再出现n的场景的概率与出现n-m的场景时出现的所有场景和的比值，可以基于历史数据得到。本方案的m限定为0≤m≤w。

通过转移概率矩阵可以得到下一轮对话的候选对话场景序列A。

例如，A＝[确认信息-确认到店时间，核实信息-姓名，确认信息-确认厂商，询问车型]。

S132，平滑对话场景转移(平滑转移概率矩阵)，获取转移概率矩阵的平滑结果。

由于当m＝3时，出现任何场景的可能性都很小，因此需要对转移概率矩阵进行平滑。

平滑的方法是当n-m轮对话的场景转移概率是0时，使用n-m-1轮对话进行平滑。即当出现n-3轮对话且候选场景是0时，计算n-2轮对话的候选场景，以此类推。比如：假设当前对话场景是A，A的前三轮对话的场景是BCD，如果P(BCD->A)＝0，那么P(BCD->A)＝P(CD->A)。P()表示场景转移概率。

S133，根据转移概率矩阵的平滑结果，推荐下一个对话场景。

在S133中，构建场景特征向量。假设当前对话窗口下的场景是abc，通过转移概率矩阵得到推荐的候选场景有d1、d2、d3...di。d1的特征向量a1＝[[所有对话的p(d1)，本轮对话的p(d1)，p(abc->d1)]，[所有对话的p(d2)，本轮对话的p(d2)，p(abc->d2)]...]，使用gbdt+lr进行排序打分，打分后的结果降序排序，top1即下一个场景。

进一步的，在一实施例中，在S130中，结合S110获取的对话目标，预测下一个对话场景.

进一步的，在人机对话交互的应用场景中，在进行对话场景转移时，可能会出现对话漂移现象，即对话内容距离对话目标越来越远。因此，在一实施例中，还执行S140。

S140，当对话产生漂移现象时，将对话场景拉回到对话目标相关的对话场景上。

具体的，在S140中，基于S130提供的下一个场景推荐列表，使用推荐列表的top1场景推进对话后，判断是否远离对话目标，若出现场景漂移，则使用推荐列表推荐的top2场景推进对话。

具体的，在一实施例中，S140包含以下流程：

(1)，计算近w轮对话的目标完成系数，构建向量d＝[d1，d2，d3...di]，di分别表示当前场景的前第i个场景。

目标完成系数是对话内容与对话目标的距离特征，反映对话与目标的关联程度。

目标完成系数计算方法如下：

目标完成系数与上下文是贝叶斯关系，用λ表示，计算公式如下：

(2)，使用将word转为向量的方法(word2vec)构建场景的embedding e，实现场景序列的向量化。

e是一个w*v_length的矩阵，其中w是对话轮数，v_length是训练embedding时指定的维度大小。

(3)，计算d和e的对偶(pairwise)乘积作为模型的输入，即y＝d⊙e，进行逐元素相乘，实现对embedding进行加权。

加权操作可以使场景序列向量与目标关联。

(4)，构建深度神经网络，y层+rnn层+sigmoid层，使用历史数据训练模型进行场景是否脱离分类。

通过sigmoid输出预测场景脱离目标的得分，得分＞50％，说明当前对话已远离对话目标，应该拉回，回到第n-m轮对话。

(5)，场景拉回后会进行下一轮对话。从S130提供的下一个场景推荐列表中，选择第二个场景作为候选场景，以此类推。

根据本申请实施例的方法，在多轮对话中引入了场景拉回模型，解决了话题漂移问题，提高了人机对话交互的用户体验。

在本申请实施例的描述中，为了描述的方便，描述装置时以功能分为各种模块分别描述，各个模块的划分仅仅是一种逻辑功能的划分，在实施本申请实施例时可以把各模块的功能在同一个或多个软件和/或硬件中实现。

具体的，本申请实施例所提出的装置在实际实现时可以全部或部分集成到一个物理实体上，也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现；也可以全部以硬件的形式实现；还可以部分模块以软件通过处理元件调用的形式实现，部分模块通过硬件的形式实现。例如，检测模块可以为单独设立的处理元件，也可以集成在电子设备的某一个芯片中实现。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起，也可以独立实现。在实现过程中，上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。

例如，以上这些模块可以是被配置成实施以上方法的一个或多个集成电路，例如：一个或多个特定集成电路(Application Specific Integrated Circuit，ASIC)，或，一个或多个数字信号处理器(Digital Singnal Processor，DSP)，或，一个或者多个现场可编程门阵列(Field Programmable Gate Array，FPGA)等。再如，这些模块可以集成在一起，以片上装置(System-On-a-Chip，SOC)的形式实现。

本申请一实施例还提出了一种电子设备。

图2为根据本申请一实施例的电子设备结构示意图。

如图2所示，电子设备200包括用于存储计算机程序指令的存储器202和用于执行程序指令的处理器201，其中，当该计算机程序指令被该处理器201执行时，触发电子设备200执行如本申请实施例所述的方法步骤。

具体的，在本申请一实施例中，上述一个或多个计算机程序被存储在上述存储器202中，上述一个或多个计算机程序包括指令，当上述指令被上述电子设备200执行时，使得上述电子设备200执行本申请实施例所述的方法步骤。

可以理解的是，本申请实施例对电子设备200的结构描述并不构成对电子设备200的具体限定。在本申请另一些实施例中，电子设备200可以包括处理器201以及存储器202以外的其他部件。

处理器201可以是片上装置SOC，该处理器201中可以包括中央处理器(CentralProcessing Unit，CPU)，还可以进一步包括其他类型的处理器。

处理器201涉及的处理器可以例如包括CPU、DSP、微控制器或数字信号处理器，还可包括GPU、嵌入式神经网络处理器(Neural-network Process Units，NPU)和图像信号处理器(Image Signal Processing，ISP)，处理器还可包括必要的硬件加速器或逻辑处理硬件电路，如ASIC，或一个或多个用于控制本申请技术方案程序执行的集成电路等。此外，处理器可以具有操作一个或多个软件程序的功能，软件程序可以存储在存储介质中。

处理器201可以包括一个或多个处理单元。例如：处理器可以包括应用处理器(application processor，AP)，调制解调处理器，图形处理器(graphics processingunit，GPU)，图像信号处理器(image signal processor，ISP)，控制器，视频编解码器，数字信号处理器(digital signal processor，DSP)，基带处理器，和/或神经网络处理器(neural-network processing unit，NPU)等。其中，不同的处理单元可以是独立的部件，也可以集成在一个或多个处理器中。在一些实施例中，电子设备200也可以包括一个或多个处理器201。其中，控制器可以根据指令操作码和时序信号，产生操作控制信号，完成取指令和执行指令的控制。

在一些实施例中，处理器201可以包括一个或多个接口。接口可以包括集成电路间(inter-integrated circuit，I2C)接口，集成电路间音频(integrated circuit sound，I2S)接口，脉冲编码调制(pulse code modulation，PCM)接口，通用异步收发传输器(universal asynchronous receiver/transmitter，UART)接口，移动产业处理器接口(mobile industry processor interface，MIPI)，通用输入输出(general-purposeinput/output，GPIO)接口，SIM卡接口，和/或USB接口等。其中，USB接口是符合USB标准规范的接口，具体可以是Mini USB接口，Micro USB接口，USB Type C接口等。USB接口可以用于连接充电器为电子设备充电，也可以用于电子设备与***设备之间传输数据。

电子设备200还可以包括外部存储器接口，外部存储器接口用于连接外部存储卡，例如Micro SD卡，实现扩展电子设备的存储能力。外部存储卡通过外部存储器接口与处理器201通信，实现数据存储功能。例如将音乐，视频等文件保存在外部存储卡中。

存储器202可以包括代码存储区和数据存储区。其中，代码存储区可存储操作***。数据存储区可存储电子设备200使用过程中所创建的数据等。此外，存储器202可以包括高速随机存取存储器，还可以包括非易失性存储器，例如一个或多个磁盘存储部件，闪存部件，通用闪存存储器(universal flash storage，UFS)等。

存储器202可以是只读存储器(read-only memory，ROM)、可存储静态信息和指令的其它类型的静态存储设备、随机存取存储器(random access memory，RAM)或可存储信息和指令的其它类型的动态存储设备，也可以是电可擦可编程只读存储器(electricallyerasable programmable read-only memory，EEPROM)、只读光盘(compact disc read-only memory，CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其它磁存储设备，或者还可以是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何计算机可读介质。

处理器201和存储器202可以合成一个处理装置，更常见的是彼此独立的部件。

进一步的，本申请实施例阐明的设备、装置、模块，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。

本领域内的技术人员应明白，本申请实施例可提供为方法、装置、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质上实施的计算机程序产品的形式。

在本申请所提供的几个实施例中，任一功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。

具体的，本申请一实施例中还提供一种计算机可读存储介质，该计算机可读存储介质中存储有计算机程序，当其在计算机上运行时，使得计算机执行本申请实施例提供的方法。

本申请一实施例还提供一种计算机程序产品，该计算机程序产品包括计算机程序，当其在计算机上运行时，使得计算机执行本申请实施例提供的方法。

本申请中的实施例描述是参照根据本申请实施例的方法、设备(装置)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

还需要说明的是，本申请实施例中，“至少一个”是指一个或者多个，“多个”是指两个或两个以上。“和/或”，描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示单独存在A、同时存在A和B、单独存在B的情况。其中A，B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项”及其类似表达，是指的这些项中的任意组合，包括单项或复数项的任意组合。例如，a，b和c中的至少一项可以表示：a，b，c，a和b，a和c，b和c或a和b和c，其中a，b，c可以是单个，也可以是多个。

本申请实施例中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本申请中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于装置实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本领域普通技术人员可以意识到，本申请实施例中描述的各单元及算法步骤，能够以电子硬件、计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的装置、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

以上所述，仅为本申请的具体实施方式，任何熟悉本技术领域的技术人员在本申请公开的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。本申请的保护范围应以所述权利要求的保护范围为准。

Claims

1.一种对话管理方法，其特征在于，所述方法包括：

获取当前的对话场景；

根据所述当前的对话场景，获取对话目标；

获取当前对话的对话上下文；

根据所述当前对话的对话上下文，预测下一个对话场景；

当对话产生漂移现象时，将对话场景拉回到所述对话目标相关的对话场景上；

所述根据所述当前对话的对话上下文，预测下一个对话场景，包括，计算对话场景转移概率并构建转移概率矩阵；

平滑所述转移概率矩阵，获取所述转移概率矩阵的平滑结果；

根据所述转移概率矩阵的平滑结果，推荐下一个对话场景，生成场景推荐列表；

基于所述场景推荐列表，使用所述场景推荐列表中第一位的对话场景推进对话后，若出现对话场景漂移，则使用所述场景推荐列表中第二位的对话场景推进对话；

所述平滑所述转移概率矩阵包括：当n-m轮对话的场景转移概率是0时，使用n-m+1轮对话进行平滑，其中，n表示当前对话场景，n-m表示当前对话场景n的前m轮对话。

2.根据权利要求1所述的方法，其特征在于，所述获取当前的对话场景，包括：

获取本次对话开始后，最初的多轮对话的对话文本；

从所述最初的多轮对话的对话文本中提取实体；

根据提取出的所述实体，识别所述对话场景。

3.根据权利要求2所述的方法，其特征在于，所述获取本次对话开始后，最初的多轮对话的对话文本，包括：

获取本次对话开始后的前三轮对话的对话文本。

4.根据权利要求2所述的方法，其特征在于，所述实体的类型包括以下任意一项或多项的组合：品牌、厂商、车型、车系、地名、称呼、价格、时间。

5.根据权利要求2所述的方法，其特征在于，所述对话场景包括以下任意一项或多项的组合：开场白场景、意向判断场景、客户没时间场景、客户不感兴趣场景、询问城市场景、所在城市有经销商场景、所在城市无经销商场景、加联络方式推信息场景、结束语场景。

6.一种电子设备，其特征在于，所述电子设备包括用于存储计算机程序指令的存储器和用于执行计算机程序指令的处理器，其中，当所述计算机程序指令被该处理器执行时，触发所述电子设备执行如权利要求1-5中任一项所述的方法步骤。

7.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机程序，当其在计算机上运行时，使得计算机执行如权利要求1-5中任一项所述的方法。