CN107644641B

CN107644641B - 对话场景识别方法、终端以及计算机可读存储介质

Info

Publication number: CN107644641B
Application number: CN201710636464.5A
Authority: CN
Inventors: 卢道和; 郑德荣; 张超; 杨海军; 钟伟
Original assignee: WeBank Co Ltd
Current assignee: WeBank Co Ltd
Priority date: 2017-07-28
Filing date: 2017-07-28
Publication date: 2021-04-13
Anticipated expiration: 2037-07-28
Also published as: CN107644641A

Abstract

本发明公开了一种对话场景识别方法，包括以下步骤：接收输入的用户对话信息；基于用户对话信息，采用预置的场景识别规则对预置候选场景进行筛选，得到用户对话信息对应的第一类候选场景；以及基于用户对话信息，采用场景判别模型对预置候选场景进行筛选，得到用户对话信息对应的第二类候选场景；基于第一类候选场景与第二类候选场景，对用户对话信息进行增强学习处理，得到与用户对话信息对应的最优对话场景；判断最优对话场景与当前对话场景是否相同，若不相同，则将最优对话场景作为当前对话场景。本发明还公开了一种对话场景识别终端及计算机可读存储介质。本发明实现了在对话场景变化过程中对场景的准确识别。

Description

对话场景识别方法、终端以及计算机可读存储介质

技术领域

本发明涉及对话场景识别技术领域，尤其涉及一种对话场景识别方法、终端以及计算机可读存储介质。

背景技术

自动问答是指利用计算机自动回答用户所提出的问题以满足用户知识需求的任务，是信息服务的一种高级形式。近年来，随着人工智能的飞速发展，自动问答已经成为备受关注且发展前景广泛的研究方向，自动问答被认为是验证机器是否具有自然语言理解能力的主要任务之一，自动问答的研究有利于推动人工智能相关学科的发展。

但是目前的自动问答***还不够完美，仍面临许多具体问题和困难。目前的智能机器人大都是单轮对话***，不考虑对话上下文信息，用户历史对话信息等数据，给出的很多答案不连贯，比较突兀，严重影响了用户体验。针对这种情况，我们提出了一种多场景识别的方法，在对话过程中，能够根据用户当前的输入、历史对话信息等数据，主动适应用户对话的场景，使得对话更加流畅自然。

发明内容

本发明的主要目的在于提供一种对话场景识别方法、识别终端以及计算机可读存储介质，旨在解决在智能机器人与人进行语音交互过程中，难以准确识别场景变化的技术问题。

为实现上述目的，本发明提供一种对话场景识别方法，所述对话场景识别方法包括：

接收输入的用户对话信息；

基于所述用户对话信息，采用预置的场景识别规则对预置候选场景进行筛选，得到所述用户对话信息对应的第一类候选场景；以及基于所述用户对话信息，采用场景判别模型对所述预置候选场景进行筛选，得到所述用户对话信息对应的第二类候选场景；

基于所述第一类候选场景与所述第二类候选场景，对所述用户对话信息进行增强学习处理，得到与所述用户对话信息对应的最优对话场景；

判断所述最优对话场景与当前对话场景是否相同，若不相同，则将所述最优对话场景作为当前对话场景。

优选地，所述基于所述用户对话信息，采用预置的场景识别规则对候选场景进行筛选处理，得到所述用户对话信息对应的第一类候选场景的步骤包括：

抽取所述用户对话信息中的关键词；

基于所述关键词，筛选所述预置候选场景中与所述关键词相关的场景，并将所述相关的场景作为所述用户对话信息对应的所述第一类候选场景。

优选地，所述基于用户对话信息，采用场景判别模型对所述预置候选场景进行筛选处理，得到所述用户对话信息对应的第二类候选场景的步骤包括：

抽取所述用户对话信息中的特征信息；

基于所述特征信息，通过所述场景判别模型计算所述预置候选场景与所述特征信息的匹配程度，并将匹配程度较高的部分场景作为所述用户对话信息对应的第二类候选场景。

优选地，所述基于所述第一类候选场景与所述第二类候选场景，对所述用户对话信息进行增强学习处理，得到与所述用户对话信息对应的最优对话场景的步骤包括：

以所述用户对话信息为动作、所述第一类候选场景与所述第二类候选场景为状态，对所述用户对话信息进行增强学习处理，以供从所述第一类候选场景与所述第二类候选场景中筛选出最优对话场景。

为实现上述目的，本发明还提供一种识别终端，所述识别终端包括：

存储有对话场景识别程序的存储器；

处理器，配置为执行所述对话场景识别程序以执行下述操作：

接收输入的用户对话信息；

可选地，执行所述基于所述用户对话信息，采用预置的场景识别规则对预置候选场景进行筛选，得到所述用户对话信息对应的第一类候选场景的操作包括：

抽取所述用户对话信息中的关键词；

可选地，执行所述基于所述用户对话信息，采用场景判别模型对所述预置候选场景进行筛选，得到所述用户对话信息对应的第二类候选场景的操作包括：

抽取所述用户对话信息中的特征信息；

优选地，执行所述基于所述第一类候选场景与所述第二类候选场景，对所述用户对话信息进行增强学习处理，得到与所述用户对话信息对应的最优对话场景的操作包括：

为实现上述目的，本发明还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有对话场景识别程序，所述对话场景识别程序被处理器执行时实现如上述任一项所述的对话场景识别方法的步骤。

本发明中，具体在场景变化过程中，当对话场景发生改变的时候，首先采用预置的场景识别规则和场景判别模型对预置候选场景进行第一次筛选，并得到相应的候选场景，然后利用增强学习策略对候选场景进行第二次筛选，进而得到最优的对话场景，最后根据最优的对话场景选择合适的对话结果回复用户，从而实现了对当前对话场景变化的准确识别，进而提升用户人机交互的使用体验。

附图说明

图1为本发明智能机器人对话场景识别方法一实施例的流程示意图；

图2为图1中步骤S20的细化流程示意图；

图3为图1中步骤S30的细化流程示意图；

图4为图1中步骤S40的细化流程示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

参照图1，图1为本发明智能机器人对话场景识别方法一实施例的流程示意图。本实施例中，对话场景识别方法包括以下步骤：

步骤S10，接收输入的用户对话信息；

本实施例中，当用户与智能机器人对话时，智能机器人通过语音交互***接收用户输入的对话信息。其中，智能机器人接收用户对话信息的方式包括:将声音进行信息转化、利用***中的声音识别***。

将声音进行信息转换就是将声音转化为电波，再将声音转化为智能机器人所能识别的信息，机器人通过接收信息，进行相应反馈。

利用声音识别***时通过识别用户的音调、音色等，通过音调及音色对应的信息做出相应的反馈。

步骤S20，基于所述用户对话信息，采用预置的场景识别规则对预置候选场景进行筛选，得到所述用户对话信息对应的第一类候选场景；

本实施例中，当接收到用户输入的对话信息时，通过使用场景识别规则，对预置场景信息进行筛选，得到相对应的候选场景。场景识别规则具体基于人的实践经验而设定的对话规则，且本实施例对于预置场景识别规则的设置不限。

比如，通过获取对话信息中的规则进行场景识别。例如，当用户输入对话信息为“你是谁，今年几岁了”时，获取的规则就是“身份”以及“年龄”，此时场景识别规则可设定为人的基本情况介绍，因此对应的回答可以是“你好，我叫小白，今年两岁”。再例如，当用户输入对话信息为“我要查询机票”时，获取的对话关键词就是“查询机票”，此时场景识别规则开设定为查询机票方式的提供，因此对应的回答可以是“出发时间是哪天”。

再比如，通过问题和答案的对应进行场景识别。例如，当用户输入对话信息为“你和我谁更帅”时，此时利用场景识别规则直接对应的答案可以是“当然是我了”或者“我更帅”。再例如，当用户输入对话信息为“晚安”，此时可以直接回答“晚安”。

步骤S30，基于所述用户对话信息，采用场景判别模型对所述预置候选场景进行筛选，得到所述用户对话信息对应的第二类候选场景；

本实施例中，场景判别模型是机器学习的一种算法，具体是通过把很多相关信息都提取出来，结合历史信息，找寻历史信息与所提取出来的信息是否存在相似，若相似则会将相似的场景归为一类。判别模型的算法有多种，且在本实施例中判别模型的算法所使用的类型是不限的。本实施例中，所使用的判别模型计算方式可以是：计算特征信息与候选场景信息的相关性的大小，进而确定候选场景。

例如，当用户对话信息为“我要健身”时，此时会获取用户信息外，还会根据此信息获取到用户想要锻炼，更会从历史对话中获取之前对话提及过关于锻炼或者健身的问题的相关信息，在获取相关的特征信息包括用户意图理解、历史对话信息、用户偏好信息时，便根据特征信息，通过判别模型对场景进行筛选，此时的回答可以是“去×××健身俱乐部去吧”或者“去护城河边区跑步吧”，而不会是“我不要健身”。

再例如，当用户对话信息为“晚餐吃什么呢”，在场景中可能存在的相关场景就有“晚餐去西餐厅吃牛排”、“晚餐去吃湘菜”、“晚餐自己做蛋炒饭”或者“我不吃晚餐”等等。以上的四种场景都有一个相似点就是吃晚餐，但是第四个和前三个明显就有一个吃晚餐的对象不一样的问题，前三个时用户而第四个却变成了机器人。所以当用户对话说“晚餐吃什么”的时候，很显然第四个是不符合此时的场景的。

需要指出的是，上述步骤S20与S30的执行先后顺序不限，比如先执行步骤S20，而后再执行步骤S30，或者先执行步骤S30，而后再至执行步骤S20，或者步骤S20与S30同时进行。

步骤S40，基于所述第一类候选场景与所述第二类候选场景，对所述用户对话信息进行增强学习处理，得到与所述用户对话信息对应的最优对话场景；

本实施例中，增强学习是一个自主学习的过程，通过不断的学习，选择一个能达到目标的最优的动作。增强学习可以通过多种方式来实现，由于在增强学习的过程中有个值函数(状态值函数)、Q函数(动作值函数)或者策略等，而且值函数、Q函数或者策略是根据不同的任务进行不同的定义，所以本实施例中对于其实现的方式是不限的。

本实施例中，将通过步骤S20得到的第一类候选场景和通过步骤S30得到第二类候选场景作为增强学习的候选场景集合。在获取用户对话信息动作时，以此候选场景为状态集合，通过增强学习实现对候选场景的筛选。

例如，当用户对话信息为“晚餐吃什么呢”，经过场景识别规则和场景判别模型的第一次筛选之后得到第一类候选场景和第二类候选场景。此时候选场景可以包括有：“晚餐去西餐厅吃牛排”、“晚餐去吃湘菜”、“晚餐自己做蛋炒饭”、“晚餐自己做菜吧”、“六点之后再吃晚餐吧”、“我不吃晚餐”等等。

在用户问出“晚餐吃什么”的问题时，智能机器人清楚了解用户的目标，通过值函数的计算，每一个场景都对应一个值，比如，“晚餐去西餐厅吃牛排”所对应的值为54、“晚餐去吃湘菜”所对应的值为63、“晚餐自己做菜吧”所对应的值为72、“六点之后再吃晚餐吧”所对应的值为81、“晚餐自己做蛋炒饭”所对应的值为90，此时不同的值代表着与目标的接近程度(满分100，即达到目标)，所以此时最优的回答可以是“晚餐自己做蛋炒饭”。

本实施例中，通过增强学习中的值函数的计算，利用数值对场景进行一个打分排序，选取打分最高的一个场景作为最优的场景输出。

步骤S50，判断所述最优对话场景与当前对话场景是否相同，若不相同，则将所述最优对话场景作为当前对话场景；

本实施例中，当通过增强学习筛选出最优的对话场景时，将最优对话场景与当前对话场景进行对比，若最优对话场景与当前度化场景没有变化，则当前对话场景不变，若对比发现最优对话场景与当前对话场景不一样，则将最优对话场景作为最新的当前对话场景输出。例如，用户之前和机器人对话的场景是关于天气的话题场景，而当用户再次与机器人对话时，根据对话信息筛选出来的时关于吃饭的话题场景，此时会将对话场景从前面的关于天气的话题场景转变为关于吃饭的话题场景。

在本实施例中，将最优的对话场景和当前的对话场景中最为合适的对话场景输出，并根据最为合适的对话场景做出相应的操作。

实施例二：

参照图2，图2为图1中步骤S20的细化流程示意图。基于上述实施例一，在本实施例中，上述步骤S20进一步包括：

步骤S201，抽取所述用户对话信息中的关键词；

步骤S202，基于所述关键词，筛选所述预置候选场景中与所述关键词相关的场景，并将所述相关的场景作为所述用户对话信息对应的所述第一类候选场景。

本实施例中，当接收到用户输入的对话信息时，根据对话信息抽取其中的关键词，然后依据所抽取出来的关键词筛选预置候选场景中与该关键词相关的程度较高的场景，并将相关程度较高的部分场景作为第一类候选场景。

例如，用户输入的对话信息是“我想要吃川菜”，当接收到此输入信息时，抽取信息中的关键词“吃饭”和“川菜”，此时根据关键词去和预置候选场景进行匹配，获取相关程度较高的部分场景。当获取了关键词“吃”和“食物”时，此时会匹配到的场景可能就有关于附近川菜馆的场景信息，进而获取更多关于“吃饭”和“川菜”的场景作为第一类候选场景。

再例如，用户输入的对话信息是“我想要去健身”，在接收到此信息时，可以很清晰的获取其中的关键词“健身”，此时获取的场景信息可能就是：“健身的项目有什么”、“健身的地点在哪里”、“怎么健身”等一系列与“健身”相关的场景就会出现在候选场景中，比如智能机器人输出的对话为“你是想要跑步还是想要去健身房”，用户可以再次选择“我想去跑步”。此时便选取了对话的场景。

本实施例中，通过识别规则获取第一类候选场景信息，获取的对话信息的关键词，而匹配的对话场景也是提及关键词的对话场景，是设置好的对话场景信息，不会随着用户的变化而改变。

实施例三：

参照图3，图3为图1中步骤S30的细化流程示意图。基于上述实施例一，在本实施例中，上述步骤S30进一步包括：

步骤S301，抽取所述用户对话信息中的特征信息；

步骤S302，基于所述特征信息，通过所述场景判别模型计算所述预置候选场景与所述特征信息的匹配程度，并将匹配程度较高的部分场景作为所述用户对话信息对应的第二类候选场景。

本实施例中，当接收到用户输入的对话信息时，抽取对话信息中的特征信息，通过将预置候选场景与该特征信息进行匹配程度的计算，得到匹配程度较高的部分场景作为第二类候选场景，其中抽取出来的特征信息包括有用户意图、此对话信息与前一段对话信息的关联性以及在预置候选场景中用户关于此类问题的偏好性等。

例如，当用户输入的对话信息是“中午吃什么”时，在获取用户信息的同时，依据此信息和用户此前问过的类似的问题，此时的特征信息可能就有用户经常的消费行为，用户经常在哪里吃，用户的口味等，通过对比这些特征信息从而选择较为合适的吃饭地点，此时可能就会回复“去×××餐厅吃川菜吧”或者“自己在家做饭吧”等。

再例如，用户对话信息是“我要健身”，此时判别模型除会获取用户信息外，还根据此信息获取到用户需要锻炼了，而此时也不单单只是获取对话信息中的信息，更会根据对话的历史信息，从历史对话中获取之前对话提及过关于锻炼或者健身的问题集合，并从集合中提取用户的选择偏好、关注的健身方式以及常去的场所等等，当获取一定的相关特征时，便根据特征信息，通过判别模型对场景进行筛选，可能就会回复“去×××健身俱乐部去吧”或者“去护城河边区跑步吧”。

通过实施例二和实施例三，可以发现，由于预置的场景识别规则是一个设定好的不能改变的规则，所以在识别过程中缺乏一定的灵活性，面对一个问题时，所能回复的永远只有一个或者几个固定的答案；而通过预置的判别模型可以较为准确的识别用户意图，进而给出更为合适的答案，但是此方法需积累一定量对话信息数据。于是通过此两种方法对预置候选场景进行第一次筛选，选择出较为合适的部分场景，为第二次的准确筛选缩小筛选范围。

实施例四：

参照图4，图4为图1中步骤S40的细化流程示意图。基于上述实施例一，在本实施例中，上述步骤S40进一步包括：

步骤S401，接收第一类候选场景和第二类候选场景，并将接收到的候选场景作为增强学的状态集合；

步骤S402，将对话信息作为增强学习的动作，通过增强学习筛选出状态集合中的最佳状态，进而确定最优对话场景。

本实施例中，在接收到第一类候选场景和第二类候选场景之后，将候选场景中的各场景当作一个状态，把用户对话信息作为一个动作，通过增强学习中的值函数或者Q函数结合当前动作对各个状态进行计算，将计算得到的值进行排序，选取值最大的作为最优状态，所述最优状态对应的场景即为最优对话场景。

例如，当用户对话信息为“我要去健身”时，通过场景是被规则和场景判别模型得到的第一类候选场景和第二类候选场景的场景集合就可以有“去×××健身俱乐部去吧”、“去护城河边区跑步吧”、“去找一个健身教练吧”、“去办一张健身卡吧”、“我不要健身”等等。智能机器人清楚了解用户的目标，通过值函数的计算，每一个场景都对应一个值，比如，“我不要健身”所对应的值为54、“去护城河边区跑步吧”所对应的值为63、“去×××健身俱乐部去吧”所对应的值为72、“去办一张健身卡吧”所对应的值为81、“去找一个健身教练吧”所对应的值为90，所以此时最优的回答可以是“去找一个健身教练吧”。

本发明还保护一种对话场景识别终端。

在本发明中，在本发明终端一实施例中，对话场景识别终端包括：

存储有对话场景识别程序的存储器；处理器，配置为执行所述对话场景识别程序以执行下述操作：

接收输入的用户对话信息；

比如，通过获取对话信息中的关键词进行场景识别。例如，当用户输入对话信息为“你是谁，今年几岁了”时，获取的规则就是“身份”以及“年龄”，此时场景识别规则可设定为人的基本情况介绍，因此对应的回答可以是“你好，我叫小白，今年两岁”。再例如，当用户输入对话信息为“我要查询机票”时，获取的对话关键词就是“查询机票”，此时场景识别规则开设定为查询机票方式的提供，因此对应的回答可以是“出发时间时哪天”。

进一步可选的，在本发明终端一实施例中，处理器执行基于所述用户对话信息，采用预置的场景识别规则对预置候选场景进行筛选，得到所述用户对话信息对应的第一类候选场景的操作包括：

抽取所述用户对话信息中的关键词；

进一步可选的，在本发明终端一实施例中，处理器执行基于所述用户对话信息，采用场景判别模型对所述预置候选场景进行筛选，得到所述用户对话信息对应的第二类候选场景的操作包括：

抽取所述用户对话信息中的特征信息；

进一步可选的，在本发明终端一实施例中，处理器执行基于所述第一类候选场景与所述第二类候选场景，对所述用户对话信息进行增强学习处理，得到与所述用户对话信息对应的最优对话场景的操作包括：

接收第一类候选场景和第二类候选场景，并将接收到的候选场景作为增强学的状态集合；

将对话信息作为增强学习的动作，通过增强学习筛选出状态集合中的最佳状态，进而确定最优对话场景。

本发明实施例还提出一种计算机可读存储介质。

本发明计算机可读存储介质上存储有对话场景识别程序，所述对话场景识别程序被处理器执行时实现如上所述实施例中的对话场景识别方法的步骤。

本实施例提出的对话场景识别方法，在具体的场景变化过程中，当对话场景发生改变的时候，首先采用预置的场景识别规则和场景判别模型对预置候选场景进行第一次筛选，并得到相应的候选场景，然后利用增强学习策略对候选场景进行第二次筛选，进而得到最优的对话场景，最后根据最优的对话场景选择合适的对话结果回复用户，从而实现了对当前对话场景变化的准确识别，进而提升用户人机交互的使用体验。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者***不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者***所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者***中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种对话场景识别方法，其特征在于，所述对话场景识别方法包括以下步骤：

接收输入的用户对话信息；

基于所述用户对话信息，采用预置的场景识别规则对预置候选场景进行筛选，得到所述用户对话信息对应的第一类候选场景；以及提取所述用户对话信息中的特征信息，基于所述特征信息，采用场景判别模型对所述预置候选场景进行筛选，得到所述用户对话信息对应的第二类候选场景，其中，所述特征信息包括用户意图、所述用户对话信息与前一段对话信息的关联性和在预置候选场景中用户关于此类问题的偏好性；

基于所述第一类候选场景与所述第二类候选场景，对所述用户对话信息进行增强学习处理，得到与所述用户对话信息对应的最优对话场景，具体包括，通过所述增强学习处理中的值函数计算确定所述第一类候选场景对应的值，和所述第二类候选场景对应的值，并基于所述第一类候选场景对应的值和所述第二类候选场景对应的值进行打分排序，根据所述打分排序确定打分最高的一个场景作为所述用户对话信息对应的最优对话场景；

2.如权利要求1所述的对话场景识别方法，其特征在于，所述基于所述用户对话信息，采用预置的场景识别规则对候选场景进行筛选处理，得到所述用户对话信息对应的第一类候选场景的步骤包括：

抽取所述用户对话信息中的关键词；

3.如权利要求1所述的对话场景识别方法，其特征在于，所述基于所述特征信息，采用场景判别模型对所述预置候选场景进行筛选处理，得到所述用户对话信息对应的第二类候选场景的步骤包括：

4.如权利要求1所述的对话场景识别方法，其特征在于，所述基于所述第一类候选场景与所述第二类候选场景，对所述用户对话信息进行增强学习处理，得到与所述用户对话信息对应的最优对话场景的步骤包括：

5.一种对话场景识别终端，其特征在于，所述对话场景识别终端包括：

存储有对话场景识别程序的存储器；

接收输入的用户对话信息；

6.如权利要求5所述的对话场景识别终端，其特征在于，执行所述基于所述用户对话信息，采用预置的场景识别规则对预置候选场景进行筛选，得到所述用户对话信息对应的第一类候选场景的操作包括：

抽取所述用户对话信息中的关键词；

7.如权利要求5所述的对话场景识别终端，其特征在于，执行所述基于所述特征信息，采用场景判别模型对所述预置候选场景进行筛选，得到所述用户对话信息对应的第二类候选场景的操作包括：

8.如权利要求5所述的对话场景识别终端，其特征在于，执行所述基于所述第一类候选场景与所述第二类候选场景，对所述用户对话信息进行增强学习处理，得到与所述用户对话信息对应的最优对话场景的操作包括：

9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有对话场景识别程序，所述对话场景识别程序被处理器执行时实现如权利要求1至4中任一项所述的对话场景识别方法的步骤。