CN116301339A

CN116301339A - 人机交互方法、装置、***、电子设备及可读存储介质

Info

Publication number: CN116301339A
Application number: CN202310104670.7A
Authority: CN
Inventors: 刘若拙; 倪旭光; 陈乐�; 刘思彦; 范长杰; 胡志鹏
Original assignee: Netease Hangzhou Network Co Ltd
Current assignee: Netease Hangzhou Network Co Ltd
Priority date: 2023-02-02
Filing date: 2023-02-02
Publication date: 2023-06-23

Abstract

本申请公开了一种人机交互方法、装置、***、电子设备及可读存储介质。该方法应用于人机交互***中的服务端，该***还包括终端，该方法包括：接收终端发送的针对用户指令的意图识别请求，对用户指令进行意图识别，得到意图信息并返回终端；接收终端发送的意图理解请求，判断意图信息是否为可执行的意图，若是，从预设的交互任务链图中确定意图信息上下文并返回终端，以使终端根据意图信息上下文，输出对用户的反馈信息。本申请从交互任务链图中确定用户意图上下文，从而确定当前交互任务链中的下一步操作，以对用户作出反馈，实现动态任务链处理；本申请还将业务逻辑部署在终端、算法逻辑部署在服务端，实现边端部署程序最小化，逻辑最简化。

Description

人机交互方法、装置、***、电子设备及可读存储介质

技术领域

本申请涉及人工智能技术领域，具体涉及一种人机交互方法、装置、***、电子设备及计算机可读存储介质。

背景技术

随着技术的飞速发展，为了给用户更好的服务体验，机器人等服务设备需要具备一定的人机交互能力，在人机交互的场景中，服务设备需要对用户需求给予合理的反馈。

在实际应用中，当用户提出需求时，服务设备可以执行与用户需求相匹配的操作，并对用户反馈执行操作的结果。但服务设备执行操作后，并不一定能够达到用户期望，需要服务设备继续对用户需求作出反馈，直至满足用户期望，这是一个动态的任务链(或称为链式任务)。然而，对于服务型的设备来说，通常较为注重提供服务功能本身，而在人机交互方面，缺乏动态任务链的处理能力。

此外，服务设备作为提供服务的边端，还需要与相应的服务端进行交互，而人机交互任务的实现逻辑糅合在服务设备一侧，则会造成服务设备侧代码臃肿、内存消耗过多等情况，无法更好地提供服务。

发明内容

本申请提供了一种人机交互方法、装置、***、电子设备及计算机可读存储介质，以解决或至少部分解决上述问题。具体如下。

第一方面，本申请提供了一种人机交互方法，应用于人机交互***中的服务端，所述人机交互***还包括与所述服务端通信连接的终端，所述方法包括：

接收所述终端发送的针对所述终端获取的用户指令的意图识别请求，响应于所述意图识别请求，对所述用户指令进行意图识别，得到意图信息，将所述意图信息返回至所述终端；

接收所述终端发送的携带有所述意图信息的意图理解请求，响应于所述意图理解请求，判断所述意图信息是否为可执行的意图，若所述意图信息为可执行的意图，从预设的交互任务链图中确定所述意图信息的上下文信息，将所述意图信息的上下文信息返回至所述终端，以使所述终端根据所述意图信息的上下文信息，输出针对所述用户指令的反馈信息。

第二方面，本申请提供了一种人机交互方法，应用于人机交互***中的终端，所述人机交互***还包括与所述终端通信连接的服务端，所述方法包括：

获取用户指令，将针对所述用户指令的意图识别请求发送至所述服务端，以使所述服务端响应于所述意图识别请求，对所述用户指令进行意图识别，得到意图信息，并将所述意图信息返回至所述终端；

接收所述服务端返回的所述意图信息，将携带有所述意图信息的意图理解请求发送至所述服务端，以使所述服务端响应于所述意图理解请求，判断所述意图信息是否为可执行的意图，若所述意图信息为可执行的意图，从预设的交互任务链图中确定所述意图信息的上下文信息，并将所述意图信息的上下文信息返回至所述终端；

接收所述服务端返回的所述意图信息的上下文信息，根据所述意图信息的上下文信息，输出针对所述用户指令的反馈信息。

第三方面，本申请提供了一种人机交互方法，应用于人机交互***，所述人机交互***包括终端，以及与所述终端通信连接的服务端，所述方法包括：

所述终端获取用户指令，将针对所述用户指令的意图识别请求发送至所述服务端；

所述服务端接收所述意图识别请求，响应于所述意图识别请求，对所述用户指令进行意图识别，得到意图信息，将所述意图信息返回至所述终端；

所述终端接收所述意图信息，将携带有所述意图信息的意图理解请求发送至所述服务端；

所述服务端接收所述意图理解请求，响应于所述意图理解请求，判断所述意图信息是否为可执行的意图，若所述意图信息为可执行的意图，从预设的交互任务链图中确定所述意图信息的上下文信息，将所述意图信息的上下文信息返回至所述终端；

所述终端接收所述意图信息的上下文信息，根据所述意图信息的上下文信息，输出针对所述用户指令的反馈信息。

第四方面，本申请实施例还提供了一种人机交互装置，应用于人机交互***中的服务端，所述人机交互***还包括与所述服务端通信连接的终端，所述装置包括：

意图识别模块，用于接收所述终端发送的针对所述终端获取的用户指令的意图识别请求，响应于所述意图识别请求，对所述用户指令进行意图识别，得到意图信息，将所述意图信息返回至所述终端；

意图理解模块，用于接收所述终端发送的携带有所述意图信息的意图理解请求，响应于所述意图理解请求，判断所述意图信息是否为可执行的意图，若所述意图信息为可执行的意图，从预设的交互任务链图中确定所述意图信息的上下文信息，将所述意图信息的上下文信息返回至所述终端，以使所述终端根据所述意图信息的上下文信息，输出针对所述用户指令的反馈信息。

第五方面，本申请实施例还提供了一种人机交互装置，应用于人机交互***中的终端，所述人机交互***还包括与所述终端通信连接的服务端，所述装置包括：

意图识别请求模块，用于获取用户指令，将针对所述用户指令的意图识别请求发送至所述服务端，以使所述服务端响应于所述意图识别请求，对所述用户指令进行意图识别，得到意图信息，并将所述意图信息返回至所述终端；

意图理解请求模块，用于接收所述服务端返回的所述意图信息，将携带有所述意图信息的意图理解请求发送至所述服务端，以使所述服务端响应于所述意图理解请求，判断所述意图信息是否为可执行的意图，若所述意图信息为可执行的意图，从预设的交互任务链图中确定所述意图信息的上下文信息，并将所述意图信息的上下文信息返回至所述终端；

反馈模块，用于接收所述服务端返回的所述意图信息的上下文信息，根据所述意图信息的上下文信息，输出针对所述用户指令的反馈信息。

第六方面，本申请实施例还提供了一种人机交互***，所述人机交互***包括服务端和与所述服务端通信连接的终端；

所述终端，用于获取用户指令，将针对所述用户指令的意图识别请求发送至所述服务端；

所述服务端，用于接收所述意图识别请求，响应于所述意图识别请求，对所述用户指令进行意图识别，得到意图信息，将所述意图信息返回至所述终端；

所述终端，还用于接收所述意图信息，将携带有所述意图信息的意图理解请求发送至所述服务端；

所述服务端，还用于接收所述意图理解请求，响应于所述意图理解请求，判断所述意图信息是否为可执行的意图，若所述意图信息为可执行的意图，从预设的交互任务链图中确定所述意图信息的上下文信息，将所述意图信息的上下文信息返回至所述终端；

所述终端，还用于接收所述意图信息的上下文信息，根据所述意图信息的上下文信息，输出针对所述用户指令的反馈信息。

第七方面，本申请实施例还提供了一种服务机器人，用于实现上述人机交互方法中的终端所执行的步骤。

第八方面，本申请实施例还提供了一种电子设备，包括：

处理器；以及

存储器，用于存储程序，该电子设备通电并通过所述处理器运行该程序后，执行如第一方面所述的方法或者第二方面所述的方法。

第九方面，本申请实施例还提供了一种计算机可读存储介质，存储有程序，该程序被处理器运行，执行如第一方面所述的方法或者第二方面所述的方法。

与现有技术相比，本申请具有以下优点：

在本申请实施例中，当终端获取到用户指令时，根据业务逻辑，可以请求服务端对用户指令进行意图识别；终端接收到服务端识别得到的意图信息后，根据业务逻辑，确定此时需要请求服务端对意图信息进行意图理解；服务端首先判断意图信息是否为交互任务链中可执行的意图，若是，则从预设的交互任务链图中确定意图信息的上下文信息，从而理解该意图信息所代表的用户意图；终端接收到服务端返回的上下文信息后，可以基于此输出针对用户指令的反馈信息，以对用户需求做出反馈。在本申请实施例中，每当获取到用户指令，且该用户指令所代表的用户意图为交互任务链中可执行的意图时，可以从交互任务链图中确定该用户意图的上下文，从而确定当前交互任务链中的下一步操作，以对用户作出反馈，如此，实现了人机交互场景中动态的任务链的处理。另外，在本申请实施例中，可以将用户指令获取、用户意图识别、用户意图理解、对用户反馈等业务逻辑部署在作为边端的终端一侧，将意图识别、意图理解等算法逻辑部署在服务端一侧，如此，避免了边端代码臃肿、内存消耗过多等情况，实现边端部署程序最小化，逻辑最简化。

附图说明

图1是本申请实施例提供的一种人机交互***的框图；

图2是本申请实施例提供的一种人机交互方法的流程图；

图3是本申请实施例提供的一种服务端与终端的交互示意图；

图4是本申请实施例提供的另一种人机交互方法的流程图；

图5是本申请实施例提供的另一种人机交互方法的流程图；

图6是本申请实施例提供的一种人机交互装置的框图；

图7是本申请实施例提供的一种人机交互装置的框图；

图8是本申请实施例提供的一种用于实现人机交互的电子设备的逻辑结构示意图。

具体实施方式

在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施，本领域技术人员可以在不违背本申请内涵的情况下做类似推广，因此本申请不受下面公开的具体实施的限制。

本申请提供了一种人机交互方法，该方法应用于如图1所示的人机交互***1000，该人机交互***1000包括终端1001，以及与终端1001通信连接的服务端1002。

在一种可选的实施方式中，终端与服务端可以基于超文本传输协议(HyperTextTransferProtocol，HTTP)通信连接。

在一种可选的实施方式中，终端可以为服务机器人。

在一种可选的实施方式中，服务机器人可以包括按摩机器人。

在一种可选的实施方式中，服务端可以为云服务端。

图2示出了本申请实施例的一种人机交互方法，参照图2，该方法包括以下步骤S10～步骤S50。图3是本申请实施例提供的一种服务端与终端的交互示意图，以下将结合图3，对本申请实施例进行具体介绍。

步骤S10：终端获取用户指令，将针对用户指令的意图识别请求发送至服务端。

当终端获取到用户指令时，根据业务逻辑，可以请求服务端对用户指令进行意图识别。

其中，用户指令可以包括用户语音指令、用户文本指令等，本实施例不作具体限定。

此外，当终端处于休眠状态时，用户指令可将终端唤醒，进而终端在被唤醒后，可以将针对用户指令的意图识别请求发送至服务端。

步骤S20：服务端接收意图识别请求，响应于意图识别请求，对用户指令进行意图识别，得到意图信息，将意图信息返回至终端。

其中，具体如何进行意图识别，是意图识别算法逻辑，该算法逻辑可以部署在服务端，也即由终端根据业务逻辑确认需要进行意图识别，进而请求服务端提供算法支持，终端接收服务端进行意图识别的结果(即意图信息)即可。

步骤S30：终端接收意图信息，将携带有意图信息的意图理解请求发送至服务端。

终端在接收到服务端进行意图识别所得到的意图信息之后，根据业务逻辑，确认此时需要对该意图信息进行意图理解，进而可以请求服务端进行意图理解。

步骤S40：服务端接收意图理解请求，响应于意图理解请求，判断意图信息是否为可执行的意图，若意图信息为可执行的意图，从预设的交互任务链图中确定意图信息的上下文信息，将意图信息的上下文信息返回至终端。

其中，具体如何进行意图理解，是意图理解算法逻辑，该算法逻辑可以部署在服务端，也即由终端根据业务逻辑确认需要进行意图理解，进而请求服务端提供算法支持，终端接收服务端进行意图理解的结果(即意图信息的上下文信息)即可。

在该步骤中，若该意图信息刚好能与某个预设的交互任务链相匹配，则确认该意图信息为可执行的意图信息。对于可执行的意图信息，服务端可以从部署在服务端的交互任务链图中，确定意图信息的上下文信息，该上下文信息可以包括用于指示针对用户意图的下一步操作的信息、用于指示针对用户进行何种反馈所需的信息等至少一种信息。

若该意图信息与预设的所有交互任务链均不匹配，则确认该意图信息为不可执行的意图信息。对于不可执行的意图信息，服务端可以向终端返回预设询问操作的指示信息，其中，预设询问操作用于使终端输出预设询问信息，预设询问信息用于再次询问用户需求，例如预设询问信息可以是“我刚刚没有听明白，请问您有什么需求”。用户在听到或看到预设询问信息时，可以使用语法、用词等更加规范的语句，重新提出需求。终端接收到预设询问操作的指示信息后，可以执行预设询问操作，以输出预设询问信息。

可选地，针对语音交互场景，该交互任务链图具体可以是语音交互任务链图，其中，语音交互任务链图可以基于语音交互场景构建。相应地，输出反馈信息的步骤具体可以实现为播放反馈语音。

还可选地，针对文本交互场景，该交互任务链图具体可以是文本交互任务链图，其中，文本交互任务链图可以基于文字交互场景构建。相应地，输出反馈信息的步骤具体可以实现为显示反馈文本。

步骤S50：终端接收意图信息的上下文信息，根据意图信息的上下文信息，输出针对用户指令的反馈信息。

终端可以根据该上下文信息中包括的用于指示针对用户意图的下一步操作的信息、用于指示针对用户进行何种反馈所需的信息等至少一种信息，对用户需求进行反馈。

例如，在执行完针对用户意图的下一步操作之后，终端可以输出用于反馈的语音，以告知用户操作后达到了什么样的结果。

再例如，若用户意图较为模糊，则服务端可以从可能与用户意图匹配的交互任务链中，确定出可能的用户意图上下文，进而终端可以输出用于询问的语音，以对用户意图进行进一步确认。

在本申请实施例中，当终端获取到用户指令时，根据业务逻辑，可以请求服务端对用户指令进行意图识别；终端接收到服务端识别得到的意图信息后，根据业务逻辑，确定此时需要请求服务端对意图信息进行意图理解；服务端首先判断意图信息是否为交互任务链中可执行的意图，若是，则从预设的交互任务链图中确定意图信息的上下文信息，从而理解该意图信息所代表的用户意图；终端接收到服务端返回的上下文信息后，可以基于此输出针对用户指令的反馈信息，以对用户需求做出反馈。

在本申请实施例中，每当获取到用户指令，且该用户指令所代表的用户意图为交互任务链中可执行的意图时，可以从交互任务链图中确定该用户意图的上下文，从而确定当前交互任务链中的下一步操作，以对用户作出反馈，如此，实现了人机交互场景中动态的任务链的处理。另外，在本申请实施例中，可以将用户指令获取、用户意图识别、用户意图理解、对用户反馈等业务逻辑部署在作为边端的终端一侧，将意图识别、意图理解等算法逻辑部署在服务端一侧，如此，避免了边端代码臃肿、内存消耗过多等情况，实现边端部署程序最小化，逻辑最简化。

在本申请实施例中，可选地，步骤S40中，服务端判断意图信息是否为可执行的意图的步骤，具体可以通过以下步骤S41-S42实现：

S41：在预设热词库中，对意图信息进行热词匹配；预设热词库基于从多个预设意图指令中所提取的热词构建得到；

S42：当在预设热词库中针对该意图信息匹配到目标热词时，确定该意图信息为可执行的意图。

在该实施方式中，可以在服务端中构建包括多个热词的预设热词库，预设热词库基于从多个预设意图指令中所提取的热词构建得到，其中，预设意图指令可以根据可能涉及的各种不同的用户需求进行配置。服务端可以在该预设热词库中，对需要进行意图理解的意图信息进行热词匹配，从而找出与该意图信息具有同样意图的热词。若通过热词匹配找出了与该意图信息相匹配的热词，表示该意图信息即为某个交互任务链中的某个任务节点，则服务端可以确定该意图信息为交互任务链中可执行的意图。其中，需要说明的是，本申请实施例中的热词，包括单个词汇形式的热词，以及多个词汇的组合形式的热词，本申请并不旨在对此进行限定。

还可选地，在另一种实施方式中，可以在服务端中构建包括多个预设意图指令的意图指令集合，预设意图指令可以根据可能涉及的用户需求进行配置。服务端可以在该意图指令集合中，对需要进行意图理解的意图信息进行热词匹配，从而找出与该意图信息具有同样意图的预设意图指令。若通过热词匹配找出了与该意图信息相匹配的预设意图指令，表示该意图信息即为某个交互任务链中的某个任务节点，则服务端可以确定该意图信息为交互任务链中可执行的意图。

其中，步骤S41中，服务端在预设热词库中对意图信息进行热词匹配的步骤，具体可以包括以下两种实施方式：

实施方式一：在预设热词库中，对意图信息进行热词精确匹配。

相应地，步骤S42可通过以下方式实现：当在预设热词库中针对该意图信息精确匹配到目标热词时，确定该意图信息为可执行的明确意图。

实施方式二：在预设热词库中，对意图信息进行热词模糊匹配。

相应地，步骤S42可通过以下方式实现：当在预设热词库中针对该意图信息模糊匹配到目标热词时，确定该意图信息为可执行的模糊意图。

在上述实施方式一中，可以对意图信息进行热词的精确匹配，对于精确匹配的方式，需要意图信息中的关键词与热词完全一致，才能被判定为匹配成功。

而在上述实施方式二中，可以对意图信息进行热词的模糊匹配，对于模糊匹配的方式，只要意图信息中的关键词与热词含义一致，即可被判定为匹配成功。

在本申请实施例中，对于用户的模糊意图，也能够通过热词模糊匹配，判定该模糊意图是否在交互任务链中为可执行的意图，若可执行，则能够对用户模糊意图也进行响应，对用户作出反馈，从而无需用户学习标准的指令语言，提升了用户体验。

在上述实施方式一的基础上，可选地，步骤S40中，服务端在意图信息为可执行的意图时，从预设的交互任务链图中确定意图信息的上下文信息的步骤，具体可以通过以下步骤S43-S44实现：

步骤S43：若意图信息为可执行的明确意图，从预设的交互任务链图中确定该意图信息所属的目标交互任务链，以及该意图信息在目标交互任务链中所处的目标任务节点；

步骤S44：确定目标交互任务链中针对目标任务节点的后续响应操作。

其中，交互任务链图中包括多个交互任务链，任一交互任务链中的任一任务节点，都可以根据业务需求，与其他交互任务链中的任务节点相关联，也即各个交互任务链并不一定各自独立，一个交互任务链可能与其中一些交互任务链存在关联，而与另外一些交互任务链不存在关联。一个交互任务链的某个任务节点的下一步，可以切换到另一个存在关联的交互任务链的某个任务节点，从而能够实现交互任务链的切换。

在该实施方式中，若意图信息为可执行的明确意图，则服务端可以从预设的交互任务链图中确定该意图信息属于哪个交互任务链，以及该意图信息在所属交互任务链中处于哪个任务节点。服务端确定出该意图信息的所属交互任务链和所处任务节点之后，便能够根据该交互任务链，确定该任务节点的下一步操作(即后续响应操作)是什么。

相应地，步骤S40中，服务端将意图信息的上下文信息返回至终端的步骤，具体包括：将携带有目标交互任务链的指示信息、目标任务节点的指示信息和后续响应操作的指示信息的第一上下文信息返回至终端。

其中，若意图信息为可执行的明确意图，则该意图信息的上下文信息即包括用于指示该意图信息所属的交互任务链的指示信息、用于指示该意图信息所处的任务节点的指示信息，以及用于指示该任务节点的下一步操作的指示信息，服务端可以将包括以上指示信息的意图信息上下文反馈给终端。

基于上述实施方式，进一步可选地，步骤S50中，终端接收意图信息的上下文信息，根据意图信息的上下文信息，输出针对用户指令的反馈信息的步骤，具体可以通过以下步骤S51-S53实现：

步骤S51：接收服务端返回的携带有目标交互任务链的指示信息、目标任务节点的指示信息和后续响应操作的指示信息的第一上下文信息；

步骤S52：执行该后续响应操作，以响应用户指令；

步骤S53：根据目标交互任务链和目标任务节点，生成针对用户指令进行答复的第一反馈信息，并输出第一反馈信息。

终端在接收到第一上下文信息之后，可以解析出其中携带的目标交互任务链的指示信息、目标任务节点的指示信息，以及后续响应操作的指示信息。

然后，终端可以执行该后续相应操作，从而实现对用户指令的响应，以满足用户需求。例如，在终端为服务机器人种类中的按摩机器人的情况下，若用户指令为“调大按摩力度”，则后续响应操作可以为将按摩力度调高一个档位，如从3档调高至4档。

之后，终端可以根据用户意图信息所属的交互任务链和所处的任务节点，生成针对用户指令进行答复的第一反馈信息。仍以终端为按摩机器人，用户指令为“调大按摩力度”为例，用户调大按摩力度的意图属于按摩力度调整交互任务链，且处于按摩力度调整交互任务链中的调大力度任务节点，按摩机器人已将从3档调高至4档，则按摩机器人此时可以生成“已将按摩力度调高至4挡”的反馈信息，并将该反馈信息通过语音播放的形式输出。其中，反馈信息中的“按摩力度”文本根据按摩力度调整交互任务链确定，反馈信息中的“调高”文本根据调大力度任务节点确定，反馈信息中的“4挡”文本则为终端执行“将按摩力度调高一个档位”的后续响应操作的执行结果。

可选地，终端为按摩机器人的情况下，后续响应操作可以包括按摩力度调整操作、按摩位置调整操作、按摩头切换操作等操作中的一种或多种。

在上述实施方式二的基础上，可选地，步骤S40中，服务端在意图信息为可执行的意图时，从预设的交互任务链图中确定意图信息的上下文信息的步骤，具体可以通过以下步骤S45-S46实现：

步骤S45：若意图信息为可执行的模糊意图，从预设的交互任务链图中确定该意图信息所属的目标交互任务链，以及该意图信息在目标交互任务链中所处的目标任务节点；

步骤S46：确定针对目标任务节点的再询问操作。

在该实施方式中，若意图信息为可执行的模糊意图，则服务端可以从预设的交互任务链图中确定该意图信息属于哪个交互任务链，以及该意图信息在所属交互任务链中处于哪个任务节点。服务端确定出该意图信息的所属交互任务链和所处任务节点之后，便能够根据该交互任务链，确定针对该任务节点需要如何向用户进一步确认意图，也即确定向用户进一步确认意图的反馈内容是什么。

相应地，步骤S40中，服务端将意图信息的上下文信息返回至终端的步骤，具体包括：将携带有目标交互任务链的指示信息、目标任务节点的指示信息和再询问操作的指示信息的第二上下文信息返回至终端。

其中，若意图信息为可执行的模糊意图，则该意图信息的上下文信息即包括用于指示该意图信息所属的交互任务链的指示信息、用于指示该意图信息所处的任务节点的指示信息，以及用于指示对用户意图如何进一步确认的再询问操作的指示信息，服务端可以将包括以上指示信息的意图信息上下文反馈给终端。

基于上述实施方式，进一步可选地，步骤S50中，终端接收意图信息的上下文信息，根据意图信息的上下文信息，输出针对用户指令的反馈信息的步骤，具体可以通过以下步骤S54-S55实现：

步骤S54：终端接收服务端返回的携带有目标交互任务链的指示信息、目标任务节点的指示信息和再询问操作的指示信息的第二上下文信息；

步骤S55：执行再询问操作；再询问操作用于根据目标交互任务链和目标任务节点，生成针对用户指令进行再询问的第二反馈信息，并输出第二反馈信息。

终端在接收到第二上下文信息之后，可以解析出其中携带的目标交互任务链的指示信息、目标任务节点的指示信息，以及再询问操作的指示信息。

然后，终端可以执行该再询问操作，以进一步确认用户意图。该再询问操作可以根据目标交互任务链和目标任务节点，生成针对用户指令进行再询问的第二反馈信息，并输出第二反馈信息。仍以终端为按摩机器人为例，若用户指令为“重一点”这种模糊意图，则按摩机器人可以确定此时需要向用户进一步确认意图，此时按摩机器人可以生成“您是否想要将按摩力度调高”的反馈信息，并将该反馈信息通过语音播放的形式输出。其中，反馈信息中的“按摩力度”文本根据按摩力度调整交互任务链确定，反馈信息中的“调高”文本根据调大力度任务节点确定，反馈信息中的“您是否想要”等询问句式的文本则根据终端需要进行意图再询问的情景确定。

综上所述，在本申请实施例中，对于可执行的模糊用户意图，可以根据意图上下文信息，进一步询问用户，进而在用户确认后，可以按照可执行的明确用户意图作出反馈，如此，进一步提升了用户体验。

此外，在本申请实施例的一种可选实施方式中，步骤10中，终端获取用户指令，将针对该用户指令的意图识别请求发送至服务端的步骤，可以通过以下步骤S11-S13实现：

步骤S11：终端获取语音格式的用户指令，将携带有语音格式的用户指令的指令解析请求发送至服务端；

步骤S12：服务端接收指令解析请求，响应于指令解析请求，将语音格式的用户指令解析为文本格式的用户指令，将文本格式的用户指令返回至终端；

步骤S13：终端接收文本格式的用户指令，将携带有文本格式的用户指令的意图识别请求发送至服务端；

相应地，步骤S20中，服务端对用户指令进行意图识别的步骤，具体包括：对文本格式的用户指令进行意图识别。

在该实施方式中，终端直接获取到的用户指令可以为语音格式，也即用户通过与终端的语音交互下达了用户指令，相应地，终端可以请求服务端将用户指令从语音格式转换为文本格式。

其中，当终端获取到语音格式的用户指令时，首先可以通过alsa(AdvancedLinuxSoundArchitecture，高级Linux声音体系)语音库对语音格式的用户指令进行本地按帧缓存，之后在传递给服务端进行指令的格式解析。可选地，语音格式的用户指令具体可以是双声道语音。还可选地，可以先对语音格式的用户指令进行降噪处理，再进行本地按帧缓存。

当然，终端直接获取到的用户指令也可以为文本格式，也即用户通过与终端的文字交互下达了用户指令，相应地，终端无需请求服务端将用户指令从语音格式转换为文本格式，可以直接请求服务端对文本格式的用户指令进行意图识别。

在本申请实施例中，终端向服务端发送的各种请求，可以通过调用服务端预留接口的方式发送，并在调用接口时，将所需参数传入接口。

例如，对于指令解析请求，终端可以调用服务端预留的指令解析接口，并向该接口传入参数，该参数至少包括用户输入的语音格式的用户指令。其中，可选地，服务端具体可以通过例如ASR(AutomaticSpeechRecognition，自动语音识别)等算法，实现语音格式到文本格式的指令解析。

又例如，对于意图识别请求，终端可以调用服务端预留的意图识别接口，并向该接口传入参数，该参数至少包括用户指令(文本格式)。其中，可选地，服务端具体可以通过例如基于embedding(嵌入)、基于SVM(SupportVector Machine，向量机)的意图识别算法等算法，实现意图识别。

再例如，对于意图理解请求，终端可以调用服务端预留的意图理解接口，并向该接口传入参数，该参数至少包括意图识别得到的意图信息。其中，可选地，服务端具体可以通过NLU(AdvancedLinuxSoundArchitecture，高级Linux声音体系)等算法，实现意图理解。

此外，在本申请实施例中，服务端可以采用“事件监听-回调执行模型”，监听终端的相关处理请求，并将对终端请求的处理结果通过回调函数反馈给终端。

具体地，在一种实现方式中，步骤S20中，服务端接收意图识别请求的步骤，可以通过以下步骤实现：对终端发送意图识别请求的第一事件进行监听；当监听到第一事件时，接收意图识别请求。

相应地，步骤S20中，服务端将意图信息返回至终端的步骤，可以通过以下步骤实现：通过预先注册在服务端的第一回调函数，将意图信息返回至终端。

其中，第一回调函数用于将服务端的意图识别结果返回给意图识别接口的调用方，也即终端。

类似地，在一种实现方式中，步骤S40中，服务端接收意图理解请求的步骤，可以通过以下步骤实现：对终端发送意图理解请求的第二事件进行监听；当监听到第二事件时，接收意图识别请求。

相应地，步骤S40中，服务端将意图信息的上下文信息返回至终端的步骤，可以通过以下步骤实现：通过预先注册在服务端的第二回调函数，将意图信息的上下文信息返回至终端。

其中，第二回调函数用于将服务端的意图理解结果返回给意图理解接口的调用方，也即终端。

此外，在实际应用中，由于服务端通常会为众多的终端提供算法逻辑服务，所以服务端会接收到大量的终端请求，而出于安全性考虑，在本申请实施例中，还可选地，每当服务端接收到一个终端请求时，可以首先对在终端登录服务端的用户账号进行用户鉴权，以确定当前请求算法逻辑服务的用户账号是否为合法的用户账号。当鉴权通过时，则可以响应该终端的请求。

基于此，步骤S20中，服务端响应于意图识别请求，对用户指令进行意图识别，得到意图信息的步骤，具体可以包括：对意图识别请求进行用户鉴权，当鉴权通过时，响应于意图识别请求，对用户指令进行意图识别，得到意图信息。

步骤S40中，服务端响应于意图理解请求，判断意图信息是否为可执行的意图的步骤，具体可以包括：对意图理解请求进行用户鉴权，当鉴权通过时，响应于意图理解请求，判断意图信息是否为可执行的意图。

步骤S12中，服务端响应于指令解析请求，将语音格式的用户指令解析为文本格式的用户指令的步骤，具体可以包括：对指令解析请求进行用户鉴权，当鉴权通过时，响应于指令解析请求，将语音格式的用户指令解析为文本格式的用户指令。

此外，除交互任务链图中的任务之外，终端还管理有自身服务功能、开关机等终端任务，例如对于按摩机器人这样的终端，自身可以执行多种按摩模式的按摩任务。在一种实施方式中，终端可以通过任务状态机，对自身终端任务进行管理。当对用户指令的意图响应需要终端切换自身终端任务时，服务端所返回的意图信息上下文中将包含需要执行这样的操作的指示信息，进而终端可以基于服务端所返回的上下文，切换自身终端任务，例如从一种按摩模式切换到另一种按摩模式。

本申请实施例中的人机交互方法，提供了一种基于自然语言理解的用户意图上下文的判断方法，解决了现有技术中因用户意图上下文缺失，造成无法实现链式任务的问题。其次，通过该人机交互方法，解耦了终端对于交互任务链图设置，使终端侧专注于业务逻辑实现。再者，该人机交互方法对于模糊用户意图可进一步确认需求，提升了用户体验。

基于上述应用于人机交互***的人机交互方法，本申请实施例相应提供一种应用于人机交互***中的服务端的人机交互方法，参照图4，所述方法包括：

步骤S401：接收所述终端发送的针对所述终端获取的用户指令的意图识别请求，响应于所述意图识别请求，对所述用户指令进行意图识别，得到意图信息，将所述意图信息返回至所述终端；

步骤S402：接收所述终端发送的携带有所述意图信息的意图理解请求，响应于所述意图理解请求，判断所述意图信息是否为可执行的意图，若所述意图信息为可执行的意图，从预设的交互任务链图中确定所述意图信息的上下文信息，将所述意图信息的上下文信息返回至所述终端，以使所述终端根据所述意图信息的上下文信息，输出针对所述用户指令的反馈信息。

基于上述应用于人机交互***的人机交互方法，本申请实施例相应提供一种应用于人机交互***中的终端的人机交互方法，参照图5，所述方法包括：

步骤S501：获取用户指令，将针对所述用户指令的意图识别请求发送至所述服务端，以使所述服务端响应于所述意图识别请求，对所述用户指令进行意图识别，得到意图信息，并将所述意图信息返回至所述终端；

步骤S502：接收所述服务端返回的所述意图信息，将携带有所述意图信息的意图理解请求发送至所述服务端，以使所述服务端响应于所述意图理解请求，判断所述意图信息是否为可执行的意图，若所述意图信息为可执行的意图，从预设的交互任务链图中确定所述意图信息的上下文信息，并将所述意图信息的上下文信息返回至所述终端；

步骤S503：接收所述服务端返回的所述意图信息的上下文信息，根据所述意图信息的上下文信息，输出针对所述用户指令的反馈信息。

需要说明的是，对于本申请实施例提供的应用于人机交互***中的服务端的人机交互方法，以及应用于人机交互***中的终端的人机交互方法的详细描述，可以参考对本申请实施例中对应用于人机交互***的人机交互方法的相关描述，这里不再赘述。

与本申请实施例提供的应用于服务端的人机交互方法相对应的，本申请实施例还提供一种人机交互装置。如图6所示，所述装置600包括：

意图识别模块601，用于接收所述终端发送的针对所述终端获取的用户指令的意图识别请求，响应于所述意图识别请求，对所述用户指令进行意图识别，得到意图信息，将所述意图信息返回至所述终端；

意图理解模块602，用于接收所述终端发送的携带有所述意图信息的意图理解请求，响应于所述意图理解请求，判断所述意图信息是否为可执行的意图，若所述意图信息为可执行的意图，从预设的交互任务链图中确定所述意图信息的上下文信息，将所述意图信息的上下文信息返回至所述终端，以使所述终端根据所述意图信息的上下文信息，输出针对所述用户指令的反馈信息。

与本申请实施例提供的应用于终端的人机交互方法相对应的，本申请实施例还提供一种人机交互装置。如图7所示，所述装置700包括：

意图识别请求模块701，用于获取用户指令，将针对所述用户指令的意图识别请求发送至所述服务端，以使所述服务端响应于所述意图识别请求，对所述用户指令进行意图识别，得到意图信息，并将所述意图信息返回至所述终端；

意图理解请求模块702，用于接收所述服务端返回的所述意图信息，将携带有所述意图信息的意图理解请求发送至所述服务端，以使所述服务端响应于所述意图理解请求，判断所述意图信息是否为可执行的意图，若所述意图信息为可执行的意图，从预设的交互任务链图中确定所述意图信息的上下文信息，并将所述意图信息的上下文信息返回至所述终端；

反馈模块703，用于接收所述服务端返回的所述意图信息的上下文信息，根据所述意图信息的上下文信息，输出针对所述用户指令的反馈信息。

与本申请实施例提供的应用于人机交互***的人机交互方法相对应的，本申请实施例还提供一种人机交互***，如图1所示，所述人机交互***包括服务端和与所述服务端通信连接的终端；

本申请实施例还提供了一种服务机器人，用于实现上述人机交互方法中的终端所执行的步骤。

本申请实施例还提供了一种用于实现人机交互的电子设备。如图8所示，所述电子设备包括：处理器801；以及存储器802，用于存储人机交互方法的程序，该设备通电并通过所述处理器运行该人机交互方法的程序后，执行如下步骤：

或者，

与本申请实施例提供的人机交互方法相对应的，本申请实施例提供一种计算机可读存储介质，存储有人机交互方法的程序，该程序被处理器运行，执行下述步骤：

或者，

需要说明的是，对于本申请实施例提供的装置、***、电子设备及计算机可读存储介质的详细描述可以参考对本申请实施例中对方法的相关描述，这里不再赘述。

本申请虽然以较佳实施例公开如上，但其并不是用来限定本申请，任何本领域技术人员在不脱离本申请的精神和范围内，都可以做出可能的变动和修改，因此本申请的保护范围应当以本申请权利要求所界定的范围为准。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flashRAM)。内存是计算机可读介质的示例。

1、计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他属性的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储介质或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括非暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

2、本领域技术人员应明白，本申请的实施例可提供为方法、***或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

Claims

1.一种人机交互方法，其特征在于，应用于人机交互***中的服务端，所述人机交互***还包括与所述服务端通信连接的终端，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述判断所述意图信息是否为可执行的意图，包括：

在预设热词库中，对所述意图信息进行热词匹配；所述预设热词库基于从多个预设意图指令中所提取的热词构建得到；

当在所述预设热词库中针对所述意图信息匹配到目标热词时，确定所述意图信息为可执行的意图。

3.根据权利要求2所述的方法，其特征在于，所述在预设热词库中，对所述意图信息进行热词匹配，包括：

在预设热词库中，对所述意图信息进行热词精确匹配；

所述当在所述预设热词库中针对所述意图信息匹配到目标热词时，确定所述意图信息为可执行的意图，包括：

当在所述预设热词库中针对所述意图信息精确匹配到目标热词时，确定所述意图信息为可执行的明确意图。

4.根据权利要求2所述的方法，其特征在于，所述在预设热词库中，对所述意图信息进行热词匹配，包括：

在预设热词库中，对所述意图信息进行热词模糊匹配；

当在所述预设热词库中针对所述意图信息模糊匹配到目标热词时，确定所述意图信息为可执行的模糊意图。

5.根据权利要求3所述的方法，其特征在于，所述若所述意图信息为可执行的意图，从预设的交互任务链图中确定所述意图信息的上下文信息，包括：

若所述意图信息为可执行的明确意图，从预设的交互任务链图中确定所述意图信息所属的目标交互任务链，以及所述意图信息在所述目标交互任务链中所处的目标任务节点；

确定所述目标交互任务链中针对所述目标任务节点的后续响应操作；

所述将所述意图信息的上下文信息返回至所述终端，包括：

将携带有所述目标交互任务链的指示信息、所述目标任务节点的指示信息和所述后续响应操作的指示信息的第一上下文信息返回至所述终端，以使所述终端执行所述后续响应操作，以响应所述用户指令，并根据所述目标交互任务链和所述目标任务节点，生成针对所述用户指令进行答复的第一反馈信息，并输出所述第一反馈信息。

6.根据权利要求4所述的方法，其特征在于，所述若所述意图信息为可执行的意图，从预设的交互任务链图中确定所述意图信息的上下文信息，包括：

若所述意图信息为可执行的模糊意图，从预设的交互任务链图中确定所述意图信息所属的目标交互任务链，以及所述意图信息在所述目标交互任务链中所处的目标任务节点；

确定针对所述目标任务节点的再询问操作；

所述将所述意图信息的上下文信息返回至所述终端，包括：

将携带有所述目标交互任务链的指示信息、所述目标任务节点的指示信息和所述再询问操作的指示信息的第二上下文信息返回至所述终端，以使所述终端执行所述再询问操作，所述再询问操作用于根据所述目标交互任务链和所述目标任务节点，生成针对所述用户指令进行再询问的第二反馈信息，并输出所述第二反馈信息。

7.根据权利要求1所述的方法，其特征在于，所述接收所述终端发送的针对所述终端获取的用户指令的意图识别请求，包括：

对所述终端发送针对所述终端获取的用户指令的意图识别请求的第一事件进行监听；

当监听到所述第一事件时，接收所述意图识别请求；

所述将所述意图信息返回至所述终端，包括：

通过预先注册在所述服务端的第一回调函数，将所述意图信息返回至所述终端。

8.根据权利要求1所述的方法，其特征在于，所述接收所述终端发送的携带有所述意图信息的意图理解请求，包括：

对所述终端发送携带有所述意图信息的意图理解请求的第二事件进行监听；

当监听到所述第二事件时，接收所述意图识别请求；

所述将所述意图信息的上下文信息返回至所述终端，包括：

通过预先注册在所述服务端的第二回调函数，将所述意图信息的上下文信息返回至所述终端。

9.根据权利要求1所述的方法，其特征在于，所述接收所述终端发送的针对所述终端获取的用户指令的意图识别请求之前，还包括：

接收所述终端发送的携带有所述终端获取的语音格式的用户指令的指令解析请求，响应于所述指令解析请求，将语音格式的所述用户指令解析为文本格式的所述用户指令，将文本格式的所述用户指令返回至所述终端；

所述接收所述终端发送的针对所述终端获取的用户指令的意图识别请求，响应于所述意图识别请求，对所述用户指令进行意图识别，得到意图信息，将所述意图信息返回至所述终端，包括：

接收所述终端发送的携带有文本格式的所述用户指令的意图识别请求，响应于所述意图识别请求，对文本格式的所述用户指令进行意图识别，得到意图信息，并将所述意图信息返回至所述终端。

10.根据权利要求9所述的方法，其特征在于，所述响应于所述指令解析请求，将语音格式的所述用户指令解析为文本格式的所述用户指令(权9)，包括：

对所述指令解析请求进行用户鉴权，当鉴权通过时，响应于所述指令解析请求，将语音格式的所述用户指令解析为文本格式的所述用户指令；

所述响应于所述意图识别请求，对所述用户指令进行意图识别，得到意图信息，包括：

对所述意图识别请求进行用户鉴权，当鉴权通过时，响应于所述意图识别请求，对所述用户指令进行意图识别，得到意图信息；

所述响应于所述意图理解请求，判断所述意图信息是否为可执行的意图，包括：

对所述意图理解请求进行用户鉴权，当鉴权通过时，响应于所述意图理解请求，判断所述意图信息是否为可执行的意图。

11.一种人机交互方法，其特征在于，应用于人机交互***中的终端，所述人机交互***还包括与所述终端通信连接的服务端，所述方法包括：

12.根据权利要求11所述的方法，其特征在于，所述接收所述服务端返回的所述意图信息的上下文信息，根据所述意图信息的上下文信息，输出针对所述用户指令的反馈信息，包括：

接收所述服务端返回的携带有所述意图信息所属的目标交互任务链的指示信息、所述意图信息在所述目标交互任务链中所处的目标任务节点的指示信息，以及所述目标交互任务链中针对所述目标任务节点的后续响应操作的指示信息的第一上下文信息；

执行所述后续响应操作，以响应所述用户指令；

根据所述目标交互任务链和所述目标任务节点，生成针对所述用户指令进行答复的第一反馈信息，并输出所述第一反馈信息；

其中，所述第一上下文信息为在所述意图信息为可执行的明确意图的情况下，所述服务端从预设的交互任务链图中确定所述意图信息所属的目标交互任务链，以及所述意图信息在所述目标交互任务链中所处的目标任务节点，确定所述目标交互任务链中针对所述目标任务节点的后续响应操作，并根据所述目标交互任务链的指示信息、所述目标任务节点的指示信息和所述后续响应操作的指示信息生成得到。

13.根据权利要求11所述的方法，其特征在于，所述接收所述服务端返回的所述意图信息的上下文信息，根据所述意图信息的上下文信息，输出针对所述用户指令的反馈信息，包括：

接收所述服务端返回的携带有所述意图信息所属的目标交互任务链的指示信息、所述意图信息在所述目标交互任务链中所处的目标任务节点的指示信息，以及针对所述目标任务节点的再询问操作的指示信息的所述第二上下文信息；

执行所述再询问操作；所述再询问操作用于根据所述目标交互任务链和所述目标任务节点，生成针对所述用户指令进行再询问的第二反馈信息，并输出所述第二反馈信息；

其中，所述第二上下文信息为在所述意图信息为可执行的模糊意图的情况下，所述服务端从预设的交互任务链图中确定所述意图信息所属的目标交互任务链，以及所述意图信息在所述目标交互任务链中所处的目标任务节点，确定针对所述目标任务节点的再询问操作，并根据所述目标交互任务链的指示信息、所述目标任务节点的指示信息和所述再询问操作的指示信息生成得到。

14.根据权利要求11所述的方法，其特征在于，所述获取用户指令，将针对所述用户指令的意图识别请求发送至所述服务端，以使所述服务端响应于所述意图识别请求，对所述用户指令进行意图识别，得到意图信息，并将所述意图信息返回至所述终端，包括：

获取语音格式的用户指令，将携带有语音格式的所述用户指令的指令解析请求发送至所述服务端，以使所述服务端响应于所述指令解析请求，将语音格式的所述用户指令解析为文本格式的所述用户指令，并将文本格式的所述用户指令返回至所述终端；

接收所述服务端返回的文本格式的所述用户指令，将携带有文本格式的所述用户指令的意图识别请求发送至所述服务端，以使所述服务端响应于所述意图识别请求，对文本格式的所述用户指令进行意图识别，得到意图信息，并将所述意图信息返回至所述终端。

15.一种人机交互方法，其特征在于，应用于人机交互***，所述人机交互***包括终端，以及与所述终端通信连接的服务端，所述方法包括：

16.一种人机交互装置，其特征在于，应用于人机交互***中的服务端，所述人机交互***还包括与所述服务端通信连接的终端，所述装置包括：

17.一种人机交互装置，其特征在于，应用于人机交互***中的终端，所述人机交互***还包括与所述终端通信连接的服务端，所述装置包括：

18.一种人机交互***，其特征在于，所述人机交互***包括服务端和与所述服务端通信连接的终端；

19.根据权利要求18所述的人机交互***，其特征在于，所述终端为服务机器人。

20.根据权利要求19所述的人机交互***，其特征在于，所述服务机器人包括按摩机器人。

21.根据权利要求18所述的人机交互***，其特征在于，所述终端与所述服务端基于超文本传输协议协议通信连接。

22.根据权利要求18所述的人机交互***，其特征在于，所述服务端为云服务端。

23.一种服务机器人，其特征在于，用于实现权利要求1-15中任一项所述的方法中的终端所执行的步骤。

24.根据权利要求23所述的服务机器人，其特征在于，所述服务机器人包括按摩机器人。

25.一种电子设备，其特征在于，包括：

处理器；以及

存储器，用于存储程序，该电子设备通电并通过所述处理器运行该程序后，执行如权利要求1-10或者权利要求11-14中任一项所述的方法。

26.一种计算机可读存储介质，其特征在于，存储有程序，该程序被处理器运行，执行如权利要求1-10或者权利要求11-14中任一项所述的方法。