CN112528002B

CN112528002B - 对话识别方法、装置、电子设备和存储介质

Info

Publication number: CN112528002B
Application number: CN202011545960.8A
Authority: CN
Inventors: 王猛; 赵筱军; 黄庆伟
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2020-12-23
Filing date: 2020-12-23
Publication date: 2023-07-18
Anticipated expiration: 2040-12-23
Also published as: CN112528002A

Abstract

本申请公开了一种对话识别方法、装置、电子设备和存储介质，涉及自然语言处理NLP领域。实现方案为：获取至少一轮对话中的目标对话，并确定从至少一轮对话中待识别出的目标问题集合；对目标对话进行实体词识别，得到目标对话中的多个实体词并存储；将目标问题集合中各问题分别与存储的多个实体词匹配，以确定各问题对应的实体词；根据各问题对应的实体词，确定各问题的答案。由此，当用户在一轮对话中回答多个问题的情况下，***即可自动识别出各问题的答案，可以减少不必要的交互次数，改善用户的使用体验。

Description

对话识别方法、装置、电子设备和存储介质

技术领域

本申请涉及NLP(Natural Language Processing，自然语言处理)等AI(Artificial Intelligence，人工智能)技术领域，具体地，本申请提供了一种对话识别方法、装置、电子设备和存储介质。

背景技术

随着人类社会信息化的不断演进以及人工服务成本的不断上升，人们越来越希望通过自然语言与计算机进行交流，人机对话***成为这样的历史背景下诞生的产物。借助人机对话***，人类可以使用自然语言与机器进行对话，并通过对话来指挥或者咨询计算机，以完成特定的操作，比如指挥智能硬件完成短信读取和回复、查询天气、租车、订票、安排行程等。

发明内容

本申请提供了一种用于对话识别方法、装置、电子设备和存储介质。

根据本申请的一方面，提供了一种对话识别方法，包括：

获取至少一轮对话中的目标对话，以及确定从所述至少一轮对话中待识别出的目标问题集合；

对所述目标对话进行实体词识别，得到所述目标对话中的多个实体词并存储；

将所述目标问题集合中各问题分别与存储的多个实体词匹配，以确定各所述问题对应的实体词；

根据各所述问题对应的实体词，确定各所述问题的答案。

根据本申请的另一方面，提供了一种对话识别装置，包括：

对话获取模块，用于获取至少一轮对话中的目标对话；

集合确定模块，用于确定从所述至少一轮对话中待识别出的目标问题集合；

识别模块，用于对所述目标对话进行实体词识别，得到所述目标对话中的多个实体词并存储；

匹配模块，用于将所述目标问题集合中各问题分别与存储的多个实体词匹配，以确定各所述问题对应的实体词；

答案确定模块，用于根据各所述问题对应的实体词，确定各所述问题的答案。

根据本申请的又一方面，提供了一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行本申请上述实施例提出的对话识别方法。

根据本申请的再一方面，提供了一种计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行本申请上述实施例提出的对话识别方法。

根据本申请的还一方面，提供了一种计算机程序产品，当所述计算机程序产品中的指令被处理器执行时，执行如本申请上述实施例提出的对话识别方法。

应当理解，本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征，也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本申请的限定。其中：

图1为一个局部连续的实体收集单元集合流程配置示意图；

图2为本申请实施例一所提供的对话识别方法的流程示意图；

图3为本申请实施例二所提供的对话识别方法的流程示意图；

图4为本申请实施例三所提供的对话识别方法的流程示意图；

图5为本申请实施例四所提供的对话识别方法的流程示意图；

图6为本申请实施例五所提供的对话识别装置的结构示意图；

图7示出了可以用来实施本申请的实施例的示例电子设备的示意性框图。

具体实施方式

以下结合附图对本申请的示范性实施例做出说明，其中包括本申请实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本申请的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

随着自然语言处理技术的不断发展，多轮对话技术越来越多地应用在智能客服、智能外呼等场景中，在提升客户服务效率的同时，大大降低了企业的成本。

目前，多轮对话***是基于槽位填充法(简称为填槽法)或者填槽法的改进版，根据对话树的一系列流程节点跳转控制来实现多轮对话，对于实体词的收集，是按照固定次序的业务流程来完成对话的交互。然而，在实际对话过程中，用户对于实体词收集的表述回复，是很容易根据对话习惯携带一些其他实体词信息作为对话的随路信息的，且这些随路信息之间往往是随机乱序的。比如，在租车场景，人机对话***预先设置的实体词收集流程依次是询问地点、车型、时间三个实体属性，在收集第一个实体词时，用户很可能会根据当前对话的上下文，对后续收集节点要收集的实体词做出预判并携带预判的实体词，或经过几次完整的对话交互可能已经潜意识里记下了后续将要被收集的一些实体词。举例而言，人机交互***发出提问：“请问要在哪租车？”用户回复：“在***我租大型车”或“明天在***我租大型车”。

然而，现有的人机对话***在一轮对话中只能识别一个问题，例如只能识别上述例子中的“北京”，而无法识别时间(“明天”)和车型(“大型车”)这两个实体词，这种方式下，即使用户在一个问题里携带了其他实体词(比如明天、大型车)，人机对话***也无法识别，从而只能按照固定次序的业务流程来完成多轮对话交互，来识别所有的实体词。

也就是说，现有技术中，一轮对话只能识别一个问题，无法适用于用户在一轮对话中同时回答多个问题的情况，增加了用户的交互次数，降低了用户的使用体验。

因此，本申请主要针对现有技术中，一轮对话只能识别一个问题，无法适用于用户在一轮对话中同时回答多个问题的情况，增加了用户的交互次数，降低了用户的使用体验的技术问题，提出一种对话识别方法。

本申请实施例的对话识别方法，通过获取至少一轮对话中的目标对话，并确定从至少一轮对话中待识别出的目标问题集合；对目标对话进行实体词识别，得到目标对话中的多个实体词并存储；将目标问题集合中各问题分别与存储的多个实体词匹配，以确定各问题对应的实体词；根据各问题对应的实体词，确定各问题的答案。由此，当用户在一轮对话中回答多个问题的情况下，***即可自动识别出各问题的答案，可以减少不必要的交互次数，改善用户的使用体验。

下面参考附图描述本申请实施例的对话识别方法、装置、电子设备和存储介质。在具体描述本发明实施例之前，为了便于理解，首先对常用技术词进行介绍：

意图，是指用户要完成的一个业务操作，比如租车、查询天气、订票等，意图类似于代码中的函数。其中，意图可以区分为顶层意图和子意图，顶层意图是在对话过程中可以随时触发的意图，子意图只有在对应的场景中时才能被触发。

场景，由一个意图以及在该意图下所有的对话交互(比如收集实体词，澄清，确认，子意图等)构成，只有当用户表述了新的意图或者结束对话时，才切换场景或者结束场景。

实体词，是指完成业务动作需要的参数，比如时间、地点、车型等，实体词类似于函数中的参数，一个意图加上多个实体词可以完成一个业务的办理。

会话，同一用户在某个时间段内与人机对话***的一系列对话即为一个会话，如电话客服中的一个电话。

对话，用户与人机对话***的一问一答即为一轮对话，即一轮对话中包括一个问题以及该问题相应的答案或作答。

实体收集单元，是指完成对话过程中的一个实体词收集流程所需的节点配置。实体收集单元一般由一个父节点和两个子节点组成，其中，父节点和子节点是对话树中的节点，父节点用于作为节点选择进入条件判断待收集实体词是否被对话上下文收集过，在未被对话上下文收集过的情况下，则第一个子节点判断用户表述的内容是否包含实体词，在包含实体词的情况下，在上下文中变量赋值完成收集，在未包含实体词的情况下，执行第二个子节点，会再次跳转至父节点重新发起实体词收集，整个收集流程由三个节点组成，为一个闭环，直到实体词收集完成。

实体收集单元集合，由实体收集单元组成。其中，实体收集单元集合包含多个连续的实体收集单元，即实体收集单元集合所包含的连续的实体收集单元的个数需大于1。例如，参见图1，图1为一个局部连续的实体收集单元集合流程配置示意图。假设从左数第四个实体收集单元为非法的实体收集单元，那么从左数第一个、第二个、第三个实体收集单元就组成了一个实体收集单元集合，只有在同一个实体收集单元集合内，对话过程中记忆里暂存的实体词信息对当前实体收集单元集合里要收集的实体词而言才是有效可用的，而不同的实体收集单元集合之间的记忆是独立的。

其中，对话树按父子关系分层，图1中的顶层节点是指对话树的第一个父节点。

举例而言，实体收集单元集合1应用于租车场景，则该实体收集单元集合1可以对租车场景中各对话中的实体词进行识别，实体收集单元集合2应用于查询天气场景，则该实体收集单元集合2可以对查询天气场景中各对话中的实体词进行识别。该实体收集单元集合1和实体收集单元集合2之间的记忆是独立的，记忆里暂存的实体词是互不影响的。

实体收集单元探测器，用于探寻当前节点所在层是否存在合法的实体收集单元集合，在不存在合法的实体收集单元集合时，则停止探测，每次探测结束会保存探测到的实体收集单元集合，以及探测过的节点轨迹信息。

其中，实体收集单元集合的合法性，可以通过根据实体收集单元集合所包含的连续的实体收集单元个数确定，当实体收集单元集合所包含的连续的实体收集单元个数大于1时，则确定该实体收集单元集合合法，而当收集单元集合所包含的连续的实体收集单元个数小于或者等于1时，则确定该实体收集单元集合非法。

如图1所示，一个完整的探测过程为，从左数第一个实体收集单元开始往右进行探测，由于左数第四个实体收集单元是一个非法的实体收集单元结构，因此第一轮探测结果是左数第一个、左数第二个、左数第三个实体收集单元组成的实体收集单元集合，记录该实体收集单元集合信息以及探测轨迹节点信息，第二轮从左数第五个实体收集单元开始探测，由于只有一个合法的实体收集单元，不满足连续个数大于1，因此第二轮没有探测到实体收集单元集合，仅记录下探测轨迹节点信息。

其中，左数第一个、左数第二个、左数第三个实体收集单元组成的实体收集单元集合在收集实体词时，支持实体词的智能收集，左数第五个实体收集单元(没有组成连续且个数大于1的实体收集单元集合)是不支持实体词智能收集的。并且，左数第五个实体收集单元在收集实体词时是不会用到左数第一个、左数第二个、左数第三个实体收集单元所组成的实体收集单元集合的对话域内记忆里暂存的实体词信息的。

图2为本申请实施例一所提供的对话识别方法的流程示意图。

本申请实施例以该对话识别方法被配置于对话识别装置中来举例说明，该对话识别装置可以应用于任一电子设备中，以使该电子设备可以执行对话识别功能。

其中，电子设备可以为任一具有计算能力的设备，例如可以为PC(PersonalComputer，个人电脑)、移动终端、服务器等，移动终端例如可以为手机、平板电脑、个人数字助理、穿戴式设备、车载设备、机器人等具有各种操作***、触摸屏和/或显示屏的硬件设备。

如图2所示，该对话识别方法可以包括以下步骤：

步骤201，获取至少一轮对话中的目标对话，以及确定从至少一轮对话中待识别出的目标问题集合。

本申请实施例中，目标问题集合与用户所办理的业务相关。比如，当用户租车时，目标问题集合包含与租车相关的各个问题，比如该目标问题集合可以为{“请问要在哪租车？”，“请问要租什么车型的车？”，“请问在什么时候租车？”}。或者，当用户查询天气时，目标问题集合包含与查询天气相关的各个问题，比如该目标问题集合可以为{“请问要查哪里的天气？”，“请问要查什么时候的天气？”}。或者，当用户订票时，比如航班预订，目标问题集合可以为{“您要预定哪天的航班？”，“您的出发时间？”，“您的出发城市？”，“您的到达城市？”}。

应当理解的是，为了识别用户的意图，从而执行与用户意图匹配的操作，本申请实施例中，目标对话可以包含用户在当前会话中已作出回答的各个对话。举例而言，当人机交互***提出的问题为“请问要在哪租车？”，用户的回答为：“明天在***我租大型车”，则获取的仅为一轮对话，对话上文为“请问要在哪租车？”，对话下文为“明天在***我租大型车”。

当目标对话为包含用户在当前会话中已作出回答的各个对话时，目标问题集合即为包含目标对话中的问题所对应的问题集合。

在本申请实施例的一种可能的实现方式中，可以识别用户意图，根据用户意图，确定目标问题集合。并根据目标问题集合中的各问题，按序向用户提问，将包含用户的回答的各个对话，作为目标对话。

一种示例，人机交互***界面上可以显示有各个业务办理控件，比如租车、查询天气、购票等控件，从而用户可以通过触发相应的控件，进入对应的业务办理页面，人机交互***可以基于相应的业务，确定用户意图，根据用户意图，确定目标问题集合，并基于目标问题集合中的各个问题，按序向用户提问，从而用户可以做出回答，将包含用户的回答的各个对话，作为目标对话。

另一种示例，用户可以直接输入待办理的业务(比如租车、查询天气、购票等)，其中，输入方式包括但不限于触摸输入(如滑动、点击等)、键盘输入、语音输入等，从而可以根据用户输入的业务，识别用户意图，根据用户意图，确定目标问题集合，并基于目标问题集合中的各个问题，按序向用户提问，从而用户可以做出回答，将包含用户的回答的各个对话，作为目标对话。

其中，可以基于AI领域的NLP技术中的语义分析技术，识别用户意图，或者，还可以基于NLP技术中的模版匹配、文本分类等方法，识别用户意图，本申请对此并不作限制。

其中，AI是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科，既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术；人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。

在本申请实施例的另一种可能的实现方式中，还可以按照设定规则，从多个问题集合中抽取一个问题集合，作为目标问题集合，并根据目标问题集合中的各问题，按序向用户提问，将包含用户的回答的各个对话，作为目标对话。

举例而言，以设定规则为按序进行示例，人机交互***中共有N个问题集合，可以首先选取一个问题集合，比如选取第一个问题集合，或者可以随机选取一个问题集合，并根据选取的问题集合中的各问题，按序向用户提问。当用户回答m个问题后，假设当前选取的问题集合为第t个问题集合，则可以将第t个问题集合作为目标问题集合，并根据目标问题集合中的各问题，按序向用户提问，将包含用户的回答的各个对话，作为目标对话。

再例如，以设定规则为场景之间的相关性进行示例，根据用户意图确定上一个场景为订票场景，订票之后可能涉及当地的旅游、租车、住宿等，则当前场景可以为租车、住宿等场景，在确定当前场景后，可以直接确定与该当前场景对应的目标问题集合，比如可以根据该当前场景对应的意图，确定目标问题集合，从而可以根据目标问题集合中的各问题，按序向用户提问，将包含用户的回答的各个对话，作为目标对话。

步骤202，对目标对话进行实体词识别，得到目标对话中的多个实体词并存储。

本申请实施例中，可以对目标对话进行实体词识别，得到目标对话中的多个实体词，并将多个实体词进行存储。

例如，可以基于NLP技术中的关键词匹配、模版匹配、统计模型等方法，对目标对话进行实体词识别，以得到目标对话中的多个实体词。需要说明的是，上述实体词识别方法仅是示例性实施例，但不限于此，还包括本领域已知的其他实体词识别方法，只要能够得到目标对话中的实体词即可，即本申请对实体词的识别方法并不做限制。

步骤203，将目标问题集合中各问题分别与存储的多个实体词匹配，以确定各问题对应的实体词。

本申请实施例中，在得到目标对话中的多个实体词后，可以将目标问题集合中的各问题，分别与目标对话中的多个实体词进行匹配，以确定各问题对应的实体词。

作为一种应用场景，当该对话识别方法应用于租车场景时，待识别出的目标问题集合为：{“请问要在哪租车？”，“请问要租什么车型的车？”，“请问在什么时候租车？”}，在第一轮对话中，人机对话***发出的提问为：“请问要在哪租车？”，假设用户的回答为：“明天在***我租大型车”，因此，可以确定问题1(“请问要在哪租车？”)对应的实体词为“北京”，问题2(“请问要租什么车型的车？”)对应的实体词为“大型车”，问题3(“请问在什么时候租车？”)对应的实体词可以为“明天”。

步骤204，根据各问题对应的实体词，确定各问题的答案。

本申请实施例中，在确定各问题对应的实体词后，可以根据各问题对应的实体词，确定各问题的答案。比如，可以基于槽位填充法，将实体词填入到相应的槽位，以得到对应问题的答案。

仍以上述例子示例，可以得到问题1的答案为：“在北京租车”、问题2对应的答案为“租大型车”、问题3对应的答案为“租车时间为明天”。从而人机对话***可以根据各问题对应的答案，执行相应的业务操作，帮用户在北京租大型车，租车时间为明天。由此，当用户在一轮对话中回答多个问题的情况下，人机交互***可自动识别出各问题的答案，可以减少不必要的交互次数，提升用户办理业务的效率，改善用户的使用体验。

本申请实施例的对话识别***，通过获取至少一轮对话中的目标对话，并确定从至少一轮对话中待识别出的目标问题集合；对目标对话进行实体词识别，得到目标对话中的多个实体词并存储；将目标问题集合中各问题分别与存储的多个实体词匹配，以确定各问题对应的实体词；根据各问题对应的实体词，确定各问题的答案。由此，当用户在一轮对话中回答多个问题的情况下，***即可自动识别出各问题的答案，可以减少不必要的交互次数，改善用户的使用体验。

在本申请实施例的一种可能的实现方式中，可以通过实体收集单元，对目标对话中的实体词进行识别，以确定各问题对应的实体词。下面结合实施二，对上述过程进行详细说明。

图3为本申请实施例二所提供的对话识别方法的流程示意图。

如图3所示，该对话识别方法可以包括以下步骤：

步骤301，获取至少一轮对话中的目标对话。

步骤301的执行过程可以参见上述实施例中步骤201的执行过程，在此不做赘述。

步骤302，根据设定规则，从至少一轮对话对应的多个实体收集单元集合中，确定目标实体收集单元集合；其中，目标实体收集单元集合中包含一个或多个与目标问题集合中的问题对应的实体收集单元，用于识别与对应问题匹配的实体词。

本申请实施例中，设定规则为预先设置的，比如该设定规则可以为按序，或者，该设定规则可以为其他，本申请对此并不作限制。

本申请实施例中，可以通过多个实体收集单元集合，对对话过程中的实体词进行收集或识别，因此，在获取至少一轮对话后，可以先确定该至少一轮对话对应的多个实体收集单元集合，并基于设定规则，从至少一轮对话对应的多个实体收集单元集合中，确定目标实体收集单元集合，其中，目标实体收集单元集合中可以包含一个或多个与目标问题集合中的问题对应的实体收集单元，各实体收集单元，用于识别与对应问题匹配的实体词。

举例而言，以设定规则为按序进行示例，假设至少一轮对话对应的多个实体收集单元集合分别为实体收集单元集合1、实体收集单元集合2、实体收集单元集合3。假设当前场景为订票，后续场景可以讨论到当地租车、住宿、旅游，因此，可以根据实体收集单元集合1中的各实体收集单元对当前场景中的对话进行实体词识别，后续可利用实体收集单元集合2中的各实体收集单元对租车场景中的对话进行实体词识别、利用实体收集单元集合3中的各实体收集单元对住宿场景中的对话进行实体词识别。

需要说明的是，上述仅以设定规则为按序进行示例，本申请并不限于此，例如，设定规则还可以与用户意图相关，比如，可以通过实体收集单元集合1中的各实体收集单元对订票场景的对话进行实体词识别，通过实体收集单元集合2中的各实体收集单元对租车场景的对话进行实体词识别，通过实体收集单元集合3中的各实体收集单元对住宿场景的对话进行实体词识别、通过实体收集单元集合4中的各实体收集单元对查询天气场景的对话进行实体词识别。假设对至少一轮对话进行意图识别，确定该对话的意图为租车，则目标实体收集单元集合可以为实体收集单元集合2，因此，可以通过该实体收集单元集合2中的各实体收集单元对租车场景中的对话进行实体词识别。

本申请实施例中，采用目标实体收集单元集合中包含的一个或多个与目标问题集合中的问题对应的实体收集单元，识别与对应问题匹配的实体词。由于实体收集单元已配置完成对话过程中的一个实体词收集流程所需的节点，因此，基于各实体收集单元识别对应问题匹配的实体词，可以提升实体词识别结果的准确性。

步骤303，对目标对话进行实体词识别，得到目标对话中的多个实体词并存储。

步骤303的执行过程可以参见上述实施例中步骤202的执行过程，在此不做赘述。

步骤304，采用目标实体收集单元集合中的各实体收集单元，依次对目标对话中的多个实体词进行识别，以得到各实体收集单元对应问题所匹配的实体词。

本申请实施例中，当目标实体收集单元集合中包含多个实体收集单元时，可以采用目标实体收集单元集合中的各实体收集单元，依次对目标对话中的多个实体词进行识别，以得到各实体收集单元对应问题所匹配的实体词。

步骤305，根据各问题对应的实体词，确定各问题的答案。

步骤305的执行过程可以参见上述实施例中步骤204的执行过程，在此不做赘述。

本申请实施例中，由于实体收集单元已配置完成对话过程中的一个实体词收集流程所需的节点，因此，基于各实体收集单元识别对应问题所匹配的实体词，可以提升实体词识别结果的准确性。

在本申请实施例的一种可能的实现方式中，当目标实体收集单元集合中的各实体收集单元均识别完毕时，可以停止采用目标实体收集单元集合进行识别，或者，在存在未识别到匹配实体词的实体收集单元时，可以停止采用目标实体收集单元集合进行识别。由此，在识别得到目标对话中已包含的实体词后，停止采用目标实体收集单元集合继续识别，可以降低***的处理压力。

可以理解的是，当存在未识别到匹配实体词的实体收集单元时，表明用户未回答完目标问题集合中的所有问题，此时，无法帮助用户完成相应的业务，因此，作为本申请实施例的一种可能的实现方式，在存在未识别到匹配实体词的实体收集单元的情况下，还可以从至少一轮对话中，获取目标对话的下文，对下文中的实体词进行识别并存储，并采用目标实体收集单元集合，对存储的各实体词继续进行识别，直至目标实体收集单元集合中所有的实体收集单元均识别得到对应问题所匹配的实体词。

下面结合实施例三，对上述过程进行详细说明。

图4为本申请实施例三所提供的对话识别方法的流程示意图。

如图4所示，该对话识别方法可以包括以下步骤：

步骤401，获取至少一轮对话中的目标对话。

步骤402，根据设定规则，从至少一轮对话对应的多个实体收集单元集合中，确定目标实体收集单元集合；其中，目标实体收集单元集合中包含一个或多个与目标问题集合中的问题对应的实体收集单元，用于识别与对应问题匹配的实体词。

步骤403，对目标对话进行实体词识别，得到目标对话中的多个实体词并存储。

步骤404，采用目标实体收集单元集合中的各实体收集单元，依次对目标对话中的多个实体词进行识别，以得到各实体收集单元对应问题所匹配的实体词。

步骤401至404的执行过程可以参见上述实施例的执行过程，在此不做赘述。

步骤405，在存在未识别到匹配实体词的实体收集单元的情况下，停止采用目标实体收集单元集合进行识别。

举例而言，当前场景为租车场景，该目标问题集合为{“请问要在哪租车？”，“请问要租什么车型的车？”，“请问在什么时候租车？”}当人机交互***提出的问题为“请问要在哪租车？”，用户的回答为：“在***我租大型车”，可以确定问题1(“请问要在哪租车？”)对应的实体词为“北京”，问题2(“请问要租什么车型的车？”)对应的实体词为“大型车”，问题3(“请问在什么时候租车？”)未识别得到实体词。因此，可以停止采用该目标实体收集单元对目标对话进行识别。

步骤406，从至少一轮对话中，获取目标对话的下文。

可以理解的是，当存在未识别到匹配实体词的实体收集单元时，表明用户未回答完目标问题集合中的所有问题，此时，无法帮助用户完成相应的业务，因此，作为本申请实施例的一种可能的实现方式，在存在未识别到匹配实体词的实体收集单元的情况下，还可以从至少一轮对话中，获取目标对话的下文。

步骤407，对下文中的实体词进行存储。

本申请实施例中，可以对下文进行实体词识别，并对识别得到的实体词进行存储。

步骤408，采用目标实体收集单元集合，对存储的各实体词继续进行识别。

本申请实施例中，可以采用目标实体收集单元集合，对存储的各实体词继续进行识别，即采用目标实体收集单元集合中的各实体收集单元，依次对存储的各实体词进行识别，以得到各实体收集单元对应问题所匹配的实体词。由此，可以识别得到目标问题集合中各问题所匹配的实体词，从而后续可确定各问题的答案，以帮助用户准确办理相应的业务。

仍以上述示例，当人机交互***在目标对话的下文提出的问题为“请问在什么时候租车？”，用户的回答为：“明天”，则采用目标实体收集单元集合，对存储的各实体词继续进行识别，可以确定问题3对应的实体词为“明天”。

步骤409，根据各问题对应的实体词，确定各问题的答案。

步骤409的执行过程可以参见上述实施例的执行过程，在此不做赘述。

在本申请实施例的一种可能的实现方式中，当目标实体收集单元集合中各实体收集单元均识别到匹配实体词的情况下，可以删除存储的多个实体词。由此，当识别得到各问题匹配的实体词时，删除存储的多个实体词，一方面，可以降低存储资源的占用，另一方面，还可以采用目标实体收集单元对其他对话进行识别，删除存储的多个实体词，可以避免影响其他对话的识别结果。

举例而言，订票场景会涉及时间的识别，而住宿、租车场景也会涉及时间的识别，假设目标对话的场景为订票场景，存储的实体词可包含时间，当识别得到目标问题集合中各问题匹配的实体词后，若不删除存储的多个实体词，将发生在住宿场景或租车场景中，对话中未存在时间这个实体词时，而将存储的时间，作为目标实体收集单元集合识别得到的实体词，将造成误判的情况，严重降低了用户的使用体验。

例如，订票场景存储的实体词为：订票时间、出发时间、出发城市、到达城市，在租车场景中识别得到的实体词为：租车地点、车型，若不将订票场景存储的实体词进行删除，则将发生将订票场景中的“出发时间”识别为租车场景中的“租车时间”，显然，这种识别结果是不正确的，因此，可以在目标实体收集单元集合中各实体收集单元均识别到匹配实体词的情况下，删除存储的多个实体词，一方面，可以提升识别结果的准确性，另一方面，还可以降低存储资源的占用。

作为一种示例，参见图5，图5为本申请实施例四所提供的对话识别方法的流程示意图。

1、用户可以输入查询语句(query)，其中，输入方式包括但不限于触摸输入、键盘输入、语音输入等；

2、人机交互***可以对query进行意图识别以及实体词识别；

3、进入与用户意图匹配的场景，比如订票场景、租车场景等；

4、判断实体词识别结果是否为空，在实体词识别结果为空的情况下，表明此轮对话未识别得到实体词，因此，直接结束，执行当前对话节点对应的处理流程；而在实体词识别结果不为空的情况下，则执行步骤5；

5、判断当前对话节点是否被实体收集探测器探测过，在未被实体收集探测器探测过的情况下，则启动实体收集探测器，利用该实体收集探测器探寻当前对话节点所在层是否存在合法的实体收集单元集合，并将探测结果暂存，并继续执行步骤6；而在被实体收集探测器探测过的情况下，不做任何处理，并继续执行步骤6；

6、判断当前对话节点是否属于实体收集探测器探测到的实体收集单元集合中某个实体收集单元中的节点，在不属于的情况下，表明当前对话节点不符合实体收集单元配置规则，不能进行实体智能收集，此轮对话实体词智能收集提前结束，执行当前对话节点对应处理流程；在属于的情况下，基于当前场景选择性的暂存此轮实体词的全部识别结果，比如当存在实体词缠绕的情况下，比如手机号和数字实体词发生缠绕，此时，需要将发生缠绕的实体词进行独立收集，不会将发生缠绕的实体词暂存，是一个选择性的记忆暂存过程，继续执行步骤7；

7、判断当前对话节点对应的实体收集单元是否存在，且步骤6中记忆里暂存的实体词中是否包含当前存在的实体收集单元需要收集的实体词；

在上述两个条件均满足的情况下，则执行当前实体收集单元的实体词收集，并将当前实体收集单元指向步骤5中实体收集探测器探测到的实体收集单元集合中的下一个实体收集单元，继续执行步骤7，以进行下一个实体收集单元的实体词收集过程，直到不满足步骤7的条件。而在上述两个条件未同时满足的情况下，继续执行步骤8；

8、判断步骤5中实体收集探测器探测到的实体收集单元集合在步骤7中是否全部完成实体词收集；在全部完成实体词收集的情况下，则清空步骤6中所有暂存的实体词，此时步骤5中探测的实体收集单元集合全部收集完成，暂存记忆的实体词信息已经没有意义，因此可以对其进行清空，实体词智能收集全部结束，回复对应对话节点的答案；而在实体收集单元集合存在未完成实体词收集的实体收集单元，则此轮对话实体词智能收集结束，回复对应对话节点的答案。

由此，在多轮对话的某个场景中，可以支持连续多个实体词的自动收集，实体词智能收集的过程中，具备了对对话做到灵活的短期记忆能力，以在对话中捕捉更多的有效对话信息，实体词智能收集具备的这种在对话过程中带有的记忆能力，有效地减少了不必要的交互次数，在提升对话能力的智能性和拟人性的同时，提升了用户办理业务的效率和体验效果。

需要说明的是，现有技术中，可以通过复杂的配置来实现实体词的智能收集，比如，在每个收集节点通过将后续要收集的实体以“隐藏埋点”的方式提前植入，以预收集的手段达到目的。例如，在收集地点的同时，判断是否存在可收集的车型和时间实体词，在存在的情况下，就提前收集，下个收集节点以此类推。

然而，上述实体词收集方式，引入了额外的配置成本，并且过于臃肿复杂的配置不利于扩展维护，甚至可能会出现配置出错的情况，此外，也不能零成本迁移，原因为每个场景的对话流程配置和信息收集需求都是不一样的。

而本申请中，无需引入额外复杂的配置流程，降低了使用门槛，有效的自动规避了传统配置方式存在的潜在不可控风险。并且，本申请的对话处理方法，不是基于某个业务场景定制开发的方案，是对对话***中这一类型需求的抽象统一解决方案，可以零成本地迁移到其他场景，降低了多轮对话***满足此类需求的构建成本。

与上述图1至图4实施例提供的对话识别方法相对应，本申请还提供一种对话识别装置，由于本申请实施例提供的对话识别装置与上述图1至图4实施例提供的对话识别方法相对应，因此在对话识别方法的实施方式也适用于本申请实施例提供的对话识别装置，在本申请实施例中不再详细描述。

图6为本申请实施例五所提供的对话识别装置的结构示意图。

如图6所示，该对话识别装置600包括：对话获取模块610、集合确定模块620、识别模块630、匹配模块640以及答案确定模块650。

其中，对话获取模块610，用于获取至少一轮对话中的目标对话。

集合确定模块620，用于确定从至少一轮对话中待识别出的目标问题集合。

识别模块630，用于对目标对话进行实体词识别，得到目标对话中的多个实体词并存储。

匹配模块640，用于将目标问题集合中各问题分别与存储的多个实体词匹配，以确定各问题对应的实体词。

答案确定模块650，用于根据各问题对应的实体词，确定各问题的答案。

在本申请实施例的一种可能的实现方式中，集合确定模块620，具体用于：根据设定规则，从至少一轮对话对应的多个实体收集单元集合中，确定目标实体收集单元集合；其中，目标实体收集单元集合中包含一个或多个与目标问题集合中的问题对应的实体收集单元，用于识别与对应问题匹配的实体词。

在本申请实施例的一种可能的实现方式中，目标实体收集单元集合中包含多个实体收集单元，匹配模块640，具体用于：采用目标实体收集单元集合中的各实体收集单元，依次对目标对话中的多个实体词进行识别，以得到各实体收集单元对应问题所匹配的实体词。

在本申请实施例的一种可能的实现方式中，该对话识别装置600还可以包括：

停止模块，用于在目标实体收集单元集合中各实体收集单元均识别完毕，或者，存在未识别到匹配实体词的实体收集单元，则停止采用目标实体收集单元集合进行识别。

下文获取模块，用于从至少一轮对话中，获取目标对话的下文。

存储模块，用于对下文中的实体词进行存储。

识别模块630，还用于采用目标实体收集单元集合，对存储的各实体词继续进行识别。

删除模块，用于目标实体收集单元集合中各实体收集单元均识别到匹配实体词的情况下，删除存储的多个实体词。

本申请实施例的对话识别装置，通过获取至少一轮对话中的目标对话，并确定从至少一轮对话中待识别出的目标问题集合；对目标对话进行实体词识别，得到目标对话中的多个实体词并存储；将目标问题集合中各问题分别与存储的多个实体词匹配，以确定各问题对应的实体词；根据各问题对应的实体词，确定各问题的答案。由此，当用户在一轮对话中回答多个问题的情况下，***即可自动识别出各问题的答案，可以减少不必要的交互次数，改善用户的使用体验。

根据本申请的实施例，本申请还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

图7示出了可以用来实施本申请的实施例的示例电子设备700的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图7所示，设备700包括计算单元701，其可以根据存储在ROM(Read-OnlyMemory，只读存储器)702中的计算机程序或者从存储单元708加载到RAM(Random AccessMemory，随机访问/存取存储器)703中的计算机程序，来执行各种适当的动作和处理。在RAM703中，还可存储设备700操作所需的各种程序和数据。计算单元701、ROM 702以及RAM 703通过总线704彼此相连。I/O(Input/Output，输入/输出)接口705也连接至总线704。

设备700中的多个部件连接至I/O接口705，包括：输入单元706，例如键盘、鼠标等；输出单元707，例如各种类型的显示器、扬声器等；存储单元708，例如磁盘、光盘等；以及通信单元709，例如网卡、调制解调器、无线通信收发机等。通信单元709允许设备700通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元701可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元701的一些示例包括但不限于CPU(Central Processing Unit，中央处理单元)、GPU(Graphic Processing Units，图形处理单元)、各种专用的AI(Artificial Intelligence，人工智能)计算芯片、各种运行机器学习模型算法的计算单元、DSP(Digital SignalProcessor，数字信号处理器)、以及任何适当的处理器、控制器、微控制器等。计算单元701执行上文所描述的各个方法和处理，例如对话识别方法。例如，在一些实施例中，对话识别方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元708。在一些实施例中，计算机程序的部分或者全部可以经由ROM 702和/或通信单元709而被载入和/或安装到设备700上。当计算机程序加载到RAM 703并由计算单元701执行时，可以执行上文描述的对话识别方法的一个或多个步骤。备选地，在其他实施例中，计算单元701可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行对话识别方法。

本文中以上描述的***和技术的各种实施方式可以在数字电子电路***、集成电路***、FPGA(Field Programmable Gate Array，现场可编程门阵列)、ASIC(Application-Specific Integrated Circuit，专用集成电路)、ASSP(Application Specific StandardProduct，专用标准产品)、SOC(System On Chip，芯片上***的***)、CPLD(ComplexProgrammable Logic Device，复杂可编程逻辑设备)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程***上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储***、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储***、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、RAM、ROM、EPROM(Electrically Programmable Read-Only-Memory，可擦除可编程只读存储器)或快闪存储器、光纤、CD-ROM(Compact Disc Read-Only Memory，便捷式紧凑盘只读存储器)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的***和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(Cathode-Ray Tube，阴极射线管)或者LCD(Liquid Crystal Display，液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的***和技术实施在包括后台部件的计算***(例如，作为数据服务器)、或者包括中间件部件的计算***(例如，应用服务器)、或者包括前端部件的计算***(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的***和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算***中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将***的部件相互连接。通信网络的示例包括：LAN(LocalArea Network，局域网)、WAN(Wide Area Network，广域网)和互联网。

计算机***可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，又称为云计算服务器或云主机，是云计算服务体系中的一项主机产品，以解决了传统物理主机与VPS服务(VirtualPrivate Server，虚拟专用服务器)中，存在的管理难度大，业务扩展性弱的缺陷。服务器也可以为分布式***的服务器，或者是结合了区块链的服务器。

根据本申请的实施例，本申请还提供了一种计算机程序产品，当计算机程序产品中的指令被处理器执行时，执行本申请上述实施例提出的对话识别方法。

根据本申请实施例的技术方案，通过获取至少一轮对话中的目标对话，并确定从至少一轮对话中待识别出的目标问题集合；对目标对话进行实体词识别，得到目标对话中的多个实体词并存储；将目标问题集合中各问题分别与存储的多个实体词匹配，以确定各问题对应的实体词；根据各问题对应的实体词，确定各问题的答案。由此，当用户在一轮对话中回答多个问题的情况下，***即可自动识别出各问题的答案，可以减少不必要的交互次数，改善用户的使用体验。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本申请公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本申请保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等，均应包含在本申请保护范围之内。

Claims

1.一种对话识别方法，所述方法包括：

获取至少一轮对话中的目标对话，以及根据设定规则，从所述至少一轮对话对应的多个实体收集单元集合中确定目标实体收集单元集合；其中，所述目标实体收集单元集合中包含多个与目标问题集合中的问题对应的实体收集单元，用于识别与对应问题匹配的实体词；实体收集单元由一个父节点和两个子节点组成，其中，父节点和子节点是对话树中的节点，父节点用于作为节点选择进入条件判断待收集实体词是否被对话上下文收集过，在未被对话上下文收集过的情况下，则第一个子节点判断用户表述的内容是否包含实体词，在包含实体词的情况下，在上下文中变量赋值完成收集，在未包含实体词的情况下，执行第二个子节点，会再次跳转至父节点重新发起实体词收集；

根据各所述问题对应的实体词，确定各所述问题的答案。

2.根据权利要求1所述的对话识别方法，其中，所述将所述目标问题集合中各问题分别与存储的多个实体词匹配，以确定各所述问题对应的实体词，包括：

采用所述目标实体收集单元集合中的各实体收集单元，依次对所述目标对话中的多个实体词进行识别，以得到各实体收集单元对应问题所匹配的实体词。

3.根据权利要求2所述的对话识别方法，其中，所述采用各实体收集单元依次对所述目标对话中的多个实体词进行识别之后，还包括：

在所述目标实体收集单元集合中各所述实体收集单元均识别完毕，或者，存在未识别到匹配实体词的所述实体收集单元，则停止采用所述目标实体收集单元集合进行识别。

4.根据权利要求3所述的对话识别方法，其中，所述存在未识别到匹配实体词的所述实体收集单元，则停止采用所述实体收集单元集合进行识别之后，还包括：

从所述至少一轮对话中，获取所述目标对话的下文；

对所述下文中的实体词进行存储；

采用所述目标实体收集单元集合，对存储的各所述实体词继续进行识别。

5.根据权利要求3所述的对话识别方法，其中，所述方法还包括：

所述目标实体收集单元集合中各所述实体收集单元均识别到匹配实体词的情况下，删除存储的多个实体词。

6.一种对话识别装置，包括：

对话获取模块，用于获取至少一轮对话中的目标对话；

集合确定模块，用于根据设定规则，从所述至少一轮对话对应的多个实体收集单元集合中确定目标实体收集单元集合；其中，所述目标实体收集单元集合中包含多个与目标问题集合中的问题对应的实体收集单元，用于识别与对应问题匹配的实体词；实体收集单元由一个父节点和两个子节点组成，其中，父节点和子节点是对话树中的节点，父节点用于作为节点选择进入条件判断待收集实体词是否被对话上下文收集过，在未被对话上下文收集过的情况下，则第一个子节点判断用户表述的内容是否包含实体词，在包含实体词的情况下，在上下文中变量赋值完成收集，在未包含实体词的情况下，执行第二个子节点，会再次跳转至父节点重新发起实体词收集；

7.根据权利要求6所述的对话识别装置，其中，所述目标实体收集单元集合中包含多个所述实体收集单元，所述匹配模块，具体用于：

8.根据权利要求7所述的对话识别装置，其中，所述装置还包括：

停止模块，用于在所述目标实体收集单元集合中各所述实体收集单元均识别完毕，或者，存在未识别到匹配实体词的所述实体收集单元，则停止采用所述目标实体收集单元集合进行识别。

9.根据权利要求8所述的对话识别装置，其中，所述装置还包括：

下文获取模块，用于从所述至少一轮对话中，获取所述目标对话的下文；

存储模块，用于对所述下文中的实体词进行存储；

所述识别模块，还用于采用所述目标实体收集单元集合，对存储的各所述实体词继续进行识别。

10.根据权利要求8所述的对话识别装置，其中，所述装置还包括：

删除模块，用于所述目标实体收集单元集合中各所述实体收集单元均识别到匹配实体词的情况下，删除存储的多个实体词。

11.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-5中任一项所述的对话识别方法。

12.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行权利要求1-5中任一项所述的对话识别方法。