CN111414195B

CN111414195B - 通用可配置、兼容多模型、领域可迁移的多轮对话***

Info

Publication number: CN111414195B
Application number: CN201910108762.6A
Authority: CN
Inventors: 鄂海红; 宋美娜; 陈忠富; 牛佩晴
Original assignee: Beijing University of Posts and Telecommunications
Current assignee: Beijing University of Posts and Telecommunications
Priority date: 2019-02-03
Filing date: 2019-02-03
Publication date: 2022-03-25
Anticipated expiration: 2039-02-03
Also published as: CN111414195A

Abstract

本发明公开了一种通用可配置、兼容多模型、领域可迁移的多轮对话***，包括：可配置模块用于根据当前所在领域的专业知识进行自定义的配置；对话理解模块用于通过对话理解对用户语句进行语义编码，并且通过替换兼容的对话理解模型进行意图识别和槽值对的联合提取；对话状态跟踪模块用于获取当前多轮历史的对话状态信息；策略学习模块，用于通过对话策略模型进行动作决策；对话生成模块用于根据相应的动作进行对话生成；在线训练模块用于作为用户模拟器提供给开发人员，并进行模型的在线迭代更新和生成可用的数据。该***整体架构模块通用，适应不同应用场景，各字段参数通用可配置，可随意接受语料，对话理解、对话策略模型可灵活扩展更换。

Description

通用可配置、兼容多模型、领域可迁移的多轮对话***

技术领域

本发明涉及信息技术及数据业务技术领域，特别涉及一种通用可配置、兼容多模型、领域可迁移的多轮对话***。

背景技术

目前任务导向多轮对话***以流水线架构为主，其目的一般是针对特定领域的任务完成一系列内部模块的设计，由于其目的相关性，大量内部规则与特定适用与其关联，导致其***单一性，无法在多领域内适用，固定的业务规则与***混杂，指定字段不可更改，且内部模型唯一，无法更新，各模块之间协调脆弱，更改内部模型结构需要大量的人工成本，其***的字段固定化、应用单一性、模型固化制约了其在不同领域的应用与发展。通用性、多兼容性、可迁移性仍是制约任务导向多轮对话***发展的重大难题。

现有的任务导向多轮对话***多是面向特定领域内容，完成相应的任务，通过对特定领域用户的语句进行意图理解，结合相应信息为用户选定动作和回复。比如,一种面向出行领域的人机多轮对话方法，该方法对用户短文本语句进行理解，采用相应的模型，提取出意图信息和槽位信息，将历史的槽位信息和当前问句的槽位信息作为输入，确定当前的对话状态信息，并结合当前问句的意图信息确定下一步的回复策略；根据确定的回复策略选择对应的模板回复给用户，达到在多轮对话中感知用户目的并回复的功能。另外,一个结合闲聊与多轮对话的框架，接收用户的输入信息；确定所述输入信息的状态；根据所述状态生成一个或多个动作概念，其中，所述一个或多个动作概念分别包括生成一句话或调用一个应用程序接口；以及执行所述一个或多个动作概念。其本质在于对对话理解中感知用户的多个意图并向用户提供多个服务，这种方式提供一种泛任务式的对话理解。

发明内容

本申请是基于发明人对以下问题的认识和发现作出的：

上述技术仅考虑到了特定领域的应用场景，***所有的模块围绕着固定的领域展开，无法适用于其它领域，改变***领域需要重新定义整个***。且其模型固定化，无法对现有模型进行不断的迭代更新，导致模型效果无法提升，改变需要变换大量逻辑，且字段需要重新定义，消耗了大量的人工成本。而在任务导向多轮对话***的应用场景中，为了让***可以适用于多个领域，节约成本并提高***重用率，需要使***具有良好的通用性、兼容性和可迁移性，即使***可以灵活配置相应参数字段、兼容不同模型并可以迁移到不同领域中使用。

本发明旨在至少在一定程度上解决相关技术中的技术问题之一。

为此，本发明的目的在于提出一种通用可配置、兼容多模型、领域可迁移的多轮对话***，***整体架构模块通用，适应不同应用场景，各字段参数通用可配置，可随意接受语料，对话理解、对话策略模型可灵活扩展更换，***可迁移到多个领域，扩展应用领域。

为达到上述目的，本发明实施例提出了一种通用可配置、兼容多模型、领域可迁移的多轮对话***，包括：可配置模块，用于根据当前所在领域的专业知识进行自定义的配置，以配置完成后得到训练好的模型；对话理解模块，用于通过对话理解对用户语句进行语义编码，并且通过替换兼容的对话理解模型进行意图识别和槽值对的联合提取；对话状态跟踪模块，用于获取当前多轮历史的对话状态信息；策略学习模块，用于通过对话策略模型进行动作决策，其中，所述对话策略模型包括可兼容更换的模型和存储记忆模块，并对所述可兼容更换的模型和所述存储记忆模块进行置信度比较，以选取最佳的策略动作；对话生成模块，用于根据相应的动作进行对话生成，其包括自定义的模版回复和需要通过自定义动作业务逻辑和在线知识库API交互的回复，以完成一轮对话，直至用户在多轮对话中完成最终目的需求；在线训练模块，用于作为用户模拟器提供给开发人员，并进行模型的在线迭代更新和生成可用的数据。

本发明实施例的通用可配置、兼容多模型、领域可迁移的多轮对话***，采用流水线任务型多轮对话***方式，实现了可以自定义配置，定义自己领域所需要的字段信息，可以随意接受预料；对话理解模型和对话策略模型可以兼容多种模型，支持模型扩展更新；可以在多个领域中迁移，不仅限于单一领域；从通用型、可迁移性、兼容性角度出发，形成了自定义任务导向多轮对话***；从而***整体架构模块通用，适应不同应用场景，各字段参数通用可配置，可随意接受语料，对话理解、对话策略模型可灵活扩展更换，***可迁移到多个领域，扩展应用领域。

另外，根据本发明上述实施例的通用可配置、兼容多模型、领域可迁移的多轮对话***还可以具有以下附加的技术特征：

进一步地，在本发明的一个实施例中，所述可配置模块包括：领域信息配置子模块：用于配置领域的意图、槽值、实体、动作、回复模版中的一项或多项信息；自定义动作配置子模块，用于配置用户自定义的动作处理逻辑、返回数据、槽改变信息中的一项或多项信息；语料子模块，用于配置对话理解语料和对话管理语料。

进一步地，在本发明的一个实施例中，所述对话理解模块包括：对话语义编码子模块，用于对用户语句进行语义编码；意图识别子模块，用于对编码信息进行意图分类；槽值提取子模块，用于对编码信息进行命名实体识别。

进一步地，在本发明的一个实施例中，所述对话状态跟踪模块包括：状态信息获取跟踪子模块，用于跟踪当前对话状态信息，以获取所有状态信息。

进一步地，在本发明的一个实施例中，所述策略学习模块包括：可兼容模型子模块，用于通过模型对结合多轮历史状态进行策略动作进行选取；记忆存储子模块，用于为每个状态策略保存唯一id，以key-value存储对话策略选取信息。

进一步地，在本发明的一个实施例中，所述对话生成模块包括：模版回复子模块，用于根据预设的回复模版进行回复；在线知识库API交互子模块，用于通过预设动作业务逻辑和在线知识库进行API交互，以获取相应回复信息生成回复。

进一步地，在本发明的一个实施例中，所述在线训练模块包括：用户机器交互子模块，用于根据用户语句机器与用户进行在线的交互；用户选择子模块，用于每轮次交互中，提供选项让用户进行符合需求的选择；在线模型更新子模块，用于在用户选择完成后，根据选择动态更新对话理解模型或对话管理模型；在线数据存储子模块，用于在对话完成时，若所有对话均可用，则将对话管理数据进行存储，对话理解数据仅用户认为对话理解出错模型更新完成后存储。

本发明附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：

图1为根据本发明实施例的通用可配置、兼容多模型、领域可迁移的多轮对话***的结构示意图；

图2为根据本发明一个实施例的通用可配置、兼容多模型、领域可迁移的多轮对话***的结构示意图；

图3为根据本发明一个具体实施例的通用可配置、兼容多模型、领域可迁移的多轮对话***的结构示意图；

图4为根据本发明实施例的自定义可配置选项示意图；

图5为根据本发明实施例的领域信息配置图；

图6为根据本发明实施例的对话理解语料配置图；

图7为根据本发明实施例的对话管理语料配置图；

图8为根据本发明实施例的自定义动作配置图；

图9为根据本发明实施例的模型可替换图；

图10为根据本发明实施例的可迁移领域图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本发明，而不能理解为对本发明的限制。

下面参照附图描述根据本发明实施例提出的通用可配置、兼容多模型、领域可迁移的多轮对话***。

图1是本发明一个实施例的通用可配置、兼容多模型、领域可迁移的多轮对话***的结构示意图。

如图1所示，该通用可配置、兼容多模型、领域可迁移的多轮对话***10包括：可配置模块100、对话理解模块200、对话状态跟踪模块300、策略学习模块400、对话生成模块500和在线训练模块600。

其中，可配置模块100用于根据当前所在领域的专业知识进行自定义的配置，以配置完成后得到训练好的模型。对话理解模块200用于通过对话理解对用户语句进行语义编码，并且通过替换兼容的对话理解模型进行意图识别和槽值对的联合提取。对话状态跟踪模块300用于获取当前多轮历史的对话状态信息。策略学习模块400用于通过对话策略模型进行动作决策，其中，对话策略模型包括可兼容更换的模型和存储记忆模块，并对可兼容更换的模型和存储记忆模块进行置信度比较，以选取最佳的策略动作。对话生成模块500用于根据相应的动作进行对话生成，其包括自定义的模版回复和需要通过自定义动作业务逻辑和在线知识库API交互的回复，以完成一轮对话，直至用户在多轮对话中完成最终目的需求。在线训练模块600用于作为用户模拟器提供给开发人员，并进行模型的在线迭代更新和生成可用的数据。本发明实施例的***10整体架构模块通用，适应不同应用场景，各字段参数通用可配置，可随意接受语料，对话理解、对话策略模型可灵活扩展更换，***可迁移到多个领域，扩展应用领域。

可以理解的是，通用可配置、兼容多模型、领域可迁移的多轮对话***架构图如图2所示，具体地，这里首先根据自身所在领域的专业知识进行自定义的配置，配置完成后，获得训练好的模型。用户语句通过对话理解进行语义编码，通过可以替换兼容的对话理解模型进行意图识别和槽值对的联合提取，完成后，对话状态***获取当前多轮历史的对话状态信息，包括意图、动作、槽值等，通过对话策略模型进行动作决策，其中对话策略模型包括可兼容更换的模型和存储记忆模块，两者进行置信度比较选取最佳的策略动作，机器根据相应的动作进行对话生成，包括自定义的模版回复，和需要通过自定义动作业务逻辑和在线知识库API交互的回复，最终完成一轮对话，类似，用户在多轮对话中完成自己的最终目的需求。在线训练模块作为用户模拟器提供给开发人员，进行模型的在线迭代更新和生成可用的数据。

下面将结合图3对通用可配置、兼容多模型、领域可迁移的多轮对话***10进行进一步详细阐述。

进一步地，在本发明的一个实施例中，可配置模块100包括：领域信息配置子模块、自定义动作配置子模块和语料子模块。

其中，领域信息配置子模块用于配置领域的意图、槽值、实体、动作、回复模版中的一项或多项信息。自定义动作配置子模块用于配置用户自定义的动作处理逻辑、返回数据、槽改变信息中的一项或多项信息。语料子模块用于配置对话理解语料和对话管理语料。

具体而言，如图3所示，可配置模块100为自定义配置模块：通过简单易用的配置操作迁移到所需领域，包括：(1)领域信息配置模块：包括领域的意图、槽值、实体、动作、回复模版等信息；(2)自定义动作配置模块：包括用户自定义的动作处理逻辑(外接API(Application Programming Interface，应用程序编程接口))、返回数据、槽改变信息；(3)语料模块：包括对话理解语料和对话管理语料。

进一步地，在本发明的一个实施例中，对话理解模块200包括：对话语义编码子模块、意图识别子模和槽值提取子模块。

其中，对话语义编码子模块，用于对用户语句进行语义编码；意图识别子模块，用于对编码信息进行意图分类；槽值提取子模块，用于对编码信息进行命名实体识别。

具体而言，如图3所示，对话理解模块200可以为可兼容意图槽值联合提取模块：模型可兼容，可以被扩展和替换，联合意图识别和槽值提取建模，包含三个子模块：(1)对话语义编码模块：对用户语句进行语义编码；(2)意图识别模块：对编码信息进行意图分类；(3)槽值提取模块：对编码信息进行命名实体识别。

进一步地，在本发明的一个实施例中，对话状态跟踪模块300包括：状态信息获取跟踪子模块。其中，状态信息获取跟踪子模块，用于跟踪当前对话状态信息，以获取所有状态信息。

具体而言，如图3所示，状态信息获取跟踪模块：跟踪当前对话状态信息，包括意图、槽值、实体、历史、领域等信息，能通过该模块获取所有状态信息

进一步地，在本发明的一个实施例中，策略学习模块400包括：可兼容模型子模块和记忆存储子模块。

其中，可兼容模型子模块，用于通过模型对结合多轮历史状态进行策略动作进行选取。记忆存储子模块，用于为每个状态策略保存唯一id，以key-value存储对话策略选取信息。

具体而言，如图3所示，策略模型模块：模型根据对话状态决定当前机器反应动作，在可兼容模型模块和记忆存储模块中做置信度比较选取动作，具体包括：(1)可兼容模型模块：通过模型对结合多轮历史状态进行策略动作选取，模型可扩展更换，包括但不限于卷积神经网络，递归神经网路，深度强化学习等；(2)记忆存储模块：为每个状态策略保存唯一id，以key-value存储对话策略选取信息，保证已有策略稳定精确。

进一步地，在本发明的一个实施例中，对话生成模块500包括：模版回复子模块和在线知识库API交互子。

其中，模版回复子模块，用于根据预设的回复模版进行回复；在线知识库API交互子模块，用于通过预设动作业务逻辑和在线知识库进行API交互，以获取相应回复信息生成回复。

具体而言，如图3所示，模版回复模块：根据用户自定义的回复模版进行回复，可以保证简单回复准确性；在线知识库API交互模块：通过用户自定义动作业务逻辑，和在线知识库进行API交互，获取相应回复信息生成回复。

进一步地，在本发明的一个实施例中，在线训练模块600包括：用户机器交互子模块、用户选择子模块、在线模型更新子模块和在线数据存储子模块。

其中，用户机器交互子模块，用于根据用户语句机器与用户进行在线的交互；用户选择子模块，用于每轮次交互中，提供选项让用户进行符合需求的选择；在线模型更新子模块，用于在用户选择完成后，根据选择动态更新对话理解模型或对话管理模型；在线数据存储子模块，用于在对话完成时，若所有对话均可用，则将对话管理数据进行存储，对话理解数据仅用户认为对话理解出错模型更新完成后存储。

具体而言，如图3所示，用户机器交互模块：根据用户语句机器与用户进行在线的交互。用户选择模块：每轮次交互中，机器提供选项让用户进行符合需求的选择。在线模型更新模块：用户选择完成，根据选择动态更新对话理解模型，或对话管理模型。在线数据存储模块：当对话完成时，若所有对话均可用，则将对话管理数据进行存储，对话理解数据仅用户认为对话理解出错模型更新完成后存储。

除了上述有别于其它***的设计模块，本部分内容主要阐述本***在三个方面的特性，通过通用可配置、兼容多模型、领域可迁移三个维度，形成自定义领域任务导向多轮对话***。下面将进行具体阐述。

1、通用可配置

首先根据业务需求完成相应领域的配置要求，用户需要根据相关领域的专业知识简单完成领域知识的配置。通用自定义配置如下图4所示：

1)图4领域需要自定义配置的可用选项，包括意图、动作、槽值、实体、回复模版这类专业领域知识所需要的信息配置，配置可以通过yaml文件格式，简单易用。其中，领域信息配置图如图5所示，包括：

2)其次***能随意接受对话理解训练数据和对话管理训练数据，两种数据格式不随着领域的迁移而改变，具有普适应性，根据相应的语料分别完成对话理解模型的训练和对话管理模型的训练，对话理解的语料可以通过json文件格式配置，对话理解通过称之为story的文件格式进行配置。对话理解语料配置图如图6所示，包括：

进一步地，对话管理语料配置图如图7所示，包括：

3)用户可以通过自定义动作文件代码进行本身所需要自定义动作以处理相关的业务逻辑的配置，包括与在线知识库API交互的逻辑，获取当前各种对话状态信息的逻辑，改变槽值的逻辑，生成的回复逻辑等。其中，自定义动作配置图如图8所示，包括：

领域信息配置、自定义动作配置、语料配置，与***本身代码逻辑分离，用户只需要对三个方面的配置进行操作，即可随意更换到自己所需要的领域。

2、兼容多模型

该***能够扩展更换对话理解与对话管理的模型，做到模型的扩展可更换，如图9所示。

对话理解模型包括意图识别模型和槽值提取模型，两者可以联合建模也可以分开建模，对话策略模型包括对话策略通用模型和记忆存储模型，两者在针对同一个对话状态做决定时会进行置信度比较，决定最优策略动作。其中对话理解模型和对话策略模型都可以支持模型的可扩展替换，比如它们都可以被包括但不限于注意力递归网络、双向递归网络、卷积+门递归网络、卷积神经网络、长短期记忆网络、快速分类器、门递归网络等各种模型替换扩展和更新，它们本身也可以进行自身独立的更新，对话理解模型除意图识别和槽值提取模型单独建模之外，也可以通过对两者进行联合的建模更好满足速度和精度的需求，策略模型可以通过强化学习模型进行更新以满足策略动作选取的进一步优化。只需要用户定义好相应的模型类文件，即可随意替换对话理解和对话管理的模型。

对话理解模型和对话管理模型可以通过模型可替换性进行不断更新替换，以满足模型的不断优化、适应于不同的新场景，为整个对话***在新的环境，新的需求下提供更好的普适应性。

3、领域可迁移

如图10所示，本方案能够方便简易地迁移到其它应用场景，作为通用的任务导向多轮对话***。只需要用户提供摸个领域的专业知识背景，即用户拥有某个领域的数据库，如机票数据库、火车票数据库、电影数据库、音乐数据库、餐馆数据库等。该***可以广泛应用于商场、影院、超市、网购平台等垂直领域的应用，能够极大地减少相关行业的人力需求、提升生产效益，符合网购平台、线下服务平台、旅游业等行业的利益需求。

该任务导向多轮对话***，通过领域信息配置、自定义动作配置、语料配置三方面即可简单易用的转移到任意需要的领域，体现了该***稳健的领域可迁移性。

综上，本发明实施例具有以下优点：(1)本方案采用流水线式任务导向多轮对话***方式，实现了完全自定义的多轮对话***框架。可配置各种字段参数，包括意图、动作、槽值、实体、对话回复模版等信息，可随意接受对话理解语料和对话管理语料训练，实现了通用性；对话理解与对话策略模型不仅限于一种模型，可用其它模型扩展和替换，实现了兼容性；针对不同业务场景，本方案可以无缝迁移到多个领域，实现了可迁移性。从通用性、兼容性、可迁移性三个方面体现了本方案的自定义化可适用能力。(2)本方案实现模块独立，各个模块做到了相对分离，用户在改变其中一个模块时，能做到不影响其它模块的功能。在实现的过程中，采用多种先进方法，改善***的准确性、稳定性，保证***在具体应用场景中的稳定可用能力，且使用简单，各模块功能清晰，用户不需要过多复杂的操作即可完成整个多轮对话***的自定义。体现了本方案的简介易用性。

根据本发明实施例提出的通用可配置、兼容多模型、领域可迁移的多轮对话***，采用流水线任务型多轮对话***方式，实现了可以自定义配置，定义自己领域所需要的字段信息，可以随意接受预料；对话理解模型和对话策略模型可以兼容多种模型，支持模型扩展更新；可以在多个领域中迁移，不仅限于单一领域；从通用型、可迁移性、兼容性角度出发，形成了自定义任务导向多轮对话***；从而***整体架构模块通用，适应不同应用场景，各字段参数通用可配置，可随意接受语料，对话理解、对话策略模型可灵活扩展更换，***可迁移到多个领域，扩展应用领域。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

1.一种通用可配置、兼容多模型、领域可迁移的多轮对话***，其特征在于，包括：

可配置模块，用于根据当前所在领域的专业知识进行自定义的配置，以配置完成后得到训练好的模型；

对话理解模块，用于通过对话理解对用户语句进行语义编码，并且通过替换兼容的对话理解模型进行意图识别和槽值对的联合提取；

对话状态跟踪模块，用于获取当前多轮历史的对话状态信息；

策略学习模块，用于通过对话策略模型进行动作决策，其中，所述对话策略模型包括可兼容更换的模型和存储记忆模块，并对所述可兼容更换的模型和所述存储记忆模块进行置信度比较，以选取最佳的策略动作，其中，所述策略模型包括：模型根据对话状态决定当前机器反应动作，在可兼容模型模块和记忆存储模块中做置信度比较选取动作，具体包括：所述可兼容模型模块，用于通过模型对结合多轮历史状态进行策略动作选取，模型可扩展更换，包括卷积神经网络或递归神经网路或深度强化学习，所述记忆存储模块，用于为每个状态策略保存唯一id，以key-value存储对话策略选取信息，所述对话理解模型包括意图识别模型和槽值提取模型，所述对话策略模型包括对话策略通用模型和记忆存储模型，两者在针对同一个对话状态做决定时会进行置信度比较，决定最优策略动作，其中对话理解模型和对话策略模型都可以支持模型的可扩展替换，策略模型可以通过强化学习模型进行更新以满足策略动作选取的进一步优化；

对话生成模块，用于根据相应的动作进行对话生成，其包括自定义的模版回复和需要通过自定义动作业务逻辑和在线知识库API交互的回复，以完成一轮对话，直至用户在多轮对话中完成最终目的需求；以及

在线训练模块，用于作为用户模拟器提供给开发人员，并进行模型的在线迭代更新和生成可用的数据，其中，所述在线训练模块包括：用户机器交互子模块，用于根据用户语句机器与用户进行在线的交互；用户选择子模块，用于每轮次交互中，提供选项让用户进行符合需求的选择；在线模型更新子模块，用于在用户选择完成后，根据选择动态更新对话理解模型或对话管理模型；在线数据存储子模块，用于在对话完成时，若所有对话均可用，则将对话管理数据进行存储，对话理解数据仅用户认为对话理解出错模型更新完成后存储。

2.根据权利要求1所述的***，其特征在于，所述可配置模块包括：

领域信息配置子模块，用于配置领域的意图、槽值、实体、动作、回复模版中的一项或多项信息；

自定义动作配置子模块，用于配置用户自定义的动作处理逻辑、返回数据、槽改变信息中的一项或多项信息；

语料子模块，用于配置对话理解语料和对话管理语料。

3.根据权利要求1所述的***，其特征在于，所述对话理解模块包括：

对话语义编码子模块，用于对用户语句进行语义编码；

意图识别子模块，用于对编码信息进行意图分类；

槽值提取子模块，用于对编码信息进行命名实体识别。

4.根据权利要求1所述的***，其特征在于，所述对话状态跟踪模块包括：

状态信息获取跟踪子模块，用于跟踪当前对话状态信息，以获取所有状态信息。

5.根据权利要求1所述的***，其特征在于，所述对话生成模块包括：

模版回复子模块，用于根据预设的回复模版进行回复；

在线知识库API交互子模块，用于通过预设动作业务逻辑和在线知识库进行API交互，以获取相应回复信息生成回复。