CN112289467A

CN112289467A - 一种面向低资源场景可迁移的医疗问诊对话***及方法

Info

Publication number: CN112289467A
Application number: CN202011287854.4A
Authority: CN
Inventors: 梁小丹; 林帅; 唐鉴恒; 陈子良; 林倞
Original assignee: Sun Yat Sen University
Current assignee: Sun Yat Sen University
Priority date: 2020-11-17
Filing date: 2020-11-17
Publication date: 2021-01-29
Anticipated expiration: 2040-11-17
Also published as: CN112289467B

Abstract

本发明公开了一种面向低资源场景可迁移的医疗问诊对话***及方法，该***包括：模拟病人构建模块，用于建立模拟病人，模拟病人具有若干对话样本，每次训练随机选取一个对话样本，并针对模拟病人给出其病情描述报告；智能医疗问诊***构建模块，建立智能医疗问诊***，根据病情描述，通过分层上下文编码器模块从对话历史中提取不同层级的上下文信息，编码得到单轮层级和多轮层级对话的特征向量，通过演化外部医疗知识图，根据特征向量进行疾病‑症状之间的关系推理得到图节点特征向量，并在图节点信息指导下，利用复制网络生成医生对病人的回复；训练模块，对***进行端到端训练，利用图演化元学习算法在已有疾病的对话数据上训练***。

Description

一种面向低资源场景可迁移的医疗问诊对话***及方法

技术领域

本发明涉及医疗信息技术领域，特别是涉及一种面向低资源场景可迁移的医疗问诊对话***及方法。

背景技术

看病难一直是我国医疗体系***最突出的问题。随着大数据和互联网的发展，人们开始通过搜索引擎来完成疾病的初步自我诊断，然而搜索引擎搜索到的是网上存在的相关案例的问答结果，这种诊断的结果可能由于与用户完全一致的症状表现而导致诊断结果有偏差甚至错误，现存的线下问诊网站医生的素质参差不齐，有一些医生可能会给出错误的诊断结果，所以构建一个具有知识推理能力的自动诊断对话***是亟待解决的一个需求。

近年来对话***作为一种新型的下一代人机交互方式取得了显著的发展，各种虚拟助理逐渐商用落地，对话***是自然语言处理的一个重要领域，其可以分为闲聊型对话***和任务型对话***，任务型对话***的主要作用是计算机通过与用户之间的交互帮助用户完成特定的任务，比如电影院订票、餐厅订票、在线购物等等，闲聊型对话***可以与用户在开放域中聊天，医疗问诊对话***本质是一个任务型的对话***。

医疗问诊对话***的主要任务是：根据用户的病情陈述，***通过与用户的对话获得诊断所需要的症状信息，然后自动地给出最终的诊断意见。这能够有效的简化诊断流程并且减少从病人处收集信息的成本，此外医疗对话***作出的诊断结果也可以协助医生更加高效地做出诊断。然而，现有的医疗问诊对话***多依赖于大量的对话数据来训练，因而只能针对数据覆盖到的特定疾病进行诊断，***可扩展性较差。

发明内容

为克服上述现有技术存在的不足，本发明之目的在于提供一种面向低资源场景可迁移的医疗问诊对话***及方法，以实现一种具有良好拓展性、实用性强且实现疾病与症状相互关系推理的医疗问诊***。

为达上述目的，本发明提出一种面向低资源场景可迁移的医疗问诊对话***，包括：

模拟病人构建模块，用于建立模拟病人，所述模拟病人具有若干对话样本，每次训练随机选取一个对话样本，并针对所述模拟病人给出其病情描述报告；

智能医疗问诊***构建模块，用于建立一个智能医疗问诊***，所述智能***根据模拟病人的病情描述，通过分层上下文编码器模块从对话历史中提取不同层级的上下文信息，编码得到单轮层级和多轮层级对话的特征向量；通过演化外部的医疗知识图，根据得到的特征向量进行疾病-症状之间的关系推理，得到图节点特征向量，并在演化得到的图节点信息的指导下，利用复制网络，智能生成医生对病人的回复；

训练模块，用于对所述智能医疗问诊***构建模块获得的智能医疗问诊***进行端到端训练，利用图演化元学习算法在已有疾病的对话数据上训练所述***，当出现新疾病需要自动诊断时，将所述***通过在新疾病的少量数据上进行迁移微调，得到拓展后的对话问诊***。

优选地，所述智能医疗问诊***构建模块进一步包括：

分层上下文编码器模块，用于根据模拟病人的病情描述，通过两个长短时记忆网络提取医生与病人对话对话历史的上下文信息，将其编码成单轮层级和多轮层级对话的特征向量；

元疾病推理模块，用于通过外部知识库构建疾病-症状知识图，并将分层上下文编码器模块获得的特征向量初始化构建的疾病-症状知识图的话语结点，通过两层图注意力网络，分别将话语节点蕴含的信息传递到疾病节点与症状节点，同时将疾病与症状节点之间的信息进行扩散传播，得到最终的图节点特征向量；

基于医疗知识图的解码器，用于在所述元疾病推理模块获得的图节点特征向量的指导下，利用复制网络作为对话生成器，从普通词表或者图节点集合动态选择解码的结果，智能生成医生对病人的回复。

优选地，所述分层上下文编码器模块将模拟病人产生的对话样本输入到第一个双向长短期记忆网络，对每轮的话语编码，取最后一个时步的输出作为话语层级的特征向量；然后将所述话语层级的特征向量输入到另一个双向长短期记忆网络，对话语层级的特征向量序列进行编码得到对话层级的高层级特征向量。

优选地，所述分层上下文编码器模块使用监督学习的方式训练双向长短期记忆网络模型。

优选地，所述元疾病推理模块进一步包括：

知识图构建单元，用于通过外部知识库构建先验性的疾病-症状知识图，所述知识图包含话语节点，疾病节点，症状节点三类节点，将每个话语节点和该单轮话语包含的疾病、症状节点进行连边，并通过查询外部知识库，将相关疾病和对应症状连边；

信息传递及扩散传播单元，用于通过两层图注意力网络，分别将对话节点蕴含的信息传递到疾病与症状节点，同时将疾病与症状节点之间的信息进行扩散传播，得到最终的图节点特征向量。

优选地，所说基于医疗知识图的解码器根据所述元疾病推理模块得到的最终的图节点特征向量，分步依次生成每个单词，生成每个单词的过程就是取所有候选词中生成概率最大的那个预测分布来自于两部分：分别是普通词表分布和图节点集合的分布，两分布的加权求和得到最终的预测分布。

优选地，所述训练模块通过在旧疾病上对所述智能医疗问诊***进行元训练，使得所述智能医疗问诊***学习到疾病间通用的对话与诊断技巧，进而可以通过新疾病少量的对话样本进行微调，具备快速迁移到新疾病上完成问诊的能力。

优选地，于训练模型中，对于每个旧的任务，元对话模型首先进行一步梯度更新：

然后通过一阶与模型无关的元学习，得到元初始化模型θ_meta；使用所述的元初始化模型θ_meta，在需要诊断新疾病时，仅通过在少量对话数据上进行一步梯度更新θ_meta，即快速迁移适应到新疾病上。

优选地，所述训练模块以在线的形式收集所有可观察到的对话样本，提取对话样本中的症状节点，如果两个症状节点出现在同一个样本中，则将两症状节点进行连边操作；然后根据得到的所述全局症状图，原疾病症状图动态更新方式为A_meta＝A+A^*，并将A_meta设置为元模型θ_meta参数的一部分，来动态学习准确的相互关系表征。

为达到上述目的，本发明还提供一种面向低资源场景可迁移的医疗问诊对话方法，包括如下步骤：

步骤S1，建立一个模拟病人，所述模拟病人具有一定数量的对话样本，每次训练随机选取一个对话样本，针对所述模拟病人会给出其病情描述报告；

步骤S2，建立一个智能医疗问诊***，所述智能医疗问诊***根据模拟病人的病情描述，通过分层上下文编码器模块从对话历史中提取不同层级的上下文信息，编码得到单轮层级和多轮层级对话的特征向量；通过演化外部的医疗知识图，根据得到的特征向量进行疾病-症状之间的关系推理，得到图节点特征向量，并在演化得到的图节点信息的指导下，利用复制网络，智能生成医生对病人的回复；

步骤S3，对步骤S2构建的智能医疗问诊***进行端到端训练，利用图演化元学习算法在已有疾病的对话数据上训练所述***，当出现新疾病需要自动诊断时，将所述***通过在新疾病的少量数据上进行迁移微调，得到拓展后的对话问诊***。

与现有技术相比，具有如下优点

1、相比于现有的医疗问诊对话***多依赖于大量的对话数据来训练的缺陷，本发明采用一阶模型无关的元学习算法学习到不同疾病间通用的对话技巧和问诊逻辑，经过元训练得到的元对话模型可以仅利用少量的对话数据即可快速迁移到未知新疾病上，完成对新疾病的智能问诊，具备良好的可拓展性。

2、本发明的元疾病推理模块利用外部知识库，构建出疾病与症状的元知识图，同时根据线上收集的对话数据，构建出全局症状图并对元知识图进行演化，使其适应到不同疾病的对话场景下。同时该模块利用图注意力网络，对元知识图上疾病与症状节点之间的相互关系进行推理。这个过程与现实中医生对病人的问诊流程是一致的，医生通常有基于过去诊断经验的知识库，包含着不同疾病与症状之间的相互关系，这个知识库会随着新的诊断案例的总结学习进行演变和完善，同时医生在诊断新疾病时不需要大量的诊断案例的学习，只需要将对已见过疾病经验进行迁移，即可进行对新疾病的问诊。

3、本发明采用元知识图指导的复制网络作为对话生成器，通过动态选择生成词来自普通词表或者来自图实体节点，从而能够生成更精准有效的回复，提高智能问诊的效率。

附图说明

图1为本发明一种面向低资源场景可迁移的医疗问诊对话***的***架构图；

图2为本发明具体实施例中面向低资源场景可迁移的医疗问诊对话***的结构示意图。；

图3为本发明一种面向低资源场景可迁移的医疗问诊对话方法的步骤流程图；

图4为本发明具体实施例中一种面向低资源场景可迁移的医疗问诊对话***的生成效果与可视化图。

具体实施方式

以下通过特定的具体实例并结合附图说明本发明的实施方式，本领域技术人员可由本说明书所揭示的内容轻易地了解本发明的其它优点与功效。本发明亦可通过其它不同的具体实例加以施行或应用，本说明书中的各项细节亦可基于不同观点与应用，在不背离本发明的精神下进行各种修饰与变更。

图1为本发明一种面向低资源场景可迁移的医疗问诊对话***的***架构图，图2为本发明具体实施例中面向低资源场景可迁移的医疗问诊对话***的结构示意图。如图1及图2所示，本发明一种面向低资源场景可迁移的医疗问诊对话***，包括：

模拟病人构建模块10，用于建立模拟病人，所述模拟病人具有一定数量的对话样本，每次训练随机选取一个对话样本，针对所述模拟病人会给出其病情描述报告。在本发明中，一个对话样本包含多轮对话，所述病情描述是病人对自我病情的陈述，即病人在多轮对话中描述自己的症状。

智能医疗问诊***构建模块11，用于建立一个智能医疗问诊***，所述智能***根据模拟病人的病情描述，通过分层上下文编码器模块从对话历史中提取不同层级的上下文信息，编码得到单轮层级和多轮层级对话的特征向量；通过演化外部的医疗知识图，根据得到的特征向量进行疾病-症状之间的关系推理，得到图节点特征向量，并在演化得到的图节点信息的指导下，利用复制网络，智能生成医生对病人的回复。

具体地，智能医疗问诊***构建模块11进一步包括：

分层上下文编码器模块110，用于根据模拟病人的病情描述，通过两个长短时记忆网络提取医生与病人对话对话历史的上下文信息，将其编码成单轮层级和多轮层级对话的特征向量。

具体地，分层上下文编码器模块110将模拟病人产生的对话样本输入到第一个双向长短期记忆网络(LSTM)，对每轮(一问一答为一轮)的话语编码，取最后一个时步的输出作为话语层级的特征向量；然后将所述话语层级的特征向量输入到另一个双向长短期记忆网络，对所述话语层级的特征向量序列进行编码得到对话层级的高层级特征向量。

优选地，所述分层上下文编码器模块110采用双向长短期记忆网络，使用监督学习的方式训练双向长短期记忆网络模型，词向量和隐藏状态的维度都设为300，以BIO形式对文本序列中的每个词进行标注。

元疾病推理模块111，用于通过外部知识库构建疾病-症状知识图，将分层上下文编码器模块110获得的特征向量初始化构建的疾病-症状知识图的话语结点，通过两层图注意力网络，分别将话语节点蕴含的信息传递到疾病节点与症状节点，同时将疾病与症状节点之间的信息进行扩散传播，得到最终的图节点特征向量。

具体地，元疾病推理模块111进一步包括：

知识图构建单元，用于通过外部知识库构建先验性的疾病-症状知识图A，所述知识图包含三类节点：话语节点，疾病节点以及症状节点。为了将话语节点和疾病、症状节点联系起来，将每个话语节点和该单轮话语包含的疾病、症状节点进行连边，为了建立疾病与症状之间的联系，通过查询外部知识库，将相关疾病和对应症状连边。

信息传递及扩散传播单元，用于通过两层图注意力网络，分别将话语节点蕴含的信息传递到疾病与症状节点，同时将疾病与症状节点之间的信息进行扩散传播，得到最终的疾病与症状图节点特征向量，节点特征更新如下：h_i＝σ(∑_j∈Nα_IJWh_j)，这使得元疾病图推理模块可以对疾病与症状的相互关系进行推理；

预测单元，用于将经信息传递及扩散传播单元得到的疾病与症状节点特征向量送入全连接神经网络，进行下一轮医生对病人的回复中可能出现症状的分类，根据分类结果，计算交叉熵损失函数，得到实体预测损失

这里是对症状的分类任务，即下一轮回复里可能出现哪些症状，而基于医疗知识图的解码器112的任务则是回复生成，旨在生成自然语言形式的回复。

基于医疗知识图的解码器112，用于在元疾病推理模块111获得的图节点特征向量的指导下，利用复制网络，从普通词表或者图节点集合动态选择解码的结果，生成智能医生对病人的回复。

具体地说，基于医疗知识图的解码器112根据元疾病推理模块111得到的最终的图节点特征向量(例如有50个图节点，则就有50个维度相等(假设维度为512)的一维特征向量，向量的每个元素为实数，例如某节点向量有512个实数元素，即[0.32，-1.21，0.89….])，分步依次生成每个单词，生成每个词的过程就是取所有候选词中生成概率最大的那个，生成概率分布来自于两部分：分别是普通词表概率分布和图节点的概率分布，两分布的加权求和得到最终的生成分布，即P_final＝(1-p_g)·P_V+p_g·P_E。假设最终生成的医生回复为：“你/应该/是/得了/肠炎。”生成每个词的过程就是取所有候选词中最后的生成概率P_final最大的那个，比如‘你’的生成概率最大，则先生成‘你’；后面则生成‘应该’等词。

具体地，解码器具体架构为双向长短期记忆网络(LSTM)，令x_t为解码器在t时刻的输入，s_t为解码器的状态，

为图节点特征向量，则复制权重为

其中“|”为两个向量的拼接操作，σ为Sigmoid激活函数，ω₁与b₁为可训练的参数。普通词表分布根据LSTM的计算公式得到，普通词表概率分布为：

其中

为上下文向量，v、ω₂与b₂为可训练的参数；图节点复制概率分布是根据注意力权重得到，图节点的复制概率分布为：

其中v′、ω₃与b₃为可训练的参数。

训练模块12，用于对智能医疗问诊***构建模块11构建的智能医疗问诊***进行端到端训练，利用图演化元学习算法在已有疾病的对话数据(即模拟病人构建模块10构建的模拟病人的对话样本)上训练所述***，当出现新疾病需要自动诊断时，将所述***通过在新疾病的少量数据上进行迁移微调，得到拓展后的对话问诊***。

具体地，训练模块12通过在旧疾病上对所述医疗问诊***进行元训练，使得所述***学习到疾病间通用的对话与诊断技巧，进而可以通过新疾病少量的对话样本进行微调，具备快速迁移到新疾病上完成问诊的能力。

对于每个旧的任务，元对话模型(即模拟病人构建模块10、智能医疗问诊***构建模块11、训练模块12形成的模型，通过元学习的方法进行训练，故称作元对话模型)首先进行一步梯度更新：

然后通过一阶与模型无关的元学习，得到元初始化模型θ_meta。使用所述的元初始化模型θ_meta，可以在需要诊断新疾病时，仅通过在少量对话数据上进行一步梯度更新θ_meta，即可快速迁移适应到新疾病上。

为了演化外部医疗知识图使其适应新疾病的问诊，训练模块14首先构造一个全局症状图A^*，具体构造方式为：以在线的形式收集所有可观察到的对话样本，提取对话样本中的症状节点，如果两个症状节点出现在同一个样本中，则将两症状节点进行连边操作；然后根据得到的所述全局症状图，元疾病知识图A的动态更新方式为A_meta＝A+A^*，A代表通过外部知识库构建的元疾病知识图，A^*代表通过对话样本提取构建的全局症状图，为了更精细地刻画疾病与症状的相互关系，将A_meta设置为元模型θ_meta参数的一部分，来动态学习准确的相互关系表征。

优选地，在训练阶段，给定元对话模型θ_meta和对话上下文U，使用生成回复r_i与真实回复R的负对数似然作为损失函数进行学习，计算方式为：

优选地，最终的损失函数为上述生成损失

与实体预测损失

的加权求和，权重系数为τ，最终的损失函数可表示为：

图3为本发明一种面向低资源场景可迁移的医疗问诊对话方法的步骤流程图。如图3所示，本发明一种面向低资源场景可迁移的医疗问诊对话方法，包括如下步骤：

步骤S1，建立模拟病人，所述模拟病人具有一定数量的对话样本，每次训练随机选取一个对话样本，针对所述模拟病人会给出其病情描述报告。一个对话样本包含多轮对话，所述病情描述是病人对自我病情的陈述，即病人在多轮对话中描述自己的症状。

步骤S2，建立一个智能医疗问诊***，所述智能医疗问诊***根据模拟病人的病情描述，通过分层上下文编码器模块从对话历史中提取不同层级的上下文信息，编码得到单轮层级和多轮层级对话的特征向量；通过演化外部的医疗知识图，根据得到的特征向量进行疾病-症状之间的关系推理，得到图节点特征向量，并在演化得到的图节点信息的指导下，利用复制网络，智能生成医生对病人的回复。

具体地，步骤S2进一步包括：

步骤S200，所述分层上下文编码器模块根据模拟病人的病情描述，通过两个长短时记忆网络提取医生与病人对话对话历史的上下文信息，将其编码成单轮层级和多轮层级对话的特征向量。

具体地，分层上下文编码器模块将模拟病人产生的对话样本输入到第一个双向长短期记忆网络，对每轮的话语编码，取最后一个时步的输出作为话语层级的特征向量；然后将所述话语层级的特征向量输入到另一个双向长短期记忆网络，对话语层级的特征向量序列进行编码得到对话层级的高层级特征向量。

优选地，所述分层上下文编码器模块采用双向长短期记忆网络，使用监督学习的方式训练双向长短期记忆网络模型，词向量和隐藏状态的维度都设为300，以BIO形式对文本序列中的每个词进行标注。

步骤S201，所述元疾病推理模块通过外部知识库构建疾病-症状知识图，并将步骤S200获得的特征向量初始化构建的疾病-症状知识图的话语结点，通过两层图注意力网络，分别将话语节点蕴含的信息传递到疾病节点与症状节点，同时将疾病与症状节点之间的信息进行扩散传播，得到最终的图节点特征向量。

具体地，步骤S201进一步包括：

步骤S201a，通过外部知识库构建先验性的疾病-症状知识图，所述知识图包含三类结点：话语节点，疾病节点，症状节点。为了将话语节点和疾病、症状节点联系起来，将每个话语节点和该单轮话语包含的疾病、症状节点进行连边。为了建立疾病与症状之间的联系，通过查询外部知识库，将相关疾病和对应症状连边。

步骤S201b，通过两层图注意力网络，分别将对话节点蕴含的信息传递到疾病与症状节点，同时将疾病与症状节点之间的信息进行扩散传播，得到最终的图节点特征向量，节点特征更新如下：h_i＝σ(∑_j∈Nα_IJWh_j)，这使得元疾病图推理模块可以对疾病与症状的相互关系进行推理；

步骤S201c，将经信息传递及扩散传播单元得到的疾病与症状节点特征向量送入全连接层，预测下一轮医生将要询问病人的症状。

步骤S202，在步骤S201获得的图节点特征向量的指导下，利用复制网络，从普通词表或者图节点集合动态选择解码的结果，生成智能医生对病人的回复。

具体地说，根据步骤S201得到的最终的图节点特征向量(例如有50个图节点，则就有50个维度相等(假设维度为512)的一维特征向量，向量的每个元素为实数，例如某节点向量有512个实数元素，即[0.32，-1.21，0.89….])，分步依次生成每个单词，生成每个词的过程就是取所有候选词中生成概率最大的那个，生成概率分布来自于两部分：分别是普通词表概率分布和图节点的概率分布，两分布的加权求和得到最终的生成分布，即P_final＝(1-p_g)·P_V+p_g·P_E。假设最终生成的医生回复为：“你/应该/是/得了/肠炎。”生成每个词的过程就是取所有候选词中最后的生成概率P_final最大的那个，比如‘你’的生成概率最大，则先生成‘你’；后面则生成‘应该’等词。

为图节点特征向量，则复制权重为

其中“”为两个向量的拼接操作，σ为Sigmoid激活函数，ω₁与b₁为可训练的参数。普通词表分布根据LSTM的计算公式得到，普通词表概率分布为：

其中

其中v′、ω₃与b₃为可训练的参数。

具体地，步骤S3进一步包括：

步骤S300，为了演化外部医疗知识图使其适应新疾病的问诊，首先构造一个全局症状图A^*，具体构造方式为：以在线的形式收集所有可观察到的对话样本，提取对话样本中的症状节点，如果两个症状节点出现在同一个样本中，则将两节点进行连边操作，这里的连边操作与步骤S201a类似，只是步骤S201a中是根据外部知识图谱得到图谱A，而这里是根据对话数据提取得到；根据得到的所述全局症状图，原疾病症状图动态更新方式为A_meta＝A+A*，其中A代表通过外部知识库构建的元疾病知识图谱，A^*代表通过对话样本提取构建的全局症状图；为了更精细地刻画疾病与症状的相互关系，将A_meta设置为元模型θ_meta参数的一部分，来动态学习准确的相互关系表征。

步骤S301，通过在旧疾病上对所述医疗问诊***进行元训练，使得所述***学习到疾病间通用的对话与诊断技巧，进而可以通过新疾病少量的对话样本进行微调，具备快速迁移到新疾病上完成问诊的能力。对于每个旧的任务，元对话模型首先进行一步梯度更新：

优选地，在训练阶段，使用生成回复与真实回复的负对数似然作为损失函数进行学习，计算方式为：

优选地，最终的损失函数为生成损失与实体预测损失的加权求和：

图4为本发明具体实施例中一种面向低资源场景可迁移的医疗问诊对话***的生成效果与可视化图，可见，本发明基于对话历史，对外部知识图进行了丰富和演化，成功推理出了患者的疾病，同时生成了质量较高的回复。说明本发明可以很好地迁移到未见过的新疾病上，特别是当新疾病对话数据量较少时，具备良好的迁移性能

上述实施例仅例示性说明本发明的原理及其功效，而非用于限制本发明。任何本领域技术人员均可在不违背本发明的精神及范畴下，对上述实施例进行修饰与改变。因此，本发明的权利保护范围，应如权利要求书所列。

Claims

1.一种面向低资源场景可迁移的医疗问诊对话***，包括：

智能医疗问诊***构建模块，用于建立一个智能医疗问诊***，所述智能医疗问诊***根据模拟病人的病情描述，通过分层上下文编码器模块从对话历史中提取不同层级的上下文信息，编码得到单轮层级和多轮层级对话的特征向量；通过演化外部的医疗知识图，根据得到的特征向量进行疾病-症状之间的关系推理，得到图节点特征向量，并在演化得到的图节点信息的指导下，利用复制网络，智能生成医生对病人的回复；

2.如权利要求1所述的一种面向低资源场景可迁移的医疗问诊对话***，其特征在于，所述智能医疗问诊***构建模块进一步包括：

3.如权利要求2所述的一种面向低资源场景可迁移的医疗问诊对话***，其特征在于：所述分层上下文编码器模块将模拟病人产生的对话样本输入到第一个双向长短期记忆网络，对每轮的话语编码，取最后一个时步的输出作为话语层级的特征向量；然后将所述话语层级的特征向量输入到另一个双向长短期记忆网络，对话语层级的特征向量序列进行编码得到对话层级的高层级特征向量。

4.如权利要求3所述的一种面向低资源场景可迁移的医疗问诊对话***，其特征在于：所述分层上下文编码器模块使用监督学习的方式训练双向长短期记忆网络模型。

5.如权利要求3所述的一种面向低资源场景可迁移的医疗问诊对话***，其特征在于：所述元疾病推理模块进一步包括：

6.如权利要求5所述的一种面向低资源场景可迁移的医疗问诊对话***，其特征在于：所说基于医疗知识图的解码器根据所述元疾病推理模块得到的最终的图节点特征向量，分步依次生成每个单词，生成每个单词的过程就是取所有候选词中生成概率最大的那个,预测分布来自于两部分：分别是普通词表分布和图节点集合的分布，两分布的加权求和得到最终的预测分布。

7.如权利要求6所述的一种面向低资源场景可迁移的医疗问诊对话***，其特征在于：所述训练模块通过在旧疾病上对所述智能医疗问诊***进行元训练，使得所述智能医疗问诊***学习到疾病间通用的对话与诊断技巧，进而可以通过新疾病少量的对话样本进行微调，具备快速迁移到新疾病上完成问诊的能力。

8.如权利要求7所述的一种面向低资源场景可迁移的医疗问诊对话***，其特征在于：于训练模型中，对于每个旧的任务，元对话模型首先进行一步梯度更新：

9.如权利要求8所述的一种面向低资源场景可迁移的医疗问诊对话***，其特征在于：所述训练模块以在线的形式收集所有可观察到的对话样本，提取对话样本中的症状节点，如果两个症状节点出现在同一个样本中，则将两症状节点进行连边操作；然后根据得到的所述全局症状图，原疾病症状图动态更新方式为A_meta＝A+A^*，并将A_meta设置为元模型θ_meta参数的一部分，来动态学习准确的相互关系表征。

10.一种面向低资源场景可迁移的医疗问诊对话方法，包括如下步骤：

步骤S1，建立一个模拟病人，所述模拟病人具有一定数量的对话样本，每次训练随机选取一个对话样本，并针对所述模拟病人给出其病情描述报告；