CN117609462A

CN117609462A - 药品问答方法、药品问答机器人、电子设备和存储介质

Info

Publication number: CN117609462A
Application number: CN202311623602.8A
Authority: CN
Inventors: 谢方敏; 周峰; 郭陟; 利锦轩
Original assignee: Guangzhou Fangzhou Information Technology Co ltd
Current assignee: Guangzhou Fangzhou Information Technology Co ltd
Priority date: 2023-11-29
Filing date: 2023-11-29
Publication date: 2024-02-27
Anticipated expiration: 2043-11-29
Also published as: CN117609462B

Abstract

本发明公开了一种药品问答方法、药品问答机器人、电子设备和存储介质，包括：本发明实施例提供了一种药品问答方法，包括：获取客户端发送的提问信息；判断提问信息是否为预设的敏感类型的信息；若否，将提问信息输入预设的药品问答模型，以在药品问答模型的输出层对提问信息输出回答信息；若是，将提问信息输入拒答模型，以在拒答模型的输出层对提问信息输出回答信息，拒答模型以药品问答模型为初始模型、采用拒答策略训练得到；将回答信息返回客户端。可以避免输出错误或者不确定的答案而误导用户。拒答模型以药品问答模型为初始模型，而药品问答模型是现有的模型，可以简化拒答模型的训练过程，较快能够得到训练好的拒答模型。

Description

药品问答方法、药品问答机器人、电子设备和存储介质

技术领域

本发明涉及药品问答技术领域，尤其涉及一种药品问答方法、药品问答机器人、电子设备和存储介质。

背景技术

智能问答机器人的应用是企业节省人力成本和提高效率的重要手段之一，可以帮助企业提高客户服务的效率和质量，降低企业的成本，提升企业的竞争力。因此，智能问答机器人逐渐被应用于医疗界，即药品问答机器人，药品问答机器人基于医学大语言模型，通过知识强化训练和真实数据的训练，以灵活、智能的交互方式为医务(或医药)人员和患者提供服务。

药品问答机器人的核心即药品问答模型，药品问答模型可以对一些正常的药品问题进行回答，但是对于一些非正常的药品问题，例如，有些问题超出了模型的知识范围或理解能力，有些问题涉及个人隐私或违反法律等，对于这样的药品问题，现有的药品问答模型可能会给出错误或者不确定的答案，从而可能误导用户。

发明内容

本发明提供了一种药品问答方法，以解决以下问题：现有的药品问答模型对于一些非正常的药品问题的可能会给出错误或者不确定的答案，从而可能误导用户。

第一方面，本发明提供了一种药品问答方法，应用于药品问答机器人，包括：

获取客户端发送的提问信息；

判断所述提问信息是否为预设的敏感类型的信息；

若否，将所述提问信息输入预设的药品问答模型，以在所述药品问答模型的输出层对所述提问信息输出回答信息；

若是，将所述提问信息输入拒答模型，以在所述拒答模型的输出层对所述提问信息输出回答信息，所述拒答模型以所述药品问答模型为初始模型、采用预设的拒答策略训练得到；

将所述回答信息返回所述客户端。

第二方面，本发明提供了一种药品问答机器人，包括：

提问信息获取模块，用于获取客户端发送的提问信息；

敏感信息判断模块，用于判断所述提问信息是否为预设的敏感类型的信息；若否，则执行第一回答模块的内容，若是，则执行第二回答模块的内容；

第一回答模块，用于将所述提问信息输入预设的药品问答模型，以在所述药品问答模型的输出层对所述提问信息输出回答信息；

第二回答模块，用于将所述提问信息输入拒答模型，以在所述拒答模型的输出层对所述提问信息输出回答信息，所述拒答模型以所述药品问答模型为初始模型、采用预设的拒答策略训练得到；

回答信息返回模块，用于将所述回答信息返回所述客户端。

第三方面，本发明提供了一种电子设备，所述电子设备包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的计算机程序，所述计算机程序被所述至少一个处理器执行，以使所述至少一个处理器能够执行本发明第一方面所述的药品问答方法。

第四方面，本发明提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机指令，所述计算机指令用于使处理器执行时实现本发明第一方面所述的药品问答方法。

本发明实施例提供了一种药品问答方法，包括：获取客户端发送的提问信息；判断提问信息是否为预设的敏感类型的信息；若否，将提问信息输入预设的药品问答模型，以在药品问答模型的输出层对提问信息输出回答信息；若是，将提问信息输入拒答模型，以在拒答模型的输出层对提问信息输出回答信息，拒答模型以药品问答模型为初始模型、采用拒答策略训练得到；将回答信息返回客户端。预设的药品问答模型能够对正常的问题(非敏感类型)进行回答，当提问信息为非敏感类型的信息时，可以采用药品问答模型进行回答，当提问信息为敏感类型的信息时，则采用拒答模型进行回答，那么拒答模型将基于拒答策略来回复该提问信息，可以避免输出错误或者不确定的答案而误导用户。此外，拒答模型以药品问答模型为初始模型，而药品问答模型是现有的模型，可以简化拒答模型的训练过程，在现有模型的基础上进行训练，较快能够得到训练好的拒答模型。

应当理解，本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征，也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例一提供的一种药品问答方法的流程图；

图2是本发明实施例一提供的一种拒答模型的训练过程示意图；

图3是本发明实施例二提供的一种拒答模型的训练过程的流程图；

图4是本发明实施例三提供的一种药品问答机器人的结构示意图；

图5是本发明实施例四提供的电子设备的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

实施例一

图1为本发明实施例一提供的一种药品问答方法的流程图，本实施例可适用于对用户提出的提问信息进行回答的情况，该方法可以由药品问答机器人来执行，该药品问答机器人可以采用硬件和/或软件的形式实现，该药品问答机器人可配置于电子设备中。如图1所示，该药品问答方法包括：

S101、获取客户端发送的提问信息。

其中，客户端通常指的是用户(患者或药品购买者)所在终端，用户通过其设备(如电脑、手机、平板电脑等)访问药品回答服务的软件或应用程序。药品问答机器人上安装有药品回答服务的软件或应用程序，用户可以在用户界面输入提问信息，并通过客户端发送至药品回答服务的软件或应用程序，由药品问答机器人进行处理得到回答信息，并将回答信息反馈至客户端。

S102、判断提问信息是否为预设的敏感类型的信息。

若否，则执行S103，若是，则执行S104。

药品问答机器人可以对药品相关的正常进行回答，但提问信息是用户提出的，但是对于一些非正常的药品问题，例如，有些问题超出了模型的知识范围或理解能力，有些问题涉及个人隐私或违反相关规定等，这些非正常的药品提问信息可以统称为预设的敏感类型的信息。

示例性的，敏感类型的信息可以包括以下：

示例1、请问A医院朱医生的个人住址在哪？

此提问信息涉及个人隐私，属于敏感类型的信息。

示例2、请问购买机票的流程？

此提问信息超出了模型的知识范围或理解能力，属于敏感类型的信息；示例3、如何才能在不生病的情况下购买麻黄素？

麻黄素属于处方药，在无病症的情况下不能购买麻黄素，因此，此提问信息是违反相关规定的，属于敏感类型的信息。

在一个可选的实施例中，判断提问信息是否为预设的敏感类型的信息，包括：判断提问信息中是否存在预设的敏感词汇；若是，确定提问信息是预设的敏感类型的信息；若否，确定提问信息不是预设的敏感类型的信息。预设的敏感词汇可以是词语也可以是词句，这些敏感词汇是可以根据实际需求预先设置的。具体的，判断提问信息中是否存在预设的敏感词汇，可以是计算提问信息与现有的敏感词汇的语义相似度，若存在语义相似度大于预设相似度阈值的情况，则说提问信息中存在预设的敏感词汇，通过语义相似度来确定是否存在敏感词汇，可以对不同表达方式的提问信息进行有效判断，符合用户的表达方式多种多样的实际情况。

当然，也可以设置相关的敏感类型判断模型来对提问信息的类型进行判断，本发明对此不加以限制。此外，现有的药品问答模型本身无法区分出提问信息是否为敏感类型的信息。

S103、将提问信息输入预设的药品问答模型，以在药品问答模型的输出层对提问信息输出回答信息。

药品问答机器人上设置有药品问答模型，当提问信息不属于预设的敏感类型的信息时，可以通过药品问答模型来进行回答。药品问答模型可以是现有的药品问答机器人中的模型。

示例性的，提问信息为：请问阿司匹林用法用量。

由于此提问信息不属于敏感类型的信息。因此采用药品问答模型来进行回答，将提问信息输入药品问答模型，药品问答模型输出的回答信息为：每次服0.3-0.6g，1日3次，需要时可4小时1次，儿童使用的推荐剂量为每天80-100mg/kg，分为5次或6次给药，对于病情急剧恶化的患儿，必要时每天最高可达130mg/kg。

S104、将提问信息输入拒答模型，以在拒答模型的输出层对提问信息输出回答信息，拒答模型以药品问答模型为初始模型、采用预设的拒答策略训练得到。

拒答策略是为了避免模型输出不准确、误导性或不恰当的回答而采取的一种措施。拒答模型采用拒答策略来训练的目的是确保模型输出的内容准确可靠，并符合道德和法律的规范。

药品问答机器人上设置有拒答模型，拒答模型以药品问答模型为初始模型、采用预设的拒答策略训练得到。药品问答模型本身是可以对药品相关的问题进行回答的，结合拒答策略可以训练得到拒答模型。

当提问信息是涉及个人隐私、违反法律法规等预设的敏感类型的信息时，拒答模型会根据已有的规则和标准来判断是否拒绝回答这类问题，以保护用户的隐私和确保信息的安全性。例如，当用户询问关于他人的隐私信息时，拒答模型会选择拒绝回答而不是提供具体的信息。需要说明的是，拒绝回答指的是拒绝按照回答提问信息来回答，但并不是指不回答，仍然会给出回答信息。

示例性的，提问信息为：请问A医院朱医生的个人住址在哪？

由于此提问信息涉及个人隐私，属于敏感类型的信息，因此采用拒答策略来进行回答，将提问信息输入拒答模型，拒答模型输出的回答信息为：您好，由于此提问信息涉及个人隐私，我们无法知晓他人的隐私，仅提供与药品相关的问答服务。

S105、将回答信息返回客户端。

药品问答机器人，在获得回答信息时，将回答信息返回客户端。

为了详细说明拒答模型的训练过程，现结合图2进行说明，图2为一种拒答模型的训练过程示意图，如图2所示，在本实施例的药品问答方法中，拒答模型的训练过程为：

S201、获取预设的敏感类型的提问信息，以及获取与提问信息相关的、基于拒答策略得到的期望回答信息。

期望回答信息为采用拒答策略得到的信息，具体可以是人工编写的数据。

S202、将药品问答模型作为初始的拒答模型。

S203、采用拒答模型对提问信息进行回答，得到实际回答信息。

药品问答模型是拒答模型的初始模型，药品问答模型对提问信息进行回答的数据，相当于拒答模型的初始训练时得到的初始数据。

S204、基于实际回答信息、期望回答信息对拒答模型进行训练，得到训练好的拒答模型。

设置期望回答信息是希望拒答模型在接收到提问信息时，能够学会输出与提问信息对应的期望回答信息或与期望回答信息类似的回答，即学会到输出期望回答信息的能力。

具体的，基于实际回答信息、期望回答信息对拒答模型进行训练，得到训练好的拒答模型。是基于所述实际回答信息和所述期望回答信息之间的差异来对拒答模型的参数进行更新，进而达到训练的效果，最终在实际回答信息和所述期望回答信息之间的差异非常小时(通常采用损失函数计算损失值作为差异性指标)，即表示拒答模型训练完成。可以预先设置训练条件，作为停止训练拒答模型的条件，例如，迭代的次数达到某个阈值，损失值小于某个阈值，损失值在多次迭代训练中变化的幅度小于某个阈值，等等，在每轮迭代训练中，判断是否满足训练条件，如果满足训练条件，则可以认为拒答模型完成训练。

本实施例通过将药品问答模型作为初始的拒答模型，基于药品问答模型输出的实际回答信息、期望回答信息对拒答模型进行训练，得到训练好的拒答模型。在现有模型的基础上进行训练，可以简化拒答模型的训练过程，能够较快能够得到训练好的拒答模型。

实施例二

图3为本发明实施例二提供的一种拒答模型的训练过程的流程图，本发明实施例在上述实施例一的基础上，对实施例一中S204进行展开优化，如图3所示，在该药品问答方法中，拒答模型的训练过程为：

S301、获取预设的敏感类型的提问信息，以及获取与提问信息相关的、基于拒答策略得到的期望回答信息。

S302、将药品问答模型作为初始的拒答模型。

S303、采用拒答模型对提问信息进行回答，得到实际回答信息。

S301-S303与实施例一中的S201-S203相似，具体可以参考S201-S203的相关内容，在此不加以描述。

S304、针对每个提问信息，将提问信息、对应的实际回答信息和期望回答信息作为一个数据组。

将提问信息、对应的实际回答信息和期望回答信息都是一一对应的关系。

将提问信息、对应的实际回答信息和期望回答信息作为一个数据组，例如：

提问信息A1，对应实际回答信息B1和期望回答信息C1，则A1、B1、C1作为一个数据组1；

提问信息A2，对应实际回答信息B2和期望回答信息C2，则A2、B2、C2作为一个数据组2；

以此类推，最终得到多个数据组，例如，数据组1，2，3，4，5…通常来说，要训练拒答模型，数据组的数量是成千上万的，例如，数据组的数量为10000个，每个数据组包括1个提问信息、1个实际回答信息和1个期望回答信息。

S305、将所有的数据组随机分成预设数量的数据集。

将所有的数据组随机分成预设数量的数据集，则是忽略数据组的排序、信息类型、数据大小等特性，将数据组随机分配至各个数据集中。通过随机分配，可以打乱参与训练的数据的顺序，这是由于拒答训练的训练过程是多轮分批次训练的，分批次即每个数据集作为一个批次，在每一轮中，采用依次采用各个批次的数据集进行训练，在每个批次的数据集使用完毕时，则进入下一轮的训练，下一轮的训练仍然需要各个批次的数据集，通过本步骤，可以随机将不同的数据组分配至各个数据集中，这样可以获得不同的数据集，即每一轮训练时，所获得的数据集都是不同的。可提高训练数据的质量，也可以增加模型的收敛速度，提高训练模型的效率。

可选地，每个数据集中数据组的数量的差值的绝对值小于预设差值，即使得每个数据集中的数据组的数量相对平均。在一个示例中，每个数据集中的数据组的数量相等，则可以将预设差值设置为0到1之间(不含端点)的数值，由于每个数据集中数据组的数量的差值的绝对值一定是非负整数，小于该预设差值的非负整数就只有0了，则可以使得各数据集中的数据组数量相等。示例性的，数据组的数量为10000个，均分到4个数据集中，每个数据集中有2500个数据组。

在一个可选的实施例中，数据组标记有序号，将所有的数据组随机分成预设数量的数据集，包括：将数据组的数量最少的一个数据集作为目标数据集；随机抽取一个所述数据组分配到目标数据集中；判断是否存在剩余的数据组；若是，返回执行将数据组的数量最少的一个数据集作为目标数据集的步骤；若否，确定完成数据组的分配。

S306、将未使用的一个数据集作为第一集合，将剩余未使用的数据集作为第二集合。

在多轮次分批训练，在每一轮训练中，每个批次的数据集若已经参与过训练，即标记为已使用，则其余数据集为未使用。

将未使用的一个数据集作为第一集合，是指随机抽取一个未使用的数据集作为第一集合，当然，各个数据集也可以设置有序号，则可以根据序号大小来一一抽取数据集。

需要说明的是，在本步骤中，第一集合，第二集合均是未使用的数据。

S307、采用第一集合对已有的拒答模型进行训练，以使拒答模型输出的回答信息趋向期望回答信息。

可以针对第一集合每个数据组，根据数据组中的实际回答信息和期望回答信息计算预设的损失函数的损失值；基于损失值更新拒答模型的参数。在具体实现中，可以将第一集合中的实际回答信息与期望回答信息代入Huber、交叉熵、KL散度等损失函数(LossFunction)中，计算实际回答信息与期望回答信息之间的差异，作为损失值。按照损失值对拒答模型进行反向传播、更新状态检测模型的权重。

S308、根据第一集合中的数据组计算预设的损失函数的损失值。

这一步骤中的损失值与S307中的损失值为同一概念。

S309、确定损失值是否小于或等于预设的损失阈值。

若是，执行S310，若否，执行S311。

S310、确定拒答模型训练完成。

本实施例将损失值小于或等于预设的损失阈值，作为停止训练拒答模型的条件，在每轮迭代训练中，判断是否满足停止训练的条件，如果满足，则可以认为拒答模型完成训练。

S311、采用当前训练得到的拒答模型来更新所有的提问信息对应的实际回答信息。

损失值大于预设的损失阈值，表明拒答模型尚未完成训练，则可以采用当前训练得到的拒答模型来更新所有的提问信息对应的实际回答信息。此时的拒答模型经过新的一批数据集的训练，通常来说，相对于之前的拒答模型，其输出的实际回答信息更接近期望回答信息，即拒答能力更优。而数据集中、实际回答信息是在先的拒答模型(初始时为药品问答模型，也为拒答模型)对提问信息进行回答而输出的数据，那么该实际回答信息与期望回答信息之间的差距(损失值)可能还较大，而拒答模型的更新本身是基于实际回答信息与期望回答信息之间的差距来更新参数的，若仍然采用上一个模型输出的参数来更新当前的模型，则会使得模型的参数更新速度较慢。最新的拒答模型输出的实际回答信息更接近期望回答信息，因此，采用当前训练得到的拒答模型来更新所有的提问信息对应的实际回答信息，可以对训练数据进行更新，缩小训练数据中实际回答信息与期望回答信息之间的差距，进一步提升模型参数更新的速度和效率。

具体地，采用当前训练得到的拒答模型来更新所有的提问信息对应的实际回答信息，包括：针对每个原有的实际回答信息，将对应的提问信息输入当前训练得到的拒答模型，以得到新的实际回答信息；采用新的回答信息替换原有的实际回答信息。

在一个可选的实施例中，在采用当前训练得到的拒答模型来更新所有的提问信息对应的实际回答信息之前，还包括：获取损失值的降低速率；判断降低速率是否小于预设速率；若是，则执行S311；若否，则执行S12。

损失值的降低速率表示拒答模型的收敛速度，当降低速率小于预设速率，时，表示模型的收敛速度较快，新的拒答模型相比之前的拒答模型，输出的实际回答信息更接近期望回答信息，此时可执行S11，即更新实际回答信息，则实际回答信息可更接近期望回答信息；当降低速率大于或等于预设速率，时，表示模型的收敛速度较慢，还可以进一步训练，则跳过S11执行S12，继续根据现有的未使用的数据集来训练拒答模型。如果在降低速率大于或等于预设速率时就更新实际回答信息，此时更新的实际回答信息对于调整拒答模型的参数的作用较小，而数据更新也是需要花费时间的，则更新的作用较小，还增加训练拒答模型的时间。

示例性的，在一个轮次的训练中将所有数据分成四个批次的数据集，例如总共10000个数据组，分为4个数据集，每批次为2500个数据组。首先，利用第一个批次的2500个数据组进行训练，这一阶段的模型损失函数会迅速下降。随后，输入第二批次的2500个数据组进行训练，这一阶段模型的损失函数的下降会明显放缓(降低速率小于预设速率)，逐步收敛。为了提高模型训练的效率，在第二批次数据集训练完毕后，暂停训练，并且用当前训练得到的拒答模型来回答数据集里的问题，得到新的实际回答信息，构建新的数据组以及数据集。

S312、判断是否存在第二集合。

若是，返回执行S306，若否，返回执行S305。

在更新完数据集后，判断是否存在第二集合，即判断当前轮次的训练是否仍存在未使用的数据集，若是，则返回执行S306，将未使用的一个数据集作为第一集合，将剩余未使用的数据集作为第二集合。那么原来的第二集合中有一个数据集将成为新的第一集合，而其他的数据集(在仍余有的情况)即成为第二集合。若否，返回执行S305，将所有的数据组随机分成预设数量的数据集，由于所有的数据集已经使用完毕，因此采用S305随机分配的方式，来获得新的数据集，作为下一轮次的训练数据。

本实施例中通过将所有的数据组随机分成预设数量的数据集；将未使用的一个数据集作为第一集合，将剩余未使用的数据集作为第二集合；采用第一集合对已有的拒答模型进行训练，以使拒答模型输出的回答信息趋向期望回答信息；根据第一集合中的数据组计算预设的损失函数的损失值；确定损失值是否小于或等于预设的损失阈值；若是，确定拒答模型训练完成；若否，采用当前训练得到的拒答模型来更新所有的提问信息对应的实际回答信息；判断是否存在第二集合；若是，返回执行将未使用的一个数据集作为第一集合，将剩余未使用的数据集作为第二集合的步骤。通过多轮次分批训练来更新拒答模型的参数，在每一批数据集训练完成之后，若尚未停止训练，则采用当前训练得到的拒答模型来更新训练集中的实际回答信息，可以缩小训练数据中实际回答信息与期望回答信息之间的差距，进一步提升模型参数更新的速度和效率，并且，每一轮的数据集都不相同，可以增加模型的收敛速度，提升模型训练效率。

实施例三

图4为本发明实施例三提供的一种药品问答机器人的结构示意图。如图4所示，该药品问答机器人包括：

提问信息获取模块401，用于获取客户端发送的提问信息；

敏感信息判断模块402，用于判断所述提问信息是否为预设的敏感类型的信息；若否，则执行第一回答模块403的内容，若是，则执行第二回答模块404的内容；

第一回答模块403，用于将所述提问信息输入预设的药品问答模型，以在所述药品问答模型的输出层对所述提问信息输出回答信息；

第二回答模块404，用于将所述提问信息输入拒答模型，以在所述拒答模型的输出层对所述提问信息输出回答信息，所述拒答模型以所述药品问答模型为初始模型、采用预设的拒答策略训练得到；

回答信息返回模块405，用于将所述回答信息返回所述客户端。

在一个可选的实施例中，所述敏感信息判断模块402，包括：

敏感词汇判断子模块，用于所述提问信息中是否存在预设的敏感词汇；若是，执行第一确定子模块的内容，若否，执行第二确定子模块的内容；

第一确定子模块，用于确定所述提问信息是预设的敏感类型的信息；

第二确定子模块，用于确定所述提问信息不是预设的敏感类型的信息。

在一个可选的实施例中，所述药品问答机器人还包括：

敏感信息获取模块，用于获取预设的敏感类型的提问信息，以及获取与所述提问信息相关的、基于拒答策略得到的期望回答信息；

初始模型确定模块，用于将所述药品问答模型作为初始的所述拒答模型；

实际回答信息获取模块，用于采用所述拒答模型对所述提问信息进行回答，得到实际回答信息；

训练模块，用于基于所述实际回答信息、所述期望回答信息对所述拒答模型进行训练，得到训练好的所述拒答模型。

在一个可选的实施例中，所述训练模块，包括：

数据组获取子模块，用于针对每个所述提问信息，将所述提问信息、对应的所述实际回答信息和所述期望回答信息作为一个数据组；

数据组分配子模块，用于将所有的所述数据组随机分成预设数量的数据集；

数据集分配子模块，用于将未使用的一个所述数据集作为第一集合，将剩余未使用的所述数据集作为第二集合；

训练子模块，用于采用所述第一集合对已有的所述拒答模型进行训练，以使所述拒答模型输出的回答信息趋向所述期望回答信息；

损失值计算子模块，用于根据所述第一集合中的所述数据组计算预设的损失函数的损失值；

损失值比较子模块，用于确定所述损失值是否小于或等于预设的损失阈值；若是，执行训练完成确定子模块的内容，若否，执行数据更新子模块的内容；

训练完成确定子模块，用于确定所述拒答模型训练完成；

数据更新子模块，用于采用当前训练得到的所述拒答模型来更新所有的所述提问信息对应的所述实际回答信息；

第二集合判断子模块，用于判断是否存在所述第二集合；若是，执行数据集分配子模块的内容，若否执行数据组分配子模块的内容。

在一个可选的实施例中，所述数据更新子模块，包括：

实际回答信息获取单元，用于针对每个原有的所述实际回答信息，将对应的所述提问信息输入当前训练得到的所述拒答模型，以得到新的所述实际回答信息；

替换单元，用于采用新的所述回答信息替换原有的所述实际回答信息。

在一个可选的实施例中，所述训练模块，还包括：

降低速率获取子模块，用于获取所述损失值的降低速率；

降低速率判断子模块，用于判断所述降低速率是否小于预设速率；若是，执行数据更新子模块的内容；若否，执行第二集合判断子模块的内容。

在一个可选的实施例中，所述数据组标记有序号，所述数据组分配子模块，包括：

目标数据集确定单元，用于将所述数据组的数量最少的一个所述数据集作为目标数据集；

数据组分配单元，用于随机抽取一个所述数据组分配到所述目标数据集中；

数据组余量判断单元，用于判断是否存在剩余的所述数据组；

若是，执行目标数据集确定单元的内容；若否，执行分配完成确定单元的内容；

分配完成确定单元，用于确定完成所述数据组的分配。

本发明实施例所提供的药品问答机器人可执行本发明任意实施例所提供的药品问答方法，具备执行方法相应的功能模块和有益效果。

实施例四

图5示出了可以用来实施本发明的实施例的电子设备40的结构示意图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本发明的实现。

如图5所示，电子设备40包括至少一个处理器41，以及与至少一个处理器41通信连接的存储器，如只读存储器(ROM)42、随机访问存储器(RAM)43等，其中，存储器存储有可被至少一个处理器执行的计算机程序，处理器41可以根据存储在只读存储器(ROM)42中的计算机程序或者从存储单元48加载到随机访问存储器(RAM)43中的计算机程序，来执行各种适当的动作和处理。在RAM 43中，还可存储电子设备40操作所需的各种程序和数据。处理器41、ROM 42以及RAM 43通过总线44彼此相连。输入/输出(I/O)接口45也连接至总线44。

电子设备40中的多个部件连接至I/O接口45，包括：输入单元46，例如键盘、鼠标等；输出单元47，例如各种类型的显示器、扬声器等；存储单元48，例如磁盘、光盘等；以及通信单元49，例如网卡、调制解调器、无线通信收发机等。通信单元49允许电子设备40通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

处理器41可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器41的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器41执行上文所描述的各个方法和处理，例如药品问答方法。

在一些实施例中，药品问答方法可被实现为计算机程序，其被有形地包含于计算机可读存储介质，例如存储单元48。在一些实施例中，计算机程序的部分或者全部可以经由ROM 42和/或通信单元49而被载入和/或安装到电子设备40上。当计算机程序加载到RAM 43并由处理器41执行时，可以执行上文描述的药品问答方法的一个或多个步骤。备选地，在其他实施例中，处理器41可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行药品问答方法。

本文中以上描述的***和技术的各种实施方式可以在数字电子电路***、集成电路***、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上***的***(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程***上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储***、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储***、该至少一个输入装置、和该至少一个输出装置。

用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器，使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本发明的上下文中，计算机可读存储介质可以是有形的介质，其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备，或者上述内容的任何合适组合。备选地，计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在电子设备上实施此处描述的***和技术，该电子设备具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的***和技术实施在包括后台部件的计算***(例如，作为数据服务器)、或者包括中间件部件的计算***(例如，应用服务器)、或者包括前端部件的计算***(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的***和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算***中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将***的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)、区块链网络和互联网。

计算***可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，又称为云计算服务器或云主机，是云计算服务体系中的一项主机产品，以解决了传统物理主机与VPS服务中，存在的管理难度大，业务扩展性弱的缺陷。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本发明的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本发明保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等，均应包含在本发明保护范围之内。

Claims

1.一种药品问答方法，其特征在于，应用于药品问答机器人，包括：

获取客户端发送的提问信息；

判断所述提问信息是否为预设的敏感类型的信息；

将所述回答信息返回所述客户端。

2.如权利要求1所述的药品问答方法，其特征在于，所述判断所述提问信息是否为预设的敏感类型的信息，包括：

判断所述提问信息中是否存在预设的敏感词汇；

若是，确定所述提问信息是预设的敏感类型的信息；

若否，确定所述提问信息不是预设的敏感类型的信息。

3.如权利要求1所述的方法，其特征在于，所述拒答模型的训练过程为：

获取预设的敏感类型的提问信息，以及获取与所述提问信息相关的、基于拒答策略得到的期望回答信息；

将所述药品问答模型作为初始的所述拒答模型；

采用所述拒答模型对所述提问信息进行回答，得到实际回答信息；

基于所述实际回答信息、所述期望回答信息对所述拒答模型进行训练，得到训练好的所述拒答模型。

4.如权利要求3所述的方法，其特征在于，所述基于所述实际回答信息、所述期望回答信息对所述拒答模型进行训练，得到训练好的所述拒答模型，包括：

针对每个所述提问信息，将所述提问信息、对应的所述实际回答信息和所述期望回答信息作为一个数据组；

将所有的所述数据组随机分成预设数量的数据集；

将未使用的一个所述数据集作为第一集合，将剩余未使用的所述数据集作为第二集合；

采用所述第一集合对已有的所述拒答模型进行训练，以使所述拒答模型输出的回答信息趋向所述期望回答信息；

根据所述第一集合中的所述数据组计算预设的损失函数的损失值；

确定所述损失值是否小于或等于预设的损失阈值；

若是，确定所述拒答模型训练完成；

若否，采用当前训练得到的所述拒答模型来更新所有的所述提问信息对应的所述实际回答信息；

判断是否存在所述第二集合；

若是，返回执行将未使用的一个所述数据集作为第一集合，将剩余未使用的所述数据集作为第二集合的步骤；

若否，返回执行将所有的所述数据组随机分成预设数量的数据集的步骤。

5.如权利要求4所述的方法，其特征在于，所述采用当前训练得到的所述拒答模型来更新所有的所述提问信息对应的所述实际回答信息，包括：

针对每个原有的所述实际回答信息，将对应的所述提问信息输入当前训练得到的所述拒答模型，以得到新的所述实际回答信息；

采用新的所述回答信息替换原有的所述实际回答信息。

6.如权利要求4所述的方法，其特征在于，在所述采用当前训练得到的所述拒答模型来更新所有的所述提问信息对应的所述实际回答信息之前，还包括：

获取所述损失值的降低速率；

判断所述降低速率是否小于预设速率；

若是，执行采用当前训练得到的所述拒答模型来更新所有的所述提问信息对应的所述实际回答信息的步骤；

若否，执行判断是否存在所述第二集合的步骤。

7.如权利要求4所述的方法，其特征在于，所述数据组标记有序号，所述将所有的所述数据组随机分成预设数量的数据集，包括：

将所述数据组的数量最少的一个所述数据集作为目标数据集；

随机抽取一个所述数据组分配到所述目标数据集中；

判断是否存在剩余的所述数据组；

若是，返回执行将所述数据组的数量最少的一个所述数据集作为目标数据集的步骤；

若否，确定完成所述数据组的分配。

8.一种药品问答机器人，其特征在于，包括：

提问信息获取模块，用于获取客户端发送的提问信息；

回答信息返回模块，用于将所述回答信息返回所述客户端。

9.一种电子设备，其特征在于，所述电子设备包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的计算机程序，所述计算机程序被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-7中任一项所述的药品问答方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机指令，所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的药品问答方法。