CN111243682A

CN111243682A - 药物的毒性预测方法及装置、介质和设备

Info

Publication number: CN111243682A
Application number: CN202010025245.5A
Authority: CN
Inventors: 张露
Original assignee: BOE Technology Group Co Ltd
Current assignee: BOE Technology Group Co Ltd
Priority date: 2020-01-10
Filing date: 2020-01-10
Publication date: 2020-06-05

Abstract

本公开涉及大数据处理技术领域，提供了一种药物的毒性预测方法及装置，以及实现上述药物的毒性预测方法的计算机存储介质和电子设备。其中，该训练方法包括：获取待测药物分子，并确定待测药物分子对应的待测描述特征；通过毒性预测模型的N个自注意力头并行对待测描述特征进行特征抽取，得到N个待测自注意力特征，其中，N为大于1的整数；拼接N个待测自注意力特征，得到待测药物分子对应的待测拼接特征；基于毒性预测模型的分类层确定待测拼接特征对应的毒性等级。本技术方案能够提升对毒性预测的准确性。

Description

药物的毒性预测方法及装置、介质和设备

技术领域

本公开涉及大数据处理技术领域，具体而言，涉及一种药物的毒性预测方法及装置，以及实现上述药物的毒性预测方法的计算机存储介质和电子设备。

背景技术

药物的毒性预测是药物研发的重要组成部分。相关技术提供的药物的毒性预测方法一般为：通过动物对待检测药物分子的反映来确定毒性。然而，在实验过程中，动物很可能会因为毒性过大而死亡。从而，不能准确确定待测药物分的毒性等级。

可见，相关技术提供的药物的毒性预测方法的预测准确度有待提高。

需要说明的是，上述背景技术部分公开的信息仅用于加强对本公开的背景的理解。

发明内容

本公开的目的在于提供一种药物的毒性预测方法及装置、及装置，以及实现上述药物的毒性预测方法和上述的计算机存储介质和电子设备，进而至少在一定程度上提升对毒性预测的准确性。

本公开的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本公开的实践而习得。

根据本公开的一个方面，提供一种药物的毒性预测方法，包括：

获取待测药物分子，并确定上述待测药物分子对应的待测描述特征；

通过毒性预测模型的N个自注意力头并行对上述待测描述特征进行特征抽取，得到N个待测自注意力特征，其中，N为大于1的整数；

拼接上述N个待测自注意力特征，得到上述待测药物分子对应的待测拼接特征；

基于上述毒性预测模型的分类层确定上述待测拼接特征对应的毒性等级。

在本公开的一些实施例中，基于前述方案，上述方法还包括：

获取海量药物分子和确定每个所述药物分子对应的描述特征，根据上述药物分子对应的描述特征得到样本集；

将上述样本集中的任一训练样本输入上述N个自注意力头，通过第i个自注意力头对应的权重矩阵对上述训练样本进行特征提取，得到第i个自注意力头对应的注意力特征，其中，i的取值范围为小于等于N的正整数；

通过拼接矩阵将N个自注意力特征拼接，得到上述训练样本对应的组合特征；

对上述组合特征进行分类得到上述训练样本的预测毒性等级，并基于上述预测毒性等级和上述训练样本的实际毒性等级之间的损失训练上述权重矩阵和上述拼接矩阵。

在本公开的一些实施例中，基于前述方案，通过毒性预测模型的N个自注意力头并行对上述待测描述特征进行特征抽取，包括：

根据所述待测描述特征确定第一向量Q、第二向量K和第三向量V；

分别通过训练后的第一权重矩阵W_i ^Q、训练后第二权重矩阵

和训练后第三权重矩阵W_i ^V，对上述待测描述特征的上述第一向量Q、上述第二向量K和上述第三向量V进行特征提取，得到上述第i个自注意力头对应的自注意力特征。

在本公开的一些实施例中，基于前述方案，拼接上述N个待测自注意力特征，包括：

通过训练后的拼接矩阵拼接上述N个待测自注意力特征。

通过上述样本集中的测试样本对上述预测模型进行测试，以使上述预测模型满足以下指标中的一种或多种：准确率、召回率和接收者操作特征曲线下面积AUC。

在本公开的一些实施例中，基于前述方案，确定上述待测药物分子对应的待测描述特征，包括：

根据上述待测药物分子的电子描述符、空间描述符、结构描述符、热力学描述符和拓扑描述符来描述中的一种或多种确定上述待测药物分子对应的待测描述特征。

在本公开的一些实施例中，基于前述方案，根据上述药物分子对应的描述特征确定样本集，包括：

确定每个药物分子对应的描述特征，并对上述海量药物分子对应的描述特征进行去重处理；

对去重处理后的描述特征进行归一化处理，得到上述样本集。

根据本公开的一个方面，提供一种药物的毒性预测装置，包括：

特征确定模块，被配置为：获取待测药物分子，并确定上述待测药物分子对应的待测描述特征；

特征提取模块，被配置为：通过毒性预测模型的N个自注意力头并行对上述待测描述特征进行特征抽取，得到N个待测自注意力特征，其中，N为大于1的整数；

特征拼接模块，被配置为：拼接上述N个待测自注意力特征，得到上述待测药物分子对应的待测拼接特征；

毒性等级预测模块，被配置为：基于上述毒性预测模型的分类层确定上述待测拼接特征对应的毒性等级。

根据本公开的一个方面，提供了一种计算机存储介质，其上存储有计算机程序，上述计算机程序被处理器执行时实现第一方面所述的药物的毒性预测方法。

根据本公开的一个方面，提供一种电子设备，包括：处理器；以及存储器，用于存储上述处理器的可执行指令；其中，上述处理器配置为经由执行上述可执行指令来执行上述第一方面所述的药物的毒性预测方法。

由上述技术方案可知，本公开示例性实施例中的药物的毒性预测方法及装置、及装置，以及实现上述药物的毒性预测方法和上述的计算机存储介质和电子设备至少具备以下优点和积极效果：

在本公开的一些实施例所提供的技术方案中，首先，根据获取到的待测药物分子确定其所对应的待测描述特征；然后，通过毒性预测模型的N个自注意力头并行对上述待测描述特征进行特征抽取，得到N个待测自注意力特征；从而获取到该待测药物分子在多个不同水平上的关键特征；进一步地，拼接上述N个待测自注意力特征，得到上述待测药物分子对应的待测拼接特征，则基于毒性预测模型的分类层确定该待测拼接特征对应的毒性等级。本技术方案在待测药物分子的描述特征中提取特征的过程中利用了多层注意力机制，从而提升了抽取关键特征的能力，有利于提高对毒性预测的准确性；同时，多层注意力机制通过并行运算的方式有利于提升服务器的计算能力。

本公开应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

在附图中：

图1示出了可以应用本公开实施例的技术方案的示例性***架构的示意图；

图2示意性示出了根据本公开的一实施例的模型样本的确定和使用方法的流程图；

图3示意性示出了根据本公开的一实施例的毒性预测模型的训练方法的流程图；

图4示意性示出了根据本公开的一实施例的样本集的确定方法的流程图；

图5示意性示出了根据本公开的一实施例的特征处理流程图；

图6示意性示出了根据本公开的另一实施例的模型样本的确定和使用方法的流程图；

图7示意性示出了根据本公开的一实施例的药物的毒性预测装置的结构图；以及，

图8示出本公开示例性实施例中电子设备的结构示意图。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而，示例实施方式能够以多种形式实施，且不应被理解为限于在此阐述的范例；相反，提供这些实施方式使得本公开将更加全面和完整，并将示例实施方式的构思全面地传达给本领域的技术人员。

此外，所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中，提供许多具体细节从而给出对本公开的实施例的充分理解。然而，本领域技术人员将意识到，可以实践本公开的技术方案而没有特定细节中的一个或更多，或者可以采用其它的方法、组元、装置、步骤等。在其它情况下，不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。

附图中所示的方框图仅仅是功能实体，不一定必须与物理上独立的实体相对应。即，可以采用软件形式来实现这些功能实体，或在一个或多个硬件模块或集成电路中实现这些功能实体，或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

附图中所示的流程图仅是示例性说明，不是必须包括所有的内容和操作/步骤，也不是必须按所描述的顺序执行。例如，有的操作/步骤还可以分解，而有的操作/步骤可以合并或部分合并，因此实际执行的顺序有可能根据实际情况改变。

本公开实施例提供的方案涉及人工智能的机器学习等技术，具体通过如下实施例进行说明：

图1示出了可以应用本公开实施例的一种药物的毒性预测方法及装置、及装置的示例性应用环境的***架构的示意图。

如图1所示，***架构100可以包括终端设备101、102、103中的一个或多个，网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。终端设备101、102、103可以是具有显示屏的各种电子设备，包括但不限于台式计算机、便携式计算机、智能手机和平板电脑等等。应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。比如服务器105可以是多个服务器组成的服务器集群等。

本公开实施例所提供的药物的毒性预测方法、一般由服务器105执行，相应地，药物的毒性预测装置、一般设置于服务器105中。但本领域技术人员容易理解的是，本公开实施例所提供的药物的毒性预测方法、也可以由终端设备101、102、103执行，相应的，药物的毒性预测装置、装置也可以设置于终端设备101、102、103中，本示例性实施例中对此不做特殊限定。

举例而言，在一种示例性实施例中，可以是终端设备101、102、103确定待预测毒性的待测药物分子并发送至服务器105；从而，服务器105获取上述待测药物分子，并确定所述待测药物分子对应的待测描述特征；然后，服务器105通过毒性预测模型的N个自注意力头并行对所述待测描述特征进行特征抽取，得到N个待测自注意力特征，其中，N为大于1的整数。进一步地，服务器105拼接所述N个待测自注意力特征，得到所述待测药物分子对应的待测拼接特征；最终，服务器105基于所述毒性预测模型的分类层确定所述待测拼接特征对应的毒性等级。

示例性的，服务器105还可以将上述毒性预测模型发送至终端设备101、102、103。从而，用户可以通过终端设备101、102、103中的训练后的毒性预测模型方便地预测待测药物分子的毒性等级。

在相关技术提供的药物研发过程中，大约60％的候选药物在动物实验中由于毒性过大而导致研发失败，这浪费了实验人员大量的时间和资金。随着计算机科学技术的迅速崛起和生物医学数据的爆发，计算机辅助药物设计(Computer Aided Drug Design,简称：CADD)成为药物研发早期研究创新药物的关键技术之一。

目前常用的CADD方法分为基于配体的药物设计和基于受体的药物设计。基于配体的药物设计主要是基于药物小分子等靶标，根据药物分子的结构和化学性质，采用机器学习算法建模并预测药物分子是否具有毒性。相比传统的动物实验方法，基于深度学习技术的计算机辅助药物毒性研究可以缩短研发周期，节省大量的人力和金钱，从而降低研发成本，缩短研发周期。

但是发明人发现，目前常用的机器学习算法有随机森林、支持向量机和人工神经网络。一方面，这些方法需要手动或半手动筛选表征药物分子的分子描述符，且只适合结构差异小的药物体系；另一方面，对于描述符个数多而样本量小的药物体系，直接采用人工神经网络的方法容易造成过拟合的后果，导致药物分子的毒性预测不准确。

针对相关技术中存在一种或多种技术问题，本技术方案提供一种药物的毒性预测方法及装置，以及实现上述药物的毒性预测方法的计算机存储介质和电子设备，至少在一定程度上提升药物分子的预测准确度。

以下先对本公开提供药物的毒性预测方法实施例的进行详细阐述：

图2示意性示出了根据本公开的一实施例的药物的毒性预测方法的流程图。具体的，参考图2，该图所示实施例包括：

步骤S210，获取待测药物分子，并确定所述待测药物分子对应的待测描述特征；

步骤S220，通过毒性预测模型的N个自注意力头并行对所述待测描述特征进行特征抽取，得到N个待测自注意力特征，其中，N为大于1的整数；

步骤S230，拼接所述N个待测自注意力特征，得到所述待测药物分子对应的待测拼接特征；以及，

步骤S240，基于所述毒性预测模型的分类层确定所述待测拼接特征对应的毒性等级。

在图2所示实施例提供的技术方案中，首先，根据获取到的待测药物分子确定其所对应的待测描述特征；然后，通过毒性预测模型的N个自注意力头并行对所述待测描述特征进行特征抽取，得到N个待测自注意力特征；从而获取到该待测药物分子在多个不同水平上的关键特征；进一步地，拼接上述N个待测自注意力特征，得到所述待测药物分子对应的待测拼接特征，则基于毒性预测模型的分类层确定该待测拼接特征对应的毒性等级。本技术方案在待测药物分子的描述特征中提取特征的过程中利用了多层注意力机制，从而提升了抽取关键特征的能力，有利于提高对毒性预测的准确性；同时，多层注意力机制通过并行运算的方式有利于提升服务器的计算能力。

可见，本技术方案通过训练后的机器学习模型(上述毒性预测模型)来预测待测药物分子的毒性等级。因此，以下实施例先对上述毒性预测模型的训练方法进行说明。

在示例性的实施例中，图3示意性示出了根据本公开的一实施例的训练集的确定方法的流程图。参考图3，该图所示实施例包括步骤S310-步骤S340。

在步骤S310中，获取海量药物分子和确定每个所述药物分子对应的描述特征，根据所述描述特征得到样本集。

在示例性的实施例中，图4示意性示出了根据本公开的一实施例的毒性预测模型的训练方法的流程图，具体可以作为步骤S310的一种具体实施方式。参考图4，该图所示实施例包括步骤S410-步骤S440。

在步骤S410中，先获取海量药物分子以及确定每个药物分子对应的描述特征。

示例性的，从已知药物毒性等级的数据库(如，TOXNET数据库)中收集大量有机化合物(即，药物分子)，以及各个有机化合物的毒性等级数据。同时，每个药物有机化合物均对应有毒性等级的标签。示例性的，毒性标签按照毒性由强到弱包括：毒性A级、毒性B级和毒性C级，另外，毒性标签还包括毒性0级(即无毒)。

示例性的，由于药物分子的毒性等级，与药物分子的大小、形状、构成、带电量以及分子极性等性质相关。所以，确定用于描述每个药物分子的理化性质、结构特征和类药性质的电子描述符、空间描述符、结构描述符、热力学描述符和拓扑描述符。进一步地，根据药物分子的电子描述符、空间描述符、结构描述符、热力学描述符和拓扑描述符来描述中的一种或多种确定该药物分子对应的描述特征(也称作“药物分子描述符”)。

在步骤S410中，还对所述海量药物分子对应的描述特征进行去重处理。

示例性的，为了确定样本集中数据的有效性，以进一步提升模型的预测准确度，将描述特征值相似度大于90％的多个药物分子进行去重，仅留一个；另外，去除描述特征值中90％为0的药物分子，去除描述特征的方差值为零的药物分子。

在步骤S420中，对去重处理后的描述特征进行归一化处理，得到所述样本集。

示例性的，为了保障模型预测结果的准确可靠，本技术方案中，将上述样本集分为训练样本和测试样本。示例性的，使得训练样本集和测试样本集的比例为8:2。

其中，上述训练样本用于步骤S430中的模型训练；上述测试样本用于步骤S440中对迭代优化后的模型进行模型测试，以使得训练后的毒性预测模型满足相关评价指标，如，准确率、召回率和接收者操作特征曲线下面积AUC。

在示例性的实施例中，继续参考图3，在确定训练样本之后，在步骤S320中，将所述样本集中的任一训练样本(记作，目标样本)输入所述N个自注意力头，通过第i个自注意力头对应的权重矩阵对所述训练样本进行特征提取，得到所述自注意力特征，其中，i的取值范围为小于等于N的正整数。

示例性的，结合图5示意性示出的一特征处理流程图对步骤S320和步骤S330的具体实施方式进行解释说明：

在示例性的实施例中，对于任一的训练样本(即上述目标样本)，其描述特征可以表示为{h₀,…,h_t-1,h_t}。参考图5，将目标样本对应的描述特征{h₀,…,h_t-1,h_t}输入包含N个自注意力头的多头注意力层51。其中，输入训练样本之前，每个自注意力层中权重矩阵的值是随机确定的，需要注意的是，不同的自注意力层，其中的权重矩阵的值不同，以保证在不同自注意力层中，能够提取到上述目标药物描述特征的不同注意力特征。

示例性的，在每个自注意力层中，将目标样本的描述特征用三个相同向量来表示，例如三个相同向量可以表示为：第一向量Q、第二向量K和第三向量V，将三个向量输入至多头注意力层51中。

示例性的，在第i个自注意力头对应的自注意力机制中，通过第i个自注意力头对应的第一权重矩阵W_i ^Q提取上述第一向量Q的特征、通过第二权重矩阵

提取上述第二向量K的特征，以及通过第三权重矩阵W_i ^V提取上述第三向量Q的特征，从而，经过N个自注意力头对应的自注意力机制，便可以确定上述目标样本的自注意力特征。

示例性的，对于i个自注意力头对上述目标样本的特征提取，得到经过第i个自注意力头对应的自注意力特征H_i，可以根据公式一和公式二确定。其中，

代表缩放因子。

在示例性的实施例中，对于上述目标样本，可以确定N个自注意力特征H_i。继续参考图3，在确定第i个自注意力头对应的自注意力特征H_i之后，在步骤S330中，通过拼接矩阵将N个自注意力特征拼接，得到所述训练样本对应的组合特征。

示例性的，对于上述目标样本，可以根据公式三将N个自注意力头对上述目标样本的特征提取，即，将目标样本的三个特征向量Q、K、V分别乘以不同的权重参数，然后放入通过公式二的ATTENTION函数中计算该目标样本的缩放的点积注意力分布。进一步地，将单头的注意力计算方法重复多次可得到多头注意力特征，得到经过N个自注意力头的自注意力特征{H₁,H₂,…H_N-1,H_N}。

继续参考图3，在确定上述目标样本确定的注意力特征之后，在步骤S330中，通过拼接矩阵将N个自注意力头对应的自注意力特征拼接，得到所述训练样本对应的组合特征。

示例性的，将上述目标样本确定的注意力特征{H₁,H₂,…H_N-1,H_N串联，再通过拼接矩阵W^O进行线性映射。可以根据公式三确定上述目标样本对应的组合特征MULTIHead(Q,K,V)。

MULTIHead(Q,K,V)＝[H₁；…；H_b]W^O 公式三

参考图5，对于上述目标样本，为了尽量减少特征损失，通过特征级联层52将输入多头注意力层51之前的描述特征{h₀,…,h_t-1,h_t}，与经过特征提取之后由上述多头注意力层51输出的组合特征MULTIHead(Q,K,V)进行特征叠加。进一步地，将叠加之后的特征输入归一化层53，对经过特征级联层52之后的叠加特征进行归一化，以使特征值被归一为0到1之间。

继续参考图5，对于上述归一化层53处理之后的归一化特征，输入至前向网络层54。为了减少特征处理过程造成的特征损失，通过特征级联层55将输入前向网络层54之前的归一化特征，与前向网络层54输出的特征进行特征叠加。最终，将特征级联层55叠加之后的特征再次进行归一化，即输入至归一化层56中。且归一化层56的输出特征即为上述目标样本对应的待分类特征。

在步骤S340中，对所述组合特征(也就是经过图5所示特征处理流程图确定的待分类特征)进行分类得到所述训练样本的预测毒性等级，并基于所述预测毒性等级和所述训练样本的实际毒性等级之间的损失训练所述权重矩阵和所述拼接矩阵。

示例性的，将上述目标样本对应的组合特征输入到神经网络组成的分类层中，以对上述目标样本的毒性等级进行分类预测，可以得到预测毒性等级。

进一步地，根据该目标样本的标签得到其实际毒性等级，进一步地，计算实际毒性等级和预测毒性等级的交叉熵损失并将损失，并进行损失回传以优化上述第一权重矩阵、第二权重矩阵、第三权重矩阵以及拼接矩阵，从而完成一次迭代过程。通过多轮迭代优化，以使得模型参数达到满足预设模型评价指标的状态。

在示例性的实施例中，通过以下模型评价指标中的一种或多种：准确率、召回率和接收者操作特征曲线(receiver operating characteristic curve，简称：ROC)下面积AUC(一种模型评价指标，具体用于评估模型的预测价值；是Area Under Curve的简称)对上述迭代优化后的毒性预测模型进行评价。具体的：

示例性的，通过训练样本进行迭代优化之后，再通过测试样本对迭代优化后中的毒性预测模型(记作“待测试模型”)进行测试，并且使用至少一种测试指标对待测试模型的测试结果进行验证，并将符合测试指标的毒性预测模型进行图2所示实施例待测药物分子的毒性等级预测。

在示例性的实施例中，具体地对待测试模型进行测试的方式可以是：

首先，根据测试样本的描述特征输入至待测试模型，模型的输出数据得到以下：真阳性TP，真阴性TN，伪阴性FN和伪阳性FP。其中，TP是利用待测试模型对测试样本集中正类进行判断后属于仍是正类的数目，TN利用待测试模型对测试样本集负类进行判断后属于仍是负类的数目，FN利用待测试模型对测试样本集中正类进行判断后属于是负类的数目，FP利用待测试模型对测试样本集负类进行判断后属于是正类的数目。正类和负类是指人工对第一部分样本标注的两种类别，即人工标注某个样本属于特定的类，则该样本属于正类，不属于该特定类的样本则属于负类。

其次，根据真阳性TP，真阴性TN，伪阴性FN和伪阳性FP计算待测试模型的测试结果。

在示例性的实施例中，测试指标以准确率、召回率为例进行介绍。具体的：

根据公式四和公式五分别计算准确率p和召回率r；

p＝TP/(TP+FP) 公式四

r＝TP/(TP+FN) 公式五

假如，测试指标对应的设定条件为：准确率测试结果大于p’(预设值)则为满足准确率设定条件，否则不满足准确率设定条件，以及召回率测试结果大于r’(预设值)则为满足召回率设定条件，否则不满足召回率设定条件。

在示例性的实施例中，在测试结果满足测试指标对应的设定条件的情况下，则待测试模型可以作为用于预测待测药物分子的毒性等级的预测模型；在测试结果不满足设定条件时，则上述待测试模型继续迭代优化直至所述待测试模型的测试结果满足设定条件。

在示例性的实施例中，判断测试结果是否满足测试指标对应的设定条件时，可以是仅以准确率或召回率作为测试指标，即正确率/召回率满足设定条件即可；还可以同时以准确率和召回率同时作为测试指标，即正确率和召回率满足设定条件即可。

需要说明的是，具体的测试方式根据实际需求而制定，不限于以上准确率和/或召回率作为测试指标进行测试。

在示例性的实施例中，测试指标还可以为AUC。具体的：

在示例性的实施例中，利用公式六和公式七确定伪阳性率FPR和真阳性率TPR，

FPR＝FP/(FP+TN) 公式六

TPR＝TP/(TP+FN) 公式七

进一步地，以FPR为横坐标，TPR为纵坐标，绘制受试者工作特征曲线(ReceiverOperating Characteristic curve，简称ROC曲线)。其中，ROC曲线是获得的各指标的特征曲线，用于展示各指标之间的关系，并进一步计算出ROC曲线下面积AUC。ROC曲线是获得的各指标的特征曲线，用于展示各指标之间的关系，AUC即ROC曲线下面积，AUC越大，则模型的预测价值越高，进而可通过AUC对待测试模型进行测试。并可以在评价结果为AUC值满足预设阈值时，便可以将得到的模型用于预测待测药物分子的毒性等级。

在示例性的实施例中，在得到满足预测模型评价指标的毒性预测模型之后，可以结合图6对图2所示实施例中的待测药物分子进行毒性等级。

具体地:

在步骤S210中，获取待测药物分子，并确定所述待测药物分子对应的待测描述特征610。

示例性的，步骤S210的具体实施方式与步骤S310实施例对应的具体实施方式相同，在此不再赘述。进一步地，在步骤S61中对待测描述特征610进行特征提取处理。

示例性的，在步骤S220中，通过毒性预测模型的N个自注意力头并行对所述待测描述特征进行特征抽取，得到N个待测自注意力特征，其中，N为大于1的整数。以及，在步骤S230中，拼接所述N个待测自注意力特征，得到所述待测药物分子对应的待测拼接特征。

在示例性的实施例中，首先，根据上述待测描述特征确定第一向量Q、第二向量K和第三向量V。具体的，第一向量Q、第二向量K和第三向量V均与上述待测描述特征相同。

进一步地，在第i个自注意力头中，分别通过训练后的第一权重矩阵W_i ^Q、训练后第二权重矩阵

和训练后第三权重矩阵W_i ^V，对所述待测描述特征的上述第一向量Q、上述第二向量K和上述第三向量V进行特征提取，得到第i个自注意力头对应的自注意力特征。同理，可以通过多头注意力层确定N个待测自注意力特征。

在示例性的实施例中，通过训练后的拼接矩阵W^O拼接上述N个待测自注意力特征，得到所述待测药物分子对应的待测拼接特征。

在示例性的实施例中，除了通过N个自注意力头(即，多头注意力层)并行对待测描述特征610进行特征抽取，以及拼接N个待测自注意力特征之后，还可以参照图5所示的特征级联层52、归一化层53、前向网络层54、特征级联层55以及归一化层56进行以下特征处理：通过特征级联层52将多头自注意力层51的输入和输出进行相加，以避免信息损失太大；进一步地，通过归一化层53对特征级联层52的输出进行归一化；并将归一化后的特征输入到前向网络层54中。同理，为了避免信息损失太大，将前向网络层54的输入和输出用特征级联层55相加，然后，再通过归一化层56对特征级联层55的输出进行归一化。最终，得到待测药物分子对应的待分类特征。

在示例性的实施例中，还可以在步骤S62中，通过前馈神经网络进行特征合并以及非线性映射处理上述待测药物分子对应的待分类特征。

进一步地，在步骤S240中，基于所述毒性预测模型的分类层确定所述待测拼接特征(即上述步骤62的输出特征)对应的毒性等级620。

示例性的，在步骤S63中通过Softmax实现特征归一化，并进行毒性等级预测。将上述待测药物分子对应的待测拼接特征输入到神经网络组成的分类层中，便可以得到对上述待测药物分子的毒性等级的预测值，如：毒性A级、毒性B级、毒性C级或毒性0级(即无毒)。

本技术方案本专利提出一种基于多头注意力机制的特征提取方法，在多个水平上获取药物分子描述特征，有利于优化特征描述特征组合(即，上述组合特征)。从而，能够避免人工筛选结构差异大的药物分子描述特征不当问题。

另外，由于药物分子毒性机制复杂，因此本专利通过神经网络进行分类的方法，对优化组合后的特征做出分类预测，根据不同数据集进行参数学习训练，可以使用到不同的毒性预测任务，有利于在毒性机制多样性且难以预测的情况下，保证毒性等级预测的准确度。进一步地，还可以将本技术方案提供的毒性预测方法泛化到其他化合物的毒性预测任务上，从而能够解决化合物毒性机制多样性且难以预测的问题。

本领域技术人员可以理解实现上述实施方式的全部或部分步骤被实现为由处理器(包含CPU和GPU)执行的计算机程序。例如，通过GPU完成模型训练过程；或者，通过CPU实现通过训练后的模型对待测药物分子进行毒性等级预测等。在该计算机程序被CPU执行时，执行本公开提供的上述方法所限定的上述功能。所述的程序可以存储于一种计算机可读存储介质中，该存储介质可以是只读存储器，磁盘或光盘等。

此外，需要注意的是，上述附图仅是根据本公开示例性实施方式的方法所包括的处理的示意性说明，而不是限制目的。易于理解，上述附图所示的处理并不表明或限制这些处理的时间顺序。另外，也易于理解，这些处理可以是例如在多个模块中同步或异步执行的。

以下介绍本公开的药物的毒性预测装置实施例，可以用于执行本公开上述的药物的毒性预测方法。

图7示出本公开示例性实施例中药物的毒性预测装置的结构示意图。如图7所示，上述药物的毒性预测装置700包括：特征确定模块701、特征提取模块702、特征拼接模块703，以及毒性等级预测模块704。

其中，上述特征确定模块701，被配置为：获取待测药物分子，并确定上述待测药物分子对应的待测描述特征；

上述特征提取模块702，被配置为：通过毒性预测模型的N个自注意力头并行对上述待测描述特征进行特征抽取，得到N个待测自注意力特征，其中，N为大于1的整数；

上述特征拼接模块703，被配置为：拼接上述N个待测自注意力特征，得到上述待测药物分子对应的待测拼接特征；

上述毒性等级预测模块704，被配置为：基于上述毒性预测模型的分类层确定上述待测拼接特征对应的毒性等级。

在本公开的一些实施例，基于前述方案，上述药物的毒性预测装置500还包括：模型训练模块。

其中，上述模型训练模块，包括：

样本确定单元，被配置为：获取海量药物分子和确定每个所述药物分子对应的描述特征，根据上述描述特征得到样本集；

特征提取单元，被配置为：将上述样本集中的任一训练样本输入上述N个自注意力头，通过第i个自注意力头对应的权重矩阵对上述训练样本进行特征提取，得到第i个自注意力头对应自注意力特征，其中，i的取值范围为小于等于N的正整数；

特征拼接单元，被配置为：通过拼接矩阵将N个自注意力特征拼接，得到上述训练样本对应的组合特征；以及，

训练单元，被配置为：对上述组合特征进行分类得到上述训练样本的预测毒性等级，并基于上述预测毒性等级和上述训练样本的实际毒性等级之间的损失训练上述权重矩阵和上述拼接矩阵。

在本公开的一些实施例，基于前述方案，上述特征提取模块702，被具体配置为：

根据上述待测描述特征确定第一向量Q、第二向量K和第三向量V；分别通过训练后的第一权重矩阵W_i ^Q、训练后第二权重矩阵

和训练后第三权重矩阵W_i ^V，对上述待测描述特征的上述第一向量Q、上述第二向量K和上述第三向量V进行特征提取，得到上述第i个自注意力头对应的自注意力特征；其中，i的取值范围为小于等于N的正整数。

在本公开的一些实施例，基于前述方案，上述特征拼接模块703，被具体配置为：

通过训练后的拼接矩阵拼接上述N个待测自注意力特征。

在本公开的一些实施例，基于前述方案，上述药物的毒性预测装置700还包括：模型测试模块。

其中，上述模型测试模块，被配置为：

在本公开的一些实施例，基于前述方案，上述特征确定模块701，被具体配置为：

在本公开的一些实施例，基于前述方案，上述样本确定单元，被具体配置为：

确定每个药物分子对应的描述特征，并对上述海量药物分子对应的描述特征进行去重处理；以及，对去重处理后的描述特征进行归一化处理，得到上述样本集。

上述药物的毒性预测装置中各单元的具体细节已经在说明书附图2至图6对应的药物的毒性预测方法中进行了详细的描述，因此此处不再赘述。

上述中各单元的具体细节已经在说明书附图8对应的实施例中进行了详细的描述，因此此处不再赘述。

图8示出了适于用来实现本公开实施例的电子设备的计算机***的结构示意图。

需要说明的是，图8示出的电子设备的计算机***800仅是一个示例，不应对本公开实施例的功能和使用范围带来任何限制。

如图8所示，计算机***800包括处理器801(包括：图形处理单元(GraphicsProcessing Unit，GPU)、中央处理单元(Central Processing Unit，CPU))，其可以根据存储在只读存储器(Read-Only Memory，ROM)802中的程序或者从存储部分808加载到随机访问存储器(Random Access Memory，RAM)803中的程序而执行各种适当的动作和处理。在RAM803中，还存储有***操作所需的各种程序和数据。CPU 801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(Input/Output，I/O)接口805也连接至总线804。

以下部件连接至I/O接口805：包括键盘、鼠标等的输入部分806；包括诸如阴极射线管(Cathode Ray Tube，CRT)、液晶显示器(Liquid Crystal Display，LCD)等以及扬声器等的输出部分807；包括硬盘等的存储部分808；以及包括诸如LAN(Local Area Network，局域网)卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至I/O接口805。可拆卸介质811，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器810上，以便于从其上读出的计算机程序根据需要被安装入存储部分808。

特别地，根据本公开的实施例，下文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分809从网络上被下载和安装，和/或从可拆卸介质811被安装。在该计算机程序被中央处理单元(CPU)801执行时，执行本申请的***中限定的各种功能。

需要说明的是，本公开实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory，EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory，CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本公开中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、有线等等，或者上述的任意合适的组合。

附图中的流程图和框图，图示了按照本公开各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的***来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本公开实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现，所描述的单元也可以设置在处理器中。其中，这些单元的名称在某种情况下并不构成对该单元本身的限定。

作为另一方面，本申请还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的电子设备中所包含的；也可以是单独存在，而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被一个该电子设备执行时，使得该电子设备实现上述实施例中所述的方法。

例如，所述的电子设备可以实现如图2中所示的：步骤S210，获取待测药物分子，并确定所述待测药物分子对应的待测描述特征；步骤S220，通过毒性预测模型的N个自注意力头并行对所述待测描述特征进行特征抽取，得到N个待测自注意力特征，其中，N为大于1的整数；步骤S230，拼接所述N个待测自注意力特征，得到所述待测药物分子对应的待测拼接特征；以及，步骤S240，基于所述毒性预测模型的分类层确定所述待测拼接特征对应的毒性等级。

应当注意，尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元，但是这种划分并非强制性的。实际上，根据本公开的实施方式，上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之，上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。

通过以上的实施方式的描述，本领域的技术人员易于理解，这里描述的示例实施方式可以通过软件实现，也可以通过软件结合必要的硬件的方式来实现。因此，根据本公开实施方式的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM，U盘，移动硬盘等)中或网络上，包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本公开实施方式的方法。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种药物的毒性预测方法，其特征在于，所述方法包括：

获取待测药物分子，并确定所述待测药物分子对应的待测描述特征；

通过毒性预测模型的N个自注意力头并行对所述待测描述特征进行特征抽取，得到N个待测自注意力特征，其中，N为大于1的整数；

拼接所述N个待测自注意力特征，得到所述待测药物分子对应的待测拼接特征；

基于所述毒性预测模型的分类层确定所述待测拼接特征对应的毒性等级。

2.根据权利要求1所述的药物的毒性预测方法，其特征在于，所述方法还包括：

获取海量药物分子和确定每个所述药物分子对应的描述特征，根据所述描述特征得到样本集；

将所述样本集中的任一训练样本输入所述N个自注意力头，通过第i个自注意力头对应的权重矩阵对所述训练样本进行特征提取，得到第i个自注意力头对应的自注意力特征，其中，i的取值范围为小于等于N的正整数；

通过拼接矩阵将N个自注意力特征拼接，得到所述训练样本对应的组合特征；

对所述组合特征进行分类得到所述训练样本的预测毒性等级，并基于所述预测毒性等级和所述训练样本的实际毒性等级之间的损失训练所述权重矩阵和所述拼接矩阵。

3.根据权利要求2所述的药物的毒性预测方法，其特征在于，通过毒性预测模型的N个自注意力头并行对所述待测描述特征进行特征抽取，包括：

分别通过训练后的第一权重矩阵W_i ^Q、训练后第二权重矩阵W_i ^K和训练后第三权重矩阵W_i ^V，对所述待测描述特征的所述第一向量Q、所述第二向量K和所述第三向量V进行特征提取，得到所述第i个自注意力头对应的自注意力特征。

4.根据权利要求2所述的药物的毒性预测方法，其特征在于，拼接所述N个待测自注意力特征，包括：

通过训练后的拼接矩阵拼接所述N个待测自注意力特征。

5.根据权利要求2所述的药物的毒性预测方法，其特征在于，所述方法还包括：

通过所述样本集中的测试样本对所述预测模型进行测试，以使所述预测模型满足以下指标中的一种或多种：准确率、召回率和接收者操作特征曲线下面积AUC。

6.根据权利要求1至5中任意一项所述的药物的毒性预测方法，其特征在于，确定所述待测药物分子对应的待测描述特征，包括：

根据所述待测药物分子的电子描述符、空间描述符、结构描述符、热力学描述符和拓扑描述符来描述中的一种或多种确定所述待测药物分子对应的待测描述特征。

7.根据权利要求2所述的药物的毒性预测方法，其特征在于，根据所述药物分子对应的描述特征确定样本集，包括：

确定每个药物分子对应的描述特征，并对所述海量药物分子对应的描述特征进行去重处理；

对去重处理后的描述特征进行归一化处理，得到所述样本集。

8.一种药物的毒性预测装置，其特征在于，所述装置包括：

特征确定模块，被配置为：获取待测药物分子，并确定所述待测药物分子对应的待测描述特征；

特征提取模块，被配置为：通过毒性预测模型的N个自注意力头并行对所述待测描述特征进行特征抽取，得到N个待测自注意力特征，其中，N为大于1的整数；

特征拼接模块，被配置为：拼接所述N个待测自注意力特征，得到所述待测药物分子对应的待测拼接特征；

毒性等级预测模块，被配置为：基于所述毒性预测模型的分类层确定所述待测拼接特征对应的毒性等级。

9.一种计算机存储介质，其特征在于，其上存储有计算机程序；

所述计算机程序被处理器执行时实现如权利要求1至7中任意一项所述的药物的毒性预测方法。

10.一种电子设备，其特征在于，所述电子设备包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如权利要求1至7中任意一项所述的药物的毒性预测方法。