CN114628002A

CN114628002A - 一种基于复制机制和层级选择策略的药物推荐方法

Info

Publication number: CN114628002A
Application number: CN202210269372.9A
Authority: CN
Inventors: 吴锐; 漆桂林
Original assignee: Southeast University
Current assignee: Southeast University
Priority date: 2022-03-18
Filing date: 2022-03-18
Publication date: 2022-06-14

Abstract

本发明公开了一种基于复制机制和层级选择策略的药物推荐方法，该方法通过多头注意力机制来对患者的历史药物、疾病与手术信息进行编码，同时将药物推荐建模成序列生成问题，并结合层级选择策略，提高药物推荐的准确率。首先，利用多头注意力机制，对患者的历史药物、疾病和手术信息进行编码；然后，构建药物共现图谱和相互作用图谱，并分别对其进行编码；接着，基于上述编码后的表示，利用患者当前的疾病、手术信息和已推荐的药物信息对其进行解码，计算生成概率，同时提出了一种层级式的选择机制来计算复制概率；最后，结合两种概率进行药物推荐，从而得到一种基于序列生成模型的药物推荐方法。

Description

一种基于复制机制和层级选择策略的药物推荐方法

技术领域

本发明涉及一种基于复制机制和层级选择策略的药物推荐方法，属于AI医疗领域。

背景技术

药物推荐的目的在于为患者推荐一系列药物，来治疗患者已经诊断出来的疾病。目前，该任务主要由医生根据其专业知识与经验来完成。其中一个问题在于，大多数患者会同时患上多种疾病，医生一方面不仅要为每个疾病来选择合适的药物，另一方面还需要避免所选择出来的药物之间缠上不良反应。因此，在复杂情况下，即使对于有经验的医生来说，药物推荐也是一个耗时耗力的工作，对于经验不足的医生来说则更容易产生问题。为了解决这个问题，我们迫切需要能够辅助医生进行决策的自动化药物推荐。

由于其较高的临床价值，药物推荐在近年来已经受到越来越多研究人员的注意，有一系列基于深度学习的药物推荐方法已经被提了出来。这些方法大体上可以分为两种。第一种是基于当前情况，即这一类方法仅仅利用患者当前的疾病、手术等信息，而忽视了患者的历史信息，例如上一次访问医院时的诊断结果及其对应药物。这类方法显然是存在不足的，因为其忽视了历史信息中的疾病发展过程。为了解决这个问题，研究人员们设计基于时间序列的方法，来充分利用患者的历史信息并对时序依赖进行建模。现有的基于时间序列的方法通常分为两个步骤：首先将所有已知信息聚合成一个患者级别的表示向量，然后再根据该表示进行药物推荐。

现有的工作所存在的一个问题在于，他们并没有显式地对同一个患者所推荐的药物之间的关系进行建模，但是在实际情况中，同一个患者所使用的药物往往都有着较强的关联性。例如，对于慢性病患者来说，他们可能会长期地使用同一种药物。针对医院的公开数据进行统计发现，对于多次访问医院的患者，其大部分药物都曾出现在之前的访问当中。受这一点启发，我们考虑从药物级别的角度来更好地利用患者的历史信息。

发明内容

本发明从现有的药物推荐工作并没有显式地从药物级别的角度对患者的历史信息进行建模的问题出发，提出了一种基于编码器-解码器结构的序列生成网络。该网络包含基础模型和复制模块两个部分。基础模型仅基于患者当前访问的健康状况来推荐药物；复制模块则会在建模的过程中引入历史访问的信息。与基础模型不同的地方在于，复制模块还需要来决策是从历史药物中复制一个，还是生成一个全新的药物。

本方案公开了一种新的基于复制机制和层级选择策略的药物推荐方法，主要用于辅助医生进行药物推荐。该方法通过多头注意力机制来利用患者的历史药物、疾病与手术信息，同时将药物推荐建模成序列生成问题，并结合层级选择策略，提高了药物推荐的准确率。首先，利用多头注意力机制，对患者的历史药物、疾病和手术信息进行编码；然后，构建药物共现图谱和相互作用图谱，并分别对其进行编码；接着，基于上述编码后的表示，利用患者当前的疾病、手术信息和已推荐的药物信息对其进行解码，计算生成概率，同时提出了一种层级式的选择机制来计算复制概率；最后，结合两种概率进行药物推荐，从而最终得到一种基于序列生成模型的药物推荐方法。

为了实现上述目的，本发明的技术方案如下：一种基于复制机制和层级选择策略的药物推荐方法，具体步骤如下：

步骤1)对患者的药物、疾病和手术信息进行编码；

步骤2)构建并编码药物共现图谱与药物相互作用图谱；

步骤3)结合步骤1)和步骤2)的编码结果，计算药物生成概率；

步骤4)利用层级选择策略计算药物复制概率；

步骤5)结合步骤3)和步骤4)的两种概率，得到最终药物推荐结果；

步骤6)在大量数据上，通过mini-batch梯度下降的方式来训练初始模型，获得最终的药物推荐模型；

步骤7)采用beamsearch的方式来进行序列生成，得到最终的药物推荐组合。

其中，在步骤1)利用多头注意力机制，对患者的药物、疾病或者手术之间的关联关系进行编码。例如，对疾病的编码过程如下：

MH(Q，K，V)＝[head₁；…；head_h]W^O

其中，MH()表示多头注意力机制，h表示注意力的头的数目，W^O、W^Q、W^K和W^V均表示可学习参数矩阵；Q表示query向量，K表示key向量，V表示value向量，s表示这些向量的维度。经过多头注意力机制之后，再利用残差连接与层标准化来得到最终的编码结果：

D′_t＝Enc_d(D_t)＝LayerNorm(H+FFN(H))；

Enc_d就表示最终的编码函数。其中，LayerNorm表示残差层，H与FFN的计算过程如下所示。

H＝LayerNorm(D_t+MH(D_t，D_t，D_t))

其中，W与b均为可学习参数，ReLU表示激活函数，D则表示编码前的初始表示。同理，对疾病、手术用同样的方式进行编码。该编码方式可以对疾病、药物和手术的内部关联关系进行建模；并且相比较于传统的循环神经网络，注意力机制相对地弱化了各项之间的相对位置，这在现实医疗场景下更为合理。

步骤2)中，根据训练集统计出所有可能的药物组合关系，构建出药物共现图谱。具体来说，构建药物组合关系图谱的邻接矩阵A_e，A_e[i，j]＝1则表示药物i与药物j曾同时出现在单次访问中，反之则未出现过。同时，根据已有知识构建药物互相作用图谱。

利用图卷积神经网络对药物共现图谱和药物相互作用图谱进行融合，得到融合药物关联关系的表示：

E_g＝G_e-λG_d

其中，A_e和A_d分别表示药物共现图谱和药物相互作用图谱的邻接矩阵，GCN()表示图卷积神经网络，E_m表示初始的药物表示，λ、

均为可学习参数。最后得到的E_g表示融合了药物关联关系后的药物表示。

步骤3)首先融合药物初始的表示与步骤2)得到的表示：

其中，

和

分别表示已推荐药物的初始表示和已推荐药物的融合药物关联关系后的表示。

然后，使用多头自注意力机制来编码已推荐药物之间的关联关系：

其中，LayerNorm表示残差层，MH()表示多头注意力机制，具体计算过程在步骤1)中进行了定义。

接下来，根据已推荐药物的表示，利用注意力机制来对患者的疾病、手术信息进行编码，得到患者的表示：

最后，根据患者的表示，计算药物的生成概率：

其中，Softmax()表示激活函数。

步骤4)首先分别融合患者的每一次历史访问中的疾病、手术信息，并得到访问级别的分数：

其中，D′_j和P′_j分别表示第j次访问中，由步骤1)所得到的编码后的疾病、手术的表示，W和b均表示可学习参数，

和Softmax()表示激活函数。

其中，

和

表示当前访问融合疾病、手术信息之后的表示，c_j表示第j次访问的分数。

然后，将所有历史访问中的药物看作一个整体，计算药物级别的分数：

其中，W_c表示可学习参数，M′表示由步骤1)中编码所得到的药物表示，M″表示步骤3)中所得到的的患者表示，s指表示的维度。

最后，结合访问级别与药物级别的分数，最终得到药物的复制概率：

其中1{}是一个指示函数，括号内成立时为1，否则为0。

步骤5)结合步骤3)和步骤4)所得到的两种概率，得到每个药物的推荐概率：

Pr＝w_g*Pr_g+(1-w_g)*Pr_c

其中Sigmoid()表示Sigmoid激活函数，W_f、b_f和w_g均表示可学习参数。最终选择概率最高的药物作为当前情况下所推荐使用的药物。

步骤6)使用梯度下降的方式来训练模型，损失函数为：

其中

表示由步骤5)所得到每一种药物的推荐概率，V_＜t表示第t次访问前患者的电子病历信息，D_t、P_t分别表示第t次访问中患者的疾病、手术，M_t，＜i表示第t次访问中为该患者已推荐的i-1个药物，θ表示该药物推荐方法中的所有参数。

步骤7)利用训练好的模型，采用beam search的方式来进行序列生成，得到最终的药物推荐组合。具体来说，设定beamsearch中的束宽为4，即在每一次推荐新的药物时，挑选所有组合中条件概率最大的4个，作为最终推荐的候选输出序列。这种方式避免了贪心算法没有从整体最优上考虑的问题，同时相对于穷举搜索，大大提升了搜索效率。

相对于现有技术，本发明的优点如下：

1)本发明首次提出来一个从药物级别的角度来利用患者的历史信息的药物推荐方法，该方法在真实数据集上的性能超越了目前已知最优的方法；

2)本发明提出了一个全新的层级选择机制，从药物级别和访问级别的角度综合来选择历史访问中可以复制的药物。该机制不仅提升了药物推荐的准确率，而且还提升了该方法的可解释性，更宜于实际场景下的使用。

3)本发明采用了多头自注意力机制来进行编码，相比较于传统的递归神经网络，该机制能够更好地捕捉药物、疾病或手术之间的关联关系。同时，该机制由于不考虑序列中元素之间的相对位置，更符合实际场景中的需求；

4)本发明创新地将药物推荐建模成了一个序列生成任务，而不是常见的多标签分类任务。对于多标签分类任务来说，其暗含了各标签之间相互独立的假设，忽视了药物之间是存在有共用导致不良反应的可能性的；而序列生成任务则会在生成每一个药物时考虑到已生成的药物，更加符合实际情况。

5)本发明结合了多种不同的药物之间的关联关系，能够得到更好的药物表示，从而进行更为准确的药物推荐。

6)本发明在训练、推理阶段分别采用了teacher-forcing和beamsearch的策略，使得模型的训练和推理更加准确。

附图说明

图1是本发明所使用的数据的示意图；

图2是本发明的整体框架示意图。

具体实施方式

以下结合实施例和说明书附图，详细说明本发明的实施过程。

实施例1：参见图1、图2，一种基于复制机制和层级选择策略的药物推荐方法，包括以下几个步骤：

步骤1)利用多头注意力机制，对患者的药物、疾病或者手术之间的关联关系进行编码。例如，对疾病的编码过程如下：

MH(Q，K，V)＝[head₁；…；head_h]W^O

D′_t＝Enc_d(D_t)＝LayerNorm(H+FFN(H))；

H＝LayerNorm(D_t+MH(D_t，D_t，D_t))

E_g＝G_e-λG_d

步骤3)首先融合药物初始的表示与步骤2)得到的表示：

其中，

和

最后，根据患者的表示，计算药物的生成概率：

其中，Softmax()表示激活函数。

和Softmax()表示激活函数。

其中，

和

其中1{}是一个指示函数，括号内成立时为1，否则为0。

Pr＝w_g*Pr_g+(1-w_g)*Pr_c

步骤6)使用梯度下降的方式来训练模型，损失函数为：

传统的梯度下降，每次梯度下降都是对所有的训练数据进行计算平均梯度，这种梯度下降法叫做ful1-batch梯度下降法。考虑一种情况，当训练数据量在千万级别时，一次迭代需要等待多长时间，会极大的降低训练速度。如果选择介于合适的bath size数据量进行训练，称为mini-batch梯度下降。

随机梯度下降的劣势每次训练的不能保证使用的是同一份数据，所以每一个batch不能保证都下降，整体训练loss变化会有很多噪声，但是整体趋势是下降的，随后会在最优值附近波动，不会收敛。

设置了验证集，在每轮训练结束时观察当前训练的模型收敛情况，防止出现在训练集上的过拟合，由于验证集上的数据没有在训练中出现，所以模型在验证集上的效果可以衡量模型的泛化性。

本实施例使用了如下指标进行评估：

在MIMIC数据集上，采用Jaccard、F1和PRAUC来测试药物推荐的准确率。Jaccard的计算方式为所推荐药物集合与实际使用药物集合的交集的大小除以并集的大小，反映了模型所推荐的药物是否准确。F1得分同时兼顾了Precision和Recall，其计算公式是

PR-AUC指PR曲线下的面积，能够较好地衡量模型的排序能力。在测试数据上进行药物推荐，并进行相关指标的验证。模型训练完成后可以保存到本地，包含其所有的参数等。之后在测试数据上进行指标的评测，和其它方法进行比较。或者在真实场景中，使用模型辅助医生进行药物推荐。

需要说明的是上述实施例，并非用来限定本发明的保护范围，在上述技术方案的基础上所作出的等同变换或替代均落入本发明权利要求所保护的范围。

Claims

1.一种基于复制机制和层级选择策略的药物推荐方法，其特征在于，该方法包含以下步骤：

步骤1)对患者的药物、疾病和手术信息进行编码；

步骤2)构建并编码药物共现图谱与药物相互作用图谱；

步骤3)结合步骤1)和步骤2)的编码结果，计算药物生成概率；

步骤4)利用层级选择策略计算药物复制概率；

2.根据权利要求1所述的基于复制机制和层级选择策略的药物推荐方法，其特征在于，步骤1)利用多头注意力机制，对患者的药物、疾病或者手术之间的关联关系进行编码，对疾病的编码过程如下：

MH(Q,K,V)＝[head₁；...；head_h]W^O

其中，MH()表示多头注意力机制，h表示注意力的头的数目，W^O、W^Q、W^K和W^V均表示可学习参数矩阵；Q表示query向量，K表示key向量，V表示value向量，s表示这些向量的维度，经过多头注意力机制之后，再利用残差连接与层标准化来得到最终的编码结果：

D′_t＝Enc_d(D_t)＝LayerNorm(H+FFN(H))；

Enc_d就表示最终的编码函数，其中，LayerNorm表示残差层，H与FFN的计算过程如下所示；

H＝LaverNorm(D_t+MH(D_t，D_t，D_t))

其中，W与b均为可学习参数，ReLU表示激活函数，D则表示编码前的初始表示，同理，对疾病、手术用同样的方式进行编码。

3.根据权利要求1所述的基于复制机制和层级选择策略的药物推荐方法，其特征在于，步骤2)中，根据训练集统计出所有可能的药物组合关系，构建出药物共现图谱,具体为构建药物组合关系图谱的邻接矩阵A_e，A_e[i,j]＝1则表示药物i与药物j曾同时出现在单次访问中，反之则未出现过，根据已有知识构建药物互相作用图谱。

4.根据权利要求1所述的基于复制机制和层级选择策略的药物推荐方法，其特征在于，步骤2)中利用图卷积神经网络对药物共现图谱和药物相互作用图谱进行融合，得到融合药物关联关系的表示：

E_g＝G_e-λG_d

其中，A_e和A_d分别表示药物共现图谱和药物相互作用图谱的邻接矩阵，GCN()表示图卷积神经网络，E_m表示初始的药物表示，λ、W_e ^g、

均为可学习参数，最后得到的E_g表示融合了药物关联关系后的药物表示。

5.根据权利要求1所述的基于复制机制和层级选择策略的药物推荐方法，其特征在于，步骤3)首先融合药物初始的表示与步骤2)得到的表示：

其中，

和

分别表示已推荐药物的初始表示和已推荐药物的融合药物关联关系后的表示；

其中，LayerNorm表示残差层，MH()表示多头注意力机制；

最后，根据患者的表示，计算药物的生成概率：

其中，Softmax()表示激活函数。

6.根据权利要求1所述的基于复制机制和层级选择策略的药物推荐方法，其特征在于，步骤4)首先分别融合患者的每一次历史访问中的疾病、手术信息，并得到访问级别的分数：

和Softmax()表示激活函数；

其中，

和

表示当前访问融合疾病、手术信息之后的表示，c_j表示第j次访问的分数；

其中，W_c表示可学习参数，M′表示由步骤1)中编码所得到的药物表示，M″表示步骤3)中所得到的的患者表示，s指表示的维度；

其中1{}是一个指示函数，括号内成立时为1，否则为0。

7.根据权利要求1所述的基于复制机制和层级选择策略的药物推荐方法，其特征在于，步骤5)结合步骤3)和步骤4)所得到的两种概率，得到每个药物的推荐概率：

Pr＝w_g*Pr_g+(1-w_g)*Pr_c

其中Sigmoid()表示Sigmoid激活函数，W_f、b_f和w_g均表示可学习参数，最终选择概率最高的药物作为当前情况下所推荐使用的药物。

8.根据权利要求1所述的基于复制机制和层级选择策略的药物推荐方法，其特征在于，步骤6)使用梯度下降的方式来训练模型，损失函数为：

其中

表示由步骤5)所得到每一种药物的推荐概率，V_<t表示第t次访问前患者的电子病历信息，D_t、P_t分别表示第t次访问中患者的疾病、手术，M_t,<i表示第t次访问中为该患者已推荐的i-1个药物，θ表示该药物推荐方法中的所有参数。

9.根据权利要求1所述的基于复制机制和层级选择策略的药物推荐方法，其特征在于，在步骤6)的训练过程中，采用teacher-forcing的训练方式，具体为在生成第i个药物时，模型以真实样本的前i-1个药物作为输入，而不是生成的前i-1的药物，在生成第1个药物时，输入被设定为一个特殊的标识：<START>。

10.根据权利要求1所述的基于复制机制和层级选择策略的药物推荐方法，其特征在于，在推理阶段中，步骤7)采用beamsearch的方式进行序列生成，具体为设定beamsearch中的束宽为4，即在每一次推荐新的药物时，挑选所有组合中条件概率最大的4个，作为最终推荐的候选输出序列。