CN111798954A

CN111798954A - 基于时间注意力机制和图卷积网络的药物组合推荐方法

Info

Publication number: CN111798954A
Application number: CN202010529940.5A
Authority: CN
Inventors: 王震; 高超; 王海强; 李向华; 朱培灿; 李学龙
Original assignee: Northwestern Polytechnical University
Current assignee: Northwestern Polytechnical University
Priority date: 2020-06-11
Filing date: 2020-06-11
Publication date: 2020-10-20

Abstract

本发明提供了一种基于时间注意力机制和图卷积网络的药物组合推荐方法；本发明能够在复杂的医疗环境中，为重症患者的治疗推荐合理的药物，帮助临床医生治疗患者。电子健康档案中的诊断和治疗都采用了统一编码格式进行了编码，保存了诊断和治疗中的时间按序列信息，通过将编码转化为向量，利用两层循环神经网络组成的时间注意力机制来捕获时间序列信息；针对电子健康档案中医生开出处方的药物与已知药物不良反应的药物，转化成图网络结构数据来描述不同药物组合之间的关系，利用图卷积网络来学习药物图网络中的医疗用药知识。与传统相比，简化的图卷积网络在维持预测准确性不变的情况下，减少了神经网络模型计算参数，降低了训练学习时间。

Description

基于时间注意力机制和图卷积网络的药物组合推荐方法

技术领域

本发明涉及基于时间注意力机制和图卷积网络的药物组合推荐方法。

背景技术

随着大量医疗数据的产生，深度学习技术在医疗领域显示出强大的预测潜力。在过去的十年里，记录患者健康信息的电子健康档案(Electronic health record，EHR)***迅速发展，它在医疗相关的研究领域发挥了巨大的作用，例如医学概念的提取、病人活动轨迹的建模、疾病的推理、临床决策***的建立和药物组合的预测等。利用深度学习技术和EHR数据库里的丰富信息，医生可以更方便、准确地为病情复杂的患者提供治疗。一般来说，医疗事件可以分为诊断、治疗和用药。这些医学概念可以用编码来表示，以便对临床事件进行更好的建模。因此，国际疾病分类(International classification of disease，ICD)用来区分疾病和治疗程序，美国国家药品编码(National drug code，NDC)用来对药品编码。这样患者看病过程就可以用ICD码来表示，患者看病过程使用的药物就可以用NDC码来表示。然而，这些医疗编码维度通常都很高，此时想要用向量来表示这些编码，并且尽可能保存原来存在于编码中的信息就比较困难。而且，ICD编码继承了诊断和治疗中的时间序列信息，患者处方中各种各样的药物组合使得NDC编码之间的关系十分复杂。

电子健康档案中的时间序列存在长度不一、采用不规律、数据丢失的问题。传统的机器学习方法在进行特征提取时，可能会忽略与预测精度相关的时间和序列关系，而这些特征是和预测的准确性相关联的。现有的研究可以分为两类来提取电子健康档案中的时间序列序列特征。第一种是基于马尔可夫决策的方法，它根据病人目前的健康状况，提供有原则的治疗方案，这种方法是想获得最佳的决策序列。但是，它继承了马尔可夫变换中的无记忆特征。第二种是基于循环神经网络(Recurrent neural networks，RNN)的方法，它在时间序列的学习中取得了良好的效果，并在许多领域得到了应用。循环神经网络的递归结构决定了，下一个隐藏状态的获取是基于前一个隐藏状态的序列信息。因此，与无记忆的马尔可夫模型相比，递归结构使基于循环神经网络的模型具有记忆功能。在近期研究中，基于循环神经网络(RNN)构建的注意力机制在自然语言处理、语音识别和医疗领域取得了很大的成功，在这些研究中表明注意力机制可以有效识别出关注重点，从而提高模型效果。

药物组合和疾病有关，但是一般的药物组合推荐方法没有考虑到疾病之间的关系。例如，一个刚刚患上某种疾病的患者，可能会得到和忍受疾病折磨多年的患者一样的用药治疗。这些患病多年的患者临床病史较长，可能同时患有多种疾病，因此他们的治疗需要考虑疾病之间的关系。有一些研究使用图卷积网络(Graph convolutional networks，GCN)来学习药物组合之间的关系，他们试图利用图的数据结构来表示隐藏在药物组合中的医学知识，图卷积网络在表示药物组合图节点方面具有良好的性能。更具体地说，在图中给每个节点一个初始向量，药物节点的嵌入向量是相邻节点权重相加的结果。这样，每个节点都聚集了一个局部子图的特征，这个局部子图就相当于同时患有多种疾病患者的药方。因此，图卷积网络的嵌入向量可以更好地描述药物组合之间的关系。该策略在药物与药物相互作用(Drug-drug interaction，DDI)图中取得了成功。但是，图卷积层重复线性变换会导致更高的复杂度和不必要的计算，而在稠密图中这个问题更加明显。简化的图卷积网络(Simplegraph convolution，SGC)移除卷积层之间的特征变换与非线性转化，在多个数据集上的测试结果表明这种策略不仅不会影响图网络结构的学习效果，而且降低了计算资源消耗。

本发明主要关注多次进入重症监护室的患者，其中大部分患者都患有多种疾病。在这种情况下，时间序列信息和药物之间的关系就更加复杂。最佳的药物组合有助于患者恢复，但是严重的药物不良反应可能会伤害到患者的健康，因此推荐出治疗效果好的药物组合并不容易。现有的关于药物组合推荐的研究可分为基于规则的方法和基于知识的方法。基于规则的方法中，治疗规则是根据医生的经验或者机构的指导方针来定义。为了适应个体治疗而提出了自适应治疗策略(Adaptive treatment strategies，ATS)，这是随着患者健康状况的变化而变化的一系列决策规则。例如，通过对治疗青少年抑郁的可行性和接受能力的评估，调整四种自适应治疗策略。慢性病的管理遵循由专家委员会制定的标准方法，尽管知识模式有助于这些复杂的规则，但是同时也受到医生知识的限制。医生通常根据个人经验和现有的医疗资源来为患者治疗。而且，在重症监护室的患者通常患有多种疾病。在如此复杂的情况下，基于规则的方法无法产生符合要求的药物组合。然而，基于知识的方法能够利用电子健康档案中的医学知识来预测药物组合。这些方法利用深度学习技术自动提取医学知识，弥补了医生的知识鸿沟。因此，本发明利用了两种深度学习模型来为医生推荐治疗药物组合，即注意力机制与简化的图卷积网络。注意力机制用以提取电子健康档案中诊断和治疗程序中的时间序列知识，简化的图卷积网络用以学习电子健康档案中医生所开处方和已知药物不良反应中的药物知识。

发明内容

本发明的目的是提供了一种基于时间注意力机制和图卷积网络的药物组合推荐方法。

本发明是通过以下技术方案实现的：

本发明涉及基于时间注意力机制和图卷积网络的药物组合推荐方法，其特征在于包括以下步骤：

S1：诊断，治疗程序与用药组成了每位患者的医疗事件x_i，其中每位患者的诊断代码和治疗程序代码，经过独热(One-hot)编码后成为统一维度的诊断向量

与治疗向量

利用线性嵌入方式，转化为诊断嵌入向量

和治疗嵌入向量

其中，w_d和w_p分别表示学习的嵌入矩阵，计算方式为：

S2：利用循环神经网络RNN_α分别学习诊断嵌入向量

与治疗嵌入向量

得到诊断注意力参数α_d与治疗注意力参数α_p。同样的，利用另外一个循环神经网络RNN_β学习诊断嵌入向量

与治疗嵌入向量

得到诊断注意力参数β_d与治疗注意力参数β_p。其中，两个循环神经网络使用了不同的激活函数，即f_α＝tanh()和f_β＝tanhshrink()。o_α和o_β分别为两个循环神经网络的输出向量，w_α,b_α,w_β,b_β分别表示神经网络要学习的参数。用

来表示诊断嵌入向量

或治疗嵌入向量

那么计算过程如下：

S3：利用前两步计算的诊断嵌入向量

诊断注意力参数α_d与β_d，以及治疗嵌入向量

治疗注意力参数α_p与β_p，将诊断表示向量为

治疗表示向量为

那么患者就诊向量就可以表示为

S4:由S3得到的每位患者就诊向量表示P_i及其对应的用药独热编码

组成一对键值对，为了把相似的患者就放在一起，所有患者保存为键值对的字典结构数据，得到患者的就诊历史向量H，n表示患者数量，计算过程如下：

S5：输入电子健康档案(EHR)中患者处方用药构成的网络G_ehr＝(V,δ_ehr)和已知的药物不良反应(DDI)构成的网络G_ddi＝(V,δ_ddi)。其中，V是图节点，表示各种药物；δ_ehr是电子健康档案中药物图网络中连接节点的边，δ_ddi是已知药物不良反应中药物图网络的边，δ_ehr与δ_ddi表示了药物之间的关系连接。这样就得到电子健康档案中药物图网络的度矩阵D_ehr，初始邻接矩阵A_ehr，单位矩阵I_ehr和已知药物不良反应中药物图网络的度矩阵D_ddi，初始邻接矩阵A_ddi，单位矩阵I_ddi。然后，对上述矩阵做如下处理，得到归一化后电子健康档案中药物图网络的矩阵N_ehr与已知药物不良反应中药物图网络的矩阵N_ddi，计算公式如下：

S6：电子健康档案中药物的独热编码组成向量阵M_ehr，已知药物不良反应中药物的独热编码组成向量矩阵M_ddi，初始化隐藏的权值参数矩阵W_ehr和W_ddi，以及权重变量λ，对网络中的药物知识进行融合，计算出融合后的药物知识向量K，公式如下：

K＝N_ehrM_ehrW_ehr+λ(N_ddiM_ddiW_ddi) (4)

S7：K是由S6得到的融合药物知识，P_i表示每位患者就诊向量。在患者历史表示向量H中，

表示第i位患者的键向量，

表示第i位患者的值向量，激活函数计算后获得输出向量

和

计算过程如下：

S8：通过Sigmoid函数σ来预测药物，计算过程如下：

S9：利用损失函数来降低预测错误的损失，其中，i和j分别表示第i和j位患者，t表示第t次就诊，T表示总共就诊次数；

为电子健康档案记录的医生为患者开的治疗药物，

为方法预测推荐的药物；π[0]和π[1]表示调节权重，且π[0]+π[1]＝1；s′表示药物组合中发在药物不良反应的可能性，s表示期望得到的药物不良反应的可能性参数，η表示惩罚系数参数；

损失函数的计算过程如下：

S10：利用衡量指标Jaccard、PRAUC、F1来衡量预测的准确性，值越高表明预测的药物组合就越准确；DDI Rate来衡量预测的药物组合安全性，值越低表明预测的药物组合发生不良反应的情况越低，药物组合的安全性就更加可靠。T表示总共就诊次数，N表示总共患者数量；

为医生为第i位患者在第t次就诊开的治疗药物，

是方法预测推荐的药物，(c_a,c_b)表示预测药物a与b是在已知药物不良反应集合δ_ddi中的组合。以公式(9)计算Jaccard，公式(10)计算的Recall和Precision为横纵坐标的点连接成的曲线与坐标轴围成的面积即为PRAUC，公式(12)计算F1，公式(12)计算DDI Rate。

在本发明的方法有以下优点：

(1)本发明采用电子健康档案中的诊断和治疗都采用了统一编码格式进行了编码，保存了诊断和治疗中的时间按序列信息，通过将编码转化为向量，利用两层循环神经网络组成的时间注意力机制来捕获时间序列信息，可以提高预测的准确性。

(2)本发明针对电子健康档案中医生开出处方的药物与已知药物不良反应的药物，转化成图网络结构数据来描述不同药物组合之间的关系，利用简化的图卷积网络来学习图网络结构中的医疗用药知识；在不同的指标上衡量预测药物组合的准确性和安全性。

(3)本发明能够在复杂的医疗环境中，为重症患者的治疗推荐合理的药物，帮助临床医生治疗患者。与传统的图卷积网络相比，简化的图卷积网络在维持预测准确性不变的情况下，减少了神经网络模型计算参数，降低了训练学习时间。

附图说明

图1为本发明的流程图；

图2为本发明的详细图解；

图3为时间注意力机制的详细图解；

图4为简化的图卷积网络详细图解；

图5展示了在多种度量指标上的药物组合预测结果图。(a)为在Jaccard指标上的得分百分比；(b)为在PRAUC指标上的得分百分比；(c)为在F1指标上的得分百分比；(d)为在DDI Rate指标上的得分百分比；

图6展示了本方法在使用简化的图卷积网络之后，训练时间的变化图。

具体实施方式

下面结合具体实施例对本发明进行详细说明。应当指出的是，以下的实施实例只是对本发明的进一步说明，但本发明的保护范围并不限于以下实施例。

实施例

本实施例涉及基于时间注意力机制和图卷积网络的药物组合推荐方法，见图1所示：包括以下步骤：

与治疗向量

利用线性嵌入方式，转化为诊断嵌入向量

和治疗嵌入向量

其中，w_d和w_p分别表示学习的嵌入矩阵，计算方式为：

S2：利用循环神经网络RNN_α分别学习诊断嵌入向量

与治疗嵌入向量

与治疗嵌入向量

来表示诊断嵌入向量

或治疗嵌入向量

那么计算过程如下：

S3：利用前两步计算的诊断嵌入向量

诊断注意力参数α_d与β_d，以及治疗嵌入向量

治疗注意力参数α_p与β_p，将诊断表示向量为

治疗表示向量为

那么患者就诊向量就可以表示为

K＝N_ehrM_ehrW_ehr+λ(N_ddiM_ddiW_ddi) (4)

表示第i位患者的键向量，

表示第i位患者的值向量，激活函数计算后获得输出向量

和

计算过程如下：

S8：通过Sigmoid函数σ来预测药物，计算过程如下：

为电子健康档案记录的医生为患者开的治疗药物，

损失函数的计算过程如下：

为医生为第i位患者在第t次就诊开的治疗药物，

将本实施例所涉及的基于时间注意力机制和图卷积网络的药物组合推荐方法用于患者，各项医疗统计信息，如表1所示：

表1

本发明详解图见附图2，本发明主要涉及两种技术，即时间注意力机制和简化的图卷积网络(SGC)，时间注意力机制用来提取时间序列特征，简化的图卷积网络降低计算量，减少对计算资源的消耗。诊断和治疗代码通过独热编码转换成统一编码x_d和x_p，利用线性嵌入转化成诊断嵌入向量e_d和治疗嵌入向量e_p后，输入到两个循环神经网络(RNN)计算注意力参数α和β，利用注意力参数计算患者就诊表示向量P与病史表示向量H。简化的图卷积神经网络(SGC)用以学习电子健康档案(EHR)和药物不良反应数据库(DDI)的药物知识K，结合循环神经网络对诊断和治疗学习的患者就诊表示向量P与病史表示向量H，来预测药物组合。通过计算损失函数，利用反向传播来降低预测误差。

本发明涉及的时间注意力机制见附图3。时间注意力机制是建立在循环神经网络(RNN)的基础上，利用注意力参数提取更加准确的时间序列特征。通过两个循环神经网络对嵌入向量进行学习，利用不同激活函数计算输出向量，分别获取嵌入向量的注意力权重α和β，通过权重叠加来获得诊断或治疗程序的向量表示形式。

本发明涉及图卷积网络详细图解见图4。简化的图卷积网络(SGC)将传统的图卷积网络(GCN)进行简化，去除了图卷积计算过程中的特征变换与非线性转换。具体来说，相对于传统的图卷积神经网络(GCN)，简化的图卷积神经网络(SGC)通过反复消除卷积层之间的非线性并将得到的函数折叠成一个线性变换来减少额外复杂度。

在多种度量指标上的药物组合预测对比结果，见图5。图5中所显示的CompNet、RNN、RETAIN、LEAP、DMNC、G-BERT和GAMENet是用来与本方法(AMSGC)对比的方法。Jaccard、PRAUC和F1是衡量预测药物准确性的指标，分值越高，表示预测的结果越准确；DDI Rate是衡量预测药物组合安全性的指标，分值越低，表示发生药物不良反应的可能性越小。(a)为在Jaccard指标上的得分百分比；(b)为在PRAUC指标上的得分百分比；(c)为在F1指标上的得分百分比；(d)为在DDI Rate指标上的得分百分比。结果显示，本方法(AMSGC)预测的药物比其他准确，并且能够控制药物不良反应发生。

本发明所述方法在运用时间注意力机制和简化的图卷积网络后的实验对比效果，见表2。与运用循环神经网络的方法(RNN-based AMSGC)对比结果显示，本方法(AMSGC)运用的时间注意力机制可以提高预测的准确性；与运用传统的图卷积网络(GCN-based AMSGC)对比结果显示，本方法(AMSGC)运用简化的图卷积网络没有对预测的准确性造成影响。

表2

本发明所涉及的方法在运用简化的图卷积网络之后，训练时间的变化，见图6。基于简化的图卷积网络方法(即SGC-based AMSGC，用折线b表示)每次训练时间都比基于传统的图卷积网络方法(即GCN-based AMSGC，用折线a表示)明显降低。如表3所示，计算参数对比统计结果显示，基于简化的图卷积网络方法(SGC-based AMSGC)计算参数比基于传统的图卷积网络方法(GCN-based AMSGC)有所降低，这也就意味着将会消耗更少的计算资源。

表3

方法	参数
		GCN-basedAMSGC	635603
SGC-basedAMSGC	627283

以上对本发明的具体实施例进行了描述。需要理解的是，本发明并不局限于上述特定实施方式，本领域技术人员可以在权利要求的范围内做出各种变形或修改，这并不影响本发明的实质。

Claims

1.一种基于时间注意力机制和图卷积网络的药物组合推荐方法，其特征在于包括以下步骤：

S1：诊断，治疗程序与用药组成了每位患者的医疗事件x_i，其中每位患者的诊断代码和治疗程序代码，经过独热编码后成为统一维度的诊断向量

与治疗向量

利用线性嵌入方式，转化为诊断嵌入向量

和治疗嵌入向量

其中，w_d和w_p分别表示学习的嵌入矩阵，计算方式为：

S2：利用循环神经网络RNN_α分别学习诊断嵌入向量

与治疗嵌入向量

得到诊断注意力参数α_d与治疗注意力参数α_p；同样的，利用另外一个循环神经网络RNN_β学习诊断嵌入向量

与治疗嵌入向量

得到诊断注意力参数β_d与治疗注意力参数β_p；其中，两个循环神经网络使用了不同的激活函数，即f_α＝tanh()和f_β＝tanhshrink()；o_α和o_β分别为两个循环神经网络的输出向量，w_α,b_α,w_β,b_β分别表示神经网络要学习的参数。用

来表示诊断嵌入向量

或治疗嵌入向量

那么计算过程如下：

S3：利用前两步计算的诊断嵌入向量

诊断注意力参数α_d与β_d，以及治疗嵌入向量

治疗注意力参数α_p与β_p，将诊断表示向量为

治疗表示向量为

那么患者就诊向量就可以表示为

S5：输入电子健康档案中患者处方用药构成的网络G_ehr＝(V,δ_ehr)和已知的药物不良反应构成的网络G_ddi＝(V,δ_ddi)；其中，V是图节点，表示各种药物；δ_ehr是电子健康档案中药物图网络中连接节点的边，δ_ddi是已知药物不良反应中药物图网络的边，δ_ehr与δ_ddi表示了药物之间的关系连接；得到电子健康档案中药物图网络的度矩阵D_ehr，初始邻接矩阵A_ehr，单位矩阵I_ehr和已知药物不良反应中药物图网络的度矩阵D_ddi，初始邻接矩阵A_ddi，单位矩阵I_ddi；然后，对上述矩阵做如下处理，得到归一化后电子健康档案中药物图网络的矩阵N_ehr与已知药物不良反应中药物图网络的矩阵N_ddi，计算公式如下：

K＝N_ehrM_ehrW_ehr+λ(N_ddiM_ddiW_ddi) (4)

表示第i位患者的键向量，

表示第i位患者的值向量，激活函数计算后获得输出向量

和

计算过程如下：

S8：通过Sigmoid函数σ来预测药物，计算过程如下：

为电子健康档案记录的医生为患者开的治疗药物，

损失函数的计算过程如下：

S10：利用衡量指标Jaccard、PRAUC、F1来衡量预测的准确性，值越高表明预测的药物组合就越准确；DDI Rate来衡量预测的药物组合安全性，值越低表明预测的药物组合发生不良反应的情况越低，药物组合的安全性就更加可靠，T表示总共就诊次数，N表示总共患者数量；

为医生为第i位患者在第t次就诊开的治疗药物，

是方法预测推荐的药物，(c_a,c_b)表示预测药物a与b是在已知药物不良反应集合δ_ddi中的组合，以公式(9)计算Jaccard，公式(10)计算的Recall和Precision为横纵坐标的点连接成的曲线与坐标轴围成的面积即为PRAUC，公式(12)计算F1，公式(12)计算DDI Rate。