CN109637669A

CN109637669A - 基于深度学习的治疗方案的生成方法、装置及存储介质

Info

Publication number: CN109637669A
Application number: CN201811407145.8A
Authority: CN
Inventors: 任江涛; 熊铠能
Original assignee: Sun Yat Sen University
Current assignee: Sun Yat Sen University
Priority date: 2018-11-22
Filing date: 2018-11-22
Publication date: 2019-04-16
Anticipated expiration: 2038-11-22
Also published as: CN109637669B

Abstract

本发明公开了一种基于深度学习的治疗方案的生成方法，包括以下步骤：获取待处理的病人的诊断信息；将所述诊断信息输入深度神经网络模型进行处理，得到所述待处理的病人的本次治疗方案的预测结果；将所述本次治疗方案的预测结果输入序列到序列模型进行处理，得到所述待处理的病人的未来治疗方案的预测结果。本发明还公开了一种基于深度学习的治疗方案的生成装置以及计算机可读存储介质。本发明通过具有时间联结的前馈型深度神经网络生成病人的当次的治疗方案，并通过序列到序列模型预测病人未来的治疗方案，为病人提供递进的治疗方案参考建议从而达到更好地辅助治疗的目的。

Description

基于深度学习的治疗方案的生成方法、装置及存储介质

技术领域

本发明涉及人工智能领域，尤其涉及一种基于深度学习的治疗方案的生成方法、基于深度学习的治疗方案的生成装置以及计算机可读存储介质。

背景技术

目前，在医院或医疗机构，每天都会产生大量电子病历文本，电子病历是一种专业性很强的医疗文本，是病人在医院诊断治疗全过程的原始记录，它包含有病人的病程记录、检查检验结果、医嘱、手术记录、护理记录等等信息。

近年来由于大数据及人工智能技术发展迅速，人们开始将机器学习相关技术运用到辅助诊断或治疗领域中，以智能生成及推荐对病人的治疗方法，帮助医生快速制定治疗方案。

但在现有的治疗方案智能生成的技术中，没有考虑到病人连续时间内诊断信息之间的联系，也只能预测病人当次就诊的治疗方案，无法对病人在整个治疗周期中的多次治疗方案进行全面的预测。

发明内容

本发明的主要目的在于提供一种基于深度学习的治疗方案的生成方法、基于深度学习的治疗方案的生成装置以及计算机可读存储介质，解决现有技术中无法对病人在整个治疗周期中的多次治疗方案进行全面的预测的技术问题。

为实现上述目的，本发明提供一种基于深度学习的治疗方案的生成方法，所述基于深度学习的治疗方案的生成方法包括以下步骤：

获取待处理的病人的诊断信息；

将所述诊断信息输入深度神经网络模型进行处理，得到所述待处理的病人的本次治疗方案的预测结果；

将所述本次治疗方案的预测结果输入序列到序列模型进行处理，得到所述待处理的病人的未来治疗方案的预测结果。

优选地，所述将所述诊断信息输入深度神经网络模型进行处理，得到所述待处理的病人的本次治疗方案的预测结果的步骤包括：

将所述诊断信息输入深度神经网络模型进行处理，得到所述诊断信息对应的隐向量；

将所述诊断信息对应的隐向量输入自注意力机制层进行处理，获得所述隐向量对应的权重；

根据所述隐向量和所述权重得到加权后的隐向量；

根据所述加权后的隐向量得到所述待处理的病人的本次治疗方案的预测结果。

优选地，将所述诊断信息对应的隐向量输入自注意力机制层进行处理，获得所述隐向量对应的权重的步骤包括：

将所述诊断信息对应的隐向量输入自注意力机制层进行处理；

所述自注意力机制层根据所述诊断信息的等级信息学习到所述隐向量对应的权重。

优选地，所述诊断信息的等级信息包括：主要诊断、其他诊断、损伤诊断和其他诊断。

优选地，所述深度神经网络模型包括多层的长短期记忆网络或者多层的门控递归单元网络，根据预设数量的病人的诊断信息和与所述病人的诊断信息对应的治疗方案对所述深度神经网络模型和所述序列到序列模型进行联合训练。

优选地，所述预设数量的病人的诊断信息为入院次数不小于预设次数的病人的诊断信息。

优选地，所述将所述本次治疗方案的预测结果输入序列到序列模型进行处理，得到所述待处理的病人的未来治疗方案的预测结果的步骤包括：

将所述本次治疗方案的预测结果输入序列到序列模型进行处理，得到所述待处理病人的下一次治疗方案的预测结果；

获取所述待处理病人的治疗方案的预测结果的个数是否达到预设数目；

若所述待处理病人的治疗方案的预测结果的个数未达到所述预设数目，将所述下一次治疗方案的预测结果作为所述本次治疗方案的预测结果，返回执行所述将所述本次治疗方案的预测结果输入序列到序列模型进行处理的步骤。

优选地，所述获取待处理的病人的诊断信息的步骤之后还包括：

根据国际疾病编码标准获取所述病人的诊断信息对应的编码向量；

将所述病人的诊断信息对应的编码向量输入深度神经网络模型进行处理，得到所述待处理的病人的本次治疗方案的预测结果。

为实现上述目的，本发明还提供一种基于深度学习的治疗方案的生成装置，所述基于深度学习的治疗方案的生成装置包括：

所述基于深度学习的治疗方案的生成装置包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于深度学习的治疗方案的生成程序，所述基于深度学习的治疗方案的生成程序被所述处理器执行时实现如上述基于深度学习的治疗方案的生成方法的步骤。

为实现上述目的，本发明还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有基于深度学习的治疗方案的生成程序，所述基于深度学习的治疗方案的生成程序被处理器执行时实现如上述基于深度学习的治疗方案的生成方法的步骤。

本发明提供的基于深度学习的治疗方案的生成方法、基于深度学习的治疗方案的生成装置以及计算机可读存储介质，获取待处理的病人的诊断信息；将所述诊断信息输入深度神经网络模型进行处理，得到所述待处理的病人的本次治疗方案的预测结果；将所述本次治疗方案的预测结果输入序列到序列模型进行处理，得到所述待处理的病人的未来治疗方案的预测结果。这样，通过具有时间联结的前馈型深度神经网络生成病人的治疗方案，并通过序列到序列模型预测病人未来的治疗方案，提高了预测得到的病人治疗方***率。

附图说明

图1为本发明实施例方案涉及的实施例终端的硬件运行环境示意图；

图2为本发明基于深度学习的治疗方案的生成方法第一实施例的流程示意图；

图3为本发明基于深度学习的治疗方案的生成方法第二实施例的流程示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

本发明提供一种基于深度学习的治疗方案的生成方法，通过具有时间联结的前馈型深度神经网络生成病人的治疗方案，并通过序列到序列模型预测病人未来的治疗方案，提高了预测得到的病人治疗方***率。

如图1所示，图1是本发明实施例方案涉及的实施例终端的硬件运行环境示意图；

本发明实施例终端可以是基于深度学习的治疗方案的生成装置，也可以是服务器。

如图1所示，该终端可以包括：处理器1001，例如CPU，存储器1002，通信总线1003。其中，通信总线1003用于实现该终端中各组成部件之间的连接通信。存储器1002可以是高速RAM存储器，也可以是稳定的存储器(non-volatile memory)，例如磁盘存储器。存储器1002可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解，图1中示出的终端的结构并不构成对本发明实施例终端的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，作为一种计算机存储介质的存储器1002中可以包括基于深度学习的治疗方案的生成程序。

在图1所示的终端中，处理器1001可以用于调用存储器1002中存储的基于深度学习的治疗方案的生成程序，并执行以下操作：

获取待处理的病人的诊断信息；

进一步地，处理器1001可以调用存储器1002中存储的基于深度学习的治疗方案的生成程序，还执行以下操作：

根据所述隐向量和所述权重得到加权后的隐向量；

所述诊断信息的等级信息包括：主要诊断、其他诊断、损伤诊断和其他诊断。

所述深度神经网络模型包括多层的长短期记忆网络或者多层的门控递归单元网络，根据预设数量的病人的诊断信息和与所述病人的诊断信息对应的治疗方案对所述深度神经网络模型和所述序列到序列模型进行联合训练。

所述预设数量的病人的诊断信息为入院次数不小于预设次数的病人的诊断信息。

参照图2，在一实施例中，所述基于深度学习的治疗方案的生成方法包括：

步骤S10、获取待处理的病人的诊断信息。

所述待处理的病人的诊断信息来源于病人的电子病历，电子病历可以是门诊病历或者入院信息记录。应当理解的是，在一份诊断信息中，只有该病一次诊断记录对应的诊断数据，诊断数据可以包括诊断的疾病名称和疾病相关病征，如发烧、发热、喉咙痛、耳鸣、流鼻涕、口腔溃疡、心率不齐、胸闷、头晕等。

步骤S20、将所述诊断信息输入深度神经网络模型进行处理，得到所述待处理的病人的本次治疗方案的预测结果。

首先，可以根据预先训练好的词向量获取待处理的病人的诊断信息对应的词向量。具体地，可以利用预先构建的连续词袋模型(CBOW)提取所述待处理的病人的诊断信息对应的词向量。CBOW模型的训练输入是某一个特征词的上下文相关的词对应的词向量，而输出就是该特征词的词向量。比如，在诊断信息中，存在一个诊断数据中的一个子数据为“喉咙痛”、“流鼻涕”、“头晕”，通过CBOW模型可以提取到的编码向量为“感冒”。

具体地，在构建CBOW模型时，对于重要的模型参数初始化，设置学习率为0.015，设置迭代次数为5，设置最小词频为5，设置窗口大小为6，设置特征向量维数为64，设置批量大小为500，设置降采样阈值为1e-3。

进一步地，由于在不同的诊断信息中，对于同一种诊断存在不同的词语表达，可以先将诊断信息根据国际疾病分类标准(ICD-9)转换成诊断编码，再利用独热编码(one-hot)算法或者CBOW模型将诊断编码转换成词向量。ICD-9是根据疾病的某些特征，按照规则将疾病分类，并用编码的方法来表示的***。

这样，通过预先构建的CBOW连续词袋模型获取诊断信息或诊断编码的词向量，能够实现诊断信息中原始诊断记录与具体疾病名称和疾病相关病征的对应，以及将对应的疾病名称和疾病相关病征转换为深度神经网络模型能接受数值形式，即所述词向量。

本实施例中深度神经网络模型包括多层的LSTM长短期记忆网络(Long/shortterm memory)，或者包括多层的GRU门控递归单元网络(Gated recurrent units)，优选地，所述深度神经网络模型包括多层的GRU门控递归单元网络。需要说明的是，LSTM网络和GRU网络均是具有时间联结的前馈神经网络，输入向量输入到LSTM网络或GRU网络的顺序，将会影响神经网络的训练结果。比如，相比先输入“曲奇饼”再输入“牛奶”，先输入“牛奶”再输入“曲奇饼”后，神经网络模型所输出的结果可能不同。

因此，根据一份诊断信息生成的词向量序列中词向量的先后次序和该诊断信息对应的分词的先后次序是一致的，可以将该词向量序列看做是具有一定的时间序列数据，依次将该词向量序列中的词向量输入到LSTM网络或GRU网络中进行处理，LSTM网络或GRU网络会依次输出和输入的词向量一一对应的隐向量，最终深度神经网络模型的全连接层根据这些词向量对应的隐向量得到对该份诊断信息对应的治疗方案的预测结果。

需要说明的是，待处理的病人的诊断信息对应的治疗方案的预测结果为多标签概率向量，该多标签概率向量的维数为预设的治疗方案的个数，其中，治疗方案包括药物治疗、***、输液、手术或其他治疗手段。一个标签对应一种治疗方案，一个标签概率为待处理的病人本次就诊获得的该种治疗方案的概率值，该概率值能够反映该种治疗方案的可靠度或可采纳度。

步骤S30、将所述本次治疗方案的预测结果输入序列到序列模型进行处理，得到所述待处理的病人的未来治疗方案的预测结果。

可以将步骤S20得到的本次治疗方案的预测结果输入到序列到序列模型中，以得到所述待处理的病人的未来治疗方案的预测结果。所述序列到序列模型为端到端(End-to-End)的序列到序列(Sequence-to-Sequence)模型，Sequence-to-Sequence模型一般是通过编码-解码(Encoder-Decoder)框架实现，Encoder和Decoder部分可以是任意的文字，语音，图像，视频数据，Sequence-to-Sequence模型可以采用CNN卷积神经网络、RNN循环神经网络、LSTM网络、GRU网络等深度学习网络构建，优选地，本实施例采用RNN循环神经网络构建所述Sequence-to-Sequence模型。

将得到的待处理病人的本次治疗方案的预测结果即多标签概率向量作为一组治疗序列输入到一个RNN网络中，用于提取该多标签概率向量的序列信息，得到一个定长的预测编码向量，这个RNN称为encoder(编码器)，将该预测编码向量输入到另一个RNN中，解码成得到一个解码向量，这个RNN一般称为decoder(解码器)，这样就直接得到了从一组治疗序列到接下来一组治疗序列的直接映射，通过decoder解码便可得到一个治疗序列，所述治疗序列为该病人下一次的治疗方案的预测结果，也是一个概率向量。

进一步地，可以将病人下一次的治疗方案的预测结果输入序列到序列模型进行处理，得到所述待处理病人的再下一次治疗方案的预测结果。

可以理解地，还可以预先设定待处理病人的治疗方案的预测结果的预设数目，每当序列到序列模型得到新的一个治疗方案的预测结果时，计算该待处理病人的治疗方案的预测结果的个数，若该待处理病人的治疗方案的预测结果的个数未达到所述预设数目，将当前得到的治疗方案的预测结果再次输入到序列到序列模型，以获取新的治疗方案。例如，可能当次生成的治疗方案与下次生成的治疗方案，对应的治疗手段均是使用同一种药物，但是下次生成的治疗方案的用药量可能会比当次生成的治疗方案的用药量少。

在本实施例中，通过序列到序列模型获得一组治疗序列(即一个治疗方案)到下一组治疗序列的直接映射为一种创新的技术方案，该方案的实施不需要依赖外部的特征和额外的训练过程，可以得到一个病人在整个治疗周期中的治疗路径，可以避免对病人治疗路径相似度度量的繁琐的处理，为病人提供递进的治疗方案参考建议从而达到更好地辅助治疗的目的。

在本实施例中，根据预设数量的诊断信息和与所述诊断信息对应的治疗方案对深度神经网络模型和序列到序列模型进行联合训练。

具体地，先确定序列到序列模型需要预测的治疗方案数目，根据需要预测的治疗方案数目确定训练数据样本中每个病人诊断信息至少需要包含几次诊断记录，例如需要预测的治疗方案数目为三次，则训练数据样本中每个病人诊断信息至少需要包含三次诊断记录；训练时，先将待处理病人的第一次诊断信息输入深度神经网模型进行处理，得到对应的第一次治疗方案的预测结果，此时根据第一次治疗方案的预测结果和真实的第一次治疗方案进行误差计算和深度神经网络模型中的参数更新；继续将预测的第一次治疗方案的预测结果输入到序列到序列模型中进行处理，得到第二次治疗方案的预测结果，此时根据第二次治疗方案的预测结果和真实的第二次治疗方案进行误差计算和序列到序列模型中的参数更新；判断治疗方案的预测结果数目是否到达了预设数目，若未达到则将第二次治疗方案的预测结果返回输入到序列到序列模型，重复上述预测、误差计算和序列到序列模型参数更新的步骤。

在预先构建的神经网络模型中，包括一个多层的LSTM网络或者GRU网络，具体地，设置网络层数初始化为20，每层隐藏单元数初始化为64。将获取到的训练数据经过神经网络模型和序列到序列模型的多次迭代，即可实现神经网络模型和序列到序列模型的训练生成。

需要说明的是，为了提高模型训练的效率和准确率，在对训练数据中诊断信息对应的治疗方案进行预处理时，仅筛选出前1500种最常见的药物和治疗手段，每种药物和治疗手段都由一个编码表示，以作为神经网络模型中的用于生成治疗方案的基础数据库。

在一实施例中，获取待处理的病人的诊断信息；将所述诊断信息输入深度神经网络模型进行处理，得到所述待处理的病人的本次治疗方案的预测结果；将所述本次治疗方案的预测结果输入序列到序列模型进行处理，得到所述待处理的病人的未来治疗方案的预测结果。这样，通过具有时间联结的前馈型深度神经网络生成病人的当次的治疗方案，并通过序列到序列模型预测病人未来的治疗方案，为病人提供递进的治疗方案参考建议从而达到更好地辅助治疗的目的。

在第二实施例中，如图3所示，在上述图2所示的实施例基础上，所述将所述诊断信息输入深度神经网络模型进行处理，得到所述待处理的病人的本次治疗方案的预测结果的步骤包括：

步骤S40、将所述诊断信息输入深度神经网络模型进行处理，得到所述诊断信息对应的隐向量。

步骤S41、将所述诊断信息对应的隐向量输入自注意力机制层进行处理，获得所述隐向量对应的权重。

步骤S42、根据所述隐向量和所述权重得到加权后的隐向量。

步骤S43、根据所述加权后的隐向量得到所述待处理的病人的本次治疗方案的预测结果。

本实施例中，通过预先构建的深度神经网络模型，或者训练完成深度神经网络模型，将诊断信息对应的词向量作为深度神经网络模型的输入向量，基于输入向量，深度神经网络模型对应输出与该输入向量对应的输出向量，作为与所述诊断信息对应的隐向量，所述隐向量为所述诊断信息对应的特征表示。

由于诊断信息中的病人的病征具有不同病情的轻重程度，因此，可以根据诊断信息中的病征，将诊断信息划分为病征一级、病征二级、病征三级和病征四级这四个病征等级，即所述等级信息，其中，病征四级对应为主要诊断的病征，病征三级对应为其他诊断的病征，病征二级为损伤类的病征，病征一级为其他常见的轻微病征，重要程度依次降低。

具体地，在根据隐向量生成治疗方案前，通过引入自注意力机制(Self-AttentionMechanism)作为权重层，将隐向量输入到权重层中，让自注意力机制根据各隐向量归类的病征等级，进行自主学习，生成与病征等级对应的权重，将权重赋予对应的隐向量。当然，在构建深度神经网络模型时，也可以是构建包括所述权重层的深度神经网络模型。

需要说明的是，自注意力机制和传统注意力机制的不同在于，传统注意力机制本质上是一种对齐的操作，即需要引入注意力机制的句子与外部的信息进行对齐，而自注意力机制不需要引入外部的信息来更新参数。自注意力机制在序列学习任务上具有巨大的提升作用，自注意力机制通过对源数据序列进行数据加权变换，可以有效提高序列对序列模型的***表现。

具体地，在深度神经网络模型输出的长度为n的隐向量序列H可以表示为：

H＝(h₁,h₂,…,h_n)

自注意力机制的权重公式为：

a＝softmax(W_s2tanh(W_s1H^T))

其中，a为与隐向量序列H对应的权重序列，H^T为阵列翻转转置后的隐向量序列H，W_s1和W_s2都是自注意力机制模型中的模型参数，在训练迭代中不断更新优化。

经过自注意力机制，赋予了权重值的隐向量序列M可以表示为：

M＝aH

将赋予了权重值的隐向量经过全连接层的处理得到待处理病人的诊断信息对应的治疗方案预测结果，将该预测结果输入到序列到序列模型中生成病人的治疗方案时，权重值越大的隐向量，自然会引起序列到序列模型更多的“重视”，可以提高序列到序列模型生成的所述待处理的病人的未来治疗方***性。

在一实施例中，将所述诊断信息输入深度神经网络模型进行处理，得到所述诊断信息对应的隐向量；将所述诊断信息对应的隐向量输入自注意力机制层进行处理，获得所述隐向量对应的权重；根据所述隐向量和所述权重得到加权后的隐向量；根据所述加权后的隐向量得到所述待处理的病人的本次治疗方案的预测结果。这样，通过在生成治疗方案的过程中根据各隐向量所对应的诊断信息的病征等级，在自注意力机制的自主学习下，对隐向量赋予对病征等级对应的权重值，实现根据病人病征轻重程度生成治疗方案，提高了生成的治疗方***性。

此外，本发明还提出一种基于深度学习的治疗方案的生成装置，所述基于深度学习的治疗方案的生成装置包括存储器、处理器及存储在存储器上并可在处理器上运行的基于深度学习的治疗方案的生成程序，所述处理器执行所述基于深度学习的治疗方案的生成程序时实现如以上实施例所述的基于深度学习的治疗方案的生成方法的步骤。

此外，本发明还提出一种计算机可读存储介质，其特征在于，所述计算机可读存储介质包括基于深度学习的治疗方案的生成程序，所述基于深度学习的治疗方案的生成程序被处理器执行时实现如以上实施例所述的基于深度学习的治疗方案的生成方法的步骤。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是电视机，手机，计算机，基于深度学习的治疗方案的生成装置，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种基于深度学习的治疗方案的生成方法，其特征在于，所述基于深度学习的治疗方案的生成方法包括以下步骤：

获取待处理的病人的诊断信息；

2.如权利要求1所述的基于深度学习的治疗方案的生成方法，其特征在于，所述将所述诊断信息输入深度神经网络模型进行处理，得到所述待处理的病人的本次治疗方案的预测结果的步骤包括：

根据所述隐向量和所述权重得到加权后的隐向量；

3.如权利要求2所述的基于深度学习的治疗方案的生成方法，其特征在于，所述将所述诊断信息对应的隐向量输入自注意力机制层进行处理，获得所述隐向量对应的权重的步骤包括：

4.如权利要求3所述的基于深度学习的治疗方案的生成方法，其特征在于，所述诊断信息的等级信息包括：主要诊断、其他诊断、损伤诊断和其他诊断。

5.如权利要求1所述的基于深度学习的治疗方案的生成方法，其特征在于，所述深度神经网络模型包括多层的长短期记忆网络或者多层的门控递归单元网络，根据预设数量的病人的诊断信息和与所述病人的诊断信息对应的治疗方案对所述深度神经网络模型和所述序列到序列模型进行联合训练。

6.如权利要求5所述的基于深度学习的治疗方案的生成方法，其特征在于，所述预设数量的病人的诊断信息为入院次数不小于预设次数的病人的诊断信息。

7.如权利要求1至6任一项所述的基于深度学习的治疗方案的生成方法，其特征在于，所述将所述本次治疗方案的预测结果输入序列到序列模型进行处理，得到所述待处理的病人的未来治疗方案的预测结果的步骤包括：

8.如权利要求1至6任一项所述的基于深度学习的治疗方案的生成方法，其特征在于，所述获取待处理的病人的诊断信息的步骤之后还包括：

9.一种基于深度学习的治疗方案的生成装置，其特征在于，所述基于深度学习的治疗方案的生成装置包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于深度学习的治疗方案的生成程序，所述基于深度学习的治疗方案的生成程序被所述处理器执行时实现如权利要求1至8中任一项所述的基于深度学习的治疗方案的生成方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有基于深度学习的治疗方案的生成程序，所述基于深度学习的治疗方案的生成程序被处理器执行时实现如权利要求1至8中任一项所述的基于深度学习的治疗方案的生成方法的步骤。