CN109637669A - 基于深度学习的治疗方案的生成方法、装置及存储介质 - Google Patents
基于深度学习的治疗方案的生成方法、装置及存储介质 Download PDFInfo
- Publication number
- CN109637669A CN109637669A CN201811407145.8A CN201811407145A CN109637669A CN 109637669 A CN109637669 A CN 109637669A CN 201811407145 A CN201811407145 A CN 201811407145A CN 109637669 A CN109637669 A CN 109637669A
- Authority
- CN
- China
- Prior art keywords
- therapeutic scheme
- patient
- diagnostic message
- prediction result
- deep learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000001225 therapeutic effect Effects 0.000 title claims abstract description 168
- 238000013135 deep learning Methods 0.000 title claims abstract description 57
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000003860 storage Methods 0.000 title claims abstract description 18
- 238000003062 neural network model Methods 0.000 claims abstract description 37
- 239000013598 vector Substances 0.000 claims description 89
- 230000007246 mechanism Effects 0.000 claims description 28
- 238000003745 diagnosis Methods 0.000 claims description 25
- 230000015654 memory Effects 0.000 claims description 21
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 19
- 201000010099 disease Diseases 0.000 claims description 18
- 238000012549 training Methods 0.000 claims description 16
- 230000007787 long-term memory Effects 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 4
- 238000013528 artificial neural network Methods 0.000 abstract description 9
- 230000000750 progressive effect Effects 0.000 abstract description 3
- 208000024891 symptom Diseases 0.000 description 23
- 238000010586 diagram Methods 0.000 description 4
- 239000003814 drug Substances 0.000 description 4
- 229940079593 drug Drugs 0.000 description 4
- 230000036541 health Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 210000004218 nerve net Anatomy 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 206010068319 Oropharyngeal pain Diseases 0.000 description 2
- 201000007100 Pharyngitis Diseases 0.000 description 2
- 206010037660 Pyrexia Diseases 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 235000014510 cooky Nutrition 0.000 description 2
- 208000002173 dizziness Diseases 0.000 description 2
- 239000008267 milk Substances 0.000 description 2
- 210000004080 milk Anatomy 0.000 description 2
- 235000013336 milk Nutrition 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 208000035211 Heart Murmurs Diseases 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 208000036071 Rhinorrhea Diseases 0.000 description 1
- 206010039101 Rhinorrhoea Diseases 0.000 description 1
- 208000009205 Tinnitus Diseases 0.000 description 1
- 208000020670 canker sore Diseases 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 210000003097 mucus Anatomy 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 230000000474 nursing effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 231100000886 tinnitus Toxicity 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/50—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Public Health (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Molecular Biology (AREA)
- Medical Informatics (AREA)
- General Engineering & Computer Science (AREA)
- Epidemiology (AREA)
- Pathology (AREA)
- Primary Health Care (AREA)
- Databases & Information Systems (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明公开了一种基于深度学习的治疗方案的生成方法,包括以下步骤:获取待处理的病人的诊断信息;将所述诊断信息输入深度神经网络模型进行处理,得到所述待处理的病人的本次治疗方案的预测结果;将所述本次治疗方案的预测结果输入序列到序列模型进行处理,得到所述待处理的病人的未来治疗方案的预测结果。本发明还公开了一种基于深度学习的治疗方案的生成装置以及计算机可读存储介质。本发明通过具有时间联结的前馈型深度神经网络生成病人的当次的治疗方案,并通过序列到序列模型预测病人未来的治疗方案,为病人提供递进的治疗方案参考建议从而达到更好地辅助治疗的目的。
Description
技术领域
本发明涉及人工智能领域,尤其涉及一种基于深度学习的治疗方案的生成方法、基于深度学习的治疗方案的生成装置以及计算机可读存储介质。
背景技术
目前,在医院或医疗机构,每天都会产生大量电子病历文本,电子病历是一种专业性很强的医疗文本,是病人在医院诊断治疗全过程的原始记录,它包含有病人的病程记录、检查检验结果、医嘱、手术记录、护理记录等等信息。
近年来由于大数据及人工智能技术发展迅速,人们开始将机器学习相关技术运用到辅助诊断或治疗领域中,以智能生成及推荐对病人的治疗方法,帮助医生快速制定治疗方案。
但在现有的治疗方案智能生成的技术中,没有考虑到病人连续时间内诊断信息之间的联系,也只能预测病人当次就诊的治疗方案,无法对病人在整个治疗周期中的多次治疗方案进行全面的预测。
发明内容
本发明的主要目的在于提供一种基于深度学习的治疗方案的生成方法、基于深度学习的治疗方案的生成装置以及计算机可读存储介质,解决现有技术中无法对病人在整个治疗周期中的多次治疗方案进行全面的预测的技术问题。
为实现上述目的,本发明提供一种基于深度学习的治疗方案的生成方法,所述基于深度学习的治疗方案的生成方法包括以下步骤:
获取待处理的病人的诊断信息;
将所述诊断信息输入深度神经网络模型进行处理,得到所述待处理的病人的本次治疗方案的预测结果;
将所述本次治疗方案的预测结果输入序列到序列模型进行处理,得到所述待处理的病人的未来治疗方案的预测结果。
优选地,所述将所述诊断信息输入深度神经网络模型进行处理,得到所述待处理的病人的本次治疗方案的预测结果的步骤包括:
将所述诊断信息输入深度神经网络模型进行处理,得到所述诊断信息对应的隐向量;
将所述诊断信息对应的隐向量输入自注意力机制层进行处理,获得所述隐向量对应的权重;
根据所述隐向量和所述权重得到加权后的隐向量;
根据所述加权后的隐向量得到所述待处理的病人的本次治疗方案的预测结果。
优选地,将所述诊断信息对应的隐向量输入自注意力机制层进行处理,获得所述隐向量对应的权重的步骤包括:
将所述诊断信息对应的隐向量输入自注意力机制层进行处理;
所述自注意力机制层根据所述诊断信息的等级信息学习到所述隐向量对应的权重。
优选地,所述诊断信息的等级信息包括:主要诊断、其他诊断、损伤诊断和其他诊断。
优选地,所述深度神经网络模型包括多层的长短期记忆网络或者多层的门控递归单元网络,根据预设数量的病人的诊断信息和与所述病人的诊断信息对应的治疗方案对所述深度神经网络模型和所述序列到序列模型进行联合训练。
优选地,所述预设数量的病人的诊断信息为入院次数不小于预设次数的病人的诊断信息。
优选地,所述将所述本次治疗方案的预测结果输入序列到序列模型进行处理,得到所述待处理的病人的未来治疗方案的预测结果的步骤包括:
将所述本次治疗方案的预测结果输入序列到序列模型进行处理,得到所述待处理病人的下一次治疗方案的预测结果;
获取所述待处理病人的治疗方案的预测结果的个数是否达到预设数目;
若所述待处理病人的治疗方案的预测结果的个数未达到所述预设数目,将所述下一次治疗方案的预测结果作为所述本次治疗方案的预测结果,返回执行所述将所述本次治疗方案的预测结果输入序列到序列模型进行处理的步骤。
优选地,所述获取待处理的病人的诊断信息的步骤之后还包括:
根据国际疾病编码标准获取所述病人的诊断信息对应的编码向量;
将所述病人的诊断信息对应的编码向量输入深度神经网络模型进行处理,得到所述待处理的病人的本次治疗方案的预测结果。
为实现上述目的,本发明还提供一种基于深度学习的治疗方案的生成装置,所述基于深度学习的治疗方案的生成装置包括:
所述基于深度学习的治疗方案的生成装置包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于深度学习的治疗方案的生成程序,所述基于深度学习的治疗方案的生成程序被所述处理器执行时实现如上述基于深度学习的治疗方案的生成方法的步骤。
为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有基于深度学习的治疗方案的生成程序,所述基于深度学习的治疗方案的生成程序被处理器执行时实现如上述基于深度学习的治疗方案的生成方法的步骤。
本发明提供的基于深度学习的治疗方案的生成方法、基于深度学习的治疗方案的生成装置以及计算机可读存储介质,获取待处理的病人的诊断信息;将所述诊断信息输入深度神经网络模型进行处理,得到所述待处理的病人的本次治疗方案的预测结果;将所述本次治疗方案的预测结果输入序列到序列模型进行处理,得到所述待处理的病人的未来治疗方案的预测结果。这样,通过具有时间联结的前馈型深度神经网络生成病人的治疗方案,并通过序列到序列模型预测病人未来的治疗方案,提高了预测得到的病人治疗方***率。
附图说明
图1为本发明实施例方案涉及的实施例终端的硬件运行环境示意图;
图2为本发明基于深度学习的治疗方案的生成方法第一实施例的流程示意图;
图3为本发明基于深度学习的治疗方案的生成方法第二实施例的流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种基于深度学习的治疗方案的生成方法,通过具有时间联结的前馈型深度神经网络生成病人的治疗方案,并通过序列到序列模型预测病人未来的治疗方案,提高了预测得到的病人治疗方***率。
如图1所示,图1是本发明实施例方案涉及的实施例终端的硬件运行环境示意图;
本发明实施例终端可以是基于深度学习的治疗方案的生成装置,也可以是服务器。
如图1所示,该终端可以包括:处理器1001,例如CPU,存储器1002,通信总线1003。其中,通信总线1003用于实现该终端中各组成部件之间的连接通信。存储器1002可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1002可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的终端的结构并不构成对本发明实施例终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1002中可以包括基于深度学习的治疗方案的生成程序。
在图1所示的终端中,处理器1001可以用于调用存储器1002中存储的基于深度学习的治疗方案的生成程序,并执行以下操作:
获取待处理的病人的诊断信息;
将所述诊断信息输入深度神经网络模型进行处理,得到所述待处理的病人的本次治疗方案的预测结果;
将所述本次治疗方案的预测结果输入序列到序列模型进行处理,得到所述待处理的病人的未来治疗方案的预测结果。
进一步地,处理器1001可以调用存储器1002中存储的基于深度学习的治疗方案的生成程序,还执行以下操作:
将所述诊断信息输入深度神经网络模型进行处理,得到所述诊断信息对应的隐向量;
将所述诊断信息对应的隐向量输入自注意力机制层进行处理,获得所述隐向量对应的权重;
根据所述隐向量和所述权重得到加权后的隐向量;
根据所述加权后的隐向量得到所述待处理的病人的本次治疗方案的预测结果。
进一步地,处理器1001可以调用存储器1002中存储的基于深度学习的治疗方案的生成程序,还执行以下操作:
将所述诊断信息对应的隐向量输入自注意力机制层进行处理;
将所述诊断信息对应的隐向量输入自注意力机制层进行处理;
所述自注意力机制层根据所述诊断信息的等级信息学习到所述隐向量对应的权重。
进一步地,处理器1001可以调用存储器1002中存储的基于深度学习的治疗方案的生成程序,还执行以下操作:
所述诊断信息的等级信息包括:主要诊断、其他诊断、损伤诊断和其他诊断。
进一步地,处理器1001可以调用存储器1002中存储的基于深度学习的治疗方案的生成程序,还执行以下操作:
所述深度神经网络模型包括多层的长短期记忆网络或者多层的门控递归单元网络,根据预设数量的病人的诊断信息和与所述病人的诊断信息对应的治疗方案对所述深度神经网络模型和所述序列到序列模型进行联合训练。
进一步地,处理器1001可以调用存储器1002中存储的基于深度学习的治疗方案的生成程序,还执行以下操作:
所述预设数量的病人的诊断信息为入院次数不小于预设次数的病人的诊断信息。
进一步地,处理器1001可以调用存储器1002中存储的基于深度学习的治疗方案的生成程序,还执行以下操作:
将所述本次治疗方案的预测结果输入序列到序列模型进行处理,得到所述待处理病人的下一次治疗方案的预测结果;
获取所述待处理病人的治疗方案的预测结果的个数是否达到预设数目;
若所述待处理病人的治疗方案的预测结果的个数未达到所述预设数目,将所述下一次治疗方案的预测结果作为所述本次治疗方案的预测结果,返回执行所述将所述本次治疗方案的预测结果输入序列到序列模型进行处理的步骤。
进一步地,处理器1001可以调用存储器1002中存储的基于深度学习的治疗方案的生成程序,还执行以下操作:
根据国际疾病编码标准获取所述病人的诊断信息对应的编码向量;
将所述病人的诊断信息对应的编码向量输入深度神经网络模型进行处理,得到所述待处理的病人的本次治疗方案的预测结果。
参照图2,在一实施例中,所述基于深度学习的治疗方案的生成方法包括:
步骤S10、获取待处理的病人的诊断信息。
所述待处理的病人的诊断信息来源于病人的电子病历,电子病历可以是门诊病历或者入院信息记录。应当理解的是,在一份诊断信息中,只有该病一次诊断记录对应的诊断数据,诊断数据可以包括诊断的疾病名称和疾病相关病征,如发烧、发热、喉咙痛、耳鸣、流鼻涕、口腔溃疡、心率不齐、胸闷、头晕等。
步骤S20、将所述诊断信息输入深度神经网络模型进行处理,得到所述待处理的病人的本次治疗方案的预测结果。
首先,可以根据预先训练好的词向量获取待处理的病人的诊断信息对应的词向量。具体地,可以利用预先构建的连续词袋模型(CBOW)提取所述待处理的病人的诊断信息对应的词向量。CBOW模型的训练输入是某一个特征词的上下文相关的词对应的词向量,而输出就是该特征词的词向量。比如,在诊断信息中,存在一个诊断数据中的一个子数据为“喉咙痛”、“流鼻涕”、“头晕”,通过CBOW模型可以提取到的编码向量为“感冒”。
具体地,在构建CBOW模型时,对于重要的模型参数初始化,设置学习率为0.015,设置迭代次数为5,设置最小词频为5,设置窗口大小为6,设置特征向量维数为64,设置批量大小为500,设置降采样阈值为1e-3。
进一步地,由于在不同的诊断信息中,对于同一种诊断存在不同的词语表达,可以先将诊断信息根据国际疾病分类标准(ICD-9)转换成诊断编码,再利用独热编码(one-hot)算法或者CBOW模型将诊断编码转换成词向量。ICD-9是根据疾病的某些特征,按照规则将疾病分类,并用编码的方法来表示的***。
这样,通过预先构建的CBOW连续词袋模型获取诊断信息或诊断编码的词向量,能够实现诊断信息中原始诊断记录与具体疾病名称和疾病相关病征的对应,以及将对应的疾病名称和疾病相关病征转换为深度神经网络模型能接受数值形式,即所述词向量。
本实施例中深度神经网络模型包括多层的LSTM长短期记忆网络(Long/shortterm memory),或者包括多层的GRU门控递归单元网络(Gated recurrent units),优选地,所述深度神经网络模型包括多层的GRU门控递归单元网络。需要说明的是,LSTM网络和GRU网络均是具有时间联结的前馈神经网络,输入向量输入到LSTM网络或GRU网络的顺序,将会影响神经网络的训练结果。比如,相比先输入“曲奇饼”再输入“牛奶”,先输入“牛奶”再输入“曲奇饼”后,神经网络模型所输出的结果可能不同。
因此,根据一份诊断信息生成的词向量序列中词向量的先后次序和该诊断信息对应的分词的先后次序是一致的,可以将该词向量序列看做是具有一定的时间序列数据,依次将该词向量序列中的词向量输入到LSTM网络或GRU网络中进行处理,LSTM网络或GRU网络会依次输出和输入的词向量一一对应的隐向量,最终深度神经网络模型的全连接层根据这些词向量对应的隐向量得到对该份诊断信息对应的治疗方案的预测结果。
需要说明的是,待处理的病人的诊断信息对应的治疗方案的预测结果为多标签概率向量,该多标签概率向量的维数为预设的治疗方案的个数,其中,治疗方案包括药物治疗、***、输液、手术或其他治疗手段。一个标签对应一种治疗方案,一个标签概率为待处理的病人本次就诊获得的该种治疗方案的概率值,该概率值能够反映该种治疗方案的可靠度或可采纳度。
步骤S30、将所述本次治疗方案的预测结果输入序列到序列模型进行处理,得到所述待处理的病人的未来治疗方案的预测结果。
可以将步骤S20得到的本次治疗方案的预测结果输入到序列到序列模型中,以得到所述待处理的病人的未来治疗方案的预测结果。所述序列到序列模型为端到端(End-to-End)的序列到序列(Sequence-to-Sequence)模型,Sequence-to-Sequence模型一般是通过编码-解码(Encoder-Decoder)框架实现,Encoder和Decoder部分可以是任意的文字,语音,图像,视频数据,Sequence-to-Sequence模型可以采用CNN卷积神经网络、RNN循环神经网络、LSTM网络、GRU网络等深度学习网络构建,优选地,本实施例采用RNN循环神经网络构建所述Sequence-to-Sequence模型。
将得到的待处理病人的本次治疗方案的预测结果即多标签概率向量作为一组治疗序列输入到一个RNN网络中,用于提取该多标签概率向量的序列信息,得到一个定长的预测编码向量,这个RNN称为encoder(编码器),将该预测编码向量输入到另一个RNN中,解码成得到一个解码向量,这个RNN一般称为decoder(解码器),这样就直接得到了从一组治疗序列到接下来一组治疗序列的直接映射,通过decoder解码便可得到一个治疗序列,所述治疗序列为该病人下一次的治疗方案的预测结果,也是一个概率向量。
进一步地,可以将病人下一次的治疗方案的预测结果输入序列到序列模型进行处理,得到所述待处理病人的再下一次治疗方案的预测结果。
可以理解地,还可以预先设定待处理病人的治疗方案的预测结果的预设数目,每当序列到序列模型得到新的一个治疗方案的预测结果时,计算该待处理病人的治疗方案的预测结果的个数,若该待处理病人的治疗方案的预测结果的个数未达到所述预设数目,将当前得到的治疗方案的预测结果再次输入到序列到序列模型,以获取新的治疗方案。例如,可能当次生成的治疗方案与下次生成的治疗方案,对应的治疗手段均是使用同一种药物,但是下次生成的治疗方案的用药量可能会比当次生成的治疗方案的用药量少。
在本实施例中,通过序列到序列模型获得一组治疗序列(即一个治疗方案)到下一组治疗序列的直接映射为一种创新的技术方案,该方案的实施不需要依赖外部的特征和额外的训练过程,可以得到一个病人在整个治疗周期中的治疗路径,可以避免对病人治疗路径相似度度量的繁琐的处理,为病人提供递进的治疗方案参考建议从而达到更好地辅助治疗的目的。
在本实施例中,根据预设数量的诊断信息和与所述诊断信息对应的治疗方案对深度神经网络模型和序列到序列模型进行联合训练。
具体地,先确定序列到序列模型需要预测的治疗方案数目,根据需要预测的治疗方案数目确定训练数据样本中每个病人诊断信息至少需要包含几次诊断记录,例如需要预测的治疗方案数目为三次,则训练数据样本中每个病人诊断信息至少需要包含三次诊断记录;训练时,先将待处理病人的第一次诊断信息输入深度神经网模型进行处理,得到对应的第一次治疗方案的预测结果,此时根据第一次治疗方案的预测结果和真实的第一次治疗方案进行误差计算和深度神经网络模型中的参数更新;继续将预测的第一次治疗方案的预测结果输入到序列到序列模型中进行处理,得到第二次治疗方案的预测结果,此时根据第二次治疗方案的预测结果和真实的第二次治疗方案进行误差计算和序列到序列模型中的参数更新;判断治疗方案的预测结果数目是否到达了预设数目,若未达到则将第二次治疗方案的预测结果返回输入到序列到序列模型,重复上述预测、误差计算和序列到序列模型参数更新的步骤。
在预先构建的神经网络模型中,包括一个多层的LSTM网络或者GRU网络,具体地,设置网络层数初始化为20,每层隐藏单元数初始化为64。将获取到的训练数据经过神经网络模型和序列到序列模型的多次迭代,即可实现神经网络模型和序列到序列模型的训练生成。
需要说明的是,为了提高模型训练的效率和准确率,在对训练数据中诊断信息对应的治疗方案进行预处理时,仅筛选出前1500种最常见的药物和治疗手段,每种药物和治疗手段都由一个编码表示,以作为神经网络模型中的用于生成治疗方案的基础数据库。
在一实施例中,获取待处理的病人的诊断信息;将所述诊断信息输入深度神经网络模型进行处理,得到所述待处理的病人的本次治疗方案的预测结果;将所述本次治疗方案的预测结果输入序列到序列模型进行处理,得到所述待处理的病人的未来治疗方案的预测结果。这样,通过具有时间联结的前馈型深度神经网络生成病人的当次的治疗方案,并通过序列到序列模型预测病人未来的治疗方案,为病人提供递进的治疗方案参考建议从而达到更好地辅助治疗的目的。
在第二实施例中,如图3所示,在上述图2所示的实施例基础上,所述将所述诊断信息输入深度神经网络模型进行处理,得到所述待处理的病人的本次治疗方案的预测结果的步骤包括:
步骤S40、将所述诊断信息输入深度神经网络模型进行处理,得到所述诊断信息对应的隐向量。
步骤S41、将所述诊断信息对应的隐向量输入自注意力机制层进行处理,获得所述隐向量对应的权重。
步骤S42、根据所述隐向量和所述权重得到加权后的隐向量。
步骤S43、根据所述加权后的隐向量得到所述待处理的病人的本次治疗方案的预测结果。
本实施例中,通过预先构建的深度神经网络模型,或者训练完成深度神经网络模型,将诊断信息对应的词向量作为深度神经网络模型的输入向量,基于输入向量,深度神经网络模型对应输出与该输入向量对应的输出向量,作为与所述诊断信息对应的隐向量,所述隐向量为所述诊断信息对应的特征表示。
由于诊断信息中的病人的病征具有不同病情的轻重程度,因此,可以根据诊断信息中的病征,将诊断信息划分为病征一级、病征二级、病征三级和病征四级这四个病征等级,即所述等级信息,其中,病征四级对应为主要诊断的病征,病征三级对应为其他诊断的病征,病征二级为损伤类的病征,病征一级为其他常见的轻微病征,重要程度依次降低。
具体地,在根据隐向量生成治疗方案前,通过引入自注意力机制(Self-AttentionMechanism)作为权重层,将隐向量输入到权重层中,让自注意力机制根据各隐向量归类的病征等级,进行自主学习,生成与病征等级对应的权重,将权重赋予对应的隐向量。当然,在构建深度神经网络模型时,也可以是构建包括所述权重层的深度神经网络模型。
需要说明的是,自注意力机制和传统注意力机制的不同在于,传统注意力机制本质上是一种对齐的操作,即需要引入注意力机制的句子与外部的信息进行对齐,而自注意力机制不需要引入外部的信息来更新参数。自注意力机制在序列学习任务上具有巨大的提升作用,自注意力机制通过对源数据序列进行数据加权变换,可以有效提高序列对序列模型的***表现。
具体地,在深度神经网络模型输出的长度为n的隐向量序列H可以表示为:
H=(h1,h2,…,hn)
自注意力机制的权重公式为:
a=softmax(Ws2tanh(Ws1HT))
其中,a为与隐向量序列H对应的权重序列,HT为阵列翻转转置后的隐向量序列H,Ws1和Ws2都是自注意力机制模型中的模型参数,在训练迭代中不断更新优化。
经过自注意力机制,赋予了权重值的隐向量序列M可以表示为:
M=aH
将赋予了权重值的隐向量经过全连接层的处理得到待处理病人的诊断信息对应的治疗方案预测结果,将该预测结果输入到序列到序列模型中生成病人的治疗方案时,权重值越大的隐向量,自然会引起序列到序列模型更多的“重视”,可以提高序列到序列模型生成的所述待处理的病人的未来治疗方***性。
在一实施例中,将所述诊断信息输入深度神经网络模型进行处理,得到所述诊断信息对应的隐向量;将所述诊断信息对应的隐向量输入自注意力机制层进行处理,获得所述隐向量对应的权重;根据所述隐向量和所述权重得到加权后的隐向量;根据所述加权后的隐向量得到所述待处理的病人的本次治疗方案的预测结果。这样,通过在生成治疗方案的过程中根据各隐向量所对应的诊断信息的病征等级,在自注意力机制的自主学习下,对隐向量赋予对病征等级对应的权重值,实现根据病人病征轻重程度生成治疗方案,提高了生成的治疗方***性。
此外,本发明还提出一种基于深度学习的治疗方案的生成装置,所述基于深度学习的治疗方案的生成装置包括存储器、处理器及存储在存储器上并可在处理器上运行的基于深度学习的治疗方案的生成程序,所述处理器执行所述基于深度学习的治疗方案的生成程序时实现如以上实施例所述的基于深度学习的治疗方案的生成方法的步骤。
此外,本发明还提出一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括基于深度学习的治疗方案的生成程序,所述基于深度学习的治疗方案的生成程序被处理器执行时实现如以上实施例所述的基于深度学习的治疗方案的生成方法的步骤。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是电视机,手机,计算机,基于深度学习的治疗方案的生成装置,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种基于深度学习的治疗方案的生成方法,其特征在于,所述基于深度学习的治疗方案的生成方法包括以下步骤:
获取待处理的病人的诊断信息;
将所述诊断信息输入深度神经网络模型进行处理,得到所述待处理的病人的本次治疗方案的预测结果;
将所述本次治疗方案的预测结果输入序列到序列模型进行处理,得到所述待处理的病人的未来治疗方案的预测结果。
2.如权利要求1所述的基于深度学习的治疗方案的生成方法,其特征在于,所述将所述诊断信息输入深度神经网络模型进行处理,得到所述待处理的病人的本次治疗方案的预测结果的步骤包括:
将所述诊断信息输入深度神经网络模型进行处理,得到所述诊断信息对应的隐向量;
将所述诊断信息对应的隐向量输入自注意力机制层进行处理,获得所述隐向量对应的权重;
根据所述隐向量和所述权重得到加权后的隐向量;
根据所述加权后的隐向量得到所述待处理的病人的本次治疗方案的预测结果。
3.如权利要求2所述的基于深度学习的治疗方案的生成方法,其特征在于,所述将所述诊断信息对应的隐向量输入自注意力机制层进行处理,获得所述隐向量对应的权重的步骤包括:
将所述诊断信息对应的隐向量输入自注意力机制层进行处理;
所述自注意力机制层根据所述诊断信息的等级信息学习到所述隐向量对应的权重。
4.如权利要求3所述的基于深度学习的治疗方案的生成方法,其特征在于,所述诊断信息的等级信息包括:主要诊断、其他诊断、损伤诊断和其他诊断。
5.如权利要求1所述的基于深度学习的治疗方案的生成方法,其特征在于,所述深度神经网络模型包括多层的长短期记忆网络或者多层的门控递归单元网络,根据预设数量的病人的诊断信息和与所述病人的诊断信息对应的治疗方案对所述深度神经网络模型和所述序列到序列模型进行联合训练。
6.如权利要求5所述的基于深度学习的治疗方案的生成方法,其特征在于,所述预设数量的病人的诊断信息为入院次数不小于预设次数的病人的诊断信息。
7.如权利要求1至6任一项所述的基于深度学习的治疗方案的生成方法,其特征在于,所述将所述本次治疗方案的预测结果输入序列到序列模型进行处理,得到所述待处理的病人的未来治疗方案的预测结果的步骤包括:
将所述本次治疗方案的预测结果输入序列到序列模型进行处理,得到所述待处理病人的下一次治疗方案的预测结果;
获取所述待处理病人的治疗方案的预测结果的个数是否达到预设数目;
若所述待处理病人的治疗方案的预测结果的个数未达到所述预设数目,将所述下一次治疗方案的预测结果作为所述本次治疗方案的预测结果,返回执行所述将所述本次治疗方案的预测结果输入序列到序列模型进行处理的步骤。
8.如权利要求1至6任一项所述的基于深度学习的治疗方案的生成方法,其特征在于,所述获取待处理的病人的诊断信息的步骤之后还包括:
根据国际疾病编码标准获取所述病人的诊断信息对应的编码向量;
将所述病人的诊断信息对应的编码向量输入深度神经网络模型进行处理,得到所述待处理的病人的本次治疗方案的预测结果。
9.一种基于深度学习的治疗方案的生成装置,其特征在于,所述基于深度学习的治疗方案的生成装置包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于深度学习的治疗方案的生成程序,所述基于深度学习的治疗方案的生成程序被所述处理器执行时实现如权利要求1至8中任一项所述的基于深度学习的治疗方案的生成方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有基于深度学习的治疗方案的生成程序,所述基于深度学习的治疗方案的生成程序被处理器执行时实现如权利要求1至8中任一项所述的基于深度学习的治疗方案的生成方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811407145.8A CN109637669B (zh) | 2018-11-22 | 2018-11-22 | 基于深度学习的治疗方案的生成方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811407145.8A CN109637669B (zh) | 2018-11-22 | 2018-11-22 | 基于深度学习的治疗方案的生成方法、装置及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109637669A true CN109637669A (zh) | 2019-04-16 |
CN109637669B CN109637669B (zh) | 2023-07-18 |
Family
ID=66068934
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811407145.8A Active CN109637669B (zh) | 2018-11-22 | 2018-11-22 | 基于深度学习的治疗方案的生成方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109637669B (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110110059A (zh) * | 2019-05-20 | 2019-08-09 | 挂号网(杭州)科技有限公司 | 一种基于深度学习的医疗对话***意图识别分类方法 |
CN110176311A (zh) * | 2019-05-17 | 2019-08-27 | 北京印刷学院 | 一种基于对抗神经网络的自动医疗方案推荐方法和*** |
CN110880362A (zh) * | 2019-11-12 | 2020-03-13 | 南京航空航天大学 | 一种大规模医疗数据知识挖掘与治疗方案推荐*** |
CN111192693A (zh) * | 2019-12-19 | 2020-05-22 | 山东大学 | 一种基于药物组合进行诊断编码纠正的方法及*** |
CN111341437A (zh) * | 2020-02-21 | 2020-06-26 | 山东大学齐鲁医院 | 基于舌图像的消化道疾病判断辅助*** |
CN111701150A (zh) * | 2020-07-02 | 2020-09-25 | 中国科学院苏州生物医学工程技术研究所 | 智能光诊疗设备 |
CN111815487A (zh) * | 2020-06-28 | 2020-10-23 | 珠海中科先进技术研究院有限公司 | 基于深度学习的健康教育评估方法、装置及介质 |
CN115115620A (zh) * | 2022-08-23 | 2022-09-27 | 安徽中医药大学 | 一种基于深度学习的肺炎病变模拟方法及*** |
CN116013503A (zh) * | 2022-12-27 | 2023-04-25 | 北大计算与数字经济研究院 | 一种牙科治疗计划确定方法、电子设备及存储介质 |
CN116798630A (zh) * | 2023-07-05 | 2023-09-22 | 广州视景医疗软件有限公司 | 基于机器学习的近视理疗依从性预测方法、设备及介质 |
TWI825467B (zh) * | 2021-08-23 | 2023-12-11 | 緯創資通股份有限公司 | 資料分析系統及資料分析方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1613068A (zh) * | 2001-11-02 | 2005-05-04 | 美国西门子医疗解决公司 | 用于诊断和计划病人状态的病人数据挖掘 |
CN102971755A (zh) * | 2010-01-21 | 2013-03-13 | 阿斯玛西格诺斯公司 | 用于慢性病管理的早期告警方法和*** |
CN106778014A (zh) * | 2016-12-29 | 2017-05-31 | 浙江大学 | 一种基于循环神经网络的患病风险预测方法 |
CN107076734A (zh) * | 2014-05-21 | 2017-08-18 | 细胞中心学股份有限公司 | 用于基于模型的疗法计划的体外诊断 |
CN107072624A (zh) * | 2014-06-18 | 2017-08-18 | Elekta股份有限公司 | 用于自动治疗计划的***和方法 |
CN107145746A (zh) * | 2017-05-09 | 2017-09-08 | 北京大数医达科技有限公司 | 一种病情描述的智能分析方法及*** |
CN107205671A (zh) * | 2014-08-22 | 2017-09-26 | 普尔斯地质构造有限责任公司 | 至少部分基于脉搏波形的自动诊断 |
CN108717866A (zh) * | 2018-04-03 | 2018-10-30 | 陈辛元 | 一种预测放疗计划剂量分布的方法、装置、设备及存储介质 |
CN108766563A (zh) * | 2018-05-25 | 2018-11-06 | 戴建荣 | 基于剂量组学的放射治疗结果预测方法和*** |
-
2018
- 2018-11-22 CN CN201811407145.8A patent/CN109637669B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1613068A (zh) * | 2001-11-02 | 2005-05-04 | 美国西门子医疗解决公司 | 用于诊断和计划病人状态的病人数据挖掘 |
CN102971755A (zh) * | 2010-01-21 | 2013-03-13 | 阿斯玛西格诺斯公司 | 用于慢性病管理的早期告警方法和*** |
CN107076734A (zh) * | 2014-05-21 | 2017-08-18 | 细胞中心学股份有限公司 | 用于基于模型的疗法计划的体外诊断 |
CN107072624A (zh) * | 2014-06-18 | 2017-08-18 | Elekta股份有限公司 | 用于自动治疗计划的***和方法 |
CN107205671A (zh) * | 2014-08-22 | 2017-09-26 | 普尔斯地质构造有限责任公司 | 至少部分基于脉搏波形的自动诊断 |
CN106778014A (zh) * | 2016-12-29 | 2017-05-31 | 浙江大学 | 一种基于循环神经网络的患病风险预测方法 |
CN107145746A (zh) * | 2017-05-09 | 2017-09-08 | 北京大数医达科技有限公司 | 一种病情描述的智能分析方法及*** |
CN108717866A (zh) * | 2018-04-03 | 2018-10-30 | 陈辛元 | 一种预测放疗计划剂量分布的方法、装置、设备及存储介质 |
CN108766563A (zh) * | 2018-05-25 | 2018-11-06 | 戴建荣 | 基于剂量组学的放射治疗结果预测方法和*** |
Non-Patent Citations (4)
Title |
---|
ILYA SUTSKEVER 等: "Sequence to Sequence Learning with Neural Networks", 《HTTPS://ARXIV.ORG/PDF/ARXIV:1409.3215V3》 * |
ILYA SUTSKEVER 等: "Sequence to Sequence Learning with Neural Networks", 《HTTPS://ARXIV.ORG/PDF/ARXIV:1409.3215V3》, 14 December 2014 (2014-12-14), pages 1 - 5 * |
ZHOUHAN LIN 等: "A STRUCTURED SELF-ATTENTIVE SENTENCE EMBEDDING", 《HTTPS://ARXIV.ORG/PDF/ARXIV:1703.03130V1》 * |
ZHOUHAN LIN 等: "A STRUCTURED SELF-ATTENTIVE SENTENCE EMBEDDING", 《HTTPS://ARXIV.ORG/PDF/ARXIV:1703.03130V1》, 9 March 2017 (2017-03-09), pages 1 - 5 * |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110176311A (zh) * | 2019-05-17 | 2019-08-27 | 北京印刷学院 | 一种基于对抗神经网络的自动医疗方案推荐方法和*** |
CN110110059B (zh) * | 2019-05-20 | 2021-06-29 | 挂号网(杭州)科技有限公司 | 一种基于深度学习的医疗对话***意图识别分类方法 |
CN110110059A (zh) * | 2019-05-20 | 2019-08-09 | 挂号网(杭州)科技有限公司 | 一种基于深度学习的医疗对话***意图识别分类方法 |
CN110880362A (zh) * | 2019-11-12 | 2020-03-13 | 南京航空航天大学 | 一种大规模医疗数据知识挖掘与治疗方案推荐*** |
CN110880362B (zh) * | 2019-11-12 | 2022-10-11 | 南京航空航天大学 | 一种大规模医疗数据知识挖掘与治疗方案推荐*** |
CN111192693A (zh) * | 2019-12-19 | 2020-05-22 | 山东大学 | 一种基于药物组合进行诊断编码纠正的方法及*** |
CN111192693B (zh) * | 2019-12-19 | 2021-07-27 | 山东大学 | 一种基于药物组合进行诊断编码纠正的方法及*** |
CN111341437A (zh) * | 2020-02-21 | 2020-06-26 | 山东大学齐鲁医院 | 基于舌图像的消化道疾病判断辅助*** |
CN111815487A (zh) * | 2020-06-28 | 2020-10-23 | 珠海中科先进技术研究院有限公司 | 基于深度学习的健康教育评估方法、装置及介质 |
CN111815487B (zh) * | 2020-06-28 | 2024-02-27 | 珠海中科先进技术研究院有限公司 | 基于深度学习的健康教育评估方法、装置及介质 |
CN111701150A (zh) * | 2020-07-02 | 2020-09-25 | 中国科学院苏州生物医学工程技术研究所 | 智能光诊疗设备 |
TWI825467B (zh) * | 2021-08-23 | 2023-12-11 | 緯創資通股份有限公司 | 資料分析系統及資料分析方法 |
CN115115620A (zh) * | 2022-08-23 | 2022-09-27 | 安徽中医药大学 | 一种基于深度学习的肺炎病变模拟方法及*** |
CN115115620B (zh) * | 2022-08-23 | 2022-12-13 | 安徽中医药大学 | 一种基于深度学习的肺炎病变模拟方法及*** |
CN116013503A (zh) * | 2022-12-27 | 2023-04-25 | 北大计算与数字经济研究院 | 一种牙科治疗计划确定方法、电子设备及存储介质 |
CN116013503B (zh) * | 2022-12-27 | 2024-02-20 | 北京大学长沙计算与数字经济研究院 | 一种牙科治疗计划确定方法、电子设备及存储介质 |
CN116798630A (zh) * | 2023-07-05 | 2023-09-22 | 广州视景医疗软件有限公司 | 基于机器学习的近视理疗依从性预测方法、设备及介质 |
CN116798630B (zh) * | 2023-07-05 | 2024-03-08 | 广州视景医疗软件有限公司 | 基于机器学习的近视理疗依从性预测方法、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109637669B (zh) | 2023-07-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109637669A (zh) | 基于深度学习的治疗方案的生成方法、装置及存储介质 | |
WO2021233112A1 (zh) | 基于多模态机器学习的翻译方法、装置、设备及存储介质 | |
US20210034813A1 (en) | Neural network model with evidence extraction | |
CN109906460A (zh) | 用于问答的动态协同注意力网络 | |
CN108416065B (zh) | 基于层级神经网络的图像-句子描述生成***及方法 | |
CN112288075B (zh) | 一种数据处理方法及相关设备 | |
CN109344391A (zh) | 基于神经网络的多特征融合中文新闻文本摘要生成方法 | |
CN111316281A (zh) | 基于机器学习的自然语言情境中数值数据的语义分类 | |
CN109710915A (zh) | 复述语句生成方法及装置 | |
CN107391501A (zh) | 一种基于词预测的神经机器翻译方法 | |
CN110111864A (zh) | 一种基于关系模型的医学报告生成模型及其生成方法 | |
CN109326353A (zh) | 预测疾病终点事件的方法、装置及电子设备 | |
CN114429122B (zh) | 一种基于循环注意力的方面级情感分析***和方法 | |
CN112420191A (zh) | 一种中医辅助决策***及方法 | |
CN116662552A (zh) | 金融文本数据分类方法、装置、终端设备及介质 | |
CN115510814B (zh) | 一种基于双重规划的篇章级复杂问题生成方法 | |
CN108304912A (zh) | 一种运用抑制信号实现脉冲神经网络监督学习的***和方法 | |
CN113990520A (zh) | 一种基于可控生成对抗网络的中医药处方生成方法 | |
Wang et al. | PromptEHR: Conditional electronic healthcare records generation with prompt learning | |
CN117407541A (zh) | 一种基于知识增强的知识图谱问答方法 | |
Reali et al. | Sequential learning and the interaction between biological and linguistic adaptation in language evolution | |
Nguyen et al. | A two-stage decoder for efficient icd coding | |
CN117747087A (zh) | 问诊大模型的训练方法、基于大模型的问诊方法和装置 | |
CN112035627B (zh) | 自动问答方法、装置、设备及存储介质 | |
AlShammari et al. | Post-stroke rehabilitation optimization & recommendation framework using tele-robotic ecosystem: Industry 4.0 readiness approach |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |