CN113096818A - 基于ode和grud的急性病症发生几率的评估方法 - Google Patents

基于ode和grud的急性病症发生几率的评估方法 Download PDF

Info

Publication number
CN113096818A
CN113096818A CN202110431318.5A CN202110431318A CN113096818A CN 113096818 A CN113096818 A CN 113096818A CN 202110431318 A CN202110431318 A CN 202110431318A CN 113096818 A CN113096818 A CN 113096818A
Authority
CN
China
Prior art keywords
grud
sequence
ode
clinical
hidden state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110431318.5A
Other languages
English (en)
Other versions
CN113096818B (zh
Inventor
缑水平
刘宁涛
苏斌虓
毛莎莎
高若曦
贺晨
蒋昆
黄陆光
刘仁怀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Air Force Medical University of PLA
Original Assignee
Xidian University
Air Force Medical University of PLA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University, Air Force Medical University of PLA filed Critical Xidian University
Priority to CN202110431318.5A priority Critical patent/CN113096818B/zh
Publication of CN113096818A publication Critical patent/CN113096818A/zh
Application granted granted Critical
Publication of CN113096818B publication Critical patent/CN113096818B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Molecular Biology (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Pathology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明提出了一种基于ODE和GRUD的急性病症发生几率的评估方法,用于解决现有技术中存在的没有同时考虑时序数据的临床指标缺失和采样的时间间隔不均匀导致的评估准确性较低的技术问题。实现步骤为:获取多临床指标的时序数据集、时间戳序列集和急性病症标签集;获取信息衰减表征训练样本集、信息衰减表征验证集样本和信息衰减表征测试样本集;构建基于ODE和GRUD的门控递归单元网络;对基于ODE和GRUD的门控递归单元网络进行迭代训练;获取急性病症发生几率的评估结果。本方法能够兼顾时序数据的临床指标缺失和采样时间间隔不均匀的问题,将临床指标缺失的影响纳入隐藏态更新的过程,提升急性病症发生概率估计的准确性。

Description

基于ODE和GRUD的急性病症发生几率的评估方法
技术领域
本发明属于时序信号处理领域,涉及一种急性病症发生几率的评估方法,具体涉及一种基于ODE和GRUD的急性病症发生几率的评估方法,可用于对存在缺失值和采样时间间隔不均匀的多临床指标时序数据的分析处理。
背景技术
临床环境中,来自各个传感器的数据以及检查检验结果构成的时序数据对于患者的急性病症发生的几率的评估具有重要意义。目前,医护人员一般通过关注若干个重要的临床指标以及通过计算评分来对数据表示的状态进行评估,并判断是否出现某种急性病症。因为各类传感器和检查检验结果庞杂密集且具有一定的冗余性,很难从海量的数据中准确高效地分析出数据包含的状况以及出现各类急性病症的概率。此外,急性病症发生概率的判断需要相关从业人员的经验以及长时间的观察总结,这在一定程度上导致在判断是否出现某种异常状况具有一定的主观性。因此,需要一种客观准确的方法对海量且不均匀的医学时序数据进行分析处理,并估计发生急性病症的概率,从而提升估计的准确性。
近年来,深度学习在医学多临床指标时序数据处理领域表现良好。在自然语言处理、语音识别和天气预测到市场分析等任务中均有涉及。在这些任务中,被广泛应用的模型主要是循环神经网络(Recurrent Neural Network,RNN)及其变种,如门控递归单元(GatedRecurrent Units,GRU)和长短时记忆网络(Long Short-Term Memory,LSTM)等。这些模型专注于处理序列数据,对于时序数据的分析十分有效。目前已经有研究将这些模型应用于存在缺失值和时间间隔不均匀的时序数据处理,并取得了较好的效果。
例如,Che Z等人2018年在Scientific Reports卷8发表的论文Recurrent NeuralNetworks for Multivariate Time Series with Missing Values中,公开了一种能够对缺失值进行处理进而对病症发生几率进行估计的方法,该方法以GRU为基本模型,并考虑医学多临床指标时序数据中的缺失值问题,将模型的输入变量中加入各个特征的采样时间间隔并对其进行编码,从而能够处理不均匀采样或者存在缺失值的时序数据。又如,DeBrouwer E等人2019年在NeurIPS会议发表的论文GRU-ODE-Bayes:Continuous Modelingof Sporadically-Observed Time Series中,公开了一种能够对多变量时序数据两次采样时间间隔进程处理进而进行时序数据预测的方法,该方法同样以GRU为基本模型,考虑两次采样之间的时间间隔,计算GRU每次处理一个时刻数据后隐藏态变量关于时间变量的常微分方程(Ordinary Differential Equation,ODE)的值,并以其与时间间隔的乘积,作为为GRU隐藏态变量的更新量。
综上所述,现有技术中没有兼顾时序数据的临床指标缺失和采样的时间间隔不均匀两个特性,导致所提取的特征无法同时包含时序数据的临床指标缺失和时间间隔不均匀带来的影响,进而影响了评估的准确性。
发明内容
本发明的目的在于针对上述现有技术的不足,提出一种基于ODE和GRUD的急性病症发生几率的评估方法,用于解决现有技术中存在的因为没有同时考虑时序数据的临床指标缺失和采样的时间间隔不均匀导致的评估准确性较低的技术问题。
为实现上述目的,本发明所采用的技术方案包括如下步骤:
(1)获取多临床指标的时序数据集S、时间戳序列集T和急性病症标签集L:
(1a)采集Ns个患者的17个临床指标,包括Glucose、Systolic blood pressure、Glascow coma scale verbal response、Temperature、Weight、Diastolic bloodpressure、Fraction inspired oxygen、Glascow coma scale total、Capillary refillrate、Mean blood pressure、Heart Rate、Oxygen saturation、pH、Height、Glascow comascale eye opening、Respiratory rate和Glascow coma scale motor response,每个临床指标至少被采集一次,每个患者共采集不少于Nr次,且每次采集的数据至少包括17个临床指标中的一个,即每次采集的数据中可能存在缺失的临床指标,并按照采集时间由前到后的顺序对每个患者采集的Nr次临床指标进行排序,得到包括Ns个患者的多临床指标的时序数据集
Figure BDA0003031565730000021
同时按照每个患者每次采集临床指标由前到后的顺序记录采集的时间戳,得到时间戳序列集
Figure BDA0003031565730000022
其中,Ns≥3000,Nr≥10,
Figure BDA0003031565730000023
表示第ns个患者的多临床指标时序数据,
Figure BDA0003031565730000024
表示
Figure BDA0003031565730000025
对应的时间戳序列;
(1b)对每个患者的多临床指标时序数据
Figure BDA0003031565730000026
对应的肾衰竭、心肌梗塞、肺衰竭、肺炎、呼吸衰竭、败血症和休克7种急性病症进行标注,得到急性病症标签集
Figure BDA0003031565730000031
其中,
Figure BDA0003031565730000032
表示与
Figure BDA0003031565730000033
对应的急性病症标签集合
Figure BDA0003031565730000034
其中,
Figure BDA0003031565730000035
表示第l个急性病症标签,
Figure BDA0003031565730000036
表示该急性病症发生,
Figure BDA0003031565730000037
表示该急性病症未发生;
(2)获取信息衰减表征训练样本集Dtrain、信息衰减表征验证集样本Dval和信息衰减表征测试样本集Dtest
(2a)对多临床指标的时序数据集S中所有多临床指标的时序数据的17个临床指标的最大值、最小值和平均值进行统计,得到临床指标最大值集合
Figure BDA0003031565730000038
临床指标最小值集合
Figure BDA0003031565730000039
和临床指标平均值集合
Figure BDA00030315657300000310
并对S中的每个多临床指标时序数据中每次采集中的每个临床指标的值按照Vmax中对应于该临床指标的最大值、Vmin中对应于该临床指标的最小值和Vmean中对应于该临床指标的平均值进行归一化,得到归一化后的时序数据集
Figure BDA00030315657300000311
其中,
Figure BDA00030315657300000312
表示与第ns个患者的多临床指标时序数据
Figure BDA00030315657300000313
对应的归一化后的时序数据,
Figure BDA00030315657300000314
Figure BDA00030315657300000315
分别表示第nc个临床指标的最大值、最小值和平均值;
(2b)将归一化后时序数据集S1中每个归一化后的时序数据
Figure BDA00030315657300000316
复制为
Figure BDA00030315657300000317
Figure BDA00030315657300000318
并将
Figure BDA00030315657300000319
中每次采集的时序数据所缺失临床指标的位置填充0,同时将每次采集的时序数据中的临床指标的值修改为1,得到掩模序列集
Figure BDA00030315657300000320
Figure BDA00030315657300000321
中首次采集的各个临床指标的值设置为1,第二的到第Nr次每次采集的每一个临床指标的值填充为距离该临床指标上一次被采集的时间间隔,得到间隔序列集
Figure BDA00030315657300000322
Figure BDA00030315657300000323
中首次采集的所缺失临床指标的位置填充为该临床指标对应于Vmean中的该临床指标平均值,第二的到第Nr次每次采集的时序数据所缺失临床指标的位置填充该临床指标之前最近一次被采集的值,得到填充序列集
Figure BDA00030315657300000324
其中
Figure BDA00030315657300000325
Figure BDA00030315657300000326
分别表示对应于
Figure BDA00030315657300000327
的包括Nr个掩模向量的掩模序列、包括Nr个间隔向量的间隔序列和包括Nr个填充向量的填充序列;
(2c)将
Figure BDA0003031565730000041
对应的掩模序列
Figure BDA0003031565730000042
间隔序列
Figure BDA0003031565730000043
填充序列
Figure BDA0003031565730000044
和时间戳序列
Figure BDA0003031565730000045
组合成输入序列
Figure BDA0003031565730000046
得到输入序列集
Figure BDA0003031565730000047
并将D中半数以上的输入序列作为信息衰减表征训练样本集Dtrain,将剩余的输入序列平分为信息衰减表征验证样本集Dval和信息衰减表征测试样本集Dtest,其中
Figure BDA0003031565730000048
表示
Figure BDA0003031565730000049
对应的输入序列;
(3)构建基于ODE和GRUD的门控递归单元网络K:
构建包括顺次连接的衰减门控递归单元网络GRUD、常微分模块ODE和全连接层的门控递归单元网络K,其中GRUD包含顺次连接的并行排列的输入衰减处理全连接层和隐藏态衰减处理全连接层、并行排列的更新门计算单元和重置门计算单元,以及隐藏态计算单元,ODE包含顺次连接的常微分方程计算模块和隐藏态更新模块;
(4)对基于ODE和GRUD的门控递归单元网络K进行迭代训练:
(4a)初始化迭代次数为e,最大迭代次数为E,200≤E≤500,初始学***均绝对误差为BCEbest,初始化K的所有偏置参数均数值为0,初始化第e次迭代GRUD的初始隐藏态为
Figure BDA00030315657300000410
符合正态分布,并令e=1,C=0,BCEbest=9223372036854775807,ηe=η;
(4b)将信息衰减表征训练样本集Dtrain作为基于ODE和GRUD的门控递归单元网络K的输入进行前向传播,实现步骤为:
(4b1)按照信息衰减表征训练样本
Figure BDA00030315657300000411
包含的时间戳序列
Figure BDA00030315657300000412
中时间戳由前到后的顺序选择第t个时间戳
Figure BDA00030315657300000413
并以信息衰减表征训练样本
Figure BDA00030315657300000414
Figure BDA00030315657300000415
对应的掩模向量
Figure BDA00030315657300000416
时间间隔向量
Figure BDA00030315657300000417
填充向量
Figure BDA00030315657300000418
Figure BDA00030315657300000419
作为K中GRUD的输入,计算时间戳为t时衰减门控递归单元网络GRUD的中间隐藏态
Figure BDA00030315657300000420
计算公式为:
Figure BDA00030315657300000421
Figure BDA00030315657300000422
Figure BDA00030315657300000423
Figure BDA00030315657300000424
Figure BDA0003031565730000051
Figure BDA0003031565730000052
Figure BDA0003031565730000053
Figure BDA0003031565730000054
其中,
Figure BDA0003031565730000055
Figure BDA0003031565730000056
分别表示GRUD中输入衰减处理全连接层的权重参数和偏置参数,
Figure BDA0003031565730000057
Figure BDA0003031565730000058
分别表示GRUD中隐藏态衰减处理全连接层的权重参数和偏置参数,Wg、Ug和Eg表示GRUD的重置门计算单元的权重参数,bg表示GRUD的重置门计算单元的偏置参数,Wz、Uz和Ez表示GRUD的更新门计算单元的权重参数,bz表示GRUD的更新门计算单元的偏置参数,Wq、Uq和Eq表示GRUD的隐藏态计算单元的权重参数,bq表示GRUD的隐藏态计算单元的偏置参数,σ(·)表示sigmoid函数,tanh(·)表示tanh函数,⊙表示元素乘;
(4b2)常微分模块ODE的常微分方程计算模块判断时间戳
Figure BDA0003031565730000059
是否为
Figure BDA00030315657300000510
中最后一个时间戳,若是,执行步骤(4b3),否则,执行步骤(4b4);
(4b3)常微分模块ODE的常微分方程计算模块计算中间隐藏态
Figure BDA00030315657300000511
的梯度
Figure BDA00030315657300000512
隐藏态更新模块通过
Figure BDA00030315657300000513
Figure BDA00030315657300000514
进行更新,得到信息衰减表征训练样本
Figure BDA00030315657300000515
对应的GRUD的最后隐藏态hlast,其中:
Figure BDA00030315657300000516
Figure BDA00030315657300000517
其中,△t表示
Figure BDA00030315657300000518
Figure BDA00030315657300000519
之间的时间间隔,hlast表示信息衰减表征训练样本
Figure BDA00030315657300000520
对应的GRUD的最终隐藏态;
(4b4)常微分模块ODE的常微分方程计算模块计算中间隐藏态
Figure BDA00030315657300000521
的梯度
Figure BDA00030315657300000522
隐藏态更新模块通过
Figure BDA00030315657300000523
Figure BDA00030315657300000524
进行更新,并执行步骤(4b1),其中:
Figure BDA00030315657300000525
Figure BDA0003031565730000061
其中,当t=1时△t=1,
Figure BDA0003031565730000062
表示时间戳为
Figure BDA0003031565730000063
时GRUD的更新前隐藏态;
(4c)将hlast作为基于ODE和GRUD的门控递归单元网络K的全连接层的输入进行编码,得到信息衰减表征训练样本
Figure BDA0003031565730000064
对应的7种急性病症发生几率的评估结果
Figure BDA0003031565730000065
(4d)采用平均二值交叉熵函数计算信息衰减表征训练样本集Dtrain中所有信息衰减表征训练样本
Figure BDA0003031565730000066
对应的7种急性病症发生几率的评估结果
Figure BDA0003031565730000067
与其对应的急性病症标签
Figure BDA0003031565730000068
的平均二值交熵值
Figure BDA0003031565730000069
并以ηe为学习率,采用自适应学习率优化算法Adam,通过
Figure BDA00030315657300000610
对基于ODE和GRUD的门控递归单元网络K的所有权重参数W和所有偏置参数b进行更新,得到第e次迭代的基于ODE和GRUD的门控递归单元网络Ke
(4e)将验证集Dval中所有信息衰减表征验证样本和GRUD的初始隐藏态
Figure BDA00030315657300000611
作为Ke的输入进行前向传播,以Ke包含的GRUD计算GRUD的中间隐藏态
Figure BDA00030315657300000612
以ODE计算GRUD的中间隐藏态的梯度并对GRUD的初始隐藏态进行更新得到GRUD的最终隐藏态,并将GRUD的最终隐藏态作为Ke中全连接层的输入进行编码,得到Dval中所有信息衰减表征验证样本对应的7种急性病症发生几率的评估结果
Figure BDA00030315657300000613
并计算
Figure BDA00030315657300000614
中每个信息衰减表征验证样本对应的7种急性病症发生几率的评估结果与其对应的7种急性病症发生几率的标签的平均二值交叉熵值的平均值BCEval
(4f)判断BCEval<BCEbest是否成立,若是,令BCEbest=BCEm,C=0,并执行步骤(4g),否则令C=C+1,并执行步骤(4g);
(4g)判断e=E或者C=3是否成立,若是,得到训练好的基于ODE和GRUD的门控递归单元网络Kbest,否则令
Figure BDA00030315657300000615
e=e+1,并执行步骤(4b);
(5)获取急性病症发生几率的评估结果:
将信息衰减表征测试样本集Dtest中每个信息衰减表征测试样本和GRUD的初始隐藏态ht pre作为作为训练好的基于ODE和GRUD的门控递归单元网络Kbest的输入进行前向传播,以Kbest包含的GRUD计算GRUD的中间隐藏态
Figure BDA0003031565730000071
以ODE计算中间隐藏态
Figure BDA0003031565730000072
的梯度并对初始隐藏态
Figure BDA0003031565730000073
进行更新得到最终隐藏态hlast,并将hlast作为Kbest中全连接层的输入进行编码得到Dtest中所有输入序列对应的7种急性病症发生几率的评估结果
Figure BDA0003031565730000074
本发明与现有技术相比具有以下优点:
1、本发明中构建的基于ODE和GRUD的门控递归单元网络中的ODE模块和GRUD模块分别考虑了多临床指标的时序数据在采集临床指标时存在临床指标缺失的问题和采样时间间隔不一致的问题,能够从多临床指标时序数据中提取更加准确有效的特征,有效的提升了急性病症发生几率估计的准确性。
2、本发明中的ODE模块计算GRUD模块计算得到的隐藏态的梯度,能够将多临床指标的时序数据包含的由临床指标缺失问题造成的影响纳入GRUD隐藏态更新的过程,从而使基于ODE和GRUD的门控递归单元网络能够提取更丰富的特征,进一步提升了急性病症发生几率估计的准确性。
附图说明
图1是本发明的实现流程图。
图2是本发明构建的患者多临床指标时序数据对应的输入序列的结构示意图。
图3是本发明中构建的基于ODE和GRUD的门控递归单元网络的结构示意图。
具体实施方式
以下结合附图和具体实施例,对本发明作进一步详细描述,需要说明的是,本发明不属于疾病的诊断与治疗方法,符合专利法第25条的规定,同时也符合专利法第2条第2款的规定。
参照图1,本发明包括步骤如下:
步骤1)获取多临床指标的时序数据集S、时间戳序列集T和急性病症标签集L:
步骤1a)采集Ns个患者的17个临床指标,包括Glucose、Systolic bloodpressure、Glascow coma scale verbal response、Temperature、Weight、Diastolicblood pressure、Fraction inspired oxygen、Glascow coma scale total、Capillaryrefill rate、Mean blood pressure、Heart Rate、Oxygen saturation、pH、Height、Glascow coma scale eye opening、Respiratory rate和Glascow coma scale motorresponse,每个临床指标至少被采集一次,每个患者共采集不少于Nr次,且每次采集的数据至少包括17个临床指标中的一个,即每次采集的数据中可能存在缺失的临床指标,并按照采集时间由前到后的顺序对每个患者采集的Nr次临床指标进行排序,得到包括Ns个患者的多临床指标的时序数据集
Figure BDA0003031565730000081
同时按照每个患者每次采集临床指标由前到后的顺序记录采集的时间戳,得到时间戳序列集
Figure BDA0003031565730000082
本实施例中,Ns=41900,Nr=10,
Figure BDA0003031565730000083
表示第ns个患者的多临床指标时序数据,
Figure BDA0003031565730000084
表示
Figure BDA0003031565730000085
对应的时间戳序列;
步骤1b)对每个患者的多临床指标时序数据
Figure BDA0003031565730000086
对应的肾衰竭、心肌梗塞、肺衰竭、肺炎、呼吸衰竭、败血症和休克7种急性病症进行标注,得到急性病症标签集
Figure BDA0003031565730000087
其中,
Figure BDA0003031565730000088
表示与
Figure BDA0003031565730000089
对应的急性病症标签集合
Figure BDA00030315657300000810
其中,
Figure BDA00030315657300000811
表示第l个急性病症标签,因为在标注时已经确定患者是否发生某种病症,故
Figure BDA00030315657300000812
表示该急性病症发生,即发生的几率为100%,
Figure BDA00030315657300000813
表示该急性病症未发生,即发生的几率为0%;
步骤2)获取信息衰减表征训练样本集Dtrain、信息衰减表征验证集样本Dval和信息衰减表征测试样本集Dtest
步骤2a)对多临床指标的时序数据集S中所有多临床指标的时序数据的17个临床指标的最大值、最小值和平均值进行统计,得到临床指标最大值集合
Figure BDA00030315657300000814
临床指标最小值集合
Figure BDA00030315657300000815
和临床指标平均值集合
Figure BDA00030315657300000816
同时,考虑到各个临床指标量纲不一致的影响,对S中的每个多临床指标时序数据中每次采集中的每个临床指标的值按照Vmax中对应于该临床指标的最大值、Vmin中对应于该临床指标的最小值和Vmean中对应于该临床指标的平均值进行归一化,得到归一化后的时序数据集
Figure BDA00030315657300000817
Figure BDA00030315657300000818
表示与第ns个患者的多临床指标时序数据
Figure BDA00030315657300000819
对应的归一化后的时序数据,对于
Figure BDA00030315657300000820
中每个临床指标的执行归一化的方式为:
Figure BDA00030315657300000821
其中,
Figure BDA0003031565730000091
Figure BDA0003031565730000092
分别表示第nc个临床指标的最大值、最小值和平均值;
步骤2b)将归一化后时序数据集S1中每个归一化后的时序数据
Figure BDA0003031565730000093
复制为
Figure BDA0003031565730000094
Figure BDA0003031565730000095
并将
Figure BDA0003031565730000096
中每次采集的时序数据所缺失临床指标的位置填充0,同时将每次采集的时序数据中的临床指标的值修改为1,得到掩模序列集
Figure BDA0003031565730000097
Figure BDA0003031565730000098
中首次采集的各个临床指标的值设置为1,第二的到第Nr次每次采集的每一个临床指标的值填充为距离该临床指标上一次被采集的时间间隔,得到间隔序列集
Figure BDA0003031565730000099
Figure BDA00030315657300000910
中首次采集的所缺失临床指标的位置填充为该临床指标对应于Vmean中的该临床指标平均值,第二的到第Nr次每次采集的时序数据所缺失临床指标的位置填充该临床指标之前最近一次被采集的值,得到填充序列集
Figure BDA00030315657300000911
其中
Figure BDA00030315657300000912
Figure BDA00030315657300000913
分别表示对应于
Figure BDA00030315657300000914
的包括Nr个掩模向量的掩模序列、包括Nr个间隔向量的间隔序列和包括Nr个填充向量的填充序列;
步骤2c)将
Figure BDA00030315657300000915
对应的掩模序列
Figure BDA00030315657300000916
间隔序列
Figure BDA00030315657300000917
填充序列
Figure BDA00030315657300000918
和时间戳序列
Figure BDA00030315657300000919
组合成如图2所示的输入序列
Figure BDA00030315657300000920
得到输入序列集
Figure BDA00030315657300000921
并将D中半数以上的输入序列作为信息衰减表征训练样本集Dtrain,将剩余的输入序列平分为信息衰减表征验证样本集Dval和信息衰减表征测试样本集Dtest,其中
Figure BDA00030315657300000922
表示
Figure BDA00030315657300000923
对应的输入序列,本实施例中信息衰减表征训练样本集Dtrain中信息衰减表征训练样本的数量为29250,信息衰减表征验证样本集Dval中信息衰减表征验证样本的个数为6375,信息衰减表征测试样本集Dtest中信息衰减表征测试样本的个数为6275。
参照图2,为使模型的输入序列中包含临床指标的缺失和时间间隔信息,对输入序列
Figure BDA00030315657300000924
为掩模序列
Figure BDA00030315657300000925
间隔序列
Figure BDA00030315657300000926
填充序列
Figure BDA00030315657300000927
和时间戳序列
Figure BDA00030315657300000928
的拼接,作为网络的输入,其中掩模序列用于指示每次采集的每个临床指标是否缺失,若未缺失,则掩模序列中对应该位置的值为1,否则为0,间隔序列通过时间戳序列计算得到,用于体现每次采集每个临床指标的时效性,填充序列由多临床指标时序数据对每次采集缺失的指标按照该指标对应的之前最近一次采集的数据填充得到,从而使数据不存在缺失值,符合网络对于每次采集的临床指标的数量一致的要求,并且掩模序列
Figure BDA0003031565730000101
间隔序列
Figure BDA0003031565730000102
和填充序列
Figure BDA0003031565730000103
均由对应与每个时间戳的向量组成,每个向量都对应17个临床指标,即输入序列能够按照时间戳切分为若干个输入向量,图2中标示了输入序列的第一个输入向量。
步骤3)构建基于ODE和GRUD的门控递归单元网络K:
参照图3,构建包括顺次连接的衰减门控递归单元网络GRUD、常微分模块ODE和全连接层的门控递归单元网络K,其中GRUD包含顺次连接的并行排列的输入衰减处理全连接层和隐藏态衰减处理全连接层、并行排列的更新门计算单元和重置门计算单元,以及隐藏态计算单元,ODE包含顺次连接的常微分方程计算模块和隐藏态更新模块;
如图3所示,基于ODE和GRUD的门控递归单元网络中的衰减门控递归单元网络GRUD和常微分模块ODE每次以一个时间戳对应的输入序列的向量作为输入,迭代完成整个序列所有的时间戳对应的输入序列后得到最终隐藏态作为全连接层的输入进行编码,得到基于整个输入序列的急性病症发生几率估计结果。
步骤4)对基于ODE和GRUD的门控递归单元网络K进行迭代训练:
步骤4a)初始化迭代次数为e,最大迭代次数为E,E=200,初始学***均绝对误差为BCEbest,初始化K的所有偏置参数均数值为0,初始化第e次迭代GRUD的初始隐藏态为
Figure BDA0003031565730000104
符合正态分布,并令e=1,C=0,BCEbest=9223372036854775807,ηe=η;
步骤4b)将信息衰减表征训练样本集Dtrain作为基于ODE和GRUD的门控递归单元网络K的输入进行前向传播,实现步骤为:
步骤4b1)如图3所示,按照信息衰减表征训练样本
Figure BDA0003031565730000105
包含的时间戳序列
Figure BDA0003031565730000106
中时间戳由前到后的顺序选择第t个时间戳
Figure BDA0003031565730000107
并以信息衰减表征训练样本
Figure BDA0003031565730000108
Figure BDA0003031565730000109
对应的掩模向量
Figure BDA00030315657300001010
时间间隔向量
Figure BDA00030315657300001011
填充向量
Figure BDA00030315657300001012
Figure BDA00030315657300001013
作为K中GRUD的输入,计算时间戳为t时包含缺失信息的衰减门控递归单元网络GRUD的中间隐藏态
Figure BDA00030315657300001014
图3中所示的整个GRUD的计算公式为:
Figure BDA0003031565730000111
Figure BDA0003031565730000112
Figure BDA0003031565730000113
Figure BDA0003031565730000114
Figure BDA0003031565730000115
Figure BDA0003031565730000116
Figure BDA0003031565730000117
Figure BDA0003031565730000118
其中,
Figure BDA0003031565730000119
Figure BDA00030315657300001110
的计算过程分别图3中所示的输入衰减处理全连接层和隐藏态衰减处理全连接层完成,zt和qt的计算过程分别由图3中所示的更新门计算单元和重置门计算单元完成,
Figure BDA00030315657300001111
的计算过程由图3中所示隐藏态计算单元完成,
Figure BDA00030315657300001112
Figure BDA00030315657300001113
分别表示GRUD中输入衰减处理全连接层的权重参数和偏置参数,
Figure BDA00030315657300001114
Figure BDA00030315657300001115
分别表示GRUD中隐藏态衰减处理全连接层的权重参数和偏置参数,Wg、Ug和Fg表示GRUD的重置门计算单元的权重参数,bg表示GRUD的重置门计算单元的偏置参数,Wz、Uz和Fz表示GRUD的更新门计算单元的权重参数,bz表示GRUD的更新门计算单元的偏置参数,Wq、Uq和Fq表示GRUD的隐藏态计算单元的权重参数,bq表示GRUD的隐藏态计算单元的偏置参数,σ(·)表示sigmoid函数,tanh(·)表示tanh函数,⊙表示元素乘;
步骤4b2)常微分模块ODE的常微分方程计算模块判断时间戳
Figure BDA00030315657300001116
是否为
Figure BDA00030315657300001117
中最后一个时间戳,若是,执行步骤4b3),否则,执行步骤4b4);
步骤4b3)常微分模块ODE的常微分方程计算模块计算包含了该时间戳对应的输入向量更丰富特征的中间隐藏态
Figure BDA00030315657300001118
的梯度
Figure BDA00030315657300001119
隐藏态更新模块通过
Figure BDA00030315657300001120
Figure BDA00030315657300001121
进行更新,得到信息衰减表征训练样本
Figure BDA00030315657300001122
对应的GRUD的最后隐藏态hlast,结束图3中所示的迭代结构,其中:
Figure BDA0003031565730000121
Figure BDA0003031565730000122
其中,△t表示
Figure BDA0003031565730000123
Figure BDA0003031565730000124
之间的时间间隔,hlast表示信息衰减表征训练样本
Figure BDA0003031565730000125
对应的GRUD的最终隐藏态;
步骤4b4)常微分模块ODE的常微分方程计算模块计算包含了该时间戳对应的输入向量更丰富特征的中间隐藏态
Figure BDA0003031565730000126
的梯度
Figure BDA0003031565730000127
隐藏态更新模块通过
Figure BDA0003031565730000128
Figure BDA0003031565730000129
进行更新得到下一时刻GRUD模块的更新隐藏态,并执行步骤4b1)构成如图3所示的迭代结构,其中:
Figure BDA00030315657300001210
Figure BDA00030315657300001211
其中,当t=1时△t=1,
Figure BDA00030315657300001212
表示时间戳为
Figure BDA00030315657300001213
时GRUD的更新前隐藏态;
步骤4c)如图3所示,将hlast作为基于ODE和GRUD的门控递归单元网络K的全连接层的输入进行编码,得到信息衰减表征训练样本
Figure BDA00030315657300001214
对应的7种急性病症发生几率的评估结果
Figure BDA00030315657300001215
步骤4d)由于急性病症发生几率的评估结果和对应的标签均为概率值,故本实施例采用平均二值交叉熵函数计算信息衰减表征训练样本集Dtrain中所有信息衰减表征训练样本
Figure BDA00030315657300001216
对应的7种急性病症发生几率的评估结果
Figure BDA00030315657300001217
与其对应的急性病症标签
Figure BDA00030315657300001218
的平均二值交熵值
Figure BDA00030315657300001219
并以ηe为学习率,采用自适应学习率优化算法Adam,通过
Figure BDA00030315657300001220
对基于ODE和GRUD的门控递归单元网络K的所有权重参数W和所有偏置参数b进行更新,得到第e次迭代的基于ODE和GRUD的门控递归单元网络Ke,计算和更新公式为:
Figure BDA00030315657300001221
Figure BDA00030315657300001222
Figure BDA00030315657300001223
其中,
Figure BDA0003031565730000131
表示与
Figure BDA0003031565730000132
对应的第nl个病症的标签值,
Figure BDA0003031565730000133
表示第nl个病症发生几率的评估结果值,ηe表示第e次迭代的学习率,W′和b′分别表示所有权重参数W和所有偏置参数b的更新结果,
Figure BDA0003031565730000134
表示
Figure BDA0003031565730000135
关于W的梯度,
Figure BDA0003031565730000136
表示
Figure BDA0003031565730000137
关于b的梯度,·表示点乘;
步骤4e)为验证当前迭代后的基于ODE和GRUD的门控递归单元网络Ke的性能,将验证集Dval中所有信息衰减表征验证样本和GRUD的初始隐藏态
Figure BDA0003031565730000138
作为Ke的输入进行前向传播,以Ke包含的GRUD计算GRUD的中间隐藏态
Figure BDA0003031565730000139
以ODE计算GRUD的中间隐藏态的梯度并对GRUD的初始隐藏态进行更新得到GRUD的最终隐藏态,并将GRUD的最终隐藏态作为Ke中全连接层的输入进行编码,得到Dval中所有信息衰减表征验证样本对应的7种急性病症发生几率的评估结果
Figure BDA00030315657300001310
并计算
Figure BDA00030315657300001311
中每个信息衰减表征验证样本对应的7种急性病症发生几率的评估结果与其对应的7种急性病症发生几率的标签的平均二值交叉熵值的平均值BCEval,计算公式为:
Figure BDA00030315657300001312
其中
Figure BDA00030315657300001313
表示验证集Dval中第nval个信息衰减表征验证样本对应的第nl个病症的标签,本实施例中全连接层采用的激活函数为sigmoid函数,故所得到的每个急性病症发生几率的估计结果的值域为(0,1),
Figure BDA00030315657300001314
表示验证集Dval中第nval个信息衰减表征样本对应的第nl个病症发生几率的评估结果值,Nval表示验证信息衰减表征样本集Dval的信息衰减表征验证样本的数量;
步骤4f)判断BCEval<BCEbest是否成立,若是,令BCEbest=BCEm,C=0,并执行步骤4g),否则令C=C+1,并执行步骤4g);
步骤4g)判断e=E或者C=3是否成立,若是,表示对网络训练迭代次数达到最大迭代次数或者网络的性能连续3次性能未提升,达到训练停止条件,得到训练好的基于ODE和GRUD的门控递归单元网络Kbest,否则令
Figure BDA00030315657300001315
e=e+1,并执行步骤4b);
步骤5)获取急性病症发生几率的评估结果:
将信息衰减表征测试样本集Dtest中每个信息衰减表征测试样本和GRUD的初始隐藏态
Figure BDA0003031565730000141
作为作为训练好的基于ODE和GRUD的门控递归单元网络Kbest的输入进行前向传播,以Kbest包含的GRUD计算GRUD的中间隐藏态
Figure BDA0003031565730000142
以ODE计算中间隐藏态
Figure BDA0003031565730000143
的梯度并对初始隐藏态
Figure BDA0003031565730000144
进行更新得到最终隐藏态hlast,并将hlast作为Kbest中全连接层的输入进行编码得到Dtest中所有输入序列对应的7种急性病症发生几率的评估结果为。
本实施例所得到的信息衰减表征测试样本集中所有信息衰减表征测试样本的7种急性病症发生几率预期与对应的7种急性病症标签的平均二至交叉熵值的平均值为0.33。
以上描述仅是本发明的一个具体实例,不构成对本发明的任何限制,显然对于本领域的专业人员来说,在了解了本发明内容和原理后,都可能在不背离本发明原理、结构的情况下,进行形式和细节上的各种修正和改变,但是这些基于本发明思想的修正和改变仍在本发明的权利要求保护范围之内。

Claims (3)

1.一种基于ODE和GRUD的急性病症发生几率的评估方法,其特征在于,包括如下步骤:
(1)获取多临床指标的时序数据集S、时间戳序列集T和急性病症标签集L:
(1a)采集Ns个患者的17个临床指标,包括Glucose、Systolic blood pressure、Glascowcoma scale verbal response、Temperature、Weight、Diastolic blood pressure、Fraction inspired oxygen、Glascow coma scale total、Capillary refill rate、Meanblood pressure、Heart Rate、Oxygen saturation、pH、Height、Glascow coma scale eyeopening、Respiratory rate和Glascow coma scale motor response,每个临床指标至少被采集一次,每个患者共采集不少于Nr次,且每次采集的数据至少包括17个临床指标中的一个,即每次采集的数据中可能存在缺失的临床指标,并按照采集时间由前到后的顺序对每个患者采集的Nr次临床指标进行排序,得到包括Ns个患者的多临床指标的时序数据集
Figure FDA0003031565720000011
同时按照每个患者每次采集临床指标由前到后的顺序记录采集的时间戳,得到时间戳序列集
Figure FDA0003031565720000012
其中,Ns≥3000,Nr≥10,
Figure FDA0003031565720000013
表示第ns个患者的多临床指标时序数据,
Figure FDA0003031565720000014
表示
Figure FDA0003031565720000015
对应的时间戳序列;
(1b)对每个患者的多临床指标时序数据
Figure FDA0003031565720000016
对应的肾衰竭、心肌梗塞、肺衰竭、肺炎、呼吸衰竭、败血症和休克7种急性病症进行标注,得到急性病症标签集
Figure FDA0003031565720000017
其中,
Figure FDA0003031565720000018
表示与
Figure FDA0003031565720000019
对应的急性病症标签集合
Figure FDA00030315657200000110
其中,
Figure FDA00030315657200000111
表示第l个急性病症标签,
Figure FDA00030315657200000112
Figure FDA00030315657200000113
表示该急性病症发生,
Figure FDA00030315657200000114
表示该急性病症未发生;
(2)获取信息衰减表征训练样本集Dtrain、信息衰减表征验证集样本Dval和信息衰减表征测试样本集Dtest
(2a)对多临床指标的时序数据集S中所有多临床指标的时序数据的17个临床指标的最大值、最小值和平均值进行统计,得到临床指标最大值集合
Figure FDA00030315657200000115
临床指标最小值集合
Figure FDA00030315657200000116
和临床指标平均值集合
Figure FDA00030315657200000117
并对S中的每个多临床指标时序数据中每次采集中的每个临床指标的值按照Vmax中对应于该临床指标的最大值、Vmin中对应于该临床指标的最小值和Vmean中对应于该临床指标的平均值进行归一化,得到归一化后的时序数据集
Figure FDA0003031565720000021
其中,
Figure FDA0003031565720000022
表示与第ns个患者的多临床指标时序数据
Figure FDA0003031565720000023
对应的归一化后的时序数据,
Figure FDA0003031565720000024
Figure FDA0003031565720000025
分别表示第nc个临床指标的最大值、最小值和平均值;
(2b)将归一化后时序数据集S1中每个归一化后的时序数据
Figure FDA0003031565720000026
复制为
Figure FDA0003031565720000027
Figure FDA0003031565720000028
并将
Figure FDA0003031565720000029
中每次采集的时序数据所缺失临床指标的位置填充0,同时将每次采集的时序数据中的临床指标的值修改为1,得到掩模序列集
Figure FDA00030315657200000210
Figure FDA00030315657200000211
中首次采集的各个临床指标的值设置为1,第二的到第Nr次每次采集的每一个临床指标的值填充为距离该临床指标上一次被采集的时间间隔,得到间隔序列集
Figure FDA00030315657200000212
Figure FDA00030315657200000213
中首次采集的所缺失临床指标的位置填充为该临床指标对应于Vmean中的该临床指标平均值,第二的到第Nr次每次采集的时序数据所缺失临床指标的位置填充该临床指标之前最近一次被采集的值,得到填充序列集
Figure FDA00030315657200000214
其中
Figure FDA00030315657200000215
Figure FDA00030315657200000216
分别表示对应于
Figure FDA00030315657200000217
的包括Nr个掩模向量的掩模序列、包括Nr个间隔向量的间隔序列和包括Nr个填充向量的填充序列;
(2c)将
Figure FDA00030315657200000218
对应的掩模序列
Figure FDA00030315657200000219
间隔序列
Figure FDA00030315657200000220
填充序列
Figure FDA00030315657200000221
和时间戳序列
Figure FDA00030315657200000222
组合成输入序列
Figure FDA00030315657200000223
得到输入序列集
Figure FDA00030315657200000224
并将D中半数以上的输入序列作为信息衰减表征训练样本集Dtrain,将剩余的输入序列平分为信息衰减表征验证样本集Dval和信息衰减表征测试样本集Dtest,其中
Figure FDA00030315657200000225
表示
Figure FDA00030315657200000226
对应的输入序列;
(3)构建基于ODE和GRUD的门控递归单元网络K:
构建包括顺次连接的衰减门控递归单元网络GRUD、常微分模块ODE和全连接层的门控递归单元网络K,其中GRUD包含顺次连接的并行排列的隐藏态衰减处理全连接层和输入衰减处理全连接层、并行排列的更新门计算单元和重置门计算单元,以及隐藏态计算单元,ODE包含顺次连接的常微分方程计算模块和隐藏态更新模块;
(4)对基于ODE和GRUD的门控递归单元网络K进行迭代训练:
(4a)初始化迭代次数为e,最大迭代次数为E,200≤E≤500,初始学***均绝对误差为BCEbest,初始化K的所有偏置参数均数值为0,初始化第e次迭代GRUD的初始隐藏态为
Figure FDA0003031565720000031
符合正态分布,并令e=1,C=0,BCEbest=9223372036854775807,ηe=η;
(4b)将信息衰减表征训练样本集Dtrain作为基于ODE和GRUD的门控递归单元网络K的输入进行前向传播,实现步骤为:
(4b1)按照信息衰减表征训练样本
Figure FDA0003031565720000032
包含的时间戳序列
Figure FDA0003031565720000033
中时间戳由前到后的顺序选择第t个时间戳
Figure FDA0003031565720000034
并以信息衰减表征训练样本
Figure FDA0003031565720000035
Figure FDA0003031565720000036
对应的掩模向量
Figure FDA0003031565720000037
时间间隔向量
Figure FDA0003031565720000038
填充向量
Figure FDA0003031565720000039
Figure FDA00030315657200000323
作为K中GRUD的输入,计算时间戳为t时衰减门控递归单元网络GRUD的中间隐藏态
Figure FDA00030315657200000310
计算公式为:
Figure FDA00030315657200000311
Figure FDA00030315657200000312
Figure FDA00030315657200000313
Figure FDA00030315657200000314
Figure FDA00030315657200000315
Figure FDA00030315657200000316
Figure FDA00030315657200000317
Figure FDA00030315657200000318
其中,
Figure FDA00030315657200000319
Figure FDA00030315657200000320
分别表示GRUD中输入衰减处理全连接层的权重参数和偏置参数,
Figure FDA00030315657200000321
Figure FDA00030315657200000322
分别表示GRUD中隐藏态衰减处理全连接层的权重参数和偏置参数,Wg、Ug和Fg表示GRUD的重置门计算单元的权重参数,bg表示GRUD的重置门计算单元的偏置参数,Wz、Uz和Fz表示GRUD的更新门计算单元的权重参数,bz表示GRUD的更新门计算单元的偏置参数,Wq、Uq和Fq表示GRUD的隐藏态计算单元的权重参数,bq表示GRUD的隐藏态计算单元的偏置参数,σ(·)表示sigmoid函数,tanh(·)表示tanh函数,⊙表示元素乘;
(4b2)常微分模块ODE的常微分方程计算模块判断时间戳
Figure FDA0003031565720000041
是否为
Figure FDA0003031565720000042
中最后一个时间戳,若是,执行步骤(4b3),否则,执行步骤(4b4);
(4b3)常微分模块ODE的常微分方程计算模块计算中间隐藏态
Figure FDA0003031565720000043
的梯度
Figure FDA0003031565720000044
隐藏态更新模块通过
Figure FDA0003031565720000045
Figure FDA0003031565720000046
进行更新,得到信息衰减表征训练样本
Figure FDA0003031565720000047
对应的GRUD的最后隐藏态hlast,其中:
Figure FDA0003031565720000048
Figure FDA0003031565720000049
其中,△t表示
Figure FDA00030315657200000410
Figure FDA00030315657200000411
之间的时间间隔,hlast表示信息衰减表征训练样本
Figure FDA00030315657200000412
对应的GRUD的最终隐藏态;
(4b4)常微分模块ODE的常微分方程计算模块计算中间隐藏态
Figure FDA00030315657200000413
的梯度
Figure FDA00030315657200000414
隐藏态更新模块通过
Figure FDA00030315657200000415
Figure FDA00030315657200000416
进行更新,并执行步骤(4b1),其中:
Figure FDA00030315657200000417
Figure FDA00030315657200000418
其中,当t=1时△t=1,
Figure FDA00030315657200000419
表示时间戳为
Figure FDA00030315657200000420
时GRUD的更新前隐藏态;
(4c)将hlast作为基于ODE和GRUD的门控递归单元网络K的全连接层的输入进行编码,得到信息衰减表征训练样本
Figure FDA00030315657200000421
对应的7种急性病症发生几率的评估结果
Figure FDA00030315657200000422
(4d)采用平均二值交叉熵函数计算信息衰减表征训练样本集Dtrain中所有信息衰减表征训练样本
Figure FDA00030315657200000423
对应的7种急性病症发生几率的评估结果
Figure FDA00030315657200000424
与其对应的急性病症标签
Figure FDA00030315657200000425
的平均二值交熵值
Figure FDA00030315657200000426
并以ηe为学习率,采用自适应学习率优化算法Adam,通过
Figure FDA00030315657200000427
对基于ODE和GRUD的门控递归单元网络K的所有权重参数W和所有偏置参数b进行更新,得到第e次迭代的基于ODE和GRUD的门控递归单元网络Ke
(4e)将验证集Dval中所有信息衰减表征验证样本和GRUD的初始隐藏态
Figure FDA00030315657200000428
作为Ke的输入进行前向传播,以Ke包含的GRUD计算GRUD的中间隐藏态
Figure FDA0003031565720000051
以ODE计算GRUD的中间隐藏态的梯度并对GRUD的初始隐藏态进行更新得到GRUD的最终隐藏态,并将GRUD的最终隐藏态作为Ke中全连接层的输入进行编码,得到Dval中所有信息衰减表征验证样本对应的7种急性病症发生几率的评估结果
Figure FDA0003031565720000052
并计算
Figure FDA0003031565720000053
中每个信息衰减表征验证样本对应的7种急性病症发生几率的评估结果与其对应的7种急性病症发生几率的标签的平均二值交叉熵值的平均值BCEval
(4f)判断BCEval<BCEbest是否成立,若是,令BCEbest=BCEm,C=0,并执行步骤(4g),否则令C=C+1,并执行步骤(4g);
(4g)判断e=E或者C=3是否成立,若是,得到训练好的基于ODE和GRUD的门控递归单元网络Kbest,否则令
Figure FDA0003031565720000054
e=e+1,并执行步骤(4b);
(5)获取急性病症发生几率的评估结果:
将信息衰减表征测试样本集Dtest中每个信息衰减表征测试样本和GRUD的初始隐藏态
Figure FDA0003031565720000055
作为作为训练好的基于ODE和GRUD的门控递归单元网络Kbest的输入进行前向传播,以Kbest包含的GRUD计算GRUD的中间隐藏态
Figure FDA0003031565720000056
以ODE计算中间隐藏态
Figure FDA0003031565720000057
的梯度并对初始隐藏态
Figure FDA0003031565720000058
进行更新得到最终隐藏态hlast,并将hlast作为Kbest中全连接层的输入进行编码得到Dtest中所有输入序列对应的7种急性病症发生几率的评估结果
Figure FDA0003031565720000059
2.根据权利要求所述的基于ODE和GRUD的急性病症发生几率的评估方法,其特征在于,步骤(4d)中所述的采用平均二值交叉熵函数计算信息衰减表征训练样本集Dtrain中所有信息衰减表征训练样本
Figure FDA00030315657200000510
对应的7种急性病症发生几率的评估结果
Figure FDA00030315657200000511
与其对应的急性病症标签
Figure FDA00030315657200000512
的平均二值交熵值
Figure FDA00030315657200000513
以及采用自适应学习率优化算法Adam,通过
Figure FDA00030315657200000514
对基于ODE和GRUD的门控递归单元网络K的所有权重参数W和所有偏置参数b进行更新,其计算公式和更新公式分别为:
Figure FDA00030315657200000515
Figure FDA0003031565720000061
Figure FDA0003031565720000062
其中,
Figure FDA0003031565720000063
表示与
Figure FDA0003031565720000064
对应的第nl个病症的标签值,
Figure FDA0003031565720000065
表示第nl个病症发生几率的评估结果值,ηe表示第e次迭代的学习率,W′和b′分别表示所有权重参数W和所有偏置参数b的更新结果,
Figure FDA0003031565720000066
表示
Figure FDA0003031565720000067
关于W的梯度,
Figure FDA0003031565720000068
表示
Figure FDA0003031565720000069
关于b的梯度,·表示点乘。
3.根据权利要求所述的基于ODE和GRUD的急性病症发生几率的评估方法,其特征在于,步骤(4e)中所述的计算
Figure FDA00030315657200000610
中每个输入序列对应的7种急性病症发生几率的评估结果与其对应的7种急性病症发生几率的标签l的平均二至交叉熵值的平均值BCEval,计算公式为:
Figure FDA00030315657200000611
其中
Figure FDA00030315657200000612
表示验证集Dval中第nval个信息衰减表征验证样本对应的第nl个病症的标签,
Figure FDA00030315657200000613
表示验证集Dval中第nval个信息衰减表征验证样本对应的第nl个病症发生几率的评估结果值,Nval表示信息衰减表征验证样本集Dval的信息衰减表征验证样本的数量。
CN202110431318.5A 2021-04-21 2021-04-21 基于ode和grud的急性病症发生几率的评估方法 Active CN113096818B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110431318.5A CN113096818B (zh) 2021-04-21 2021-04-21 基于ode和grud的急性病症发生几率的评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110431318.5A CN113096818B (zh) 2021-04-21 2021-04-21 基于ode和grud的急性病症发生几率的评估方法

Publications (2)

Publication Number Publication Date
CN113096818A true CN113096818A (zh) 2021-07-09
CN113096818B CN113096818B (zh) 2023-05-30

Family

ID=76679155

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110431318.5A Active CN113096818B (zh) 2021-04-21 2021-04-21 基于ode和grud的急性病症发生几率的评估方法

Country Status (1)

Country Link
CN (1) CN113096818B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113793666A (zh) * 2021-09-16 2021-12-14 中国人民解放军空军军医大学 一种复合模式神经元信息处理方法和***
CN113876337A (zh) * 2021-09-16 2022-01-04 中国矿业大学 一种基于多元递归网络的心脏疾病识别方法
CN113951845A (zh) * 2021-12-01 2022-01-21 中国人民解放军总医院第一医学中心 创伤严重失血伤情预测方法与***
CN115547502A (zh) * 2022-11-23 2022-12-30 浙江大学 基于时序数据的血透病人风险预测装置
JP2023043188A (ja) * 2021-09-15 2023-03-28 中国人民解放軍陸軍軍医大学 常微分方程式に基づくgruネットワークモデル及び特徴抽出方法と装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3346912A1 (en) * 2015-09-09 2018-07-18 Ubiome Inc. Method and system for microbiome-derived diagnostics and therapeutics for conditions associated with cerebro-craniofacial health
CN110866631A (zh) * 2019-10-09 2020-03-06 重庆大学 基于集成的门递归单元神经网络gru来预测大气污染情况的方法
CN112526876A (zh) * 2020-08-12 2021-03-19 江苏大学 一种基于数据驱动的lpv***的lqg控制器的设计方法
CN112541839A (zh) * 2020-12-23 2021-03-23 四川大汇大数据服务有限公司 基于神经微分方程的水库入库流量预测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3346912A1 (en) * 2015-09-09 2018-07-18 Ubiome Inc. Method and system for microbiome-derived diagnostics and therapeutics for conditions associated with cerebro-craniofacial health
CN110866631A (zh) * 2019-10-09 2020-03-06 重庆大学 基于集成的门递归单元神经网络gru来预测大气污染情况的方法
CN112526876A (zh) * 2020-08-12 2021-03-19 江苏大学 一种基于数据驱动的lpv***的lqg控制器的设计方法
CN112541839A (zh) * 2020-12-23 2021-03-23 四川大汇大数据服务有限公司 基于神经微分方程的水库入库流量预测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
DONG HAI ET AL.: ""Heartbeat Detection and Rate Estimation from Ballistocardiograms using the Gated Recurrent Unit Network"", 《IEEE》 *
EDWARD DE BROUWER ET AL.: ""GRU-ODE-Bayes: Continuous modeling of sporadically-observed time series"", 《33RD CONFERENCE ON NEURAL INFORMATION PROCESSING SYSTEMS (NEURIPS 2019)》 *
谢仕斌;吴元凯;朱建芸;张英;陈淑如;凌莉;柯伟民;高志良;: "慢加急性肝衰竭预后评分***的建立与评估", 中山大学学报(医学科学版) *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023043188A (ja) * 2021-09-15 2023-03-28 中国人民解放軍陸軍軍医大学 常微分方程式に基づくgruネットワークモデル及び特徴抽出方法と装置
CN113793666A (zh) * 2021-09-16 2021-12-14 中国人民解放军空军军医大学 一种复合模式神经元信息处理方法和***
CN113876337A (zh) * 2021-09-16 2022-01-04 中国矿业大学 一种基于多元递归网络的心脏疾病识别方法
CN113876337B (zh) * 2021-09-16 2023-09-22 中国矿业大学 一种基于多元递归网络的心脏疾病识别方法
CN113793666B (zh) * 2021-09-16 2023-10-27 中国人民解放军空军军医大学 一种复合模式神经元信息处理方法和***
CN113951845A (zh) * 2021-12-01 2022-01-21 中国人民解放军总医院第一医学中心 创伤严重失血伤情预测方法与***
CN115547502A (zh) * 2022-11-23 2022-12-30 浙江大学 基于时序数据的血透病人风险预测装置

Also Published As

Publication number Publication date
CN113096818B (zh) 2023-05-30

Similar Documents

Publication Publication Date Title
CN113096818A (zh) 基于ode和grud的急性病症发生几率的评估方法
CN109036553A (zh) 一种基于自动抽取医疗专家知识的疾病预测方法
CN109659033A (zh) 一种基于循环神经网络的慢性疾病病情变化事件预测装置
CN111243736B (zh) 一种生存风险评估方法及***
CN113040711B (zh) 一种脑卒中发病风险预测***、设备、存储介质
CN111899894A (zh) 一种抑郁症患者预后药效评估***及其评估方法
CN114549469A (zh) 一种基于置信度校准的深层神经网络医疗图像诊断方法
CN114037011B (zh) 一种中医舌色噪声标注样本的自动识别与清洗方法
CN116822920B (zh) 一种基于循环神经网络的流程预测方法
CN111803059A (zh) 一种基于时域卷积网络的心电信号分类方法及装置
CN111915024A (zh) 一种序列预测模型训练方法、预测***及预测方法和介质
CN107491656B (zh) 一种基于相对危险度决策树模型的妊娠结局影响因子评估方法
CN116350196A (zh) 基于深度学习的无创血压值预测方法及***
CN115527608A (zh) 一种肠道年龄预测方法和***
CN112397202B (zh) 一种青少年儿童身高生长曲线的预测方法
CN113842135A (zh) 一种基于BiLSTM的睡眠呼吸异常自动筛查方法
CN112149355A (zh) 基于半监督动态反馈堆栈降噪自编码器模型的软测量方法
CN116957157A (zh) 一种基于多源数据分析的生产效益预测方法及***
CN114464319B (zh) 一种基于慢特征分析和深度神经网络的ams易感性评估***
CN116364203A (zh) 一种基于深度学习的水质预测方法、***和装置
Zhang et al. Multivariate discrete grey model base on dummy drivers
CN115497591A (zh) 一种基于环境-基因交互作用的多状态模型预测***
CN113782209A (zh) 一种基于循环神经网络的慢性病患者智能预后方法及***
CN110786839A (zh) 瞬时无波形比值的生成方法、装置、设备及介质
Luong et al. Learning deep representations from clinical data for chronic kidney disease

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant