CN115762783A - 一种急性肾损伤预测*** - Google Patents

一种急性肾损伤预测*** Download PDF

Info

Publication number
CN115762783A
CN115762783A CN202211469514.2A CN202211469514A CN115762783A CN 115762783 A CN115762783 A CN 115762783A CN 202211469514 A CN202211469514 A CN 202211469514A CN 115762783 A CN115762783 A CN 115762783A
Authority
CN
China
Prior art keywords
time
structured
medical record
kidney injury
acute kidney
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211469514.2A
Other languages
English (en)
Inventor
余夏夏
曾广健
庄锦湖
高毅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen University
Original Assignee
Shenzhen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen University filed Critical Shenzhen University
Priority to CN202211469514.2A priority Critical patent/CN115762783A/zh
Publication of CN115762783A publication Critical patent/CN115762783A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开了一种急性肾损伤预测***,该***中的数据预处理模块,用于获取目标对象的待测结构化病历数据,并基于时间滑动窗口和待测结构化病历数据,确定至少两个待测时间结构化数据,以及基于指标参数维度对待测结构化病历数据进行分类,得到至少两个待测空间结构化数据;其中,相邻的待测时间结构化数据之间存在至少一个相同的待测时间病历数据;模型处理模块,用于基于各待测时间结构化数据、各待测空间结构化数据以及预先训练完成的急性肾损伤预测模型,输出预测急性肾损伤结果;预测结果输出模块,用于将预测急性肾损伤结果进行输出。本发明实施例提高了急性肾损伤预测***的预测效果。

Description

一种急性肾损伤预测***
技术领域
本发明涉及神经网络技术领域,尤其涉及一种急性肾损伤预测***。
背景技术
急性肾损伤(Acute Kidney Injury,AKI)具有发生率高、死亡率高、临床不良事件发生率高,并且预后效果差等特点。临床研究表明,AKI是脓毒症的常见并发症,脓毒症所致的急性肾损伤(Sepsis-induced AKI,SI-AKI)占AKI病例的50%以上,是导致重症监护室(Intensive care unit,ICU)患者死亡和不良预后的重要原因。然而SI-AKI的发病机制十分复杂,各种学说众说纷纭,不明晰的发病机制和依赖于临床经验,使得SI-AKI的早期诊断仍然存在很大的挑战。
近年来,深度学习逐渐应用到电子病历(Electronic Health Record,EHR)***,以提高对患者临床表现的预测诊断,包括早期阶段疾病检测,临床风险评估和未来住院治疗情况预测等。
深度学习根据研究方向具有非常多不同的适用算法,以SI-AKI预测评估为目标的神经网络模型仍存在不足,预测结果相对滞后,准确度不高。
发明内容
本发明实施例提供了一种急性肾损伤预测***,以解决现有的急性肾损伤预测模型的预测效果差的问题,提高急性肾损伤预测结果的及时性及准确度。
根据本发明一个实施例提供了一种急性肾损伤预测***,该***包括:数据预处理模块、模型处理模块和预测结果输出模块;
其中,所述数据预处理模块,用于获取目标对象的待测结构化病历数据,并基于时间滑动窗口和所述待测结构化病历数据,确定至少两个待测时间结构化数据,以及基于指标参数维度对所述待测结构化病历数据进行分类,得到至少两个待测空间结构化数据;其中,相邻的待测时间结构化数据之间存在至少一个相同的待测时间病历数据;
所述模型处理模块,用于基于各所述待测时间结构化数据、各所述待测空间结构化数据以及预先训练完成的急性肾损伤预测模型,输出预测急性肾损伤结果;
所述预测结果输出模块,用于将所述预测急性肾损伤结果进行输出。
本发明实施例的技术方案,通过在急性肾损伤预测***中设置数据预处理模块,用于获取目标对象的待测结构化病历数据,并基于时间滑动窗口和待测结构化病历数据,确定至少两个待测时间结构化数据,以及基于指标参数维度对待测结构化病历数据进行分类,得到至少两个待测空间结构化数据;其中,相邻的待测时间结构化数据之间存在至少一个相同的待测时间病历数据;急性肾损伤预测***中的模型处理模块,用于基于各待测时间结构化数据、各待测空间结构化数据以及预先训练完成的急性肾损伤预测模型,输出预测急性肾损伤结果;急性肾损伤预测***中的预测结果输出模块,用于将预测急性肾损伤结果进行输出,本发明实施例提供的急性肾损伤预测***考虑了急性肾损伤的时间连续性和空间多样性,降低了结构化病历数据存在的数据采集偏差对急性肾损伤预测结果的影响,解决了现有的急性肾损伤预测模型的预测效果差的问题,提高了急性肾损伤预测模型输出的急性肾损伤预测结果的及时性及准确度。
应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一个实施例所提供的一种急性肾损伤预测***的结构示意图;
图2为本发明一个实施例所提供的一种待测结构化病历数据的时间序列示意图;
图3为本发明一个实施例所提供的另一种急性肾损伤预测***的结构示意图;
图4为本发明一个实施例所提供的一种急性肾损伤预测模型的模型架构图;
图5为本发明一个实施例所提供的另一种急性肾损伤预测模型的模型架构图;
图6为本发明一个实施例所提供的另一种急性肾损伤预测***的结构示意图;
图7为本发明一个实施例所提供的一种训练结构化病历数据的时间序列示意图;
图8为本发明一个实施例所提供的一种急性肾损伤预测模型的训练过程的流程图;
图9为本发明一个实施例所提供的一种电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
图1为本发明一个实施例所提供的一种急性肾损伤预测***的结构示意图,本发明实施例可适用于对目标对象进行急性肾损伤的早期预测的情况,尤其适用于对确认脓毒症的目标对象进行急性肾损伤的早期预测的情况,该急性肾损伤预测***可采用硬件和/或软件的形式实现,该急性肾损伤预测***可配置于终端设备中。
如图1所示,急性肾损伤预测***包括:数据预处理模块110、模型处理模块120和预测结果输出模块130;其中,数据预处理模块110,用于获取目标对象的待测结构化病历数据,并基于时间滑动窗口和待测结构化病历数据,确定至少两个待测时间结构化数据,以及基于指标参数维度对待测结构化病历数据进行分类,得到至少两个待测空间结构化数据;模型处理模块120,用于基于各待测时间结构化数据、各待测空间结构化数据以及预先训练完成的急性肾损伤预测模型,输出预测急性肾损伤结果;预测结果输出模块130,用于将预测急性肾损伤结果进行输出。
在本实施例中,急性肾损伤预测***的输入数据包括待测结构化病历数据。其中,具体的,待测结构化病历数据可用于表征从医学信息学的角度将以自然语言方式录入的医疗文书按照医学术语的要求进行结构化分析,并将这些语义结构以关系型(面向对象)结构的方式保存在数据库中的待测病历数据。
在本实施例中,时间滑动窗口表征待测时间结构化数据包含的待测时间病历数据的预设数量。其中,示例性的,预设数量可以为3个或7个,时间滑动窗口的滑动步长可以为1个时间节点或2个时间节点,此处对预设数量和滑动步长不作限定。
在本实施例中,相邻的待测时间结构化数据之间存在至少一个相同的待测时间病历数据。其中,具体的,相邻的待测时间结构化数据之间相同的待测时间病历数据的数量大于或等于滑动步长。
在一个可选实施例中,待测结构化病历数据中包含至少两个时间节点分别对应的待测时间病历数据,各时间节点分别对应的时间长度均满足预设时间步长,相应的,数据预处理模块110,具体用于:针对每个时间节点,将当前时间节点作为窗口终止节点,并基于时间滑动窗口和窗口终止节点,从待测结构化病历数据中获取参考时间结构化数据;在参考时间结构化数据中的参考时间病历数据的数量小于时间滑动窗口对应的预设数量的情况下,对参考时间结构化数据执行插值处理,得到与当前时间节点对应的待测时间结构化数据。
其中,示例性的,预设时间步长为1小时,举例而言,待测结构化病历数据包括8:00-9:00的待测时间病历数据1、9:00-10:00的待测时间病历数据2和13:00-14:00的待测时间病历数据等等。
其中,示例性的,假设时间滑动窗口对应的预设数量为N个,如果时间滑动窗口的滑动步长为1个,则前N-1个时间节点分别对应的参考待测时间结构化数据的数量均小于时间滑动窗口对应的预设数量。
在一个可选实施例中,对参考时间结构化数据执行插值处理可以是将参考时间结构化数据中的参考时间病历数据进行复制,以使当前待测时间结构化数据中待测时间病历数据的数量满足时间滑动窗口对应的预设数量。其中,示例性的,进行复制的参考时间病历数据可以是随机选择的,也可以是前几个或后几个,此处对进行复制的参考时间病历数据不作限定。
在一个可选实施例中,待测结构化病历数据中的开始时间节点为目标对象确诊脓毒症之后的第一个时间节点。
这样设置的好处在于,使得急性肾损伤预测***具体用于对确认脓毒症的目标对象进行急性肾损伤的早期预测的情况。
图2为本发明一个实施例所提供的一种待测结构化病历数据的时间序列示意图。具体的,图2中方框里的圆点表示待测结构化病历数据中时间节点对应的待测时间病历数据,图2示出的待测结构化病历数据包括12个时间节点分别对应的待测时间病历数据。其中,时间节点1为目标对象确诊脓毒症之后的第一个时间节点。图2中的箭头用于表示时间线的方向,圆点的位置可表示时间节点在时间线上的时间位置。示例性的,时间节点1位于8:00-9:00,时间节点2位于9:00-10:00,时间节点3位于10:00-11:00,时间节点4位于12:00-13:00,以此类推。
以图2为例,时间滑动窗口对应的预设数量为6个,滑动步长为1个时间节点,则与时间节点1对应的待测时间结构化数据为[1 1 1 1 1 1],与时间节点2对应的待测时间结构化数据为[1 2 1 2 1 2],与时间节点3对应的待测时间结构化数据为[1 2 3 1 2 3],与时间节点4对应的待测时间结构化数据为[1 2 3 4 1 2],与时间节点5对应的待测时间结构化数据为[1 2 3 4 5 1],与时间节点6对应的待测时间结构化数据为[1 2 3 4 5 6],与时间节点7对应的待测时间结构化数据为[2 3 4 5 6 7],以此类推。
在上述实施例的基础上,可选的,数据预处理模块110,具体用于:基于预设时间步长,获取目标对象的原始结构化病历数据对应的至少两个原始时间病历数据;针对每个原始时间病历数据,对原始时间病历数据执行第一预处理操作得到待测时间病历数据;其中,第一预处理操作包括聚合操作、异常值处理操作、标准化操作和缺失值处理操作中至少一种;基于各待测时间病历数据,生成目标对象对应的待测结构化病历数据。
其中,具体的,原始结构化病历数据可用于表征目标对象对应的未被处理过的结构化病历数据,原始结构化病历数据中包含与各时间点分别对应的结构化病历数据。
举例而言,假设预设时间步长为1小时,则将原始结构化病历数据中在8:00-9:00、9:00-10:00、10:00-11:00、11:00-12:00等时间范围内的结构化病历数据分别作为原始时间病历数据。示例性的,如果原始结构化病历数据中不存在10:00-11:00内的结构化病历数据,则待测结构化病历数据中的各时间节点不包含10:00-11:00。
在一个实施例中,对原始时间病历数据执行第一预处理操作得到待测时间病历数据,包括:基于指标参数维度对原始时间病历数据执行聚合操作,得到待测时间病历数据。
其中,示例性的,聚合操作可以是均值聚合、最大值聚合、最小值聚合或中值聚合等等。举例而言,原始时间病历数据包括两组时间病历数据,其中,第一组时间病历数据中红细胞含量为450/ml,第二组时间病历数据中红细胞含量为550/ml,则待测时间病历数据中红细胞含量可以为450/ml、450/ml或500/ml。
这样设置的好处在于,可以降低后续输入到模型处理模块120中的数据量,从而可以提高急性肾损伤预测***的预测效率。
在另一个实施例中,对原始时间病历数据执行第一预处理操作得到待测时间病历数据,包括:基于指标参数维度和原始时间病历数据,确定各指标参数分别对应的箱线图,并根据各箱线图,确定待测时间病历数据中各指标参数分别对应的参数值。
其中,箱线图是一种用于显示一组数据分散特征的统计图,能够显示出一组数据的最大值、最小值、中位值及上下四分位数。其中,具体的,针对每个箱线图,将原始时间病历数据中大于箱线图中最大值的指标参数的参数值作为第一异常值,以及将原始时间病历数据中小于箱线图中最小值的指标参数的参数值作为第二异常值;将原始时间病历数据中的各第一异常值分别替换为对应箱线图中的最大值,以及将原始时间病历数据中的各第二异常值分别替换为对应箱线图中的最小值,得到待测时间病历数据。
这样设置的好处在于,可以降低原始时间病历数据中的异常值对急性肾损伤预测***的影响,提高急性肾损伤预测***的预测结果的准确度。
在另一个实施例中,对原始时间病历数据执行第一预处理操作得到待测时间病历数据,包括:对原始时间病历数据执行标准化操作得到待测时间病历数据。其中,示例性的,标准化操作采用的标准化函数可以为离差标准化函数或Z分数标准化函数。
这样设置的好处在于,可以统一待测时间病历数据中各指标参数的量纲,降低不同量纲对急性肾损伤预测***的预测结果的准确度,提高急性肾损伤预测***的预测结果的准确度。
在另一个实施例中,对原始时间病历数据执行第一预处理操作得到待测时间病历数据,包括:在原始时间病历数据中存在缺失数据的情况下,将原始时间病历数据作为当前原始时间病历数据,并将上一原始时间病历数据或下一原始时间病历数据中与缺失数据对应的指标参数的参数值添加到当前原始时间病历数据中。
在上述实施例的基础上,如果上一原始时间病历数据和下一参数时间病历数据中均不存在与缺失数据对应的指标参数的参数值,则将与缺失数据对应的指标参数的标准值添加到当前原始时间病历数据中。
这样设置的好处在于,降低缺失数据对急性肾损伤预测***的预测结果的准确度,提高急性肾损伤预测***的预测结果的准确度。
其中,示例性的,急性肾损伤预测模型的网络架构包括但不限于CNN网络(Convolutional Neural Networks,卷积神经网络)、FCN网络(Fully ConvolutionalNetworks,全卷积神经网络)、残差网络(ResNet)、DNN网络(Deep Neural Networks,深度神经网络)、RNN网络(Recurrent Neural Network,循环神经网络)或Transformer网络等等。此处对急性肾损伤预测模型的网络架构不作限定。
在本实施例中,模型处理模块120,具体用于:将各待测时间结构化数据和各待测空间结构化数据输入到预先训练完成的急性肾损伤预测模型,得到输出的预测急性肾损伤结果。其中,示例性的,预测急性肾损伤结果可以是发生概率、不发生概率、发生等级、不发生等级或是否发生等等。其中,发生概率和发生等级用于表征目标对象后续会被确诊急性肾损伤的可能性,发生概率或发生等级越高,则目标对象后续会被确诊急性肾损伤的可能性越高,如发生概率为0.9,发生等级为I级。不发生概率和不发生等级用于表征目标对象后续不会被确诊急性肾损伤的可能性,不发生概率或不发生等级越高,则目标对象后续会被确诊急性肾损伤的可能性越低,如不发生概率为0.1,发生等级为III级。此处对预测急性肾损伤结果的输出内容不作限定。
其中,示例性的,预测结果输出模块130的输出形式包括但不限于文字展示、声音播放和指示灯输出等等。如文字展示可以为“发生概率为0.9”,声音播放可以是语音播放也可以是提示音播放,如发生概率较低时,预测结果输出模块130输出的提示音的音量和/或音调较低,发生概率较高时,预测结果输出模块130输出的提示音的音量和/或音调较高。指示灯输出时的指示灯颜色和/或频率不同,如发生概率较低时,预测结果输出模块130输出的指示灯颜色为绿色和/或频率较低,发生概率较高时,预测结果输出模块130输出的指示灯颜色为红色和/或频率较高。此处对预测结果输出模块130的输出形式不作限定。
本实施例的技术方案,通过在急性肾损伤预测***中设置数据预处理模块,用于获取目标对象的待测结构化病历数据,并基于时间滑动窗口和待测结构化病历数据,确定至少两个待测时间结构化数据,以及基于指标参数维度对待测结构化病历数据进行分类,得到至少两个待测空间结构化数据;其中,相邻的待测时间结构化数据之间存在至少一个相同的待测时间病历数据;急性肾损伤预测***中的模型处理模块,用于基于各待测时间结构化数据、各待测空间结构化数据以及预先训练完成的急性肾损伤预测模型,输出预测急性肾损伤结果;急性肾损伤预测***中的预测结果输出模块,用于将模型处理模块输出的预测急性肾损伤结果进行输出,本发明实施例提供的急性肾损伤预测***考虑了急性肾损伤的时间连续性和空间多样性,降低了结构化病历数据存在的数据采集偏差对急性肾损伤预测结果的影响,解决了现有的急性肾损伤预测模型的预测效果差的问题,提高了急性肾损伤预测模型输出的急性肾损伤预测结果的及时性及准确度。
图3为本发明一个实施例所提供的另一种急性肾损伤预测***的结构示意图,本实施例对上述实施例中模型处理模块120中的急性肾损伤预测模型进行进一步细化。
如图3所示,急性肾损伤预测***中模型处理模块120中的急性肾损伤预测模型包括位置编码单元121、结构化时间计算单元122、结构化空间计算单元123和时空联合计算单元124,相应的,模型处理模块120,具体用于:将各待测时间结构化数据和各待测空间结构化数据输入到位置编码单元121,得到输出的各待测时间结构化特征和各待测空间结构化特征;将各待测时间结构化特征输入到急性肾损伤预测模型中的结构化时间计算单元122中,得到输出的结构化时间向量;将各待测空间结构化特征输入到急性肾损伤预测模型中的结构化空间计算单元123中,得到输出的结构化空间向量;将结构化时间向量和结构化空间向量输入到急性肾损伤预测模型中的时空联合计算单元124中,得到输出的预测急性肾损伤结果。
其中,具体的,位置编码单元121用于保存待测时间结构化数据和待测空间结构化数据中各指标参数的相对或绝对位置。
其中,示例性的,位置编码单元121满足公式:
PE(pos,2i)=sin(pos/100002i/d)
PE(pos,2i+1)=cos(pos/100002i/d)
其中,pos表示指标参数在待测时间结构化数据或待测空间结构化数据中的位置,pos≤l,l表示待测时间结构化数据或待测空间结构化数据的长度,d是词嵌入的维度,2i表示偶数的维度,2i+1表示奇数维度,其中,2i≤d,2i+1≤d。
在一个可选实施例中,通过结构化时间计算单元122,采用自注意力机制对各待测时间结构化特征执行特征提取操作,得到结构化时间向量。其中,具体的,结构化时间计算单元122包括第一遮罩自注意力层和第一残差与层归一化层。第一遮罩自注意力层,用于基于输入的各待测时间结构化特征,输出各时间注意力特征,第一残差与层归一化层,用于基于输入的各待测时间结构化特征以及第一遮罩自注意力层输出的各时间注意力特征,输出结构化时间向量。
其中,示例性的,遮罩自注意力层满足公式:
Figure BDA0003957958740000111
其中,Q,K,V是由各待测时间结构化数据通过三种不同的线性变换矩阵计算得到的,dk表示向量维度,除以
Figure BDA0003957958740000112
的目的是为了防止内积过大。
进一步地,多头注意力机制还可以定义为:
MultiHead(Q,K,V)=Concat(head1,...,headh)WO
headi=Attention(QWi Q,KWi K,VWi V)
其中,WO、Wi Q、Wi K和Wi V表示可学习的参数权重矩阵,多头注意力机制给出了注意力层的多个表示子空间,扩展了急性肾损伤预测模型专注于不同位置的能力,从而大大提高注意力层的表现性能。
其中,具体的,通过结构化空间计算单元123,对各待测空间结构化特征执行特征提取操作,得到结构化空间向量。在一个可选实施例中,结构化空间计算单元123包括一维卷积层、全连接层和层归一化层。其中,一维卷积层,用于基于输入的各待测空间结构化特征,输出空间卷积特征,全连接层,用于基于一维卷积层输出的空间卷积特征,输出结构化空间特征,层归一化层,用于基于全连接层输出的结构化空间特征,输出结构化空间向量。
在一个可选实施例中,通过时空联合计算单元124,对结构化时间向量和结构化空间向量进行融合,并基于得到的结构化融合向量,确定预测急性肾损伤结果。其中,具体的,时空联合计算单元124包括融合层、第二遮罩多头自注意力层、第二残差与层归一化层、第一前馈神经网络、第三残差与层归一化层和输出层。
其中,融合层,用于对结构化时间向量和结构化空间向量进行融合,输出结构化融合向量。第二遮罩多头自注意力层,用于基于融合层输出的结构化融合向量,输出融合注意力特征。第二残差与层归一化层,用于基于融合层输出的结构化融合向量以及第二遮罩多头自注意力层输出的融合注意力特征,输出第一融合特征。第一前馈神经网络,用于基于第二残差与层归一化层输出的第一融合特征,输出第一前馈特征。第三残差与层归一化层,用于基于第二残差与层归一化层输出的第一融合特征以及第一前馈神经网络输出的第一前馈特征,输出第二融合特征。输出层,用于基于第三残差与层归一化层输出的第二融合特征,输出预测急性肾损伤结果。在一个可选实施例中,输出层包括全连接层和激活函数。
其中,示例性的,第一前馈神经网络可定义为:
FFN(x)=max(0,xW1+b1)W2+b2
其中,W1和W2是可学习的参数权重矩阵,b1和b2为预先设置的偏置值。
图4为本发明一个实施例所提供的一种急性肾损伤预测模型的模型架构图。图4中最左侧的3*3的网格表示原始结构化病历数据,将原始结构化数据输入到数据预处理模块110中,输出各待测时间结构化数据以及各待测空间结构化数据。图4中数据预处理模块110后面的“圆形+曲线”表示急性肾损伤预测模型中的位置编码单元121,位置编码单元121输出N维的待测时间结构化特征以及T维的待测空间结构化特征,将N维的待测时间结构化特征输入到急性肾损伤预测模型中的结构化时间计算单元122中,得到输出的结构化时间向量,将T维的待测空间结构化特征输入到急性肾损伤预测模型中的结构化空间计算单元123中,得到输出的结构化空间向量。
图4中的“圆形+加号”表示时空联合计算单元124中的融合层,具体的,将结构化时间计算单元122输出的结构化时间向量和结构化空间计算单元123输出的结构化空间向量输入到急性肾损伤预测模型中的时空联合计算单元124中,得到输出的预测急性肾损伤结果。
在上述实施例的基础上,可选的,数据预处理模块110,还用于:对获取到的原始非结构化病历数据执行第二预处理操作,得到待测非结构化病历数据;其中,第二预处理操作包括字段筛选操作和向量转化操作;相应的,急性肾损伤预测模型还包括非结构化计算单元,模型处理模块120,还用于:将待测非结构化病历数据输入到预先训练完成的急性肾损伤预测模型中的位置编码单元121中,得到输出的非结构化特征;将非结构化特征输入到预先训练完成的急性肾损伤预测模型中的非结构化计算单元中,得到输出的非结构化向量,以及将非结构化向量输入到急性肾损伤预测模型中的时空联合计算单元124中。
其中,具体的,待测非结构化病历数据可用于表征以文本的形式保存在数据库中的待测病历数据。示例性的,待测非结构化病历数据包括但不限于住院记录、病程记录、ICU咨询、用药记录和相关健康说明等等,此处对待测非结构化病历数据不作限定。
其中,具体的,数据预处理模块110,具体用于:删除原始非结构化病历数据中与急性肾损伤无关的字段和/或字符,将删除后的原始非结构化病历数据输入到的预先训练完成的词嵌入模型中,得到输出的待测非结构化病历数据。其中,示例性的,词嵌入模型包括但不限于GloVe模型。CBOW模型或skip-Gram模型等等,此处对词嵌入模型不作限定。
其中,具体的,位置编码单元121用于保存单词在待测非结构化病历数据中的相对或绝对位置。
在一个可选实施例中,非结构化计算单元包括第三遮罩多头自注意力层、第四残差与层归一化层、第二前馈神经网络和第五残差与层归一化层。其中,具体的,第三遮罩多头自注意力层,用于基于输入的非结构化特征,输出位置编码向量矩阵。第四残差与层归一化层,用于基于输入的非结构化特征以及第三遮罩多头自注意力层输出的位置编码向量矩阵,输出归一化矩阵。第二前馈神经网络,用于基于第四残差与层归一化层输出的归一化矩阵,输出第二前馈特征。第五残差与层归一化层,用于基于第四残差与层归一化层输出的归一化矩阵以及第二前馈神经网络输出的第二前馈特征,输出非结构化向量。
在本实施例中,时空联合计算单元124的输入数据包括非结构化计算单元输出的非结构化向量、结构化时间计算单元122输出的结构化时间向量以及结构化空间计算单元123输出的结构化空间向量。其中,具体的,时空联合计算单元124中的第二遮罩多头自注意力层,用于基于融合层输出的结构化融合向量以及非结构化计算单元输出的非结构化向量,输出融合注意力特征,第二残差与层归一化层,用于基于融合层输出的结构化融合向量以及第二遮罩多头自注意力层输出的融合注意力特征,输出第一融合特征。
图5为本发明一个实施例所提供的另一种急性肾损伤预测模型的模型架构图。具体的,图5中最左侧的方框内的“xxx”和“yyy”表示原始非结构化病历数据,将原始非结构化病历数据输入到数据预处理模块110中,输出待测非结构化病历数据,位置编码单元121基于输入的待测非结构化病历数据,输出非结构化特征。将非结构化特征输入到非结构化计算单元中,得到输出的非结构化向量,以及将非结构化向量输入到急性肾损伤预测模型中的时空联合计算单元124中。
这样设置的好处在于,提高了急性肾损伤预测模型的输入数据的多样性,使得急性肾损伤预测模型同时具备结构化病历数据的时间连续性和空间多样性以及非结构化病历数据的学习能力,进一步提高了急性肾损伤预测模型的输出的急性肾损伤预测结果的及时性及准确度。
本实施例的技术方案,通过设置急性肾损伤预测模型包括位置编码单元、结构化时间计算单元、结构化空间计算单元和时空联合计算单元,相应的,模型处理模块,具体用于:将各待测时间结构化数据和各待测空间结构化数据输入到位置编码单元,得到输出的各待测时间结构化特征和各待测空间结构化特征;将各待测时间结构化特征输入到急性肾损伤预测模型中的结构化时间计算单元中,得到输出的结构化时间向量;将各待测空间结构化特征输入到急性肾损伤预测模型中的结构化空间计算单元中,得到输出的结构化空间向量;将结构化时间向量和结构化空间向量输入到急性肾损伤预测模型中的时空联合计算单元中,得到输出的预测急性肾损伤结果,解决了现有的急性肾损伤预测模型的模型架构存在的不足,改进的Transformer模型更加适配本发明实施例提供的急性肾损伤预测任务,充分挖掘结构化病历数据的时空联合特征信息以及非结构化病历数据的文本信息,进一步提高了急性肾损伤预测模型输出的急性肾损伤预测结果的及时性及准确度。
图6为本发明一个实施例所提供的另一种急性肾损伤预测***的结构示意图,本发明实施例对上述实施例中急性肾损伤预测***的训练过程进行进一步细化。
如图6所示,急性肾损伤预测***还包括模型训练模块310,模型训练模块310,用于:获取训练对象的训练结构化病历数据;基于时间滑动窗口和训练结构化病历数据,确定至少两个训练时间结构化数据,以及基于指标参数维度对训练结构化病历数据进行分类,得到至少两个训练空间结构化数据;其中,相邻的训练时间结构化数据之间存在至少一个相同的训练时间病历数据;基于各训练时间结构化数据、各训练空间结构化数据以及未训练完成的急性肾损伤预测模型,输出训练急性肾损伤结果;基于训练急性肾损伤结果和标准急性肾损伤结果,对未训练完成的急性肾损伤预测模型的模型参数进行调整,直到得到训练完成的急性肾损伤预测模型。
在本实施例中,模型训练模块310,具体用于:将各训练时间结构化数据和各训练空间结构化数据输入到未训练完成的急性肾损伤预测模型中,得到输出的训练急性肾损伤结果。
在一个可选实施例中,模型训练模块310,还用于:获取训练对象的训练非结构化病历数据,并将训练非结构化病历数据输入到未训练完成的急性肾损伤预测模型中。
其中,具体的,训练结构化病历数据和/或训练非结构化病历数据可以是从公共数据库中获取到的,示例性的,公共数据库可以为MIMIC-III数据库,MIMIC-III数据库是由MIT的physionet实验室、BIDMC(Beth Israel Deaconess Medical Center)和飞利浦公司共同建设的针对重症监护患者的数据库,目前数据库包含了53423名成年患者的医疗数据。
其中,具体的,根据第三个国际共识脓毒症定义(Sepsis-3)指南筛选出本发明实施例适用的脓毒症患者人群,对MIMIC-III数据库进行筛选,得到训练对象的训练结构化病历数据和/或训练非结构化病历数据,以及依照改善全球肾脏病预后组织(Kidney DiseaseImproving Global Outcomes,KDIGO)指南,计算得到训练对象对应的标准急性肾损伤结果。其中,标准急性肾损伤结果包括训练对象确诊急性肾损伤或训练对象未确诊急性肾损伤。
在一个可选实施例中,训练结构化病历数据中包含至少两个时间节点分别对应的训练时间病历数据,各时间节点分别对应的时间长度均满足预设时间步长,模型训练模块310,具体用于:将训练对象确诊脓毒症的时间节点作为开始时间节点,并将训练对象处于预设状态之前的预设前瞻窗口对应的起始时间节点作为终止时间节点;其中,预设状态包括确诊急性肾损伤或就诊状态结束;基于时间滑动窗口、开始时间节点和终止时间节点,获取训练结构化病历数据中的至少两个训练时间结构化数据。
其中,示例性的,预设前瞻窗口对应的窗口时长为24小时或48小时,此处对预设前瞻窗口对应的窗口时长不作限定。
图7为本发明一个实施例所提供的一种训练结构化病历数据的时间序列示意图。具体的,图7中最后两个白色圆点表示预设状态为确诊急性肾损伤后的结构化病历数据,当训练对象的预设状态为就诊状态结束时,则训练结构化病历数据在预设状态之后的时间序列中不存在白色圆点。
以图7为例,预设前瞻窗口对应的起始时间节点为训练结构化病历数据中的第7个时间节点,则在本实施例中,训练结构化病历数据包括7个时间节点分别对应的训练时间结构化数据。
在上述实施例的基础上,可选的,将模型训练模块310对应的各训练病历数据构成训练集、验证集和测试集。其中,训练病历数据包括训练结构化病历数据,或者,训练病历数据包括训练结构化病历数据和训练非结构化病历数据。具体的,基于训练集、验证集和测试集分别对应的数据占比,将各训练病历数据随机分为训练集、验证集和测试集,示例性的,训练集、验证集和测试集对应的数据占比分别为80%、10%和10%,此处对数据占比不作限定。
在本实施例中,模型训练模块310具体用于:基于训练集中训练对象的训练病历数据,对未训练完成的急性肾损伤预测模型进行训练,得到训练完成的急性肾损伤预测模型,基于验证集中的训练病历数据对训练完成的急性肾损伤预测模型进行验证操作,在验证结果不满足预设验证条件的情况下,对训练完成的急性肾损伤预测模型中的超参数进行调整,并将调整后的急性肾损伤预测模型作为未训练完成的急性肾损伤预测模型,重复执行基于训练集中训练对象的训练病历数据,对未训练完成的急性肾损伤预测模型进行训练,得到训练完成的急性肾损伤预测模型的步骤,直到验证结果满足预设验证条件;基于测试集中的训练病历数据,对验证结果满足预设验证条件的训练完成的急性肾损伤预测模型进行评估,得到模型评估结果。
其中,示例性的,对训练完成的急性肾损伤预测模型中的超参数进行调整,包括:对训练完成的急性肾损伤预测模型中的超参数执行网格搜索操作,得到最优的一组超参数作为调整后的急性肾损伤预测模型中的超参数。
其中,示例性的,模型评估结果中的评估参数包括但不限限于准确率、F1分数、AUROC(The area under the receiver operating characteristic,ROC曲线下面积)与AUPRC(The area under precision-recall curve,PRC曲线下面积)等等。
ROC曲线是指接受者操作特征曲线,ROC曲线表征在特定刺激条件下,横轴是假阳率(False Positive Rate,FPR),纵轴是真阳率(True Positive Rate,TPR),曲线上的点是根据急性肾损伤的发生概率输出的在不同的分类阈值下所表现出来的TPR与FPR所决定,如当急性肾损伤的发生概率大于等于设定阈值时,该训练病历数据预测为阳性,否则为阴性。其中,AUROC表示ROC曲线下面积,可用于评价分类器性能。随机挑选一个阳性训练病历数据与阴性训练病历数据,输入到急性肾损伤预测模型之中,输出两个训练病历数据的急性肾损伤的发生概率,由大到小排列,将阳性训练病历数据排在阴性训练病历数据前面的概率就是AUC值,也就是阳性训练病历数据输出概率大于阴性训练病历数据输出概率的可能性。
同理,PRC曲线的横轴则是召回率(Recall),纵轴则是精确度(Precision)。随着分类阈值逐渐减小,越来越多的训练病历数据被预测为阳性,但是这些阳性训练病历数据中同样掺杂着真正的阴性训练病历数据,即TPR与FPR会同时增大。当阈值最大时,对应ROC曲线坐标点为(0,0),阈值最小时对应坐标点(1,1),而我们的理想目标是TPR=1,FPR=0,对应的ROC曲线坐标点是(0,1),所以我们在急性肾损伤预测模型的训练中选择最接近坐标点(0,1)的ROC曲线上的点所代表的概率值作为分类阈值。根据最佳分类阈值,可以求得急性肾损伤预测模型输出的急性肾损伤预测结果的准确率、敏感度、特异度、召回率、精确度。其中,具体的,准确率Accuracy=(TP+TN)/(TP+TN+FP+FN);敏感度Sensitivity=TP/(TP+FN);特异度Specificity=TN/(TN+FP);召回率Recall=TP/(TP+FN);F1分数=2*Recall*Precision/(Recall+Precision);精确度Precision=TP/(TP+FP)。其中,TP(TruePositive)表征实际为阳性,预测为阳性的训练病历数据,FP(False Positive)表征实际为阴性,预测为阳性的训练病历数据,TN(True Negative)表征实际为阴性,预测为阴性的训练病历数据,FN(False Negative)表征实际为阳性,预测为阴性的训练病历数据。
图8为本发明一个实施例所提供的一种急性肾损伤预测模型的训练过程的流程图。具体的,急性肾损伤预测模型的训练过程主要包括数据收集与人群筛选过程、建模分析过程以及结果评估过程。
其中,在数据收集与人群筛选过程中,从数据库中提取原始结构化病历数据、原始非结构化病历数据以及标签,根据第三个国际共识脓毒症定义(Sepsis-3)指南,从上述提取结果中筛选出适用本发明实施例的脓毒症患者人群的原始结构化病历数据、原始非结构化病历数据以及标签。基于医疗临床文本语料库预训练词嵌入模型,并对脓毒症患者人群对应的原始非结构化病历数据进行修剪删除,将修剪删除后的原始非结构化病历数据输入到预训练完成的词嵌入模型中,得到输出的训练非结构化病历数据。基于预设时间步长,对脓毒症患者人群对应的原始结构化病历数据进行时间聚合及排序,得到原始结构化病历数据对应的结构化时间序列,并对结构化时间序列依次执行异常值处理、指标标准化处理和缺失值处理操作,得到训练结构化病历数据。基于预设前瞻窗口、脓毒症患者人群对应的标签以及结构化时间序列,确定标准急性肾损伤结果。具体的,训练非结构化病历数据、训练结构化病历数据和标准急性肾损伤结果共同构成训练病历数据。
在建模分析过程中,将数据收集与人群筛选过程得到的训练病历数据中的80%作为训练集,10%作为验证集,10%作为测试集。基于训练集中训练对象的训练病历数据,对未训练完成的急性肾损伤预测模型进行训练,得到训练完成的急性肾损伤预测模型,基于验证集中的训练病历数据对训练完成的急性肾损伤预测模型进行验证操作,在验证结果不满足预设验证条件的情况下,采用超参数网格搜索算法,对训练完成的急性肾损伤预测模型中的超参数进行调整,并将调整后的急性肾损伤预测模型作为未训练完成的急性肾损伤预测模型,重复执行基于训练集中训练对象的训练病历数据,对未训练完成的急性肾损伤预测模型进行训练,得到训练完成的急性肾损伤预测模型的步骤,直到验证结果满足预设验证条件。
在结果评估过程中,建模分析过程得到的验证结果满足预设验证条件的训练完成的急性肾损伤预测模型中的超参数为最佳超参数,基于测试集中的训练病历数据对建模分析过程得到的验证结果满足预设验证条件的训练完成的急性肾损伤预测模型进行评估,得到模型评估结果。
本实施例的技术方案,通过在急性肾损伤预测***中设置模型训练模块,模型训练模块,用于获取训练对象的训练结构化病历数据;基于时间滑动窗口和训练结构化病历数据,确定至少两个训练时间结构化数据,以及基于指标参数维度对训练结构化病历数据进行分类,得到至少两个训练空间结构化数据;其中,相邻的训练时间结构化数据之间存在至少一个相同的训练时间病历数据;基于各训练时间结构化数据、各训练空间结构化数据以及未训练完成的急性肾损伤预测模型,输出训练急性肾损伤结果;基于训练急性肾损伤结果和标准急性肾损伤结果,对未训练完成的急性肾损伤预测模型的模型参数进行调整,直到得到训练完成的急性肾损伤预测模型,解决了急性肾损伤预测模型的训练问题,保证了急性肾损伤预测***的完整性。
需要说明的是,本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
图9为本发明一个实施例所提供的一种电子设备的结构示意图。电子设备10可配置本发明实施例中的急性肾损伤预测***中的功能模块。
如图9所示,电子设备10旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备10还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本发明实施例所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
如图9所示,电子设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(ROM)12、随机访问存储器(RAM)13等,其中,存储器存储有可被至少一个处理器11执行的计算机程序,处理器11可以根据存储在只读存储器(ROM)12中的计算机程序或者从存储单元18加载到随机访问存储器(RAM)13中的计算机程序,来执行各种适当的动作和处理。在RAM 13中,还可存储电子设备10操作所需的各种程序和数据。处理器11、ROM 12以及RAM 13通过总线14彼此相连。输入/输出(I/O)接口15也连接至总线14。
电子设备10中的多个部件连接至I/O接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如急性肾损伤预测方法。
在一些实施例中,急性肾损伤预测方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由ROM 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到RAM 13并由处理器11执行时,可以执行上文描述的急性肾损伤预测方法的一个或多个步骤。备选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行急性肾损伤预测方法。
本文中以上描述的***和技术的各种实施方式可以在数字电子电路***、集成电路***、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上***的***(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程***上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储***、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储***、该至少一个输入装置、和该至少一个输出装置。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各模块可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (10)

1.一种急性肾损伤预测***,其特征在于,包括:数据预处理模块、模型处理模块和预测结果输出模块;
其中,所述数据预处理模块,用于获取目标对象的待测结构化病历数据,并基于时间滑动窗口和所述待测结构化病历数据,确定至少两个待测时间结构化数据,以及基于指标参数维度对所述待测结构化病历数据进行分类,得到至少两个待测空间结构化数据;其中,相邻的待测时间结构化数据之间存在至少一个相同的待测时间病历数据;
所述模型处理模块,用于基于各所述待测时间结构化数据、各所述待测空间结构化数据以及预先训练完成的急性肾损伤预测模型,输出预测急性肾损伤结果;
所述预测结果输出模块,用于将所述预测急性肾损伤结果进行输出。
2.根据权利要求1所述的急性肾损伤预测***,其特征在于,所述待测结构化病历数据中包含至少两个时间节点分别对应的待测时间病历数据,各所述时间节点分别对应的时间长度均满足预设时间步长,相应的,所述数据预处理模块,具体用于:
针对每个时间节点,将当前时间节点作为窗口终止节点,并基于时间滑动窗口和所述窗口终止节点,从所述待测结构化病历数据中获取参考时间结构化数据;
在所述参考时间结构化数据中的参考时间病历数据的数量小于所述时间滑动窗口对应的预设数量的情况下,对所述参考时间结构化数据执行插值处理,得到与所述当前时间节点对应的待测时间结构化数据。
3.根据权利要求2所述的急性肾损伤预测***,其特征在于,所述待测结构化病历数据中的开始时间节点为所述目标对象确诊脓毒症之后的第一个时间节点。
4.根据权利要求2所述的急性肾损伤预测***,其特征在于,所述数据预处理模块,具体用于:
基于预设时间步长,获取所述目标对象的原始结构化病历数据对应的至少两个原始时间病历数据;
针对每个原始时间病历数据,对所述原始时间病历数据执行第一预处理操作得到待测时间病历数据;其中,所述第一预处理操作包括聚合操作、异常值处理操作、标准化操作和缺失值处理操作中至少一种;
基于各所述待测时间病历数据,生成所述目标对象对应的待测结构化病历数据。
5.根据权利要求1-4任一项所述的急性肾损伤预测***,其特征在于,所述急性肾损伤预测模型包括位置编码单元、结构化时间计算单元、结构化空间计算单元和时空联合计算单元,相应的,所述模型处理模块,具体用于:
将各所述待测时间结构化数据和各所述待测空间结构化数据输入到位置编码单元,得到输出的各待测时间结构化特征和各待测空间结构化特征;
将各所述待测时间结构化特征输入到所述急性肾损伤预测模型中的结构化时间计算单元中,得到输出的结构化时间向量;
将各所述待测空间结构化特征输入到所述急性肾损伤预测模型中的结构化空间计算单元中,得到输出的结构化空间向量;
将所述结构化时间向量和所述结构化空间向量输入到所述急性肾损伤预测模型中的时空联合计算单元中,得到输出的预测急性肾损伤结果。
6.根据权利要求5所述的急性肾损伤预测***,其特征在于,所述结构化时间计算单元包括第一遮罩自注意力层和第一残差与层归一化层,所述结构化空间计算单元包括一维卷积层、全连接层和层归一化层,所述时空联合计算单元包括融合层、第二遮罩多头自注意力层、第二残差与层归一化层、第一前馈神经网络、第三残差与层归一化层和输出层。
7.根据权利要求5所述的急性肾损伤预测***,其特征在于,所述急性肾损伤预测***还包括模型训练模块,所述模型训练模块,用于:
获取训练对象的训练结构化病历数据;
基于时间滑动窗口和所述训练结构化病历数据,确定至少两个训练时间结构化数据,以及基于指标参数维度对所述训练结构化病历数据进行分类,得到至少两个训练空间结构化数据;其中,相邻的训练时间结构化数据之间存在至少一个相同的训练时间病历数据;
基于各所述训练时间结构化数据、各所述训练空间结构化数据以及未训练完成的急性肾损伤预测模型,输出训练急性肾损伤结果;
基于训练急性肾损伤结果和标准急性肾损伤结果,对所述未训练完成的急性肾损伤预测模型的模型参数进行调整,直到得到训练完成的急性肾损伤预测模型。
8.根据权利要求7所述的急性肾损伤预测***,其特征在于,所述训练结构化病历数据中包含至少两个时间节点分别对应的训练时间病历数据,各所述时间节点分别对应的时间长度均满足预设时间步长,所述模型训练模块,具体用于:
将所述训练对象确诊脓毒症的时间节点作为开始时间节点,并将所述训练对象处于预设状态之前的预设前瞻窗口对应的起始时间节点作为终止时间节点;其中,所述预设状态包括确诊急性肾损伤或就诊状态结束;
基于时间滑动窗口、开始时间节点和终止时间节点,获取所述训练结构化病历数据中的至少两个训练时间结构化数据。
9.根据权利要求5所述的急性肾损伤预测***,其特征在于,所述数据预处理模块,还用于:对获取到的原始非结构化病历数据执行第二预处理操作,得到待测非结构化病历数据;其中,所述第二预处理操作包括字段筛选操作和向量转化操作;
相应的,所述急性肾损伤预测模型还包括非结构化计算单元,所述模型处理模块,还用于:将所述待测非结构化病历数据输入到预先训练完成的急性肾损伤预测模型中的位置编码单元中,得到输出的非结构化特征;
将所述非结构化特征输入到预先训练完成的急性肾损伤预测模型中的非结构化计算单元中,得到输出的非结构化向量,以及将所述非结构化向量输入到所述急性肾损伤预测模型中的时空联合计算单元中。
10.根据权利要求9所述的急性肾损伤预测***,其特征在于,所述非结构化计算单元包括第三遮罩多头自注意力层、第四残差与层归一化层、第二前馈神经网络和第五残差与层归一化层。
CN202211469514.2A 2022-11-22 2022-11-22 一种急性肾损伤预测*** Pending CN115762783A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211469514.2A CN115762783A (zh) 2022-11-22 2022-11-22 一种急性肾损伤预测***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211469514.2A CN115762783A (zh) 2022-11-22 2022-11-22 一种急性肾损伤预测***

Publications (1)

Publication Number Publication Date
CN115762783A true CN115762783A (zh) 2023-03-07

Family

ID=85335374

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211469514.2A Pending CN115762783A (zh) 2022-11-22 2022-11-22 一种急性肾损伤预测***

Country Status (1)

Country Link
CN (1) CN115762783A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117894466A (zh) * 2024-03-15 2024-04-16 四川大学华西医院 基于循环神经网络的急性肾炎风险连续预测方法和***

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117894466A (zh) * 2024-03-15 2024-04-16 四川大学华西医院 基于循环神经网络的急性肾炎风险连续预测方法和***
CN117894466B (zh) * 2024-03-15 2024-05-17 四川大学华西医院 基于循环神经网络的急性肾炎风险连续预测方法和***

Similar Documents

Publication Publication Date Title
US11138514B2 (en) Review machine learning system
CN107516110B (zh) 一种基于集成卷积编码的医疗问答语义聚类方法
Yu et al. A bearing fault and severity diagnostic technique using adaptive deep belief networks and Dempster–Shafer theory
WO2024000852A1 (zh) 数据处理方法、装置、设备及存储介质
Petrozziello et al. Deep learning for continuous electronic fetal monitoring in labor
US20230085991A1 (en) Anomaly detection and filtering of time-series data
CN111612038B (zh) 异常用户检测方法及装置、存储介质、电子设备
CN111612041A (zh) 异常用户识别方法及装置、存储介质、电子设备
CN114388135B (zh) 一种孕妇指标数据分析方法、装置、设备及可读存储介质
JP2024506529A (ja) 心電図信号を基にした慢性疾患の予測方法
CN113435253A (zh) 一种多源影像联合城区地表覆盖分类方法
KR102362678B1 (ko) 생체신호 분석 방법
Ojeme et al. Selecting learning algorithms for simultaneous identification of depression and comorbid disorders
CN116959725A (zh) 一种多模态数据融合的疾病风险预测方法
CN115762783A (zh) 一种急性肾损伤预测***
Liu et al. Product Processing Quality Classification Model for Small‐Sample and Imbalanced Data Environment
Jeffin et al. Machine learning for prediction of clinical appointment no-shows
CN111785372A (zh) 基于关联规则的协同过滤疾病预测***及其电子设备
Hossen et al. Examining the risk factors of liver disease: a machine learning approach
Zhang et al. Exploring unsupervised multivariate time series representation learning for chronic disease diagnosis
Alotaibi et al. Stroke in-patients' transfer to the ICU using ensemble based model
CN114722941A (zh) 信贷违约识别方法、装置、设备和介质
Zeng et al. Use of Deep Learning for Continuous Prediction of Mortality for All Admissions in Intensive Care Units
Zhao et al. Financial time series data prediction by combination model Adaboost-KNN-LSTM
Busi et al. A Hybrid Deep Learning Technique for Feature Selection and Classification of Chronic Kidney Disease.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination