CN114334062A - 一种基于病历的疾病异常预警方法、设备及介质 - Google Patents
一种基于病历的疾病异常预警方法、设备及介质 Download PDFInfo
- Publication number
- CN114334062A CN114334062A CN202111663427.6A CN202111663427A CN114334062A CN 114334062 A CN114334062 A CN 114334062A CN 202111663427 A CN202111663427 A CN 202111663427A CN 114334062 A CN114334062 A CN 114334062A
- Authority
- CN
- China
- Prior art keywords
- medical record
- disease
- specified
- vector
- designated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 title claims abstract description 209
- 201000010099 disease Diseases 0.000 title claims abstract description 203
- 238000000034 method Methods 0.000 title claims abstract description 57
- 239000013598 vector Substances 0.000 claims abstract description 102
- 230000002159 abnormal effect Effects 0.000 claims abstract description 68
- 230000005856 abnormality Effects 0.000 claims abstract description 43
- 230000006835 compression Effects 0.000 claims abstract description 12
- 238000007906 compression Methods 0.000 claims abstract description 12
- 230000005855 radiation Effects 0.000 claims description 36
- 238000012512 characterization method Methods 0.000 claims description 13
- 238000003860 storage Methods 0.000 claims description 12
- 208000035977 Rare disease Diseases 0.000 claims description 7
- 208000015181 infectious disease Diseases 0.000 claims description 6
- 230000005540 biological transmission Effects 0.000 claims description 4
- 230000002265 prevention Effects 0.000 claims description 4
- 238000012216 screening Methods 0.000 claims description 3
- 230000011218 segmentation Effects 0.000 claims 2
- 238000001514 detection method Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 10
- 238000004590 computer program Methods 0.000 description 7
- 208000035475 disorder Diseases 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 206010019233 Headaches Diseases 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 231100000869 headache Toxicity 0.000 description 3
- 230000036772 blood pressure Effects 0.000 description 2
- 230000036760 body temperature Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 206010008469 Chest discomfort Diseases 0.000 description 1
- 206010011224 Cough Diseases 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007721 medicinal effect Effects 0.000 description 1
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000012847 principal component analysis method Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Landscapes
- Measuring And Recording Apparatus For Diagnosis (AREA)
Abstract
本申请公开了一种基于病历的疾病异常预警方法、设备及介质,方法包括:获取当期的病历信息,对病历信息中的疾病表征进行编码,以得到结构化的第一病历向量;通过预先训练的病历向量化模型,对第一病历向量进行维度压缩,得到低维度的第二病历向量;通过预先训练的疾病趋势预测模型,将第二病历向量作为输入,对当期的病历信息中出现的指定疾病进行异常预测,并根据预测结果输出当期的病历信息对应的异常期望;若指定个体或指定群体的病历信息,通过疾病趋势预测模型得到的输出结果,与异常期望之间的偏离等级达到预设等级,则确定指定个体或指定群体存在异常。
Description
技术领域
本申请涉及异常预警领域,具体涉及一种基于病历的疾病异常预警方法、设备及介质。
背景技术
随着新发疾病的不断出现和已有疾病的卷土重来,现有的疾病监测方法已不能适应社会应急处理的要求。为保证及时、准确地预测疾病异常情况,采取有效的防控措施,一般情况下是通过对患者的病症信息、就诊数据进行数据处理和数据挖掘来进行疾病预警,然而这种方式需要大量的数据前置处理操作,工作量较大且处理效率低,预警效果不佳。
发明内容
为了解决上述问题,本申请提出了一种基于病历的疾病异常预警方法,包括:
本申请实施例提供了一种基于病历的疾病异常预警设备,方法包括:获取当期的病历信息,对病历信息中的疾病表征进行编码,以得到结构化的第一病历向量;通过预先训练的病历向量化模型,对第一病历向量进行维度压缩,得到低维度的第二病历向量;通过预先训练的疾病趋势预测模型,将第二病历向量作为输入,对当期的病历信息中出现的指定疾病进行异常预测,并根据预测结果输出当期的病历信息对应的异常期望;若指定个体或指定群体的病历信息,通过疾病趋势预测模型得到的输出结果,与异常期望之间的偏离等级达到预设等级,则确定指定个体或指定群体存在异常。
在本申请的一种实现方式中,预测结果包括第二病历向量对应的指定疾病的异常概率;根据预测结果输出当期的病历信息对应的异常期望之后,方法还包括:根据个体对应的个体特征,将个体划分为多个指定群体;个体特征至少包括以下一项或多项:年龄、地理位置、性别;分别计算指定群体中的不同个体的异常概率与异常期望之间的第一偏离度,以及不同个体对应的第一偏离度之间的均值;根据预先划分的偏离度区间,确定第一偏离度的均值对应的偏离度区间,以确定对应的偏离等级。
在本申请的一种实现方式中,根据预测结果输出当期的病历信息对应的异常期望之后,方法还包括:计算指定个体对应的指定疾病的异常概率与异常期望之间的第二偏离度;根据预先划分的偏离度区间,确定第二偏离度对应的偏离度区间,以确定对应的偏离等级;在确定偏离等级达到预设等级的情况下,计算病历信息对应的个体所患疾病的历史发病率,以根据历史发病率,确定指定个体对应的患病类型;患病类型包括常见疾病和罕见疾病。
在本申请的一种实现方式中,确定指定个体或指定群体存在异常之后,方法还包括:在指定群体存在异常的情况下,根据预设的回归模型,预测群体在当期之后的指定时间段内的目标发病趋势;根据病历信息,获取指定群体历年来在指定时间段内的历史发病趋势;根据目标发病趋势和历史发病趋势,提示疾控部门对指定群体采取相应的防控措施。
在本申请的一种实现方式中,确定指定个体或指定群体存在异常之后,方法还包括:按照预设的时间间隔,获取指定疾病的传染速度、传播方式以及死亡率,以确定指定疾病对应的权重;确定指定群体中的个体的地理位置,根据指定疾病对应的权重以及地理位置,在预置的电子地图上,通过对应的显示颜色对指定疾病进行标注;显示颜色与指定疾病对应的权重相对应;根据指定群体对应的目标发病趋势,在电子地图上标注出指定疾病对应的辐射范围。
在本申请的一种实现方式中,根据指定群体对应的目标发病趋势,在电子地图上标注出指定疾病对应的辐射范围,具体包括:根据指定群体对应的目标发病趋势,预测各辐射周期对应的发病率;时间间隔与辐射周期相对应;确定指定群体的人数总量,并根据人数总量和发病率,确定辐射周期内的患病人数;根据患病人数与人数总量之间的比值,确定对应的风险级别,以根据风险级别确定对应的第一辐射半径;以指定群体的个体为第一圆心,根据第一圆心和第一辐射半径,确定各个体对应的第一辐射范围;以各第一辐射范围的并集区域中心为第二圆心,以各第一辐射范围中距离第二圆心的最远点与第二圆心之间的距离为第二辐射半径,确定指定疾病对应的第二辐射范围。
在本申请的一种实现方式中,对病历信息中的疾病表征进行编码,具体包括:对病历信息进行分词,并根据预设的病症词典,从分词后的病历信息中筛选出疾病表征;病症词典中包括多个疾病表征;通过病症词典,对病历信息中的各疾病表征进行编码,得到一位编码形式的疾病表征向量;对疾病表征向量进行去重,并整合去重后的疾病表征向量,以得到由疾病表征向量组成的结构化的第一病历向量。
在本申请的一种实现方式中,确定指定个体对应的患病类型之后,方法还包括:在指定个体对应的患病类型为罕见疾病的情况下,获取指定患者对应的目标病历向量;指定患者患有所述罕见疾病;计算目标病历向量与个体对应的第一病历向量之间的相似度,并从多个指定患者中,选取与第一病历向量相似度最高的目标病历向量对应的指定患者,作为目标患者;根据目标患者对应的目标病历向量,以及指定个体对应的第一病历向量,确定指定个体的特殊疾病表征,并添加至临床案例库中。
本申请实施例提供了一种基于病历的疾病异常预警设备,包括:
至少一个处理器;以及,
与至少一个处理器通信连接的存储器;其中,
存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够:
获取当期的病历信息,对病历信息中的疾病表征进行编码,以得到结构化的第一病历向量;
通过预先训练的病历向量化模型,对第一病历向量进行维度压缩,得到低维度的第二病历向量;
通过预先训练的疾病趋势预测模型,将第二病历向量作为输入,对当期的病历信息中出现的指定疾病进行异常预测,并根据预测结果输出当期的病历信息对应的异常期望;
若指定个体或指定群体的病历信息,通过疾病趋势预测模型得到的输出结果,与异常期望之间的偏离等级达到预设等级,则确定指定个体或指定群体存在异常。
本申请实施例提供了一种非易失性计算机存储介质,存储有计算机可执行指令,计算机可执行指令设置为:
获取当期的病历信息,对病历信息中的疾病表征进行编码,以得到结构化的第一病历向量;
通过预先训练的病历向量化模型,对第一病历向量进行维度压缩,得到低维度的第二病历向量;
通过预先训练的疾病趋势预测模型,将第二病历向量作为输入,对当期的病历信息中出现的指定疾病进行异常预测,并根据预测结果输出当期的病历信息对应的异常期望;
若指定个体或指定群体的病历信息,通过疾病趋势预测模型得到的输出结果,与异常期望之间的偏离等级达到预设等级,则确定指定个体或指定群体存在异常。
本申请实施例提供的一种基于病历的疾病异常预警方法、设备及介质,至少具备以下有益效果:
病历信息经过结构化和向量维度压缩得到病历向量,通过病历向量,预测指定个体或指定群体的是否存在异常,这种基于自然语言文本的疾病异常预测方式使得数据无需进行清洗、整理和标注等预备工作,便能够直接参与到最终的疾病预测过程中,大大减少了数据预处理工作量,提高了预测效率;并且,疾病趋势预测模型能够预测当期病历信息对应的异常期望,通过将异常期望与预测模型输出结果进行比对,便能够实现疾病的异常检测,更为高效准确。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请实施例提供的一种基于病历的疾病异常预警方法的流程示意图;
图2为本申请实施例提供的另一种基于病历的疾病异常预警方法的流程示意图;
图3为本申请实施例提供的一种基于病历的疾病异常预警设备结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
以下结合附图,详细说明本申请各实施例提供的技术方案。
如图1所示,本申请实施例提供的一种基于病历的疾病异常预警方法,包括:
S101:获取当期的病历信息,对病历信息中的疾病表征进行编码,以得到结构化的第一病历向量。
病历信息是医务人员对患者疾病的诊断、治疗等医疗活动过程的记录,能够以手写文本或电子文本的形式存在。病历信息来自医院、社区诊所等医疗***,包括患者的身份信息、病症信息和诊断信息等,用于反映患者的患病情况。
本申请实施例基于个体病历进行疾病的异常预警,需从医疗***中获取到个体病历信息,并对自然文本形式的病历信息进行结构化,从而使之以程序化的形式存储,便于后续的预测分析。需要说明的是,这里的个体病历信息指的是电子文本形式的病历信息,手写文本形式的病历信息需事先通过电子扫描仪等上传工具上传至医疗***中去。
服务器对病历信息进行结构化,实质就是对词汇进行编码的过程。而病历信息中能够进行疾病相关预测的有效信息即为病症信息,因此,首先要对病历信息进行分词,得到针对个人病历的一组病历词汇,然后根据预设的病症词典,从病历词汇中筛选出记载于病症词典中的疾病表征。这里所指的病症词典包括用于描述病症的疾病表征词汇,比如胸闷、头疼、咳嗽等。
完成疾病表征的筛选后,可通过病症词典对疾病表征进行编码,使得各疾病表征都以向量的形式存在。假设病症词典中包括1000种病症,那么病历中的疾病表征可以通过1000维向量表示,每一个向量分量代表一种疾病表征的检测结果。在对疾病表征进行编码后,可将疾病表征的检测结果量化为[-1,1]区间内,其中,0表示正常或未对疾病表征进行检测。比如,病症词典中包括头痛、体温、心跳、血压四个疾病表征词,那么疾病表征可通过四维向量去描述,(0,0,0.4,-0.3),(1,0.2,0,0.3),(0,0,-0.1,0)中每个向量的分量依次对应头痛、体温、心跳、血压的检测结果,每个向量都对应不同的病历。依据此种方法,得到了与病症词典维度相同的个体病历向量,实现了文本病历的结构化表示。
S102:通过预先训练的病历向量化模型,对第一病历向量进行维度压缩,得到低维度的第二病历向量。
经过编码的结构化第一病历向量不再以自然文本的形式存在,而是以向量的形式存在,但是其维度较大(相当于病症词典中的疾病表征数量),不易于后续的预测和学习。因此,服务器可采集各个体的结构化病历向量组成结构化病历数据集,参与到病历向量化模型的训练过程中。这里的病历向量化模型可以是无监督学习的神经网络模型,也可以是通过PCA主成分分析方法训练得到的向量化模型,将高维度的结构化病历向量输入至病历向量化模型中,对个体的结构化病历向量进行维度压缩,能够输出低维度的第二病历向量。比如,第一病历向量的维度为1000,通过病历向量化模型可将第一病历向量的维度压缩到5维,这样得到的低维第二病历向量才是对预测结果影响最大的特征向量。需要说明的是,高维度、低维度只是相对意义上的高和低,比如,低于5便为低维度,高于100便为高维度,这里列举的数值仅做示例。
S103:通过预先训练的疾病趋势预测模型,将第二病历向量作为输入,对当期的病历信息中出现的指定疾病进行异常预测,并根据预测结果输出当期的病历信息对应的异常期望。
在对个体病历信息进行结构化和向量化之后,服务器可按照预设的时间间隔进行采样,采集由多个第二病历向量组成的病历向量数据集并将其作为数据样本,在连续采样N个时间段的病历向量样本后,可将前N-1个样本作为模型输入,第N个样本作为标签,训练相应的疾病趋势模型。该疾病趋势模型能够对当期的病历信息中出现的指定疾病进行异常预测,并根据预测结果输出当期的病历信息对应的异常期望。指定疾病可以是病历信息中诊断出的实际患有的疾病,也可以是发生过的全部疾病,在进行异常检测时,可以仅对病历信息中存在的疾病进行检测,也可以对全部疾病进行检测,最后的输出结果均为针对各指定疾病的异常概率。
S104:若指定个体或指定群体的病历信息,通过疾病趋势预测模型得到的输出结果,与异常期望之间的偏离等级达到预设等级,则确定指定个体或指定群体存在异常。
异常期望表示当期内指定个体或指定群体在面对指定疾病时能够维持正常的标准值,通过比较预测结果与实际异常期望的偏差,便能够确定出当前患病个体或群体是否存在疾病异常。具体地,服务器首先需确定病历信息对应的预测结果。对于指定个体来说,需确定指定个体对应的指定疾病的预测结果与异常期望之间的第二偏离度,根据预先划分的偏离度区间,确定第二偏离度对应的偏离度区间,从而确定对应的偏离等级。当偏离等级达到预设等级的情况下,指定个体是存在异常。比如,某一个体的预测结果显示异常概率为50%,而异常期望为30%,那么二者的偏离度为20%。预设的偏离度区间分为3种,分别是[0,10),[10,50),[50,100],各区间依次对应的偏离等级为一级、二级和三级,当偏离等级大于等于二级时,便能够认为指定个体不符合预期的异常期望,该个体存在异常。
在指定个体存在异常的情况下,需对其进行进一步的分析。具体地,可以从多家医院、医学论坛、社区医疗信息***、统计机构等中采集医疗数据,根据多源采集的医疗数据,计算指定个体所患疾病的历史发病率,并根据历史发病率,确定指定个体对应的患病类型是常见疾病还是罕见疾病。如果历史发病率低于预设阈值,那么指定个体患有罕见疾病。
此时,需对该指定个体进行临床监测,确定出指定个体存在的异常疾病表征,从而在对其进行治疗的过程中不断扩充病历档案库。首先,获取患有同样罕见疾病的指定患者对应的目标病历向量,当然,在获取此数据之前,应先对上述指定患者的病历信息进行结构化。然后,通过余弦相似度,计算目标病历向量与指定个体的第一病历向量之间的相似度,在分别得到指定个体与多个指定患者之间的病历向量相似度后,从中选取相似度最高的指定患者作为目标患者。目标患者用于对指定个体的疾病表征进行更为深入的比较分析,因此,需选用相似度最高的某一指定患者作为标准来进行分析。在确定出目标患者后,需将目标病历向量与指定个体的第一病历向量进行比较,确定出该存在异常的指定个体的特殊疾病表征,并将特殊疾病表征添加至临床案例库中去,有利于后续其他患者的确诊和治疗。
在本申请实施例中,可按照个体的个体特征,将个体划分为多个群体,其中,个体特征至少包括以下一项或多项:年龄、地理位置、性别。当然,个体特征也可以包括已婚未婚、有无某类生活习惯等,只要是能够进行类别区分的特征都可作为个体特征,本申请对此不再进行赘述。对于指定群体来说,分别计算指定群体中的不同个体的异常概率与异常期望之间的第一偏离度,并计算第一偏离度之间的均值,该均值即为指定群体对应的群体偏离度。根据预先划分的偏离度区间,确定第一偏离度的均值对应的偏离度区间,从而确定对应的偏离等级。若预测结果与异常期望之间的偏离等级达到预设等级,表明当前指定群体的疾病发展不符合预期的期望,可能存在异常。偏离度区间的设置以及偏离等级的划分可按照实际需求进行设置,本申请对此不再进行限定。
服务器在对个体或群体进行异常监测时,通常情况下是设定具体的时间间隔,定期反馈监测结果。在监测到指定群体存在异常的情况下,服务器能够根据预设的回归模型,预测群体在当期之后的指定时间段内的目标发病趋势。比如,设定每间隔一月就对群体进行一次异常结果的分析处理,对于居住在某一街道的居民群体来说,其患病情况在10月份发生了异常,那么可通过预设的回归模型比如差分整合移动平均自回归模型(Autoregressive Integrated Moving Average model,ARIMA),对其下一监测时间段也就是11月份的发病趋势进行预测。服务器根据群体的病历信息,确定该指定群体历年来在指定时间段的历史发病趋势,并将历史发病趋势与预测得到的目标发病趋势进行对比,若两个趋势之间的差别超出一定范围,那么说明当前异常群体的未来患病情况极有可能存在异常,需提醒疾控部门对此群体采取相应的防控措施,避免疾病的突然爆发。比如,发病趋势可以通过发病率去体现,通过预设的回归模型可得到疾病在指定时间段内的目标发病率和历史发病率,当二者之间的差值超过预设值时,表明当前指定群体的发病趋势存在异常,则需要疾控部门的介入,避免群体性的疾病爆发。
在一个实施例中,服务器在确定指定群体存在异常的情况下,可通过生成电子预警地图,实时进行相关疾病的动态预警。
具体地,服务器可按照预设的时间间隔集中采集医疗数据,根据医疗数据确定出指定疾病的传染速度、传播方式以及死亡率,进而确定出该指定疾病对应的权重。指定疾病的权重可通过传染速度、传播方式以及死亡率加权求和计算得出,加权系数可自行设置。权重与传染速度及死亡率成正比关系,也就是说,传染速度越快,死亡率越高,该指定疾病的权重也就越大。
进一步地,服务器需确定指定群体中各个体的地理位置,然后根据发病类型对应的权重以及地理位置,在预置的电子地图上,通过对应的显示颜色对发病类型进行标注。其中,显示颜色与发病类型对应的权重相对应,某一发病类型在地图上的颜色对比度越高越为显眼,其权重就越大。同时,服务器还能够根据预测出的目标发病趋势,预测出各辐射周期的发病率,这里的辐射周期指的就是医疗数据的采集周期,与预设的时间间隔相对应。进一步,确定指定群体的人数总量,并根据人数总量和发病率,确定在辐射周期内的患病人数,并根据患病人数与人数总量之间的比值,确定对应的风险级别。风险级别用于表示疾病的扩散速度,风险级别越高,则指定疾病的辐射范围就越大,对应的第一半径就越大。针对指定群体中的各个体,将个体所在的位置作为圆心,将第一辐射半径作为半径,确定对应的第一辐射范围。当得到多个个体对应的第一辐射范围后,以各第一辐射范围的并集区域的中心为第二圆心,以各第一辐射范围中距离第二圆心的最远点与第二圆心之间的距离为第二辐射半径,确定指定疾病对应的第二辐射范围。第二辐射范围能够覆盖指定群体中患有指定疾病的全部个体。
需要说明的是,在对异常群体的临床治疗过程中,服务器可通过获取群体中的各个体所在医疗机构的地理位置以及实时上传的个体治疗进度,建立监测网络。这样,当某个医疗机构治愈率高并存在可分配的医疗资源的情况下,可进行医疗资源的实时调度和治疗手段的相关干预。
图2为本申请实施例提供的另一种基于病历的疾病异常预警方法的流程示意图。如图2所示,首先,获取个体病历信息,并对个体病历进行结构化,得到结构化的第一病历向量。采集结构化的第一病历向量以组成结构化病历数据集,根据结构化病历数据集,训练得到用于压缩维度的病历向量化模型。通过病历向量化模型,对个体病历信息进行病历向量化,得到低维度的第二病历向量。采集上述第二病历向量,并根据采样到的病历向量数据集作为样本,训练疾病趋势预测模型。通过疾病趋势预测模型,对第二病历向量进行异常检测。异常检测分为针对个体的异常检测和针对群体的异常检测,对于异常个体需及时进行预警;对于异常群体,需预测其疾病发展趋势,并对异常的疾病发展趋势进行预警,还能够在对群体进行异常检测的过程中,实时动态的生成电子预警地图。
以上为本申请提出的方法实施例。基于同样的思路,本申请的一些实施例还提供了上述方法对应的设备和非易失性计算机存储介质。
图3为本申请实施例提供的一种基于病历的疾病异常预警设备结构示意图。如图3所示,包括:
至少一个处理器;以及,
至少一个处理器通信连接的存储器;其中,
存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够:
获取当期的病历信息,对病历信息中的疾病表征进行编码,以得到结构化的第一病历向量;
通过预先训练的病历向量化模型,对第一病历向量进行维度压缩,得到低维度的第二病历向量;
通过预先训练的疾病趋势预测模型,将第二病历向量作为输入,对当期的病历信息中出现的指定疾病进行异常预测,并根据预测结果输出当期的病历信息对应的异常期望;
若指定个体或指定群体的病历信息,通过疾病趋势预测模型得到的输出结果,与异常期望之间的偏离等级达到预设等级,则确定指定个体或指定群体存在异常。
本申请实施例提供的一种非易失性计算机存储介质,存储有计算机可执行指令,计算机可执行指令设置为:
获取当期的病历信息,对病历信息中的疾病表征进行编码,以得到结构化的第一病历向量;
通过预先训练的病历向量化模型,对第一病历向量进行维度压缩,得到低维度的第二病历向量;
通过预先训练的疾病趋势预测模型,将第二病历向量作为输入,对当期的病历信息中出现的指定疾病进行异常预测,并根据预测结果输出当期的病历信息对应的异常期望;
若指定个体或指定群体的病历信息,通过疾病趋势预测模型得到的输出结果,与异常期望之间的偏离等级达到预设等级,则确定指定个体或指定群体存在异常。
本申请中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备和介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本申请实施例提供的设备和介质与方法是一一对应的,因此,设备和介质也具有与其对应的方法类似的有益技术效果,由于上面已经对方法的有益技术效果进行了详细说明,因此,这里不再赘述设备和介质的有益技术效果。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (10)
1.一种基于病历的疾病异常预警方法,其特征在于,所述方法包括:
获取当期的病历信息,对所述病历信息中的疾病表征进行编码,以得到结构化的第一病历向量;
通过预先训练的病历向量化模型,对所述第一病历向量进行维度压缩,得到低维度的第二病历向量;
通过预先训练的疾病趋势预测模型,将所述第二病历向量作为输入,对所述当期的病历信息中出现的指定疾病进行异常预测,并根据预测结果输出所述当期的病历信息对应的异常期望;
若指定个体或指定群体的病历信息,通过所述疾病趋势预测模型得到的输出结果,与所述异常期望之间的偏离等级达到预设等级,则确定所述指定个体或所述指定群体存在异常。
2.根据权利要求1所述的一种基于病历的疾病异常预警方法,其特征在于,所述预测结果包括所述第二病历向量对应的指定疾病的异常概率;
根据预测结果输出所述当期的病历信息对应的异常期望之后,所述方法还包括:
根据个体对应的个体特征,将所述个体划分为多个指定群体;所述个体特征至少包括以下一项或多项:年龄、地理位置、性别;
分别计算所述指定群体中的不同个体的异常概率与所述异常期望之间的第一偏离度,以及不同所述个体对应的第一偏离度之间的均值;
根据预先划分的偏离度区间,确定所述第一偏离度的均值对应的偏离度区间,以确定对应的偏离等级。
3.根据权利要求2所述的一种基于病历的疾病异常预警方法,其特征在于,根据预测结果输出所述当期的病历信息对应的异常期望之后,所述方法还包括:
计算所述指定个体对应的指定疾病的异常概率与所述异常期望之间的第二偏离度;
根据预先划分的偏离度区间,确定所述第二偏离度对应的偏离度区间,以确定对应的偏离等级;
在确定所述偏离等级达到预设等级的情况下,计算所述病历信息对应的个体所患疾病的历史发病率,以根据所述历史发病率,确定所述指定个体对应的患病类型;所述患病类型包括常见疾病和罕见疾病。
4.根据权利要求1所述的一种基于病历的疾病异常预警方法,其特征在于,确定所述指定个体或所述指定群体存在异常之后,所述方法还包括:
在所述指定群体存在异常的情况下,根据预设的回归模型,预测所述群体在当期之后的指定时间段内的目标发病趋势;
根据所述病历信息,获取所述指定群体历年来在所述指定时间段内的历史发病趋势;
根据所述目标发病趋势和所述历史发病趋势,提示疾控部门对所述指定群体采取相应的防控措施。
5.根据权利要求4所述的一种基于病历的疾病异常预警方法,其特征在于,确定所述指定个体或所述指定群体存在异常之后,所述方法还包括:
按照预设的时间间隔,获取所述指定疾病的传染速度、传播方式以及死亡率,以确定所述指定疾病对应的权重;
确定所述指定群体中的个体的地理位置,根据所述指定疾病对应的权重以及所述地理位置,在预置的电子地图上,通过对应的显示颜色对所述指定疾病进行标注;所述显示颜色与所述指定疾病对应的权重相对应;
根据所述指定群体对应的目标发病趋势,在所述电子地图上标注出所述指定疾病对应的辐射范围。
6.根据权利要求5所述的一种基于病历的疾病异常预警方法,其特征在于,根据所述指定群体对应的目标发病趋势,在所述电子地图上标注出所述指定疾病对应的辐射范围,具体包括:
根据所述指定群体对应的目标发病趋势,预测各辐射周期对应的发病率;所述时间间隔与所述辐射周期相对应;
确定所述指定群体的人数总量,并根据所述人数总量和所述发病率,确定所述辐射周期内的患病人数;
根据所述患病人数与所述人数总量之间的比值,确定对应的风险级别,以根据所述风险级别确定对应的第一辐射半径;
以所述指定群体的个体为第一圆心,根据所述第一圆心和所述第一辐射半径,确定各个体对应的第一辐射范围;
以各所述第一辐射范围的并集区域中心为第二圆心,以各所述第一辐射范围中距离所述第二圆心的最远点与所述第二圆心之间的距离为第二辐射半径,确定所述指定疾病对应的第二辐射范围。
7.根据权利要求1所述的一种基于病历的疾病异常预警方法,其特征在于,对所述病历信息中的疾病表征进行编码,具体包括:
对所述病历信息进行分词,并根据预设的病症词典,从分词后的所述病历信息中筛选出疾病表征;所述病症词典中包括多个疾病表征;
通过所述病症词典,对所述病历信息中的各疾病表征进行编码,得到一位编码形式的疾病表征向量;
对所述疾病表征向量进行去重,并整合去重后的所述疾病表征向量,以得到由所述疾病表征向量组成的结构化的第一病历向量。
8.根据权利要求3所述的一种基于病历的疾病异常预警方法,其特征在于,确定所述指定个体对应的患病类型之后,所述方法还包括:
在所述指定个体对应的患病类型为罕见疾病的情况下,获取指定患者对应的目标病历向量;所述指定患者患有所述罕见疾病;
计算所述目标病历向量与所述个体对应的第一病历向量之间的相似度,并从多个所述指定患者中,选取与所述第一病历向量相似度最高的目标病历向量对应的指定患者,作为目标患者;
根据所述目标患者对应的目标病历向量,以及所述指定个体对应的第一病历向量,确定所述指定个体的特殊疾病表征,并添加至临床案例库中。
9.一种基于病历的疾病异常预警设备,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
获取当期的病历信息,对所述病历信息中的疾病表征进行编码,以得到结构化的第一病历向量;
通过预先训练的病历向量化模型,对所述第一病历向量进行维度压缩,得到低维度的第二病历向量;
通过预先训练的疾病趋势预测模型,将所述第二病历向量作为输入,对所述当期的病历信息中出现的指定疾病进行异常预测,并根据预测结果输出所述当期的病历信息对应的异常期望;
若指定个体或指定群体的病历信息,通过所述疾病趋势预测模型得到的输出结果,与所述异常期望之间的偏离等级达到预设等级,则确定所述指定个体或所述指定群体存在异常。
10.一种非易失性计算机存储介质,存储有计算机可执行指令,其特征在于,所述计算机可执行指令设置为:
获取当期的病历信息,对所述病历信息中的疾病表征进行编码,以得到结构化的第一病历向量;
通过预先训练的病历向量化模型,对所述第一病历向量进行维度压缩,得到低维度的第二病历向量;
通过预先训练的疾病趋势预测模型,将所述第二病历向量作为输入,对所述当期的病历信息中出现的指定疾病进行异常预测,并根据预测结果输出所述当期的病历信息对应的异常期望;
若指定个体或指定群体的病历信息,通过所述疾病趋势预测模型得到的输出结果,与所述异常期望之间的偏离等级达到预设等级,则确定所述指定个体或所述指定群体存在异常。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111663427.6A CN114334062A (zh) | 2021-12-30 | 2021-12-30 | 一种基于病历的疾病异常预警方法、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111663427.6A CN114334062A (zh) | 2021-12-30 | 2021-12-30 | 一种基于病历的疾病异常预警方法、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114334062A true CN114334062A (zh) | 2022-04-12 |
Family
ID=81021280
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111663427.6A Pending CN114334062A (zh) | 2021-12-30 | 2021-12-30 | 一种基于病历的疾病异常预警方法、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114334062A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115879179A (zh) * | 2023-02-24 | 2023-03-31 | 忻州师范学院 | 一种异常病历检测装置 |
-
2021
- 2021-12-30 CN CN202111663427.6A patent/CN114334062A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115879179A (zh) * | 2023-02-24 | 2023-03-31 | 忻州师范学院 | 一种异常病历检测装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20020169735A1 (en) | Automatic mapping from data to preprocessing algorithms | |
WO2020257782A1 (en) | Factory risk estimation using historical inspection data | |
Data | Machine learning | |
JP2018524750A (ja) | ストレス状態をモニターするための方法およびシステム | |
US11429899B2 (en) | Data model processing in machine learning using a reduced set of features | |
AU2013205281A1 (en) | System and Method for Classifying Respiratory and Overall Health Status of an Animal | |
US11182411B2 (en) | Combined data driven and knowledge driven analytics | |
CA3053894A1 (en) | Defect prediction using historical inspection data | |
CN111477328B (zh) | 一种非接触式的心理状态预测方法 | |
US20130281871A1 (en) | System and method for classifying the respiratory health status of an animal | |
CN114334062A (zh) | 一种基于病历的疾病异常预警方法、设备及介质 | |
Srivastav et al. | Machine Learning Models for Early Brain Stroke Prediction: A Performance Analogy | |
US20230409926A1 (en) | Index for risk of non-adherence in geographic region with patient-level projection | |
AU2021104790A4 (en) | A method for predicting and early warning of mental disorders using neural networks | |
Nnamoko et al. | Meta-classification model for diabetes onset forecast: A proof of concept | |
CN115481803A (zh) | 基于行业拥挤度的金融时间序列预测方法、装置及设备 | |
EP4141744A1 (en) | Semi-supervised machine learning method and system suitable for identification of patient subgroups in electronic healthcare records | |
CN113159419A (zh) | 一种群体特征画像分析方法、装置、设备及可读存储介质 | |
Mahalle et al. | Data Acquisition and Preparation | |
Yin | Prediction and analysis of time series data based on granular computing | |
CN115831339B (zh) | 基于深度学习的医疗***风险管控事前预测方法、*** | |
Ariq et al. | The Effect of Facial Attributes in Identifying Gender Using Facial Recognition | |
Birhane et al. | Predicting the Behavior of Blood Donors in National Blood Bank of Ethiopia Using Data Mining Techniques. | |
Sillitti et al. | Providing proactiveness: data analysis techniques portfolios | |
Luong et al. | longSil: An evaluation metric to assess quality of clustering longitudinal clinical data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |