CN117012380A - 事件预估方法、装置、设备、存储介质及程序产品 - Google Patents
事件预估方法、装置、设备、存储介质及程序产品 Download PDFInfo
- Publication number
- CN117012380A CN117012380A CN202211144293.1A CN202211144293A CN117012380A CN 117012380 A CN117012380 A CN 117012380A CN 202211144293 A CN202211144293 A CN 202211144293A CN 117012380 A CN117012380 A CN 117012380A
- Authority
- CN
- China
- Prior art keywords
- event
- historical
- target data
- time
- specified
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 91
- 238000003860 storage Methods 0.000 title claims abstract description 31
- 230000004927 fusion Effects 0.000 claims abstract description 76
- 238000007499 fusion processing Methods 0.000 claims abstract description 22
- 238000012098 association analyses Methods 0.000 claims abstract description 15
- 201000010099 disease Diseases 0.000 claims description 187
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 187
- 230000006870 function Effects 0.000 claims description 32
- 238000004458 analytical method Methods 0.000 claims description 30
- 238000000605 extraction Methods 0.000 claims description 22
- 238000010219 correlation analysis Methods 0.000 claims description 11
- 230000010354 integration Effects 0.000 claims description 11
- 238000012300 Sequence Analysis Methods 0.000 claims description 9
- 238000012549 training Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 8
- 230000004913 activation Effects 0.000 claims description 7
- 238000005516 engineering process Methods 0.000 abstract description 24
- 238000010801 machine learning Methods 0.000 abstract description 14
- 238000013473 artificial intelligence Methods 0.000 abstract description 11
- 230000001364 causal effect Effects 0.000 abstract description 11
- 230000000875 corresponding effect Effects 0.000 description 202
- 238000003745 diagnosis Methods 0.000 description 24
- 230000008569 process Effects 0.000 description 19
- 238000010586 diagram Methods 0.000 description 14
- 238000012545 processing Methods 0.000 description 11
- 238000004364 calculation method Methods 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 8
- 230000000474 nursing effect Effects 0.000 description 7
- 238000013528 artificial neural network Methods 0.000 description 4
- 239000002131 composite material Substances 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 230000001537 neural effect Effects 0.000 description 4
- 238000007500 overflow downdraw method Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 230000036541 health Effects 0.000 description 3
- 238000011176 pooling Methods 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 208000007530 Essential hypertension Diseases 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 206010012601 diabetes mellitus Diseases 0.000 description 2
- 208000022602 disease susceptibility Diseases 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 230000004083 survival effect Effects 0.000 description 2
- 208000002177 Cataract Diseases 0.000 description 1
- 206010019280 Heart failures Diseases 0.000 description 1
- 206010020751 Hypersensitivity Diseases 0.000 description 1
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- 208000005141 Otitis Diseases 0.000 description 1
- 206010035664 Pneumonia Diseases 0.000 description 1
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 230000007815 allergy Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 208000020832 chronic kidney disease Diseases 0.000 description 1
- 239000002817 coal dust Substances 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 208000019258 ear infection Diseases 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000008570 general process Effects 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 238000009533 lab test Methods 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000003449 preventive effect Effects 0.000 description 1
- 238000004393 prognosis Methods 0.000 description 1
- 238000007430 reference method Methods 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012502 risk assessment Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- AYEKOFBPNLCAJY-UHFFFAOYSA-O thiamine pyrophosphate Chemical compound CC1=C(CCOP(O)(=O)OP(O)(O)=O)SC=[N+]1CC1=CN=C(C)N=C1N AYEKOFBPNLCAJY-UHFFFAOYSA-O 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Data Mining & Analysis (AREA)
- Public Health (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Pathology (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- Theoretical Computer Science (AREA)
- Primary Health Care (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种事件预估方法、装置、设备、存储介质及程序产品,涉及机器学习领域。该方法包括:获取历史时间段内生成的多个目标数据对,并得到目标数据对所对应的事件特征表示;对相同历史时刻的事件特征表示进行特征融合处理后得到融合事件特征表示;沿时间序列维度对多个融合事件特征表示进行事件关联度分析,确定多个历史时刻下发生的历史事件对于发生指定事件的事件影响强度,并确定发生指定事件的事件发生概率。不仅充分考虑到不同历史时刻下发生的历史事件之间的时序因果关系,还考虑到了相同历史时刻下多个历史事件之间的事件并列关系,有利于提高事件发生概率的预测准确率。本申请可应用于云技术、人工智能、智慧交通等各种场景。
Description
技术领域
本申请实施例涉及机器学习领域,特别涉及一种事件预估方法、装置、设备、存储介质及程序产品。
背景技术
随着机器学习技术的发展,机器学习模型已经逐步应用到疾病预测中,通过将患者的历史疾病数据输入至机器学习模型的方法,借助机器学习模型对患者未来可能患有的疾病进行预测。
相关技术中,通常获取在不同时刻下对应的历史疾病确诊情况后,根据时刻与疾病之间的对应关系得到多个历史疾病数据,将历史时间段内的历史疾病数据输入机器学习模型,由机器学习模型对全部历史疾病数据进行综合分析,根据历史时间段内患者的患病情况,对未来可能患有的疾病以及可能加重的疾病情况进行预测。
然而,在上述预测过程中,在根据时刻与疾病之间的对应关系得到历史疾病数据时,历史疾病数据呈现为单标签的情况,虽然能够根据全部历史疾病数据对未来的疾病情况进行预测,但忽略了同一时刻下不同疾病之间可能存在的关联关系。因此,若仅仅综合分析全部历史疾病数据,容易降低疾病预测的准确率。
发明内容
本申请实施例提供了一种事件预估方法、装置、设备、存储介质及程序产品,不仅充分考虑到不同历史时刻下发生的历史事件之间的时序因果关系,还考虑到了相同历史时刻下多个历史事件之间的事件并列关系,有利于提高事件发生概率的预测准确率。所述技术方案如下。
一方面,提供了一种事件预估方法,所述方法包括:
获取历史时间段内生成的多个目标数据对,所述目标数据对中包括历史时刻与历史事件之间的对应关系,所述目标数据对用于指示在所述历史时刻发生的历史事件;
对所述目标数据对进行特征提取,得到所述目标数据对所对应的事件特征表示;
对对应相同历史时刻的所述事件特征表示进行特征融合处理,得到与多个历史时刻分别对应的融合事件特征表示;
沿时间序列维度对多个融合事件特征表示进行事件关联度分析,确定所述多个历史时刻下发生的历史事件对于发生指定事件的事件影响强度,所述指定事件是待进行预估在所述历史时间段之后发生的事件,所述指定事件与所述历史时间段内发生的历史事件存在伴随关联关系;
基于所述事件影响强度确定发生所述指定事件的事件发生概率。
另一方面,提供了一种事件预估装置,所述装置包括:
获取模块,用于获取历史时间段内生成的多个目标数据对,所述目标数据对中包括历史时刻与历史事件之间的对应关系,所述目标数据对用于指示在所述历史时刻发生的历史事件;
提取模块,用于对所述目标数据对进行特征提取,得到所述目标数据对所对应的事件特征表示;
融合模块,用于对对应相同历史时刻的所述事件特征表示进行特征融合处理,得到与多个历史时刻分别对应的融合事件特征表示;
分析模块,用于沿时间序列维度对多个融合事件特征表示进行事件关联度分析,确定所述多个历史时刻下发生的历史事件对于发生指定事件的事件影响强度,所述指定事件是待进行预估在所述历史时间段之后发生的事件,所述指定事件与所述历史时间段内发生的历史事件存在伴随关联关系;
确定模块,用于基于所述事件影响强度确定发生所述指定事件的事件发生概率。
另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上述本申请实施例中任一所述事件预估方法。
另一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上述本申请实施例中任一所述的事件预估方法。
另一方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述实施例中任一所述的事件预估方法。
本申请实施例提供的技术方案带来的有益效果至少包括:
获取体现历史时刻与历史事件之间对应关系的目标数据对,并得到与目标数据对对应的事件特征表示;对相同历史时刻的事件特征表示进行特征融合处理后得到与多个历史时刻分别对应的融合事件特征表示;沿时间序列维度对多个融合事件特征表示进行事件关联度分析,确定多个历史时刻下发生的历史事件对于发生指定事件的事件影响强度,从而确定发生指定事件的事件发生概率。不仅充分考虑到不同历史时刻下发生的历史事件之间的时序因果关系,还考虑到了相同历史时刻下多个历史事件之间的事件并列关系,在一个历史时刻对应多个历史事件的情况下,更加充分地考虑了历史事件对于发生指定事件的事件影响强度,从而提高了事件发生概率的预测准确率,也更有利于使用对象根据事件发生概率对指定事件进行规避或迎合。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一个示例性实施例提供的实施环境示意图;
图2是本申请一个示例性实施例提供的事件预估方法的流程图;
图3是本申请另一个示例性实施例提供的事件预估方法的流程图;
图4是本申请又一个示例性实施例提供的事件预估方法的流程图;
图5是本申请再一个示例性实施例提供的事件预估方法的流程图;
图6是本申请一个示例性实施例提供的事件预估模型的示意图;
图7是本申请一个示例性实施例提供的应用事件预估方法的疾病预测示意图;
图8是本申请一个示例性实施例提供的解码层的注意力网络的示意图;
图9是本申请一个示例性实施例提供的转化层的注意力网络的示意图;
图10是本申请一个示例性实施例提供的事件预估模型的技术侧流程示意图;
图11是本申请一个示例性实施例提供的应用事件预估方法的疾病预测流程图;
图12是本申请另一个示例性实施例提供的应用事件预估方法的疾病预测流程图;
图13是本申请一个示例性实施例提供的事件预估装置的结构框图;
图14是本申请另一个示例性实施例提供的事件预估装置的结构框图;
图15是本申请一个示例性实施例提供的服务器的结构框图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
首先,针对本申请实施例中涉及的名词进行简单介绍。
人工智能(Artificial Intelligence,AI):是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用***。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互***、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
机器学习(Machine Learning,ML):是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。
电子健康记录(Electronic Health Records EHR):用于指示病人疾病记录的数字版本,可能包括一系列数据,包括人口统计、病史、用药和过敏、免疫状态、实验室测试结果、放射学图像、生命体征、年龄和体重等个人统计数据以及账单信息等。
国际疾病分类第九版(International Classification of Diseases9,ICD 9):世界卫生组织依据疾病特征,按规则制定的国际疾病伤害及死因分类标准第九版。
相关技术中,通常获取在不同时刻下对应的历史疾病确诊情况后,根据时刻与疾病之间的对应关系得到多个历史疾病数据,将历史时间段内的历史疾病数据输入机器学习模型,由机器学习模型对全部历史疾病数据进行综合分析,根据历史时间段内患者的患病情况,对未来可能患有的疾病以及可能加重的疾病情况进行预测。然而,在上述预测过程中,在根据时刻与疾病之间的对应关系得到历史疾病数据时,历史疾病数据呈现为单标签的情况,虽然能够根据全部历史疾病数据对未来的疾病情况进行预测,但忽略了同一时刻下不同疾病之间可能存在的关联关系。因此,若仅仅综合分析全部历史疾病数据,容易降低疾病预测的准确率。
本申请实施例中,提供了一种事件预估方法,不仅充分考虑到不同历史时刻下发生的历史事件之间的时序因果关系,还考虑到了相同历史时刻下多个历史事件之间的事件并列关系,有利于提高事件发生概率的预测准确率。针对本申请训练得到的事件预估方法,在应用时包括疾病预测场景、风险评估场景、灾害管理场景等多种事件预估场景中的至少一种。值得注意的是,上述应用场景仅为示意性的举例,本实施例提供的事件预估方法还可以应用于其他场景中,本申请实施例对此不加以限定。
需要说明的是,本申请所涉及的信息(包括但不限于用户设备信息、用户个人信息等)、数据(包括但不限于用于分析的数据、存储的数据、展示的数据等)以及信号,均为经用户授权或者经过各方充分授权的,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。例如,本申请中涉及到的历史时刻、历史事件、目标数据对等都是在充分授权的情况下获取的。
其次,对本申请实施例中涉及的实施环境进行说明,示意性的,请参考图1,该实施环境中涉及终端110、服务器120,终端110和服务器120之间通过通信网络130连接。
在一些实施例中,终端110用于向服务器120发送目标数据对。示意性的,终端110中安装有具有数据获取功能的应用程序,以根据历史时间段内的历史时刻以及与历史时刻对应的历史事件获取得到目标数据对,目标数据对用于指示在历史时刻发生的历史事件;或者,终端110用于向服务器120发送历史时刻以及与历史时刻对应的历史事件。示意性的,终端110中安装有具有数据获取功能的应用程序,在获取得到的历史时间段内的历史时刻以及与历史时刻对应的历史事件后,将历史时刻以及与历史时刻对应的历史事件发送至服务器120,服务器将历史时刻以及与历史时刻对应的历史事件组成目标数据对。
本申请实施例提供的事件预估方法可以由终端110单独执行实现,也可以由服务器120执行实现,或者由终端110和服务器120通过数据交互实现,本申请实施例对此不加以限定。可选地,以服务器120对目标数据对进行分析为例进行说明。
可选地,服务器120接收终端110发送的目标数据对,其中包括:与历史时刻1对应的目标数据对1、目标数据对2以及目标数据对3;与历史时刻2对应的目标数据对4以及目标数据对5;与历史时刻3对应的目标数据对6以及目标数据对7;与历史时刻4对应的目标数据对8以及目标数据对9。
服务器120对上述多个目标数据对分别进行特征提取,得到与多个目标数据对分别对应的事件特征表示,即:与目标数据对1对应的事件特征表示1、与目标数据对2对应的事件特征表示2、与目标数据对3对应的事件特征表示3、与目标数据对4对应的事件特征表示4、与目标数据对5对应的事件特征表示5、与目标数据对6对应的事件特征表示6、与目标数对7对应的事件特征表示7、与目标数据对8对应的事件特征表示8以及与目标数据对9对应的事件特征表示9。
随后,服务器120对对应相同历史时刻的事件特征表示进行特征融合处理,得到与多个历史时刻分别对应的融合事件特征表示。也即,将事件特征表示1、事件特征表示2以及事件特征表示3进行特征融合后,得到与历史时刻1对应的融合事件特征表示1;将事件特征表示4以及事件特征表示5进行特征融合后,得到与历史时刻2对应的融合事件特征表示2;将事件特征表示6以及事件特征表示7进行特征融合后,得到与历史时刻3对应的融合事件特征表示3;将事件特征表示8以及事件特征表示9进行特征融合后,得到与历史时刻4对应的融合事件特征表示4。
之后,服务器120沿时间序列维度对多个融合事件特征表示进行事件关联度分析,确定多个历史时刻下发生的历史事件对于发生指定事件的事件影响强度。其中的指定事件在历史时间段之后发生的待预估事件,且指定事件与历史时间段内发生的历史事件存在伴随关联关系。服务器120基于事件影响强度确定发生指定事件的事件发生概率。
可选地,服务器120将发生指定事件的事件发生概率发送至终端110,由终端110对事件发生概率的分析结果进行显示;或者,由终端110根据多个指定事件分别对应的事件发生概率,将事件发生概率最高的指定事件显示在终端110上,从而提供最有可能发生的事件情况。
值得注意的是,上述终端包括但不限于手机、平板电脑、便携式膝上笔记本电脑、智能语音交互设备、智能家电、车载终端等移动终端,也可以实现为台式电脑等;上述服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式***,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
其中,云技术(Cloud technology)是指在广域网或局域网内将硬件、应用程序、网络等系列资源统一起来,实现数据的计算、储存、处理和共享的一种托管技术。云技术基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术、应用技术等的总称,可以组成资源池,按需所用,灵活便利。
在一些实施例中,上述服务器还可以实现为区块链***中的节点。
结合上述名词简介和应用场景,对本申请提供的事件预估方法进行说明,以该方法应用于服务器为例,如图2所示,该方法包括如下步骤210至步骤250。
步骤210,获取历史时间段内生成的多个目标数据对。
示意性的,历史时间段用于指示过去的时间段。其中,目标数据对中包括历史时刻与历史事件之间的对应关系。
历史时刻用于指示历史时间段中的时刻;历史事件用于指示在历史时间段内发生的事件。示意性的,历史时刻与历史事件之间的对应关系用于指示在历史时刻发生对应的历史事件,也即:目标数据对用于指示在历史时刻发生的历史事件。
可选地,历史时间段内的历史时刻以秒进行划分;或者,历史时间段内的历史时刻以分钟进行划分;或者,历史时间段内的历史时刻以小时进行划分;或者,历史时间段内的历史时刻以天进行划分等。
可选地,历史事件包括各种类型的事件。例如:历史事件为疾病确诊事件;或者,历史事件为灾难发生事件;或者,历史事件为广告推送事件等。
示意性的,在对历史事件进行分析时,选择相同或者相近种类的历史事件进行事件预估分析。例如:当需要对疾病事件进行预估时,选择将历史时间段内的疾病确诊事件作为待进行分析的历史事件,根据历史时间段内的疾病确诊事件对未来的疾病情况进行预测;或者,当需要对灾难发生事件进行预估时,选择将历史时间段内的灾难发生事件作为待进行分析的历史事件,根据历史时间段内的灾难发生事件对未来的灾难情况进行预测等。
可选地,历史时刻的划分方式是根据历史事件情况而预先确定的。
示意性的,当需要对疾病事件进行预估时,选择将“天”作为历史时刻的划分标准,确定不同天中的疾病确诊情况。例如:在2020年2月13日确诊了疾病A以及疾病B;在2020年8月25日确诊了疾病C;或者,选择将“月”作为历史时刻的划分标准,确定不同月中的疾病确诊情况。例如:在2020年2月确诊了疾病A以及疾病B;在2020年8月确诊了疾病C;或者,选择将“次”作为历史时刻的划分标准,确定不同天中的疾病确诊情况。例如:在第一次疾病诊断过程中确诊了疾病A以及疾病B;在第二次疾病诊断过程中确诊了疾病C等。
示意性的,当需要对灾难发生事件进行预估时,选择将“分钟”作为历史时刻的划分标准,确定不同小时中的灾难发生情况。例如:在13日下午2点03分发生了地震U;在15日上午4点30分发生了地震R等。
在一个可选的实施例中,确定历史时间段中多个历史时刻分别对应的至少一个历史事件。
示意性的,在确定历史时间段后,确定每一个历史时刻下发生的历史事件。例如:当需要对疾病确诊情况进行分析,则选择疾病确诊情况作为历史事件,确定每一个历史时刻下是否存在确诊疾病;或者,在确定历史时间段后,根据历史事件的发生情况,确定与历史事件对应的历史时刻,从而得到与至少一个历史事件对应的历史时刻。
可选地,历史时间段中存在若干个历史时刻,其中存在多个历史时刻具有对应的历史事件。多个历史时刻中的任意一个历史时刻既可能与一个历史事件相对应,也可能与多个历史事件相对应,也即:在多个历史时刻中的某一个历史时刻下,既可能只发生一个历史事件,也可能会发生多个历史事件。
在一个可选的实施例中,将多个历史时刻中的每个历史时刻与对应的至少一个历史事件组成至少一个数据对,得到多个历史时刻分别对应的数据对。
示意性的,在确定多个历史时刻以及与多个历史时刻所分别对应的历史事件后,根据历史时刻与历史事件之间的对应关系,将历史时刻与历史事件相组合,从而得到由历史时刻与历史事件组成的目标数据对。
例如:在确定历史时间段后,已知在历史时刻1下发生了历史事件1,在历史时刻2下发生了历史事件2以及历史事件3,在历史时刻3下发生了历史事件4。则在基于历史时刻与历史事件组成目标数据对时,基于历史时刻1与历史事件1之间的对应关系,将历史时刻1与历史事件1组成一个目标数据对,即:将历史时刻1与历史事件1组成目标数据对1;基于历史时刻2与历史事件2和历史事件3之间的对应关系,将历史时刻2与历史事件2和历史事件3组成两个目标数据对,即:将历史时刻2与历史事件2组成目标数据对2,将历史时刻2与历史事件3组成目标数据对3;基于历史时刻3与历史事件4之间的对应关系,将历史时刻3与历史事件4组成一个目标数据对,即:将历史时刻3与历史事件4组成目标数据对4等。
步骤220,对目标数据对进行特征提取,得到目标数据对所对应的事件特征表示。
示意性的,在得到代表历史时刻与历史事件之间对应关系的目标数据对后,可以确定多个历史时刻下分别对应的目标数据对。其中,多个历史时刻中每个历史时刻对应至少一个目标数据对。
在对目标数据对进行特征提取时,对多个历史时刻下的目标数据对分别进行特征提取,从而可以得到每个目标数据对所对应的事件特征表示。
示意性的,将目标数据对输入至特征提取网络,从而输出得到与目标数据对对应的事件特征表示。例如:将多个目标数据对输入至残差网络(Residual Neural Network,ResNet)中,输出得到与多个目标数据对分别对应的事件特征表示;或者,将多个目标数据对输入至视觉几何组网络(Visual Geometry Group Network,VGG Net)中,输出得到与多个目标数据对分别对应的事件特征表示等。
值得注意的是,上述特征提取网络仅为示意性的举例,本申请实施例对此不加以限定。
可选地,对目标数据对进行特征提取,能够降低目标数据对的数据维度,更好地提取得到目标数据对的数据特征,从而将目标数据对所代表的离散的标记转换为连续型的嵌入表示,即:与多个目标数据对分别对应的事件特征表示。
步骤230,对对应相同历史时刻的事件特征表示进行特征融合处理,得到与多个历史时刻分别对应的融合事件特征表示。
示意性的,在对多个时刻下的若干目标数据对进行特征提取得到事件特征表示后,以历史时刻为特征融合度量,在多个历史时刻中每个历史时刻下的事件特征表示进行特征融合处理,即:将每个历史时刻下的事件特征表示进行特征融合。
例如:在历史时刻2下发生了历史事件2以及历史事件3,对历史时刻2与历史事件2组成的目标数据对2,以及历史时刻2与历史事件3组成的目标数据对3进行特征提取后,得到与目标数据对2对应的事件特征表示2以及与目标数据对3对应的事件特征表示3,在对相同历史时刻的事件特征表示进行特征融合处理时,将与目标数据对2对应的事件特征表示2以及与目标数据对3对应的事件特征表示3进行特征融合处理,从而得到与历史时刻2对应的融合事件特征表示2。
或者,在历史时刻3下发生了历史事件4,对历史时刻3与历史事件4组成的目标数据对4进行特征提取后,得到与目标数据对4对应的事件特征表示4,将事件特征表示4作为与历史时刻3对应的融合事件特征表示3等。
可选地,在对相同历史时刻的事件特征表示进行特征融合处理时,采用特征拼接方法作为特征融合的方法,将相同历史时刻下的事件特征表示进行特征拼接,从而得到对应历史时刻下的融合事件特征表示;或者,在对相同历史时刻的事件特征表示进行特征融合处理时,采用并行策略方法作为特征融合的方法,将相同历史时刻下的事件特征表示组合成复合向量,将组合得到的复合向量作为对应历史时刻下的融合事件特征表示等。
可选地,基于上述过程,对多个历史时刻中相同历史时刻下的事件特征表示进行特征融合后,得到与多个历史时刻中每个历史时刻分别对应的融合事件特征表示。
步骤240,沿时间序列维度对多个融合事件特征表示进行事件关联度分析,确定多个历史时刻下发生的历史事件对于发生指定事件的事件影响强度。
示意性的,多个融合事件特征表示与多个历史时刻分别对应,多个历史时刻在时间序列维度上依次分布。例如:历史时刻1位于历史时刻2和历史时刻3之前,历史时刻2位于历史时刻3之前,历史时刻1、历史时刻2以及历史时刻3在时间序列维度上等间距依次分布。
可选地,历史时刻1对应融合事件特征表示1,历史时刻2对应融合事件特征表示2,历史时刻3对应融合事件特征表示3。沿时间序列维度对融合事件特征表示1、融合事件特征表示2以及融合事件特征表示3进行事件关联度分析。
可选地,事件关联度分析用于确定多个历史时刻下发生的历史事件对于发生指定事件的事件影响强度。
其中,指定事件是待进行预估在历史时间段之后发生的事件,也即:指定事件用于指示未来可能发生的事件。指定事件与历史时间段内发生的历史事件存在伴随关联关系。
示意性的,伴随关联关系用于指示历史事件对于指定事件的事件影响情况。可选地,伴随关联关系包括在历史时刻发生的历史事件可能会导致在未来发生指定事件的因果关联关系;或者,伴随关联关系包括在历史时刻发生的历史事件可能会导致在未来重复发生某个历史事件的关联关系,即:指定事件包括重复发生的历史事件等。
在一个可选的实施例中,预先确定指定事件,在沿时间序列维度对多个融合事件特征表示进行事件关联度分析时,分析多个历史时刻下发生的每个历史事件对于发生指定事件的影响程度(如:确定每个历史事件对于发生指定事件的影响权重),从而结合每个历史事件对于发生指定事件的影响程度确定事件影响强度。
可选地,在预先确定指定事件时,该指定事件与历史事件之间存在伴随关联关系。例如:历史事件为在历史时间段内确诊的多个确诊疾病,根据多个确诊疾病所可能引发的并发症,确定并发症集合,从并发症集合中选择至少一个并发症作为指定事件,确定未来是否可能确诊并发症等。
值得注意的是,以上仅为示意性的举例,本申请实施例对此不加以限定。
步骤250,基于事件影响强度确定发生指定事件的事件发生概率。
示意性的,在确定多个历史时刻下发生的历史事件对于发生指定事件的事件影响强度后,对事件影响强度进行非线性变换,将事件影响强度转换为概率情况,即得到发生指定事件的事件发生概率。可选地,选择不同的事件作为指定事件,得到不同的事件发生概率。
在一个可选的实施例中,将事件影响强度输入激活函数中,获取得到发生指定事件的事件发生概率。
示意性的,将事件影响强度输入线性整流函数(Rectified Linear Unit,ReLU),从而将输出限制在0到1之间,即确定发生指定事件的事件发生概率;或者,将事件影响强度输入S型函数(Sigmoid),从而得到输出为0到1之间的事件发生概率;或者,将事件影响强度输入双曲正切函数tanh,从而得到输出为0到1之间的事件发生概率等。
值得注意的是,以上仅为示意性的举例,本申请实施例对此不加以限定。
综上所述,不仅充分考虑到不同历史时刻下发生的历史事件之间的时序因果关系,还考虑到了相同历史时刻下多个历史事件之间的事件并列关系,在一个历史时刻对应多个历史事件的情况下,更加充分地考虑了历史事件对于发生指定事件的事件影响强度,从而提高了事件发生概率的预测准确率,也更有利于使用对象根据事件发生概率对指定事件进行规避或迎合。
在一个可选的实施例中,在分析多个历史事件对于发生指定事件时的事件影响强度时,分析多个历史事件之间的事件影响关系,并基于事件影响关系确定事件影响强度。示意性的,如图3所示,上述图2所示出的实施例中的步骤240还可以实现为如下步骤310至330。
步骤310,对多个融合事件特征表示进行序列分析,确定多个历史时刻下,多个融合事件特征表示之间的事件影响关系。
可选地,在获取得到与多个历史时刻分别对应的融合事件特征表示后,沿多个历史时刻所分布的时间序列维度,对多个融合事件特征表示进行序列分析,从而实现综合分析多个历史事件的目的。
示意性的,在对多个融合事件特征表示进行序列分析时,考虑发生在前的历史事件对于发生在后的历史事件的影响情况。例如:在时间序列维度上,历史时刻1位于历史时刻2之前,历史时刻1时发生了历史事件1,历史时刻2时发生了历史事件2和历史事件3,历史时刻1对应融合事件特征表示1,历史时刻2对应融合事件特征表示2。在对多个融合事件特征表示进行序列分析时,分析融合事件特征表示1与融合事件特征表示2之间的序列关系,即确定发生的历史事件1对于发生历史事件2以及历史事件3的影响情况。
可选地,在对多个融合事件特征表示进行序列分析后,确定多个历史时刻下,多个融合事件特征表示之间的事件影响关系。其中,事件影响关系用于指示目标数据对中不同历史事件之间的相互影响情况。
示意性的,对多个融合事件特征表示进行序列分析,以学习到多个融合事件特征表示之间的事件影响关系,事件影响关系能够综合体现多个融合事件特征表示之间的信息情况。
步骤320,基于事件影响关系对多个融合事件特征表示进行序列整合,得到与多个历史时刻分别对应的事件序列特征表示。
示意性的,在确定多个融合事件特征表示之间的事件影响关系后,基于事件影响关系对多个融合事件特征表示进行序列整合。
可选地,序列整合用于对融合事件特征表示进行调整,在调整融合事件特征表示时,将事件影响关系体现在序列整合后的事件序列特征表示中,也即:对多个融合事件特征表示进行序列整合后,得到与多个历史时刻分别对应的事件序列特征表示,且事件序列特征表示中蕴含事件影响关系。
示意性的,在事件序列特征表示中,不仅包括相同历史时刻下历史时刻与历史事件之间的关系,还包括不同历史时刻之间、不同历史事件之间的关系,也即:在事件序列特征表示中,既蕴含了同一历史时刻下历史事件的并列关系,也蕴含了不同历史时刻间的时序因果关系。
步骤330,沿时间序列维度对多个事件序列特征表示进行事件关联度分析,确定多个历史时刻下发生的历史事件对于发生指定事件的事件影响强度。
示意性的,在得到多个历史时刻分别对应事件序列特征表示后,对多个事件序列特征表示进行事件关联度分析,从而确定多个事件序列特征表示对于发生指定事件的事件影响强度。
可选地,事件影响强度是基于历史时刻下发生的每个历史事件对于发生指定事件的影响强度而得到的结果。例如:多个历史时刻下发生的历史事件1对于发生指定事件的影响强度为影响强度1;多个历史时刻下发生的历史事件2对于发生指定事件的影响强度为影响强度2,综合影响强度1和影响强度2确定发生指定事件的事件影响强度。
在一个可选的实施例中,对多个事件序列特征表示分别进行解码处理,得到影响强度参数集合。
其中,影响强度参数集合中包括与目标数据对对应的影响强度参数,影响强度参数用于调整目标数据对对指定事件的影响程度。
在一个可选的实施例中,影响强度参数集合中包括权重参数集合和系数参数集合。
其中,权重参数集合中包括与目标数据对分别对应的权重参数;系数参数集合中包括与目标数据对分别对应的系数参数。
示意性的,在沿时间序列维度对多个事件序列特征表示进行事件关联度分析时,通过解码网络,基于多个历史时刻下发生的历史事件而确定的目标数据对,确定不同目标数据对分别对应的权重参数和系数参数。
示意性的,权重参数用于调整不同目标数据对的权重比例,从而确定不同目标数据对对于发生指定事件的不同影响程度;系数参数用于指示不同目标数据对对应的调整系数。
在一个可选的实施例中,基于目标数据对所对应的影响强度参数,对目标数据对中的历史事件对指定事件的影响程度进行调整,并确定多个历史时刻下发生的历史事件对于发生指定事件的事件影响强度。
示意性的,在得到包括不同目标数据对所对应的影响强度参数的影响强度参数集合后,在沿时间序列维度对多个历史时刻下分别对应的多个历史事件进行事件关联度分析时,通过不同目标数据对所分别对应的影响强度参数,沿时间序列维度对多个历史时刻下分别对应的目标数据对进行事件关联度分析,从而确定多个历史时刻下发生的历史事件对于发生指定事件的事件影响强度。
例如:确定目标数据对1所对应的影响强度参数1,确定目标数据对2所对应的影响强度参数2,通过影响强度参数1调整目标数据对1中的历史事件对于发生指定事件的影响强度1;通过影响强度参数2调整目标数据对2中的历史事件对于发生指定事件的影响强度2等,从而综合分析调整后的影响强度,得到多个历史时刻下发生的历史事件对于发生指定事件的事件影响强度。
在一个可选的实施例中,指定事件是指定时刻下发生的事件。在沿时间序列维度对多个融合事件特征表示进行事件关联度分析时,根据指定时刻与多个历史时刻之间的时间段情况以及上述影响强度参数,确定事件影响强度。
可选地,沿时间序列维度确定指定时刻与多个历史时刻分别对应的时间段数据。
其中,指定时刻是历史时间段之后被选取的时刻。也即:指定时刻是历史时间段之后的未来某一时刻。
可选地,首先选取指定时刻,之后判断该指定时刻下发生指定事件的事件发生概率;或者,首先选取指定事件,之后确定指定事件在未来任意时刻的事件发生概率,该任意时刻即为上述指定时刻。
示意性的,在确定指定时刻后,沿时间序列维度确定指定时刻与多个历史时刻分别对应的时间段数据。例如:确定指定时刻与历史时刻1之间的时间段数据1;确定指定时刻与历史时刻2之间的时间段数据2;确定指定时刻与历史时刻3之间的时间段数据3等。
在一个可选的实施例中,对多个融合事件特征表示进行序列整合,得到与多个历史时刻分别对应的事件序列特征表示;对多个事件序列特征表示分别进行解码处理,得到影响强度参数集合。
可选地,影响强度参数集合中包括权重参数集合和系数参数集合,权重参数集合中包括与目标数据对分别对应的权重参数;系数参数集合中包括与目标数据对分别对应的系数参数。
在一个可选的实施例中,基于权重参数集合和系数参数集合,对多个时间段数据进行调整,确定与多个历史时刻分别对应的调整数据。
示意性的,采用权重参数集合中的权重参数以及系数参数集合中的系数参数,对多个时间段数据进行调整。
示意性的,目标数据对中包括历史时刻以及与该历史时刻对应的历史事件,且权重参数集合中的权重参数与目标数据对相对应,系数参数集合中的系数参数也与目标数据对相对应,因此除可以通过目标数据对确定历史时刻与指定时刻之间的时间段数据外,还可以根据目标数据对中的历史事件,从权重参数集合中确定与该历史事件和历史时刻对应的权重参数。
在一个可选的实施例中,上述权重参数集合和系数参数集合中,不仅包括与历史事件对应的权重参数和系数参数,还包括多种与历史事件相关联事件对应的权重参数和系数参数。
例如:在对多个事件序列特征表示分别进行解码处理得到影响强度参数集合时,将多个事件序列特征表示分别通过全连接层网络结构,全连接层网络结构是基于预先获取的样本事件数据集训练得到的网络结构,在通过全连接层网络结构对多个事件序列特征表示分别进行解码处理后,不仅得到历史事件对应的权重参数和系数参数,还会得到样本事件数据集中除历史事件以外的、其他样本事件所对应的权重参数和系数参数。其中,其他样本事件中存在与历史事件具有关联关系的事件,例如:历史事件A和历史事件B容易导致未来发生样本事件I;或者,历史事件A和历史事件C容易抑制样本事件R的发生等。
在一个可选的实施例中,从权重参数集合中获取与指定事件对应的指定权重参数,以及从系数参数集合中获取与指定事件对应的指定系数参数。
可选地,指定事件为与历史事件相同的事件;或者,指定事件为历史事件所可能导致的事件。
示意性的,以指定事件为与历史事件相同的事件为例进行说明,在确定指定事件后,从权重参数集合中获取与指定事件相同的历史事件对应的权重参数,将该权重参数作为与指定事件对应的指定权重参数;同理,从系数参数集合中获取与指定事件相同的历史事件对应的系数参数,将该系数参数作为与指定事件对应的指定系数参数。
示意性的,以指定事件为历史事件所可能导致的事件为例进行说明,在确定指定事件后,基于预先训练的全连接层网络结构,能够得到指定事件对应的权重参数和系数参数。则从权重参数集合中获取该指定事件对应的权重参数,将该权重参数作为与指定事件对应的指定权重参数;从系数参数集合中获取与指定事件对应的历史事件对应的系数参数,将该系数参数作为与指定事件对应的指定系数参数。
示意性的,基于指定权重参数和指定系数参数是与目标数据对对应的参数,则在获取得到与指定事件对应的指定权重参数和指定系数参数时,会获取得到相同历史事件且不同历史时刻所分别对应的指定权重参数和指定系数参数,也即:可能会获取得到多个指定权重参数和多个指定系数参数。
在一个可选的实施例中,以指定系数参数对时间段数据进行调整,得到与多个历史时刻分别对应的调整数据。
示意性的,在获取得到指定系数参数后,以指定系数参数对指定时刻与多个历史时刻之间的多个时间段数据分别进行调整,从而确定与多个时间段分别对应的时间段调整结果。
可选地,以指定权重参数对时间段调整结果进行调整,得到与多个历史时刻分别对应的调整数据。
示意性的,在获取得到与多个时间段分别对应的时间段调整结果后,以指定权重参数对多个时间段调整数据分别进行调整,从而确定与多个时间段分别对应的调整结果。
可选地,在基于多个指定权重参数和多个指定系数参数对多个时间段数据进行调整以得到调整数据时,通过相同历史时刻所对应的指定权重参数和指定系数参数对多个时间段数据进行调整,以得到该历史时刻下的调整数据;进而借助多个指定权重参数和多个指定系数参数,对对应时间段数据进行调整,从而得到不同历史时刻所对应的调整数据。
例如:在对历史时刻1对应的时间段数据1进行调整时,通过历史时刻1对应的指定权重参数和指定系数参数,对历史时刻1与指定时刻之间的时间段数据1进行调整;在对历史时刻2对应的时间段数据2进行调整时,通过历史时刻2对应的指定权重参数和指定系数参数,对历史时刻2与指定时刻之间的时间段数据2进行调整等。
在一个可选的实施例中,通过多个调整数据对多个历史时刻下分别对应的多个历史事件进行事件关联度分析。
示意性的,将相同历史事件下,不同历史时刻分别对应的多个调整数据相加后,确定调整数据和,通过调整数据和对多个历史时刻下分别对应的多个历史事件进行事件关联度分析。
值得注意的是,以上仅为示意性的举例,本申请实施例对此不加以限定。
综上所述,对根据多个历史事件之间的事件影响关系确定事件影响强度的内容进行了说明。在得到多个融合事件特征表示后,对多个融合事件特征表示进行序列分析,确定多个历史时刻下,多个融合事件特征表示之间的事件影响关系,并基于事件影响关系对多个融合事件特征表示进行序列整合,得到与多个历史时刻分别对应的事件序列特征表示,从而在沿时间序列维度对多个事件序列特征表示进行事件关联度分析时,借助蕴含了同一历史时刻下历史事件的并列关系,也蕴含了不同历史时刻间的时序因果关系的事件序列特征表示,更准确地得到多个历史时刻下发生的历史事件对于发生指定事件的事件影响强度,以便于提高事件发生概率的预测准确率。
在一个可选的实施例中,在基于事件影响强度确定发生指定事件的事件发生概率时,除分析多个历史事件间的事件影响强度外,还考虑多个历史事件所各自对应的基本事件强度,即:综合分析事件影响强度和基本事件强度,从而确定发生指定事件的事件发生概率。示意性的,如图4所示,上述图2所示出的实施例中的步骤250还可以实现为如下步骤410至440。
步骤410,获取多个历史时刻下多个历史事件对应的基本事件数据。
其中,基本事件数据用于指示历史事件的背景信息。
示意性的,背景信息包括与历史事件不存在必然关联关系的多种基本信息。例如:当历史事件实现为确诊疾病时,与该历史事件对应的基本事件数据包括病人的年龄、性别、居住环境等;或者,当历史事件实现为自然灾难时,与该历史事件对应的基本事件数据包括自然灾害发生的季节、自然灾害的强度等级、自然灾害的损坏程度等。
步骤420,对基本事件数据进行特征提取,得到与基本事件数据对应的基本事件特征表示。
示意性的,对上述基本事件数据进行特征提取,得到与基本事件数据对应的基本事件特征表示。例如:对多种类型的基本事件数据分别进行特征提取后,将多个特征提取结果进行融合,得到与基本事件数据对应的基本事件特征表示。
可选地,以序列形式表示与基本事件数据对应的基本事件特征表示。
步骤430,采用预设参数对基本事件特征表示进行调整,得到基本事件强度。
示意性的,在对基本事件特征表示进行调整时,采用预先设定的预设参数,对基本事件特征表示进行调整。如下公式所示,为对基本事件特征表示进行调整后得到基本事件强度的公式表示。
μv(f)=ftan(ftanh(IseqW1+b1)*W2+b2)
ftanh(x)=tanh(x)
其中,μv(f)用于指示发生历史事件v的基本事件强度;Iseq用于指示基本事件特征表示;W1、b1、W2、b2用于指示预先设定的预设参数;tanh用于指示双曲正切函数。基本事件强度μv(f)用于捕获基于背景信息的事件平均发生强度。可选地,基本事件强度μv(f)是通过一个两层全连接网络计算得到的。基于上述基本事件强度的计算公式,确定不同历史事件所对应的基本事件强度。
步骤440,基于基本事件强度和事件影响强度,得到发生指定事件的事件发生概率。
示意性的,事件影响强度用于描述历史时间段内的多个历史时刻发生的历史事件对未来指定时刻发生事件v的影响强度。
可选地,将事件影响强度定义为各个历史时刻发生历史事件的子影响强度的总和,相关公式如下:
其中,用于指示历史时刻下发生历史事件的目标数据对的集合,/>/>ti用于指示第i个历史时刻;Vi用于指示第i个历史时刻发生的历史事件;用于指示事件影响强度;t用于指示指定时刻,且t>ti;/>用于指示第i个历史时刻下发生指定事件v的参数。
在一个可选的实施例中,基于基本事件强度和事件影响强度之和,获取得到事件发生强度。示意性的,在确定基本事件强度以及事件影响强度后,将基本事件强度与事件影响强度相加后获取得到事件发生强度。可选地,将事件发生强度输入激活函数,得到发生目标事件的事件发生概率。
如下公式所示,为事件发生强度的计算公式。
λv(t)=fReLu(μv+gv)
fReLu(x)=max(x,0)
其中,λv(t)用于指示在指定时刻t下发生指定事件v的事件发生强度;μv用于指示指定事件v的基本事件强度;gv用于指示指定事件v的事件影响强度;fReLu(x)用于指示激活函数ReLu;max用于指示最大值函数。
基于上述激活函数,将事件发生强度转化为概率形式,使得对事件发生强度进行转换后的事件发生概率位于0至1之间。
可选地,选择不同的指定事件v会得到对应的事件发生概率,从而根据事件发生概率能够辅助确定所选取的不同指定事件是否会发生,进而有利于进行提前的预防准备,尽可能地避免指定事件的发生。
综上所述,对综合分析事件影响强度和基本事件强度,从而确定发生指定事件的事件发生概率进行了说明。获取多个历史时刻下多个历史事件对应的基本事件数据,并得到与基本事件数据对应的及基本事件特征表示;采用预设参数对基本事件特征表示进行调整,得到基本事件强度,并基于基本事件强度和事件影响强度,得到发生指定事件的事件发生概率。也即:在考虑历史事件之间的***时,也会考虑与发生历史事件相关联的基本信息,从而降低历史事件之间发生的偶然性,更加全面地对历史事件的发生状况进行分析,也有助于提高事件发生概率的预估准确性。
在一个可选的实施例中,以上述事件预估方法应用于生命状态预估场景(如:疾病预估场景)为例进行说明。示意性的,如图5所示,上述图2所示出的实施例还可以实现为如下步骤510至步骤550。
步骤510,获取历史时间段内生成的多个目标数据对。
示意性的,历史时间段用于指示过去的时间段。其中,目标数据对中包括历史时刻与历史生命状态之间的对应关系,例如:获取得到的目标数据对中包括历史时刻与历史疾病之间的对应关系。历史时刻用于指示历史时间段中的时刻;历史事件用于指示在历史时间段内发生的事件。示意性的,历史时刻与历史事件之间的对应关系用于指示在历史时刻发生对应的历史事件,也即:目标数据对用于指示在历史时刻检测到历史疾病。
在一个可选的实施例中,将历史时间段内生成的多个目标数据对输入事件预估模型;通过事件预估模型对目标数据对进行数据对分析,获取事件预估模型输出的事件发生概率。其中,事件预估模型为预先训练得到的预估模型。数据对分析包括上述特征提取过程、特征融合处理过程等分析过程。示意性的,如图6所示,为事件预估模型的模型结构示意图。将t1-tfinal作为历史时间段,在获取历史时间段内生成的多个目标数据对时,获取不同历史时刻对应的目标数据对。例如:获取不同历史时刻分别对应的历史数据历史数据表示历史时刻与历史事件之间的对应关系。
示意性的,如图6所示,将不同历史时刻分别对应的历史数据通过历史信息输出层610输入至事件预估模型中。在历史时刻t1下的历史数据表示为{t1,V1},包括目标数据对V11、V12、V13、V14等,其中V11用于指示在历史时刻t1下发生历史事件1的情况;V12用于指示在历史时刻t1下发生历史事件2的情况等。
可选地,在历史时刻t1下的历史数据表示为{t1,V1},其中V1的取值表示历史事件发生的情况,例如:预先确定的样本事件数据集中包括100种存在顺序编码的事件,若V1=[5,9,25],则代表在历史时刻t1下确定发生了样本事件5、样本事件9以及样本事件25。在将历史数据通过历史信息输出层610输入至事件预估模型时,为充分考虑事件与历史时刻的对应情况,分析历史时刻t1与发生各个事件的对应关系,即:将目标数据对V11、V12、V13、V14等通过历史信息输出层610输入至事件预估模型中。
步骤520,对目标数据对进行特征提取,得到目标数据对所对应的数据特征表示。
示意性的,在得到代表历史时刻与历史疾病之间对应关系的目标数据对后,可以确定多个历史时刻下分别对应的目标数据对。其中,多个历史时刻中每个历史时刻对应至少一个目标数据对。
在对目标数据对进行特征提取时,对多个历史时刻下的目标数据对分别进行特征提取,从而可以得到每个目标数据对所对应的数据特征表示。
示意性的,将目标数据对输入至特征提取网络,从而输出得到与目标数据对对应的数据特征表示;或者,将目标数据对投射到向量空间,从而得到与目标数据对对应的数据特征表示等。
示意性的,如图6所示,将目标数据对输入至嵌入层620中,嵌入层620负责将离散的标记转换为连续型的嵌入表示。也即:嵌入层620负责对离散的目标数据对进行特征提取,以得到目标数据对所对应的数据特征表示。
例如:对目标数据对V11进行特征提取,得到目标数据对V11所对应的数据特征表示e11;对目标数据对V12进行特征提取,得到目标数据对V12所对应的数据特征表示e12;对目标数据对V13进行特征提取,得到目标数据对V13所对应的数据特征表示e13;对目标数据对V14进行特征提取,得到目标数据对V14所对应的数据特征表示e14等。
步骤530,对对应相同历史时刻的数据特征表示进行特征融合处理,得到与多个历史时刻分别对应的融合数据特征表示。
示意性的,在对多个时刻下的若干目标数据对进行特征提取得到数据特征表示后,以历史时刻为特征融合度量,在多个历史时刻中每个历史时刻下的数据特征表示进行特征融合处理,即:将每个历史时刻下的数据特征表示进行特征融合。
可选地,在对相同历史时刻的数据特征表示进行特征融合处理时,采用特征拼接方法作为特征融合的方法,将相同历史时刻下的数据特征表示进行特征拼接,从而得到对应历史时刻下的融合数据特征表示;或者,在对相同历史时刻的数据特征表示进行特征融合处理时,采用并行策略方法作为特征融合的方法,将相同历史时刻下的数据特征表示组合成复合向量,将组合得到的复合向量作为对应历史时刻下的融合数据特征表示等。
示意性的,由于历史时刻下的历史事件存在两种层次结构,分别为:同一历史时刻下历史事件之间的并列关系;以及,不同历史时刻之间的时序因果关系,因此在构建事件预估模型时构建了两个网络结构层,如图6所示,分别为编码层630和转换层640,并使用两个不同的多头自注意力网络结构提取不同的特征表示。其中,多头自注意力网络结构通过对每个数据特征表示分别赋以注意力权重,从而在处理序列输入时拥有良好的性能。
编码层630包含一个多头自注意力层和一个最大池化层。其中,多头自注意力层负责分别编码每个历史时刻下发生的历史事件,例如:多头自注意力层负责分别编码每次看病时所有被诊断的疾病;其中,最大池化层负责将每个历史时刻下的数据特征表示进行特征融合处理,例如:最大池化层负责将每次看病中的平行的多个诊断疾病的数据特征表示编码为一个整体表示。
转换层640中的多头自注意力层负责综合处理多个历史时刻分别对应的融合数据特征表示。例如:转换层640中的多头自注意力层负责综合处理病人的全部历史确诊疾病以及历史时刻,并将计算得到的隐藏特征传入解码层650。同时,由于原自注意力机制中的位置嵌入是离散的,因此将其改为了连续性的时域嵌入,转换层640中的相关公式如下所示。
其中,k的取值为0到dModel/2-1;αk与呈正比;/>是编码层630的第i个输出;dModel是编码层630的第i个输出的维度,xi是第i个历史时刻对应的完整编码,即:第i个历史时刻对应的融合数据特征表示。
基于上述过程,得到不同历史时刻分别对应的融合数据特征表示。示意性的,如图6所示,将历史时刻t1下的数据特征表示e11、数据特征表示e12、数据特征表示e13以及数据特征表示e14等数据特征表示进行特征融合处理,并考虑历史事件和历史时刻的双重信息,得到与历史时刻t1对应的融合数据特征表示x1。例如:融合数据特征表示x1表示历史疾病与历史时刻之间的关系,则融合数据特征表示x1为历史疾病对应的完整编码,包含了疾病和时域双重信息。
步骤540,沿时间序列维度对多个融合数据特征表示进行疾病关联度分析,确定多个历史时刻下检测到的历史生命状态对于检测到指定生命状态的状态影响强度。
示意性的,多个融合数据特征表示与多个历史时刻分别对应,多个历史时刻在时间序列维度上依次分布。例如:历史时刻1位于历史时刻2和历史时刻3之前,历史时刻2位于历史时刻3之前,且历史时刻1、历史时刻2以及历史时刻3在时间序列维度上等间距依次分布。
其中,指定生命状态是待进行预估的、且在历史时间段之后存在的生命状态,指定生命状态与历史时间段内发生的历史生命状态存在伴随关联关系。
可选地,以历史生命状态实现为历史疾病、指定生命状态实现为指定疾病为例进行说明。其中,指定疾病是待进行预估的、且在历史时间段之后发生的疾病,指定疾病与历史时间段内发生的历史疾病存在伴随关联关系。
示意性的,伴随关联关系用于指示历史疾病对于指定疾病的事件影响情况。可选地,伴随关联关系包括在历史时刻发生的历史疾病可能会导致在未来发生指定疾病的因果关联关系;或者,伴随关联关系包括在历史时刻发生的历史疾病可能会导致在未来重复发生某个历史疾病的关联关系,即:指定疾病包括重复发生的历史疾病等。
可选地,在进行疾病关联度分析前,预先确定指定疾病,且该指定疾病与历史疾病之间存在伴随关联关系。例如:将多个历史疾病所可能引发的并发症组成一个并发症集合,从并发症集合中选择至少一个并发症作为指定疾病,从而确定未来是否可能确诊并发症。或者,随机确定一个疾病作为指定疾病,在沿时间序列维度对多个融合数据特征表示进行疾病关联度分析,确定多个历史时刻下检测到的历史疾病对于检测到指定疾病的疾病影响强度。
示意性的,如图6所示,在得到多个历史时刻分别对应的融合数据特征表示后,将多个融合数据特征表示输入解码层650,对多个融合数据特征表示进行疾病关联度分析。示意性的,将多个融合数据特征表示通过解码层650中的全连接层,通过其中的两个全连接层分别将多个融合数据特征解码为计算疾病影响强度时需要用到的权重参数集合以及系数参数集合,权重参数集合Ωi以及系数参数集合Bi如下所示。
Ωi={ωij}j∈[1,|E|]
Bi={βij}j∈[1,|E|]
其中,|E|用于指示历史事件的种类数量(例如:历史疾病的种类数量);i用于指示历史时刻;j用于指示历史事件;ωij用于指示与目标数据对对应的权重参数;βij用于指示与目标数据对对应的权重参数。
可选地,在计算权重参数集合Ωi时,当对应的激活函数选择为tanh函数时,以此可以达到模型同时捕获疾病间激励和抑制的效果。在得到上述权重参数集合Ωi以及系数参数集合Bi后,采用上述事件影响强度的计算公式,即可计算得到每个疾病的在t时刻的状态影响强度
步骤550,基于状态影响强度确定发生指定疾病的状态发生概率。
示意性的,将状态影响强度输入ReLU函数中,从而确定发生指定生命状态的状态发生概率;或者,将状态影响强度输入Sigmoid函数中,从而得到状态发生概率等。
在一个可选的实施例中,确定获取多个历史时刻下多个历史疾病对应的基本生命状态数据。可选地,以生命状态实现为疾病为例进行说明。示意性的,对A病人在未来指定时刻患有指定疾病M的概率进行预测,将A病人的年龄、性别、工作环境等数据作为基本疾病数据。示意性的,该基本疾病数据与疾病的种类的关联度较小。
可选地,对基本疾病数据进行特征提取,得到与基本疾病数据对应的基本疾病特征表示;采用预设参数对基本疾病特征表示进行调整得到基本疾病强度。
在一个可选的实施例中,采用上述事件影响强度的计算公式,对疾病影响强度进行确定,并采用上述事件发生强度的计算公式,得到发生指定疾病M的事件发生概率。
示意性的,如图6所示,通过输出层660的疾病发生概率的计算公式,综合序列信息输入层输入的基本疾病强度以及解码层650输出的疾病影响强度,确定并输出疾病发生概率。
λv(t)=f+(μv(Iseq)+gv(Ht,t))
示意性的,当基于公式确定A病人未来患有指定疾病M的概率为0.65,则代表A病人未来患有指定疾病M的概率较大,A病人可以基于该事件发生概率的概率预测结果,采用锻炼、服用药物等方式,既可能避免未来患上指定疾病M的概率。此外,事件发生概率也可以辅助医生对病人进行更全面的了解,也有助于医生为病人提供更有针对性的治疗手段、预防措施等。
在一个可选的实施例中,采用预先训练的事件预估模型进行上述事件预估方法。其中,事件预估模型的训练过程如下所示。
示意性的,采用预先选择的样本事件数据集(如:样本疾病数据集)对事件预估模型进行训练,在训练过程中,通过损失函数对事件预估模型进行优化过程。
可选地,使用多元多标签负对数似然函数作为损失函数。此外,考虑到在多标签任务中,一个疾病的发生有可能促进另一个疾病的发生,而不是单一的抑制关系,假设EHR中的疾病间不存在竞争风险,则损失函数如下所示。
其中,N用于指示每次投入事件预估模型中进行训练的样本事件(如:样本疾病)的数量;K用于指示样本事件的类别数;用于指示病人下一次就诊,患病疾病为v,且就诊时间为t的联合概率。
示意性的,上述联合概率由发生强度λ计算得到,计算公式如下所示。
其中,生存函数即Sv(t),表示最后一次就诊时间ti到下一次就诊的t时刻之间,患病但没有就诊的概率。
可选地,如图6所示,在通过上述损失函数确定损失值670后,通过梯度下降法优化事件预估模型的网络参数,从而得到训练完毕的事件预估模型。
在一个可选的实施例中,以事件预估模型完成上述事件预估方法为例进行说明,对将事件预估模型应用于医疗疾病预测领域的情况进行介绍,在得到事件预估模型后,事件预估模型既可以用于预测患者未来的疾病发展情况,也可以用于探索疾病间的发展规律。
示意性的,将待预测患者的基本信息和历史患病情况输入模型后,再指定待预测的指定时刻,模型即可输出每个疾病在该指定时刻的患病概率,从而达到预测的目的。如图7所示,若连续预测多个指定时刻下的患病概率,即可连接成图,显示患者每个疾病随时间变化的连续性患病概率。
可选地,为展示多种对比性或可解释性结果,以两个EHR数据集做实验,其中Synthea(Ear Infection)为小型模拟数据集,而MIMIC IV为较大型真实数据集,由贝斯以色列女执事医疗中心提供。两个数据集的基本统计信息如下表1所示。
表1
示意性的,采用如下两个实验对事件预估模型的性能进行分析。
(一)疾病潜在发展趋势
MIMIC IV数据集以ICD 9编码方法对疾病进行编码,为分析事件预估模型对疾病潜在发展趋势预测的能力,以下述选择的5个疾病为例,分别为原发性高血压以及它的4种常见并发症、糖尿病合并肾脏表现、心力衰竭、各类心脏相关疾病以及慢性肾病。表2为指定病人的EHR的看病记录,其中空格部分表示未确诊对应疾病。
表2
在将病人的历史数据以及待预测的指定时刻输入事件预估模型后,事件预估模型将计算所有疾病的疾病影响强度(事件影响强度),并输出基于疾病影响强度确定发生指定疾病的疾病发生概率。可选地,当选取多个时刻作为指定时刻,通过预测多个指定时刻上的疾病影响强度,如图7所示,最终可绘制疾病发生概率随时间变化的图。图7用于指示该病人的指定疾病的疾病发生概率随时间变化的示意图。图中横坐标上的圆点分别对应病人每次看病的时间,纵坐标表示指定疾病的疾病发生概率,即:瞬时发生概率。其中,纵坐标越高,则代表该指定疾病在该指定时刻有更大的概率发生。
从图7可以看到,原发性高血压710和糖尿病合并肾脏表示720的疾病发生概率是随时间变化的,且一直维持在一个较高水平,但其余并发症并未表现有患病风险。与传统推荐算法直接输出单一的患病概率相比,基于时序点过程的事件预估模型可以动态输出疾病发生概率随时间的变化趋势图,能够更好地进行疾病预测。
(二)疾病关系图
多头自注意力通过内部权重,为序列化的输入赋予不同的权重,从而综合提取对应的特征表示。通过提取并统计样本事件数据集中所有样本事件输入注意力层时的权重,可以用于分析疾病间的潜在关系,大概性地解释模型部分原理。如图8所示,为根据解码层内部权重绘制的注意力网络,如图9所示,为根据转换层内部权重绘制的注意力网络。其中,权重小于0.5和0.3的边,和没有边连接的节点被省略。
将图8和图9对比可以发现,位于不同两层的多头自注意力层捕获的特征并不相同。概括而言,在解码层的自注意力层倾向于帮助模型更好地明确病人每个确诊疾病的状况,而在转换层的自注意力层更倾向于学习疾病间的时域因果关系,以帮助模型更好地拟合强度函数。
如图8所示,为解码层的注意力网络。其中的节点越大、颜色越深,则表示疾病的度越大。例如:节点810比节点820的节点更大、颜色更深,则代表节点810所对应的疾病的度越大。其中节点之间的边越粗、颜色越深,则表示疾病间的平均注意力越大。
如图9所示,为转换层的注意力网络。其中的节点越大、颜色越深,则表示疾病的度越大。例如:节点910比节点920的节点更大、颜色更深,则代表节点910所对应的疾病的度越大。其中节点之间的边越粗、颜色越深,则表示疾病间的平均注意力越大。
值得注意的是,上述图8和图9仅为示意性的举例,其中图8所示出的解码层以及图9所示出的转换层,仅为注意力网络的局部内容,本申请实施例对此不加以限定。在一个可选的实施例中,将本申请实施例提供的事件预估方法与其他预估方法进行比较,将其他预估方法作为基准方法。
示意性的,以4篇论文中的预估模型为基准模型,其中包括循环标记的时间点过程(Recurrent marked temporal point processes,RMTPP)模型;条件泊松(ConditionalPoisson)模型;日志规范混合(LogNorm Mix)模型;神经时间点过程(Neural temporalpoint processes,Neural TPP)模型。
可选地,将应用本申请实施例提供的事件预估方法的事件预估模型与上述四种基准模型进行对比实验,实验结果如下表3所示。
表3
如上表3所示,本申请实施例提供的事件预估模型超越了其它基准模型,预测性能在两个数据集上均较为优异。
值得注意的是,以上仅为示意性的举例,本申请实施例对此不加以限定。
在一个可选的实施例中,将上述事件预估模型应用至疾病辅助诊断场景中,由于事件预估模型无需病人的当前身体指标、症状等信息,只需要将病人的基本统计学信息和历史患病记录作为事件预估模型的输入,因此可以作为看病诊断时的一个辅助工具,或用于病人全科预诊阶段。
在一个可选的实施例中,对上述事件预估模型的技术侧总流程进行说明。如图10所示,与大多数神经点过程的网络及结构相同,事件预估模型参数化建模事件的强度函数,再使用神经网络计算模型中的参数。
步骤1010:数学化定义强度函数。
示意性的,预先定义求解事件发生概率过程中的强度函数,如:上述的事件影响强度的计算公式;上述的基本事件强度μv(f)的计算公式;上述的事件发生强度λv(t)的计算公式等。
步骤1020:利用神经网络求取强度函数中的参数。
示意性的,求解上述权重参数以及系数参数,并将若干个权重参数组成权重参数集合;将若干个系数参数组成系数参数集合。
步骤1030:计算损失函数,训练优化事件预估模型。
示意性的,采用上述生存损失函数,确定训练事件预估模型的过程中的损失值,并利用损失值训练优化事件预估模型。
步骤1040:将事件预估模型投入应用,预测患者未来的疾病。
示意性的,如图11所示,医生对病人进行主要诊断分析;训练得到的事件预估模型1110根据该病人的基本信息,对从EHR数据库中获取的、与该病人相关的基本统计学信息和历史患病记录(如:历史时刻和对应的历史疾病)进行辅助诊断分析。可选地,医生基于主要诊断分析的主要分析结果以及辅助诊断分析的辅助诊断结果,得到最终诊断结果,从而便利地在医疗领域进行应用。
在一个可选的实施例中,将上述事件预估模型应用至辅助体检和护理场景中,由于上述事件预估模型可以动态预测各种疾病未来随时间的变化趋势,且简单易用、无需复杂信息输入。示意性的,针对病人的基本统计学信息和历史患病记录,事件预估模型可以给出指定时刻的易感疾病列表,从而可以针对性地制定病人护理计划或体检项目。
步骤1050:借助事件预估模型进行可视化实验,分析疾病的内在规律。
示意性的,如图12所示,使用对象将性别、年龄、地域、HER看病记录等作为输入信息1210输入至事件预估模型1220,通过事件预估模型1220预测该使用对象的易感疾病列表1230,如:易感疾病列表1230中包括肺炎、肺癌、白内障、煤炭工尘肺等,从而有效节省经济与时间成本,并提高护理和体检效果,避开护理盲区。
值得注意的是,以上仅为示意性的举例,本申请实施例对此不加以限定。
综上所述,在医疗场景下,可以采用事件预估模型预测使用对象未来易患得的疾病。此外,上述事件预估模型无需以当前身体指标作为特征,只需输入使用对象在历史时刻所患有的历史疾病,即能够良好地预测使用对象未来易患的疾病,因此该方法可以灵活应用于体检前、就诊前、设计护理方案时等多种医疗时间下,能够有效降低医护的人力成本以及检测成本,提高疾病诊断效率。对于使用对象,若将事件预估模型应用于终端上,则也有助于使用对象通过输入自己的基本信息和历史疾病,得到自己的易患疾病,从而有利于使用对象根据疾病易患列表,更有针对性地预约体检项目,并且事件预估模型还可以列出用户疾病高危发病的日期(指定时刻),提醒使用对象及时检查;对于护理人员,也可以通过输入病人的相关信息的方式,输出未来可能发展的疾病,以便于根据结果更有针对地设计个性化护理方案,提高护理方案的科学性和有效性。
图13是本申请一个示例性实施例提供的事件预估装置的结构框图,如图13所示,该装置包括如下部分:
获取模块1310,用于获取历史时间段内生成的多个目标数据对,所述目标数据对中包括历史时刻与历史事件之间的对应关系,所述目标数据对用于指示在所述历史时刻发生的历史事件;
提取模块1320,用于对所述目标数据对进行特征提取,得到所述目标数据对所对应的事件特征表示;
融合模块1330,用于对对应相同历史时刻的所述事件特征表示进行特征融合处理,得到与多个历史时刻分别对应的融合事件特征表示;
分析模块1340,用于沿时间序列维度对多个融合事件特征表示进行事件关联度分析,确定所述多个历史时刻下发生的历史事件对于发生指定事件的事件影响强度,所述指定事件是待进行预估在所述历史时间段之后发生的事件,所述指定事件与所述历史时间段内发生的历史事件存在伴随关联关系;
确定模块1350,用于基于所述事件影响强度确定发生所述指定事件的事件发生概率。
在一个可选的实施例中,所述分析模块1340还用于对所述多个融合事件特征表示进行序列分析,确定所述多个历史时刻下,所述多个融合事件特征表示之间的事件影响关系,所述事件影响关系用于指示所述目标数据对中不同历史事件之间的相互影响情况;基于所述事件影响关系对所述多个融合事件特征表示进行序列整合,得到与所述多个历史时刻分别对应的事件序列特征表示,所述事件序列特征表示中蕴含所述事件影响关系;沿所述时间序列维度对多个事件序列特征表示进行事件关联度分析,确定所述多个历史时刻下发生的历史事件对于发生所述指定事件的所述事件影响强度。
在一个可选的实施例中,所述分析模块1340还用于沿所述时间序列维度对所述多个事件序列特征表示分别进行解码处理,得到影响强度参数集合,所述影响强度参数集合中包括与所述目标数据对对应的影响强度参数,所述影响强度参数用于调整所述目标数据对对所述指定事件的影响程度;基于所述目标数据对所对应的影响强度参数,对所述目标数据对中的历史事件对所述指定事件的影响程度进行调整,并确定所述多个历史时刻下发生的历史事件对于发生所述指定事件的所述事件影响强度。
在一个可选的实施例中,所述指定事件是指定时刻下发生的事件;
所述分析模块1340还用于沿所述时间序列维度确定所述指定时刻与所述多个历史时刻分别对应的时间段数据,所述指定时刻是所述历史时间段之后被选取的时刻;对所述多个融合事件特征表示进行序列整合,得到与所述多个历史时刻分别对应的事件序列特征表示,所述事件序列特征表示中蕴含所述多个融合事件特征表示之间的事件影响关系;对所述多个事件序列特征表示分别进行解码处理,得到影响强度参数集合,所述影响强度参数集合包括权重参数集合和系数参数集合,所述权重参数集合中包括与所述目标数据对分别对应的权重参数;所述系数参数集合中包括与所述目标数据对分别对应的系数参数;基于所述多个时刻分别对应的权重参数集合和所述系数参数集合,对多个时间段数据进行调整,确定与所述多个历史时刻分别对应的调整数据;通过多个调整数据对所述多个历史时刻下分别对应的多个历史事件进行事件关联度分析。
在一个可选的实施例中,所述分析模块1340还用于从所述权重参数集合中获取与所述目标指定事件对应的目标指定权重参数,以及从所述系数参数集合中获取与所述目标指定事件对应的目标指定系数参数;以所述多个时刻分别对应的目标指定系数参数对与所述指定系数参数对应的所述多个时间段数据进行调整,确定时间段调整结果;以所述指定权重参数对所述时间段调整结果进行调整,得到与所述多个历史时刻分别对应的调整数据。
在一个可选的实施例中,所述分析模块1340还用于获取所述多个历史时刻中每个历史时刻下发生的历史分析事件对于所述指定时刻下发生目标事件的事件子影响强度;将多个事件子影响强度进行求和运算,得到发生所述目标指定事件的所述事件影响强度。
在一个可选的实施例中,所述确定模块1350还用于获取所述多个历史时刻下多个历史事件对应的基本事件数据,所述基本事件数据用于指示所述历史事件的背景信息;对所述基本事件数据进行特征提取,得到与所述基本事件数据对应的基本事件特征表示;采用预设参数对所述基本事件特征表示进行调整,得到基本事件强度;基于所述基本事件强度和所述事件影响强度,得到发生所述目标事件的所述事件发生概率。
在一个可选的实施例中,所述确定模块1350还用于基于所述基本事件强度和所述事件影响强度之和,获取得到事件发生强度;将所述事件发生强度输入激活函数,得到发生所述目标事件的所述事件发生概率。
在一个可选的实施例中,所述获取模块1310还用于确定所述历史时间段中所述多个历史时刻分别对应的至少一个历史事件;将所述多个历史时刻中的每个历史时刻与对应的至少一个历史事件组成至少一个目标数据对,得到所述多个历史时刻分别对应的目标数据对。
在一个可选的实施例中,所述装置还用于将所述历史时间段内生成的多个目标数据对输入事件预估模型,所述事件预估模型为预先训练得到的预估模型;通过所述事件预估模型对所述目标数据对进行数据对分析,获取所述事件预估模型输出的所述事件发生概率。
图14是本申请一个示例性实施例提供的事件预估装置的结构框图,如图14所示,该装置包括如下部分:
获取模块1410,用于获取历史时间段内生成的多个目标数据对,所述目标数据对中包括历史时刻与历史生命状态之间的对应关系,所述目标数据对用于指示在所述历史时刻检测到的历史生命状态;
提取模块1420,用于对所述目标数据对进行特征提取,得到所述目标数据对所对应的数据特征表示;
融合模块1430,用于对对应相同历史时刻下的所述数据特征表示进行特征融合处理,得到与所述多个历史时刻分别对应的融合数据特征表示;
分析模块1440,用于沿时间序列维度对多个融合数据特征表示进行生命状态关联度分析,确定所述多个历史时刻下检测到的历史生命状态对于检测到指定生命状态的状态影响强度,所述指定生命状态是待进行预估在所述历史时间段之后存在的生命状态,所述指定生命状态与所述历史时间段内发生的历史生命状态存在伴随关联关系;
确定模块1450,用于概率基于所述状态影响强度确定检测到所述指定生命状态的状态发生概率。
需要说明的是:上述实施例提供的事件预估装置,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的事件预估装置与事件预估方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图15示出了本申请一个示例性实施例提供的服务器的结构示意图。该服务器1500包括中央处理单元(Central Processing Unit,CPU)1501、包括随机存取存储器(RandomAccess Memory,RAM)1502和只读存储器(Read Only Memory,ROM)1503的***存储器1504,以及连接***存储器1504和中央处理单元1501的***总线1505。服务器1500还包括用于存储操作***1513、应用程序1514和其他程序模块1515的大容量存储设备1506。
大容量存储设备1506通过连接到***总线1505的大容量存储控制器(未示出)连接到中央处理单元1501。大容量存储设备1506及其相关联的计算机可读介质为服务器1500提供非易失性存储。也就是说,大容量存储设备1506可以包括诸如硬盘或者紧凑型光盘只读存储器(Compact Disc Read Only Memory,CD-ROM)驱动器之类的计算机可读介质(未示出)。
不失一般性,计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。上述的***存储器1504和大容量存储设备1506可以统称为存储器。
根据本申请的各种实施例,服务器1500还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即服务器1500可以通过连接在***总线1505上的网络接口单元1511连接到网络1512,或者说,也可以使用网络接口单元1511来连接到其他类型的网络或远程计算机***(未示出)。
上述存储器还包括一个或者一个以上的程序,一个或者一个以上程序存储于存储器中,被配置由CPU执行。
本申请的实施例还提供了一种计算机设备,该计算机设备包括处理器和存储器,该存储器中存储有至少一条指令、至少一段程序、代码集或指令集,至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现上述各方法实施例提供的事件预估方法。
本申请的实施例还提供了一种计算机可读存储介质,该计算机可读存储介质上存储有至少一条指令、至少一段程序、代码集或指令集,至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行,以实现上述各方法实施例提供的事件预估方法。
本申请的实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述实施例中任一所述的事件预估方法。
以上所述仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (15)
1.一种事件预估方法,其特征在于,所述方法包括:
获取历史时间段内生成的多个目标数据对,所述目标数据对中包括历史时刻与历史事件之间的对应关系,所述目标数据对用于指示在所述历史时刻发生的历史事件;
对所述目标数据对进行特征提取,得到所述目标数据对所对应的事件特征表示;
对对应相同历史时刻的所述事件特征表示进行特征融合处理,得到与多个历史时刻分别对应的融合事件特征表示;
沿时间序列维度对多个融合事件特征表示进行事件关联度分析,确定所述多个历史时刻下发生的历史事件对于发生指定事件的事件影响强度,所述指定事件是待进行预估在所述历史时间段之后发生的事件,所述指定事件与所述历史时间段内发生的历史事件存在伴随关联关系;
基于所述事件影响强度确定发生所述指定事件的事件发生概率。
2.根据权利要求1所述的方法,其特征在于,所述沿时间序列维度对多个融合事件特征表示进行事件关联度分析,确定所述多个历史时刻下发生的历史事件对于发生指定事件的事件影响强度,包括:
对所述多个融合事件特征表示进行序列分析,确定所述多个历史时刻下,所述多个融合事件特征表示之间的事件影响关系,所述事件影响关系用于指示所述目标数据对中不同历史事件之间的相互影响情况;
基于所述事件影响关系对所述多个融合事件特征表示进行序列整合,得到与所述多个历史时刻分别对应的事件序列特征表示,所述事件序列特征表示中蕴含所述事件影响关系;
沿所述时间序列维度对多个事件序列特征表示进行事件关联度分析,确定所述多个历史时刻下发生的历史事件对于发生所述指定事件的所述事件影响强度。
3.根据权利要求2所述的方法,其特征在于,所述沿所述时间序列维度对多个事件序列特征表示进行事件关联度分析,确定所述多个历史时刻下发生的历史事件对于发生所述指定事件的所述事件影响强度,包括:
沿所述时间序列维度对所述多个事件序列特征表示分别进行解码处理,得到影响强度参数集合,所述影响强度参数集合中包括与所述目标数据对对应的影响强度参数,所述影响强度参数用于调整所述目标数据对对所述指定事件的影响程度;
基于所述目标数据对所对应的影响强度参数,对所述目标数据对中的历史事件对所述指定事件的影响程度进行调整,并确定所述多个历史时刻下发生的历史事件对于发生所述指定事件的所述事件影响强度。
4.根据权利要求1至3任一所述的方法,其特征在于,所述指定事件是指定时刻下发生的事件;
所述沿时间序列维度对多个融合事件特征表示进行事件关联度分析,包括:
沿所述时间序列维度确定所述指定时刻与所述多个历史时刻分别对应的时间段数据,所述指定时刻是所述历史时间段之后被选取的时刻;
对所述多个融合事件特征表示进行序列整合,得到与所述多个历史时刻分别对应的事件序列特征表示,所述事件序列特征表示中蕴含所述多个融合事件特征表示之间的事件影响关系;
对所述多个事件序列特征表示分别进行解码处理,得到影响强度参数集合,所述影响强度参数集合包括权重参数集合和系数参数集合,所述权重参数集合中包括与所述目标数据对分别对应的权重参数;所述系数参数集合中包括与所述目标数据对分别对应的系数参数;
基于所述权重参数集合和所述系数参数集合,对多个时间段数据进行调整,确定与所述多个历史时刻分别对应的调整数据;
通过多个调整数据对所述多个历史时刻下分别对应的多个历史事件进行事件关联度分析。
5.根据权利要求4所述的方法,其特征在于,所述基于所述权重参数集合和所述系数参数集合,对多个时间段数据进行调整,确定与所述多个历史时刻分别对应的调整数据,包括:
从所述权重参数集合中获取与所述指定事件对应的指定权重参数,以及从所述系数参数集合中获取与所述指定事件对应的指定系数参数;
以所述指定系数参数对与所述指定系数参数对应的时间段数据进行调整,确定时间段调整结果;
以所述指定权重参数对所述时间段调整结果进行调整,得到与所述多个历史时刻分别对应的调整数据。
6.根据权利要求1至3任一所述的方法,其特征在于,所述确定所述多个历史时刻下发生的历史事件对于发生指定事件的事件影响强度,包括:
获取所述多个历史时刻中每个历史时刻下发生的历史事件对于发生目标事件的事件子影响强度;
将多个事件子影响强度进行求和运算,得到发生所述指定事件的所述事件影响强度。
7.根据权利要求1至3任一所述的方法,其特征在于,所述基于所述事件影响强度确定发生所述指定事件的事件发生概率,包括:
获取所述多个历史时刻下多个历史事件对应的基本事件数据,所述基本事件数据用于指示所述历史事件的背景信息;
对所述基本事件数据进行特征提取,得到与所述基本事件数据对应的基本事件特征表示;
采用预设参数对所述基本事件特征表示进行调整,得到基本事件强度;
基于所述基本事件强度和所述事件影响强度,得到发生所述目标事件的所述事件发生概率。
8.根据权利要求7所述的方法,其特征在于,所述基于所述基本事件强度和所述事件影响强度,得到发生所述目标事件的所述事件发生概率,包括:
基于所述基本事件强度和所述事件影响强度之和,获取得到事件发生强度;
将所述事件发生强度输入激活函数,得到发生所述目标事件的所述事件发生概率。
9.根据权利要求1至3任一所述的方法,其特征在于,所述方法还包括:
将所述历史时间段内生成的多个目标数据对输入事件预估模型,所述事件预估模型为预先训练得到的预估模型;
通过所述事件预估模型对所述目标数据对进行数据对分析,获取所述事件预估模型输出的所述事件发生概率。
10.一种事件预估方法,其特征在于,所述方法包括:
获取历史时间段内生成的多个目标数据对,所述目标数据对中包括历史时刻与历史生命状态之间的对应关系,所述目标数据对用于指示在所述历史时刻检测到的历史生命状态;
对所述目标数据对进行特征提取,得到所述目标数据对所对应的数据特征表示;
对对应相同历史时刻下的所述数据特征表示进行特征融合处理,得到与所述多个历史时刻分别对应的融合数据特征表示;
沿时间序列维度对多个融合数据特征表示进行疾病关联度分析,确定所述多个历史时刻下检测到的历史生命状态对于检测到指定生命状态的状态影响强度,所述指定生命状态是待进行预估在所述历史时间段之后存在的生命状态,所述指定生命状况与所述历史时间段内检测到的历史生命状况存在伴随关联关系;
基于所述状态影响强度确定检测到所述指定生命状态的状态发生概率。
11.一种事件预估装置,其特征在于,所述装置包括:
获取模块,用于获取历史时间段内生成的多个目标数据对,所述目标数据对中包括历史时刻与历史事件之间的对应关系,所述目标数据对用于指示在所述历史时刻发生的历史事件;
提取模块,用于对所述目标数据对进行特征提取,得到所述目标数据对所对应的事件特征表示;
融合模块,用于对对应相同历史时刻的所述事件特征表示进行特征融合处理,得到与多个历史时刻分别对应的融合事件特征表示;
分析模块,用于沿时间序列维度对多个融合事件特征表示进行事件关联度分析,确定所述多个历史时刻下发生的历史事件对于发生指定事件的事件影响强度,所述指定事件是待进行预估在所述历史时间段之后发生的事件,所述指定事件与所述历史时间段内发生的历史事件存在伴随关联关系;
确定模块,用于基于所述事件影响强度确定发生所述指定事件的事件发生概率。
12.一种事件预估装置,其特征在于,所述装置包括:
获取模块,用于获取历史时间段内生成的多个目标数据对,所述目标数据对中包括历史时刻与历史生命状态的对应关系,所述目标数据对用于指示在所述历史时刻检测到的历史生命状态;
提取模块,用于对所述目标数据对进行特征提取,得到所述目标数据对所对应的数据特征表示;
融合模块,用于对对应相同历史时刻下的所述数据特征表示进行特征融合处理,得到与所述多个历史时刻分别对应的融合数据特征表示;
分析模块,用于沿时间序列维度对多个融合数据特征表示进行疾病关联度分析,确定所述多个历史时刻下检测到的历史生命状态对于检测到指定生命状态的状态影响强度,所述指定生命状态是待进行预估在所述历史时间段之后存在的生命状态,所述指定生命状态与所述历史时间段内检测到的历史生命状态存在伴随关联关系;
确定模块,用于基于所述状态影响强度确定检测到所述指定生命状态的状态发生概率。
13.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现如权利要求1至11任一所述的事件预估方法。
14.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现如权利要求1至11任一所述的事件预估方法。
15.一种计算机程序产品,其特征在于,包括计算机程序或指令,所述计算机程序或指令被处理器执行时实现如权利要求1至11任一所述的事件预估方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211144293.1A CN117012380A (zh) | 2022-09-20 | 2022-09-20 | 事件预估方法、装置、设备、存储介质及程序产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211144293.1A CN117012380A (zh) | 2022-09-20 | 2022-09-20 | 事件预估方法、装置、设备、存储介质及程序产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117012380A true CN117012380A (zh) | 2023-11-07 |
Family
ID=88573363
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211144293.1A Pending CN117012380A (zh) | 2022-09-20 | 2022-09-20 | 事件预估方法、装置、设备、存储介质及程序产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117012380A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117875522A (zh) * | 2024-03-12 | 2024-04-12 | 之江实验室 | 一种事件数量预测的方法、装置、存储介质、设备 |
-
2022
- 2022-09-20 CN CN202211144293.1A patent/CN117012380A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117875522A (zh) * | 2024-03-12 | 2024-04-12 | 之江实验室 | 一种事件数量预测的方法、装置、存储介质、设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6463572B1 (ja) | 対象システムの内部状態を推定する支援システム | |
Hoffman et al. | Big bad data: law, public health, and biomedical databases | |
US7181375B2 (en) | Patient data mining for diagnosis and projections of patient states | |
KR20220064395A (ko) | 이미지들 및 전문 지식으로부터 피부 상태들을 수집하고 식별하기 위한 시스템 | |
CN113241135A (zh) | 一种基于多模态融合的疾病风险预测方法和*** | |
CN104572583B (zh) | 用于数据致密化的方法和*** | |
Ansarullah et al. | Significance of Visible Non‐Invasive Risk Attributes for the Initial Prediction of Heart Disease Using Different Machine Learning Techniques | |
KR20170061222A (ko) | 건강데이터 패턴의 일반화를 통한 건강수치 예측 방법 및 그 장치 | |
KR20190069687A (ko) | 우울증 진단을 위한 다중 설문 분석 시스템 및 그 방법 | |
US20210151140A1 (en) | Event Data Modelling | |
Ali et al. | Multitask deep learning for cost-effective prediction of patient's length of stay and readmission state using multimodal physical activity sensory data | |
Chen et al. | Patient stratification using electronic health records from a chronic disease management program | |
CN117012380A (zh) | 事件预估方法、装置、设备、存储介质及程序产品 | |
Shukla et al. | Optimization assisted bidirectional gated recurrent unit for healthcare monitoring system in big-data | |
Lin et al. | AI-driven decision making for auxiliary diagnosis of epidemic diseases | |
CN116543917A (zh) | 一种针对异构时间序列数据的信息挖掘方法 | |
Ekong et al. | A Softcomputing Model for Depression Prediction. | |
US20030018240A1 (en) | Chronic heart failure patient identification system | |
CN117116476B (zh) | 下游任务预测方法、装置及计算机可读存储介质 | |
US20230253100A1 (en) | Machine learning model to evaluate healthcare facilities | |
Straszecka | Combining knowledge from different sources | |
JP7422873B2 (ja) | 胸部x線写真から胸部状態を診断するためのディープラーニングシステム | |
Radha et al. | Use of Machine Learning and Deep Learning in Healthcare—A Review on Disease Prediction System | |
Hoffman et al. | Big Bad Data: Law, Public Health, and Biomedical Databases | |
Taylor | Forecasting mental distress using healthcare claims data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |