CN113517076A - 基于图神经网络与迁移学习的疾病病例数预测方法及*** - Google Patents

基于图神经网络与迁移学习的疾病病例数预测方法及*** Download PDF

Info

Publication number
CN113517076A
CN113517076A CN202110877916.5A CN202110877916A CN113517076A CN 113517076 A CN113517076 A CN 113517076A CN 202110877916 A CN202110877916 A CN 202110877916A CN 113517076 A CN113517076 A CN 113517076A
Authority
CN
China
Prior art keywords
case number
information aggregation
node
network
number prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110877916.5A
Other languages
English (en)
Inventor
张维玉
王政凯
郭新超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qilu University of Technology
Original Assignee
Qilu University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qilu University of Technology filed Critical Qilu University of Technology
Priority to CN202110877916.5A priority Critical patent/CN113517076A/zh
Publication of CN113517076A publication Critical patent/CN113517076A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/80ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Biophysics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开公开的基于图神经网络与迁移学习的疾病病例数预测方法及***,获取待预测国家各地区的历史时间病例数和相应时间内各地区间的移动人数;将各地区的历史时间病例数和相应时间内各地区间的移动人数输入构建的有向图中,获得有向图各节点的特征向量;将各节点的特征向量输入训练好的病例数预测模型中,获取病例数预测结果;其中,病例数预测模型采用多层信息聚合网络,且上一层信息聚合网络的输出作为当前信息聚合网络的输入,第一层信息聚合网络的输入为有向图各节点的特征向量,将有向图各节点的特征向量和各层信息聚合网络的输出经全连接层连接后,获得病例数预测结果。提高了病例数预测的准确性。

Description

基于图神经网络与迁移学习的疾病病例数预测方法及***
技术领域
本发明涉及疾病病例数技术领域,尤其涉及基于图神经网络与迁移学习的疾病病例数预测方法及***。
背景技术
本部分的陈述仅仅是提供了与本公开相关的背景技术信息,不必然构成在先技术。
流行病因其高度的传染性以及严重的危害性已经给人们带来了诸多灾难。在流行病肆虐的情况下,对病例数进行准确的预测能够帮助决策者制定合理的方案,来减少流行病带来的经济损失以及保障人民的身体健康安全。
在研究早期,人们通过利用数学模型来对流行病的病例数进行预测。这类方法通常用于研究病毒在个体之间传播的方式,包括SIR模型(易感-感染-康复模型)和SEIR模型(易感-潜伏-感染-康复模型)等。但是,人类为防止疾病传播所采取的预防行为对上述方法造成了一定的影响,导致预测结果不准确。于是,一些研究工作也将预防行为这种因素纳入了数学模型,加入预防行为的方式可分为以下两种:第一种是将预防行为作为疾病模型的参数;第二种是引入新的动态状态,目的是区分采取预防措施的人与未采取预防措施的人,并将两者分开进行研究,上述使用的数学模型原理是通过一组微分方程来拟合流行病发展的整个趋势,但是这些模型考虑的参数过少或者过多,容易出现欠拟合或过拟合等问题。
近年来,随着深度学***均模型ARIMA在病例数的预测问题上得到了广泛使用。它要求时序数据是稳定的,或者通过差分后的数据是稳定的,输入是待预测地区预测之前的整个时间序列数据;最近Mahmud等使用的PROPHET方法,输入类似于ARIMA,它可以处理时间序列存在一些异常值的情况,也可以处理部分缺失值的情形,能够有效地预测时间序列未来的走势;与此同时,循环神经网络也应用到了病例数预测的领域中,该方法通常为每个地区建立一个单独的模型(例如每个市建立一个模型),每个模型通过结合它之前的病例信息来对特征进行更新,例如Chimmula等使用长短期记忆网络LSTM预测了加拿大各个地区的新冠肺炎确诊人数。
但这些时间序列方法在进行病例数预测时,均没有考虑地理上的相邻关系以及与附近地区的迁移情况,区域间的交互作用并未加入模型,由于流行病主要是通过人们之间的接触来进行传播,故当不考虑人群的流动性时,导致病例数的预测不准确。
发明内容
本公开为了解决上述问题,提出了基于图神经网络与迁移学习的疾病病例数预测方法及***,在进行疾病数预测时,充分考虑了历史病例数跟各地区间的人流流动性,从而保证了疾病数预测的准确性。
为实现上述目的,本公开采用如下技术方案:
第一方面,提出了基于图神经网络与迁移学习的疾病病例数预测方法,包括:
获取待预测国家各地区的历史时间病例数和相应时间内各地区间的移动人数;
将各地区的历史时间病例数和相应时间内各地区间的移动人数输入构建的有向图中,获得有向图各节点的特征向量;
将各节点的特征向量输入训练好的病例数预测模型中,获取病例数预测结果;
其中,病例数预测模型采用多层信息聚合网络,且上一层信息聚合网络的输出作为当前信息聚合网络的输入,第一层信息聚合网络的输入为有向图各节点的特征向量,将有向图各节点的特征向量和各层信息聚合网络的输出经全连接层连接后,获得病例数预测结果。
第二方面,提出了基于图神经网络与迁移学习的疾病病例数预测***,包括:
数据获取模块,用于获取待预测国家各地区的历史时间病例数和相应时间内各地区间的移动人数;
节点的特征向量获取模块,用于将各地区的历史时间病例数和相应时间内各地区间的移动人数输入构建的有向图中,获得有向图各节点的特征向量;
病例数预测模块,用于将各节点的特征向量输入训练好的病例数预测模型中,获取病例数预测结果;
其中,病例数预测模型采用多层信息聚合网络,且上一层信息聚合网络的输出作为当前信息聚合网络的输入,第一层信息聚合网络的输入为有向图各节点的特征向量,将有向图各节点的特征向量和各层信息聚合网络的输出经全连接层连接后,获得病例数预测结果。
第三方面,提出了一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成基于图神经网络与迁移学习的疾病病例数预测方法所述的步骤。
第四方面,提出了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成基于图神经网络与迁移学习的疾病病例数预测方法所述的步骤。
与现有技术相比,本公开的有益效果为:
1、本公开的在进行疾病病例数预测时,不仅考虑了地区的历史病例数,还充分考虑了各地区间人的流动性,从而使得病例数的预测结果更准确。
2、本公开在进行病例数预测时,不仅使用了和前一天的病例数据,而是使用了多天的病例数据,进一步提高了病例数预测的准确性。
3、本公开通过信息聚合网络将每个节点的邻域信息结合起来,获取了各节点的输出特征,考虑到对于一个中心节点,其周围邻域的影响程度并不总是相同,故在结合邻域信息的过程中,信息聚合网络使用了图卷积网络和图注意力机制,通过增加图注意力机制评价各邻域与中心节点重要性的差异,从而根据该差异进行邻域信息的结合,使得输出的各节点的输出特征更准确,进一步保证了病例数预测的准确性。
4、本公开提出的病例数预测模型包含多层信息聚合网络,通过多个信息聚合网络结合时间层次的信息来对每个节点的特征进行更新,随着时间层次数目的增加,最终的节点特征能够获得越来越多的全局信息,从而提高病例数预测的准确性。
5、本公开在对病例数预测模型进行训练时,引入了迁移学习方法,使得处于疾病初期阶段国家的病例数预测模型能够利用进入疾病相对稳定阶段的国家训练好的参数,保证处于疾病初期阶段国家病例数预测的准确性。
本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。
图1为本公开实施例1公开的使用两个IAN框架时的病例数预测流程图;
图2为本公开实施例1公开的IAN框架结构图;
图3为本公开实施例1公开的加入迁移学习方法的模型训练流程图。
具体实施方式:
下面结合附图与实施例对本公开作进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
实施例1
在该实施例中,公开了基于图神经网络与迁移学习的疾病病例数预测方法,包括:
获取待预测国家各地区的历史时间病例数和相应时间内各地区间的移动人数;
将各地区的历史时间病例数和相应时间内各地区间的移动人数输入构建的有向图中,获得有向图各节点的特征向量;
将各节点的特征向量输入训练好的病例数预测模型中,获取病例数预测结果;
其中,病例数预测模型采用多层信息聚合网络,且上一层信息聚合网络的输出作为当前信息聚合网络的输入,第一层信息聚合网络的输入为有向图各节点的特征向量,将有向图各节点的特征向量和各层信息聚合网络的输出经全连接层连接后,获得病例数预测结果。
进一步的,根据不同的时间,为每个国家创建一系列有向图,有向图的节点代表国家内的各个地区,有向图的边为国家内各个地区之间的移动人数。
进一步的,信息聚合网络采用图卷积网络,并在图卷积网络中添加图注意力机制。
进一步的,获取信息聚合网络节点的输出特征的过程为:
获取图卷积网络各节点的深度特征,将每个节点的深度特征输入图注意力机制中,获取各节点间的注意力权重系数,根据节点的深度特征和注意力权重系数,获得信息聚合网络各节点的输出特征。
进一步的,计算注意力权重系数时,使用softmax函数对某一节点的相邻节点的注意力机制进行归一化处理。
进一步的,在信息聚合网络中加入迁移学习方法,运用不同国家的疾病数据对信息聚合网络进行训练。
进一步的,对信息聚合网络进行训练的具体过程为:
选取其中一个国家的疾病数据为元测试集,剩余国家的疾病数据为元训练集,将元训练集的疾病数据输入一组信息聚合网络中进行训练,使用训练好的信息聚合网络的参数初始化元测试集的信息聚合网络,将元测试集的疾病数据输入初始化后的信息聚合网络中,对元测试集的信息聚合网络进行训练。
对本实施例公开的基于图神经网络与迁移学习的疾病病例数预测方法进行详细说明。
基于图神经网络与迁移学习的疾病病例数预测方法,包括:
S1:获取待预测国家各地区的历史时间病例数和相应时间内各地区间的移动人数。
由于各个国家各个地区每天的病例数据不仅和当天与其邻域之间的流动性等因素有关,而且与该地区之前的病例数据密切相关,为了提高病例数预测的准确度,结合使用多天的病例数据而不只是预测前一天的病例数据,进行病例数预测。
需要注明的是:本实施例获取的数据的来源均为合法的,且不涉及隐私的,所有数据的获取均符合法律法规。
S2:将各地区的历史时间病例数和相应时间内各地区间的移动人数输入构建的有向图中,获得有向图各节点的特征向量。
在具体实施时,为每个国家创建有向图G=(V,E),并将一个国家T天内的情况表示为一系列图G(1),…,G(t),…,G(T),其中,图的边是根据地区之间的流动性创建的,流动性是指每个国家内部各个地区之间的移动人数,创建的有向图中节点之间是否存在边取决于两个地区之间是否存在移动人数。
G=(V,E)中V代表图的节点,节点代表了国家的每个地区。E代表图的边,边捕获两个地区之间的移动人数情况。使用
Figure BDA0003189585690000081
表示第t天顶点V到顶点U之间的权重,权重代表了两个地区之间的移动人数。为了病例数预测的准确度,在进行病例数预测之前,结合使用了多天的病例数据而不只是预测前一天的病例数据,设
Figure BDA0003189585690000082
向量代表节点的属性,它包含了地区u过去d天中每一天的确诊病例,通过结合地区每日的病例数据以及地区之间的移动数据,共同组建节点的特征。对于设定时间T,其节点的特征如公式(1)所示:
Figure BDA0003189585690000091
式中:A(t)是图G(t)的邻接矩阵,该矩阵元素由两个地区之间的权重
Figure BDA0003189585690000092
组成。若两个地区之间移动人数为0,则不建立边,元素值为0,X(t)是不同地区的病例数特征向量,F(t)表示结合了地区病例数和地区之间移动人数的总特征向量。
综合来说,对于一个特定地区u,将其邻域地区的病例数特征以及它与邻域地区之间的移动人数特征,两者做了向量乘积运算,得出的结果为区域u的最终特征向量。需要注意,这里同样也考虑了地区u内部的移动情况,在式(1)中表示为
Figure BDA0003189585690000093
S3:将各节点的特征向量输入训练好的病例数预测模型中,获取病例数预测结果;
其中,病例数预测模型采用多层信息聚合网络,多层信息聚合网络以输入输出的关系进行连接,上一层信息聚合网络的输出作为当前信息聚合网络的输入,且第一层信息聚合网络的输入为有向图各节点的特征向量,将有向图各节点的特征向量和各层信息聚合网络的输出经全连接层连接后,获得病例数预测结果。
在具体实施时,信息聚合网络采用图卷积网络,并在图卷积网络中添加图注意力机制,在添加图注意力机制时,获取图卷积网络各节点的深度特征,将每个节点的深度特征输入图注意力机制中,获取各节点间的注意力权重系数,根据节点的深度特征和注意力权重系数,获得各节点的输出特征。
其中,信息聚合网络(IAN)的框架如图2所示,包括图卷积网络(GCN)与图注意力机制(GAT),信息聚合网络对输入其中的各节点的特征进行邻域信息聚合,从而获得各节点的输出特征。
图卷积网络(GCN)是标准卷积网络(CNN)在图域上的推广,它通过傅里叶变换等方法,能够对广义的图结构数据进行处理,从而深度捕获节点的特征信息,获取节点的深度特征信息。
GCN的层与层之间的传播方式为:
Figure BDA0003189585690000101
式中:A为邻接矩阵,
Figure BDA0003189585690000102
为单位矩阵,
Figure BDA0003189585690000103
Figure BDA0003189585690000104
的度矩阵,H(l)是第l层的特征矩阵,W(l)是第l层的可训练矩阵,σ为激活函数。
将各节点的特征向量输入GCN网络中,获取各节点的深度特征H。
考虑到对于一个中心节点,其周围邻域的影响程度并不总是相同的,因此在结合邻域信息的过程中,必须考虑各节点相对于中心节点重要性的差异,故在信息聚合网络中加入了更适用于有向图的图注意力机制(GAT),能够为邻域中的各个节点制定不等的权重来表示其对中心节点的重要程度,将通过GCN获取的各节点的特征向量输入GAT网络中,获取各节点间的注意力权重系数,根据节点的深度特征和注意力权重系数,获得各节点的输出特征。
具体为:
首先,针对每个节点实行self-attention机制,self-attention机制用a来表示,针对不同的传播轮次,a具有不同的参数。self-attention机制a用来计算节点i和节点j之间的注意力互相关系数ei,j,也就是节点i和节点j两者之间对彼此的重要程度。
ei,j=a(WHi,WHj) (3)
其中,a为self-attention机制,W为权重矩阵,Hi、Hj分别为节点i、j的深度特征。
然后,将self-attention机制a引入图的结构之中,以节点i为例,并加入了softmax函数对所有i的相邻节点j进行归一化处理。
Figure BDA0003189585690000111
式中:αi,j为注意力权重系数,Ni为节点i的所有邻域节点。
综合上述式(3)和式(4),整理一起可得到完整的注意力机制,如下
Figure BDA0003189585690000112
式中:||是连接操作。LeakyRelu是给所有负值赋予一个非零斜率,它的数学公式表示为:
Figure BDA0003189585690000113
通过上述运算得到了不同节点之间最终的注意力权重系数ai,j,从而可以得到每个节点的输出特征。
Figure BDA0003189585690000114
通过多个IAN框架结合多个时间层次的信息来对每个节点的特征进行更新,并且,随着时间层次数目的增加,最终的节点特征能够获得越来越多的全局信息。
将上一层IAN框架对节点的特征进行邻域信息聚合后获得的节点的输出特征输入公式(8)中,获得当前层IAN输出的节点的输出特征。
Ht+1=f(AHtMt+1) (8)
式中:Ht表示上一时间层次的特征向量,其中H0为开始的输入特征X,f为非线性激活函数,例如tanh函数、Relu函数等,Mt+1是第t+1层的可训练矩阵。
为了易于计算,这里将邻接矩阵A做了改变,使每一个节点传入的所有边的权值之和等于1。
将输入第一层IAN的特征X和每一层IAN输出的节点的输出特征使用函数(9)连接起来,通过Dropout丢弃层、Relu函数和全连接层得到病例数预测结果进行输出。
H=Concatenate(H0,…,Hn) (9)
最后,使用均方误差函数Loss来计算预测的损失。
Figure BDA0003189585690000121
式中:N代表总节点数,yv代表地区v病例数真实值,
Figure BDA0003189585690000122
代表地区v病例数预测值。
本实施例公开的病例数预测模型包括多个相连的IAN,根据时间层次的信息,将第一层IAN输出的节点的输出特征输入第二层IAN中,将第二层IAN输出的节点的输出特征输入第三层IAN中,依次至最后一层IAN,实现了根据时间层次的信息对每个节点的特征进行更新,将输入第一层IAN的特征和每一层IAN输出的节点的输出特征进行全连接后,获取病例数预测结果。当病例数预测模型中包含两个IAN时,结构如图1所示,其中Lin代表全连接层。
由于不同国家是遭受流行病的病毒袭击的时间不同,有的国家病毒刚开始传染时,可能其它国家的病毒传染已经进入了相对稳定的阶段。由于流行病属于同一种病毒,不同国家初期的流行病传染模式很大程度上有着相似的基本特征,而且,对流行病整个周期进行训练的模型能够更好的拟合流行病未来的发展趋势,这是处于感染初期阶段的国家训练的新模型所不能达到的。所以,在本实施例中,在处于流行病初期的国家的病例数预测模型中使用其他的处于流行病稳定期国家的训练好的病例数预测模型中的参数数据。
在IAN中加入迁移学习方法(TL),运用不同国家的病例数据对IAN进行训练,具体为:
设置元训练集Mxl={O(1),…,O(k),…,O(n)},其中O(k)代表了第k个国家的数据集,随着预测天数的增加,每个部分训练的规模也将随之扩大。以使用四个国家的数据为例进行说明,总共分为4次对IAN进行训练,每次将四个国家中三个国家的数据集作为元训练集,将剩下的那一个国家的数据集作为元测试集,将其表示为Mcs。还将设置特定的预测目标,例如第3天、第7天和第14天等。这种方法的任务是将通过元训练集Mxl学习到的参数迁移到元测试集Mcs的IAN模型之中。
对于不同的训练集与不同的测试集,都将其设置为一个单独的模型。所以,对于国家K,它的任务集为:
Figure BDA0003189585690000141
式中:
Figure BDA0003189585690000142
分别为国家k的训练集与测试集,训练集为前i天(使用最少两周的训练天数),测试天数为训练天数之后的第j天。
将Mxl每个部分训练集的损失最小化为特定任务θS,如式(12)所示。
Figure BDA0003189585690000143
式中:θ是通过IAN框架得出的全部权重参数以及偏差参数,它最初被随机初始化。然后将在
Figure BDA0003189585690000144
中训练后的θS,用来更新
Figure BDA0003189585690000145
中θ的梯度。如式(13)所示。
Figure BDA0003189585690000146
将通过Mxl学习得到的参数θ应用到Mcs中,并进行训练。
Figure BDA0003189585690000147
最后,在Mcs的测试集上进行测试得到误差,图3展示了本实施例运用迁移学习方法进行IAN训练的过程。首先,将元训练集的三个国家数据依次输入同一组IAN框架之中进行训练;然后将学习到的全部权重以及偏差参数迁移到元测试集的模型之中。换句话说,就是将学习得到的这些参数初始化元测试集的IAN框架;最后将元测试集的那一个国家数据输入进已经初始化好的IAN框架,并通过训练以及测试得到预测误差。
该实施例公开的基于图神经网络与迁移学习的疾病病例数预测方法,不仅考虑了待预测地区的历史病例数,还考虑了各地区之间的流动性,从而使得疾病数的预测结果更准确。
此外,通过使用包括图卷积网络和图注意力机制的信息聚合网络,能够根据不同节点对中心节点的重要性的差异,进行节点特征的聚合,从而使得获取的节点的输出特征更准确,进一步保证了疾病数预测的准确性。
本实施例还考虑到处于疾病初期的国家用于训练模型的样本数据不足,可能导致训练出的病例数预测不准确的问题,在进行病例数模型预测时,使用了迁移学习方法,使用处于疾病稳定期的国家的数据进行模型训练,将训练好的模型的参数迁移至处于疾病初期的国家的预测模型中,用于处于疾病初期的国家的预测模型的训练,保证了模型训练的准确性,从而实现处于疾病初期的国家病例数的准确预测。
使用四个欧洲国家(意大利、英国、西班牙和法国)的新冠肺炎数据对本实施例公开的疾病病例数预测模型的性能进行验证。
数据集的详细情况如表1所示,它展示了四个国家数据集的使用时间区间、每个国家包含的地区数量以及每天的平均新增病例数。
表1数据集的具体情况
Figure BDA0003189585690000151
为了验证本实施例所提出方法的预测能力,与下列方法进行了比较,具体情况如下所示:
1)LAST_DAY:使用地区过去几天的病例数作为预测未来的病例数。
2)AVG:使用预测之前的地区每天病例数的平均值作为预测未来的病例数。
3)AVG_WINDOW:与AVG相比,增加了一个时间选择窗口,用来指定过去特定天数的平均病例数作为预测未来的病例数。
4)LSTM:使用双层长短期记忆网络,新的节点信息来源于该节点之前的特征。本文用来比较的LSTM它的输入是预测之前一周的病例数据。
5)PROPHET:输入与ARIMA相似,适用于各种时间序列的预测模型。
6)ARIMA:自回归移动平均模型,它的输入是预测之前的整个时间序列数据。
7)TL_BASE:使用4个国家的数据集进行训练,并在其中一个国家的数据集上进行测试。(注意:训练集包括未来测试的国家)
为了评估所有模型预测病例数的性能,在意大利、英国、西班牙和法国的数据集上对它们进行了测试。结果展示了3天内、7天内以及14天内的各个模型预测的平均误差。详情情况如表2、表3以及表4所示。
表2 1-3天的平均误差
Figure BDA0003189585690000171
表3 1-7天的平均误差
Figure BDA0003189585690000172
Figure BDA0003189585690000181
表4 1-14天的平均误差
Figure BDA0003189585690000182
从以上三个表所展示的数据中可以观察到,本实施例提出的疾病病例数预测模型达到了最优的效果。这显示出了IAN计算框架以及迁移学***均预测误差结果中,IAN要比预测结果相对较好的时间序列模型分别低2.65、1.99、8.03和10.03。在7天内的平均预测误差结果中,分别低2.01、2.04、7.02和7.87。在14天内的平均预测误差结果中,分别低0.90、0.97、4.58和6.50。由此可见,地区之间的流动性是预测病例数一个必要的考虑因素。
实施例2
在该实施例中,公开了提出了基于图神经网络与迁移学习的疾病病例数预测***,包括:
数据获取模块,用于获取待预测国家各地区的历史时间病例数和相应时间内各地区间的移动人数;
节点的特征向量获取模块,用于将各地区的历史时间病例数和相应时间内各地区间的移动人数输入构建的有向图中,获得有向图各节点的特征向量;
病例数预测模块,用于将各节点的特征向量输入训练好的病例数预测模型中,获取病例数预测结果;
其中,病例数预测模型采用多层信息聚合网络,且上一层信息聚合网络的输出作为当前信息聚合网络的输入,第一层信息聚合网络的输入为有向图各节点的特征向量,将有向图各节点的特征向量和各层信息聚合网络的输出经全连接层连接后,获得病例数预测结果。
实施例3
在该实施例中,公开了一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成实施例1公开的基于图神经网络与迁移学习的疾病病例数预测方法所述的步骤。
实施例4
在该实施例中,公开了一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成实施例1公开的基于图神经网络与迁移学习的疾病病例数预测方法所述的步骤。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。

Claims (10)

1.基于图神经网络与迁移学习的疾病病例数预测方法,其特征在于,包括:
获取待预测国家各地区的历史时间病例数和相应时间内各地区间的移动人数;
将各地区的历史时间病例数和相应时间内各地区间的移动人数输入构建的有向图中,获得有向图各节点的特征向量;
将各节点的特征向量输入训练好的病例数预测模型中,获取病例数预测结果;
其中,病例数预测模型采用多层信息聚合网络,且上一层信息聚合网络的输出作为当前信息聚合网络的输入,第一层信息聚合网络的输入为有向图各节点的特征向量,将有向图各节点的特征向量和各层信息聚合网络的输出经全连接层连接后,获得病例数预测结果。
2.如权利要求1所述的基于图神经网络与迁移学习的疾病病例数预测方法,其特征在于,根据不同的时间,为每个国家创建一系列有向图,有向图的节点代表国家内的各个地区,有向图的边为国家内各个地区之间的移动人数。
3.如权利要求1所述的基于图神经网络与迁移学习的疾病病例数预测方法,其特征在于,信息聚合网络采用图卷积网络,并在图卷积网络中添加图注意力机制。
4.如权利要求3所述的基于图神经网络与迁移学习的疾病病例数预测方法,其特征在于,获取信息聚合网络节点的输出特征的过程为:
获取图卷积网络各节点的深度特征,将每个节点的深度特征输入图注意力机制中,获取各节点间的注意力权重系数,根据节点的深度特征和注意力权重系数,获得信息聚合网络各节点的输出特征。
5.如权利要求4所述的基于图神经网络与迁移学习的疾病病例数预测方法,其特征在于,计算注意力权重系数时,使用softmax函数对某一节点的相邻节点的注意力机制进行归一化处理。
6.如权利要求1所述的基于图神经网络与迁移学习的疾病病例数预测方法,其特征在于,在信息聚合网络中加入迁移学习方法,运用不同国家的疾病数据对信息聚合网络进行训练。
7.如权利要求6所述的基于图神经网络与迁移学习的疾病病例数预测方法,其特征在于,对信息聚合网络进行训练的具体过程为:
选取其中一个国家的疾病数据为元测试集,剩余国家的疾病数据为元训练集,将元训练集的疾病数据输入一组信息聚合网络中进行训练,使用训练好的信息聚合网络的参数初始化元测试集的信息聚合网络,将元测试集的疾病数据输入初始化后的信息聚合网络中,对元测试集的信息聚合网络进行训练。
8.基于图神经网络与迁移学习的疾病病例数预测***,其特征在于,包括:
数据获取模块,用于获取待预测国家各地区的历史时间病例数和相应时间内各地区间的移动人数;
节点的特征向量获取模块,用于将各地区的历史时间病例数和相应时间内各地区间的移动人数输入构建的有向图中,获得有向图各节点的特征向量;
病例数预测模块,用于将各节点的特征向量输入训练好的病例数预测模型中,获取病例数预测结果;
其中,病例数预测模型采用多层信息聚合网络,且上一层信息聚合网络的输出作为当前信息聚合网络的输入,第一层信息聚合网络的输入为有向图各节点的特征向量,将有向图各节点的特征向量和各层信息聚合网络的输出经全连接层连接后,获得病例数预测结果。
9.一种电子设备,其特征在于,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成权利要求1-7任一项所述的基于图神经网络与迁移学习的疾病病例数预测方法的步骤。
10.一种计算机可读存储介质,其特征在于,用于存储计算机指令,所述计算机指令被处理器执行时,完成权利要求1-7任一项所述的基于图神经网络与迁移学习的疾病病例数预测方法的步骤。
CN202110877916.5A 2021-07-30 2021-07-30 基于图神经网络与迁移学习的疾病病例数预测方法及*** Pending CN113517076A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110877916.5A CN113517076A (zh) 2021-07-30 2021-07-30 基于图神经网络与迁移学习的疾病病例数预测方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110877916.5A CN113517076A (zh) 2021-07-30 2021-07-30 基于图神经网络与迁移学习的疾病病例数预测方法及***

Publications (1)

Publication Number Publication Date
CN113517076A true CN113517076A (zh) 2021-10-19

Family

ID=78068907

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110877916.5A Pending CN113517076A (zh) 2021-07-30 2021-07-30 基于图神经网络与迁移学习的疾病病例数预测方法及***

Country Status (1)

Country Link
CN (1) CN113517076A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114362994A (zh) * 2021-11-26 2022-04-15 北京交通大学 多层异粒度智能聚合铁路***运行行为安全风险识别方法
CN115359870A (zh) * 2022-10-20 2022-11-18 之江实验室 一种基于层次图神经网络的疾病诊疗过程异常识别***
CN115862888A (zh) * 2023-02-17 2023-03-28 之江实验室 传染病感染情况预测方法、***、设备及存储介质
CN116013541A (zh) * 2023-01-03 2023-04-25 武汉博科国泰信息技术有限公司 一种用于结核病检测的资源配置方法和***
CN117747121A (zh) * 2023-12-19 2024-03-22 首都医科大学宣武医院 一种基于多模型的糖尿病风险预估***
CN118016318A (zh) * 2024-04-08 2024-05-10 中国科学院地理科学与资源研究所 基于图神经网络的***共患病风险预测模型的构建方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112116155A (zh) * 2020-09-18 2020-12-22 平安科技(深圳)有限公司 基于智能决策的人口流动预测方法、装置及计算机设备
CN112863696A (zh) * 2021-04-25 2021-05-28 浙江大学 基于迁移学习和图神经网络的药物敏感性预测方法和装置
CN113035368A (zh) * 2021-04-13 2021-06-25 桂林电子科技大学 一种基于差分迁移图神经网络的疾病传播预测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112116155A (zh) * 2020-09-18 2020-12-22 平安科技(深圳)有限公司 基于智能决策的人口流动预测方法、装置及计算机设备
CN113035368A (zh) * 2021-04-13 2021-06-25 桂林电子科技大学 一种基于差分迁移图神经网络的疾病传播预测方法
CN112863696A (zh) * 2021-04-25 2021-05-28 浙江大学 基于迁移学习和图神经网络的药物敏感性预测方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
马帅: ""基于注意力实现的图神经网络"", 《计算机研究与发展》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114362994A (zh) * 2021-11-26 2022-04-15 北京交通大学 多层异粒度智能聚合铁路***运行行为安全风险识别方法
CN114362994B (zh) * 2021-11-26 2023-01-06 北京交通大学 多层异粒度智能聚合铁路***运行行为安全风险识别方法
CN115359870A (zh) * 2022-10-20 2022-11-18 之江实验室 一种基于层次图神经网络的疾病诊疗过程异常识别***
CN116013541A (zh) * 2023-01-03 2023-04-25 武汉博科国泰信息技术有限公司 一种用于结核病检测的资源配置方法和***
CN115862888A (zh) * 2023-02-17 2023-03-28 之江实验室 传染病感染情况预测方法、***、设备及存储介质
CN117747121A (zh) * 2023-12-19 2024-03-22 首都医科大学宣武医院 一种基于多模型的糖尿病风险预估***
CN118016318A (zh) * 2024-04-08 2024-05-10 中国科学院地理科学与资源研究所 基于图神经网络的***共患病风险预测模型的构建方法
CN118016318B (zh) * 2024-04-08 2024-06-14 中国科学院地理科学与资源研究所 基于图神经网络的***共患病风险预测模型的构建方法

Similar Documents

Publication Publication Date Title
CN113517076A (zh) 基于图神经网络与迁移学习的疾病病例数预测方法及***
Efimov et al. On an interval prediction of COVID-19 development based on a SEIR epidemic model
La Gatta et al. An epidemiological neural network exploiting dynamic graph structured data applied to the COVID-19 outbreak
Rochmawati et al. Covid symptom severity using decision tree
Maathuis et al. A Review of Some Recent Advances in Causal Inference.
CN109523021B (zh) 一种基于长短时记忆网络的动态网络结构预测方法
Lefèvre et al. SIR-type epidemic models as block-structured Markov processes
Paré et al. Stability analysis and control of virus spread over time-varying networks
De la Sen et al. On an Sir Epidemic Model for the COVID‐19 Pandemic and the Logistic Equation
CN107590139A (zh) 一种基于循环矩阵翻译的知识图谱表示学习方法
CN113035368A (zh) 一种基于差分迁移图神经网络的疾病传播预测方法
Shami et al. Economic aspects of the detection of new strains in a multi-strain epidemiological–mathematical model
Lin et al. Takagi-sugeno fuzzy model identification using coevolution particle swarm optimization with multi-strategy
Liang et al. Discovering dynamic models of COVID‐19 transmission
CN108446841A (zh) 一种利用灰色关联确定事故因素层次结构的***方法
Kuylen et al. Social contact patterns in an individual-based simulator for the transmission of infectious diseases (stride)
CN114997504A (zh) 基于时序卷积网络与图卷积网络的疾病病例数预测方法及***
Iakovidis et al. Intuitionistic fuzzy reasoning with cognitive maps
Hadiwibowo et al. A policy strategy evaluation for covid-19 pandemic in the city of surabaya using vensim ventana dynamic system simulation
Ramesh et al. Statistical model checking for dynamical processes on networks: a healthcare application
Gál et al. Modified bacterial memetic algorithm used for fuzzy rule base extraction
Saptarini et al. Dengue haemorrhagic fever outbreak prediction using Elman Levenberg neural network and genetic algorithm
CN112185581A (zh) 一种基于Python和BP神经网络的新冠肺炎SIT模型反演方法
Burman et al. A Flexible Agent-Based Model to Study COVID-19 Outbreak--A Generic Approach
Tang et al. A microscopic pandemic simulator for pandemic prediction using scalable million-agent reinforcement learning

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination