CN111367961B - 基于图卷积神经网络的时序数据事件预测方法、***及其应用 - Google Patents
基于图卷积神经网络的时序数据事件预测方法、***及其应用 Download PDFInfo
- Publication number
- CN111367961B CN111367961B CN202010124544.4A CN202010124544A CN111367961B CN 111367961 B CN111367961 B CN 111367961B CN 202010124544 A CN202010124544 A CN 202010124544A CN 111367961 B CN111367961 B CN 111367961B
- Authority
- CN
- China
- Prior art keywords
- event
- data
- sequence data
- time
- vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2474—Sequence data queries, e.g. querying versioned data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Fuzzy Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Health & Medical Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于图卷积神经网络的时序数据事件预测方法、***及其应用,包括:将数据清洗后的时序数据以预定的时间间隔转换成事件序列数据,获得事件与事件集合的向量表示;将事件序列数据中每一条序列样本数据最后一个时刻所包含的事件集合作为预测目标,将其作为对应序列样本标签,得到已标注的事件序列数据;当图卷积神经网络模型被训练至满足预设定的收敛条件时,使用测试集对模型预测效果进行测试,取测试效果的模型作为最终的事件预测模型。本发明可弥补传统方法对数据数量及质量要求高、无法充分利用知识图谱的缺陷。
Description
技术领域
本发明属于数据挖掘及机器学习技术领域,涉及时序数据事件预测领域,特别涉及一种基于图卷积神经网络的时序数据事件预测方法、***及其应用。
背景技术
根据历史时序数据对未来可能发生的事件进行预测是数据挖掘与机器学习领域重要的研究方向。目前的主要方法是通过传统机器学习或深度学习技术挖掘时序数据所包含的隐藏模式,并利用这些信息计算出未来某些事件发生的概率,进而达到事件预测的目的。
时序数据通常具有时序性、高维度、高噪声等特点,使用传统机器技术对时序数据建模需先由领域专家进行数据的人工特征提取,再使用机器学习预测模型使用这些数据特征进行预测。其中,特征提取方式面对大量高维的数据时效率非常低下,同时模型预测效果会因特征的选择而产生差异,缺乏鲁棒性。
近些年,深度学习技术因其强大的特征自动提取能力而被成功应用于多种领域;其中,循环神经网络模型因其优异的时间序列特征提取能力而被广泛应用于时序数据的事件预测应用中。对于深度学习预测模型而言,其性能很大程度上受到数据数量与质量的影响。为了减缓由数据质量而导致的预测性能降低,目前最有效的方式是在深度学习模型的训练及预测过程中引入与数据相关联的知识图谱,丰富原始数据中所包含的信息,进而提升模型的预测性能。知识图谱属于图结构数据,其中节点表示某一变量,节点间的边代表节点间的关系,因此空间结构属于图结构数据的重要特征。
综上,目前存在的问题包括:基于卷积神经网络的深度学习模型仅适用于一维或多维网格状数据,无法有效的从图结构数据中提取关键特征;通过注意力机制(AttentionMechanism)引入知识图谱信息的方式无法完全利用图结构数据的空间结构信息,亟需一种新的可有效利用知识图谱信息的时序数据事件预测方法。
发明内容
本发明的目的在于提供一种基于图卷积神经网络的时序数据事件预测方法、***及其应用,以解决上述存在的一个或多个技术问题。本发明中,通过构建包含时序数据及相关领域知识图谱的时间、空间图结构数据,再利用图卷积神经网络对数据进行建模,提取关键特征,进而进行事件预测,可弥补传统方法对数据数量及质量要求高、无法充分利用知识图谱的缺陷。
为达到上述目的,本发明采用以下技术方案:
本发明的一种基于图卷积神经网络的时序数据事件预测方法,包括以下步骤:
步骤1,采集预设数量的时序数据;对时序数据进行数据清洗,实现初始数据结构统一;
步骤2,将步骤1获得的数据清洗后的时序数据以预定的时间间隔转换成事件序列数据,获得事件与事件集合的向量表示;将事件序列数据中每一条序列样本数据最后一个时刻所包含的事件集合作为预测目标,将其作为对应序列样本标签,得到已标注的事件序列数据;将已标注的事件序列数据划分为训练集、验证集与测试集;
步骤3,根据步骤2获得的训练集、验证集与测试集,以及知识图谱,分别构建时间、空间图结构形式的训练集、验证集与测试集;
步骤4,使用步骤3获得的训练集训练预构建的图卷积神经网络模型,使用验证集验证训练效果并调整网络参数;其中,当图卷积神经网络模型被训练至满足预设定的收敛条件时,使用测试集对模型预测效果进行测试,取测试效果的模型作为最终的事件预测模型;
步骤5,将待预测序列数据输入步骤4获得的事件预测模型中,获得在某一时刻特定事件可能会发生的概率。
本发明的进一步改进在于,步骤1中,所述数据清洗包括:缺失值和异常值处理;其中,处理方式包括舍去、按正常值填充或按前一时刻值填充。
本发明的进一步改进在于,步骤2具体包括:
步骤2.1,将步骤1获得的时序数据按照一定时间间隔划分;
步骤2.2,将步骤2.1所得的已划分时序数据中每个时间间隔内的时序数据转化为相应的事件集合,其中在同一时间间隔内发生的相同事件只记一次,得到具有相同时间间隔的事件序列数据;
步骤2.3,统计事件序列数据中所有事件的数量,以独热码的形式对每一个事件进行编码,表示成一维向量,得到每一个事件的事件向量;
步骤2.4,将每条事件序列数据的每个时间间隔中所包含的事件集合序列表示为事件集合向量,其中所述事件集合序列向量是通过将事件集合内所有事件向量相加获得,从而得到向量形式的事件序列数据;
步骤2.5,对每一条向量形式的事件序列数据,将其最后一个事件间隔的事件集合向量作为该条数据的预测标签,并将此事件集合向量从原始事件序列数据中删除,获得已标注的向量形式事件序列数据。
本发明的进一步改进在于,步骤3具体包括:
步骤3.1,将知识图谱中的边关系用邻接矩阵的形式表示;其中,原本存在于知识图谱中的节点称为祖先节点;
步骤3.2,将步骤2.3统计所得的所有事件作为叶子节点加入知识图谱,并与相应的祖先节点进行连接,获得事件节点与祖先节点的连接关系,得到已扩充的邻接矩阵;同时统计所有事件节点及祖先节点的数量;
步骤3.3,根据步骤3.2所得节点数量对事件节点与祖先节点以独热码的形式进行编码,表示为新的一维向量,得到祖先节点向量以及事件节点向量;再根据步骤3.2所得的已扩充的邻接矩阵,将有连接关系的事件节点向量与祖先节点向量相加,得到新的事件节点向量;
步骤3.4,对步骤2.5所得的已标注的向量形式事件序列数据中每一个时间间隔内的事件子集以新的事件节点想点向量进行表示,得到每条事件序列数据各时间间隔的特征向量;
步骤3.5,对每条向量形式事件序列数据,将其各时间间隔的特征向量按照时间顺序,在时间维度上进行拼接,形成包含时序信息的事件序列特征矩阵。
本发明的进一步改进在于,步骤3.2具体包括:扩充步骤3.1所得邻接矩阵的行和列,扩充数量为所有叶子节点个数;根据叶子节点的连接关系对邻接矩阵进行填充,得到已扩充的邻接矩阵。
本发明的进一步改进在于,步骤4中,所述预构建的图卷积神经网络模型结构包括:
批数据归一化层,用于对采用批次训练的图卷积神经网络模型的输入进行归一化,减小批次训练带来的样本分布偏移;
时间-空间图卷积单元,用于接收时间-空间图结构数据,在图结构的空间域与时域中提取数据特征,输出低维特征图;
通道注意力层,用于在多通道特征图中甄别重要的特征;
平均池化层,用于对不同时间-空间卷积单元产生的不同尺寸特征图进行特征融合;
分类器,用于使用图神经网络模型生成的特征图实现最终的事件预测。
本发明的进一步改进在于,步骤4具体包括:
步骤4.1,预构建的图卷积神经网络模型训练目标函数的表达式为:
步骤4.2,分批次地将输入数据送入图卷积神经网络模型中;其中,输入数据包括由步骤3.1所得邻接矩阵、由步骤3.5所得事件序列特征矩阵以及由步骤2.5所得预测标签;
步骤4.3,根据预设的网络参数进行训练,并根据验证集的验证结果调整网络参数;其中,可调整的参数为:网络模型优化器学习率、随机断开神经元的概率(dropout)、权重衰减系数、时间-空间图卷积单元卷积核尺寸;
步骤4.4,进行迭代训练预设轮之后,保存模型参数;输入测试集数据,获得测试结果;重复执行步骤4.2至步骤4.4,直至模型收敛,将测试结果最优的模型作为最终的事件预测模型。
本发明的一种基于图卷积神经网络的时序数据事件预测***,包括:
数据采集与预处理模块,用于采集预设数量的时序数据,对时序数据进行数据清洗,实现初始数据结构统一;
知识图谱-数据融合模块,用于将已获得的时序数据转化为向量形式的事件序列数据,并与相关领域知识图谱进行融合,获得隐含信息更加丰富的时图结构时间序列数据;所述知识图谱-数据融合模块以数据采集与预处理模块生成的数据与知识图谱为输入,输出适合图神经网络使用的图结构数据的邻接矩阵与数据初始特征矩阵;
图神经网络模块,用于存储图神经网络模型,完成对模型的训练、验证及测试,并保存测试结果最优的模型用于事件预测任务;所述图神经网络模块通过对由知识图谱-数据融合模块产生的图结构时序数据进行特征提取,获得数据在空间域与时域的隐含特征,学习隐藏模式,并以此为依据,使用历史数据对未来特定事件可能发生的概率进行预测;所述图神经网络模块进行多轮迭代训练,直至模型收敛,训练完成后可由输入的时序数据得到某时刻可能发生特定事件的概率。
一种本发明的基于图卷积神经网络的时序数据事件预测***的应用,用于电子病历数据的诊断预测。
一种本发明的基于图卷积神经网络的时序数据事件预测***的应用,包括以下步骤:
步骤S1,获取电子病历数据并进行预处理,获得预处理后的电子病历数据;
步骤S2,将预处理后的电子病历数据以一定时间间隔进行划分,生成诊断序列数据;将每一条诊断序列中每一时间间隔内所包含的所有诊断码作为本时间间隔的诊断码集合,所有诊断码集合按照时间顺序排列;统计诊断序列数据中出现的N个不重复的诊断码,将N个诊断码进行独热编码,生成N个长度为N的1维诊断向量;根据诊断码集合和1维诊断向量,构建诊断码集合的向量表示,获得诊断码集合向量;在模型训练阶段,将每条诊断序列数据中最后一个时间间隔的诊断码集合向量作为预测标签,并从原本的诊断序列中删除,得到已标注的诊断序列数据及其预测标签;对已标注的诊断序列数据进行一定比例的划分,生成训练集、验证集与测试集;
步骤S3,根据步骤S2获得的N个诊断码,查询其存在于医疗领域知识图谱中的所有祖先节点,得到M个祖先节点,以及反映医疗领域知识图谱中节点连接关系的邻接矩阵A;将诊断码与将祖先节点进行独热编码,生成N+M个长度为N+M的1维向量,分别为N个诊断向量与M个祖先节点向量;根据邻接矩阵A中的连接关系,将每一个诊断向量与其有连接关系的祖先节点向量相加,生成新的N个诊断向量;对于步骤S2所得的已标注、已划分的诊断序列数据,将每个时间间隔内的诊断码集合以新的诊断向量进行表示,生成新的诊断码集合向量,并将每一条诊断序列数据中的新的诊断码集合向量按照时间顺序进行堆叠,得到每一条诊断序列数据的初始特征矩阵;
步骤S4,使用步骤S2获得的预测标签、步骤S3获得的诊断序列数据初始特征矩阵训练预构建的图卷积神经网络模型,使用验证集验证训练效果并调整网络参数;其中,当图卷积神经网络模型被训练至满足预设定的收敛条件时,使用测试集对模型预测效果进行测试;通过多次测试,取测试结果最优的模型作为最终的诊断预测模型;
步骤S5,将某病人的历史诊断序列数据输入步骤S4获得的诊断预测模型中,获得病人在本次就诊中可能出现的医学诊断的概率。
与现有技术相比,本发明具有以下有益效果:
现有传统方法使用循环神经网络或卷积神经网络对时序数据进行建模,再由注意力机制将知识图谱中所含信息引入网络模型;首先,此类传统方法对数据质量要求较高,对数据噪声敏感;其次,此类传统方法使用的网络模型无法处理图结构模型,无法有效提取知识图谱中所蕴含的信息;其中,注意力机制仅能部分利用知识图谱中的数据相关性,无法有效获取知识图谱的空间结构信息。本发明的方法,首先将数据与相关领域知识图谱进行自然融合,构建出图结构的时序数据,可极大地丰富数据所包含的信息;其次,本发明所使用的图卷积神经网络模型经过结构设计,可有效地对图结构时序进行建模,通过学习,能够自动提取到数据的空间结构特征以及时间序列特征,最终生成更加准确的预测结果。本发明既解决了现有方法无法处理或有效利用知识图谱的缺点,同时使用知识图谱的空间结构特征与数据的时间序列特征相互补充,能够提高模型对数据噪声的鲁棒性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面对实施例或现有技术描述中所需要使用的附图做简单的介绍;显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来说,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例的一种基于图卷积神经网络的时序数据事件预测方法的流程示意框图;
图2是本发明实施例中,数据序列编码方式的示意图;
图3是本发明实施例中,基于图卷积神经网络的预测模型结构示意图;
图4是本发明实施例的一种基于图卷积神经网络的时序数据事件预测***的示意图。
具体实施方式
为使本发明实施例的目的、技术效果及技术方案更加清楚,下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述;显然,所描述的实施例是本发明一部分实施例。基于本发明公开的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的其它实施例,都应属于本发明保护的范围。
请参阅图1,本发明实施例的一种基于图卷积神经网络的时序数据事件预测方法,包括以下步骤:
步骤1,数据采集与预处理:其中,数据采集通过基于MySQL数据库技术直接从数据库中查询获取预设数量的样本数据,并存储至本地。数据预处理的具体过程:时序数据通常具有高维度、高噪声的特征。对于事件预测任务,首先将所得时序数据以一定事件间隔均匀划分,将时间间隔内所发生事件进行统计形成事件集合,随后按照时间间隔的先后顺序将原始数据转化为事件序列数据。通过统计分析,将数据中的重复值、缺失值与异常值进行处理。
请参阅图2,步骤2,数据的向量表示:由步骤1所得的事件序列数据,首先对数据中所有出现的事件进行统计,以事件总量为尺寸对每一个事件进行独热编码,如图2所示生成事件向量。对于每一个时间间隔内的事件集合,将集合内每个事件的向量进行向量加法,由此生成事件集合的向量表示。
步骤3,图结构时序数据构建:知识图谱一般是图结构数据,节点表示与邻接矩阵。其中,邻接矩阵代表在图中节点的连接关系。
通过知识图谱与时序数据构建图结构序列数据的具体步骤包括:
步骤3.1,通过查询由步骤2所得除数据标签外的所有事件集合序列中事件在知识图谱中的祖先节点,并将所得祖先节点加入事件集合中来扩充每事件集合。
步骤3.2,重新统计事件与祖先节点数量,对每一个事件或祖先节点进行独热编码生成新的事件或祖先节点向量。
步骤3.3,按照步骤2的方法更新除数据标签外所有事件集合的向量表示。对于样本数据,将其所包含事件集合向量表示按照时间顺序进行堆叠,得到样本数据的初始时序特征矩阵。
步骤3.4,将知识图谱邻接矩阵进行扩充,矩阵的长与宽应与新的事件向量长度相同。并将事件节点与祖先节点的连接关系填入矩阵中对应位置。
请参阅图3,本发明实施例中,图卷积神经网络预测模型结构包括:
(1)批归一化层:由于神经网络的训练往往需要大量的数据,而设备的内存有限,可能会出现无法将完整数据全部读取的情况,因此常采用批次训练的方式。而由于批次划分的随机性,会对模型的训练产生影响,因此使用批归一化层来使模型适应数据分布的变化。
(2)时间-空间图卷积单元:时间-空间图卷积单元由图卷积层与卷积层构成。图卷积层用于提取图数据的空间结构特征,具体为按照图中节点的连接关系将某一节点与其所有相邻并连接的节点的特征进行传播与融合。因此图卷积层生成的特征图中每个节点都包含了在空间结构上相连接的节点特征。卷积层以时间轴为方向,以预设步长滑动,并对预设窗口内的数据进行卷积特征,从而捕获数据的时间序列特征。
(3)通道注意力层:将时间-空间图卷积单元产生的特征图按照输出通道进行划分,并对每个通道进行平均池化新的通道特征图。再使用Softmax函数计算每一个通道特征的注意力系数。
(4)平均池化层:平均池化层与一般卷积层相似,其中包含一个尺寸可调的滤波器,按照一定步长对特征图进行求平均,从而生成维度更低的特征图,用来缩减模型大小、提高计算速度并提高模型提取特征的鲁棒性。
(5)分类器:目前已有多种神经网络分类器被提出,可根据具体任务进行选择。一般情况下事件预测可以看作是多标签分类任务,可以使用一层全连接神经网络以及Softmax函数实现。
步骤4,预测模型训练:将步骤3获得的包含知识图谱信息的图结构时序数据作为神经网络模型的输入送入到神经网络中,使用定义目标函数模型与由步骤2得到的每一个数据样本的标签计算其训练损失,并使用梯度回传算法优化模型参数,直至模型收敛。
步骤4具体包括以下步骤:
步骤4.1,构建目标函数,形式化表示为:
步骤4.2,将步骤2所得数据标签与步骤3所得样本数据进行随机划分,划分时保证数据与其数据标签的统一。划分完成后送入图卷积神经网络模型进行训练。
综上,本发明实施例的一种基于图卷积神经网络和时序数据的事件预测方法,能够弥补现有方法鲁棒性差与无法有效利用知识图谱信息的不足。本发明创新性的将时序数据与相应领域知识图谱进行融合,综合利用图卷积与卷积神经网络技术,有效的对图结构时序数据进行特征提取。在经过端对端的监督训练之后,可完成鲁棒与准确的事件预测任务。
请参阅图4,本发明实施例的一种基于图卷积神经网络的时序数据事件预测***,包括:
数据采集与预处理模块:用于获取原始数据,并将原始数据中每个样本构建成事件序列数据,并获得数据的向量表示;
知识图谱-数据融合模块:用于通过已采集、处理数据与领域知识图谱,构建图结构时序数据;
图神经网络预测模型模块:在模型训练阶段,本模块对一模块产生的数据进行随机划分,对预测模型进行训练。在应用阶段,本模块通过给定的输入数据生成预测结果。
本发明基于web***搭建,代码和数据均托管于SQL Server远程服务器。用户使用时,仅需常规的浏览器即可完成相关操作,无须安装其他附带软件。同时,该平台不受操作***的限制,可用于Windows、Mac和Linux等多种操作平台。本发明数据采集与预处理模块、知识图谱-数据融合模块由Python语言实现,本发明图神经网络预测模型模块由Python语言与Pytorch深度学习框架实现。此外,图神经网络预测模型模块需要使用GPU进行计算。
实施例:
本发明实施例的具体应用为基于图卷积神经网络和时序数据的事件预测方法,应用于电子病历数据的诊断预测,包括以下步骤:
S101,获取电子病历数据并进行预处理。
电子病历(EHR)数据包括病人基本信息、诊断、检验检查、手术以及用药信息。由于进行诊断预测任务,因此仅提取诊断信息,并进行数据清洗。
S102,数据的向量表示。
Step1,以一定时间间隔诊断数据进行划分,可以天、周、月为单位。将每一时间间隔内所包含的所有诊断作为本时间间隔的诊断集合,所有诊断集合按照时间顺序排列。
Step2,统计所有数据中出现的N个不重复的诊断。再将N个诊断进行独热编码,生成N个长度为N的1维诊断向量,每个向量代表一种诊断。
Step3,根据Step2所得诊断集合以及Step3中所得诊断向量表示,构建集合的向量表示,具体方法为将集合内所有诊断向量进行向量加法,向量长度与维度不变。
Step4,在模型训练阶段,可将每个样本序列中最后一个诊断集合向量作为数据标签,并将之前的诊断集合序列作为训练或测试数据。
S103,图结构数据构建。
本步骤使用S102得到的数据,与医疗领域知识图谱。知识图谱具体为一种图结构医疗实体,主要反映了诊断与诊断间的关系。
Step1,根据S102中统计出的所有诊断查询其存在知识图谱中的所有祖先节点,并将祖先节点加入S102所得到的用于训练或测试的诊断集合中,标签集合保持不变。其中一个祖先节点可能连接多个诊断节点,因此需要删除诊断集合中重复的祖先节点。同时获取反映知识图谱中节点连接关系的邻接矩阵A。
Step2,重新对所有诊断与祖先节点进行独热表码,若祖先节点有M个,那么新的独热编码长度应该为N+M。
Step3,参照S102中的Step3,对非标签的所有诊断集合进行重新编码,并将同一样本中所有诊断集合向量按照时间轴进行堆叠,得到样本数据的初始特征矩阵,矩阵维度为T×
(N+M)。其中T为样本序列长度。至此已获得样本数据的初始特征矩阵,知识图谱的邻接矩阵以及训练标签。
S104,预测模型构建与训练。
基于图卷积神经网络的事件预测模型具体网络结构如下:
(1)批归一化层:EHR通常数据量巨大,在模型训练时无法将全部训练数据输入模型中。一般使用小批次的训练方法,将训练数据均匀的划分成数据量较小的集合,再按顺序送入网络模型中训练。然而这种划分方式无法保证每个批次中样本数据的分布与原始数据相同,因此使用归一化层对网络输入进行归一化。
(2)时间-空间图卷积单元:本实施例网络模型中使用6个卷积单元,用于提取不同尺度的图结构诊断序列数据的空间结构特征与时序特征。
(3)通道注意力层:本实施例网络模型中使用6层通道注意力层,分别设置在空间图卷积单元之后,用于计算由卷积单元得到的特征图通道间注意力系数,以此确定哪一个通道的特征图更加重要,从而提升模型的鲁棒性与准确性。
(4)平均池化层:本实施例中网络模型将产生6种不同尺度的数据特征图,使用平均池化层,按照一定的滤波器尺寸与步长对特征图求平均,从而生成维度更低的特征图,用来提高计算速度,提高模型提取特征的鲁棒性,并缩减模型大小。
(5)分类器:本实施例中使用一层全连接层与Softmax函数来实现多标签分类的分类器。通过全连接层将网络模型最后一层的输出转化为与数据标签大小、维度相同的向量,通过Softmax函数计算输出向量内每一个元素的概率,从而反应出某诊断在某时刻出现的概率。
本发明实施例中,模型训练具体步骤如下:
Step1,构建目标函数。诊断预测属于多标签事件预测任务,其目标函数为:
Step2,将S103所得图结构诊断数据与数据标签随机划分成训练集、验证集与测试集,在划分时保证数据与标签的对应。对网络模型训练,一般进行100轮迭代。
Step3,重复Step2,一般5次,训练至模型收敛,得到已优化的诊断预测模型。
综上所述,本发明实施例的一种基于图卷积神经网络和时序数据的事件预测方法,主要解决现有方法鲁棒性差、无法有效利用知识图谱的问题。具体包括以下步骤:首先,将时序数据转化为包含事件序列的形式,并按照事件间隔将数据集转化为事件集合的序列。其次,对数据内所有事件进行统计后进行编码,将事件映射为低维向量,将上一步所得事件集合转化为向量表示,并获取样本标签。再次,使用领域知识图谱与上一步所得事件集合构建图结构事件序列数据。最后,设计构建一个定制的图卷积神经网络预测模型,使用上一步所得的图结构序列数据训练至收敛后获得事件预测模型。不同于现有方法无法有效利用知识图谱信息提升预测模型的鲁棒性与准确性,本发明公开了一种基于图卷积神经网络的事件预测方法,通过构建图结构事件序列数据,再使用定制的神经网络模型学习数据的空间结构与时间序列特征,最终得到了一个鲁棒、准确的事件预测模型。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员依然可以对本发明的具体实施方式进行修改或者等同替换,这些未脱离本发明精神和范围的任何修改或者等同替换,均在申请待批的本发明的权利要求保护范围之内。
Claims (10)
1.一种基于图卷积神经网络的时序数据事件预测方法,其特征在于,包括以下步骤:
步骤1,采集预设数量的时序数据;对时序数据进行数据清洗,实现初始数据结构统一;
步骤2,将步骤1获得的数据清洗后的时序数据以预定的时间间隔转换成事件序列数据,获得事件与事件集合的向量表示;将事件序列数据中每一条序列样本数据最后一个时刻所包含的事件集合作为预测目标,将其作为对应序列样本标签,得到已标注的事件序列数据;将已标注的事件序列数据划分为训练集、验证集与测试集;
步骤3,根据步骤2获得的训练集、验证集与测试集,以及知识图谱,分别构建时间、空间图结构形式的训练集、验证集与测试集;
步骤4,使用步骤3获得的训练集训练预构建的图卷积神经网络模型,使用验证集验证训练效果并调整网络参数;其中,当图卷积神经网络模型被训练至满足预设定的收敛条件时,使用测试集对模型预测效果进行测试,取测试效果的模型作为最终的事件预测模型;
步骤5,将待预测序列数据输入步骤4获得的事件预测模型中,获得在某一时刻特定事件可能会发生的概率。
2.根据权利要求1所述的一种基于图卷积神经网络的时序数据事件预测方法,其特征在于,步骤1中,所述数据清洗包括:缺失值和异常值处理;其中,处理方式包括舍去、按正常值填充或按前一时刻值填充。
3.根据权利要求1所述的一种基于图卷积神经网络的时序数据事件预测方法,其特征在于,步骤2具体包括:
步骤2.1,将步骤1获得的时序数据按照一定时间间隔划分;
步骤2.2,将步骤2.1所得的已划分时序数据中每个时间间隔内的时序数据转化为相应的事件集合,其中在同一时间间隔内发生的相同事件只记一次,得到具有相同时间间隔的事件序列数据;
步骤2.3,统计事件序列数据中所有事件的数量,以独热码的形式对每一个事件进行编码,表示成一维向量,得到每一个事件的事件向量;
步骤2.4,将每条事件序列数据的每个时间间隔中所包含的事件集合序列表示为事件集合向量,其中所述事件集合序列向量是通过将事件集合内所有事件向量相加获得,从而得到向量形式的事件序列数据;
步骤2.5,对每一条向量形式的事件序列数据,将其最后一个事件间隔的事件集合向量作为该条数据的预测标签,并将此事件集合向量从原始事件序列数据中删除,获得已标注的向量形式事件序列数据。
4.根据权利要求3所述的一种基于图卷积神经网络的时序数据事件预测方法,其特征在于,步骤3具体包括:
步骤3.1,将知识图谱中的边关系用邻接矩阵的形式表示;其中,原本存在于知识图谱中的节点称为祖先节点;
步骤3.2,将步骤2.3统计所得的所有事件作为叶子节点加入知识图谱,并与相应的祖先节点进行连接,获得事件节点与祖先节点的连接关系,得到已扩充的邻接矩阵;同时统计所有事件节点及祖先节点的数量;
步骤3.3,根据步骤3.2所得节点数量对事件节点与祖先节点以独热码的形式进行编码,表示为新的一维向量,得到祖先节点向量以及事件节点向量;再根据步骤3.2所得的已扩充的邻接矩阵,将有连接关系的事件节点向量与祖先节点向量相加,得到新的事件节点向量;
步骤3.4,对步骤2.5所得的已标注的向量形式事件序列数据中每一个时间间隔内的事件子集以新的事件节点想点向量进行表示,得到每条事件序列数据各时间间隔的特征向量;
步骤3.5,对每条向量形式事件序列数据,将其各时间间隔的特征向量按照时间顺序,在时间维度上进行拼接,形成包含时序信息的事件序列特征矩阵。
5.根据权利要求4所述的一种基于图卷积神经网络的时序数据事件预测方法,其特征在于,步骤3.2具体包括:扩充步骤3.1所得邻接矩阵的行和列,扩充数量为所有叶子节点个数;根据叶子节点的连接关系对邻接矩阵进行填充,得到已扩充的邻接矩阵。
6.根据权利要求4所述的一种基于图卷积神经网络的时序数据事件预测方法,其特征在于,步骤4中,所述预构建的图卷积神经网络模型结构包括:
批数据归一化层,用于对采用批次训练的图卷积神经网络模型的输入进行归一化,减小批次训练带来的样本分布偏移;
时间-空间图卷积单元,用于接收时间-空间图结构数据,在图结构的空间域与时域中提取数据特征,输出低维特征图;
通道注意力层,用于在多通道特征图中甄别重要的特征;
平均池化层,用于对不同时间-空间卷积单元产生的不同尺寸特征图进行特征融合;
分类器,用于使用图神经网络模型生成的特征图实现最终的事件预测。
7.根据权利要求6所述的一种基于图卷积神经网络的时序数据事件预测方法,其特征在于,步骤4具体包括:
步骤4.1,预构建的图卷积神经网络模型训练目标函数的表达式为:
步骤4.2,分批次地将输入数据送入图卷积神经网络模型中;其中,输入数据包括由步骤3.1所得邻接矩阵、由步骤3.5所得事件序列特征矩阵以及由步骤2.5所得预测标签;
步骤4.3,根据预设的网络参数进行训练,并根据验证集的验证结果调整网络参数;其中,可调整的参数为:网络模型优化器学习率、随机断开神经元的概率(dropout)、权重衰减系数、时间-空间图卷积单元卷积核尺寸;
步骤4.4,进行迭代训练预设轮之后,保存模型参数;输入测试集数据,获得测试结果;重复执行步骤4.2至步骤4.4,直至模型收敛,将测试结果最优的模型作为最终的事件预测模型。
8.一种基于图卷积神经网络的时序数据事件预测***,其特征在于,包括:
数据采集与预处理模块,用于采集预设数量的时序数据,对时序数据进行数据清洗,实现初始数据结构统一;
知识图谱-数据融合模块,用于将已获得的时序数据转化为向量形式的事件序列数据,并与相关领域知识图谱进行融合,获得隐含信息更加丰富的时图结构时间序列数据;所述知识图谱-数据融合模块以数据采集与预处理模块生成的数据与知识图谱为输入,输出适合图神经网络使用的图结构数据的邻接矩阵与数据初始特征矩阵;
图神经网络模块,用于存储图神经网络模型,完成对模型的训练、验证及测试,并保存测试结果最优的模型用于事件预测任务;所述图神经网络模块通过对由知识图谱-数据融合模块产生的图结构时序数据进行特征提取,获得数据在空间域与时域的隐含特征,学习隐藏模式,并以此为依据,使用历史数据对未来特定事件可能发生的概率进行预测;所述图神经网络模块进行多轮迭代训练,直至模型收敛,训练完成后可由输入的时序数据得到某时刻可能发生特定事件的概率。
9.一种权利要求8所述的基于图卷积神经网络的时序数据事件预测***的应用,其特征在于,用于电子病历数据的诊断预测。
10.根据权利要求9所述的一种基于图卷积神经网络的时序数据事件预测***的应用,其特征在于,包括以下步骤:
步骤S1,获取电子病历数据并进行预处理,获得预处理后的电子病历数据;
步骤S2,将预处理后的电子病历数据以一定时间间隔进行划分,生成诊断序列数据;将每一条诊断序列中每一时间间隔内所包含的所有诊断码作为本时间间隔的诊断码集合,所有诊断码集合按照时间顺序排列;统计诊断序列数据中出现的N个不重复的诊断码,将N个诊断码进行独热编码,生成N个长度为N的1维诊断向量;根据诊断码集合和1维诊断向量,构建诊断码集合的向量表示,获得诊断码集合向量;在模型训练阶段,将每条诊断序列数据中最后一个时间间隔的诊断码集合向量作为预测标签,并从原本的诊断序列中删除,得到已标注的诊断序列数据及其预测标签;对已标注的诊断序列数据进行一定比例的划分,生成训练集、验证集与测试集;
步骤S3,根据步骤S2获得的N个诊断码,查询其存在于医疗领域知识图谱中的所有祖先节点,得到M个祖先节点,以及反映医疗领域知识图谱中节点连接关系的邻接矩阵A;将诊断码与将祖先节点进行独热编码,生成N+M个长度为N+M的1维向量,分别为N个诊断向量与M个祖先节点向量;根据邻接矩阵A中的连接关系,将每一个诊断向量与其有连接关系的祖先节点向量相加,生成新的N个诊断向量;对于步骤S2所得的已标注、已划分的诊断序列数据,将每个时间间隔内的诊断码集合以新的诊断向量进行表示,生成新的诊断码集合向量,并将每一条诊断序列数据中的新的诊断码集合向量按照时间顺序进行堆叠,得到每一条诊断序列数据的初始特征矩阵;
步骤S4,使用步骤S2获得的预测标签、步骤S3获得的诊断序列数据初始特征矩阵训练预构建的图卷积神经网络模型,使用验证集验证训练效果并调整网络参数;其中,当图卷积神经网络模型被训练至满足预设定的收敛条件时,使用测试集对模型预测效果进行测试;通过多次测试,取测试结果最优的模型作为最终的诊断预测模型;
步骤S5,将某病人的历史诊断序列数据输入步骤S4获得的诊断预测模型中,获得病人在本次就诊中可能出现的医学诊断的概率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010124544.4A CN111367961B (zh) | 2020-02-27 | 2020-02-27 | 基于图卷积神经网络的时序数据事件预测方法、***及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010124544.4A CN111367961B (zh) | 2020-02-27 | 2020-02-27 | 基于图卷积神经网络的时序数据事件预测方法、***及其应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111367961A CN111367961A (zh) | 2020-07-03 |
CN111367961B true CN111367961B (zh) | 2023-03-28 |
Family
ID=71206500
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010124544.4A Active CN111367961B (zh) | 2020-02-27 | 2020-02-27 | 基于图卷积神经网络的时序数据事件预测方法、***及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111367961B (zh) |
Families Citing this family (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111949704A (zh) * | 2020-07-17 | 2020-11-17 | 网络通信与安全紫金山实验室 | 一种可解释的多维时序数据分析方法 |
CN111897975A (zh) * | 2020-08-12 | 2020-11-06 | 哈尔滨工业大学 | 一种面向知识图谱表示学习训练的局部训练方法 |
CN111738532B (zh) * | 2020-08-14 | 2021-02-05 | 支付宝(杭州)信息技术有限公司 | 一种事件对对象影响度的获取方法和*** |
CN112085104B (zh) * | 2020-09-10 | 2024-04-12 | 杭州中奥科技有限公司 | 一种事件特征提取方法、装置、存储介质及电子设备 |
CN112328801B (zh) * | 2020-09-28 | 2022-06-14 | 西南电子技术研究所(中国电子科技集团公司第十研究所) | 事件知识图谱预测***件的方法 |
CN114338416B (zh) * | 2020-09-29 | 2023-04-07 | ***通信有限公司研究院 | 一种时空多指标预测方法、装置和存储介质 |
CN112364975B (zh) * | 2020-10-14 | 2023-06-02 | 山东大学 | 基于图神经网络的终端运行状态预测方法及*** |
CN112017776B (zh) * | 2020-10-27 | 2021-01-15 | 平安科技(深圳)有限公司 | 基于动态图和医学知识图谱的疾病预测方法及相关设备 |
CN112201348B (zh) * | 2020-10-28 | 2022-07-26 | 浙江大学 | 基于知识感知的多中心临床数据集适配设备 |
CN112348269A (zh) * | 2020-11-11 | 2021-02-09 | 北京航空航天大学 | 一种融合图结构的时间序列预测建模方法 |
CN112684130A (zh) * | 2020-11-23 | 2021-04-20 | 深圳市水务科技有限公司 | 流域水质预测方法和装置、计算机可读存储介质 |
CN112529685A (zh) * | 2020-11-27 | 2021-03-19 | 百维金科(上海)信息科技有限公司 | 一种基于bas-fnn的贷款用户信用评级方法及*** |
CN112560712B (zh) * | 2020-12-18 | 2023-05-26 | 西安电子科技大学 | 基于时间增强图卷积网络的行为识别方法、装置及介质 |
KR20220091161A (ko) * | 2020-12-23 | 2022-06-30 | 삼성전자주식회사 | 발생될 다음 이벤트를 예측하는 방법 및 디바이스 |
CN112905738B (zh) * | 2021-02-05 | 2022-04-22 | 中山大学 | 一种基于时态知识图谱推理的社交关系演变预测方法 |
CN113095364B (zh) * | 2021-03-12 | 2023-12-19 | 西安交通大学 | 利用卷积神经网络的高铁地震事件提取方法、介质及设备 |
CN113517046B (zh) * | 2021-04-15 | 2023-11-07 | 中南大学 | 一种电子病历中异构数据特征融合方法及基于融合特征的预测方法、***及可读存储介质 |
CN113112004B (zh) * | 2021-04-21 | 2022-12-06 | 上海电力大学 | 一种基于霍克斯过程与图神经网络的时空预测方法 |
CN113239614A (zh) * | 2021-04-22 | 2021-08-10 | 西北工业大学 | 一种大气湍流相位时空预估算法 |
CN113408663B (zh) * | 2021-07-20 | 2022-04-08 | 中国科学院地理科学与资源研究所 | 融合模型构建方法、融合模型使用方法、装置和电子设备 |
CN113962294B (zh) * | 2021-09-30 | 2023-05-16 | 西南电子技术研究所(中国电子科技集团公司第十研究所) | 多类型事件预测模型 |
CN113749622A (zh) * | 2021-09-30 | 2021-12-07 | 杭州电子科技大学 | 基于图卷积神经网络的低通气和呼吸暂停自动识别*** |
CN113762648B (zh) * | 2021-10-26 | 2023-12-19 | 平安科技(深圳)有限公司 | 公卫黑天鹅事件预测方法、装置、设备及介质 |
CN114417721B (zh) * | 2022-01-19 | 2023-03-03 | 北京万旺科技有限公司 | 事件序列预测模型构建方法、预测方法、装置及终端 |
CN114861889B (zh) * | 2022-07-04 | 2022-09-27 | 北京百度网讯科技有限公司 | 深度学习模型的训练方法、目标对象检测方法和装置 |
CN116029408A (zh) * | 2022-09-02 | 2023-04-28 | 深圳计算科学研究院 | 基于时序图规则的事件预测的方法及装置 |
CN116484016A (zh) * | 2023-03-30 | 2023-07-25 | 中国科学院计算机网络信息中心 | 一种基于时序路径自动维护的时序知识图谱推理方法和*** |
CN116682553B (zh) * | 2023-08-02 | 2023-11-03 | 浙江大学 | 一种融合知识与患者表示的诊断推荐*** |
CN117174319B (zh) * | 2023-11-03 | 2024-03-01 | 神州医疗科技股份有限公司 | 一种基于知识图谱的脓毒症时序预测方法及*** |
CN117763485A (zh) * | 2024-02-22 | 2024-03-26 | 福建理工大学 | 一种基于谱图分解的社交网络异常检测方法 |
CN118134232A (zh) * | 2024-05-07 | 2024-06-04 | 暨南大学 | 融合流程图和流程日志的多模态业务流程预测方法及*** |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10474949B2 (en) * | 2014-08-19 | 2019-11-12 | Qualcomm Incorporated | Knowledge-graph biased classification for data |
CN109920501B (zh) * | 2019-01-24 | 2021-04-20 | 西安交通大学 | 基于卷积神经网络和主动学习的电子病历分类方法及*** |
-
2020
- 2020-02-27 CN CN202010124544.4A patent/CN111367961B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN111367961A (zh) | 2020-07-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111367961B (zh) | 基于图卷积神经网络的时序数据事件预测方法、***及其应用 | |
Rama-Maneiro et al. | Deep learning for predictive business process monitoring: Review and benchmark | |
CN110163261B (zh) | 不平衡数据分类模型训练方法、装置、设备及存储介质 | |
Li et al. | DCT-GAN: dilated convolutional transformer-based GAN for time series anomaly detection | |
US11138514B2 (en) | Review machine learning system | |
CN111898689B (zh) | 一种基于神经网络架构搜索的图像分类方法 | |
Yoon et al. | Semi-supervised learning with deep generative models for asset failure prediction | |
CN110674604A (zh) | 基于多维时序帧卷积lstm的变压器dga数据预测方法 | |
CN110334208B (zh) | 基于贝叶斯信念网络的lkj故障预测诊断方法和*** | |
CN110956309A (zh) | 基于crf和lstm的流程活动预测方法 | |
CN114757432A (zh) | 基于流程日志和多任务学习的未来执行活动及时间预测方法及*** | |
CN114723003A (zh) | 一种基于时序卷积和关系建模的事件序列预测方法 | |
CN112041880A (zh) | 用于评估信用风险的深度学习方法 | |
CN115391553A (zh) | 一种自动搜索时序知识图谱补全模型的方法 | |
CN116821646A (zh) | 数据处理链构建方法、数据缩减方法、装置、设备及介质 | |
CN114721898A (zh) | 基于boosting算法的边缘云服务器利用率预测方法、预测装置及存储介质 | |
CN112712855B (zh) | 一种基于联合训练的含缺失值基因微阵列的聚类方法 | |
Cui et al. | Automed: automated medical risk predictive modeling on electronic health records | |
CN116662307A (zh) | 一种基于多源数据融合的智能预警方法、***及设备 | |
CN116777452A (zh) | 智能电表的预付费***及其方法 | |
CN116703568A (zh) | ***异常交易识别方法及装置 | |
CN116910526A (zh) | 模型训练方法、装置、通信设备及可读存储介质 | |
CN115391523A (zh) | 风电场多源异构数据处理方法及装置 | |
CN115393098A (zh) | 理财产品信息推荐方法及装置 | |
Bashar et al. | Algan: Time series anomaly detection with adjusted-lstm gan |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |