CN110335160A

CN110335160A - 一种基于分组和注意力改进Bi-GRU的就医迁移行为预测方法及***

Info

Publication number: CN110335160A
Application number: CN201910599649.2A
Authority: CN
Inventors: 史玉良; 程林; 张坤; 王新军
Original assignee: Shandong University
Current assignee: Shandong University
Priority date: 2019-07-04
Filing date: 2019-07-04
Publication date: 2019-10-15
Anticipated expiration: 2039-07-04
Also published as: CN110335160B

Abstract

本公开公开了一种基于分组和注意力改进Bi‑GRU的就医迁移行为预测方法及***，该方法包括：接收医保数据，提取与就医迁移行为关联度大于预设关联度阈值的特征；根据就医迁移行为特征及其相应权重构建人群分类树，进行人群分组；根据历史就医数据计算各类人群历史患病概率趋势，采用自回归和灰色算法并结合标准差权重组合法构建疾病预测模型；构建Bi‑GRU模型；接收各医院就医数据，基于Bi‑GRU获取的就医迁移状态预测数据，采用注意力机制生成各就医迁移序列的匹配权重，更新权重值；进行Bi‑GRU模型的训练；将输出的预测结果与实际就医迁移行为进行对比，反馈更新底层数据信息，进一步更新权重值，进行就医迁移行为预测。

Description

一种基于分组和注意力改进Bi-GRU的就医迁移行为预测方法及***

技术领域

本公开属于医保信息处理的技术领域，涉及一种基于分组和注意力改进Bi-GRU的就医迁移行为预测方法及***。

背景技术

本部分的陈述仅仅是提供了与本公开相关的背景技术信息，不必然构成在先技术。

就医迁移，一般指参保人在参保统筹地区以外的其他地区发生的就医行为。近年来，随着流动人口的急剧膨胀，发生就医迁移的人数也越来越多。由于各个医院治疗水平和报销政策的差异，引发个体向更高治疗水平和报销政策更优惠的医院就医，造成了医院资源浪费。因此，如何对医保大数据进行分析，挖掘出隐藏在医保大数据中的参保人就医规律，构建就医迁移预测模型，为医保资金分配和医疗资源优化调度提供决策支撑，成为医保领域中一个重要的研究问题。

医保领域中就医行为传统的预测方法是整体预测模型。也就是说，使用所有可用的训练数据来构建全局模型，然后使用该模型对每个参保人进行预测。应用整体预测模型的好处是它可以捕获所有训练人群的整体信息。然而，参保人本身的属性不同以及所在地区的发展水平也不同，发生就医迁移的情况可能也会不同，使用整体预测模型可能会遗漏一些对不同群体重要的特定信息。因此，为不同的群体分别建立预测模型对就医行为的研究来说是相当重要的。

近年来，随着医保信息技术领域的推进，由于循环神经网络(Recurrent NeuralNetworks，RNNs)可基于就医记录序列而实现时序关联预测，故被广泛应用于就医预测建模中。然而，发明人在研究过程中发现，RNNs不能有效地解决就医序列之间的长时间依赖表达关系，如当病人的就医序列时间间隔过大时，RNNs模型的预测性能就会下降。

发明内容

针对现有技术中存在的不足，本公开的一个或多个实施例提供了一种基于分组和注意力改进Bi-GRU的就医迁移行为预测方法及***,。

根据本公开的一个或多个实施例的一个方面，提供一种基于分组和注意力改进Bi-GRU的就医迁移行为预测方法。

一种基于分组和注意力改进Bi-GRU的就医迁移行为预测方法，该方法包括：

接收医保数据，提取与就医迁移行为关联度大于预设关联度阈值的特征，得到就医迁移行为特征；

根据就医迁移行为特征及其相应权重采用C4.5算法构建人群分类树，根据人群分类树进行人群分组；

根据医保数据的历史就医数据计算各类人群历史患病概率趋势，采用自回归和灰色算法并结合标准差权重组合法构建疾病预测模型，进行不同人群分组的疾病预测；

在疾病预测已经完成的前提下，利用就医迁移行为特征及其对应权重构建Bi-GRU模型；

接收各医院就医数据，基于Bi-GRU获取的就医迁移状态预测数据，采用注意力机制生成各就医迁移序列的匹配权重，更新Bi-GRU模型的权重值；

利用就医迁移状态预测向量，构建softmax预测函数；计算softmax预测函数输出值的损失函数，采用反向传播算法训练Bi-GRU的学习参数，完成Bi-GRU模型的训练；

将Bi-GRU模型训练输出的预测结果与实际就医迁移行为进行对比，反馈更新底层数据信息，进一步更新Bi-GRU模型的权重值，进行就医迁移行为预测。

进一步地，该方法还包括：对接收的医保数据进行数据预处理，包含数据清洗、缺失数据补全、数据定义以及规范化处理。

进一步地，在该方法中，所述提取与就医迁移行为关联度大于预设关联度阈值的特征的具体步骤包括：

将预处理后的医保数据利用灰色关联分析法计算特征相关统计量；

设定相关统计量阈值作为预设关联度阈值，提取与就医迁移行为关联度大于预设关联度阈值的特征。

进一步地，在该方法中，在所述Bi-GRU模型训练时，采用交叉熵作为预测模型的损失函数进行Bi-GRU模型的训练。

进一步地，在该方法中，所述Bi-GRU模型采用Attention机制；

将Bi-GRU模型训练输出的预测结果与实际就医迁移行为进行对比后，基于预测结果的可解释性反馈调整Bi-GRU模型Attention机制中各个就医序列的权重值，将就医迁移状态预测数据中每个维度的权重按照逆序排序，选择权重靠前的预设数量的数据，反馈调整所述Bi-GRU模型中就医记录对就医迁移行为预测的重要度。

根据本公开的一个或多个实施例的一个方面，提供一种计算机可读存储介质。

一种计算机可读存储介质，其中存储有多条指令，所述指令适于由终端设备的处理器加载并执行所述的一种基于分组和注意力改进Bi-GRU的就医迁移行为预测方法。

根据本公开的一个或多个实施例的一个方面，提供一种终端设备。

一种终端设备，其包括处理器和计算机可读存储介质，处理器用于实现各指令；计算机可读存储介质用于存储多条指令，所述指令适于由处理器加载并执行所述的一种基于分组和注意力改进Bi-GRU的就医迁移行为预测方法。

根据本公开的一个或多个实施例的一个方面，提供一种基于分组和注意力改进Bi-GRU的就医迁移行为预测装置。

一种基于分组和注意力改进Bi-GRU的就医迁移行为预测装置，基于所述的一种基于分组和注意力改进Bi-GRU的就医迁移行为预测方法，包括：

特征提取模块，被配置为接收医保数据，提取与就医迁移行为关联度大于预设关联度阈值的特征，得到就医迁移行为特征；

人群分组模块，被配置为根据就医迁移行为特征及其相应权重采用C4.5算法构建人群分类树，根据人群分类树进行人群分组；

疾病预测模块，被配置为根据医保数据的历史就医数据计算各类人群历史患病概率趋势，采用自回归和灰色算法并结合标准差权重组合法构建疾病预测模型，进行不同人群分组的疾病预测；

就医迁移预测模块，被配置为在疾病预测已经完成的前提下，利用就医迁移行为特征及其对应权重构建Bi-GRU模型；

权重更新模块，被配置为接收各医院就医数据，基于Bi-GRU获取的就医迁移状态预测数据，采用注意力机制生成各就医迁移序列的匹配权重，更新Bi-GRU模型的权重值；

预测模型训练模块，被配置为利用就医迁移状态预测向量，构建softmax预测函数；计算softmax预测函数输出值的损失函数，采用反向传播算法训练Bi-GRU的学习参数，完成Bi-GRU模型的训练；

反馈更新模块，被配置为将Bi-GRU模型训练输出的预测结果与实际就医迁移行为进行对比，反馈更新底层数据信息，进一步更新Bi-GRU模型的权重值，进行就医迁移行为预测。

进一步地，该装置中还包括数据预处理，被配置为对接收的医保数据进行数据预处理，包含数据清洗、缺失数据补全、数据定义以及规范化处理。

进一步地，在该装置中，所述特征提取模块还被配置为将预处理后的医保数据利用灰色关联分析法计算特征相关统计量；设定相关统计量阈值作为预设关联度阈值，提取与就医迁移行为关联度大于预设关联度阈值的特征。

进一步地，在该装置中，所述预测模型训练模块还被配置为：在所述Bi-GRU模型训练时，采用交叉熵作为预测模型的损失函数进行Bi-GRU模型的训练。

进一步地，在该装置中，所述权重更新模块还被配置为：将Bi-GRU模型训练输出的预测结果与实际就医迁移行为进行对比后，基于预测结果的可解释性反馈调整Bi-GRU模型Attention机制中各个就医序列的权重值，将就医迁移状态预测数据中每个维度的权重按照逆序排序，选择权重靠前的预设数量的数据，反馈调整所述Bi-GRU模型中就医记录对就医迁移行为预测的重要度。

本公开的有益效果：

(1)本公开提供的一种基于分组和注意力改进Bi-GRU的就医迁移行为预测方法及***，通过对近年来就医行为数据的分析，采用灰色关联分析算法提取与就医迁移行为高关联度的特征，并基于筛选出的特征并结合C4.5算法构建人群分类树，根据分类规则实现迁移人群分组。

(2)本公开提供的一种基于分组和注意力改进Bi-GRU的就医迁移行为预测方法及***，以历史医保数据为基础，根据各类人群历史患各类疾病的概率趋势，通过自回归模型和灰色模型算法，预测某类型参保人未来的患病情况。考虑到单一预测模型的预测性能问题，采用标准差法确定组合权重，构建组合预测模型，预测某类型参保人未来的患病情况。

(3)本公开提供的一种基于分组和注意力改进Bi-GRU的就医迁移行为预测方法及***，针对具有时序性和长期依赖性的就医序列，采用Bi-GRU预测患者未来就医迁移行为的选择意向，一方面以内循环的方式将上一时间点的输入以记忆的形式存储起来，并作为下一步预测输出的输入数据；另一方面采用“门”操作理念，将链式传输过程中产生的输出误差以参数的形式在网络中流动，避免梯度***或者梯度消失问题，从而保持就医记录的长期依赖关联稳定性，此外，引入注意力机制，通过注意力分数决定不同时刻的就医状态的被更新力度，从而提高模型的预测性能。

附图说明

构成本申请的一部分的说明书附图用来提供对本申请的进一步理解，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。

图1是本公开一个或多个实施例提供的就医迁移行为预测方法的整体流程图；

图2为本公开一个或多个实施例提供的基于灰色关联分析方法的就医迁移行为特征提取流程图；

图3为本公开一个或多个实施例提供的就医迁移人群分组方法的流程图；

图4为本公开一个或多个实施例提供的基于自回归和灰色模型的疾病预测方法的处理流程图；

图5为本公开一个或多个实施例提供的以Bi-GRU为核心的数据流处理过程图；

图6为本公开一个或多个实施例提供的就行迁移行为预测实施例流程图；

图7为本公开一个或多个实施例提供的就医迁移行为预测装置结构示意图；

图8为本公开一个或多个实施例提供的模型预测结果对比图。

具体实施方式：

下面将结合本公开的一个或多个实施例中的附图，对本公开的一个或多个实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本公开一部分实施例，而不是全部的实施例。基于本公开的一个或多个实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本公开保护的范围。

应该指出，以下详细说明都是例示性的，旨在对本申请提供进一步的说明。除非另有指明，使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本申请的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

需要注意的是，附图中的流程图和框图示出了根据本公开的各种实施例的方法和***的可能实现的体系架构、功能和操作。应当注意，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，所述模块、程序段、或代码的一部分可以包括一个或多个用于实现各个实施例中所规定的逻辑功能的可执行指令。也应当注意，在有些作为备选的实现中，方框中所标注的功能也可以按照不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，或者它们有时也可以按照相反的顺序执行，这取决于所涉及的功能。同样应当注意的是，流程图和/或框图中的每个方框、以及流程图和/或框图中的方框的组合，可以使用执行规定的功能或操作的专用的基于硬件的***来实现，或者可以使用专用硬件与计算机指令的组合来实现。

在不冲突的情况下，本公开中的实施例及实施例中的特征可以相互组合，下面结合附图与实施例对本公开作进一步说明。

实施例一

在实际的就医迁移预测过程中，患病预测是人群发生就医迁移的先验条件。针对上述提出的问题，本公开的一个或多个实施例旨在解决以下几个关键性问题：分析哪些因素会影响就医迁移；如何根据影响因素进行人群分组；如何对不同人群分别进行就医迁移预测以及如何体现出时间因素对就医迁移情况的影响。

根据本公开的一个或多个实施例的一个方面，提供一种基于分组和注意力改进Bi-GRU的就医迁移行为预测方法。该方法首先采用灰色关联分析法(Grey RelationAnalysis，GRA)分析出影响就医迁移的因素集合。为了挖掘易发生就医迁移的人群，根据分析出的影响因素，并结合决策树模型，构建分类树，实现人群分组，然后分别对不同人群分别建立预测模型。在实际的就医迁移预测过程中，患病预测是人群发生就医迁移的先验条件。因此，该方法会根据各类人群历史患各类疾病的概率趋势，利用自回归和灰色算法实现参保人群的疾病预测。

然而，考虑到单一预测算法的预测性能问题，本公开的一个或多个实施例在多个算法的基础上，采用标准差权重组合法，构建疾病预测模型，预测迁移人群未来的患病情况。在患病迁移预测方面，我们提出了基于注意力改进的Bi-GRU模型。该模型采用双向门控循环单元(Bi-directional Gated Recurrent Unit，Bi-GRU)来记忆历史样本某节点的历史记录信息与未来发展趋势间的隐含信息，并引入注意机制来测量不同访问的关系以进行预测，从而提高模型的预测性能。

如图1和图6所示，一种基于分组和注意力改进Bi-GRU的就医迁移行为预测方法，该方法包括：

步骤A：接收医保数据，提取与就医迁移行为关联度大于预设关联度阈值的特征，得到就医迁移行为特征；

步骤B：根据就医迁移行为特征及其相应权重采用C4.5算法构建人群分类树，根据人群分类树进行人群分组；

步骤C：根据医保数据的历史就医数据计算各类人群历史患病概率趋势，采用自回归和灰色算法并结合标准差权重组合法构建疾病预测模型，进行不同人群分组的疾病预测；

步骤D：在疾病预测已经完成的前提下，利用就医迁移行为特征及其对应权重构建Bi-GRU模型；

步骤E：接收各医院就医数据，基于Bi-GRU获取的就医迁移状态预测数据，采用注意力机制生成各就医迁移序列的匹配权重，更新Bi-GRU模型的权重值；

步骤F：利用就医迁移状态预测向量，构建softmax预测函数；计算softmax预测函数输出值的损失函数，采用反向传播算法训练Bi-GRU的学习参数，完成Bi-GRU模型的训练；

步骤G：将Bi-GRU模型训练输出的预测结果与实际就医迁移行为进行对比，反馈更新底层数据信息，进一步更新Bi-GRU模型的权重值，进行就医迁移行为预测。

在本公开的一个或多个实施例步骤A中，对参保人信息和医院信息进行有关医保海量数据的采集，包含历史数据和当前就医数据，对获取的海量医保数据进行数据预处理，包含数据清洗、缺失数据补全、数据定义并存储。

具体地，基于某市某地区的社保***获取就医历史数据为应用实例，将该地区2012-2016年历史就医数据作为训练样本，将2017年数据作为实验样本，并且根据ICD-10标准，将就医类别分为21大类。这些数据集中包含了498080万条的就医记录，其中，发生迁移的病人有31130人，疾病种类数量21大类，迁移至医院就诊的医院数量有44家。如表1所示，为历史就医数据集统计示例。

表1就医类别数据集的基本统计信息

搜集某市某地区的2012年～2016年的参保人员样本分别从参保人和医院两个方面研究影响就医迁移行为的因素，得出如下主要因素：年龄、性别、参保类别、经济收入、疾病类别、医院级别、医院治疗疾病的治疗复杂度(平均日均花费、平均住院天数)、就诊率、一段时间内医院的最大住院数，获取海量医保数据中可能影响就医迁移行为的部分因素集如表2所示：

表2.医保数据中可能影响就医迁移行为的部分因素集

在本公开的一个或多个实施例步骤B中，对海量医保数据进行规范化处理，基于灰色关联分析法(Grey Relation Analysis,GRA)进行影响就医因素的特征选择，消除特征的冗余并提取与就医迁移行为高关联度的特征。

其中，对获取的数据进行数据预处理，包含缺失值处理、数据归一化，并采用卡方检验进行简单的相关性分析，消除重复影响因素及因子选择的任意性，降低问题的复杂性，从而消除特征的冗余并选择更多信息变量以提高预测模型的准确率和效率。

针对获取的医保数据样本，根据灰色关联分析法，判别特征选择的结果如下所示。表3显示了通过GRA算法计算部分筛选特征与就医迁移行为之间的相关统计量，并且按统计量从高到低排序，设置阈值(＝0.5)以排除一些无信息的特征。在实验中，GRA获得的前11个特征被视为信息特征。此外，还可以得出结论，医院治疗疾病的治疗水平(平均日均花费、平均住院天数)、医院级别以及患者的经济收入对影响患者发生就医迁移的程度更大。

表3.部分就医迁移行为的筛选特征及相关统计量

影响因素	关联度
		平均日均花费	0.9498
平均住院天数	0.9084
		医院级别	0.8877
经济收入	0.8273
		年龄	0.7909
就诊率	0.6599
		疾病类别	0.6133
性别	0.5945
		参保类别	0.5510
一段时间内医院的最大住院数	0.5133
		距离	0.5087
行业类别	0.4766
		参保地点	0.4587

具体地，如图2所示，所述步骤B中基于灰色关联分析法(Grey RelationAnalysis,GRA)进行影响就医因素的特征选择的一般生成过程为：

B1.定义医保数据中所有的就医类别编码为c₁,c₂,…,c_|C|∈C，其中|C|为就医类别编码的数量，假设有N个患者样本数据，第N个患者样本数据有T⁽ⁿ⁾条就医记录，则一个患者样本数据可由就医序列表示为X₁，X₂,…,X_T(n)，每个就医记录包含一组特征向量x∈R^|C|，并根据国际标准(ICD-10)将疾病划分为21类；

B2.对就医行为样本数据进行规范化处理，采用min-max标准化方法对原始医保数据X进行归一化处理，特征数据取值为[0,1]；

B3.假设原样本中各个特征就医数据经均值化变化后的***参考序列为X₀＝(x₀(1),x₀(2),……,x₀(n))，将是否发生就医迁移设为比较序列为X_k＝(x_k(1),x_k(2),……,x_k(n))，i＝1,2,…..,m。则X₀与X_k的相关系数的计算公式如下：

式中，δ_i(k)表示x_i对x₀在K个数据上的关联度系数。ρ表示分辨系数(ρ＝0.5)；

B4.各个因素与是否发生迁移的关联度θ

最后，我们可以通过对关联度θ进行排序，根据排序大小选出影响就医迁移的主要特征集合。输出筛选的特征及其对应的特征权重向量W。

在本公开的一个或多个实施例步骤C中，根据筛选的就医迁移行为特征及其对应的特征权重，采用决策树-C4.5算法，以是否发生迁移为分类标准，构建分类树，通过分类规则挖掘出易发生迁移的人群。与传统的决策树算法不同的是，考虑了特征权重对分类结果的影响，因此在C4.5算法的基础上，将信息增益率与特征权重相结合，共同影响分类结果。如图3所示。

定义Z表示训练数据集，Z_i表示通过特征A将Z划分为v个子集i＝1,2,…,v。所述步骤C中构建人群分类树实现迁移人群分组的一般生成过程为：

C1.基于步骤B对历史训练样本进行样本特征提取，并采用C4.5算法构建人群分类树，计算信息增益如下所示：

C2.基于步骤C1计算的信息增益，计算信息增益率，如下所示：

C3.基于步骤C2计算的信息增益率，并结合步骤B得出的特征权重W，共同影响分类权重，如下所示；

GainRatio′(Z,A,θ)＝WGainRatio(Z,A) (6)

通过步骤C3计算各个特征信息增益率GainRatio′，从中选择信息增益率最大的作为分类结点，依次类推，构造分类树，根据分类规则，实现人群分组，然后对不同群体分别建立预测模型。

在本公开的一个或多个实施例步骤D中，根据各组人群历史患各类疾病的概率趋势，利用自回归和灰色算法实现参保人群的疾病预测。然而，考虑到单一预测模型的预测性能问题，采用标准差法确定组合权重，构建组合预测模型，预测某类型参保人未来的患病情况。如图4所示，组合预测模型构建的过程为：

D1.定义y_i表示患第i类疾病的概率，其中i＝1,2,…21。自回归模型生成公式如下：

式中，c是常数项。是一个记忆函数。ε_t被假设为平均数等于0，标准差等于σ的随机误差值；σ被假设为对于任何的t都不变。

D2.灰色模型生成公式如下：

x⁽⁰⁾(k)+ay⁽¹⁾(k)＝b，k＝2,3,… (8)

D3.基于步骤D1和步骤D2，采用标准差权重组合法构建组合预测模型，计算公式如下：

式中，设自回归预测模型和灰色模型的预测误差的标准差分别为τ₁，τ₂，且m为模型个数，y为组合预测值；y₁为自回归模型预测值；y₂为灰色模型预测值。

基于步骤D3预测某类型参保人未来的患病情况，与单个预测模型比起来，该组合模型的预测性能更好。

以历史医保数据为基础，根据各类人群历史患各类疾病的概率趋势，通过自回归模型或灰色模型等算法，采用标准差法确定组合权重，构建组合预测模型，预测某类型参保人未来患某类疾病的概率。图8描述的是利用自回归预测模型、灰色预测模型以及组合预测模型这三种模型对2017年某类人群患各类疾病的预测情况。由图8可知，组合预测模型的预测效果比其他两个单独模型的预测效果好。

在本公开的一个或多个实施例步骤E中，基于步骤D中疾病预测完成的前提下，根据筛选的就医迁移行为特征提取，采用embedding映射提取历史就医样本的特征向量集，构建Bi-GRU实现正反两个方向的就医信息的就医迁移状态预测，进而设定就医迁移状态预测阈值，输出就医迁移状态预测结果，如图5所示。

具体地，训练模型采用Adadelta优化器，样本数据集随机分配比例为0.75,0.1,0.15，分别作为训练集、验证集和实验集，初始化θ和u值分别为1和0.1，Embedding层的维度m为100，初始设置基于疾病类别等级设置GRU的就医状态维度为100，迭代次数阈值为200次。

所述步骤E中构建Bi-GRU实现正反两个方向的就医迁移状态预测的一般生成过程为：

E1.基于步骤B获取的样本特征，对历史训练样本进行样本特征提取，并采用embedding层将特征数据映射为索引表示，构建特征-索引映射矩阵，如给定一个就医序列X_i(i＝1,2,…,|C|)，通过embedding映射，得到对应的低维稠密的向量集合v∈R^K，如下所示：

v＝A^Tx (10)

式中，K为embedding层的维度，A∈R^|C|·K表示特征映射矩阵；

E2.考虑到GRU比LSTM结构简单，参数较少的特点，基于低维特征向量集合v，构建由重置门、更新门组成的GRU，模型构建原理过程如下：

r_t＝σ(W_rx_t+U_rh_t-1) (11)

π_t＝σ(W_πx_t+U_πh_t-1) (12)

式中，h_t,r_t和π_t分别是d维度的隐状态，重置门和更新门。W_r,W_π,W_c和U_r,U_π,U是GRU的参数。σ是sigmoid函数；

E3.基于步骤E2构建的Bi-GRU，正向GRU读取从v₁到v_T就医序列计算出一系列正向就医迁移预测状态反向GRU读取从v_T到v₁就医序列计算出一系列反向就医迁移预测状态并采用数据加权求和获取最终就医迁移状态向量H_t，

式中，和分别表示t时刻正向和反向的就医迁移状态预测数据，由于在实际就医迁移状态预测过程中，仅可以获取正向数据，故以正向预测数据作为预测定量标准，以反向数据作为阈值设定标准，为根据正反向获取的最终就医迁移状态向量，H_t传输至Attention机制。

在本公开的一个或多个实施例步骤F中，基于Bi-GRU获取的就医迁移状态预测数据，结合底层传输的各医院就医分布数据概率统计获取的权重矩阵W，采用注意力(Attention)机制更新各个就医序列内部状态的权重值，即：

u_t＝tanh(WH_t+b) (16)

δ＝∑_ta_tH_t (18)

其中，W∈R^L×|C|和b∈R^L分别表示权重矩阵和基本矩阵，u_t代表就医记录的重要性向量，a_t表示通过公式(17)归一化的就医记录的权重。δ是a_t和H_t权重的总和；

结合Attention机制获取的就医序列匹配权重，则就医迁移状态最终的输出向量为：

在本公开的一个或多个实施例步骤G中，基于历史样本训练集数据输出的隐状态最终的输出向量构建softmax预测函数，预测结果为：

式中，W_c∈R^2L和b_c∈R^L是可以学习的参数向量，基于历史训练样本集数据；

对待预测样本进行就医迁移行为预测，将预测结果进行推送，并与实际就医迁移行为进行结果对比，表4描述了就医迁移预测中方法的准确性和F1-score：

表4就医迁移行为预测的准确性和F1-score

预测方法	准确性	F1-score
			MLR	0.6224	0.565063
Naive Bayes	0.6178	0.563988
			SVM	0.6588	0.620159
RNNs	0.6837	0.641778
			Bi-GRU	0.7018	0.659382
GABi-GRU	0.7595	0.717276

基于表4中的结果可得，本实施例所提出的就医迁移预测模型的预测性能优于其他预测方法。

实施例二

实施例三

这些计算机可执行指令在设备中运行时使得该设备执行根据本公开中的各个实施例所描述的方法或过程。

在本实施例中，计算机程序产品可以包括计算机可读存储介质，其上载有用于执行本公开的各个方面的计算机可读程序指令。计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身，诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如，通过光纤电缆的光脉冲)、或者通过电线传输的电信号。

本公开所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备，或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令，并转发该计算机可读程序指令，以供存储在各个计算/处理设备中的计算机可读存储介质中。

用于执行本公开内容操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码，所述编程语言包括面向对象的编程语言—诸如C++等，以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中，通过利用计算机可读程序指令的状态信息来个性化定制电子电路，例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA)，该电子电路可以执行计算机可读程序指令，从而实现本公开内容的各个方面。

实施例四

如图7所示，一种基于分组和注意力改进Bi-GRU的就医迁移行为预测装置，基于所述的一种基于分组和注意力改进Bi-GRU的就医迁移行为预测方法，包括：

应当注意，尽管在上文的详细描述中提及了设备的若干模块或子模块，但是这种划分仅仅是示例性而非强制性的。实际上，根据本公开的实施例，上文描述的两个或更多模块的特征和功能可以在一个模块中具体化。反之，上文描述的一个模块的特征和功能可以进一步划分为由多个模块来具体化。

以上所述仅为本申请的优选实施例而已，并不用于限制本申请，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。因此，本公开将不会被限制于本公开所示的这些实施例，而是要符合与本公开所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种基于分组和注意力改进Bi-GRU的就医迁移行为预测方法，其特征在于，该方法包括：

2.如权利要求1所述的一种基于分组和注意力改进Bi-GRU的就医迁移行为预测方法，其特征在于，该方法还包括：对接收的医保数据进行数据预处理，包含数据清洗、缺失数据补全、数据定义以及规范化处理。

3.如权利要求1所述的一种基于分组和注意力改进Bi-GRU的就医迁移行为预测方法，其特征在于，在该方法中，所述提取与就医迁移行为关联度大于预设关联度阈值的特征的具体步骤包括：

4.如权利要求1所述的一种基于分组和注意力改进Bi-GRU的就医迁移行为预测方法，其特征在于，在该方法中，在所述Bi-GRU模型训练时，采用交叉熵作为预测模型的损失函数进行Bi-GRU模型的训练。

5.如权利要求1所述的一种基于分组和注意力改进Bi-GRU的就医迁移行为预测方法，其特征在于，在该方法中，所述Bi-GRU模型采用Attention机制；

6.一种计算机可读存储介质，其中存储有多条指令，其特征在于，所述指令适于由终端设备的处理器加载并执行如权利要求1-5任一项所述的一种基于分组和注意力改进Bi-GRU的就医迁移行为预测方法。

7.一种终端设备，其包括处理器和计算机可读存储介质，处理器用于实现各指令；计算机可读存储介质用于存储多条指令，其特征在于，所述指令适于由处理器加载并执行如权利要求1-5任一项所述的一种基于分组和注意力改进Bi-GRU的就医迁移行为预测方法。

8.一种基于分组和注意力改进Bi-GRU的就医迁移行为预测装置，其特征在于，基于如权利要求1-5任一项所述的一种基于分组和注意力改进Bi-GRU的就医迁移行为预测方法，包括：

9.如权利要求8所述的一种基于分组和注意力改进Bi-GRU的就医迁移行为预测装置，其特征在于，该装置中还包括数据预处理，被配置为对接收的医保数据进行数据预处理，包含数据清洗、缺失数据补全、数据定义以及规范化处理。

10.如权利要求8所述的一种基于分组和注意力改进Bi-GRU的就医迁移行为预测装置，其特征在于，在该装置中，所述特征提取模块还被配置为将预处理后的医保数据利用灰色关联分析法计算特征相关统计量；设定相关统计量阈值作为预设关联度阈值，提取与就医迁移行为关联度大于预设关联度阈值的特征。

和/或，在该装置中，所述预测模型训练模块还被配置为：在所述Bi-GRU模型训练时，采用交叉熵作为预测模型的损失函数进行Bi-GRU模型的训练。

和/或，在该装置中，所述权重更新模块还被配置为：将Bi-GRU模型训练输出的预测结果与实际就医迁移行为进行对比后，基于预测结果的可解释性反馈调整Bi-GRU模型Attention机制中各个就医序列的权重值，将就医迁移状态预测数据中每个维度的权重按照逆序排序，选择权重靠前的预设数量的数据，反馈调整所述Bi-GRU模型中就医记录对就医迁移行为预测的重要度。