CN106709588B

CN106709588B - 预测模型构建方法和设备以及实时预测方法和设备

Info

Publication number: CN106709588B
Application number: CN201510778908.XA
Authority: CN
Inventors: 祁仲昂; 刘博�; 胡卫松
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2015-11-13
Filing date: 2015-11-13
Publication date: 2022-05-17
Anticipated expiration: 2035-11-13
Also published as: CN106709588A

Abstract

本公开涉及预测模型构建方法和设备以及实时预测方法和设备。所述预测模型构建方法包括：识别待训练数据中的多种不同的关联模式，其中多种不同的关联模式描述待训练数据中的影响因素与目标数据之间的多种不同的关联关系；利用与多种不同的关联模式相对应的多组数据分别进行训练，以得到适用于多种不同的关联模式的多个子预测模型；以及根据待训练数据构建多种不同的关联模式之间的关联模式转移模型，其中关联模式转移模型用于在预测过程中确定多个不同的子预测模型与待预测数据之间的匹配度。根据本公开的实施方式，可以得到与多种数据特征对应的多个预测模型，因此在预测时可以基于数据自身特征动态调整各个预测模型的权重，从而提高预测精度。

Description

预测模型构建方法和设备以及实时预测方法和设备

技术领域

本公开涉及预测技术领域，更特别地涉及一种用于构建预测模型的方法和设备以及用于执行实时预测的方法和设备。

背景技术

预测技术是当下的一个热点研究问题。预测技术可以在各个领域得到广泛应用，诸如空气质量预测、气候预测、交通流量预测等。根据数据的特点和预测的问题的不同，已经提出了各种不同的预测模型，例如基于参数的时间序列预测、神经网络、回归分析等。

传统的预测模型通常采用全局建模的方式，即利用一个统一的模型涵盖各种预测过程，并对自变量与因变量之间的关系进行建模。然而，数据中变量间的关联模式随着时间、空间的不同通常有着较大变化，而这类统一的模型难以涵盖数据中的所有情况，尤其是数据中的稀有事件。而这些事件往往会是预测中需要特别关注的重点，例如空气质量预测中的重度污染预测、交通流中的事故预测等。

传统的预测方法，如神经网络、回归分析等方法，通常首先采集一些真实数据作为样本，以用于训练模型，然后用训练好的模型进行预测。这样预测的准确度非常依赖于训练时所用样本数据的数量和质量。而且待预测的数据与训练样本特征差异较大时，其预测结果往往是不准确的。

多模型预测是传统的空气质量预测多采用的预测方式，这种预测方式已经被证明是有效的。例如，在US6535817B1中公开了一种基于多回归模型的气候预测方式。根据该专利中提出的技术方案，在训练过程中，首先针对历史气候数据执行预处理，以使其满足模型的输入和输出形式；接着随机地将数据划分为N个分组；然后，针对这N个分组进行训练以得到相应的N个预测模型；随后，基于历史气候数据针对这N个相应的预测模型进行评估，以便获得他们各自的历史性能。而在预测过程中，针对实时数据采用N个预测模型进行预测，以得到N个预测结果；然后，基于各个预测模型的历史性能对这N个预测结果进行加权平均；最后，将得到的平均结果作为最终预测结果进行存储。

在上述的美国专利所提出的技术中，采用了历史性能作为模型性能的度量。然而，实时预测是一个相当复杂的问题，例如对于空气质量而言，它不但受到最近历史空气质量因素和交通因素的影响，而且还受到实时气象因素的影响。因而，包括上述专利在内的现有技术中基于多模型的预测方法目前对于实时预测而言有效性仍然不太理想，其预测结果的准确性和可靠性依然较低。

为此，在现有技术中存在针对实时预测技术的方案进行改进的需要。

发明内容

有鉴于此，本公开公开了一种用于构建预测模型的方法和设备以及用于执行实时预测的方法和设备，以至少部分上消除或者缓解上述问题。

根据本公开的第一方面，提供了一种用于构建预测模型的方法。该方法包括：识别待训练数据中的多种不同的关联模式，其中所述多种不同的关联模式描述所述待训练数据中的影响因素与目标数据之间的多种不同的关联关系；利用与所述多种不同的关联模式相对应的多组数据分别进行训练，以得到适用于所述多种不同的关联模式的多个子预测模型；以及根据所述待训练数据构建所述多种不同的关联模式之间的关联模式转移模型。所述关联模式转移模型用于在预测过程中确定所述多个不同的子预测模型与待预测数据之间的匹配度。

在根据本公开的第一方面的实施方式中，所述识别待训练数据中的多种不同的关联模式包括：将所述待训练数据按照时间划分为多个数据分段；学习所述多个数据分段中的各个数据分段的关联模式；以及通过合并相似的关联模式和对应的数据分段来确定所述多种不同的关联模式。

在根据本公开的第一方面的另一实施方式中，所述确定所述多种不同的关联模式包括：基于层次聚类对所述各个数据分段的关联模式进行聚类。

在根据本公开的第一方面的另一实施方式中，所述关联模式转移模型描述所述多种不同的关联模式之间的模式转移的概率。

在根据本公开的第一方面的另一实施方式中，根据所述待训练数据构建所述多种不同的关联模式之间的关联模式转移模型包括：利用马尔科夫链模型按照最大似然性原则根据所述待训练数据来确定所述多种不同的关联模式之间的转移矩阵。

根据本公开的第二方面，提供了一种用于执行实时预测的方法。所述方法包括：利用多个不同的子预测模型针对实时数据执行预测，以得到多个初始预测结果，其中所述多个不同的子预测模型分别适用于多种不同的关联模式；基于所述多种不同的关联模式之间的关联模式转移模型确定所述实时数据与所述多个不同的子预测模型之间的匹配度；以及基于所述匹配度对所述多个初始预测结果进行加权平均，以确定针对所述实时数据的预测结果。

在根据本公开的第一方面的实施方式中，所述多个不同的子预测模型是通过识别待训练数据中的所述多种不同的关联模式并且利用与所述多种不同的关联模式相对应的多组数据分别进行训练而得到的。

在根据本公开的第一方面的再一实施方式中，所述基于关联模式转移模型确定所述实时数据与所述多个不同的子预测模型之间的匹配度包括：通过根据所述实时数据之前的数据的关联模式以及所述多种不同的关联模式之间的模式转移的概率计算所述实时数据处于所述多种不同的关联模式的各个关联模式的概率，来确定所述匹配度。

根据本公开的第三方面，提供了一种用于构建预测模型的设备。所述设备包括：模式识别模块、模型训练模块和模型构建模块。所述模式识别模块被配置用于识别待训练数据中的多种不同的关联模式，其中所述多种不同的关联模式描述所述待训练数据中的影响因素与目标数据之间的多种不同的关联关系。所述模型训练模块被配置用于利用与所述多种不同的关联模式相对应的多组数据分别进行训练，以得到适用于所述多种不同的关联模式的多个子预测模型。所述模型构建模块被配置用于根据所述待训练数据构建所述多种不同的关联模式之间的关联模式转移模型，其中所述关联模式转移模型用于在预测过程中确定所述多个不同的子预测模型与待预测数据之间的匹配度。

根据本公开的第四方面，提供了一种用于执行实时预测的设备。所述设备包括：预测执行模块、匹配度确定模块和结果平均模块。所述预测执行模块被配置用于利用多个不同的子预测模型针对实时数据执行预测，以得到多个初始预测结果，其中所述多个不同的子预测模型分别适用于多种不同的关联模式。所述匹配度确定模块被配置用于基于所述多种不同的关联模式之间的关联模式转移模型确定所述实时数据与所述多个不同的子预测模型之间的匹配度。所述结果平均模块被配置用于基于所述匹配度对所述多个初始预测结果进行加权平均，以确定针对所述实时数据的预测结果。

根据本公开的第五方面，提供了一种计算程序产品，其上包括有计算机程序代码，当被加载到计算机设备中时，其可以使得该计算机设备执行根据本公开的第一方面的方法。

根据本公开的第六方面，提供了一种计算程序产品，其上包括有计算机程序代码，当被加载到计算机设备中时，其可以使得该计算机设备执行根据本公开的第二方面的方法。

根据本公开的第七方面，还提供一种用于构建预测模型的设备，所述设备包括存储器，和处理器，所述处理器可以被配置为执行根据本公开的第一方面的方法。

根据本公开的第八方面，还提供一种用于执行实时预测的设备，所述设备包括存储器，和处理器，所述处理器可以被配置为执行根据本公开的第二方面的方法。

根据本公开的实施方式，可以得到与多个关联模式对应的多个预测子模型，而所述关联模式能够反应数据本身的特征。因此在实时预测时，就可以基于实时数据本身的数据特征来动态调整各个预测子模型的权重，因而预测精度可以得到提高。

附图说明

通过对结合附图所示出的实施方式进行详细说明，本公开的上述以及其他特征将更加明显，本公开的附图中相同的标号表示相同或相似的部件。在附图中：

图1示意性地示出了根据本公开的一个实施方式的用于构建预测模型的方法的流程图；

图2示意性地示出了根据本公开的一个实施方式的样本集形成的示意图；

图3示意性地示出了根据本公开的一个实施方式的关联模式识别的流程图；

图4示意性地示出了根据本公开的一个实施方式的数据分段划分的示意图；

图5示意性地示出了根据本公开的一个实施方式的关联模式学习的示意图；

图6示意性地示出了根据本公开的一个实施方式的相似关联模式合并的示意图；

图7示意性地示出了根据本公开的一个实施方式的模型训练的示意图；

图8示意性地示出了根据本公开的一个实施方式的关联模式转移模型构建的示意图；

图9示意性地示出了根据本公开的一个实施方式的用于执行实时预测的方法的流程图；

图10示意性地示出了根据本公开的一个实施方式的用于匹配度计算的示意图；

图11示意性地示出了根据本公开的一个实施方式的预测结果平均的示意图；

图12示意性地示出了根据本公开的一个实施方式的预测***的整体架构的方框图；

图13示意性地示出了根据本公开的一个实施方式的用于构建预测模型的设备的方框图；以及

图14示意性地示出了根据本公开的一个实施方式的用于执行实时预测的设备的方框图。

具体实施方式

在下文中，将参考附图详细描述本公开的各个示例性实施方式。应当注意，这些附图和描述涉及的仅仅是作为示例的优选实施方式。可以应该指出的是，根据随后的描述，很容易设想出此处公开的结构和方法的替换实施方式，并且可以在不脱离本公开要求保护的公开的原理的情况下使用这些替代实施方式。

应当理解，给出这些示例性实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本公开，而并非以任何方式限制本公开的范围。此外在附图中，出于说明的目的，将可选的步骤、模块、模块等以虚线框示出。

在此使用的术语“包括”、“包含”及类似术语应该被理解为是开放性的术语，即“包括/包含但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”；术语“另一实施例”表示“至少一个另外的实施例”。其他术语的相关定义将在下文描述中给出。

如前所述，在现有技术中，基于多模型的预测方法目前对于实时预测而言有效性仍然不太理想，其预测结果的准确性和可靠性依然较低。针对此问题，在本公开中提出一种新的技术方案，该方案是一种基于数据中的关联模式划分并组合使用多个预测模型的方法。根据该方案，将构建针对多种关联模式的多个预测模型，同时在实时预测时，将根据实时数据与预测模型之间的匹配程度动态调整各个预测模型的权重，以便提高预测精度。

在下文中，将参考附图对根据本公开的实施方式的用于预测模型构建和实时预测的方法和设备进行详细描述。然而，需要说明的是，这些描述是仅仅是出于说明的目的，本公开并不局限于这些实施方式和附图中的细节。此外，在下面的描述中，将主要参考空气质量预测对本公开的实施方式进行描述。然而需要说明的是，本公开也可能应用在其他预测场合，例如气候预测、交通流量预测等。

图1示意性地示出了根据本公开的一个实施方式的用于构建预测模型的方法的流程图。如图1所示，首先在步骤S101，识别待训练数据中的多种不同的关联模式。如图2所示，待训练数据可以是从整个历史时间序列数据中采样得到的数据，例如包括目标数据以及影响因素数据。目标数据是与预测对象对应的数据，例如在PM2.5预测的场景下，目标数据是PM2.5。影响因素是影响目标数据的因素，例如在PM2.5预测的场景下，影响因素可以是空气质量因素诸如CO、SO2，交通状况等。

目标数据及其影响因素的时间序列是由数据监测设备采集的一系列数据，诸如是气象数据、空气质量数据、交通数据、人口密度数据、污染源数据等的时间序列。可以清楚的是，对于不同的数据，不同时间序列通常具有不同的尺度、采集间隔等。因此，首先可以对采集得到的数据进行预处理，以便将其转化为待训练的样本集。例如，可以将在不同的时间(时间)和不同的位置(空间)采集得到的数据归一化为具有相同时间尺度的数据序列，从而得到样本集。S_i＝(X_i，Y_i)，即待训练数据，其中X_i代表影响因素，Y_i代表目标数据。由于在预测时，影响因素是输入，目标数据是输出，所以在下文中也将X_i称为输入，将Y_i称为输出。

影响因素X_i可以包括两个部分，即历史序列部分和未来序列部分。在给定预测索引y和时间步长L的情况下，可以将X_i表示如下：

(式1)

该式代表可以获得时刻i+R+1时刻的数据来预测Y_i，并且其中

代表第p个输入变量(例如空气质量，交通因素，比如CO和交通流量)在(i+t)时刻的历史序列部分；

代表第q个输入变量(例如气象因素，诸如风力，湿度)在(i+t+L)时刻的未来序列部分。

Y_i＝y_i+R-1+L代表在(i+R-1+L)时刻的预测项，其中L是在X_i之后的时间步长；R是输入变量的范围，R通常大于时间步长L。需要注意的是，在i+R-1时刻，空气质量和交通数据均是检测数据，因此，只能够使用截止到时刻i+R-1的历史数据；而气象数据可以是预测数据，因此可以使用直到(i+R-1+L)时刻的未来数据。

接着，可以针对训练的样本集S_i＝(X_i，Y_i)，执行关联模式识别。此处的术语“关联模式”指代在一个特定时段内的待训练数据中的影响因素与目标数据之间的关联关系。多种不同的关联模式将描述待训练数据中的影响因素与目标数据之间的多种不同的关联关系。以PM2.5预测为例，第一种关联模式可以指示一氧化碳CO对于PM2.5具有较大影响，第二种关联模式可以指示交通情况对于PM2.5具有较大影响，第三种关联模式可以指示温度对于PM2.5具有较大影响等等。相同的关联模式中的样本数据将具有共同的特征，因此这些样本将会形成一个特定的关联模式。

在下文中，将参考一个示例实施方式对关联模式识别进行详细描述，在该示例实施方式中，将基于Granger Lasso方法和层次聚类来实现关联模式识别。然而需要说明的是，这仅仅是出于说明的目的，本公开也有可能采用任何其他适当的手段和算法来定义和学习关联模式。

参考图3，首先在步骤S1011，将所述待训练数据按照时间划分为多个数据分段。这里如可以通过一个滑动时间窗口来实现。图4示意性地示出了根据本公开的一个实施方式的分段划分的示意图。如图4所示，该滑动时间窗口具有固定的长度Len例如为8，每次分段划分例如移动一个样本。这样就可以得到例如P个分段S_eci,其中i＝1至P。然而需要说明的是，分段长度和移动步长是为了说明的目的而给出的，本公开并不局限于此。

对于给定的窗口长度Len和样本集(S₁，S₂，...，S_n}，样本集可以被划分为n-len+1个分段，其中Sec_i＝{S_i，S_i+1，...，S_i+len-1}。

接着，在步骤S1012，学习所述多个数据分段中的各个数据分段的关联模式。换句话讲，针对每个数据分段，学习该组数据的关联模式。图5中示出了根据本公开的一个实施方式的关联模式学习的示意图。在该图中，采用的是Granger Lasso图模型方法。该GrangerLasso图模型方法的目标函数可以通过下面的式子来表示：

(式2)

其中

为输入数据的向量，其由各个时间序列变量xⁱ的一段数据组成；y为对应的输出；

为系数向量，其反映了特定的输入xⁱ与输出y之间的关联；n为待训练的各个数据分段的样本数目，λ为正则项系数。

将Granger Lasso方法应用于各个数据分段Sec_i，以便学习输入与输出之间的关联关系。结果将针对每个数据分段Sec_i得到一个对应的权重向量W_i，其中

如图5所示。此处将Sec_i的关联模式表示为P_i，并使用该权重向量W_i作为关联模式P_i的特征空间。

然后，在步骤S1013，通过合并相似的关联模式和对应的数据分段来确定所述多种不同的关联模式。针对图5中得到的多个关联模式，可以确定他们之间的相似度，并基于相似阈值，来对这些关联模式进行合并，最终得到多种不同的关联模式P_A-P_Q。

在根据本公开的一个实施方式中，关联模式之间的相似度可以通过特征空间中的每个元素的权重来计算。例如可以通过下面给出的式子来度量相似度：

(式3)

通过该式子可以确定出两个关联模式W_i和W_j之间的相似度。

在根据本公开的一个实施方式中，使用层次聚类对关联模式进行聚类。特别地，在初始状态时，每个关联模式P_i单独为一类，即C_i＝P_i。此后，逐层地构造聚类树，在每一层将当前最相似的两个类聚为一个新的模式类，如图6所示。两个类C_a和C_b之间的相似度可以定义如下：

Sim_C_a，b＝max{Sim_P_i，j|P_i∈C_a，P_j∈C_b}

(式4)

需要说明的是，按照上述定义，Sim_C_a，b越小，类C_a和C_b越相似。对于一个预定的相似度阈值δ，当某层出现min{Sim_C_a，b}＞δ时，则该层聚类停止，这表示此时各个类之间已足够不相似。假设两个类C_a、C_b合并为新类C_ab(对应的新关联模式记为P_ab)，则两个类对应的样本数据也被合并在一起，并且样本对应的关联模式也被更新为P_ab。

最终，假设我们得到了K个关联模式的聚类，记为

对每一个聚类中的数据，重新用Granger Lasso方法计算出一个新的权重向量。这样将会得到K个对应的权重向量

这K个权重向量

就是对应的关联模式

的特征空间。

这样，通过例如图3中所示的方法，就可以识别出待训练数据中的多个不同的关联模式。

现在返回继续参考图1。如图1所示，在识别出待训练数据中的多种不同的关联模式之后，可以在步骤S102，利用所述多种不同的关联模式相对应的对组数据分组分别进行训练，以得到适用于所述多种不同的关联模式的多个子预测模型。例如，可以针对得到的K个关联模式及其对应的K个数据分组，分别训练K个预测模型，如图7所示。预测模型可以根据数据情况进行不同的选择，如果分组中的数据量较小则使用Lasso回归模型，数据量较大，则可以使用深度神经网络模型。在下面将以Lasso回归模型为例进行说明。对于K种关联模式，可以学习K个Lasso回归模型。对于样本集为Set_i＝{S_i1，S_i2，...，S_im}的

Lasso回归模型的目标函数可以表示为：

(式5)

在选定的预测模型的情况下，利用待训练数据来训练模型可以采用本领域任何适当的方法，这对于本领域技术人员而言是已知的。因此，此处为了简化起见不再进行详细说明。

接下来，在步骤S103，根据所述待训练的数据构建多种不同的关联模式之间的关联模式转移模型。关联模式转移模型描述所述多种不同的关联模式之间的模式转移规律的模型，例如可以描述所述多种不同的关联模式之间的模式转移的概率。基于该模型，可以确定例如一个关联模式在下一步转移到各个关联模式的概率。

在本公开的一个实施方式中，利用马尔科夫链模型按照最大似然性原则根据所述待训练数据来确定所述多种不同的关联模式之间的转移矩阵。然而需要说明的是，也可以采用任何其他适当的技术来构建关联模式转移模型。特别地，对于每个历史样本，都存在一个对应的关联模式，这样可以针对样本集和得到关联模式的序列：

{S₁，S₂，...，S_n}→{P(1)，P(2)，...，P(n)}，

(式6)

其中S_t为t时刻的样本；P(t)为t时刻的关联模式。根据Markov链模型，一阶转移矩阵A可以按最大似然估计原则计算如下：

(式7)

其中

表示

转移到

的次数。这样就得到了关联模式转移模型，例如如图8所示。然而需要说明的是，尽管在上式5中给出了一阶转移矩阵，但是本公开不仅限于此，也有可能采用更高阶矩阵。

这样，通过上面给出的方法，可以得到适用于多种不同模式的子预测模型，并且获得了多种不同的关联模式之间的模式转移模型。该模式转移模型可以用于在预测过程中确定所述多个不同的子预测模型与待预测数据之间的匹配度。这样，执行预测时，就可以基于待预测的实时数据与各个子预测模型的匹配度来动态调整各个预测子模型的权重。在下文中，将继续参考图9至图11来描述本公开中提供的一种用于执行实时预测的方法。

参考图9，首先在步骤S901，利用多个不同的子预测模型针对实时数据执行预测，以得到多个初始预测结果。所述多个不同的子预测模型分别适用于多种不同的关联模式。因此，在该步骤使用的子预测模型与传统方法中使用的多个预测模型是不同的。传统方法中使用的多个预测模型是通过训练随机划分的数据分组而得到的多个预测模型，而本公开中的多个子预测模型，是针对各个不同的关联模式的子模型。当监测的实时数据输入时，可以利用在训练阶段得到的多个不同的子预测模型分别执行预测，这样可以得到多个初始预测结果。

接着，在步骤S902可以基于所述多种不同的关联模式之间的关联模式转移模型确定所述实时数据与所述多个不同的子预测模型之间的匹配度。例如，对于t时刻的实时数据S_t，时刻t之前一段时间的数据序列为{S_t-k，...，S_t-1}，对应的关联模式序列为{P{t-k}，...，P(t-1)}。此处使用idx(t)指示P(t)的下标，例如

则idx(t-k)＝3)；使用f(j)指示

的转移概率，则f(j)可以被表示为：

(式8)

其中A^(t-i)为(t-i)-阶转移矩阵，且其可以被计算为C-K函数A⁽ⁿ⁾＝A^(n-1)A。这样，对于实时数据S_t，其属于各个关联模式的概率为f(i)。

在根据本公开的一个方式中，直接使用该概率f(i)来表示实时数据S_t与关联模式之间的匹配度D_i，即D_i＝f(i)。然而，需要说明的是，本公开并不局限于此。事实上，匹配度D_i也可以是基于该概率f(i)通过其他方式计算得到的值。换言之匹配度D_i可以是概率f(i)的函数。匹配度D_i反映了实时数据S_t属于一个特定的关联模式的概率的大小。D_i越大，则该实时数据与该关联模式越为匹配。因此，D_i越大，也就意味着该实时数据与适用于该关联模式的预测模型更为匹配，该预测模型的可靠性越高。在下面将参考图10来描述匹配度计算的是一个示例。

参考图10，该图示意性地示出了根据本公开的一个实施方式的用于匹配度计算的示意图。如图10所示，对于实时数据S₁₀₀，其之前时间最近的三个样本S₉₉，S₉₈和S₉₇的关联模式分别为P₂、P₃和P₁。基于这三个样本的关联模式和转移概率矩阵，并利用式6中示出的转移概率计算公式，可以确定出实时样本S₁₀₀与P1、P2、P3和P4的匹配度分别为0.79、1.08、0.47和0.66。也就是说，该实时数据S₁₀₀与关联模式P2具有最大的匹配度而与关联模式P3具有最小的匹配度。

返回参考图9，然后在步骤S903，基于所述匹配度对上面所述的多个初始预测结果进行加权平均，以确定出针对所述实时数据的最终预测结果。例如，对于K个初始预测结果，可以利用K个对应的关联模式匹配度对初始预测结果进行加权平均。

该预测结果平均例如可以通过以下方式来执行。首先，可以针对得到的K个匹配度执行归一化，该归一化可以通过下面的式子给出：

(式9)

然后利用归一化后的匹配度执行加权平均，因此最后的输出结过可以通过下面的式子表示：

R_final＝ΣD_norm_i·R_i

其中R_i指示利用多个预测模型得到的多个预测结果。

出于说明的目的，在图11中示出了根据本公开的一个实施方式的预测结果加权平均的示意图。如图11所示，其中初始的预测结果A至Q分别利用对应的匹配度值(0.79,0.47，…，1.08)进行加权平均，进而将加权平均后的输出作为最终预测结果。最后，可以实时存储最终的预测结果。

需要说明的是，在上面的描述中，将步骤S901描述为在S902之前进行操作。然而，本公开并不局限于此，实际上步骤S902也有可能在步骤S901之前执行，或者并行地执行两个步骤。

下面将参考图12来描述根据本公开的一个实施方式的预测***的整体架构的方框图，以使得本领域技术人员对于本公开的预测***的总体架构有个更加深入的理解。如图12所示，该预测***架构可以被划分为训练过程和预测过程，其中在训练过程中将使用历史数据进行训练，以确定出针对多个不同的关联模式的多个子预测模型以及多个不同的关联模式之间的关联转移模型。在预测阶段中，将基于训练过程中得到的预测模型和关联模式转移模型执行预测。

具体地，如图12所示，在训练过程中，首先针对历史数据执行预处理，以便对各种数据执行归一化。接着，执行关联模式识别，例如可以通过滑动时间窗间该数据划分为P个数据分段，然后学***均，并最终将经过加权平均的预测结果作为最终预测结果输出。

从上文中针对本公开的实施方式的描述可以看出，在本公开中，可以得到与多个关联模式对应的多个预测子模型，而所述关联模式能够反应出数据本身的特征。因此在实时预测时，就可以基于实时数据本身的数据特征来动态调整各个预测子模型的权重，因而预测精度可以得到提高。

在上文中，针对本公开中提供过的用于构建预测模型的方法和用于实时预测的方法进行了描述。此外，本公开中还提供了一种用于构建预测模型的设备和一种用于执行实时预测的设备。在下文中将参考图13和图14对这些设备进行详细地描述。

图13示出了根据本公开的一个实施方式的用于构建预测模型的设备的方框图。该设备1300包括模式识别模块1310、模型训练模块1320以及模型构建模块1330。所述模式识别模块1310可以被配置用于识别待训练数据中的多种不同的关联模式，其中所述多种不同的关联模式描述所述待训练数据中的影响因素与目标数据之间的多种不同的关联关系。所述模型训练模块1320可以被配置用于利用与所述多种不同的关联模式相对应的多组数据分别进行训练，以得到适用于所述多种不同的关联模式的多个子预测模型。所述模型构建模块1330可以被配置用于根据所述待训练数据构建所述多种不同的关联模式之间的关联模式转移模型，其中所述关联模式转移模型用于在预测过程中确定所述多个不同的子预测模型与待预测数据之间的匹配度。所述关联模式转移模型可以描述所述多种不同的关联模式之间的模式转移规律。特别地，在一个实施方式中，所述关联模式转移模型可以描述所述多种不同的关联模式之间的模式转移的概率。

此外，所述模式识别模块1310可以进一步包括数据划分模块1312、模式学习模块1314和模式确定模块1316。所述数据划分模块1312可以被配置用于将所述待训练数据按照时间划分为多个数据分段。所述模式学习模块1314可以被配置用于学习所述多个数据分段中的各个数据分段的关联模式。所述模式确定模块1316可以被配置用于通过合并相似的关联模式和对应的数据分段来确定所述多种不同的关联模式。

另外，所述模式确定模块1316进一步被配置用于通过基于层次聚类对所述各个数据分段的关联模式进行聚类来确定出所述多种不同的关联模式。

在一个实施方式中，所述模型构建模块1330可以被配置用于：利用马尔科夫链模型按照最大似然性原则根据所述待训练数据，来确定所述多种不同的关联模式之间的转移矩阵。

接着参考图14，图14示意性地示出了根据本公开的一个实施方式的用于实时预测的设备的方框图。如图14所示，设备1400包括结果预测模块1410、匹配度确定模块1420和结果平均模块1430。所述结果预测模块1410可以被配置用于利用多个不同的子预测模型针对实时数据执行预测，以得到多个初始预测结果，其中所述多个不同的子预测模型分别适用于多种不同的关联模式。所述匹配度确定模块1420可以被配置用于基于所述多种不同的关联模式之间的关联模式转移模型确定所述实时数据与所述多个不同的子预测模型之间的匹配度。所述结果平均模块1430可以被配置用于基于所述匹配度对所述多个初始预测结果进行加权平均，以确定针对所述实时数据的预测结果。所述多个不同的子预测模型可以是通过识别待训练数据中的所述多种不同的关联模式并且利用与所述多种不同的关联模式相对应的多组数据分别进行训练而得到的。另外，所述关联模式转移模型可以描述所述多种不同的关联模式之间的模式转移规律。特别地，在一个实施方式中，所述关联模式转移模型可以描述所述多种不同的关联模式之间的模式转移的概率。

此外，所述匹配度确定模块1420可以被配置为：通过根据所述实时数据之前的数据的关联模式以及所述多种不同的关联模式之间的模式转移的概率计算所述实时数据处于所述多种不同的关联模式的各个关联模式的概率，来确定所述匹配度。

需要说明的是，上面参考图13和14所描述的设备1300和1400中的各个模块可以被配置为执行与参考图1至图12所描述的方法相对应的操作。因此，此处不再详细描述设备1300和1400的各个模块的具体操作。关于这些模块的具体操作的细节，可以参考结合图1至图12针对相应方法的各个步骤进行的描述。

另外还需理解的是，本公开的实施方式可以以软件、硬件或者软件和硬件的结合来实现。硬件部分可以利用专用逻辑来实现；软件部分可以存储在存储器中，由适当的指令执行***，例如微处理器或者专用设计硬件来执行。本领域的普通技术人员可以理解上述的方法和设备可以使用计算机可执行指令和/或包含在处理器控制代码中来实现，例如在诸如磁盘、CD或DVD－ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本实施例的设备及其组件可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现，也可以用由各种类型的处理器执行的软件实现，也可以由上述硬件电路和软件的结合例如固件来实现。

虽然已经参考目前考虑到的实施方式描述了本公开，但是应该理解本公开不限于所公开的实施方式。相反，本公开旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。以下权利要求的范围符合最广泛解释，以便包含所有这样的修改及等同结构和功能。

Claims

1.一种用于执行实时预测的方法，包括：

利用多个不同的子预测模型针对实时数据执行预测，以得到多个初始预测结果，其中所述多个不同的子预测模型分别适用于多种不同的关联模式，所述实时数据为空气质量数据，所述多种不同的关联模式表示目标数据与多个影响因素之间的多种不同的关联关系，所述目标数据为PM2.5，所述多个影响因素至少包括一氧化碳、二氧化硫、交通状况；

基于所述多种不同的关联模式之间的关联模式转移模型确定所述实时数据与所述多个不同的子预测模型之间的匹配度；以及

基于所述匹配度以及所述多个初始预测结果确定针对所述实时数据的预测结果，所述预测结果表示空气质量预测。

2.根据权利要求1所述的方法，其中所述多个不同的子预测模型是通过识别待训练数据中的所述多种不同的关联模式并且利用与所述多种不同的关联模式相对应的多组数据分别进行训练而得到的。

3.根据权利要求2所述的方法，其中所述多个不同的子预测模型通过下述训练过程得到：

识别所述待训练数据中的所述多种不同的关联模式，其中所述多种不同的关联模式描述所述待训练数据中的影响因素与目标数据之间的多种不同的关联关系；以及

利用与所述多种不同的关联模式相对应的多组数据分别进行训练，以得到适用于所述多种不同的关联模式的所述多个子预测模型。

4.根据权利要求3所述的方法，其中所述识别待训练数据中的多种不同的关联模式包括：

将所述待训练数据按照时间划分为多个数据分段；

学习所述多个数据分段中的各个数据分段的关联模式；以及

通过合并相似的关联模式和对应的数据分段来确定所述多种不同的关联模式。

5.根据权利要求4所述的方法，其中所述确定所述多种不同的关联模式包括：基于层次聚类对所述各个数据分段的关联模式进行聚类。

6.根据权利要求3至5中任一项所述的方法，其中所述关联模式转移模型通过下述方式得到：

根据所述待训练数据构建所述多种不同的关联模式之间的关联模式转移模型。

7.根据权利要求6所述的方法，其中根据所述待训练数据构建所述多种不同的关联模式之间的关联模式转移模型包括：利用马尔科夫链模型按照最大似然性原则根据所述待训练数据来确定所述多种不同的关联模式之间的转移矩阵。

8.根据权利要求1或2所述的方法，其中所述关联模式转移模型描述所述多种不同的关联模式之间的模式转移的概率。

9.根据权利要求8所述的方法，其中所述基于关联模式转移模型确定所述实时数据与所述多个不同的子预测模型之间的匹配度包括：通过根据所述实时数据之前的数据的关联模式以及所述多种不同的关联模式之间的模式转移的概率计算所述实时数据处于所述多种不同的关联模式的各个关联模式的概率，来确定所述匹配度。

10.一种用于执行实时预测的设备，包括：

结果预测模块，被配置用于利用多个不同的子预测模型针对实时数据执行预测，以得到多个初始预测结果，其中所述多个不同的子预测模型分别适用于多种不同的关联模式，所述实时数据为空气质量数据，所述多种不同的关联模式表示目标数据与多个影响因素之间的多种不同的关联关系，所述目标数据为PM2.5，所述多个影响因素至少包括一氧化碳、二氧化硫、交通状况；

匹配度确定模块，被配置用于基于所述多种不同的关联模式之间的关联模式转移模型确定所述实时数据与所述多个不同的子预测模型之间的匹配度；以及

结果平均模块，被配置用于基于所述匹配度以及所述多个初始预测结果确定针对所述实时数据的预测结果，所述预测结果表示空气质量预测。

11.根据权利要求10所述的设备，其中所述多个不同的子预测模型是通过识别待训练数据中的所述多种不同的关联模式并且利用与所述多种不同的关联模式相对应的多组数据分别进行训练而得到的。

12.根据权利要求11所述的设备，还包括：

模式识别模块，被配置用于识别所述待训练数据中的所述多种不同的关联模式，其中所述多种不同的关联模式描述所述待训练数据中的影响因素与目标数据之间的多种不同的关联关系；以及

模型训练模块，被配置用于利用与所述多种不同的关联模式相对应的多组数据分别进行训练，以得到适用于所述多种不同的关联模式的所述多个子预测模型。

13.根据权利要求12所述的设备，其中所述模式识别模块进一步包括：

数据划分模块，被配置用于将所述待训练数据按照时间划分为多个数据分段；

模式学习模块，被配置用于学习所述多个数据分段中的各个数据分段的关联模式；以及

模式确定模块，被配置用于通过合并相似的关联模式和对应的数据分段来确定所述多种不同的关联模式。

14.根据权利要求13所述的设备，其中所述模式确定模块进一步被配置用于：基于层次聚类对所述各个数据分段的关联模式进行聚类。

15.根据权利要求12至14中任一项所述的设备，还包括模型构建模块，被配置用于：根据所述待训练数据构建所述多种不同的关联模式之间的关联模式转移模型。

16.根据权利要求15所述的设备，其中所述模型构建模块被配置用于：利用马尔科夫链模型按照最大似然性原则根据所述待训练数据来确定所述多种不同的关联模式之间的转移矩阵。

17.根据权利要求10或11所述的设备，其中所述关联模式转移模型描述所述多种不同的关联模式之间的模式转移的概率。

18.根据权利要求17所述的设备，其中所述匹配度确定模块被配置为：通过根据所述实时数据之前的数据的关联模式以及所述多种不同的关联模式之间的模式转移的概率计算所述实时数据处于所述多种不同的关联模式的各个关联模式的概率，来确定所述匹配度。