CN115359310A

CN115359310A - 一种基于ConvLSTM和条件随机场的SIC预测方法及***

Info

Publication number: CN115359310A
Application number: CN202210798362.4A
Authority: CN
Inventors: 张辉; 任开军; 李小勇; 任小丽; 谭家明; 蓝云杰; 柴星宇; 徐青
Original assignee: National University of Defense Technology
Current assignee: National University of Defense Technology
Priority date: 2022-07-08
Filing date: 2022-07-08
Publication date: 2022-11-18
Anticipated expiration: 2042-07-08
Also published as: CN115359310B

Abstract

本发明公开了一种基于ConvLSTM和条件随机场的SIC预测方法及***，包括获取多个连续时刻的历史SIC数据，并对历史SIC数据进行归一化处理，将处理后的历史SIC数据通过时间滑窗进行时间步的拼接，生成序列数据样本集，将序列数据样本集输入预设的预测模型中，得到预测模型输出的下一个时刻的SIC预测结果，其中，预测模型是指结合全连接条件随机场的ConvLSTM网络模型，通过以ConvLSTM提供的预测结果作为全连接条件随机场的先验概率，得到预测模型输出的下一个时刻的SIC预测结果，提高了整体SIC的预测精度与边界区域的预测准确度。

Description

一种基于ConvLSTM和条件随机场的SIC预测方法及***

技术领域

本发明涉及SIC预测相关技术领域，尤其是涉及一种基于ConvLSTM和条件随机场的SIC 预测方法及***。

背景技术

近年来，随着全球变暖，北极海冰覆盖面积逐渐减少，北极地区也受到越来越多的关注。海冰浓度的变化直接反应了海冰覆盖范围的变化。预测海冰浓度(Sea IceConcentration， SIC)对于了解气候变化的影响、资源开采和新的北极航线规划非常重要。

传统的海冰预测方法主要有统计模型或数值模型。统计模型是由数据驱动的，根据历史观测数据构建拟合海冰变化规律。观测数据主要包括气象要素(例如温度、海平面压力)、海洋要素(例如海面温度、盐度)和海冰要素(例如浓度、范围、冰类型和厚度)。然而，统计方法不能考虑海冰和大气之间的相互作用，并且只能建立逐点模型，而忽略了相邻点之间的相互作用。

近年来，机器学习方法开始应用于海冰预测。例如MLP(Multilayer Perceptron，MLP) 和LSTM(Long Short-Term Memory Network，LSTM)两种深度学习方法对北极SIC进行中期预测，效果好于传统自回归模型。但LSTM只考虑时间序列的信息，无法进行空间信息的处理。因为LSTM需要把二维空间数据转换成一维数据进行计算，在此过程中很难保留原有的空间结构特征，在融化和冻结季节，海冰覆盖区域发生剧烈变化时预测效果不好。此外，卷积操作也可以很好的考虑空间相关性，通过CNN(Convolutional Neural Networks,CNN)实现了本月预测下一个月的SIC。但CNN的缺陷很明显，t时刻的SIC完全取决于t-1时刻的SIC，不能提取到过去所有时刻中的信息。

发明内容

本发明旨在至少解决现有技术中存在的技术问题。为此，本发明提出一种基于ConvLSTM 和条件随机场的SIC预测方法及***，通过将条件随机场引入到ConvLSTM中，提高了整体 SIC的预测精度与边界区域的预测准确度。

本发明的第一方面，提供了一种基于ConvLSTM和条件随机场的SIC预测方法，包括如下步骤：

获取多个连续时刻的历史SIC数据，并对所述历史SIC数据进行归一化处理，将处理后的历史SIC数据通过时间滑窗进行时间步的拼接，生成序列数据样本集；

将所述序列数据样本集输入预设的预测模型中，得到所述预测模型输出的下一个时刻的 SIC预测结果，其中，所述预测模型是指结合全连接条件随机场的ConvLSTM网络模型。

根据本发明的实施例，至少具有如下技术效果：

本方法通过获取多个连续时刻的历史SIC数据，并对历史SIC数据进行归一化处理，将处理后的历史SIC数据通过时间滑窗进行时间步的拼接，生成序列数据样本集，将序列数据样本集输入预设的预测模型中，得到预测模型输出的下一个时刻的SIC预测结果，其中，预测模型是指结合全连接条件随机场的ConvLSTM网络模型，通过以ConvLSTM提供的预测结果作为全连接条件随机场的先验概率，得到预测模型输出的下一个时刻的SIC预测结果，提高了整体SIC的预测精度与边界区域的预测准确度。

根据本发明的一些实施例，所述ConvLSTM网络模型的内部结构式包括：

i_t＝σ(W_xi*X_t+W_hi*H_t-1+W_ci⊙C_t-1+b_i)

f_t＝σ(W_xf*X_t+W_hf*H_t-1+W_cf⊙C_t-1+b_f)

C_t＝f_t⊙C_t-1+i_t⊙tanh(W_xc*X_t+W_hc*H_t-1+b_c)

o_t＝σ(W_xo*X_t+W_ho*H_t-1+W_co⊙C_t+b_o)

H_t＝o_t⊙tanh(C_t)

其中，σ为门，*为卷积运算符，⊙为内积，tanh为双曲正切函数，i_t为t时刻的输入门，f_t为t时刻的遗忘门，C_t为t时刻的记忆单元，o_t为t时刻的输出门，X_t为t时刻的二维图像，W_xi为与输入门相关的二维图像为X_t的权重矩阵，H_t为t时刻的网络预测值，W_hi为与输入门相关的隐藏状态为H_t-1的权重矩阵，W_ci为与输入门相关的记忆单元为C_t-1的权重矩阵，b_i为输入门的偏置值，W_xf为与遗忘门相关的二维图像为X_t的权重矩阵，W_hf为与遗忘门相关的隐藏状态为H_t-1的权重矩阵，W_cf为与遗忘门相关的记忆单元为C_t-1的权重矩阵，b_f为遗忘门的偏置值，W_xc为与记忆单元相关的二维图像为X_t的权重矩阵，W_hc为与记忆单元相关的隐藏状态为H_t-1的权重矩阵，b_c为记忆单元的偏置值，W_xo为与输出门相关的二维图像为X_t的权重矩阵，W_ho为与输出门相关的隐藏状态为H_t-1的权重矩阵，W_co为与输出门相关的记忆单元为C_t的权重矩阵，b_o为输出门的偏置值。

根据本发明的一些实施例，所述将所述序列数据样本集输入预设的预测模型中，得到所述预测模型输出的下一个时刻的SIC预测结果，包括：

将所述序列数据样本集输入所述预设的预测模型中的ConvLSTM网络模型中，得到第一 SIC预测结果，其中，所述第一SIC预测结果为所述预测模型中的ConvLSTM网络模型输出的下一个时刻的SIC预测结果；

根据所述的第一SIC预测结果得到像素集合X＝{x₁,x₂…x_n}，标签类别构成的标签集 L＝{L₁,L₂…L_k}，特征向量F＝{f₁,f₂…f_n}，颜色特征向量I＝{I₁,I₂…I_n}，位置特征向量P＝{p₁,p₂…p_n}以及像素点i为分类标签x_i的概率P(x_i)，其中，x_n为像素点n的分类标签，L_k为所述标签集中第k个类别的分类标签，p_n为像素点n的位置特征向量，I_n是所述像素点n的颜色特征向量，f_n为像素点n的特征向量，所述f_n包括所述像素点n的位置特征向量与所述像素点n 的颜色特征向量；

所述全连接条件随机场满足吉布斯分布，其概率函数如下：

其中，Z(I)为归一化因子，E(X∣I)能量函数；

在全图的基础上定义能量函数为：

E(X∣I)＝∑_iψ_u(x_i)+∑_i,jψ_p(x_i,x_j)

ψ_u(x_i)＝-log P(x_i)

其中，ψ_u(x_i)为一元势函数，ψ_p(x_i,x_j)为二元势函数，μ(x_i,x_j)为标签比较函数，若x_i≠x_j时μ(x_i,x_j)等于1，若所述x_i＝x_j时μ(x_i,x_j)等于0，w^m为标签集中第m个类别的高斯核函数对应的权重，m∈[1，k]。

为所述标签集中第m个类别的高斯核函数，f_i为像素点i的特征向量，f_j为像素点j的特征向量，p_i为像素点i的位置特征向量，p_j为像素点j的位置特征向量，I_i为像素点i的颜色特征向量，I_j为像素点j的颜色特征向量，θ_α为控制位置信息的尺度，θ_β为控制颜色信息的尺度，θ_γ为控制位置信息的尺度；

利用平均场算法迭代更新Q(x)，以使得所述概率函数P(x)与所述Q(x)间K-L散度达到预设值，然后用Q_i(x_i)代替P(x_i)，得到所述预测模型输出的下一个时刻的SIC预测结果，计算步骤如下：

Q(x)＝∏_iQ_i(x_i)

其中，Q_i(x_i)为像素点i为分类标签x_i的近似概率，l为像素点i的分类标签，l′为像素点i的预测分类标签，Z_i为归一化因子，μ(l,l′)为标签比较函数。

根据本发明的一些实施例，所述ConvLSTM网络模型设置4个ConvLSTM cell，第4个ConvLSTM cell的参数Return_sequences设置为false。

本发明的第二方面，提供一种基于ConvLSTM和条件随机场的SIC预测***，所述一种基于ConvLSTM和条件随机场的SIC预测***包括：

数据获取模块，用于获取多个连续时刻的历史SIC数据，并对所述历史SIC数据进行归一化处理，将处理后的历史SIC数据通过时间滑窗进行时间步的拼接，生成序列数据样本集；

数据输出模块，用于将所述序列数据样本集输入预设的预测模型中，得到所述预测模型输出的下一个时刻的SIC预测结果，其中，所述预测模型是指结合全连接条件随机场的 ConvLSTM网络模型。

本***通过获取多个连续时刻的历史SIC数据，并对历史SIC数据进行归一化处理，将处理后的历史SIC数据通过时间滑窗进行时间步的拼接，生成序列数据样本集，将序列数据样本集输入预设的预测模型中，得到预测模型输出的下一个时刻的SIC预测结果，其中，预测模型是指结合全连接条件随机场的ConvLSTM网络模型，通过以ConvLSTM提供的预测结果作为全连接条件随机场的先验概率，得到预测模型输出的下一个时刻的SIC预测结果，提高了整体SIC的预测精度与边界区域的预测准确度。

i_t＝σ(W_xi*X_t+W_hi*H_t-1+W_ci⊙C_t-1+b_i)

f_t＝σ(W_xf*X_t+W_hf*H_t-1+W_cf⊙C_t-1+b_f)

C_t＝f_t⊙C_t-1+i_t⊙tanh(W_xc*X_t+W_hc*H_t-1+b_c)

o_t＝σ(W_xo*X_t+W_ho*H_t-1+W_co⊙C_t+b_o)

H_t＝o_t⊙tanh(C_t)

根据本发明的一些实施例，所述数据输出模块包括：

第一预测模块，用于将所述序列数据样本集输入所述预设的预测模型中的ConvLSTM网络模型中，得到第一SIC预测结果，其中，所述第一SIC预测结果为所述预测模型中的ConvLSTM 网络模型输出的下一个时刻的SIC预测结果；

数据生成模块，用于根据所述的第一SIC预测结果生成像素集合X＝{x₁,x₂…x_n}，标签类别构成的标签集L＝{L₁,L₂…L_k}，特征向量F＝{f₁,f₂…f_n}，颜色特征向量I＝{I₁,I₂…I_n}，位置特征向量P＝{p₁,p₂…p_n}以及像素点i为分类标签x_i的概率P(x_i)，其中，x_n为像素点n的分类标签，L_k为所述标签集中第k个类别的分类标签，p_n为像素点n的位置特征向量，I_n是所述像素点n的颜色特征向量，f_n为像素点n的特征向量，所述f_n包括所述像素点n的位置特征向量与所述像素点n的颜色特征向量；

所述全连接条件随机场满足吉布斯分布，其概率函数如下：

其中，Z(I)为归一化因子，E(X∣I)能量函数；

在全图的基础上定义能量函数为：

E(X∣I)＝∑_iψ_u(x_i)+∑_i,jψ_p(x_i,x_j)

ψ_u(x_i)＝-log P(x_i)

结果输出模块，用于利用平均场算法迭代更新Q(x)，以使得所述概率函数P(x)与所述Q(x) 间K-L散度达到预设值，然后用Q_i(x_i)代替P(x_i)，得到所述预测模型输出的下一个时刻的SIC 预测结果，计算步骤如下：

Q(x)＝∏_iQ_i(x_i)

根据本发明的一些实施例，所述ConvLSTM网络模型设置4个ConvLSTM cell，且第4个ConvLSTM cell的参数Return_sequences设置为false。

本发明的第三方面，提供了一种基于ConvLSTM和条件随机场的SIC预测电子设备，包括至少一个控制处理器和用于与所述至少一个控制处理器通信连接的存储器；所述存储器存储有可被所述至少一个控制处理器执行的指令，所述指令被所述至少一个控制处理器执行，以使所述至少一个控制处理器能够执行上述的基于ConvLSTM和条件随机场的SIC预测方法。

本发明的第四方面，提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机可执行指令，所述计算机可执行指令用于使计算机执行上述的基于ConvLSTM和条件随机场的SIC预测方法。

需要注意的是，本发明的第二方面至第四方面与现有技术之间的有益效果与上述的一种基于ConvLSTM和条件随机场的SIC预测***与现有技术之间的有益效果相同，此处不再细述。

本发明的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解，其中：

图1是本发明一实施例的一种基于ConvLSTM和条件随机场的SIC预测方法的流程图；

图2是本发明一个实施例提供的序列数据样本集构建示意图；

图3是本发明一个实施例提供的ConvLSTM网络结构图；

图4是本发明一个实施例提供的ConvLSTM和ConvLSTM-CRF对2016年1月、2016年5月、2016年9月、2016年10月SIC的预测结果和真实值的对比图；

图5是本发明一个实施例提供的ConvLSTM和ConvLSTM-CRF迭代预测未来12个月MAE 对比图；

图6是本发明一个实施例提供的ConvLSTM和ConvLSTM-CRF迭代预测未来12个月RMSE 对比图；

图7是本发明一实施例的一种基于ConvLSTM和条件随机场的SIC预测***的流程图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。

在本发明的描述中，如果有描述到第一、第二等只是用于区分技术特征为目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。

在本发明的描述中，需要理解的是，涉及到方位描述，例如上、下等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

本发明的描述中，需要说明的是，除非另有明确的限定，设置、安装、连接等词语应做广义理解，所属技术领域技术人员可以结合技术方案的具体内容合理确定上述词语在本发明中的具体含义。

机器学习方法开始应用于海冰预测。例如MLP(Multilayer Perceptron，MLP)和LSTM (Long Short-Term Memory Network，LSTM)两种深度学习方法对北极SIC进行中期预测，效果好于传统自回归模型。但LSTM只考虑时间序列的信息，无法进行空间信息的处理。因为 LSTM需要把二维空间数据转换成一维数据进行计算，在此过程中很难保留原有的空间结构特征，在融化和冻结季节，海冰覆盖区域发生剧烈变化时预测效果不好。此外，卷积操作也可以很好的考虑空间相关性，通过CNN(Convolutional Neural Networks,CNN)实现了本月预测下一个月的SIC。但CNN的缺陷很明显，t时刻的SIC完全取决于t-1时刻的SIC，不能提取到过去所有时刻中的信息。

为了解决上述技术缺陷，参照图1和图2，本发明的一个实施例，提供一种基于ConvLSTM 和条件随机场的SIC预测方法，包括：

S101、获取多个连续时刻的历史SIC数据，并对历史SIC数据进行归一化处理，将处理后的历史SIC数据通过时间滑窗进行时间步的拼接，生成序列数据样本集。

S102、将序列数据样本集输入预设的预测模型中，得到预测模型输出的下一个时刻的SIC 预测结果，其中，预测模型是指结合全连接条件随机场的ConvLSTM网络模型。

参照图3，在一些实施例中，ConvLSTM网络模型的内部结构式包括：

i_t＝σ(W_xi*X_t+W_hi*H_t-1+W_ci⊙C_t-1+b_i)

f_t＝σ(W_xf*X_t+W_hf*H_t-1+W_cf⊙C_t-1+b_f)

C_t＝f_t⊙C_t-1+i_t⊙tanh(W_xc*X_t+W_hc*H_t-1+b_c)

o_t＝σ(W_xo*X_t+W_ho*H_t-1+W_co⊙C_t+b_o)

H_t＝o_t⊙tanh(C_t)

在一些实施例中，将序列数据样本集输入预设的预测模型中，得到预测模型输出的下一个时刻的SIC预测结果，包括：

将序列数据样本集输入预设的预测模型中的ConvLSTM网络模型中，得到第一SIC预测结果，其中，第一SIC预测结果为预测模型中的ConvLSTM网络模型输出的下一个时刻的SIC预测结果。

根据的第一SIC预测结果得到像素集合X＝{x₁,x₂…x_n}，标签类别构成的标签集 L＝{L₁,L₂…L_k}，特征向量F＝{f₁,f₂…f_n}，颜色特征向量I＝{I₁,I₂…I_n}，位置特征向量 P＝{p₁,p₂…p_n}以及像素点i为分类标签x_i的概率P(x_i)，其中，x_n为像素点n的分类标签，L_k为标签集中第k个类别的分类标签，p_n为像素点n的位置特征向量，I_n是像素点n的颜色特征向量，f_n为像素点n的特征向量，f_n包括像素点n的位置特征向量与像素点n的颜色特征向量。

全连接条件随机场满足吉布斯分布，其概率函数如下：

其中，Z(I)为归一化因子，E(X∣I)能量函数。

在全图的基础上定义能量函数为：

E(X∣I)＝∑_iψ_u(x_i)+∑_i,jψ_p(x_i,x_j)

ψ_u(x_i)＝-log P(x_i)

其中，ψ_u(x_i)为一元势函数，ψ_p(x_i,x_j)为二元势函数，μ(x_i,x_j)为标签比较函数，若x_i≠x_j时μ(x_i,x_j)等于1，若x_i＝x_j时μ(x_i,x_j)等于0，w^m为标签集中第m个类别的高斯核函数对应的权重，m∈[1，k]。

为标签集中第m个类别的高斯核函数，f_i为像素点i的特征向量，f_j为像素点j的特征向量，p_i为像素点i的位置特征向量，p_j为像素点j的位置特征向量，I_i为像素点i的颜色特征向量，I_j为像素点j的颜色特征向量，θ_α为控制位置信息的尺度，θ_β为控制颜色信息的尺度，θ_γ为控制位置信息的尺度。

利用平均场算法迭代更新Q(x)，以使得概率函数P(x)与Q(x)间K-L散度达到预设值，然后用Q_i(x_i)代替P(x_i)，得到预测模型输出的下一个时刻的SIC预测结果，计算步骤如下：

Q(x)＝∏_iQ_i(x_i)

在一些实施例中，ConvLSTM网络模型设置4个ConvLSTM cell，第4个ConvLSTMcell 的参数Return_sequences设置为false。

为了便于本领域人员的理解，以下提供一组最佳实施例：

一、生成序列数据样本集：

获取多个连续时刻的历史SIC数据，并对历史SIC数据进行归一化处理，将处理后的历史SIC数据通过时间滑窗进行时间步的拼接，生成序列数据样本集。

历史SIC数据选用NSIDC第四版的每月SIC数据，研究区域选取北极，水平分辨率为25 ×25km，SIC覆盖范围为31.1N-89.8N，180E-180W，时间跨度为1978年11月-2020年12月，共506个月，其中，SIC数据中土地等缺失值全部赋值为0，代表此处没有海冰覆盖。

参照图2，基于1978年11月-2020年12月共506个月的数据构建序列数据样本集。从第一个月开始，每13个月数据作为一组，逐步划分。每组数据中，前12个月数据作为模型输入，第13个月数据作为标签值。506个月数据共划分为494组，前422组作为训练集，第 423至446组共24组作为验证集，剩下48组作为测试集，其中，利用训练集进行模型训练，图2中Train Set为训练集，Validation Set为验证集，Test Set为测试集。

二、获取预测结果：

根据的第一SIC预测结果得到像素集合X＝{x₁,x₂…x_n}，标签类别构成的标签集 L＝{L₁,L₂…L_k}，特征向量F＝{f₁,f₂…f_n}，颜色特征向量I＝{I₁,I₂…I_n}，位置特征向量 P＝{p₁,p₂…p_n}以及像素点i为分类标签x_i的概率P(x_i)，其中，x_n为像素点n的分类标签，L_k为标签集中第k个类别的分类标签，p_n为像素点n的位置特征向量，I_n是像素点n的颜色特征向量，f_n为像素点n的特征向量，f_n包括像素点n的位置特征向量与像素点n的颜色特征向量；

全连接条件随机场满足吉布斯分布，其概率函数如下。

其中，Z(I)为归一化因子，E(X∣I)能量函数。

在全图的基础上定义能量函数为：

E(X∣I)＝∑_iψ_u(x_i)+∑_i,jψ_p(x_i,x_j)

ψ_u(x_i)＝-log P(x_i)

Q(x)＝∏_iQ_i(x_i)

ConvLSTM网络模型的内部结构式包括：

i_t＝σ(W_xi*X_t+W_hi*H_t-1+W_ci⊙C_t-1+b_i)

f_t＝σ(W_xf*X_t+W_hf*H_t-1+W_cf⊙C_t-1+b_f)

C_t＝f_t⊙C_t-1+i_t⊙tanh(W_xc*X_t+W_hc*H_t-1+b_c)

o_t＝σ(W_xo*X_t+W_ho*H_t-1+W_co⊙C_t+b_o)

H_t＝o_t⊙tanh(C_t)

ConvLSTM网络模型设置4个ConvLSTM cell，第4个ConvLSTM cell的参数 Return_sequences设置为false。

三、实验与结果：

利用序列数据样本集通过实验比较ConvLSTM和ConvLSTM-CRF性能差异。

测试模型的单月预测能力和迭代预测能力，单月预测是指输入T1-T12共12个月数据预测下一个月T13。迭代预测是把预测值作为输入再去预测下一时刻的值，例如把预测值T13 作为预测下一时刻的输入，基于T2-T13共12个月数据预测下一个月T14，再照此迭代预测未来多个月份，利用训练集的48组数据进行单月预测，利用2019年1月-2019年12月的数据迭代预测未来12个月的数据。

通过MAE(Mean Absolute Error,MAE)、RMSE(Root Mean Squared Error,RMSE)比较 ConvLSTM和ConvLSTM-CRF的预测结果，ConvLSTM-CRF为预测模型，两个评价指标的计算方法如下所示：

为了消除不随时间变化的开阔水域和陆地的影响，去除了预测结果中的0值，其中，n为预测的SIC中非零值个数，y_i为SIC真实值，p_i为预测值。

单月预测实验中，利用ConvLSTM和ConvLSTM-CRF分别对测试集48组数据进行预测，预测结果的季节和全年平均MAE和RMSE百分比值如表1、表2所示：

表1为ConvLSTM模型和ConvLSTM-CRF模型季节平均MAE和年平均MAE的对比；

表1

表2为ConvLSTM模型和ConvLSTM-CRF模型季节平均MAE和年平均RMSE的对比；

表2

由表1和表2中可知，ConvLSTM-CRF的预测结果优于ConvLSTM，在融化季节海冰融化产生熔池，MAE和RMSE都要高于冰冻季节均值，但ConvLSTM-CRF的MAE和RMSE都要小于ConvLSTM的MAE和RMSE。

参照图2，其中，Actual表示真实值，选取了两个模型对2016年1月、2016年5月、2016年9月SIC的预测结果，从图中可以看出ConvLSTM-CRF比ConvLSTM的预测范围更准确，海冰边界区域SIC值更贴近真实值。图中两个模型都高估了研究区域的左上和右下部分SIC值，但ConvLSTM-CRF预测值更接近真实值，从图中可以也可以知道ConvLSTM-CRF的9月预测结果明显好于ConvLSTM，ConvLSTM-CRF预测结果的覆盖范围与真实值比较接近，而ConvLSTM预测结果的覆盖范围较广，并将开阔水域预测为有一定浓度的海冰区域。海冰融化季节于9月中旬结束，此时海冰覆盖面积最小。相比于9月，10月海冰覆盖面积迅速增长。从图中可以看出，ConvLSTM-CRF能较好的捕捉到这种变化，预测的海冰覆盖范围和浓度都要更接近真实值。

参照图5和图6，迭代预测实验中，利用2019年1月-2019年12月的数据迭代预测未来 12个月的数据。首先将2019年1月-2019年12月的数据输入两个模型，得到20年1月的预测结果，并将其作为下一次预测的输入。最终得到2020年1月-2020年12月数据。预测结果的每月MAE和RMSE百分比值如图6和图7所示。从图中可以看出，两个模型的MAE和MRSE 都随着迭代次数的增加而增长。但ConvLSTM-CRF增长较缓慢，其MAE和MRSE也小于ConvLSTM。

本发明将ConvLSTM和全连接条件随机场相结合，提出了ConvLSTM-CRF模型以预测北极未来月度SIC。实验证明，ConvLSTM-CRF模型预测精度优于ConvLSTM方法，能更准确的预测 SIC边界范围。特别是在融化和冰冻季节SIC发生剧烈变化时，ConvLSTM-CRF模型预测结果更接近真实情况。在进行海冰迭代预测时，ConvLSTM-CRF模型也体现出了更好的预测效果，此外，ConvLSTM-CRF模型也可以泛化应用场景，所有类似SIC时序预测的问题都可以采用本模型，例如降水预测、降雪预测。

另外，参照图7，本发明还提供了一种基于ConvLSTM和条件随机场的SIC预测***，包括数据获取模块1100以及数据输出模块1200，其中：

数据获取模块1100用于获取多个连续时刻的历史SIC数据，并对历史SIC数据进行归一化处理，将处理后的历史SIC数据通过时间滑窗进行时间步的拼接，生成序列数据样本集；

数据输出模块1200用于将序列数据样本集输入预设的预测模型中，得到预测模型输出的下一个时刻的SIC预测结果，其中，预测模型是指结合全连接条件随机场的ConvLSTM网络模型。

在一些实施例中，ConvLSTM网络模型的内部结构式包括：

i_t＝σ(W_xi*X_t+W_hi*H_t-1+W_ci⊙C_t-1+b_i)

f_t＝σ(W_xf*X_t+W_hf*H_t-1+W_cf⊙C_t-1+b_f)

C_t＝f_t⊙C_t-1+i_t⊙tanh(W_xc*X_t+W_hc*H_t-1+b_c)

o_t＝σ(W_xo*X_t+W_ho*H_t-1+W_co⊙C_t+b_o)

H_t＝o_t⊙tanh(C_t)

在一些实施例中，数据输出模块包括：

第一预测模块，用于将序列数据样本集输入预设的预测模型中的ConvLSTM网络模型中，得到第一SIC预测结果，其中，第一SIC预测结果为预测模型中的ConvLSTM网络模型输出的下一个时刻的SIC预测结果；

数据生成模块，用于根据的第一SIC预测结果生成像素集合X＝{x₁,x₂…x_n}，标签类别构成的标签集L＝{L₁,L₂…L_k}，特征向量F＝{f₁,f₂…f_n}，颜色特征向量I＝{I₁,I₂…I_n}，位置特征向量P＝{p₁,p₂…p_n}以及像素点i为分类标签x_i的概率P(x_i)，其中，x_n为像素点n的分类标签，L_k为标签集中第k个类别的分类标签，p_n为像素点n的位置特征向量，I_n是像素点n的颜色特征向量，f_n为像素点n的特征向量，f_n包括像素点n的位置特征向量与像素点n的颜色特征向量；

全连接条件随机场满足吉布斯分布，其概率函数如下：

其中，Z(I)为归一化因子，E(X∣I)能量函数；

在全图的基础上定义能量函数为：

E(X∣I)＝∑_iψ_u(x_i)+∑_i,jψ_p(x_i,x_j)

ψ_u(x_i)＝-log P(x_i)

为标签集中第m个类别的高斯核函数，f_i为像素点i的特征向量，f_j为像素点j的特征向量，p_i为像素点i的位置特征向量，p_j为像素点j的位置特征向量，I_i为像素点i的颜色特征向量，I_j为像素点j的颜色特征向量，θ_α为控制位置信息的尺度，θ_β为控制颜色信息的尺度，θ_γ为控制位置信息的尺度；

结果输出模块，用于利用平均场算法迭代更新Q(x)，以使得概率函数P(x)与Q(x)间K-L 散度达到预设值，然后用Q_i(x_i)代替P(x_i)，得到预测模型输出的下一个时刻的SIC预测结果，计算步骤如下：

Q(x)＝∏_iQ_i(x_i)

在一些实施例中，ConvLSTM网络模型设置4个ConvLSTM cell，且第4个ConvLSTMcell 的参数Return_sequences设置为false。

需要注意的是，本***实施例与上述的方法实施例是基于相同的发明构思，因此上述方法实施例的相关内容同样适用于本***实施例，这里不再赘述。

处理器和存储器可以通过总线或者其他方式连接。

存储器作为一种非暂态计算机可读存储介质，可用于存储非暂态软件程序以及非暂态性计算机可执行程序。此外，存储器可以包括高速随机存取存储器，还可以包括非暂态存储器，例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中，存储器可选包括相对于处理器远程设置的存储器，这些远程存储器可以通过网络连接至该处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

实现上述实施例的基于ConvLSTM和条件随机场的SIC预测方法所需的非暂态软件程序以及指令存储在存储器中，当被处理器执行时，执行上述实施例中的基于ConvLSTM和条件随机场的SIC预测方法，例如，执行以上描述的图1中的方法步骤S101至步骤S102。

本申请还提供一种计算机可读存储介质，存储有计算机可执行指令，计算机可执行指令用于执行：如上述的基于ConvLSTM和条件随机场的SIC预测方法。

该计算机可读存储介质存储有计算机可执行指令，该计算机可执行指令被一个处理器或控制器执行，例如，被上述电子设备实施例中的一个处理器执行，可使得上述处理器执行上述实施例中的基于ConvLSTM和条件随机场的SIC预测方法，例如，执行以上描述的图1中的方法步骤S101至步骤S102。

本领域普通技术人员可以理解，上文中所公开方法中的全部或某些步骤、***可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器，如中央处理器、数字信号处理器或微处理器执行的软件，或者被实施为硬件，或者被实施为集成电路，如专用集成电路。这样的软件可以分布在计算机可读介质上，计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的，术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序单元或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外，本领域普通技术人员公知的是，通信介质通常包含计算机可读指令、数据结构、程序单元或者诸如载波或其他传输机制之类的调制数据信号中的其他数据，并且可包括任何信息递送介质。

上面结合附图对本发明实施例作了详细说明，但本发明不限于上述实施例，在所属技术领域普通技术人员所具备的知识范围内，还可以在不脱离本发明宗旨的前提下作出各种变化。

Claims

1.一种基于ConvLSTM和条件随机场的SIC预测方法，其特征在于，所述方法包括：

将所述序列数据样本集输入预设的预测模型中，得到所述预测模型输出的下一个时刻的SIC预测结果，其中，所述预测模型是指结合全连接条件随机场的ConvLSTM网络模型。

2.根据权利要求1所述的一种基于ConvLSTM和条件随机场的SIC预测方法，其特征在于，所述ConvLSTM网络模型的内部结构式包括：

i_t＝σ(W_xi*X_t+W_hi*H_t-1+W_ci⊙C_t-1+b_i)

f_t＝σ(W_xf*X_t+W_hf*H_t-1+W_cf⊙C_t-1+b_f)

C_t＝f_t⊙C_t-1+i_t⊙tanh(W_xc*X_t+W_hc*H_t-1+b_c)

o_t＝σ(W_xo*X_t+W_ho*H_t-1+W_eo⊙C_t+b_o)

H_t＝o_t⊙tanh(C_t)

3.根据权利要求2所述的一种基于ConvLSTM和条件随机场的SIC预测方法，其特征在于，所述将所述序列数据样本集输入预设的预测模型中，得到所述预测模型输出的下一个时刻的SIC预测结果，包括：

将所述序列数据样本集输入所述预设的预测模型中的ConvLSTM网络模型中，得到第一SIC预测结果，其中，所述第一SIC预测结果为所述预测模型中的ConvLSTM网络模型输出的下一个时刻的SIC预测结果；

根据所述的第一SIC预测结果得到像素集合X＝{x₁，x₂...x_n}，标签类别构成的标签集L＝{L₁，L₂...L_k}，特征向量F＝{f₁，f₂...f_n}，颜色特征向量I＝{I₁，I₂...I_n}，位置特征向量P＝{p₁，p₂...p_n}以及像素点i为分类标签x_i的概率P(x_i)，其中，x_n为像素点n的分类标签，L_k为所述标签集中第k个类别的分类标签，p_n为像素点n的位置特征向量，I_n是所述像素点n的颜色特征向量，f_n为像素点n的特征向量，所述f_n包括所述像素点n的位置特征向量与所述像素点n的颜色特征向量；

所述全连接条件随机场满足吉布斯分布，其概率函数如下：

其中，Z(I)为归一化因子，E(X|I)能量函数；

在全图的基础上定义能量函数为：

E(X|I)＝∑_iψ_u(x_i)+∑_i，jψ_p(x_i，x_j)

ψ_u(x_i)＝-log P(x_i)

其中，ψ_u(x_i)为一元势函数，ψ_p(x_i，x_j)为二元势函数，μ(x_i，x_j)为标签比较函数，若x_i≠x_j时μ(x_i，x_j)等于1，若所述x_i＝x_j时μ(x_i，x_j)等于0，w^m为标签集中第m个类别的高斯核函数对应的权重，m∈[1，k]。

为所述标签集中第m个类别的高斯核函数，fi为像素点i的特征向量，f_j为像素点j的特征向量，p_i为像素点i的位置特征向量，p_j为像素点j的位置特征向量，I_i为像素点i的颜色特征向量，I_j为像素点j的颜色特征向量，θ_α为控制位置信息的尺度，θ_β为控制颜色信息的尺度，θ_γ为控制位置信息的尺度；

Q(x)＝Π_iQ_i(x_i)

其中，Q_i(x_i)为像素点i为分类标签x_i的近似概率，l为像素点i的分类标签，l′为像素点i的预测分类标签，Z_i为归一化因子，μ(l，l′)为标签比较函数。

4.根据权利要求3所述的一种基于ConvLSTM和条件随机场的SIC预测方法，其特征在于，所述ConvLSTM网络模型设置4个ConvLSTM cell，第4个ConvLSTM cell的参数Return_sequences设置为false。

5.一种基于ConvLSTM和条件随机场的SIC预测***，其特征在于，所述***包括：

数据输出模块，用于将所述序列数据样本集输入预设的预测模型中，得到所述预测模型输出的下一个时刻的SIC预测结果，其中，所述预测模型是指结合全连接条件随机场的ConvLSTM网络模型。

6.根据权利要求5所述的一种基于ConvLSTM和条件随机场的SIC预测***，其特征在于，所述ConvLSTM网络模型的内部结构式包括：

i_t＝σ(W_xi*X_t+W_hi*H_t-1+W_ci⊙C_t-1+b_i)

f_t＝σ(W_xf*X_t+W_hf*H_t-1+W_cf⊙C_t-1+b_f)

C_t＝f_t⊙C_t-1+i_t⊙tanh(W_xc*X_t+W_hc*H_t-1+b_c)

o_t＝σ(W_xo*X_t+W_ho*H_t-1+W_co⊙C_t+b_o)

H_t＝o_t⊙tanh(C_t)

7.根据权利要求6所述的一种基于ConvLSTM和条件随机场的SIC预测***，其特征在于，所述数据输出模块包括：

第一预测模块，用于将所述序列数据样本集输入所述预设的预测模型中的ConvLSTM网络模型中，得到第一SIC预测结果，其中，所述第一SIC预测结果为所述预测模型中的ConvLSTM网络模型输出的下一个时刻的SIC预测结果；

数据生成模块，用于根据所述的第一SIC预测结果生成像素集合X＝{x₁，x₂...x_n}，标签类别构成的标签集L＝{L₁，L₂...L_k}，特征向量F＝{f₁，f₂...f_n}，颜色特征向量I＝{I₁，I₂...I_n}，位置特征向量P＝{p₁，p₂...p_n}以及像素点i为分类标签x_i的概率P(x_i)，其中，x_n为像素点n的分类标签，L_k为所述标签集中第k个类别的分类标签，p_n为像素点n的位置特征向量，I_n是所述像素点n的颜色特征向量，f_n为像素点n的特征向量，所述f_n包括所述像素点n的位置特征向量与所述像素点n的颜色特征向量；

所述全连接条件随机场满足吉布斯分布，其概率函数如下：

其中，Z(I)为归一化因子，E(X|I)能量函数；

在全图的基础上定义能量函数为：

E(X|I)＝∑_iψ_u(x_i)+∑_i，jψ_p(x_i，x_j)

ψ_u(x_i)＝-log P(x_i)

结果输出模块，用于利用平均场算法迭代更新Q(x)，以使得所述概率函数P(x)与所述Q(x)间K-L散度达到预设值，然后用Q_i(x_i)代替P(x_i)，得到所述预测模型输出的下一个时刻的SIC预测结果，计算步骤如下：

Q(x)＝Π_iQ_i(x_i)

8.根据权利要求7所述的一种基于ConvLSTM和条件随机场的SIC预测***，其特征在于，所述ConvLSTM网络模型设置4个ConvLSTM cell，且第4个ConvLSTM cell的参数Return_sequences设置为false。

9.一种基于ConvLSTM和条件随机场的SIC预测设备，其特征在于，包括至少一个控制处理器和用于与所述至少一个控制处理器通信连接的存储器；所述存储器存储有可被所述至少一个控制处理器执行的指令，所述指令被所述至少一个控制处理器执行，以使所述至少一个控制处理器能够执行如权利要求1至4任一项所述的一种基于ConvLSTM和条件随机场的SIC预测方法。

10.一种计算机可读存储介质，其特征在于：所述计算机可读存储介质存储有计算机可执行指令，所述计算机可执行指令用于使计算机执行如权利要求1至4任一项所述的一种基于ConvLSTM和条件随机场的SIC预测方法。