CN113420421A

CN113420421A - 移动边缘计算中基于时序正则化张量分解的QoS预测方法

Info

Publication number: CN113420421A
Application number: CN202110594867.4A
Authority: CN
Inventors: 夏虹; 陈彦萍; 张雅倩; ***; 高聪; 金小敏; 王凤伟; 董庆义
Original assignee: Xian University of Posts and Telecommunications
Current assignee: Xian University of Posts and Telecommunications
Priority date: 2021-05-28
Filing date: 2021-05-28
Publication date: 2021-09-21
Anticipated expiration: 2041-05-28
Also published as: CN113420421B

Abstract

本发明提供的一种移动边缘计算中基于时序正则化张量分解的QoS预测方法，通过获取用户访问服务的QoS记录；基于QoS记录构建表示用户、服务以及时间关系的三维张量模型；使用CP分解方法对三维张量模型进行分解，在分解过程中引入与用户维、服务维以及时间维的相关的约束正则项分别对三维张量模型的用户、服务以及时间的权重进行分解约束，并且引入时序正则项对三维张量模型的时间维的时序关系进行分解约束，分别得到用户因子矩阵、服务因子矩阵以及时间因子矩阵，预测具体用户在具体时刻调用具体服务的QoS值。本发明将张量分解与时间序列预测相结合来提高移动边缘计算环境中QoS预测的准确度。

Description

移动边缘计算中基于时序正则化张量分解的QoS预测方法

技术领域

本发明属于移动边缘技术领域，具体涉及一种移动边缘计算中基于时序正则化张量分解的QoS预测方法。

背景技术

移动边缘计算(MobileEdgeComputing，MEC)技术的快速发展使得移动服务数量急剧增长，不同的服务提供商提供的许多移动服务具有相同或类似的功能。移动中的QoS数据有以下两种特殊的性质：QoS数据的高维高稀疏性以及QoS数据的动态易变性。

高维高稀疏性是指越来越多的移动服务在不同的领域被开发并用于构建复杂的移动应用程序。目前需要处理的用户和移动服务对象在急剧增长，服务调用中的高稀疏问题越严重，并且这样的高维数据往往会带来庞大的计算量。动态易变性是指动态QoS值取决于调用用户、服务提供者以及移动网络环境。但是MEC下服务状态和网络环境频繁变化，QoS数据具有非线性、随时间动态易变的特点，即使相同的移动服务在不同的调用时间也会表现出不一样的QoS值。

现有技术中移动边缘计算针对上述两种性质，提出协同过滤方法预测QoS。协同过滤方法分为基于内存协同过滤方法和基于模型的协同过滤方法，在预测过程中使用时间序列预测技术在用户过去调用过服务的情况预测QoS，但是由于QoS数据的高稀疏性。随着移动服务和用户数量的增多，用户不可能对所有服务都进行调用，也不可能一直保持对某个服务的访问，服务调记录中的高稀疏性问题严重，很难对每对用户和服务都构建一个时间序列模型来进行QoS预测。并且由于服务推荐中需要处理的对象为成百上千个用户和服务，这样的高维数据往往会带来庞大的计算量，然而大多数传统的时间序列技术由于其较高的计算复杂度只能处理较低维的时序数据。在移动边缘计算环境下用户调用得到的QoS数据不仅与本地QoS性能有关，还会受到网络环境、服务状态、链路长度等用户个性化因素的影响。因此现有技术预测QoS的方法并不准确。

发明内容

为了解决现有技术中存在的上述问题，本发明提供了一种移动边缘计算中基于时序正则化张量分解的QoS预测方法。本发明要解决的技术问题通过以下技术方案实现：

本发明提供的一种移动边缘计算中基于时序正则化张量分解的QoS预测方法包括：

获取用户访问服务的QoS记录；

基于QoS记录构建表示用户、服务以及时间关系的三维张量模型；

使用CP分解方法对所述三维张量模型进行分解，在分解过程中引入与用户维、服务维以及时间维的相关的约束正则项分别对所述三维张量模型的用户、服务以及时间的权重进行分解约束，并且引入时序正则项对三维张量模型的时间维的时序关系进行分解约束，分别得到用户因子矩阵、服务因子矩阵以及时间因子矩阵；

使用所述用户因子矩阵、服务因子矩阵以及时间因子矩阵，预测具体用户在具体时刻调用具体服务的QoS值。

可选的，所述基于QoS记录构建表示用户、服务以及时间关系的三维张量模型包括：

将在时间周期1处的I个用户作为矩阵行，J个服务作为矩阵列，构建二维矩阵；

基于所述QoS记录，将QoS记录中QoS值按照用户与服务的对应关系，填充如所述二维矩阵中；

构建K个时间周期矩阵以及三维张量矩阵；

将每个时间周期矩阵确定为张量矩阵的第三维度，所述填充后的二维矩阵确定为所述张量矩阵的剩余维度，获得三维张量模型。

可选的，所述使用CP分解方法对所述三维张量模型进行分解，在分解过程中引入与用户维、服务维以及时间维的相关的约束正则项分别对所述三维张量模型的用户、服务以及时间的权重进行分解约束，并且引入时序正则项对三维张量模型的时间维的时序关系进行分解约束，分别得到用户因子矩阵、服务因子矩阵以及时间因子矩阵包括：

构建预测所述三维张量模型的近似张量与原始张量误差最小的第一优化问题；

在当用户i在k时刻调用服务j获取的QoS与预测的用户i在k时刻调用服务j获取的QoS相同，则所述第一优化问题最小的条件下，将所述第一优化问题转化为第二优化问题；

在所述第二优化问题中引入用户维、与用户维、服务维以及时间维的相关的约束正则项分别对所述三维张量模型的用户、服务以及时间的权重进行分解约束，并且引入时序正则项对三维张量模型的时间维的时序关系进行分解约束，将所述第二优化问题转化为第三优化问题；

对所述第三优化问题进行求解，分别得到用户因子矩阵、服务因子矩阵以及时间因子矩阵。

可选的，在所述第二优化问题中引入用户维、与用户维、服务维以及时间维的相关的约束正则项分别对所述三维张量模型的用户、服务以及时间的权重进行分解约束，并且引入时序正则项对三维张量模型的时间维的时序关系进行分解约束，将所述第二优化问题转化为第三优化问题包括：

确定时间因子矩阵的时序系数向量，组成时序系数矩阵；

在所述第二优化问题中引入用户维、与用户维、服务维以及时间维的相关的约束正则项分别对所述三维张量模型的用户、服务以及时间的权重进行分解约束，并且引入时序系数矩阵中的时序系数向量对三维张量模型的时间维的时序关系进行分解约束，将所述第二优化问题转化为第三优化问题。

其中，所述第一优化问题表示为：

其中，

表示估计的近似张量，

表示原始张量，y_ijk是张量

中的元素值，表示用户i在k时刻调用服务j获取的QoS，

是张量

中的元素值，表示预测的用户i在k时刻调用服务j获取的QoS，I,J,K分别是张量每一维度的最大值，

是张量

中的元素值，u_ir是因子矩阵U中第i行第r列的值，s_jr是因子矩阵S中第j行第r列的值，t_kr是因子矩阵T中第k行第r列的值，R表示近似张量的秩。

其中，所述第二优化问题表示为：

所述引入正则化项的第二优化问题表示为：

其中，

是引入的与因子矩阵U,S,T相关的约束正则项，λ_u,λ_s,λ_t分别是对应的正则化参数。

其中，所述时序系数向量表示为：

其中，t_k表示时间因子矩阵T中的第k行，

是一个滞后集，θ₁是t_k的前一行t_k-1对应的时序系数，θ₂是t_k的前两行t_k-2对应的时序系数，θ_l是t_k-l的时序系数向量，时序系数向量θ_l组成了时序系数矩阵Θ；

所述第三优化问题表示为：

其中，

是时序正则项，λ_ar是时序正则项对应的正则化参数，

是时序系数正则项，λ_θ是时序系数正则项对应的正则化系数。

可选的，所述对所述第三优化问题进行求解，分别得到用户因子矩阵、服务因子矩阵以及时间因子矩阵包括：

使用交替最小二乘法ALS对所述第三优化问题进行迭代优化，以获取对用户因子矩阵的用户值、服务因子矩阵的服务值以及时间因子矩阵时间值。

其中，所述用户值表示为：

所述服务值表示为：

当k∈{1,2,…,l_d}，所述时间值表示为：

当k∈{l_d+1,l_d+2,…,K}所述时间值表示为：

其中，

表示卷积，上角标T表示转置，h表示滞后集

中的每个值，l_d表示滞后集

中的最大值，t表示时间。

可选的，所述使用所述用户因子矩阵、服务因子矩阵以及时间因子矩阵，预测具体用户在具体时刻调用具体服务的QoS值包括：

将所述用户值、服务值以及时间值代入预测公式，预测具体用户在具体时刻调用具体服务的QoS值；

所述预测公式为：

其中，

表示预测的QoS值。

本发明的创新点在于：

1、本发明考虑移动边缘计算环境下QoS数据与服务调用时间高度相关，将时间因素考虑在内，在二维用户-服务矩阵的基础上，使用三维用户-服务-时间张量模型来表示QoS数据中复杂的三元关系，将用户在一段时间内调用服务获取的QoS属性值存储在张量模型中，以提高预测的准确性。

2、本发明通过张量分解来分析用户、服务和时间的潜在因素，并考虑QoS的时序特征，在CP分解的基础上引入时序正则项。通过多次迭代优化将各个因子矩阵组合起来得到目标张量的低秩近似来预测缺失值，因此可以提高预测QoS的准确性。

以下将结合附图及实施例对本发明做进一步详细说明。

附图说明

图1是本发明实施例提供的本发明提供的一种移动边缘计算中基于时序正则化张量分解的QoS预测方法的流程示意图；

图2是本发明实施例提供的三阶张量的CP分解过程示意图；

图3是本发明实施例提供的潜在因子矩阵和秩1张量的示意图；

图4是本发明实施例提供的基于时序正则化张量分解的QoS预测框架结构图；

图5是本发明实施例提供的用户-服务-时间张量模型构造示意图；

图6是本发明实施例提供的时间依赖关系展示图；

图7是本发明实施例提供的滞后集

的影响的实验对比图；

图8是本发明实施例提供的张量密度的影响的实验对比图；

图9是本发明实施例提供的因子矩阵维度值的影响的实验对比图。

具体实施方式

下面结合具体实施例对本发明做进一步详细的描述，但本发明的实施方式不限于此。

实施例一

如图1所示，本发明提供的一种移动边缘计算中基于时序正则化张量分解的QoS预测方法包括：

S1，获取用户访问服务的QoS记录；

S2，基于QoS记录构建表示用户、服务以及时间关系的三维张量模型；

张量是向量(一阶张量)和矩阵(二阶张量)向高阶序列的推广，可称为多维矩阵或多维数组，其作为一种高维数据表示与分析的有力工具，已经被广泛应用于数据挖掘、计算机视觉、图像处理、交通流量分析等研究领域。张量通常用欧拉字母

矩阵用大写字母X,Y…,向量用小写字母x,y…表示。一个N维张量

可以被认为是一个由

组成的N维数组，其中对于1≤n≤N,i_n∈{1,2,…,I_n}。张量展开是通过变化维度i_n并保持其它维度不变得到n模矩阵的操作，是张量到矩阵的映射过程。

中的元素被映射到展开矩阵

例如，一个三阶张量

可以展开形成三个矩阵

S3，使用CP分解方法对三维张量模型进行分解，在分解过程中引入与用户维、服务维以及时间维的相关的约束正则项分别对三维张量模型的用户、服务以及时间的权重进行分解约束，并且引入时序正则项对三维张量模型的时间维的时序关系进行分解约束，分别得到用户因子矩阵、服务因子矩阵以及时间因子矩阵；

一个三阶张量的CANDECOMP/PARAFAC(CP)分解过程如图2所示。可以看出，通过CP分解，

被分解成个R秩1张量，分别是：

其中R是分解的秩1张量的总数目。对于一个给定的张量，R的定义是一个不确定的多项式问题，因此，它通常是提前定义的。

是由三个潜在因子向量u_r,s_r,t_r的外积构成的秩1张量，即

表示CP分解后得到的秩1张量，u_r,s_r,t_r是潜在因子向量，其中u_r,s_r,t_r分别是长度为I,J,K的向量，

表示张量积。秩1张量

中每个元素的值可表示为

a_ijk＝u_irs_jrt_kr(2)

a_ijk表示

中的元素值，u_ir是因子矩阵中U中第i行第r列的值，s_jr是因子矩阵S中第j行第r列的值，t_kr是因子矩阵T中第k行第r列的值。

参考图2，图2为一个三阶张量的CP分解过程，一个三阶张量可以分解为用户、服务、时间的因子矩阵。参考图3，因子矩阵

分别由长度为I,J,K的R个潜在因子向量组成。其中，U,S,T的第r列向量u_r,s_r,t_r外积得到第r个秩1张量

在得到这些秩1张量

之后，本发明可以计算

的近似张量

如下式：

表示估计的近似张量，R表示近似张量的秩。根据上面定义，近似问题可以转化为如下优化问题：

表示原始张量，U,S,T是潜在因子矩阵其中运算符

表示Frobenius范数。

S4，使用用户因子矩阵、服务因子矩阵以及时间因子矩阵，预测具体用户在具体时刻调用具体服务的QoS值。

如图4所示，图4为基于时序正则化张量分解的QoS预测框架，给定一个包含时间信息的QoS数据集，如何在已有QoS记录的基础上预测其余缺失的QoS值。每一个QoS值都由user、service、time三个维度的信息进行描述，对应于三维空间中的点，每个点的坐标为<user,service,time>，所以本发明使用张量模型来捕获用户、服务、时间三者之间的交互关系。整合I个用户在K个时间间隔中调用J个Web服务观察到的QoS值可以得到一个三阶张量

由于只是部分调用，张量中会存在一些空缺值。比如，对于一个大小为I×J×K的三阶张量，里面的元素值可表示为

其中

表明用户i在时间k处调用了服务j,Rating表示此次调用获取的QoS值，

表示此时该服务并未被此用户调用。为了获得张量中缺失的QoS值，需要利用历史调用服务的QoS数据进行预测。

作为本发明一种可选的实施方式，基于QoS记录构建表示用户、服务以及时间关系的三维张量模型包括：

步骤一：将在时间周期1处的I个用户作为矩阵行，J个服务作为矩阵列，构建二维矩阵；

步骤二：基于QoS记录，将QoS记录中QoS值按照用户与服务的对应关系，填充如二维矩阵中；

步骤三：构建K个时间周期矩阵以及三维张量矩阵；

步骤四：将每个时间周期矩阵确定为张量矩阵的第三维度，填充后的二维矩阵确定为张量矩阵的剩余维度，获得三维张量模型。

当用户调用服务时，底层中间件会记录相关QoS信息。在一段时间之后，***将会积累一系列QoS数据。如果当前时间间隔内没有可用的QoS信息，本发明考虑QoS属性值会受到该用户之前调用同一服务的QoS值的影响。例如在图5中，U₁在T₁和T₃时刻调用了服务S₁，U₁在T₁、T₂以及T₃时刻调用了服务S₃。本发明可以把用户在多个时间间隔内调用同一服务获取的QoS值作为一个个时间序列存储在用户-服务-时间张量模型中，利用这些已有的QoS信息构造一个三阶张量

其中I,J,K为用户、服务和时间间隔的数目。参考图5，在图5中，总共有3个用户(U₁至U₃)，3种服务(S₁至S₃)，3个时间间隔(T₁至T₃)。灰色部分表示此服务被调用，白色部分表示未被调用，观察到的QoS值用<user,service,time,rating>表示，比如U₁在T₁时刻调用了服务S₁观察到的QoS值为1.2。具体的构造过程如本实施例所示，利用一组QoS值构造一个时间感知张量模型

三维张量模型的构建过程如下述所示：

输入:QoS数据集(user,service,time,rating)；

输出:一个三阶张量

1、加载数据集中所有的QoS值(user,service,time,rating)，

2、构建用户-服务矩阵M(1)，将在时间周期1处的I个用户作为矩阵行，J个服务作为矩阵列，

3、根据QoS值(user,service,1,rating)填充矩阵M(1)，

4、构造K个时间周期的矩阵M(1),M(2),…,M(K)，

5、构造张量

矩阵M(k),k＝1,2,…,K作为张量的每一个片；

6、return

作为本发明一种可选的实施方式，上述步骤S3包括：

步骤31：构建预测三维张量模型的近似张量与原始张量误差最小的第一优化问题；

步骤32：在当用户i在时刻k调用服务j获取的QoS与预测的用户i在k时刻调用服务j获取的QoS相同，则第一优化问题最小的条件下，将第一优化问题转化为第二优化问题；

步骤33：在第二优化问题中引入用户维、与用户维、服务维以及时间维的相关的约束正则项分别对三维张量模型的用户、服务以及时间的权重进行分解约束，并且引入时序正则项对三维张量模型的时间维的时序关系进行分解约束，将第二优化问题转化为第三优化问题；

步骤34：对第三优化问题进行求解，分别得到用户因子矩阵、服务因子矩阵以及时间因子矩阵。

为了得到CP分解中理想的潜在因子矩阵，本发明需要建立第一优化问题：

其中，

表示估计的近似张量，

表示原始张量，y_ijk是张量

中的元素值，表示用户i在k时刻调用服务j获取的QoS，

是张量

是张量

当且仅当

时，误差最小为零。第一优化问题可以转换为第二优化问题，表示为：

由于

中有很多元素是未知的，因此应该根据

中的已知元素集合Ω定义优化问题，基于这样的原则，第一优化问题可以转换为：

为了避免模型过拟合的问题，本发明引入了与潜在矩阵U,S,T有关的三个约束正则化项，引入正则化项的第二优化问题表示为：

是引入的与潜在因子矩阵U,S,T相关的正则化项，其中λ_u,λ_s,λ_t分别是对应的正则化参数。

由于QoS数据具有时序特征，某个时间间隔的QoS属性值可能会受到该用户在之前时间间隔调用此Web服务获取的QoS值的影响。如图6所示的时序结构，每一个时间槽的状态就与该时间槽之前的第一个和第二个时间槽的状态有关。图6所示的时序结构可以表现在时间因子矩阵

中，矩阵T的任一行t_k其前第一行t_k-1和前第二行t_k-2的组合，组合方式如下：

t_k表示时间因子矩阵T中的第k行，θ₁是t_k的前一行t_k-1对应的时序系数，θ₂是t_k的前两行t_k-2对应的时序系数。

本发明可以首先确定时间因子矩阵的时序系数向量，组成时序系数矩阵；在第二优化问题中引入用户维、与用户维、服务维以及时间维的相关的约束正则项分别对三维张量模型的用户、服务以及时间的权重进行分解约束，并且引入时序系数矩阵中的时序系数向量对三维张量模型的时间维的时序关系进行分解约束，将第二优化问题转化为第三优化问题。

一般的，时间因子矩阵

的行之间的关系可以表示为：

其中，t_k表示时间因子矩阵T中的第k行，

基于上述时间特性因子矩阵

的行之间的时序关系，通过在CP分解方法中引入时序正则项，以自回归的方式对用户因子矩阵U、服务因子矩阵S、时间因子矩阵T、时序系数矩阵Θ进行学习，而不需要人为设定时序系数θ。这就是在张量分解方法的基础上引入时序关系的时序正则化张量分解方法TRTF。因此，最终得到第三优化的问题如下：

第三优化问题表示为：

其中，

是时序正则项，λ_ar是时序正则项对应的正则化参数，

为了解决上述优化问题，本发明使用交替最小二乘法ALS对近似张量进行迭代优化，以获取对目标张量的最佳估计。ALS是优化近似张量秩(R₁,R₂,…R_N)的算法。它在每次迭代过程中只优化一个因子矩阵，固定其余N-1个因子矩阵。

更新用户因子矩阵U中的向量u_i,i∈{1,2,…,I}需要最小化：

对上式求导并令导数为零可得：

因此，向量u_i,i∈{1,2,…,I}的更新迭代式子，即用户值表示为：

更新服务因子矩阵S中的向量s_j,j∈{1,2,…,J}需要最小化：

根据u_i的更新原则可得向量s_j,j∈{1,2,…,J}的更新迭代式子，即服务值为：

当更新时间因子矩阵T中的向量t_k,k∈{1,2,…,K}时，需要分为两种情况，令

第一种情况：k∈{1,2,…,l_d}，由于前l_d列不由前几项组合得到，不包含时序正则项，所以需要最小化：

根据u_i的更新原则可得向量t_k，k∈{1,2,…,l_d}的更新迭代式子为：

第二种情况：k∈{l_d+1,l_d+2,…,K}，此时需要包含时序正则项，需要最小化:

根据u_i的更新原则可得向量t_k，k∈{l_d+1,l_d+2,…,K}的更新迭代式子为：

其中

更新时序系数矩阵Θ中的向量θ_h,

需要最小化：

根据u_i的更新原则可得向量θ_h,

的更新迭代式子为：

其中

其中，

表示卷积，上角标T表示转置，h表示滞后集

中的每个值，l_d表示滞后集

中的最大值，t表示时间。

在获得理想的潜在因子矩阵U,S,T之后，用户i在时刻k调用服务j的QoS预测值可以预测。

作为本发明一种可选的实施方式，使用用户因子矩阵、服务因子矩阵以及时间因子矩阵，预测具体用户在具体时刻调用具体服务的QoS值包括：

将用户值、服务值以及时间值代入预测公式，预测具体用户在具体时刻调用具体服务的QoS值；

预测公式为：

其中，

表示预测的QoS值。

作为本发明一种可选的实施方式，对第三优化问题进行求解，分别得到用户因子矩阵、服务因子矩阵以及时间因子矩阵包括：

使用交替最小二乘法ALS对第三优化问题进行迭代优化，以获取对用户因子矩阵的用户值、服务因子矩阵的服务值以及时间因子矩阵时间值。

下面通过仿真实验，验证本发明提供的预测方法的效果。

在本节中，首先介绍了实验所用数据集以及评价指标，接着说明实验设计以及得到的实验结果。经过大量的实验，将所提的TRTF模型与其余几种常见的QoS预测方法在相同的训练和测试用例下进行了MAE和RMSE值的比较。由于张量密度决定张量模型的稀疏性，这将影响预测精度。因子矩阵的维度数决定潜在因子的数量，这也将影响预测精度。因此通过一系列的实验考察了不同张量密度以及因子矩阵维度数对预测准确度的影响。

实验设置

使用Python3.8和C++混合环境实现算法。实验是在一台带有2.4GHzIntel(R)i5Core(TM),16GBRAM，运行Windows10操作***的计算机上进行的。

为了评估提出的QoS预测方法，使用由Zheng等人在PlanetLab从22个国家的142台分布式计算机上收集的两个真实Web服务QoS数据集，详细信息如表1所示。它们描述了在64个不同的时间点142个用户调用4532个真实Web服务时观察到的响应时间和吞吐量，每个数据集包含30,287,611条QoS记录。可以根据QoS属性分别构造两个大小为142×4532×64的用户-服务-时间张量。

表1QoS数据集特征

统计指标	响应时间	吞吐量
			ScaleofQoSvalue	0-20s	0-1000kbps
MeanofQoSvalue	3.165s	9.609kbps
			StandradDeviationofQoSvalue	6.12s	50.11s
Num.ofServiceUsers	142	142
			Num.ofWebServices	4,532	4,532
Num.ofTimeIntervals	64	64
			IntervalofTimeSlots	15minutes	15minutes
Num.ofRecords	30,287,611	30,287,611

为了评估QoS的预测精度，使用MeanAbsoluteError(MAE)和RootMeanSquaredError(RMSE)作为指标与其余几种协同过滤方法进行比较。

MAE被定义如下：

其中，

表示用户i在时间k处使用Web服务j的真实QoS值，

表示预测的QoS值，N表示预测元素的个数。

RMSE被定义如下：

MAE和RMSE的值越小表示QoS的预测准确度越高。

本发明为了进行比较，本发明在同一数据集上进行了大量的实验，所对比的7种QoS预测方法及特点如表2所示。

表2对比方法表

由于上述方法有些不能通过构造三阶张量进行QoS预测，本发明使用一种特殊的方式处理，把用户-服务-时间张量看作是一组对应不同时间间隔的用户-服务矩阵切片，将三阶张量压缩为二维用户-服务矩阵，矩阵中的元素是每对用户和服务沿所有时间间隔计算得到的平均值。对张量中的每一个矩阵切片，使用基线方法预测并与本发明的TRTF模型比较。

在现实世界中，用户不会调用所有的服务，任一服务也不会被所有的用户所访问，所以用户观察到的QoS数据通常是稀疏的。本发明在实验过程中将一部分数据作为测试数据随机剔除，保证实验数据集的稀疏性。详细描述如表3所示，训练数据集的密度在5％至30％之间，每次递增5％，将张量密度定义为训练数据集的密度。例如第一种情况，训练数据比值为5％，这意味着本发明从数据集中随机选取5％作为训练数据，剩余95％作为测试数据，利用5％的训练项预测95％的测试项。为了评估的公平性，本发明对模型赋予相同的初始假设，并在相同的训练和测试用例下利用公式(24)和公式(25)对预测值和原始值进行误差比较。由于UPCC、IPCC以及UIPCC都是基于邻域的协同过滤方法，本发明将其中的用户邻域数设置为10，服务邻域数设置为50，并将所有张量或矩阵分解中的潜在因子数设置为20。如图7所示，本发明针对滞后集L的设置进行了对比实验，对响应时间和吞吐量的预测结果都显示将TRTF方法中的滞后集

设置为{1,2,3,4}时误差最小。所以在以下实验中，将

设置为{1,2,3,4}，以获取好的预测效果。每组实验重复十次，以避免数据波动造成的误差。

表3测试数据的详细设置

表4给出了以上八种方法的预测精度比较。通过观察这些结果，本发明有以下重要结论。基于时间感知张量的预测方法WSPred、NTF以及TRTF的预测准确度比其余几种方法要高，这说明通过构造用户-服务-时间张量来捕获QoS数据中蕴含在时间模式下的潜在因子信息是必要的。例如在吞吐量的预测结果中，当训练密度为5％时，TRTF的MAE值为4.0301，比IPCC的10.0606低59.94％，当训练密度为30％时，TRTF的MAE值为3.4989，比IPCC的7.9722低56.11％。同时这几种时间感知方法在相同的训练密度下，本发明的TRTF模型的MAE和RMSE值都更小，有更好的预测精度，这体现了将时间序列预测和张量分解方法相结合的优势。例如在对响应时间的预测结果中，当训练密度为5％时，TRTF的MAE值为0.7105，分别比WSPred和NTF的MAE低10.35％和5.38％，当训练密度为30％时，TRTF的MAE值为0.6732，分别比WSPred和NTF的MAE低11.86％和8.13％。此外，本发明发现在几种基于邻域的预测方法中，IPCC的预测精度远低于其余基线方法，这是因为IPCC是一种基于服务邻域的预测方法，而本发明使用的实验数据集中用户数为142，远小于服务数4532，因此基于用户邻域方法预测的准确度会高于基于服务邻域的方法。

表4基于MAE和RMSE的QoS预测精度比较

随着训练密度从5％增加至30％，所有方法的预测精度都在逐渐提高，这是因为训练密度越大，为QoS缺失值预测提供的信息就越多，所以密集数据集(比如训练密度为30％或25％)的MAE和RMSE值总会小于稀疏数据集(比如训练密度为5％或10％)的MAE和RMSE值。另外，本发明观察到响应时间的MAE和RMSE值总要低于吞吐量的MAE和RMSE值，这是由于响应时间QoS值的范围在0-20s，而吞吐量QoS值的范围在0-1000kps。

本发明将研究张量密度对预测精度的影响。由于潜在因子维度数会影响预测精度，所以在本组实验中本发明将潜在因子维度值固定为20，然后将训练数据集的密度从5％调整至30％，每次增加5％，观察在不同张量密度下响应时间和吞吐量的预测精度。

图8中(a)和(b)是响应时间的MAE和RMSE的实验结果，(c)和(d)是吞吐量的MAE和RMSE的实验结果。实验结果表明，在不同的张量密度下，本发明的方法TRTF的预测精度都比其余基线方法要好，有更小的MAE和RMSE值。随着张量密度的增加，TRTF方法的预测准确度逐渐提高，这意味着提供更多的QoS数据可以获得更高的预测精度。更准确的说，当张量密度从5％增至15％时，TRTF方法的预测精度显著增加。但当张量密度由15％增至30％时，TRTF的预测精度增幅有限。例如在图8中(c)对吞吐量的预测结果中，当张量密度为5％时，其MAE值为4.0301，当张量密度为15％时，其MAE值为3.5615，预测精度提高了11.62％，当张量密度增至30％时，其MAE值为3.4989，仅比张量密度为15％时的预测精度提高了1.76％。这说明在训练数据集极其稀疏时，引入更多的QoS信息将会显著提高预测准确度。

维度数用来决定三阶张量中用户、服务、时间的潜在因子数量。在本发明中，本发明将研究潜在因子维度值对预测精度的影响。从图8可以看出张量密度会对预测精度产生影响，所以在本次实验中本发明将张量密度固定为25％，潜在因子的维度数从1调整至20，每次增加1，观察不同的潜在因子数对响应时间和吞吐量预测精度的影响。图9中(a)和(b)是响应时间的MAE和RMSE的实验结果，(c)和(d)是吞吐量的MAE和RMSE的实验结果。实验结果表明，TRTF模型的预测精度与潜在因子数呈正相关，随着潜在因子数的增加，MAE和RMSE逐渐减小，有更高的预测准确度，即较多的潜在因素可以产生更好的预测效果。但二者之间是非线性的关系，当潜在因子数从1增至10时，预测误差显著减小，当潜在因子数从10增至20时，预测误差减幅变小。例如在图9中(a)对响应时间的预测结果中，当维数为1时，其MAE值为1.2354，当维数为10时，其MAE值为0.7224，预测误差减少了41.53％，当维数增至20时，其MAE值为0.6783，相比维数为10的MAE值，预测误差仅减少了6.10％。这一结果表明，太少的潜在因素不足以描述用户、服务、时间的潜在特征。但是，维数并不是越大越好，引入更多的潜在因素需要更高的时间和计算成本，并且当维数超过阈值时，可能会造成过拟合问题，反而降低预测精度。所以在实际应用中，本发明需要不断调整维度值，以让其更接近张量的最优秩。

在本发明中，为了解决移动边缘计算环境的QoS预测问题中数据高维高稀疏以及随时间动态易变两大难点，本发明将二维矩阵模型扩展到三维张量模型，将已有的QoS记录建模为用户-服务-时间三阶张量，并利用QoS数据的时序特征，在CP分解中引入时序正则项，通过张量分解学习用户、服务以及时间潜在特征并使用交替最小二乘法ALS对近似张量迭代优化，从而得到目标张量的良好估计来预测缺失值。TRTF模型将时间序列预测与张量的潜在因子分解方法相结合，属于一种混合协同过滤方法。对公开的大规模QoS数据集WS-Dream的一系列实验研究表明，本发明的方法优于其它基线方法，预测精度更高。

以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明，不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干简单推演或替换，都应当视为属于本发明的保护范围。

Claims

1.一种移动边缘计算中基于时序正则化张量分解的QoS预测方法，其特征在于，包括：

获取用户访问服务的QoS记录；

2.根据权利要求1所述的预测方法，其特征在于，所述基于QoS记录构建表示用户、服务以及时间关系的三维张量模型包括：

构建K个时间周期矩阵以及三维张量矩阵；

3.根据权利要求1所述的预测方法，其特征在于，所述使用CP分解方法对所述三维张量模型进行分解，在分解过程中引入与用户维、服务维以及时间维的相关的约束正则项分别对所述三维张量模型的用户、服务以及时间的权重进行分解约束，并且引入时序正则项对三维张量模型的时间维的时序关系进行分解约束，分别得到用户因子矩阵、服务因子矩阵以及时间因子矩阵包括：

4.根据权利要求3所述的预测方法，其特征在于，在所述第二优化问题中引入用户维、与用户维、服务维以及时间维的相关的约束正则项分别对所述三维张量模型的用户、服务以及时间的权重进行分解约束，并且引入时序正则项对三维张量模型的时间维的时序关系进行分解约束，将所述第二优化问题转化为第三优化问题包括：

确定时间因子矩阵的时序系数向量，组成时序系数矩阵；

5.根据权利要求4所述的预测方法，其特征在于，所述第一优化问题表示为：