CN103840985A

CN103840985A - 基于用户邻域的Web Service服务质量预测方法及装置

Info

Publication number: CN103840985A
Application number: CN201410072178.7A
Authority: CN
Inventors: 尹建伟; 徐悦甡; 李莹; 邓水光; 吴朝晖
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2014-02-28
Filing date: 2014-02-28
Publication date: 2014-06-04

Abstract

本发明涉及Web Service服务质量预测领域，公开了一种基于用户邻域的Web Service服务质量预测方法，通过建立第一类邻域以及第二类邻域，建立预测模型，对预测模型进行求解得到最终的预测值，同时，还公开了一种基于用户邻域的Web Service服务质量预测装置。本发明的优点在于，解决了地域对服务质量预测的准确性的不利影响，同时也很好地解决了数据稀疏性以及推荐***中用户评分过于主观的问题，具有较高的应用价值。

Description

基于用户邻域的Web Service服务质量预测方法及装置

技术领域

本发明涉及Web Service服务质量预测领域，特别涉及一种基于用户邻域的Web Service服务质量预测方法及装置。

背景技术

Web Service是一类在网络上用以实现资源的互操作性与可访问性的应用，且这类应用是自我描述的、可编程的。Web Service一般使用标准的已定义完善的语言实现，并通过规范的协议发布。基于SOA的架构，Web Service已成为实现企业内与企业间信息***的重要手段。同时，由于Web Service技术广泛应用在云计算中，特别是SaaS平台上，所以Web Service的数量在迅猛增长。

服务质量是Web Service非功能性指标的统称，包括服务价格、响应时间、吞吐量等。服务质量是Web Service除功能性外，在服务选择、服务发现、服务推荐等方面重要的衡量标准，特别是候选的服务集中各服务的功能相似的情况下。但是大部分情况下，用户只能获取仅少一部分的QoS值，原因如下：1)因为Web Service的数量非常多，全部调用是不现实的；2)很多Web Service的服务质量会随着物理资源的变化而变动。在实际的服务调用过程中，这些缺失值必须被预测出来作为服务选择与推荐的依据。

作为推荐***中最常用的预测缺失值的方法，协同过滤技术在近几年也被开发人员应用到了服务质量预测问题上。协同过滤的核心是根据历史的服务调用记录，计算用户与用户或者服务与服务之间的相似度，常用的计算方法有余弦相似度等。但是，这类方法存在以下缺陷：1)协同过滤方法难以解决“冷启动”的问题，即某个服务从未被任何用户调用过，或某个用户从未调用过任何服务。2)传统的协同过滤方法只能反映用户的主观喜欢，而在服务调用的过程中，决定最终服务质量的却是客观的物理资源与运行环境。所以，需要寻求其它的技术更好地解决这一问题。

最近，一部分研发人员已经注意到了地域对于服务质量的影响。对于同样一个服务，不同地区的用户调用该用户得到的服务质量会相差很大，原因在于，不同用户所处的地区IT基础设施的水准相差很大。例如，韩国和日本是世界上平均网速最快的两个国家，而中国的平均网速则相对较慢。所以，如果在首尔、东京和北京的三位用户均调用同一个服务，则在首尔和东京的用户体验到比北京用户更好的服务质量。

另外，数据的稀疏性也是服务质量预测要面临的另一个重要的问题。极高的数据稀疏性意味着在用户-服务调用矩阵里绝大多数项都是空值。最近，矩阵分解技术已经被应用在推荐***中，用于解决数据稀疏性的问题。但是，由于服务质量主要由客观的物理资源决定，而推荐***中的评分是用户主观喜好的反映，故而传统的分解技术需要进行较大的改进。

发明内容

本发明针对现有技术中所存在的地域对于服务质量的影响的缺点，提供了一种基于用户邻域的Web Service服务质量预测方法及装置，可以很好地解决地域的因素对于服务质量预测的影响。

为实现上述目的，本发明可采取下述技术方案：

基于用户邻域的Web Service服务质量预测方法，包括以下的具体步骤：

第一类邻域识别步骤：根据用户的历史调用记录计算任意两个用户i、l之间的相似度sim_il，用户i为目标用户，用户i、l共同调用过服务集合S，相似度sim_il采用余弦相似度计算得到，并以历史调用记录中所记载的服务被用户调用后返回的服务质量作为用户的空间向量坐标值；选择与用户i相似度sim_il最大的K个用户l组成目标用户的第一类邻域TopK_l(i)；

第一类邻域权重计算步骤：根据相似度sim_il计算第一类邻域TopK_l(i)内每个用户l的权重w_il；

第二类邻域识别步骤：根据用户的地理位置坐标计算任意两个用户i、h之间的空间距离d_ih，选择与用户i的空间距离d_ih最近的K个用户h组成目标用户的第二类邻域TopK_h(i)；

第二类邻域权重计算步骤：根据空间距离d_ih计算第二类邻域TopK_h(i)内每个用户h与用户i之间的相似度sim_ih，当d_ih为0时，sim_ih＝1；当d_ih逐渐增大时，sim_ih逐渐减小；当d_ih趋向于无穷时，sim_ih＝0；根据相似度sim_ih计算第二类邻域TopK_h(i)内每个用户h的权重w_ih；

模型建立步骤：在矩阵分解模型的基础上建立用于预测目标用户与第一类邻域TopK_j(i)内用户的Web Service服务质量的预测模型，所述预测模型还包括一个根据目标用户与第二类邻域TopK_h(i)内用户之间的权重w_ih得到的正则化项，所述正则化项用于令目标用户的特征向量与第二类邻域TopK_h(i)内用户的特征向量之间尽可能地接近；

模型求解步骤：应用梯度下降法求解预测模型，得到待求解的用户特征矩阵以及服务特征矩阵；

预测步骤：通过预测模型中用户特征矩阵与服务特征矩阵的矩阵乘法得到最终的预测值。

作为优选，第一类邻域识别步骤中，使用历史调用记录中所记载的服务被用户调用后返回的服务质量与服务被调用后返回的服务质量的平均值之差作为用户的空间向量坐标值计算余弦相似度。

作为优选，第一类邻域识别步骤中，所述相似度

其中，r_ij为用户i调用服务j后返回的服务质量，r_lj为用户l调用服务j后返回的服务质量，

为服务j被调用后返回的服务质量的平均值。

作为优选，第一类邻域识别步骤中，使用修正后的相似度

{sim}^{'}_{il} =

\frac{2 \times | U_{i} \cap U_{l} |}{| U_{i} | + | U_{l} |} {sim}_{il}

作为任意两个用户i、j之间的相似度，其中，|U_i|、|U_l|以及|U_i∩U_l|依次为用户i调用过的服务数量、用户j调用过的服务数量以及用户i、j同时调用过的服务数量。

作为优选，第二类邻域权重计算步骤中，sim_ih＝exp(-d_ih)。

作为优选，模型建立步骤还包括：将用户-服务调用矩阵Q分解为两个低维矩阵，即其中，U∈R^d×m表示用户隐因子矩阵，S∈R^d×n表示服务隐因子矩阵；建立所述预测模型的目标函数

L (U, S) = \frac{1}{2} Σ_{i = 1}^{m} Σ_{j = 1}^{n} I_{ij} (q_{ij} -

{({αU}_{i}^{T} S_{j} + (1 - α) Σ_{l = 1}^{K} w_{il} {U_{l}}^{T} S_{j}))}^{2} + \frac{λ_{U}}{2} {| | U | |}_{F}^{2} + \frac{λ_{S}}{2} {| | S | |}_{F}^{2},

其中，I_ij等于1表示用户i调用过服务j，I_ij等于0表示用户i没有调用过服务j，q_ij表示用户i调用服务j的服务质量预测值，U_i ^T、U_l ^T依次表示矩阵U的第i、l列，S_j表示矩阵S的第j列，α为预设的调节因子，λ_U、λ_S分别取极小的正常数，||U||_F、||S||_F分别为弗洛贝尼乌斯范数。

作为优选，模型建立步骤中，所述正则化项为

其中，U_i、U_h依次表示矩阵U中的第i、h行。

作为优选，模型求解步骤还包括：将预测模型对于U_i、S_j求偏导数得到

\frac{&PartialD; L}{{&PartialD; U}_{i}} = α Σ_{j = 1}^{n} I_{ij} (- S_{j}) ({α U_{i}}^{T} S_{j} + (1 - α) Σ_{l = 1}^{K} w_{jl} {U_{i}}^{T} S_{l}) \times (q_{ij} - ({αS}_{j} + (1 -

α) Σ_{l = 1}^{K} w_{jl} {U_{i}}^{T})) + (1 - α) Σ_{g &Element; G (j)} Σ_{j = 1}^{n} I_{gj} w_{gi} S_{j} ({αU}_{i}^{T} S_{j} + (1 - α) Σ_{l = 1}^{K} w_{jl} {U_{i}}^{T} S_{l} -

{q_{ij}) + λ}_{U} U_{i} + λ_{H} (U_{i} - Σ_{h &Element; {TopK}_{h} (i)} w_{ih} U_{h})

以及

\frac{&PartialD; L}{{&PartialD; S}_{j}} = Σ_{j = 1}^{n} I_{ij} ({αU}_{i}^{T} S_{j} + (1 -

α) Σ_{l = 1}^{K} w_{jl} {U_{i}}^{T} S_{l} - q_{ij}) \times ({αU}_{i} + (1 - α) Σ_{l = 1}^{K} w_{il} {U_{l}}^{T}) + λ_{S} S_{j};

采用梯度下降迭代公式

\{\begin{matrix} {U^{'}}_{i} = U_{i} - β \times \frac{&PartialD; L}{{&PartialD; U}_{i}} \\ {S^{'}}_{j} = S_{j} - β \times \frac{&PartialD; L}{{&PartialD; S}_{j}} \end{matrix}

得到最终的U_i以及S_j，其中，β为预设常数，表示梯度下降迭代过程中的学习率。

作为优选，预测步骤中，采用

q_{ij} = {αU}_{i}^{T} S_{j} + (1 - α) Σ_{l = 1}^{K} w_{il} {U_{l}}^{T} S_{j}

计算得到最终的预测值。

根据上述的基于用户邻域的Web Service服务质量预测方法所得到的基于用户邻域的Web Service服务质量预测装置，包括第一类邻域识别装置、第一类邻域权重计算装置、第二类邻域识别装置、第二类邻域权重计算装置、模型建立装置、模型求解装置以及预测装置；

第一类邻域识别装置用于根据用户的历史调用记录计算任意两个用户i、l之间的相似度sim_il，用户i为目标用户，用户i、l共同调用过服务集合S，相似度sim_il采用余弦相似度计算得到，并以历史调用记录中所记载的服务被用户调用后返回的服务质量作为用户的空间向量坐标值；选择与用户i相似度sim_il最大的K个用户l组成目标用户的第一类邻域TopK_l(i)；

第一类邻域权重计算装置用于根据相似度sim_il计算第一类邻域TopK_l(i)内每个用户l的权重w_il；

第二类邻域识别装置用于根据用户的地理位置坐标计算任意两个用户i、h之间的空间距离d_ih，选择与用户i的空间距离d_ih最近的K个用户h组成目标用户的第二类邻域TopK_h(i)；

第二类邻域权重计算装置用于根据空间距离d_ih计算第二类邻域TopK_h(i)内每个用户h与用户i之间的相似度sim_ih，当d_ih为0时，sim_ih＝1；当d_ih逐渐增大时，sim_ih逐渐减小；当d_ih趋向于无穷时，sim_ih＝0；根据相似度sim_ih计算第二类邻域TopK_h(i)内每个用户h的权重w_ih；

模型建立装置用于在矩阵分解模型的基础上建立用于预测目标用户与第一类邻域TopK_j(i)内用户的Web Service服务质量的预测模型，所述预测模型还包括一个根据目标用户与第二类邻域TopK_h(i)内用户之间的权重w_ih得到的正则化项，所述正则化项用于令目标用户的特征向量与第二类邻域TopK_h(i)内用户的特征向量之间尽可能地接近；

模型求解装置用于应用梯度下降法求解预测模型，得到待求解的用户特征矩阵以及服务特征矩阵；

预测装置用于通过预测模型中用户特征矩阵与服务特征矩阵的矩阵乘法得到最终的预测值。

本发明由于采用了以上技术方案，具有显著的技术效果：

可以较为准确地预测基于用户领域的Web Service的服务质量，提供一种具有更好准确性的预测方法以及应用上述方法的装置。该方法利用用户调用历史记录作为辨别相似用户的标准，部分解决了服务调用中的“冷启动”问题；利用地理位置作为衡量用户间服务调用相似性的标准，部分解决了服务调用的“冷启动问题”；此外，通过提出一种具有线性时间复杂度的算法，令该算法可以适用于海量大数据的情形，提高了该预测方法的应用领域。此外，上述方法也可以有效地解决现有的评分***过于偏向于主观导致预测值不准确的我能替，具有较好的应用价值。

附图说明

图1为基于用户邻域的Web Service服务质量预测装置的结构连接示意图。

图2为第一类邻域识别以及权重计算步骤的流程示意图。

图3为第二类邻域识别以及权重计算步骤的流程示意图。

图4为模型建立以及求解步骤的流程示意图。

图5为模型求解以及预测步骤的流程示意图。

具体实施方式

下面结合实施例对本发明作进一步的详细描述。

实施例1

基于用户邻域的Web Service服务质量预测方法，如图2-5所示，包括以下的具体步骤：

第一类邻域识别步骤101：根据用户的历史调用记录计算任意两个用户i、l之间的相似度sim_il，本实施例中，用户指可以调用Web Service服务的装置、网络节点或者客户端，用户i为目标用户，用户i、l共同调用过服务集合S，相似度sim_il采用余弦相似度计算得到，并以历史调用记录中所记载的服务被用户调用后返回的服务质量作为用户的空间向量坐标值；选择与用户i相似度sim_il最大的K个用户l组成目标用户的第一类邻域TopK_l(i)，该K个用户亦可以成为邻居；优选地，可以采用修正后的余弦相似度计算相似度sim_il，本实施例中，包括两个部分的修正。第一部分的修正是对相似度sim_il计算公式的修正，使用历史调用记录中所记载的服务被用户调用后返回的服务质量与服务被调用后返回的服务质量的平均值之差作为用户的空间向量坐标值计算余弦相似度。修正后的相似度

为服务j被调用后返回的服务质量的平均值。第二部分的修正包括对计算得到的相似度sim_il进行再次的修正，使用修正后的相似度

第一类邻域权重计算步骤102：根据相似度sim_il计算第一类邻域TopK_l(i)内每个用户l的权重

其中，g表示用户i在第一类邻域识别步骤101中筛选得到的最为相似的K个用户，即第一类邻域TopK_l(i)中的用户。

第二类邻域识别步骤103：根据用户的地理位置坐标根据欧几里得公式计算任意两个用户i、h之间的空间距离

其中，(x_i，y_i)、(x_h，y_h)依次为用户i、h的经纬度坐标，选择与用户i的空间距离d_ih最近的K个用户h组成目标用户的第二类邻域TopK_h(i)。

第二类邻域权重计算步骤104：根据空间距离d_ih计算第二类邻域TopK_h(i)内每个用户h与用户i之间的相似度sim_ih，当d_ih为0时，sim_ih＝1；当d_ih逐渐增大时，sim_ih逐渐减小；当d_ih趋向于无穷时，sim_ih＝0；根据相似度sim_ih计算第二类邻域TopK_h(i)内每个用户h的权重

该处，g表示用户i在第二类邻域识别步骤103中筛选得到的最为相似的K个用户，即第二类邻域TopK_h(i)中的用户。作为优选，sim_ih＝exp(-d_ih)，可以进一步提高相似度与实际空间距离之间的契合程度，令相似度可以更为准确地反映空间距离的差异。

模型建立步骤105：在矩阵分解模型的基础上建立用于预测目标用户与第一类邻域TopK_j(i)内用户的Web Service服务质量的预测模型，此时，先将用户-服务调用矩阵Q分解为两个低维矩阵，即

其中，U∈R^d×m表示用户隐因子矩阵，亦称为用户特征矩阵，S∈R^d×n表示服务隐因子矩阵，或者称为服务特征矩阵。由此，用户i调用服务j返回的Web Service服务质量预测值可以通过如下的公式进行计算：

q_ij≈p_ij＝U_i ^TS_j，进一步地，找寻合适的U、S来最小化训练集的预测误差，同时最小化测试集的测试误差，由此，定义损失函数为：

\min_{U, S} L (U, S) =

\frac{1}{2} Σ_{i = 1}^{m} Σ_{j = 1}^{n} I_{ij} {(q_{ij} - {U_{i}}^{T} S_{j})}^{2},

其中，I_ij为指示函数，I_ij等于1表示用户i调用过服务j，I_ij等于0表示用户i未调用过服务j。进一步地，为了防止直接优化上述的损失函数可能会导致的学习过程的过拟合，尚需要加入防止过拟合的正则化项，从而得到最终的矩阵分解形式：

L (U, S) = \frac{1}{2} Σ_{i = 1}^{m} Σ_{j = 1}^{n} I_{ij} {(q_{ij} - {U_{i}}^{T} S_{j})}^{2} + \frac{λ_{U}}{2} {| | U | |}_{F}^{2} +

\frac{λ_{S}}{2} {| | S | |}_{F}^{2},

其中，||U||_F、||S||_F分别为弗洛贝尼乌斯范数，λ_U、λ_S分别取极小的正常数，可选地，可以均取0.001。定义用户i调用服务j得到的服务质量被预测为其中，α为一个[0，1]之间的调节因子，进一步地，得到以下的建立所述预测模型的目标函数：

L (U, S) = \frac{1}{2} Σ_{i = 1}^{m} Σ_{j = 1}^{n} I_{ij} {(q_{ij} - ({αU}_{i}^{T} S_{j} + (1 - α) Σ_{l = 1}^{K} w_{il} {U_{l}}^{T} S_{j}))}^{2} + \frac{λ_{U}}{2} {| | U | |}_{F}^{2} +

\frac{λ_{S}}{2} {| | S | |}_{F}^{2},

进一步地，所述预测模型还包括一个根据目标用户与第二类邻域TopK_h(i)内用户之间的权重w_ih得到的正则化项，该正则化项为：

Σ_{i = 1}^{m} {| | U_{i} - Σ_{{h &Element; TopK}_{h} (i)} w_{ih} U_{h} | |}_{F}^{2},

其中，U_i、U_h依次表示矩阵U中的第i、h行，所述正则化项用于令目标用户的特征向量与第二类邻域TopK_h(i)内用户的特征向量之间尽可能地接近。

由此，得到了上述预测模型的最终的目标函数：

L (U, S) = \frac{1}{2} Σ_{i = 1}^{m} Σ_{j = 1}^{n} I_{ij} {(q_{ij} - ({αU}_{i}^{T} S_{j} + (1 - α) Σ_{l = 1}^{K} w_{il} {U_{l}}^{T} S_{j}))}^{2} + \frac{λ_{U}}{2} {| | U | |}_{F}^{2} +

\frac{λ_{S}}{2} {| | S | |}_{F}^{2} + \frac{λ_{E}}{2} Σ_{i = 1}^{m} {| | U_{i} - Σ_{{h &Element; TopK}_{h} (i)} w_{ih} U_{h} | |}_{F}^{2},

其中，λ_E为极小的正常数，通常取0.001。

模型求解步骤106：对上述最终的目标函数进行求解，首先将预测模型对于U_i、S_j求偏导数得到

\frac{&PartialD; L}{{&PartialD; U}_{i}} = α Σ_{j = 1}^{n} I_{ij} (- S_{j}) ({α U_{i}}^{T} S_{j} + (1 - α) Σ_{l = 1}^{K} w_{jl} {U_{i}}^{T} S_{l}) \times

(q_{ij} - ({αS}_{j} + (1 - α) Σ_{l = 1}^{K} w_{jl} {U_{i}}^{T})) + (1 - α) Σ_{g &Element; G (i)} Σ_{j = 1}^{n} I_{gj} w_{gi} S_{j} ({αU}_{i}^{T} S_{j} +

(1 - α) Σ_{l = 1}^{K} w_{il} {U_{i}}^{T} S_{l} - q_{ij}) + λ_{U} U_{i} + λ_{H} (U_{i} - Σ_{{h &Element; TopK}_{h} (i)} w_{ih} U_{h})

以及

\frac{&PartialD; L}{{&PartialD; S}_{j}} =

Σ_{j = 1}^{n} I_{ij} ({αU}_{i}^{T} S_{j} + (1 - α) Σ_{l = 1}^{K} w_{jl} {U_{i}}^{T} S_{l} - q_{ij}) \times ({αU}_{i} + (1 - α) Σ_{l = 1}^{K} w_{il} {U_{l}}^{T}) + λ_{S} S_{j},

其中，G(i)代表所有邻居中包括用户i的用户集合；

应用梯度下降法，采用梯度下降迭代公式

\{\begin{matrix} {U^{'}}_{i} = U_{i} - β \times \frac{&PartialD; L}{{&PartialD; U}_{i}} \\ {S^{'}}_{j} = S_{j} - β \times \frac{&PartialD; L}{{&PartialD; S}_{j}} \end{matrix}

得到最终的U_i以及S_j以求解预测模型，其中，β为预设常数，表示梯度下降迭代过程中的学习率，得到待求解的用户特征矩阵U_i以及服务特征矩阵S_j。

预测步骤107：通过预测模型中用户特征矩阵与服务特征矩阵的矩阵乘法得到最终的预测值

q_{ij} = {αU}_{i}^{T} S_{j} + (1 - α) Σ_{l = 1}^{K} w_{il} {U_{l}}^{T} S_{j} .

实施例2

应用实施例1所记载的基于用户邻域的Web Service服务质量预测方法所得到的基于用户邻域的Web Service服务质量预测装置，如图1所示，该装置包括第一类邻域识别装置201、第一类邻域权重计算装置202、第二类邻域识别装置203、第二类邻域权重计算装置204、模型建立装置205、模型求解装置206以及预测装置207。

第一类邻域识别装置201用于根据用户的历史调用记录计算任意两个用户i、l之间的相似度sim_il，用户i为目标用户，用户i、l共同调用过服务集合S，相似度sim_il采用余弦相似度计算得到，并以历史调用记录中所记载的服务被用户调用后返回的服务质量作为用户的空间向量坐标值；选择与用户i相似度sim_il最大的K个用户l组成目标用户的第一类邻域TopK_l(i)。

第一类邻域权重计算装置202用于根据相似度sim_il计算第一类邻域TopK_l(i)内每个用户l的权重w_il。

第二类邻域识别装置203用于根据用户的地理位置坐标计算任意两个用户i、h之间的空间距离d_ih，选择与用户i的空间距离d_ih最近的K个用户h组成目标用户的第二类邻域TopK_h(i)。

第二类邻域权重计算装置204用于根据空间距离d_ih计算第二类邻域TopK_h(i)内每个用户h与用户i之间的相似度sim_ih，当d_ih为0时，sim_ih＝1；当d_ih逐渐增大时，sim_ih逐渐减小；当d_ih趋向于无穷时，sim_ih＝0；根据相似度sim_ih计算第二类邻域TopK_h(i)内每个用户h的权重w_ih。

模型建立装置205用于在矩阵分解模型的基础上建立用于预测目标用户与第一类邻域TopK_j(i)内用户的Web Service服务质量的预测模型，所述预测模型还包括一个根据目标用户与第二类邻域TopK_h(i)内用户之间的权重w_ih得到的正则化项，所述正则化项用于令目标用户的特征向量与第二类邻域TopK_h(i)内用户的特征向量之间尽可能地接近。

模型求解装置206用于应用梯度下降法求解预测模型，得到待求解的用户特征矩阵以及服务特征矩阵。

预测装置207用于通过预测模型中用户特征矩阵与服务特征矩阵的矩阵乘法得到最终的预测值。

总之，以上所述仅为本发明的较佳实施例，凡依本发明申请专利范围所作的均等变化与修饰，皆应属本发明专利的涵盖范围。

Claims

1.一种基于用户邻域的Web Service服务质量预测方法，其特征在于，包括以下的具体步骤：

第一类邻域识别步骤(101)：根据用户的历史调用记录计算任意两个用户i、l之间的相似度sim_il，用户i为目标用户，用户i、l共同调用过服务集合S，相似度sim_il采用余弦相似度计算得到，并以历史调用记录中所记载的服务被用户调用后返回的服务质量作为用户的空间向量坐标值；选择与用户i相似度sim_il最大的K个用户l组成目标用户的第一类邻域TopK_l(i)；

第一类邻域权重计算步骤(102)：根据相似度sim_il计算第一类邻域TopK_l(i)内每个用户l的权重w_il；

第二类邻域识别步骤(103)：根据用户的地理位置坐标计算任意两个用户i、h之间的空间距离d_ih，选择与用户i的空间距离d_ih最近的K个用户h组成目标用户的第二类邻域TopK_h(i)；

第二类邻域权重计算步骤(104)：根据空间距离d_ih计算第二类邻域TopK_h(i)内每个用户h与用户i之间的相似度sim_ih，当d_ih为0时，sim_ih＝1；当d_ih逐渐增大时，sim_ih逐渐减小；当d_ih趋向于无穷时，sim_ih＝0；根据相似度sim_ih计算第二类邻域TopK_h(i)内每个用户h的权重w_ih；

模型建立步骤(105)：在矩阵分解模型的基础上建立用于预测目标用户与第一类邻域TopK_j(i)内用户的Web Service服务质量的预测模型，所述预测模型还包括一个根据目标用户与第二类邻域TopK_h(i)内用户之间的权重w_ih得到的正则化项，所述正则化项用于令目标用户的特征向量与第二类邻域TopK_h(i)内用户的特征向量之间尽可能地接近；

模型求解步骤(106)：应用梯度下降法求解预测模型，得到待求解的用户特征矩阵以及服务特征矩阵；

预测步骤(107)：通过预测模型中用户特征矩阵与服务特征矩阵的矩阵乘法得到最终的预测值。

2.根据权利要求1所述的基于用户邻域的Web Service服务质量预测方法，其特征在于，第一类邻域识别步骤(101)中，使用历史调用记录中所记载的服务被用户调用后返回的服务质量与服务被调用后返回的服务质量的平均值之差作为用户的空间向量坐标值计算余弦相似度。

3.根据权利要求1所述的基于用户邻域的Web Service服务质量预测方法，其特征在于，第一类邻域识别步骤(101)中，所述相似度

{sim}_{il} = \frac{Σ_{j &Element; S} (r_{ij} - {\overset{&OverBar;}{r}}_{j}) (r_{lj} - {\overset{&OverBar;}{r}}_{j})}{\sqrt{Σ_{j &Element; S} {(r_{ij} - {\overset{&OverBar;}{r}}_{j})}^{2}} \sqrt{Σ_{j &Element; S} {(r_{lj} - {\overset{&OverBar;}{r}}_{l'})}^{2}}},

为服务j被调用后返回的服务质量的平均值。

4.根据权利要求1、2或者3所述的基于用户邻域的Web Service服务质量预测方法，其特征在于，第一类邻域识别步骤(101)中，使用修正后的相似度

5.根据权利要求1所述的基于用户邻域的Web Service服务质量预测方法，其特征在于，第二类邻域权重计算步骤(104)中，sim_ih＝exp(-d_ih)。

6.根据权利要求1所述的基于用户邻域的Web Service服务质量预测方法，其特征在于，模型建立步骤(105)还包括：将用户-服务调用矩阵Q分解为两个低维矩阵，即

其中，U∈R^d×m表示用户隐因子矩阵，S∈R^d×n表示服务隐因子矩阵；建立所述预测模型的目标函数

L (U, S) = \frac{1}{2} Σ_{i = 1}^{m} Σ_{j = 1}^{n} I_{ij} {(q_{ij} - ({αU}_{i}^{T} S_{j} + (1 - α) Σ_{l = 1}^{K} w_{il} {U_{l}}^{T} S_{j}))}^{2} + \frac{λ_{U}}{2} {| | U | |}_{F}^{2} +

\frac{λ_{S}}{2} {| | S | |}_{F}^{2},

7.根据权利要求1所述的基于用户邻域的Web Service服务质量预测方法，其特征在于，模型建立步骤(105)中，所述正则化项为

其中，U_i、U_h依次表示矩阵U中的第i、h行。

8.根据权利要求1所述的基于用户邻域的Web Service服务质量预测方法，其特征在于，模型求解步骤(106)还包括：将预测模型对于U_i、S_j求偏导数得到

\frac{&PartialD; L}{{&PartialD; U}_{i}} = α Σ_{j = 1}^{n} I_{ij} (- S_{j}) ({α U_{i}}^{T} S_{j} + (1 - α) Σ_{l = 1}^{K} w_{jl} {U_{i}}^{T} S_{l}) \times (q_{ij} - ({αS}_{j} +

(1 - α) Σ_{l = 1}^{K} w_{jl} {U_{i}}^{T})) +

(1 - α) Σ_{g &Element; G (j)} Σ_{j = 1}^{n} I_{gj} w_{gi} S_{j} ({αU}_{i}^{T} S_{j} + (1 - α) Σ_{l = 1}^{K} w_{il} {U_{i}}^{T} S_{l} - q_{ij}) + λ_{U} U_{i} +

λ_{H} (U_{i} - Σ_{h &Element; {TopK}_{h} (i)} w_{ih} U_{h})

以及

\frac{&PartialD; L}{{&PartialD; S}_{j}} = Σ_{j = 1}^{n} I_{ij} ({αU}_{i}^{T} S_{j} + (1 - α) Σ_{l = 1}^{K} w_{jl} {U_{i}}^{T} S_{l} -

q_{ij}) \times ({αU}_{i} + (1 - α) Σ_{l = 1}^{K} w_{il} {U_{l}}^{T}) + λ_{S} S_{j};

采用梯度下降迭代公式

\{\begin{matrix} {U^{'}}_{i} = U_{i} - β \times \frac{&PartialD; L}{{&PartialD; U}_{i}} \\ {S^{'}}_{j} = S_{j} - β \times \frac{&PartialD; L}{{&PartialD; S}_{j}} \end{matrix}

9.根据权利要求1所述的基于用户邻域的Web Service服务质量预测方法，其特征在于，预测步骤(107)中，采用

q_{ij} = {αU}_{i}^{T} S_{j} + (1 - α) Σ_{l = 1}^{K} w_{il} {U_{l}}^{T} S_{j}

计算得到最终的预测值。

10.根据权利要求1-9任一所述的基于用户邻域的Web Service服务质量预测方法所得到的基于用户邻域的Web Service服务质量预测装置，其特征在于，包括第一类邻域识别装置(201)、第一类邻域权重计算装置(202)、第二类邻域识别装置(203)、第二类邻域权重计算装置(204)、模型建立装置(205)、模型求解装置(206)以及预测装置(207)；

第一类邻域识别装置(201)用于根据用户的历史调用记录计算任意两个用户i、l之间的相似度sim_il，用户i为目标用户，用户i、l共同调用过服务集合S，相似度sim_il采用余弦相似度计算得到，并以历史调用记录中所记载的服务被用户调用后返回的服务质量作为用户的空间向量坐标值；选择与用户i相似度sim_il最大的K个用户l组成目标用户的第一类邻域TopK_l(i)；

第一类邻域权重计算装置(202)用于根据相似度sim_il计算第一类邻域TopK_l(i)内每个用户l的权重w_il；

第二类邻域识别装置(203)用于根据用户的地理位置坐标计算任意两个用户i、h之间的空间距离d_ih，选择与用户i的空间距离d_ih最近的K个用户h组成目标用户的第二类邻域TopK_h(i)；

第二类邻域权重计算装置(204)用于根据空间距离d_ih计算第二类邻域TopK_h(i)内每个用户h与用户i之间的相似度sim_ih，当d_ih为0时，sim_ih＝1；当d_ih逐渐增大时，sim_ih逐渐减小；当d_ih趋向于无穷时，sim_ih＝0；根据相似度sim_ih计算第二类邻域TopK_h(i)内每个用户h的权重w_ih；

模型建立装置(205)用于在矩阵分解模型的基础上建立用于预测目标用户与第一类邻域TopK_j(i)内用户的Web Service服务质量的预测模型，所述预测模型还包括一个根据目标用户与第二类邻域TopK_h(i)内用户之间的权重w_ih得到的正则化项，所述正则化项用于令目标用户的特征向量与第二类邻域TopK_h(i)内用户的特征向量之间尽可能地接近；

模型求解装置(206)用于应用梯度下降法求解预测模型，得到待求解的用户特征矩阵以及服务特征矩阵；

预测装置(207)用于通过预测模型中用户特征矩阵与服务特征矩阵的矩阵乘法得到最终的预测值。