CN103840985A - 基于用户邻域的Web Service服务质量预测方法及装置 - Google Patents

基于用户邻域的Web Service服务质量预测方法及装置 Download PDF

Info

Publication number
CN103840985A
CN103840985A CN201410072178.7A CN201410072178A CN103840985A CN 103840985 A CN103840985 A CN 103840985A CN 201410072178 A CN201410072178 A CN 201410072178A CN 103840985 A CN103840985 A CN 103840985A
Authority
CN
China
Prior art keywords
user
service
neighborhood
service quality
topk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410072178.7A
Other languages
English (en)
Inventor
尹建伟
徐悦甡
李莹
邓水光
吴朝晖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN201410072178.7A priority Critical patent/CN103840985A/zh
Publication of CN103840985A publication Critical patent/CN103840985A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及Web Service服务质量预测领域,公开了一种基于用户邻域的Web Service服务质量预测方法,通过建立第一类邻域以及第二类邻域,建立预测模型,对预测模型进行求解得到最终的预测值,同时,还公开了一种基于用户邻域的Web Service服务质量预测装置。本发明的优点在于,解决了地域对服务质量预测的准确性的不利影响,同时也很好地解决了数据稀疏性以及推荐***中用户评分过于主观的问题,具有较高的应用价值。

Description

基于用户邻域的Web Service服务质量预测方法及装置
技术领域
本发明涉及Web Service服务质量预测领域,特别涉及一种基于用户邻域的Web Service服务质量预测方法及装置。
背景技术
Web Service是一类在网络上用以实现资源的互操作性与可访问性的应用,且这类应用是自我描述的、可编程的。Web Service一般使用标准的已定义完善的语言实现,并通过规范的协议发布。基于SOA的架构,Web Service已成为实现企业内与企业间信息***的重要手段。同时,由于Web Service技术广泛应用在云计算中,特别是SaaS平台上,所以Web Service的数量在迅猛增长。
服务质量是Web Service非功能性指标的统称,包括服务价格、响应时间、吞吐量等。服务质量是Web Service除功能性外,在服务选择、服务发现、服务推荐等方面重要的衡量标准,特别是候选的服务集中各服务的功能相似的情况下。但是大部分情况下,用户只能获取仅少一部分的QoS值,原因如下:1)因为Web Service的数量非常多,全部调用是不现实的;2)很多Web Service的服务质量会随着物理资源的变化而变动。在实际的服务调用过程中,这些缺失值必须被预测出来作为服务选择与推荐的依据。
作为推荐***中最常用的预测缺失值的方法,协同过滤技术在近几年也被开发人员应用到了服务质量预测问题上。协同过滤的核心是根据历史的服务调用记录,计算用户与用户或者服务与服务之间的相似度,常用的计算方法有余弦相似度等。但是,这类方法存在以下缺陷:1)协同过滤方法难以解决“冷启动”的问题,即某个服务从未被任何用户调用过,或某个用户从未调用过任何服务。2)传统的协同过滤方法只能反映用户的主观喜欢,而在服务调用的过程中,决定最终服务质量的却是客观的物理资源与运行环境。所以,需要寻求其它的技术更好地解决这一问题。
最近,一部分研发人员已经注意到了地域对于服务质量的影响。对于同样一个服务,不同地区的用户调用该用户得到的服务质量会相差很大,原因在于,不同用户所处的地区IT基础设施的水准相差很大。例如,韩国和日本是世界上平均网速最快的两个国家,而中国的平均网速则相对较慢。所以,如果在首尔、东京和北京的三位用户均调用同一个服务,则在首尔和东京的用户体验到比北京用户更好的服务质量。
另外,数据的稀疏性也是服务质量预测要面临的另一个重要的问题。极高的数据稀疏性意味着在用户-服务调用矩阵里绝大多数项都是空值。最近,矩阵分解技术已经被应用在推荐***中,用于解决数据稀疏性的问题。但是,由于服务质量主要由客观的物理资源决定,而推荐***中的评分是用户主观喜好的反映,故而传统的分解技术需要进行较大的改进。
发明内容
本发明针对现有技术中所存在的地域对于服务质量的影响的缺点,提供了一种基于用户邻域的Web Service服务质量预测方法及装置,可以很好地解决地域的因素对于服务质量预测的影响。
为实现上述目的,本发明可采取下述技术方案:
基于用户邻域的Web Service服务质量预测方法,包括以下的具体步骤:
第一类邻域识别步骤:根据用户的历史调用记录计算任意两个用户i、l之间的相似度simil,用户i为目标用户,用户i、l共同调用过服务集合S,相似度simil采用余弦相似度计算得到,并以历史调用记录中所记载的服务被用户调用后返回的服务质量作为用户的空间向量坐标值;选择与用户i相似度simil最大的K个用户l组成目标用户的第一类邻域TopKl(i);
第一类邻域权重计算步骤:根据相似度simil计算第一类邻域TopKl(i)内每个用户l的权重wil
第二类邻域识别步骤:根据用户的地理位置坐标计算任意两个用户i、h之间的空间距离dih,选择与用户i的空间距离dih最近的K个用户h组成目标用户的第二类邻域TopKh(i);
第二类邻域权重计算步骤:根据空间距离dih计算第二类邻域TopKh(i)内每个用户h与用户i之间的相似度simih,当dih为0时,simih=1;当dih逐渐增大时,simih逐渐减小;当dih趋向于无穷时,simih=0;根据相似度simih计算第二类邻域TopKh(i)内每个用户h的权重wih
模型建立步骤:在矩阵分解模型的基础上建立用于预测目标用户与第一类邻域TopKj(i)内用户的Web Service服务质量的预测模型,所述预测模型还包括一个根据目标用户与第二类邻域TopKh(i)内用户之间的权重wih得到的正则化项,所述正则化项用于令目标用户的特征向量与第二类邻域TopKh(i)内用户的特征向量之间尽可能地接近;
模型求解步骤:应用梯度下降法求解预测模型,得到待求解的用户特征矩阵以及服务特征矩阵;
预测步骤:通过预测模型中用户特征矩阵与服务特征矩阵的矩阵乘法得到最终的预测值。
作为优选,第一类邻域识别步骤中,使用历史调用记录中所记载的服务被用户调用后返回的服务质量与服务被调用后返回的服务质量的平均值之差作为用户的空间向量坐标值计算余弦相似度。
作为优选,第一类邻域识别步骤中,所述相似度
Figure BDA0000471086260000031
其中,rij为用户i调用服务j后返回的服务质量,rlj为用户l调用服务j后返回的服务质量,
Figure BDA0000471086260000032
为服务j被调用后返回的服务质量的平均值。
作为优选,第一类邻域识别步骤中,使用修正后的相似度 sim ′ il = 2 × | U i ∩ U l | | U i | + | U l | sim il 作为任意两个用户i、j之间的相似度,其中,|Ui|、|Ul|以及|Ui∩Ul|依次为用户i调用过的服务数量、用户j调用过的服务数量以及用户i、j同时调用过的服务数量。
作为优选,第二类邻域权重计算步骤中,simih=exp(-dih)。
作为优选,模型建立步骤还包括:将用户-服务调用矩阵Q分解为两个低维矩阵,即其中,U∈Rd×m表示用户隐因子矩阵,S∈Rd×n表示服务隐因子矩阵;建立所述预测模型的目标函数 L ( U , S ) = 1 2 Σ i = 1 m Σ j = 1 n I ij ( q ij - ( αU i T S j + ( 1 - α ) Σ l = 1 K w il U l T S j ) ) 2 + λ U 2 | | U | | F 2 + λ S 2 | | S | | F 2 , 其中,Iij等于1表示用户i调用过服务j,Iij等于0表示用户i没有调用过服务j,qij表示用户i调用服务j的服务质量预测值,Ui T、Ul T依次表示矩阵U的第i、l列,Sj表示矩阵S的第j列,α为预设的调节因子,λU、λS分别取极小的正常数,||U||F、||S||F分别为弗洛贝尼乌斯范数。
作为优选,模型建立步骤中,所述正则化项为
Figure BDA0000471086260000044
其中,Ui、Uh依次表示矩阵U中的第i、h行。
作为优选,模型求解步骤还包括:将预测模型对于Ui、Sj求偏导数得到 ∂ L ∂ U i = α Σ j = 1 n I ij ( - S j ) ( α U i T S j + ( 1 - α ) Σ l = 1 K w jl U i T S l ) × ( q ij - ( αS j + ( 1 - α ) Σ l = 1 K w jl U i T ) ) + ( 1 - α ) Σ g ∈ G ( j ) Σ j = 1 n I gj w gi S j ( αU i T S j + ( 1 - α ) Σ l = 1 K w jl U i T S l - q ij ) + λ U U i + λ H ( U i - Σ h ∈ TopK h ( i ) w ih U h ) 以及 ∂ L ∂ S j = Σ j = 1 n I ij ( αU i T S j + ( 1 - α ) Σ l = 1 K w jl U i T S l - q ij ) × ( αU i + ( 1 - α ) Σ l = 1 K w il U l T ) + λ S S j ; 采用梯度下降迭代公式 U ′ i = U i - β × ∂ L ∂ U i S ′ j = S j - β × ∂ L ∂ S j 得到最终的Ui以及Sj,其中,β为预设常数,表示梯度下降迭代过程中的学习率。
作为优选,预测步骤中,采用 q ij = αU i T S j + ( 1 - α ) Σ l = 1 K w il U l T S j 计算得到最终的预测值。
根据上述的基于用户邻域的Web Service服务质量预测方法所得到的基于用户邻域的Web Service服务质量预测装置,包括第一类邻域识别装置、第一类邻域权重计算装置、第二类邻域识别装置、第二类邻域权重计算装置、模型建立装置、模型求解装置以及预测装置;
第一类邻域识别装置用于根据用户的历史调用记录计算任意两个用户i、l之间的相似度simil,用户i为目标用户,用户i、l共同调用过服务集合S,相似度simil采用余弦相似度计算得到,并以历史调用记录中所记载的服务被用户调用后返回的服务质量作为用户的空间向量坐标值;选择与用户i相似度simil最大的K个用户l组成目标用户的第一类邻域TopKl(i);
第一类邻域权重计算装置用于根据相似度simil计算第一类邻域TopKl(i)内每个用户l的权重wil
第二类邻域识别装置用于根据用户的地理位置坐标计算任意两个用户i、h之间的空间距离dih,选择与用户i的空间距离dih最近的K个用户h组成目标用户的第二类邻域TopKh(i);
第二类邻域权重计算装置用于根据空间距离dih计算第二类邻域TopKh(i)内每个用户h与用户i之间的相似度simih,当dih为0时,simih=1;当dih逐渐增大时,simih逐渐减小;当dih趋向于无穷时,simih=0;根据相似度simih计算第二类邻域TopKh(i)内每个用户h的权重wih
模型建立装置用于在矩阵分解模型的基础上建立用于预测目标用户与第一类邻域TopKj(i)内用户的Web Service服务质量的预测模型,所述预测模型还包括一个根据目标用户与第二类邻域TopKh(i)内用户之间的权重wih得到的正则化项,所述正则化项用于令目标用户的特征向量与第二类邻域TopKh(i)内用户的特征向量之间尽可能地接近;
模型求解装置用于应用梯度下降法求解预测模型,得到待求解的用户特征矩阵以及服务特征矩阵;
预测装置用于通过预测模型中用户特征矩阵与服务特征矩阵的矩阵乘法得到最终的预测值。
本发明由于采用了以上技术方案,具有显著的技术效果:
可以较为准确地预测基于用户领域的Web Service的服务质量,提供一种具有更好准确性的预测方法以及应用上述方法的装置。该方法利用用户调用历史记录作为辨别相似用户的标准,部分解决了服务调用中的“冷启动”问题;利用地理位置作为衡量用户间服务调用相似性的标准,部分解决了服务调用的“冷启动问题”;此外,通过提出一种具有线性时间复杂度的算法,令该算法可以适用于海量大数据的情形,提高了该预测方法的应用领域。此外,上述方法也可以有效地解决现有的评分***过于偏向于主观导致预测值不准确的我能替,具有较好的应用价值。
附图说明
图1为基于用户邻域的Web Service服务质量预测装置的结构连接示意图。
图2为第一类邻域识别以及权重计算步骤的流程示意图。
图3为第二类邻域识别以及权重计算步骤的流程示意图。
图4为模型建立以及求解步骤的流程示意图。
图5为模型求解以及预测步骤的流程示意图。
具体实施方式
下面结合实施例对本发明作进一步的详细描述。
实施例1
基于用户邻域的Web Service服务质量预测方法,如图2-5所示,包括以下的具体步骤:
第一类邻域识别步骤101:根据用户的历史调用记录计算任意两个用户i、l之间的相似度simil,本实施例中,用户指可以调用Web Service服务的装置、网络节点或者客户端,用户i为目标用户,用户i、l共同调用过服务集合S,相似度simil采用余弦相似度计算得到,并以历史调用记录中所记载的服务被用户调用后返回的服务质量作为用户的空间向量坐标值;选择与用户i相似度simil最大的K个用户l组成目标用户的第一类邻域TopKl(i),该K个用户亦可以成为邻居;优选地,可以采用修正后的余弦相似度计算相似度simil,本实施例中,包括两个部分的修正。第一部分的修正是对相似度simil计算公式的修正,使用历史调用记录中所记载的服务被用户调用后返回的服务质量与服务被调用后返回的服务质量的平均值之差作为用户的空间向量坐标值计算余弦相似度。修正后的相似度
Figure BDA0000471086260000071
其中,rij为用户i调用服务j后返回的服务质量,rlj为用户l调用服务j后返回的服务质量,
Figure BDA0000471086260000072
为服务j被调用后返回的服务质量的平均值。第二部分的修正包括对计算得到的相似度simil进行再次的修正,使用修正后的相似度
Figure BDA0000471086260000073
作为任意两个用户i、j之间的相似度,其中,|Ui|、|Ul|以及|Ui∩Ul|依次为用户i调用过的服务数量、用户j调用过的服务数量以及用户i、j同时调用过的服务数量。
第一类邻域权重计算步骤102:根据相似度simil计算第一类邻域TopKl(i)内每个用户l的权重
Figure BDA0000471086260000074
其中,g表示用户i在第一类邻域识别步骤101中筛选得到的最为相似的K个用户,即第一类邻域TopKl(i)中的用户。
第二类邻域识别步骤103:根据用户的地理位置坐标根据欧几里得公式计算任意两个用户i、h之间的空间距离
Figure BDA0000471086260000075
其中,(xi,yi)、(xh,yh)依次为用户i、h的经纬度坐标,选择与用户i的空间距离dih最近的K个用户h组成目标用户的第二类邻域TopKh(i)。
第二类邻域权重计算步骤104:根据空间距离dih计算第二类邻域TopKh(i)内每个用户h与用户i之间的相似度simih,当dih为0时,simih=1;当dih逐渐增大时,simih逐渐减小;当dih趋向于无穷时,simih=0;根据相似度simih计算第二类邻域TopKh(i)内每个用户h的权重
Figure BDA0000471086260000076
该处,g表示用户i在第二类邻域识别步骤103中筛选得到的最为相似的K个用户,即第二类邻域TopKh(i)中的用户。作为优选,simih=exp(-dih),可以进一步提高相似度与实际空间距离之间的契合程度,令相似度可以更为准确地反映空间距离的差异。
模型建立步骤105:在矩阵分解模型的基础上建立用于预测目标用户与第一类邻域TopKj(i)内用户的Web Service服务质量的预测模型,此时,先将用户-服务调用矩阵Q分解为两个低维矩阵,即
Figure BDA0000471086260000077
其中,U∈Rd×m表示用户隐因子矩阵,亦称为用户特征矩阵,S∈Rd×n表示服务隐因子矩阵,或者称为服务特征矩阵。由此,用户i调用服务j返回的Web Service服务质量预测值可以通过如下的公式进行计算:
qij≈pij=Ui TSj,进一步地,找寻合适的U、S来最小化训练集的预测误差,同时最小化测试集的测试误差,由此,定义损失函数为: min U , S L ( U , S ) = 1 2 Σ i = 1 m Σ j = 1 n I ij ( q ij - U i T S j ) 2 , 其中,Iij为指示函数,Iij等于1表示用户i调用过服务j,Iij等于0表示用户i未调用过服务j。进一步地,为了防止直接优化上述的损失函数可能会导致的学习过程的过拟合,尚需要加入防止过拟合的正则化项,从而得到最终的矩阵分解形式: L ( U , S ) = 1 2 Σ i = 1 m Σ j = 1 n I ij ( q ij - U i T S j ) 2 + λ U 2 | | U | | F 2 + λ S 2 | | S | | F 2 , 其中,||U||F、||S||F分别为弗洛贝尼乌斯范数,λU、λS分别取极小的正常数,可选地,可以均取0.001。定义用户i调用服务j得到的服务质量被预测为其中,α为一个[0,1]之间的调节因子,进一步地,得到以下的建立所述预测模型的目标函数:
L ( U , S ) = 1 2 Σ i = 1 m Σ j = 1 n I ij ( q ij - ( αU i T S j + ( 1 - α ) Σ l = 1 K w il U l T S j ) ) 2 + λ U 2 | | U | | F 2 + λ S 2 | | S | | F 2 ,
其中,Iij等于1表示用户i调用过服务j,Iij等于0表示用户i没有调用过服务j,qij表示用户i调用服务j的服务质量预测值,Ui T、Ul T依次表示矩阵U的第i、l列,Sj表示矩阵S的第j列,α为预设的调节因子,λU、λS分别取极小的正常数,||U||F、||S||F分别为弗洛贝尼乌斯范数。
进一步地,所述预测模型还包括一个根据目标用户与第二类邻域TopKh(i)内用户之间的权重wih得到的正则化项,该正则化项为:
Σ i = 1 m | | U i - Σ h ∈ TopK h ( i ) w ih U h | | F 2 ,
其中,Ui、Uh依次表示矩阵U中的第i、h行,所述正则化项用于令目标用户的特征向量与第二类邻域TopKh(i)内用户的特征向量之间尽可能地接近。
由此,得到了上述预测模型的最终的目标函数:
L ( U , S ) = 1 2 Σ i = 1 m Σ j = 1 n I ij ( q ij - ( αU i T S j + ( 1 - α ) Σ l = 1 K w il U l T S j ) ) 2 + λ U 2 | | U | | F 2 + λ S 2 | | S | | F 2 + λ E 2 Σ i = 1 m | | U i - Σ h ∈ TopK h ( i ) w ih U h | | F 2 , 其中,λE为极小的正常数,通常取0.001。
模型求解步骤106:对上述最终的目标函数进行求解,首先将预测模型对于Ui、Sj求偏导数得到 ∂ L ∂ U i = α Σ j = 1 n I ij ( - S j ) ( α U i T S j + ( 1 - α ) Σ l = 1 K w jl U i T S l ) × ( q ij - ( αS j + ( 1 - α ) Σ l = 1 K w jl U i T ) ) + ( 1 - α ) Σ g ∈ G ( i ) Σ j = 1 n I gj w gi S j ( αU i T S j + ( 1 - α ) Σ l = 1 K w il U i T S l - q ij ) + λ U U i + λ H ( U i - Σ h ∈ TopK h ( i ) w ih U h ) 以及 ∂ L ∂ S j = Σ j = 1 n I ij ( αU i T S j + ( 1 - α ) Σ l = 1 K w jl U i T S l - q ij ) × ( αU i + ( 1 - α ) Σ l = 1 K w il U l T ) + λ S S j , 其中,G(i)代表所有邻居中包括用户i的用户集合;
应用梯度下降法,采用梯度下降迭代公式 U ′ i = U i - β × ∂ L ∂ U i S ′ j = S j - β × ∂ L ∂ S j 得到最终的Ui以及Sj以求解预测模型,其中,β为预设常数,表示梯度下降迭代过程中的学习率,得到待求解的用户特征矩阵Ui以及服务特征矩阵Sj
预测步骤107:通过预测模型中用户特征矩阵与服务特征矩阵的矩阵乘法得到最终的预测值 q ij = αU i T S j + ( 1 - α ) Σ l = 1 K w il U l T S j .
实施例2
应用实施例1所记载的基于用户邻域的Web Service服务质量预测方法所得到的基于用户邻域的Web Service服务质量预测装置,如图1所示,该装置包括第一类邻域识别装置201、第一类邻域权重计算装置202、第二类邻域识别装置203、第二类邻域权重计算装置204、模型建立装置205、模型求解装置206以及预测装置207。
第一类邻域识别装置201用于根据用户的历史调用记录计算任意两个用户i、l之间的相似度simil,用户i为目标用户,用户i、l共同调用过服务集合S,相似度simil采用余弦相似度计算得到,并以历史调用记录中所记载的服务被用户调用后返回的服务质量作为用户的空间向量坐标值;选择与用户i相似度simil最大的K个用户l组成目标用户的第一类邻域TopKl(i)。
第一类邻域权重计算装置202用于根据相似度simil计算第一类邻域TopKl(i)内每个用户l的权重wil
第二类邻域识别装置203用于根据用户的地理位置坐标计算任意两个用户i、h之间的空间距离dih,选择与用户i的空间距离dih最近的K个用户h组成目标用户的第二类邻域TopKh(i)。
第二类邻域权重计算装置204用于根据空间距离dih计算第二类邻域TopKh(i)内每个用户h与用户i之间的相似度simih,当dih为0时,simih=1;当dih逐渐增大时,simih逐渐减小;当dih趋向于无穷时,simih=0;根据相似度simih计算第二类邻域TopKh(i)内每个用户h的权重wih
模型建立装置205用于在矩阵分解模型的基础上建立用于预测目标用户与第一类邻域TopKj(i)内用户的Web Service服务质量的预测模型,所述预测模型还包括一个根据目标用户与第二类邻域TopKh(i)内用户之间的权重wih得到的正则化项,所述正则化项用于令目标用户的特征向量与第二类邻域TopKh(i)内用户的特征向量之间尽可能地接近。
模型求解装置206用于应用梯度下降法求解预测模型,得到待求解的用户特征矩阵以及服务特征矩阵。
预测装置207用于通过预测模型中用户特征矩阵与服务特征矩阵的矩阵乘法得到最终的预测值。
总之,以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所作的均等变化与修饰,皆应属本发明专利的涵盖范围。

Claims (10)

1.一种基于用户邻域的Web Service服务质量预测方法,其特征在于,包括以下的具体步骤:
第一类邻域识别步骤(101):根据用户的历史调用记录计算任意两个用户i、l之间的相似度simil,用户i为目标用户,用户i、l共同调用过服务集合S,相似度simil采用余弦相似度计算得到,并以历史调用记录中所记载的服务被用户调用后返回的服务质量作为用户的空间向量坐标值;选择与用户i相似度simil最大的K个用户l组成目标用户的第一类邻域TopKl(i);
第一类邻域权重计算步骤(102):根据相似度simil计算第一类邻域TopKl(i)内每个用户l的权重wil
第二类邻域识别步骤(103):根据用户的地理位置坐标计算任意两个用户i、h之间的空间距离dih,选择与用户i的空间距离dih最近的K个用户h组成目标用户的第二类邻域TopKh(i);
第二类邻域权重计算步骤(104):根据空间距离dih计算第二类邻域TopKh(i)内每个用户h与用户i之间的相似度simih,当dih为0时,simih=1;当dih逐渐增大时,simih逐渐减小;当dih趋向于无穷时,simih=0;根据相似度simih计算第二类邻域TopKh(i)内每个用户h的权重wih
模型建立步骤(105):在矩阵分解模型的基础上建立用于预测目标用户与第一类邻域TopKj(i)内用户的Web Service服务质量的预测模型,所述预测模型还包括一个根据目标用户与第二类邻域TopKh(i)内用户之间的权重wih得到的正则化项,所述正则化项用于令目标用户的特征向量与第二类邻域TopKh(i)内用户的特征向量之间尽可能地接近;
模型求解步骤(106):应用梯度下降法求解预测模型,得到待求解的用户特征矩阵以及服务特征矩阵;
预测步骤(107):通过预测模型中用户特征矩阵与服务特征矩阵的矩阵乘法得到最终的预测值。
2.根据权利要求1所述的基于用户邻域的Web Service服务质量预测方法,其特征在于,第一类邻域识别步骤(101)中,使用历史调用记录中所记载的服务被用户调用后返回的服务质量与服务被调用后返回的服务质量的平均值之差作为用户的空间向量坐标值计算余弦相似度。
3.根据权利要求1所述的基于用户邻域的Web Service服务质量预测方法,其特征在于,第一类邻域识别步骤(101)中,所述相似度 sim il = Σ j ∈ S ( r ij - r ‾ j ) ( r lj - r ‾ j ) Σ j ∈ S ( r ij - r ‾ j ) 2 Σ j ∈ S ( r lj - r ‾ l ′ ) 2 , 其中,rij为用户i调用服务j后返回的服务质量,rlj为用户l调用服务j后返回的服务质量,
Figure FDA0000471086250000022
为服务j被调用后返回的服务质量的平均值。
4.根据权利要求1、2或者3所述的基于用户邻域的Web Service服务质量预测方法,其特征在于,第一类邻域识别步骤(101)中,使用修正后的相似度
Figure FDA0000471086250000023
作为任意两个用户i、j之间的相似度,其中,|Ui|、|Ul|以及|Ui∩Ul|依次为用户i调用过的服务数量、用户j调用过的服务数量以及用户i、j同时调用过的服务数量。
5.根据权利要求1所述的基于用户邻域的Web Service服务质量预测方法,其特征在于,第二类邻域权重计算步骤(104)中,simih=exp(-dih)。
6.根据权利要求1所述的基于用户邻域的Web Service服务质量预测方法,其特征在于,模型建立步骤(105)还包括:将用户-服务调用矩阵Q分解为两个低维矩阵,即
Figure FDA0000471086250000024
其中,U∈Rd×m表示用户隐因子矩阵,S∈Rd×n表示服务隐因子矩阵;建立所述预测模型的目标函数 L ( U , S ) = 1 2 Σ i = 1 m Σ j = 1 n I ij ( q ij - ( αU i T S j + ( 1 - α ) Σ l = 1 K w il U l T S j ) ) 2 + λ U 2 | | U | | F 2 + λ S 2 | | S | | F 2 , 其中,Iij等于1表示用户i调用过服务j,Iij等于0表示用户i没有调用过服务j,qij表示用户i调用服务j的服务质量预测值,Ui T、Ul T依次表示矩阵U的第i、l列,Sj表示矩阵S的第j列,α为预设的调节因子,λU、λS分别取极小的正常数,||U||F、||S||F分别为弗洛贝尼乌斯范数。
7.根据权利要求1所述的基于用户邻域的Web Service服务质量预测方法,其特征在于,模型建立步骤(105)中,所述正则化项为
Figure FDA0000471086250000031
其中,Ui、Uh依次表示矩阵U中的第i、h行。
8.根据权利要求1所述的基于用户邻域的Web Service服务质量预测方法,其特征在于,模型求解步骤(106)还包括:将预测模型对于Ui、Sj求偏导数得到 ∂ L ∂ U i = α Σ j = 1 n I ij ( - S j ) ( α U i T S j + ( 1 - α ) Σ l = 1 K w jl U i T S l ) × ( q ij - ( αS j + ( 1 - α ) Σ l = 1 K w jl U i T ) ) + ( 1 - α ) Σ g ∈ G ( j ) Σ j = 1 n I gj w gi S j ( αU i T S j + ( 1 - α ) Σ l = 1 K w il U i T S l - q ij ) + λ U U i + λ H ( U i - Σ h ∈ TopK h ( i ) w ih U h ) 以及 ∂ L ∂ S j = Σ j = 1 n I ij ( αU i T S j + ( 1 - α ) Σ l = 1 K w jl U i T S l - q ij ) × ( αU i + ( 1 - α ) Σ l = 1 K w il U l T ) + λ S S j ; 采用梯度下降迭代公式 U ′ i = U i - β × ∂ L ∂ U i S ′ j = S j - β × ∂ L ∂ S j 得到最终的Ui以及Sj,其中,β为预设常数,表示梯度下降迭代过程中的学习率。
9.根据权利要求1所述的基于用户邻域的Web Service服务质量预测方法,其特征在于,预测步骤(107)中,采用 q ij = αU i T S j + ( 1 - α ) Σ l = 1 K w il U l T S j 计算得到最终的预测值。
10.根据权利要求1-9任一所述的基于用户邻域的Web Service服务质量预测方法所得到的基于用户邻域的Web Service服务质量预测装置,其特征在于,包括第一类邻域识别装置(201)、第一类邻域权重计算装置(202)、第二类邻域识别装置(203)、第二类邻域权重计算装置(204)、模型建立装置(205)、模型求解装置(206)以及预测装置(207);
第一类邻域识别装置(201)用于根据用户的历史调用记录计算任意两个用户i、l之间的相似度simil,用户i为目标用户,用户i、l共同调用过服务集合S,相似度simil采用余弦相似度计算得到,并以历史调用记录中所记载的服务被用户调用后返回的服务质量作为用户的空间向量坐标值;选择与用户i相似度simil最大的K个用户l组成目标用户的第一类邻域TopKl(i);
第一类邻域权重计算装置(202)用于根据相似度simil计算第一类邻域TopKl(i)内每个用户l的权重wil
第二类邻域识别装置(203)用于根据用户的地理位置坐标计算任意两个用户i、h之间的空间距离dih,选择与用户i的空间距离dih最近的K个用户h组成目标用户的第二类邻域TopKh(i);
第二类邻域权重计算装置(204)用于根据空间距离dih计算第二类邻域TopKh(i)内每个用户h与用户i之间的相似度simih,当dih为0时,simih=1;当dih逐渐增大时,simih逐渐减小;当dih趋向于无穷时,simih=0;根据相似度simih计算第二类邻域TopKh(i)内每个用户h的权重wih
模型建立装置(205)用于在矩阵分解模型的基础上建立用于预测目标用户与第一类邻域TopKj(i)内用户的Web Service服务质量的预测模型,所述预测模型还包括一个根据目标用户与第二类邻域TopKh(i)内用户之间的权重wih得到的正则化项,所述正则化项用于令目标用户的特征向量与第二类邻域TopKh(i)内用户的特征向量之间尽可能地接近;
模型求解装置(206)用于应用梯度下降法求解预测模型,得到待求解的用户特征矩阵以及服务特征矩阵;
预测装置(207)用于通过预测模型中用户特征矩阵与服务特征矩阵的矩阵乘法得到最终的预测值。
CN201410072178.7A 2014-02-28 2014-02-28 基于用户邻域的Web Service服务质量预测方法及装置 Pending CN103840985A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410072178.7A CN103840985A (zh) 2014-02-28 2014-02-28 基于用户邻域的Web Service服务质量预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410072178.7A CN103840985A (zh) 2014-02-28 2014-02-28 基于用户邻域的Web Service服务质量预测方法及装置

Publications (1)

Publication Number Publication Date
CN103840985A true CN103840985A (zh) 2014-06-04

Family

ID=50804147

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410072178.7A Pending CN103840985A (zh) 2014-02-28 2014-02-28 基于用户邻域的Web Service服务质量预测方法及装置

Country Status (1)

Country Link
CN (1) CN103840985A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104778636A (zh) * 2015-04-08 2015-07-15 中国人民解放军海军工程大学 船舶装备维修保障信息服务推荐方法
CN105024886A (zh) * 2015-07-31 2015-11-04 浙江大学 一种基于用户元数据的快速Web服务QoS预测方法
CN105071961A (zh) * 2015-07-30 2015-11-18 中国人民解放军信息工程大学 一种Web服务的服务质量预测方法和装置
CN107358447A (zh) * 2017-06-29 2017-11-17 安徽大学 一种以服务质量为中心的个性化服务推荐方法和***
CN107609421A (zh) * 2017-09-25 2018-01-19 深圳大学 隐私保护协同Web服务质量预测的基于邻域的协同过滤方法
CN107679415A (zh) * 2017-09-25 2018-02-09 深圳大学 隐私保护协同Web服务质量预测的基于模型的协同过滤方法
WO2018058629A1 (zh) * 2016-09-30 2018-04-05 华为技术有限公司 用于预测网络距离的方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102170449A (zh) * 2011-04-28 2011-08-31 浙江大学 一种基于协同过滤的Web服务QoS预测方法
CN102629341A (zh) * 2012-04-13 2012-08-08 浙江大学 一种基于用户地理位置信息的Web服务QoS在线预测方法
CN103139310A (zh) * 2013-03-06 2013-06-05 杭州电子科技大学 一种基于混合协同过滤的Web服务QoS预测方法
CN103209102A (zh) * 2013-03-11 2013-07-17 北京邮电大学 Web服务质量的分布式测量***和方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102170449A (zh) * 2011-04-28 2011-08-31 浙江大学 一种基于协同过滤的Web服务QoS预测方法
CN102629341A (zh) * 2012-04-13 2012-08-08 浙江大学 一种基于用户地理位置信息的Web服务QoS在线预测方法
CN103139310A (zh) * 2013-03-06 2013-06-05 杭州电子科技大学 一种基于混合协同过滤的Web服务QoS预测方法
CN103209102A (zh) * 2013-03-11 2013-07-17 北京邮电大学 Web服务质量的分布式测量***和方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
WEI LO,JIANWEI YIN,SHUIGUANG DENG,YING LI,ZHAOHUI WU: "Collaborative Web Service QoS Prediction with Location-Based Regularization", 《2012 IEEE 19TH INTERNATIONAL CONFERENCE ON WEB SERVICES》 *
YUESHEN XU,JIANWEI YIN,WEI LO: "A Unified Framework of QoS-based Web Service Recommendation with Neighborhood-Extended Matrix Factorization", 《2013 IEEE 6TH INTERNATIONAL CONFERENCE ON SERVICE-ORIENTED COMPUTING AND APPLICATIONS》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104778636A (zh) * 2015-04-08 2015-07-15 中国人民解放军海军工程大学 船舶装备维修保障信息服务推荐方法
CN104778636B (zh) * 2015-04-08 2017-11-07 中国人民解放军海军工程大学 船舶装备维修保障信息服务推荐方法
CN105071961A (zh) * 2015-07-30 2015-11-18 中国人民解放军信息工程大学 一种Web服务的服务质量预测方法和装置
CN105071961B (zh) * 2015-07-30 2018-12-14 中国人民解放军信息工程大学 一种Web服务的服务质量预测方法和装置
CN105024886A (zh) * 2015-07-31 2015-11-04 浙江大学 一种基于用户元数据的快速Web服务QoS预测方法
CN105024886B (zh) * 2015-07-31 2018-04-20 浙江大学 一种基于用户元数据的快速Web服务QoS预测方法
WO2018058629A1 (zh) * 2016-09-30 2018-04-05 华为技术有限公司 用于预测网络距离的方法和装置
US10749754B2 (en) 2016-09-30 2020-08-18 Huawei Technologies Co., Ltd. Network distance prediction method and apparatus
CN107358447A (zh) * 2017-06-29 2017-11-17 安徽大学 一种以服务质量为中心的个性化服务推荐方法和***
CN107358447B (zh) * 2017-06-29 2021-01-29 安徽大学 一种以服务质量为中心的个性化服务推荐方法和***
CN107609421A (zh) * 2017-09-25 2018-01-19 深圳大学 隐私保护协同Web服务质量预测的基于邻域的协同过滤方法
CN107679415A (zh) * 2017-09-25 2018-02-09 深圳大学 隐私保护协同Web服务质量预测的基于模型的协同过滤方法

Similar Documents

Publication Publication Date Title
CN103840985A (zh) 基于用户邻域的Web Service服务质量预测方法及装置
CN109062962B (zh) 一种融合天气信息的门控循环神经网络兴趣点推荐方法
CN110599234A (zh) 一种产品销售预测方法
US20190272553A1 (en) Predictive Modeling with Entity Representations Computed from Neural Network Models Simultaneously Trained on Multiple Tasks
CN113537600B (zh) 一种全过程耦合机器学习的中长期降水预报建模方法
KR102340463B1 (ko) 샘플 가중치 설정방법 및 장치, 전자 기기
CN106776928B (zh) 基于内存计算框架、融合社交及时空数据的位置推荐方法
CN103684850A (zh) 基于服务邻域的Web Service服务质量预测方法
CN107451596B (zh) 一种网络节点分类方法及装置
CN107545301B (zh) 页面展示方法及装置
CN107003834B (zh) 行人检测设备和方法
CN108804577B (zh) 一种资讯标签兴趣度的预估方法
CN108664658A (zh) 一种考虑用户偏好动态变化的协同过滤视频推荐方法
CN111582538A (zh) 一种基于图神经网络的社群价值预测方法及***
CN111160472B (zh) 对象的目标特征的预测方法、装置、存储介质与电子设备
CN109509039A (zh) 价格预测模型的建立方法及***、商品推荐方法及***
CN110110372B (zh) 一种用户时序行为自动切分预测方法
CN111353620A (zh) 构建网点件量预测模型的方法、装置、设备及存储介质
CN109754122A (zh) 一种基于随机森林特征提取的bp神经网络的数值预测方法
CN114584406B (zh) 一种联邦学习的工业大数据隐私保护***及方法
CN104601385A (zh) 基于地理位置的WebService服务质量预测方法
CN109657725B (zh) 一种基于复杂时空情境感知的服务质量预测方法及***
CN109684561B (zh) 基于用户签到行为变化的深层语义分析的兴趣点推荐方法
CN111310995A (zh) 基于卷积神经网络的业务预测方法以及装置
CN108052534A (zh) 一种基于地理特征的房地产推荐方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20140604