CN103473291B - 一种基于隐语义概率模型的个性化服务推荐***及方法 - Google Patents

一种基于隐语义概率模型的个性化服务推荐***及方法 Download PDF

Info

Publication number
CN103473291B
CN103473291B CN201310392446.9A CN201310392446A CN103473291B CN 103473291 B CN103473291 B CN 103473291B CN 201310392446 A CN201310392446 A CN 201310392446A CN 103473291 B CN103473291 B CN 103473291B
Authority
CN
China
Prior art keywords
user
service
index
preference
service context
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201310392446.9A
Other languages
English (en)
Other versions
CN103473291A (zh
Inventor
彭启民
胡堰
胡晓惠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Software of CAS
Original Assignee
Institute of Software of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Software of CAS filed Critical Institute of Software of CAS
Priority to CN201310392446.9A priority Critical patent/CN103473291B/zh
Publication of CN103473291A publication Critical patent/CN103473291A/zh
Application granted granted Critical
Publication of CN103473291B publication Critical patent/CN103473291B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于隐语义概率模型的个性化服务推荐***及方法,属于服务计算技术领域,包括以下步骤:确定用于评价一系列功能相似服务的性能优劣的QoS指标体系;建立用户、用户指标偏好以及服务情境三者之间的隐语义概率模型;收集***内不同用户在不同的服务情境下使用不同功能的服务时通过与***交互提供的指标偏好信息,并存入历史经验数据库;用已收集的数据训练隐语义概率模型的参数;当用户不熟悉某种服务情境,但需要在该服务情景下调用特定功能服务时,利用已训练的隐语义概率模型对该用户的指标偏好进行预测;根据预测出的用户个性化的QoS指标偏好,对候选服务进行综合筛选,从中选出最贴近该用户需求的服务,从而实现个性化服务推荐。

Description

一种基于隐语义概率模型的个性化服务推荐***及方法
技术领域
本发明属于服务计算技术领域,具体涉及一种基于隐语义概率模型的个性化服务推荐***及方法。
背景技术
随着互联网技术的飞速发展,服务计算技术得到了广泛应用,Web服务就是这样一种分布运行于Internet之上、支持不同平台之间互操作的松耦合软件***,它主要通过“发布-查找-绑定”的模式允许服务使用者和提供者之间形成松散的绑定关系,这为服务的使用奠定了基础。但web服务的使用者和提供者相分离的特性,增加了服务使用者理解服务的难度,同时随着Internet上运行的web服务数量不断增多,服务使用者需要从众多功能相似的服务中选出最符合自身需求的一个或一组服务,这对大多数缺乏专业知识的服务使用者来说无疑是一项繁重的任务,所以发展有效的服务推荐技术是服务选择的必然需求。
经过对现有技术的检索发现,中国专利申请号200710162463.8,记载了一种自适应服务推荐设备,该装置主要包括:语义分析装置、服务选择装置、服务推荐装置;语义分析装置用于对用户的查询进行语义上的分析;服务选择装置用于找出与语义分析后的查询对应的选择的服务,并根据选择的服务更新服务相关数据库;最后服务推荐装置用于利用获取的选择的服务来查找服务相关数据库以向用户推荐相关服务。
进一步检索发现,中国专利申请号200910236492.3,记载了一种个性化服务推荐***和方法,该方法主要包括:用户信息收集器监控在终端进行的各种操作信息,并进行预处理后存入用户信息数据库,若用户信息数据库方法更新,则启动用户行为分析器进行分析;用户行为分析器扫描用户信息数据库,提取新的用户信息并计入资源信息数据库,计算新的推荐策略并记入推荐策略数据库;上下文感知处理器感知用户的当前上下文,输出当前的上下文描述信息,启动个性化推荐处理器;个性化推荐处理器接收来自上下文感知处理器的消息后,获得当前上下文信息,通过检索推荐策略数据库,获得匹配的左右推荐策略,并按照左右推荐策略通过检索资源信息数据库,匹配合适的资源信息,实时生成个性化推荐服务。
进一步检索发现,中国专利申请号20121014234.2记录了一种基于上下文感知和用户偏好的空间信息服务匹配方法,在用户的服务请求和候选空间信息服务的功能性匹配和非功能性匹配的基础上,考虑上下文敏感的用户偏好,计算出用户服务需求与智能空间中的各候选空间信息服务的匹配度,然后依据匹配度将候选空间信息服务推荐给用户;虽然用户可能具有固定的或者重复的偏好,但这些偏好不是在任何时候都相关,该发明基于上下文感知和用户偏好的空间信息服务匹配方法从上下文的角度对用户偏好进行精简,剔除与用户无关的用户偏好;该发明从功能匹配和非功能匹配两个方面进行匹配度计算,提高空间信息服务匹配的准确率。
进一步检索发现,中国专利申请号201210253884.2记录了一种用于Web服务推荐的个性化搜索方法,包括以下步骤:步骤1,预处理WSDL文档:通过去除停用词和提取词干两个预处理步骤,形成词袋;步骤2,抽取用户兴趣:使用改进的TF-IDF公式计算词袋中的每一个词的权重,并乘以该词的时间衰减因子,得到新的权重;选择权重由大至小前k个词作为用户的兴趣词,以及每个词的对应权重,组成k维的用户兴趣向量;步骤3,计算兴趣相似度:设定相似度阈值,超过阈值的用户入选为目标用户的邻居用户;步骤4,排序服务检索结果,根据邻居用户的相似度及其选择服务的次数计算服务的推荐预测值,并将检索结果按照推荐预测值降序排列,从而得到个性化搜索结果。
上述的方法都涉及了个性化的服务推荐,但很少针对Web服务的非功能属性筛选服务以满足用户的个性化需求,服务的非功能属性往往是服务性能的主要体现,所以如何利用服务的非功能属性客观地评价服务的性能同时又能满足不同用户的个性化需求是服务推荐需要解决的问题。
发明内容
本发明技术解决问题:针对现有技术存在的不足,提供一种基于隐语义概率模型的个性化服务推荐***及方法,旨在为用户在不熟悉的服务情境下提供指标偏好预测,从而完成基于多维QoS指标的服务综合排序,为用户提供个性化的服务推荐结果。
本发明的技术解决方案:一种个性化服务推荐中基于隐语义概率模型的用户指标偏好预测方法,具体步骤如下:
步骤1、确定评价服务性能优劣的服务QoS指标体系
所述的服务QoS指标体系是指整个Web服务***统一采用的用于评价一系列功能相似服务性能优劣所用QoS指标的集合,不同的***可以根据需要选取适当的QoS指标组成自己的QoS指标体系用于评价服务的性能优劣;
步骤2、建立用户、用户指标偏好以及服务情境三者之间的隐语义概率模型
所述的用户指标偏好是指用户对步骤1中所述服务QoS指标体系中各个QoS指标的偏好程度,对每个QoS指标的偏好程度值介于0到1之间,并且对各个QoS指标的偏好值总和为1;所述的服务情境是指在何种场景下使用何种功能的服务,每一个服务情境e用三元组(w1,w2,w3)表示,其中w1表示服务完成的与业务无关的基本功能,如视频功能、导航功能等,w2表示用户使用该功能的服务完成的具体业务活动,如学术会议、军事导航等,w3表示用户调用服务的终端设备,如手机、PC机等;所述的用户、用户指标偏好、服务情境三者之间的隐语义概率模型是指单个用户以不同的概率依赖不同的用户隐类而存在,单则服务情境以不同的概率依赖不同的服务情境隐类存在,指标偏好同时以不同的概率同时依赖不同的用户隐类和服务情境隐类存在的概率模型,模型的图像化表示如7所示。
所述的用户隐类是指非人为事先确定的而是从历史经验数据中学习得到的用户聚簇;所述的服务情境隐类是指非人为事先确定的而是从历史经验数据中学习得到的服务情境聚簇;
步骤3、收集不同用户在不同的服务情境下使用不同功能服务时自主提供的指标偏好信息,作为历史经验数据存入数据库,为训练步骤2中建立的隐语义概率模型的参数作准备,存储格式为(用户,服务情境、指标偏好)三元组;
步骤4、用EM算法及已收集的历史经验数据训练隐语义概率模型的参数
所述的隐语义概率模型的参数是指所有用户隐类{U1,U2,...,UI}的先验概率P(Ui)(1≤i≤I)、服务情境隐类{E1,E2,...,EJ}先验概率P(Ej)(1≤j≤J)、给定一个用户隐类Ui的情况下单个用户u出现的条件概率P(u|Ui)(1≤i≤I)、给定一个服务情境隐类Ej的情况下单则服务情境e出现的条件概率P(e|Ej)(1≤j≤J)、给定用户隐类Ui和服务情境隐类Ej的情况下用户指标偏好向量r出现的概率P(r|Ui,Ej)(1≤i≤I,1≤j≤J);其中I,J分别表示用户隐类和服务情境隐类的总个数,i,j分别表示用户隐类和服务情境隐类的编号;
步骤5、获得用户需要服务推荐的请求,包括个人信息、服务推荐所依赖的服务情境;
步骤6、用已训练的隐语义概率模型预测指定用户在特定服务情境下的未知指标偏好;
步骤7、根据预测出的用户个性化的QoS指标偏好,对候选服务进行综合筛选,从而选出最贴近该用户需求的服务,将推荐结果返回给用户。
所述步骤3中收集历史经验数据的过程如下:
(1)用户在其熟悉的服务情境下调用熟悉的web服务时可以直接与***交互,使用层次分析法给出自己给出对各个指标偏好的两两比较结果,建立比较矩阵;
C = c 11 , c 12 , . . . , c 1 n c 21 , c 22 , . . . , c 3 n . . . . . . . . . c n 1 , c n 2 , . . . , c nn ,
(2)验证比较矩阵的一致性是否在可接受的范围内,若可接受,进入(3),否者返回(1);
(3)计算比较矩阵的最大特征值对应的特征向量,将该特征向量归一化后所得到的就是用户对各个QoS指标的偏好向量WQoS,将(用户、服务情境、指标偏好)三元组存入数据库。
所述步骤4中隐语义概率模型的参数训练过程如下:
(1)从数据库中取出所有的用户、服务情境、指标偏好三元组作为训练数据,是用户在其熟悉的服务情境下利用层次分析法给出的个性化指标偏好权值,每个三元组(u,e,r)表示用户u在服务情境e下对服务的各个QoS指标的偏好权重为r,r是一个K维向量(r1,r2,...,rK),为简单起见,假设权重向量r的每一维相互独立并且服从正态分布,则联合概率P(u,e,r)可用下面两个公式表示,
P ( u , e , r ) = Σ i Σ j P ( U i ) P ( E j ) P ( u | U i ) P ( e | E j ) P ( r | U i , E j ) ,
其中P(r|Ui,Ej)为K维正态分布,i,j分别表示用户隐类和服务情境隐类编号;
(2)E步计算隐类的联合后验概率,
P ( U p , E q | u , e , r ) = [ P ( U p ) P ( E q ) P ( u | U p ) P ( e | E q ) P ( r | U p , E q ) ] b Σ i Σ j [ P ( U i ) P ( E j ) P ( u | U i ) P ( e | E j ) P ( r | U p , E q ) ] b .
其中b是一个介于0到1之间的模拟退火参数,P(r|Up,Eq)为K维正态分布,p,q表示用户隐类和服务情境隐类编号;
(3)M步使用E步计算得到的后验概率重新估算模型参数,包括每一个用户隐类和每一个服务情境隐类的先验概率P(Up)和P(Eq),每一个用户在给定不同用户隐类时出现的条件概率P(u|Up),每一则服务情境在给定不同服务情境隐类时出现的条件概率P(e|Eq),同时给定不同的用户情境隐类和服务情境隐类时K个指标偏好的正态分布均值和方差 σ 2 k , U p , E q :
P ( U p ) = Σ l Σ j P ( U p , E j | u ( l ) , e ( l ) , r ( l ) ) L , P ( E q ) = Σ l Σ i P ( U i , E q | u ( l ) , e ( l ) , r ( l ) ) L ,
P ( u | U p ) = Σ l : u ( l ) = u Σ j P ( U p , E j | u ( l ) , e ( l ) , r ( l ) ) L * P ( U p ) , P ( e | E q ) = Σ l : e ( l ) = e Σ i P ( U i , E q | u ( l ) , e ( l ) , r ( l ) ) L * P ( E q ) ,
μ k , U p , E q = Σ l r k ( l ) P ( U p , E q | u ( l ) , e ( l ) , r ( l ) ) Σ l P ( U p , E q | u ( l ) , e ( l ) , r ( l ) ) , σ 2 k , U p , E q = Σ l ( r k ( l ) - μ k , U p , E q ) 2 P ( U p , E q | u ( l ) , e ( l ) , r ( l ) ) Σ l P ( U p , E q | u ( l ) , e ( l ) , r ( l ) ) .
其中l表示历史训练样本的编号,i,p表示用户隐类的标号,j,q表示服务情境隐类的编号,u,e表示单个用户和单则服务情境,U,E表示用户隐类和服务情境隐类,k表示QoS指标的编号。
(4)检查模型参数是否收敛,若收敛,结束并保存模型参数,若不收敛,返回(2)执行。
所述步骤6中利用已训练的隐语义概率模型预测用户指标偏好的实现方式如下:
(1)用户ut登陆服务推荐***,提供需要进行服务推荐的服务情境et
(2)推荐***获取用户的个人数据及其提供的服务情境信息,用下面的公式对该用户在该服务情境下的各个QoS指标偏好进行独立预测
R k ( e t , u t ) = ∫ 0 1 r k P ( e t , u t , r k ) ∫ 0 1 P ( e t , u t , r k ) d r k d r k
其中
P ( e t , u t , r k ) = Σ i , j P ( U i ) P ( E j ) P ( u t | U i ) P ( e t | E j ) P ( r k | U i , E j )
P ( r k | U i , E j ) = 1 2 π σ k , U i , E j exp [ - ( r k - μ k , U i , E j ) 2 2 σ 2 k , U i , E j ] .
最后预测得到用户ut在该服务情境et下对各个QoS指标的偏好权重为 ( R 1 ( e t , u t ) , . . . , R K ( e t , u t ) ) , 简单记作 ( r ^ 1 , r ^ 2 , . . . , r ^ K ) .
所述步骤7中根据预测出的用户个性化的QoS指标偏好,对候选服务进行筛选的过程如下:用户ut在服务情境et下已得到多个功能相似的候选服务,假设每个服务的各QoS指标上的性能可有其他方法得到,记为(q1,q2,...,qK),那么每一个服务的总得分采用表示,最后根据各个服务的总得分给出服务的排序,作为服务推荐的依据。
本发明与现有技术相比的优点在于:本发明提供的技术方案建立了一种有关用户、用户指标偏好、服务情境之间的概率依赖模型,用历史数据对模型训练以后,可以利用该模型方便地预测出特定用户在陌生服务情境下的指标偏好向量,最后结合服务的非功能属性和已经预测的用户指标偏好对候选服务进行综合评价以实现个性化服务推荐。已有方法一般只简单地将候选服务的各维度QoS值进行加权平均,据此给出候选服务的综合排序,权值一般是先确定的,显然无法体现用户在服务调用过程中的个性化需求。本专利提出的基于隐语义概率模型的个性化服务推荐方法可以以一种自动的方式预测出用户在特定情境下的个性化指标偏好,即使在用户自己也无法明确表达自己的偏好信息的时候。同时本发明的模型训练可以离线进行,所以提高了在线服务推荐的效率。
附图说明
图1是本发明***的功能框图;
图2为图1中历史信息收集模块的实现流程图;
图3为图1中隐语义概率模型参数训练模块的实现流程图;
图4为图1中服务推荐请求模块的实现流程图;
图5为图1中个性化指标偏好预测模块的实现流程图;
图6为图1中个性化服务推荐模块的实现流程图;
图7为隐语义概率模型的图像化表示。
具体实施方式
如图1所示,本发明一种基于隐语义概率模型的个性化服务推荐***及方法由历史信息收集模块、隐语义概率模型参数训练模块、服务推荐请求模块、个性化指标偏好预测模块、个性化服务推荐模块组成。
整个实现过程如下:
步骤1、确定评价服务性能优劣的服务QoS指标体系
所述的服务QoS指标体系是指整个Web服务***统一采用的用于评价一系列功能相似服务性能优劣所用QoS指标的集合,不同的***可以根据需要选取适当的QoS指标组成自己的QoS指标体系用于评价服务的性能优劣;
步骤2、建立用户、用户指标偏好以及服务情境三者之间的隐语义概率模型
所述的用户指标偏好是指用户对步骤1中所述服务QoS指标体系中各个QoS指标的偏好程度,对每个QoS指标的偏好程度值介于0到1之间,并且对各个QoS指标的偏好值总和为1;所述的服务情境是指在何种场景下使用何种功能的服务,每一个服务情境e用三元组(w1,w2,w3)表示,其中w1表示服务完成的与业务无关的基本功能,如视频功能、导航功能等,w2表示用户使用该功能的服务完成的具体业务活动,如学术会议、军事导航等,w3表示用户调用服务的终端设备,如手机、PC机等;所述的用户、用户指标偏好、服务情境三者之间的隐语义概率模型是指单个用户以不同的概率依赖不同的用户隐类而存在,单则服务情境以不同的概率依赖不同的服务情境隐类存在,指标偏好同时以不同的概率同时依赖不同的用户隐类和服务情境隐类存在的概率模型,模型的图像化表示如图7所示。图中U代表用户隐类,E代表服务情境隐类,u、e分别代表单个用户和打个服务情境,r代表指标偏好向量,图7显示了这几个要素之间的概率依赖关系,用户u、服务情境e、指标偏好向量r对用户隐类U和服务情境隐类E的依赖度的大小以条件概率P(u|U)、P(e|E)、P(r|U,E)的大小来衡量。
所述的用户隐类是指非人为事先确定的而是从历史经验数据中学习得到的用户聚簇;所述的服务情境隐类是指非人为事先确定的而是从历史经验数据中学习得到的服务情境聚簇;
步骤3、收集不同用户在不同的服务情境下使用不同功能服务时自主提供的指标偏好信息,作为历史经验数据存入数据库,为训练步骤2中建立的隐语义概率模型的参数作准备,存储格式为(用户,服务情境、指标偏好)三元组;
步骤4、用EM算法及已收集的历史经验数据训练隐语义概率模型的参数
所述的隐语义概率模型的参数是指所有用户隐类{U1,U2,...,UI}的先验概率P(Ui)(1≤i≤I)、服务情境隐类{E1,E2,...,EJ}先验概率P(Ej)(1≤j≤J)、给定一个用户隐类Ui的情况下单个用户u出现的条件概率P(u|Ui)(1≤i≤I)、给定一个服务情境隐类Ej的情况下单则服务情境e出现的条件概率P(e|Ej)(1≤j≤J)、给定用户隐类Ui和服务情境隐类Ej的情况下用户指标偏好向量r出现的概率P(r|Ui,Ej)(1≤i≤I,1≤j≤J);i,j分别代表什么,其中I,J分别表示用户隐类和服务情境隐类的总个数,i,j分别表示用户隐类和服务情境隐类的编号;
步骤5、获得用户需要服务推荐的请求,包括个人信息、服务推荐所依赖的服务情境;
步骤6、用已训练的隐语义概率模型预测指定用户在特定服务情境下的未知指标偏好;
步骤7、根据预测出的用户个性化的QoS指标偏好,对候选服务进行综合筛选,从而选出最贴近该用户需求的服务,将推荐结果返回给用户。
上述各模块的具体实现过程如下:
1.历史信息收集模块
实现过程如图2所示:收集用户的个人信息,包括姓名、职业、年收入、兴趣爱好等,为每个用户分配一个编号;收集用户提供指标偏好所处的服务情境信息,服务情境表示为三元组(服务基本功能,目标活动,终端设备),比如(导航功能,日常出行,手机)或者(语音功能,学术会议,个人电脑)等等。假设实际确定的各个QoS维度为:可靠性、响应时间、可用性、吞吐量、价格,那么用户在该服务情境下给出的比较矩阵就为5*5的矩阵C,计算其最大特征值对应的特征向量并归一化,即为指标偏好,将用户,服务情境,指标偏好三元组存入数据库。
2、隐语义概率模型参数训练模块
实现过程如图3所示:将数据库中的历史训练数据取出,然后人工设置用户隐类和服务隐类的个数,假设都为5个,以及隐语义概率模型的初始参数:5个用户隐类的初始先验概率,可均设为1/5;5个服务情境隐类的概率,可均设为1/5;每一个用户在给定不同用户隐类的条件概率初值;每一则服务情境在给定不同服务情境隐类的条件概率初值;每一个指标偏好在给定不同用户隐类和服务情境隐类时的正态分布均值和方差的初值,然后用EM算法结合训练数据迭代训练模型的参数直至收敛并将参数保存。
3.服务推荐请求模块
实现过程如图4所示,用户登录服务推荐***,假设该用户已经是***的注册用户,并且有特定的登录名标识,记为ut,他提供了需要进行服务推荐的服务情境记为et,具体含义是(汇率转换,网络购物,个人电脑),该模块会记录下ut和et,提交给个性化指标偏好预测模块和个性化服务推荐模块。
4.个性化指标偏好预测模块,实现过程如图5所示。
该模块需要获取已训练好的模型参数和用户提供的服务推荐请求信息,基于上面提出的指标偏好预测方法预测出用户指标偏好,假设预测的指标偏好为r=(0.3,0.1,0.2,0.3,0.1)。
5.个性化服务推荐模块
实现过程如图6所示,假设满足汇率转换的服务共有3个s1,s2,s3,它们在五个QoS维度上的归一化值可以由其他方式获得,假设分别记为:q1=(0.5,0.5,0.6,0.7,0.6),q2=(0.8,0.4,0.7,0.2,0.6),q3=(0.4,0.8,0.2,0.6,0.4),那么三个候选服务的得分分别为:
g1=r·q1=(0.3,0.1,0.2,0.3,0.1)·(0.5,0.5,0.6,0.7,0.6)=0.59;
g2=r·q2=(0.3,0.1,0.2,0.3,0.1)·(0.8,0.4,0.7,0.2,0.6)=0.54;
g3=r·q3=(0.3,0.1,0.2,0.3,0.1)·(0.4,0.8,0.2,0.6,0.4)=0.46;
所以可得g1>g2>g3,所以给出了服务排序列表为s1,s2,s3,返回给用户供用户选择。
本发明未详细阐述部分属于本领域公知技术。
以上所述,仅为本发明部分具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本领域的人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。

Claims (7)

1.一种基于隐语义概率模型的个性化服务推荐***,其特征在于包括:
历史信息收集模块:收集不同用户在不同服务情境下通过层次分析法自主提供的指标偏好比较矩阵,检查该矩阵满足一致性约束后,计算该矩阵最大特征值对应的特征向量,归一化后得出不同用户在不同服务情境下的指标偏好,并将用户、服务情境、指标偏好以三元组形式存入数据库,为隐语义概率模型参数训练模块提供历史训练数据;
隐语义概率模型参数训练模块:从数据库中获取历史信息收集模块收集的用户、服务情境、指标偏好三元组作为训练样本,根据事先设定的隐语义概率模型参数初值,利用EM算法在训练数据上迭代训练模型参数,直至模型参数收敛,保存所得训练参数,提供给个性化指标偏好预测模块;
用户服务推荐请求模块:该模块获取用户登录时提供的个性资料信息及用户登录后录入的需要进行服务推荐的服务情境信息,最后将这两项信息提供给个性化指标偏好预测模块;
个性化指标偏好预测模块:获取用户服务推荐请求模块提供的用户个人信息和服务情境信息,结合隐语义概率模型参数训练模块提供的已经训练好的模型参数,预测该用户在该服务情境下的指标偏好,并将预测的指标偏好提供给个性化服务推荐模块;
个性化服务推荐模块:接收来自个性化指标偏好模块的用户指标偏好,及来自用户服务推荐请求模块的服务情境信息,获取适用于该服务情境的所有功能相似的服务,及服务各维度的QoS指标值,与用户个性化的指标偏好作点积,给出服务的综合排序,作为推荐列表返回给用户,用户根据推荐的结果选择自己感兴趣的项目进行关注。
2.根据权利要求1所述的基于隐语义概率模型的个性化服务推荐***,其特征在于:所述隐语义概率模型参数训练模块实现过程:
(1)从数据库中获取历史信息收集模块存入的用户、服务情境、指标偏好三元组,作为历史训练数据;
(2)人工设置用户隐类和服务情境隐类的个数以及模型的参数初值,包括用户隐类和服务情境隐类的先验概率,单个用户在给定不同用户隐类时的条件概率,单则服务情境在给定不同服务情境隐类时的条件概率,以及各个指标偏好在给定不同用户隐类和不同服务情境隐类时的正态分布均值和方差;
(3)用EM算法,结合历史训练数据,对模型参数进行迭代训练,直至收敛,保存模型参数,提供给个性化指标偏好预测模块。
3.一种基于隐语义概率模型的个性化服务推荐方法,其特征在于实现步骤如下:
步骤1、确定评价服务性能优劣的服务QoS指标体系
所述的服务QoS指标体系是指整个Web服务***统一采用的用于评价一系列功能相似服务性能优劣所用QoS指标的集合,不同的***可以根据需要选取适当的QoS指标组成自己的QoS指标体系用于评价服务的性能优劣;
步骤2、建立用户、用户指标偏好以及服务情境三者之间的隐语义概率模型
所述的用户指标偏好是指用户对步骤1中所述服务QoS指标体系中各个QoS指标的偏好程度,对每个QoS指标的偏好程度值介于0到1之间,并且对各个QoS指标的偏好值总和为1;所述的服务情境是指在何种场景下使用何种功能的服务,每一个服务情境e用三元组(w1,w2,w3)表示,其中w1表示服务完成的与业务无关的基本功能,包括视频功能、导航功能,w2表示用户使用该功能的服务完成的具体业务活动,w3表示用户调用服务的终端设备;
所述的用户、用户指标偏好、服务情境三者之间的隐语义概率模型是指单个用户以不同的概率依赖不同的用户隐类而存在,单则服务情境以不同的概率依赖不同的服务情境隐类存在,指标偏好同时以不同的概率同时依赖不同的用户隐类和服务情境隐类存在的概率模型,所述的用户隐类是指非人为事先确定的而是从历史经验数据中学习得到的用户聚簇;所述的服务情境隐类是指非人为事先确定的而是从历史经验数据中学习得到的服务情境聚簇;
步骤3、收集不同用户在不同的服务情境下使用不同功能服务时自主提供的指标偏好信息,作为历史经验数据存入数据库,为训练步骤2中建立的隐语义概率模型的参数作准备,存储格式为用户、服务情境、指标偏好三元组;
步骤4、用EM算法及已收集的历史经验数据训练隐语义概率模型的参数
所述的隐语义概率模型的参数是指所有用户隐类的先验概率服务情境隐类先验概率给定一个用户隐类的情况下单个用户u出现的条件概率给定一个服务情境隐类的情况下单则服务情境e出现的条件概率给定用户隐类和服务情境隐类的情况下用户指标偏好向量r出现的概率其中I,J分别表示用户隐类和服务情境隐类的总个数,i,j分别表示用户隐类和服务情境隐类的编号;
步骤5、获得用户需要服务推荐的请求,包括个人信息、服务推荐所依赖的服务情境;
步骤6、用已训练的隐语义概率模型预测指定用户在特定服务情境下的未知指标偏好;
步骤7、根据预测出的用户个性化的QoS指标偏好,对候选服务进行综合筛选,从而选出最贴近该用户需求的服务,将推荐结果返回给用户。
4.根据权利要求3所述的基于隐语义概率模型的个性化服务推荐方法,其特征在于:所述步骤3中收集历史经验数据的过程如下:
(1)用户在其熟悉的服务情境下调用熟悉的web服务时,直接与***交互,使用层次分析法给出自己对各个指标偏好的两两比较结果,建立比较矩阵;
C = c 11 , c 12 , ... , c 1 n c 21 , c 22 , ... , c 3 n . . . . . . . . . c n 1 , c n 2 , ... , c n n ,
(2)验证比较矩阵的一致性是否在可接受的范围内,若可接受,进入步骤(3),否者返回步骤(1);
(3)计算比较矩阵的最大特征值对应的特征向量,将该特征向量归一化后所得到的就是用户对各个QoS指标的偏好向量WQoS,将用户、服务情境、指标偏好三元组存入数据库。
5.根据权利要求3所述的基于隐语义概率模型的个性化服务推荐方法,其特征在于:所述步骤4中隐语义概率模型的参数训练过程如下,
(1)从数据库中取出所有的用户、服务情境、指标偏好三元组作为训练数据,是用户在其熟悉的服务情境下利用层次分析法给出的个性化指标偏好权值,每个三元组(u,e,r)表示用户u在服务情境e下对服务的各个QoS指标的偏好权重为r,r是一个K维向量(r1,r2,...,rK),为简单起见,假设权重向量r的每一维相互独立并且服从正态分布,则联合概率P(u,e,r)用下面公式表示,
其中为K维正态分布,i,j分别表示用户隐类和服务情境隐类编号,K是QoS指标体系中指标个数;
(2)E步计算隐类的联合后验概率,
其中b是一个介于0到1之间的模拟退火参数,满足K维正态分布,i,p表示用户隐类编号,j,q表示服务情境隐类编号;
(3)M步使用E步计算得到的用户隐类和服务情境隐类的联合后验概率重新估算模型参数,包括每一个用户隐类和每一个服务情境隐类的先验概率每一个用户在给定不同用户隐类时出现的条件概率每一则服务情境在给定不同服务情境隐类时出现的条件概率同时给定不同的用户情境隐类和服务情境隐类时K个指标偏好的正态分布均值和方差
其中l表示历史训练样本的编号,L表示训练样本的总数,i,p表示用户隐类的标号,j,q表示服务情境隐类的编号,u,e表示单个用户和单则服务情境,分别表示用户隐类和服务情境隐类,k表示QoS指标的编号;
(4)检查模型参数是否收敛,若收敛,结束并保存模型参数,若不收敛,返回(2)执行。
6.根据权利要求5所述的基于隐语义概率模型的个性化服务推荐方法,其特征在于:步骤6中利用已训练的隐语义概率模型预测用户指标偏好的实现方式如下:
(1)用户ut登陆服务推荐***,提供需要进行服务推荐的服务情境et
(2)推荐***获取用户的个人数据及其提供的服务情境信息,用下面的公式对该用户在该服务情境下的各个QoS指标偏好进行独立预测:
R k ( e t , u t ) = ∫ 0 1 r k P ( e t , u t , r k ) ∫ 0 1 P ( e t , u t , r k ) dr k dr k ;
其中:
其中ut、et分别表示待预测指标偏好的用户及其所处的服务情境,k表示QoS指标的编号,Rk(et,ut)表示用户ut在服务情境et下对第k个指标偏好的预测值,分别代表用户隐类和服务情境隐类,i表示用户隐类的标号,j表示服务情境隐类的编号,分别表示给定用户情境隐类和服务情境隐类时第k个指标偏好的正态分布均值和方差最后预测得到用户ut在该服务情境et下对各个QoS指标的偏好权重为(R1(et,ut),...,RK(et,ut)),记作
7.根据权利要求6所述的基于隐语义概率模型的个性化服务推荐方法,其特征在于:步骤7中根据预测出的用户个性化的QoS指标偏好,对候选服务进行筛选的过程如下:用户ut在服务情境et下已得到多个功能相似的候选服务,假设每个服务的各QoS指标上的性能可有其他方法得到,记为(q1,q2,...,qK),每一个服务的总得分采用表示,最后根据各个服务的总得分给出服务的排序,作为服务推荐的依据。
CN201310392446.9A 2013-09-02 2013-09-02 一种基于隐语义概率模型的个性化服务推荐***及方法 Expired - Fee Related CN103473291B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310392446.9A CN103473291B (zh) 2013-09-02 2013-09-02 一种基于隐语义概率模型的个性化服务推荐***及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310392446.9A CN103473291B (zh) 2013-09-02 2013-09-02 一种基于隐语义概率模型的个性化服务推荐***及方法

Publications (2)

Publication Number Publication Date
CN103473291A CN103473291A (zh) 2013-12-25
CN103473291B true CN103473291B (zh) 2017-01-18

Family

ID=49798139

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310392446.9A Expired - Fee Related CN103473291B (zh) 2013-09-02 2013-09-02 一种基于隐语义概率模型的个性化服务推荐***及方法

Country Status (1)

Country Link
CN (1) CN103473291B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3684139A4 (en) * 2017-09-30 2020-08-19 Huawei Technologies Co., Ltd. DATA ANALYSIS PROCESS AND DEVICE

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104112366B (zh) * 2014-07-25 2017-02-22 中国科学院自动化研究所 基于隐语义模型的交通信号优化方法
CN104166702B (zh) * 2014-08-04 2017-06-23 浙江财经大学 一种面向服务供应链网络的服务推荐方法
CN104199843B (zh) * 2014-08-07 2017-09-26 蔡剑 一种基于社会网络交互数据的服务排序及推荐方法与***
CN104361023B (zh) * 2014-10-22 2018-01-30 浙江中烟工业有限责任公司 一种情境感知的移动终端烟草信息推送方法
CN104468727B (zh) * 2014-11-06 2018-05-01 北京邮电大学 一种基于方差的服务选择方法
CN104468728B (zh) * 2014-11-06 2017-12-08 北京邮电大学 一种基于信息熵和方差的服务选择方法
US10028116B2 (en) * 2015-02-10 2018-07-17 Microsoft Technology Licensing, Llc De-siloing applications for personalization and task completion services
CN104834967A (zh) * 2015-04-24 2015-08-12 南京邮电大学 泛在网络下基于用户相似度的业务行为预测方法
CN104794367B (zh) * 2015-05-12 2018-01-12 宁波克诺普信息科技有限公司 基于隐语义模型的就医资源评分与推荐方法
US9792281B2 (en) * 2015-06-15 2017-10-17 Microsoft Technology Licensing, Llc Contextual language generation by leveraging language understanding
CN105138508A (zh) * 2015-08-06 2015-12-09 电子科技大学 一种基于偏好扩散的上下文推荐***
CN105260390B (zh) * 2015-09-11 2016-11-16 合肥工业大学 一种面向群组的基于联合概率矩阵分解的项目推荐方法
CN105512323A (zh) * 2015-12-21 2016-04-20 广东省科技基础条件平台中心 一种基于领域特征和隐语义分析的科技资源推荐方法
CN105760950B (zh) * 2016-02-05 2018-09-11 第四范式(北京)技术有限公司 提供或获取预测结果的方法、装置以及预测***
CN107169571A (zh) * 2016-03-07 2017-09-15 阿里巴巴集团控股有限公司 一种特征筛选方法及装置
CN105930406B (zh) * 2016-04-15 2019-03-22 清华大学 一种基于泊松分解的服务推荐方法
CN108629608B (zh) * 2017-03-22 2023-02-24 腾讯科技(深圳)有限公司 用户数据处理方法及装置
US10922717B2 (en) 2017-04-07 2021-02-16 Beijing Didi Infinity Technology And Development Co., Ltd. Systems and methods for activity recommendation
CN108694182B (zh) * 2017-04-07 2021-03-02 北京嘀嘀无限科技发展有限公司 活动推送方法、活动推送装置和服务器
CN106961356B (zh) * 2017-04-26 2020-01-10 中国人民解放军信息工程大学 基于动态QoS和主客观权重的Web服务选取方法及其装置
CN107025311A (zh) * 2017-05-18 2017-08-08 北京大学 一种基于k近邻的贝叶斯个性化推荐方法及装置
CN107330023B (zh) * 2017-06-21 2021-02-12 北京百度网讯科技有限公司 基于关注点的文本内容推荐方法和装置
CN107562632B (zh) * 2017-09-12 2020-08-28 北京奇艺世纪科技有限公司 针对推荐策略的a/b测试方法及装置
CN107885796B (zh) * 2017-10-27 2020-04-17 阿里巴巴集团控股有限公司 信息推荐方法及装置、设备
CN108182229B (zh) * 2017-12-27 2022-10-28 上海科大讯飞信息科技有限公司 信息交互方法及装置
CN108763251B (zh) * 2018-04-02 2021-06-01 创新先进技术有限公司 核身产品的个性化推荐方法及装置和电子设备
CN108287904A (zh) * 2018-05-09 2018-07-17 重庆邮电大学 一种基于社会化卷积矩阵分解的文档上下文感知推荐方法
CN109032591B (zh) * 2018-06-21 2021-04-09 北京航空航天大学 一种基于元学习的众包软件开发者推荐方法
EP3655840B1 (en) 2018-09-27 2024-01-17 Google LLC Analyzing web pages to facilitate automatic navigation
WO2020106706A1 (en) 2018-11-19 2020-05-28 Siemens Aktiengesellschaft Object marking to support tasks by autonomous machines
CN111611486B (zh) * 2020-05-15 2021-03-26 北京博海迪信息科技有限公司 基于在线教育大数据的深度学习样本标注方法
CN113094589B (zh) * 2021-04-30 2024-05-28 中国银行股份有限公司 智能服务推荐方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101414296A (zh) * 2007-10-15 2009-04-22 日电(中国)有限公司 自适应服务推荐设备及方法、自适应服务推荐***及方法
US8145636B1 (en) * 2009-03-13 2012-03-27 Google Inc. Classifying text into hierarchical categories
CN102819575A (zh) * 2012-07-20 2012-12-12 南京大学 一种用于Web服务推荐的个性化搜索方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020198882A1 (en) * 2001-03-29 2002-12-26 Linden Gregory D. Content personalization based on actions performed during a current browsing session

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101414296A (zh) * 2007-10-15 2009-04-22 日电(中国)有限公司 自适应服务推荐设备及方法、自适应服务推荐***及方法
US8145636B1 (en) * 2009-03-13 2012-03-27 Google Inc. Classifying text into hierarchical categories
CN102819575A (zh) * 2012-07-20 2012-12-12 南京大学 一种用于Web服务推荐的个性化搜索方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3684139A4 (en) * 2017-09-30 2020-08-19 Huawei Technologies Co., Ltd. DATA ANALYSIS PROCESS AND DEVICE

Also Published As

Publication number Publication date
CN103473291A (zh) 2013-12-25

Similar Documents

Publication Publication Date Title
CN103473291B (zh) 一种基于隐语义概率模型的个性化服务推荐***及方法
CN110457589B (zh) 一种车辆推荐方法、装置、设备及存储介质
CN111061946B (zh) 场景化内容推荐方法、装置、电子设备及存储介质
CN103544623B (zh) 一种基于用户偏好特征建模的Web 服务推荐方法
Bobbio et al. Analysis of large scale interacting systems by mean field method
CN103761254B (zh) 多领域服务主题匹配推荐方法
CN110674407A (zh) 基于图卷积神经网络的混合推荐方法
CN111611488B (zh) 基于人工智能的信息推荐方法、装置、电子设备
CN110909182A (zh) 多媒体资源搜索方法、装置、计算机设备及存储介质
CN103971161A (zh) 基于柯西分布量子粒子群的混合推荐方法
Tang et al. Dynamic personalized recommendation on sparse data
CN111949886B (zh) 一种用于信息推荐的样本数据生成方法和相关装置
WO2021208535A1 (zh) 基于自动特征分组的推荐方法及装置
Do et al. Dynamic weighted hybrid recommender systems
Özbal et al. A content-boosted collaborative filtering approach for movie recommendation based on local and global similarity and missing data prediction
Pujahari et al. Model-based collaborative filtering for recommender systems: An empirical survey
Li et al. From reputation perspective: a hybrid matrix factorization for qos prediction in location‐aware mobile service recommendation system
CN111078997B (zh) 一种资讯推荐方法及装置
Ali et al. Dynamic context management in context-aware recommender systems
CN114372680A (zh) 一种基于工人流失预测的空间众包任务分配方法
CN113469752A (zh) 内容推荐方法、装置、存储介质及电子设备
He et al. A time-context-based collaborative filtering algorithm
Rohilla et al. An Empirical Framework for Recommendation-based Location Services Using Deep Learning
Paracchini et al. Weighting and aggregation of indicators for sustainability impact assessment in the SENSOR context
Abdullah et al. An integrated-model qos-based graph for web service recommendation

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170118

Termination date: 20190902