CN106375369B - 基于用户行为分析的移动Web业务推荐方法及协同推荐*** - Google Patents

基于用户行为分析的移动Web业务推荐方法及协同推荐*** Download PDF

Info

Publication number
CN106375369B
CN106375369B CN201610688083.7A CN201610688083A CN106375369B CN 106375369 B CN106375369 B CN 106375369B CN 201610688083 A CN201610688083 A CN 201610688083A CN 106375369 B CN106375369 B CN 106375369B
Authority
CN
China
Prior art keywords
web
user
feature vector
target user
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610688083.7A
Other languages
English (en)
Other versions
CN106375369A (zh
Inventor
张晖
毛小旺
刘宝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Post and Telecommunication University
Original Assignee
Nanjing Post and Telecommunication University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Post and Telecommunication University filed Critical Nanjing Post and Telecommunication University
Priority to CN201610688083.7A priority Critical patent/CN106375369B/zh
Publication of CN106375369A publication Critical patent/CN106375369A/zh
Application granted granted Critical
Publication of CN106375369B publication Critical patent/CN106375369B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/147Network analysis or design for predicting network behaviour
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/51Discovery or management thereof, e.g. service location protocol [SLP] or web services

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于用户行为分析的移动Web业务推荐方法及协同推荐***,首先构建了Web业务预测模型,并通过智能终端侧用户浏览数据和可穿戴设备侧用户生理数据,寻找与目标用户长期习惯最相似及短期情绪最相似的两个最优关联用户。进而,利用两个最优关联用户数据丰富目标用户预测模型样本库,实现引入噪声最小化的样本丰富机制。设计基于特征向量的Web资源存储机制,根据模型预测结果,实现移动Web业务的准确推荐。该方案通过智能终端和可穿戴设备间交互合作,将可穿戴设备侧生理数据进行应用重构,从多视角、多维度分析用户行为,实现业务的准确预测与推荐,进而提升用户的使用体验。

Description

基于用户行为分析的移动Web业务推荐方法及协同推荐***
技术领域
本发明涉及一种基于用户行为分析的移动Web业务推荐方法及协同推荐***,属于推荐技术领域。
背景技术
因应于移动互联业务的爆发式增长趋势,业务推荐引擎,作为解决用户信息过载及信息迷向问题的有效工具,通过获取和预测移动用户潜在偏好,为用户从海量信息中筛选感兴趣业务,并实现业务预下载,达到均衡网络负载和减小业务时延之效果。业务推荐引擎做出准确预测的前提需要大量用户行为样本作为支撑,但是局限于单用户的样本数量不足、种类受限等问题,导致了业务预测准确度低,推荐质量不佳。
虽然已有相关技术来解决上述问题,如使用基于经验的协同过滤和基于模型的协同过滤的方法,通过寻找关联用户,利用相关用户数据丰富目标用户样本库。但仍存在一些问题,该类方法一般都是将所有关联用户的预测结果进行加权融合,这必将引入其他用户的样本噪声,导致预测精度不高,甚至变得更低,亦无法为用户提供良好的业务体验。
发明内容
本发明所要解决的技术问题是提供一种基于用户行为分析的移动Web业务推荐方法及协同推荐***,该方法首先构建了Web业务预测模型,并通过智能终端侧用户浏览数据和可穿戴设备侧用户生理数据,寻找与目标用户长期习惯最相似及短期情绪最相似的两个最优关联用户。进而,利用两个最优关联用户数据丰富目标用户预测模型样本库,实现引入噪声最小化的样本丰富机制。设计基于特征向量的Web资源存储机制,根据模型预测结果,实现移动Web业务的准确推荐。该方案通过智能终端和可穿戴设备间交互合作,将可穿戴设备侧生理数据进行应用重构,从多视角、多维度分析用户行为,实现业务的准确预测与推荐,进而提升用户的使用体验。
本发明为解决上述技术问题采用以下技术方案:
一方面,本发明提供一种基于用户行为分析的移动Web业务推荐方法,周期性向目标用户进行移动Web业务推荐,该方法包括以下具体步骤:
步骤1,设计Web特征向量,建立Web URL与Web特征向量之间的映射表,具体为:
1.1,对Web URL的域名进行解析,提取对应该Web的第一和第二特征值,其中,第一特征值为企业或组织机构名称,第二特征值为业务类型;对Web URL的资源路径名进行解析,提取对应该Web的第三特征值,第三特征值为业务类型下的具体业务形式;从而得到Web特征向量,其元素即为第一至第三特征值;
1.2,根据提取的Web URL信息,建立Web URL与Web特征向量之间的映射表;
步骤2,建立基于Web特征向量的Web资源库,具体为:
2.1,提取所有预存Web资源的URL信息,查询Web URL与Web特征向量之间的映射表,生成相应的Web特征向量;
2.2,按照Web特征向量中的特征值,对所有预存Web资源进行分类存储,即同一存储路径下对应同一公司或组织机构的同一业务类型,从而建立Web资源库;
步骤3,根据目标用户的历史Web浏览记录,构建Web业务预测模型,具体为:
3.1,根据目标用户的历史Web浏览记录,查询Web URL与Web特征向量之间的映射表,得到目标用户的历史Web浏览记录对应的若干Web特征向量;
3.2,建立表征目标用户Web浏览记录的树形结构,该树形结构不存在根结点,且任意两个不同结点可互为后续结点,其中,每个结点表征一个特征向量,且当前结点中存储有当前结点向其他结点转移的次数;该树形结构即为Web业务预测模型;
步骤4,根据目标用户当前周期内的浏览记录,向目标用户进行Web业务推荐,具体为:
4.1,提取目标用户当前周期开始时刻至当前时刻的浏览记录,查询Web URL与Web特征向量之间的映射表,生成相应的Web特征向量;
4.2,按照浏览时序,将4.1生成的Web特征向量与步骤3中的Web业务预测模型进行匹配,若所有Web特征向量及相互间的转移关系均能够在Web业务预测模型中找到对应结点以及转移路径,则以目标用户最近时刻的Web特征向量在对应结点中转移次数最高的Web特征向量作为预测结果,执行4.3;否则,不执行预测,等待下一周期;
4.3,根据预测结果,查询Web资源库,找到与预测结果最匹配的存储路径,将该存储路径下的最新Web资源推荐给目标用户。
作为本发明的进一步优化方案,周期性更新Web资源库,并记录更新时间。
作为本发明的进一步优化方案,该方法还包括周期性对Web业务预测模型进行更新,具体为:
若当前周期内,目标用户有浏览记录,则根据当前周期内目标用户浏览记录,查询Web URL与Web特征向量之间的映射表,生成相应的Web特征向量,按照步骤3.2利用生成的Web特征向量及相互间的转移关系对Web业务预测模型进行更新;同时,分别比对当前周期内目标用户与其长期习惯最相似关联用户、短期情绪最相似关联用户之间的浏览记录的相似度,若目标用户与长期习惯最相似关联用户之间的浏览记录的相似度高于目标用户与短期情绪最相似关联用户之间的浏览记录的相似度,则长期习惯重要因子w1加0.1,短期情绪重要因子w2减0.1,否则短期情绪重要因子w2加0.1,长期习惯重要因子w1减0.1;
若当前周期内,目标用户没有浏览记录,则根据当前周期内目标用户的长期习惯最相似关联用户和短期情绪最相似关联用户的浏览记录,查询Web URL与Web特征向量之间的映射表,生成相应的Web特征向量,按照步骤3.2利用生成的Web特征向量及相互间的转移关系对Web业务预测模型进行更新,其中,对应长期习惯最相似关联用户的Web特征向量之间的转移次数加w1,对应短期情绪最相似关联用户的Web特征向量之间的转移次数加w2
作为本发明的进一步优化方案,w1、w2的初始值都为0.5,且0≤w1≤1,0≤w2≤1。
作为本发明的进一步优化方案,该方法还包括周期性获取目标用户的长期习惯最相似关联用户和短期情绪最相似关联用户,具体为:
1)确定目标用户的关联用户集Ψ,其中,关联用户即为目标用户的移动社交圈的联系人;
2)周期性寻找与目标用户m的长期习惯最相似的关联用户u*,具体为:
一个周期内,有浏览记录的关联用户集为Λ,其中,首先,统计该周期之前的N1×T时间段内目标用户m与任一关联用户u的浏览记录,并生成相应的特征向量集合,其中,u∈Λ,N1≥100,T为周期;其次,按照浏览时序,统计目标用户m与关联用户u的特征向量集合中特征向量转移对的出现频率,并对统计结果进行排序;再次,根据排序后的统计结果,分别计算任一关联用户u与目标用户m的长期习惯相似度R(m,u);最后,与目标用户m的长期习惯相似度最高的关联用户即为长期习惯最相似的关联用户u*
3)周期性寻找与目标用户m短期情绪最相似的关联用户v*,具体为:
一个周期内,有浏览记录的关联用户集为其中,首先,统计该周期之前的N2×T时间段内目标用户m与任一关联用户v的各项生理数据集合,其中,N2≤10;其次,对目标用户m和关联用户v的第j种生理数据集合中的生理数据,分别计算目标用户m与任一关联用户v之间的第j种生理数据的相似度ρj(m,v);再次,目标用户m与任一关联用户v的短期情绪相似度ρ(m,v)其中,1≤j≤L,L为所统计生理数据种类;最后,与目标用户m的短期情绪相似度最高的关联用户即为短期情绪最相似的关联用户v*
作为本发明的进一步优化方案,采用Kendall秩相关系数或Spearman秩相关系数分别计算任一关联用户u与目标用户m的长期习惯相似度R(m,u)
作为本发明的进一步优化方案,采用Pearson相关系数或余弦相似度函数分别计算目标用户m与任一关联用户v之间的第j种生理数据的相似度ρj(m,v)
另一方面,本发明还提供一种基于用户行为分析的移动Web业务协同推荐***,包括:可穿戴终端、用户终端、网关、服务器,其中,
可穿戴终端包括生理数据采集模块和第一无线传输模块,其中,生理数据采集模块实时采集用户的各项生理数据,通过第一无线传输模块传输至用户终端;
用户终端包括第二无线传输模块、浏览器模块、Web特征向量生成模块、本地数据缓存模块、推荐模块、第三无线传输模块,其中,第二无线传输模块用于与第一无线传输模块进行无线通信;浏览器模块用于收集用户的浏览记录,显示推荐业务;Web特征向量生成模块用于对用户的浏览记录进行特征提取,生成Web特征向量;本地数据缓存模块,用于缓存用户浏览记录及其对应的Web特征向量、用户的生理数据;推荐模块用于接收来自网关的推荐业务,并在格式转换后以弹窗形式在浏览器模块中显示;第三无线传输模块用于用户终端与网关的无线通信;
网关包括:第四无线传输模块、用户IP管理模块、推荐业务缓存模块,其中,第四无线传输模块用于用户终端与网关的无线通信;用户IP管理模块,用于为所接入用户分配IP地址;推荐业务缓存模块,用于缓存来自服务器的推荐业务,并周期性将推荐业务发送至用户终端;
服务器包括数据库模块、预测模型构建及更新模块、业务推荐模块、Web资源库,其中,数据库模块,用于存储代表用户浏览行为的特征向量及各项生理数据;预测模型构建及更新模块,用于构建Web业务预测模型,并对模型进行周期性更新;业务推荐模块用于执行Web业务预测,并根据预测结果从Web资源库中寻找相似度高的Web资源进行推荐;Web资源库,用于根据Web特征向量对Web资源进行存储。
作为本发明的进一步优化方案,网关与服务器之间通过有线接口模块连接。
作为本发明的进一步优化方案,可穿戴终端还包括数据预处理模块,用于对采集的生理数据进行清洗与过滤,去除采集错误与误差。
本发明采用以上技术方案与现有技术相比,具有以下技术效果:本发明提出的一种基于用户行为分析的移动Web业务推荐方法及可穿戴协同推荐引擎,通过构建长期习惯指标和短期情绪指标,寻找与目标用户长期习惯及短期情绪最相似的两个最优关联用户,实现引入噪声最小的样本丰富机制,此外,对Web进行多维特征提取,不但改善了预测模型的存储结构,还提高了引擎的推荐质量。通过本发明提供的移动Web推荐方法及推荐引擎,一方面能够解决用户在移动互联环境下,信息过载及迷向问题,另一方面,能够实现移动Web业务预下载,以均衡网络负载及减小业务时延,进而提升用户的业务体验。
附图说明
图1为本发明提供的一种基于用户行为分析的移动Web业务推荐方法流程图。
图2为本发明提供的一种Web业务预测模型数据更新策略示意图。
图3为本发明提供的一种Web业务预测模型示意图。
图4为本发明提供的基于用户行为分析的移动Web业务协同推荐***模块化结构示意图。
具体实施方式
下面结合附图以及具体实施例对本发明的技术方案做进一步的详细说明:
本发明提供了一种基于用户行为分析的移动Web业务推荐方法,具体如下:
一,设计Web特征向量,提取网页URL信息,建立Web URL与Web特征向量之间的映射表;
1.1,对Web URL的域名进行解析,提取对应该Web的第一和第二特征值,其中,第一特征值为企业或组织机构名称,第二特征值为业务类型;对Web URL的资源路径名进行解析,提取对应该Web的第三特征值,第三特征值为业务类型下的具体业务形式;从而得到Web特征向量,其元素即为第一至第三特征值;
1.2,根据提取的Web URL信息,建立Web URL与Web特征向量之间的映射表。
二,建立基于Web特征向量的Web资源库,具体为:
2.1,提取所有预存Web资源的URL信息,查询Web URL与Web特征向量之间的映射表,生成相应的Web特征向量;
2.2,按照Web特征向量中的特征值,对所有预存Web资源进行分类存储,即同一存储路径下对应同一公司或组织机构的同一业务类型,从而建立Web资源库。同时还可以周期性更新资源库,并添加更新时间标签。
三,根据目标用户历史Web浏览记录,构建Web业务预测模型。
所述Web业务预测模型为一种特殊的树形结构,该树形结构不存在根结点,且任意两个不同结点可互为后续结点,树中的每一个结点代表了一种特征向量,结点中存储了当前业务特征向量到另一种业务特征向量的转移情况。
3.1,根据目标用户的历史Web浏览记录,查询Web URL与Web特征向量之间的映射表,得到目标用户的历史Web浏览记录对应的若干Web特征向量。
3.2,对得到的若干Web特征向量,按照各特征向量时序性,依次查找预测模型中是否包含对应结点;若包含,则在对应结点中,记录该特征向量到下一组特征向量的转移情况,相应转移次数加1;若不包含,则新建对应结点,并记录该特征向量到下一组特征向量的转移情况,相应转移次数加1。
四,周期性对Web业务预测模型进行更新(周期T<60min):
首先介绍目标用户m的长期习惯最相似关联用户u*、短期情绪最相似关联用户v*,顾名思义,这两个最优用户即为一个周期内,与目标用户m长期习惯最相似的关联用户以及与目标用户m短期情绪最相似的关联用户。其中,不同用户的长期习惯相似度,通过用户的Web浏览行为的相似度来衡量,不同用户的短期情绪相似度通过用户的生理参数的相似度来衡量。由于用户的Web浏览行为取决于长期习惯和短期情绪两个因素,即在目标用户m没有浏览行为的周期内,可以用长期习惯最相似关联用户和短期情绪最相似关联用户的浏览行为来代表目标用户m的浏览行为。Web业务预测模型的更新的时间为每个周期的结束时刻。
4.1,周期性寻找目标用户的长期习惯最相似关联用户u*、短期情绪最相似关联用户v*,具体为:
首先,寻找关联用户集Ψ:目标用户m的移动社交圈的联系人用户,即为关联用户集中的关联用户。这里的寻找关联用户集Ψ的方法,包括但不限定于:手机注册方式,通过相关权限授权,以获取目标用户手机通讯录联系人作为目标用户关联用户集;移动社交账号登入方式,通过相关权限授权,以获取目标用户移动社交好友作为目标用户关联用户集。
其次,周期性寻找与目标用户m长期习惯最相似的关联用户u*:一个周期内,有浏览行为产生的关联用户集为Λ,其中,首先,统计该周期之前的N1×T时间段内,目标用户m与任一关联用户u产生的Web业务浏览记录,并生成相应的特征向量集合,其中,u∈Λ,N1≥100;其次,按照浏览时序,统计目标用户m与任一关联用户u浏览记录中各特征向量转移对出现频率,即前一个特征向量转移到后一个特征向量的转移次数;进而,对目标用户m与关联用户u的统计结果进行排序;最后,对于两组排序结果,利用相似度函数,计算关联用户u与目标用户m的长期习惯相似度R(m,u);这里所述的相似度函数包括但不限定于,如Kendall秩相关系数、Spearman秩相关系数等。计算关联用户集Λ中,所有关联用户与目标用户m的相似度,并建立长期习惯相似的用户最优化模型,寻找与目标用户m长期习惯最相似的关联用户u*,模型如下:
最后,周期性寻找与目标用户m短期情绪最相似的关联用户v*:一个周期内,有浏览行为产生的关联用户集为其中,首先,统计该周期之前的N2×T时间段内,目标用户m与关联用户v的各项生理数据集合,其中,v∈Λ,N2≤10;其次,对目标用户m和关联用户v的第j种生理数据集合中的生理数据,利用相似度函数,计算用户u与目标用户v的第j种生理数据相似度ρj(m,v),这里所述的相似度函数包括但不限定于,Pearson相关系数,余弦相似度函数等;最后,对各项生理数据相似度统计平均,得到目标用户m与用户v的短期情绪相似度ρ(m,v)其中,1≤j≤L,L为所统计生理数据种类;计算关联用户集中,所有用户与目标用户m的短期情绪相似度,并建立短期情绪相似的用户最优化模型,寻找与目标用户m短期情绪最相似的关联用户v*,模型如下:
4.2,判断当前周期内,目标用户m是否有浏览行为产生;若有,执行步骤4.3,否则执行步骤4.4。
4.3,当前周期内,目标用户m有Web浏览行为产生,则进行以下两项操作:第一,利用目标用户的浏览记录更新Web业务预测模型:根据目标用户m在当前周期的浏览记录,查询Web URL与Web特征向量映射表,生成特征向量,并利用生成的特征向量对Web业务预测模型进行更新,更新过程同步骤3.2,相应转移次数加1;第二,更新长期习惯重要因子w1及短期情绪重要因子w2:对比用户m与长期习惯最相似关联用户u*、短期情绪最相似关联用户v*在当前周期内所生成Web特征向量的相似度,若m与u*的特征向量相似度更高,则长期习惯重要因子w1增加0.1,短期情绪重要因子w2减小0.1;若m与v*相似度更高,则w1减小0.1,w2增加0.1。其中,w1、w2的初始值都为0.5,且0≤w1≤1,0≤w2≤1。
4.4,当前周期内,目标用户m没有Web浏览行为产生,则利用长期习惯最相似关联用户u*、短期情绪最相似关联用户v*的浏览记录更新Web业务预测模型:首先,根据长期习惯最相似关联用户u*、短期情绪最相似关联用户v*在该周期内的浏览记录,查询网页URL与Web特征向量映射表,生成对应特征向量;最后,利用生成的特征向量对模型样本库进行更新,更新过程同步骤3.2,相应转移次数分别加w1、w2
五,根据目标用户当前周期内的浏览记录,向目标用户进行Web业务推荐,实现移动Web业务推荐。
首先,提取用户当前周期开始时刻至当前时刻内的浏览记录,查询网页URL与Web特征向量映射表,生成相应特征向量;其次,对生成的特征向量按照时序性,依次与模型中的结点进行匹配;若所有特征向量都能在模型中找到对应的结点以及转移路径,即浏览路径完全匹配,则以最后一组特征向量所对应结点中,转移次数最高的特征向量作为预测结果;若浏览路径不完全匹配,则不执行预测。
本发明还提供了一种基于用户行为分析的移动Web业务协同推荐***,如图4所示,包括:
可穿戴终端,用于采集用户的各项生理数据,并经过粗大误差数据剔除后发送至智能终端,具体包括:无线传输模块,用于采用WIFI、蓝牙等无线技术传输数据,采用UDP分组传输信令,建立与用户终端的协同通信;生理数据采集模块,利用各种传感器实时采集用户的各项生理数据,所述传感器包括但不限于,如体温传感器,脉搏传感器,心率传感器等,与之对应的生理参数包括但不限定于,如体温、脉搏、心率等;数据预处理模块,用于对所采集的生理数据进行清洗与过滤,去除采集错误与误差。
用户终端,用于获取用户业务数据及生理数据,发送至网关并接收来自网关的推荐信息,具体包括:无线传输模块,借助WIFI、蓝牙等无线技术,采用UDP分组,建立与可穿戴终端的协同通信;浏览器模块,用于收集用户的浏览记录,并显示来自服务器的推荐业务;Web特征向量生成模块,用于对用户的每条浏览记录进行特征提取,生成Web特征向量;本地数据缓存模块,用于缓存用户在一个周期T内,一条完整的浏览记录所包含的特征向量以及用户的生理数据;推荐模块,用于接收来自网关的推荐信息,进行信息格式的转换,对转换后推荐信息以弹窗形式在浏览器界面显示;无线传输模块,用于采用WiFi、3G或4G等无线技术,与网关进行用户数据及推荐业务的交互。
网关,用于对各智能终端进行IP管理,接收来自各智能终端的业务数据及生理数据,为其添加IP信息后转发至服务器,并缓存来自服务器的推荐业务,具体包括:用户IP管理模块,用于为所接入用户分配IP地址;无线传输模块,用于接收各个用户终端的用户数据,并在接收到数据中添加对应IP信息;有线接口模块,用于提供网关和服务器相连接的物理接口,实现用户数据的传送与推荐业务的接收;推荐业务缓存模块,用于缓存来自服务器的推荐业务,并周期性将推荐信息发送至智能终端。
服务器,用于存储来自网关的用户数据,对目标用户构建预测模型,根据预测结果进行业务推荐,并将推荐结果发送至网关缓存,具体包括:有线接口模块,用于提供网关和服务器相连接的物理接口,实现用户数据的接收与推荐业务的传送;数据库模块,用于存储代表用户浏览行为的特征向量及各项生理数据;预测模型构建及更新模块,用于构建Web业务为预测模型,并通过用户数据对模型进行实时更新;业务推荐模块,用于执行业务预测算法,并根据预测结果从Web文件库中寻找相似度高的Web资源进行推荐;Web文件库,根据度Web特征存储规则,进行Web资源的存储。
如图1所示的一种基于用户行为分析的移动Web业务推荐方法流程图,具体执行步骤如下:
步骤S101,初始化各种参数,如业务周期T、用户关联用户集Ψ、统计周期系数N1、N2、长期习惯重要因子w1及短期情绪重要因子w2等。
步骤S102,设计Web特征向量,提取网页URL信息,并根据所提取的URL信息建立WebURL与Web特征向量之间的映射表。
其中,Web特征向量的包括三个维度,第一个维度代表企业或组织机构、第二个维度代表Web业务类型、第三个维度代表业务类型下的具体业务形式;而对一个网页提取其URL信息过程为:通过域名信息可得到特征向量前两个维度的信息,通过资源路径名解析可得到特征向量第三个维度的信息,如对网址http://sports.sina.com.cn/nba/进行解析,可得到一组特征向量(新浪,体育,nba),即可得到该网址与特征向量(新浪,体育,nba)之间的映射关系,并以此建立映射表。
步骤S103,根据目标用户历史Web浏览记录,构建Web业务预测模型。
步骤S104,通过用户长期习惯相似度及短期情绪相似度构建最优化模型,寻找与目标用户m长期习惯最相似的关联用户u*及短期情绪最相似的关联用户v*,具体过程如下:
不同用户的长期习惯相似度通过用户的Web浏览行为相似度来衡量,所述寻找与目标用户长期习惯最相似的关联用户具体方法为:一个周期T内,有业务产生的关联用户集为Λ,统计该周期之前的N1×T时间段内,目标用户m与关联用户u产生的Web业务浏览集合,集合中的每个元素代表一种业务类型,其中,u∈Λ,针对业务的时序性,统计两个用户浏览记录中业务转移对,即前一个业务跳转到后一个业务,跳转次数;首先,按照目标用户m的统计结果进行排序,业务转移频率最高的一对业务类型的秩次记为1,并依次类推;其次,用户u根据自己的统计结果,对应于目标用户m的排序方式进行排序,得到一组秩次为乱序的序列,根据该序列,利用Kendall秩相关系数,计算用户u与目标用户m的长期习惯相似度R(m,u)
p为用户u按照目标用户m排序方式排序后,每个秩次之后出现同序对数量的累加和;n为目标用户m在N1×T时间段内的浏览记录中出现的业务转移对数量。计算关联用户集Λ中,所有用户与目标用户m的相似度,并建立长期习惯相似的用户最优化模型,寻找与目标用户m长期习惯最相似的关联用户u*,模型如下:
不同用户的短期情绪相似度通过用户的生理参数相似度来衡量,寻找与目标用户短期情绪最相似的关联用户具体方法为:一个周期T内,有业务产生的关联用户集为Λ,统计该周期之前的N2×T时间段内,目标用户m与关联用户v的各项生理数据集合,生理数据如体温、血压、脉搏、心跳等。目标用户m和关联用户v的第j种生理数据,分别记为Sj1={aj1,aj2,..aji..,ajN}和Sj2={bj1,bj2,..bji..,bjN},其中,N为目标用户m和关联用户v在N2×T时间段内,有业务产生的次数的最小值,且N≤N2,1≤i≤N,1≤j≤L,L为所测生理数据种类;aji及bji分别为目标用户m和关联用户v在时间N2×T内,第i次采集的第j种生理数据;对两个集合中的元素,利用Pearson相关系数,计算用户u与目标用户v的第j种生理数据相似度ρj(m,v)
分别为集合Sj1和Sj2的均值;a'ji、b'ji分别为aji和bji的标准化形式,
分别为的标准化形式,
则目标用户m与用户v的短期情绪相似度ρ(m,v)
计算关联用户集Λ中,所有用户与目标用户m的短期情绪相似度,并建立短期情绪相似的用户最优化模型,寻找与目标用户m短期情绪最相似的关联用户v*,模型如下:
步骤S105,利用目标用户m及两个最优用户的浏览记录,周期性对Web业务预测模型进行更新。具体过程如下:
首先,判断当前周期内,目标用户m是否有浏览行为产生;若有,则进行以下两项操作:第一,利用目标用户的浏览记录更新Web业务预测模型:根据目标用户m在该周期的浏览记录,查询Web URL与Web特征向量映射表,生成特征向量,并利用生成的特征向量对Web业务预测模型进行更新,相应转移次数加1;第二,更新长期习惯重要因子w1及短期情绪重要因子w2:对比用户m与两个最优用户在该周期内所生成Web特征向量的相似度,若用户m与用户u*的特征向量相似度更高,则长期习惯重要因子w1增加0.1,短期情绪重要因子w2减小0.1;若用户m与用户v*相似度更高,则w1减小0.1,w2增加0.1;其中,w1、w2的初始值都为0.5,且0≤w1≤1,0≤w2≤1。
若没有,则利用两个最优用户的浏览记录更新Web业务预测模型:首先,根据两个最优用户在该周期内的浏览记录,查询Web URL与Web特征向量之间的映射表,生成对应特征向量;最后,利用生成的特征向量对Web业务预测模型进行更新,相应转移次数加w1、w2
步骤S106,利用Web业务预测模型,执行预测算法,并根据预测结果,实现移动Web业务推荐。
其中,预测过程为:在Web业务预测模型中,每个存储结点代表一种业务特征向量,而其存储的是当前特征向量到另一种特征向量的转移情况,即一种业务类型转移到另一种业务类型。在执行预测时,首先对目标用户的浏览记录进行特征分析,得到与其对应的多组特征向量,并根据Web业务预测模型中相应结点,存储的转移情况,按照各组特征向量时序性依次查找,每个结点是否含有与之对应的转移特征向量。若有,则以最后一组特征向量所对应结点中,转移频率最高的特征向量作为预测结果,若没有,则该浏览记录只作为更新信息,不提供预测。
其中,推荐过程为:根据预测结果,从预存Web资源库中,找到与预测特征向量各维信息最匹配的资源路径,选择该存储路径下最新更新的Web资源推送给目标用户。
如图2所示的一种Web业务预测模型更新策略示意图,具体更新过程如下:
首先判断某个周期内目标用户m是否有浏览行为产生。若有,则直接将浏览记录中的特征向量转移情况存入Web业务预测模型,且统计频度加1。进而,更新长期习惯重要因子w1及短期情绪重要因子w2,具体方法为:寻找该周期内有业务产生的关联用户中,与目标用户m长期习惯相似度最高的用户u*及短期情绪相似度最高的用户v*,判断他们的业务类型是否与用户m业务类型相同。若全相同或全不同,则w1、w2不变;若目标用户m仅与长期习惯相似度最高用户u*业务类型相同,则w1增加0.1,w2减小0.1;否则w1减小0.1,w2增加0.1。
若目标用户m该周期内没有浏览行为,则判断该周期内关联用户中是否有新浏览行为产生。若没有,则Web业务预测模型不更新;若有,则寻找该周期内与目标用户m长期习惯相似度最高的用户u*及短期情绪相似度最高的用户v*,利用他们的业务行为代表目标用户m由长期习惯因素导致的业务行为及短期情绪导致的业务行为,相应统计频度加w1、w2
如图3所述的一种Web业务预测模型示意图,具体构建过程如下:
预测模型中每个存储结点代表一种业务类型,结点存储了当前业务特征向量到另一种业务特征向量的转移情况,首先,根据用户的Web浏览记录,生成Web特征向量;其次,将生成的Web特征向量在模型中寻找相应存储结点,若结点存在,则更新该结点存储数据;若结点不存在,则新建之,并更新结点存储数据。
以上所述,仅为本发明中的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉该技术的人在本发明所揭露的技术范围内,可理解想到的变换或替换,都应涵盖在本发明的包含范围之内,因此,本发明的保护范围应该以权利要求书的保护范围为准。

Claims (10)

1.基于用户行为分析的移动Web业务推荐方法,周期性向目标用户进行移动Web业务推荐,其特征在于,包括以下具体步骤:
步骤1,设计Web特征向量,建立Web URL与Web特征向量之间的映射表,具体为:
1.1,对Web URL的域名进行解析,提取对应该Web的第一和第二特征值,其中,第一特征值为企业或组织机构名称,第二特征值为业务类型;对Web URL的资源路径名进行解析,提取对应该Web的第三特征值,第三特征值为业务类型下的具体业务形式;从而得到Web特征向量,其元素即为第一至第三特征值;
1.2,根据提取的Web URL信息,建立Web URL与Web特征向量之间的映射表;
步骤2,建立基于Web特征向量的Web资源库,具体为:
2.1,提取所有预存Web资源的URL信息,查询Web URL与Web特征向量之间的映射表,生成相应的Web特征向量;
2.2,按照Web特征向量中的特征值,对所有预存Web资源进行分类存储,即同一存储路径下对应同一公司或组织机构的同一业务类型,从而建立Web资源库;
步骤3,根据目标用户的历史Web浏览记录,构建Web业务预测模型,具体为:
3.1,根据目标用户的历史Web浏览记录,查询Web URL与Web特征向量之间的映射表,得到目标用户的历史Web浏览记录对应的若干Web特征向量;
3.2,建立表征目标用户Web浏览记录的树形结构,该树形结构不存在根结点,且任意两个不同结点可互为后续结点,其中,每个结点表征一个特征向量,且当前结点中存储有当前结点向其他结点转移的次数;该树形结构即为Web业务预测模型;
步骤4,根据目标用户当前周期内的浏览记录,向目标用户进行Web业务推荐,具体为:
4.1,提取目标用户当前周期开始时刻至当前时刻的浏览记录,查询Web URL与Web特征向量之间的映射表,生成相应的Web特征向量;
4.2,按照浏览时序,将4.1生成的Web特征向量与步骤3中的Web业务预测模型进行匹配,若所有Web特征向量及相互间的转移关系均能够在Web业务预测模型中找到对应结点以及转移路径,则以目标用户最近时刻的Web特征向量在对应结点中转移次数最高的Web特征向量作为预测结果,执行4.3;否则,不执行预测,等待下一周期;
4.3,根据预测结果,查询Web资源库,找到与预测结果最匹配的存储路径,将该存储路径下的最新Web资源推荐给目标用户。
2.根据权利要求1所述的基于用户行为分析的移动Web业务推荐方法,其特征在于,周期性更新Web资源库,并记录更新时间。
3.根据权利要求1所述的基于用户行为分析的移动Web业务推荐方法,其特征在于,该方法还包括周期性对Web业务预测模型进行更新,具体为:
若当前周期内,目标用户有浏览记录,则根据当前周期内目标用户浏览记录,查询WebURL与Web特征向量之间的映射表,生成相应的Web特征向量,按照步骤3.2利用生成的Web特征向量及相互间的转移关系对Web业务预测模型进行更新;同时,分别比对当前周期内目标用户与其长期习惯最相似关联用户、短期情绪最相似关联用户之间的浏览记录的相似度,若目标用户与长期习惯最相似关联用户之间的浏览记录的相似度高于目标用户与短期情绪最相似关联用户之间的浏览记录的相似度,则长期习惯重要因子w1加0.1,短期情绪重要因子w2减0.1,否则短期情绪重要因子w2加0.1,长期习惯重要因子w1减0.1;
若当前周期内,目标用户没有浏览记录,则根据当前周期内目标用户的长期习惯最相似关联用户和短期情绪最相似关联用户的浏览记录,查询Web URL与Web特征向量之间的映射表,生成相应的Web特征向量,按照步骤3.2利用生成的Web特征向量及相互间的转移关系对Web业务预测模型进行更新,其中,对应长期习惯最相似关联用户的Web特征向量之间的转移次数加w1,对应短期情绪最相似关联用户的Web特征向量之间的转移次数加w2
4.根据权利要求3所述的基于用户行为分析的移动Web业务推荐方法,其特征在于,w1、w2的初始值都为0.5,且0≤w1≤1,0≤w2≤1。
5.根据权利要求3所述的基于用户行为分析的移动Web业务推荐方法,其特征在于,该方法还包括周期性获取目标用户的长期习惯最相似关联用户和短期情绪最相似关联用户,具体为:
1)确定目标用户的关联用户集Ψ,其中,关联用户即为目标用户的移动社交圈的联系人;
2)周期性寻找与目标用户m的长期习惯最相似的关联用户u*,具体为:
一个周期内,有浏览记录的关联用户集为Λ,其中,首先,统计该周期之前的N1×T时间段内目标用户m与任一关联用户u的浏览记录,并生成相应的特征向量集合,其中,u∈Λ,N1≥100,T为周期;其次,按照浏览时序,统计目标用户m与关联用户u的特征向量集合中特征向量转移对的出现频率,并对统计结果进行排序;再次,根据排序后的统计结果,分别计算任一关联用户u与目标用户m的长期习惯相似度R(m,u);最后,与目标用户m的长期习惯相似度最高的关联用户即为长期习惯最相似的关联用户u*
3)周期性寻找与目标用户m短期情绪最相似的关联用户v*,具体为:
一个周期内,有浏览记录的关联用户集为其中,首先,统计该周期之前的N2×T时间段内目标用户m与任一关联用户v的各项生理数据集合,其中,N2≤10;其次,对目标用户m和关联用户v的第j种生理数据集合中的生理数据,分别计算目标用户m与任一关联用户v之间的第j种生理数据的相似度ρj(m,v);再次,目标用户m与任一关联用户v的短期情绪相似度ρ(m,v)其中,1≤j≤L,L为所统计生理数据种类;最后,与目标用户m的短期情绪相似度最高的关联用户即为短期情绪最相似的关联用户v*
6.根据权利要求5所述的基于用户行为分析的移动Web业务推荐方法,其特征在于,采用Kendall秩相关系数或Spearman秩相关系数分别计算任一关联用户u与目标用户m的长期习惯相似度R(m,u)
7.根据权利要求5所述的基于用户行为分析的移动Web业务推荐方法,其特征在于,采用Pearson相关系数或余弦相似度函数分别计算目标用户m与任一关联用户v之间的第j种生理数据的相似度ρj(m,v)
8.基于用户行为分析的移动Web业务协同推荐***,其特征在于,包括:可穿戴终端、用户终端、网关、服务器,其中,
可穿戴终端包括生理数据采集模块和第一无线传输模块,其中,生理数据采集模块实时采集用户的各项生理数据,通过第一无线传输模块传输至用户终端;
用户终端包括第二无线传输模块、浏览器模块、Web特征向量生成模块、本地数据缓存模块、推荐模块、第三无线传输模块,其中,第二无线传输模块用于与第一无线传输模块进行无线通信;浏览器模块用于收集用户的浏览记录,显示推荐业务;Web特征向量生成模块用于对用户的浏览记录进行特征提取,生成Web特征向量;本地数据缓存模块,用于缓存用户浏览记录及其对应的Web特征向量、用户的生理数据;推荐模块用于接收来自网关的推荐业务,并在格式转换后以弹窗形式在浏览器模块中显示;第三无线传输模块用于用户终端与网关的无线通信;
网关包括:第四无线传输模块、用户IP管理模块、推荐业务缓存模块,其中,第四无线传输模块用于用户终端与网关的无线通信;用户IP管理模块,用于为所接入用户分配IP地址;推荐业务缓存模块,用于缓存来自服务器的推荐业务,并周期性将推荐业务发送至用户终端;
服务器包括数据库模块、预测模型构建及更新模块、业务推荐模块、Web资源库,其中,数据库模块,用于存储代表用户浏览行为的特征向量及各项生理数据;预测模型构建及更新模块,用于构建Web业务预测模型,并对模型进行周期性更新;业务推荐模块用于执行Web业务预测,并根据预测结果从Web资源库中寻找相似度高的Web资源进行推荐;Web资源库,用于根据Web特征向量对Web资源进行存储。
9.根据权利要求8所述的基于用户行为分析的移动Web业务协同推荐***,其特征在于,网关与服务器之间通过有线接口模块连接。
10.根据权利要求8所述的基于用户行为分析的移动Web业务协同推荐***,其特征在于,可穿戴终端还包括数据预处理模块,用于对采集的生理数据进行清洗与过滤,去除采集错误与误差。
CN201610688083.7A 2016-08-18 2016-08-18 基于用户行为分析的移动Web业务推荐方法及协同推荐*** Active CN106375369B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610688083.7A CN106375369B (zh) 2016-08-18 2016-08-18 基于用户行为分析的移动Web业务推荐方法及协同推荐***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610688083.7A CN106375369B (zh) 2016-08-18 2016-08-18 基于用户行为分析的移动Web业务推荐方法及协同推荐***

Publications (2)

Publication Number Publication Date
CN106375369A CN106375369A (zh) 2017-02-01
CN106375369B true CN106375369B (zh) 2019-05-28

Family

ID=57878030

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610688083.7A Active CN106375369B (zh) 2016-08-18 2016-08-18 基于用户行为分析的移动Web业务推荐方法及协同推荐***

Country Status (1)

Country Link
CN (1) CN106375369B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108665513B (zh) * 2017-03-27 2021-04-06 腾讯科技(深圳)有限公司 基于用户行为数据的绘图方法和装置
CN106991496B (zh) * 2017-03-29 2020-06-30 南京邮电大学 一种面向移动社交环境的用户行为分层关联预测方法
CN109117444A (zh) * 2017-06-23 2019-01-01 宏碁股份有限公司 推荐服务的方法及相关数据处理***
CN108629362B (zh) * 2018-05-30 2019-11-01 华南师范大学 一种面向移动环境的学习行为习惯发现量化***及方法
CN109151515B (zh) * 2018-09-12 2021-11-12 广东乐心医疗电子股份有限公司 表演场景下的互动***和方法
CN110008974A (zh) * 2018-11-23 2019-07-12 阿里巴巴集团控股有限公司 行为数据预测方法、装置、电子设备及计算机存储介质
CN109886823A (zh) * 2019-02-25 2019-06-14 北京奇艺世纪科技有限公司 一种社交圈的推荐方法及装置
CN110245293B (zh) * 2019-05-28 2023-07-11 深圳市雅阅科技有限公司 一种网络内容召回方法和装置
CN111914160B (zh) * 2019-10-11 2022-06-21 宁波大学 一种移动智能终端业务内容推送方法
CN111563190B (zh) * 2020-04-07 2023-03-14 中国电子科技集团公司第二十九研究所 一种区域网络用户行为的多维度分析与监管方法及***
CN111935231A (zh) * 2020-07-13 2020-11-13 支付宝(杭州)信息技术有限公司 信息处理方法和装置
CN113536108A (zh) * 2021-05-31 2021-10-22 珠海大横琴科技发展有限公司 一种信息推荐的方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101770520A (zh) * 2010-03-05 2010-07-07 南京邮电大学 基于用户浏览行为的用户兴趣建模方法
CN101923545A (zh) * 2009-06-15 2010-12-22 北京百分通联传媒技术有限公司 一种个性化信息推荐的方法
CN102215300A (zh) * 2011-05-24 2011-10-12 中国联合网络通信集团有限公司 电信业务推荐方法和***
CN103235824A (zh) * 2013-05-06 2013-08-07 上海河广信息科技有限公司 根据浏览网页确定用户感兴趣的网页文本的方法和***
CN103235826A (zh) * 2013-05-06 2013-08-07 上海河广信息科技有限公司 一种时间窗口的调节方法
CN103246725A (zh) * 2013-05-06 2013-08-14 上海河广信息科技有限公司 一种基于无线网络的数据业务推送***和方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101923545A (zh) * 2009-06-15 2010-12-22 北京百分通联传媒技术有限公司 一种个性化信息推荐的方法
CN101770520A (zh) * 2010-03-05 2010-07-07 南京邮电大学 基于用户浏览行为的用户兴趣建模方法
CN102215300A (zh) * 2011-05-24 2011-10-12 中国联合网络通信集团有限公司 电信业务推荐方法和***
CN103235824A (zh) * 2013-05-06 2013-08-07 上海河广信息科技有限公司 根据浏览网页确定用户感兴趣的网页文本的方法和***
CN103235826A (zh) * 2013-05-06 2013-08-07 上海河广信息科技有限公司 一种时间窗口的调节方法
CN103246725A (zh) * 2013-05-06 2013-08-14 上海河广信息科技有限公司 一种基于无线网络的数据业务推送***和方法

Also Published As

Publication number Publication date
CN106375369A (zh) 2017-02-01

Similar Documents

Publication Publication Date Title
CN106375369B (zh) 基于用户行为分析的移动Web业务推荐方法及协同推荐***
CN105701216B (zh) 一种信息推送方法及装置
CN101414296B (zh) 自适应服务推荐设备及方法、自适应服务推荐***及方法
CN100401292C (zh) 用于使用倾向分析进行搜索查询处理的***和方法
CN102859516B (zh) 使用历史搜索结果生成改进的文档分类数据
CN102622417B (zh) 对信息记录进行排序的方法和装置
CN107451861B (zh) 一种大数据下用户上网特征识别的方法
CN101025737B (zh) 基于关注度的同源信息搜索引擎聚合显示方法
CN104408043B (zh) 一种信息处理方法及服务器
CN105045932B (zh) 一种基于降序存储的数据分页查询方法
CN102667761A (zh) 可扩展的集群数据库
CN102760151B (zh) 开源软件获取与搜索***的实现方法
WO2010039537A2 (en) Method and system for determining topical relatedness of domain names
CN103942221B (zh) 检索方法及设备
CN103186666B (zh) 基于收藏进行搜索的方法、装置与设备
CN105760469A (zh) 云计算环境下基于倒排lsh的高维近似图象检索方法
CN105760468A (zh) 移动环境下基于倒排位置敏感哈希索引的大规模图象查询***
CN108282508A (zh) 地理位置的确定方法及装置、信息推送方法及装置
CN109685128A (zh) 一种MB-kmeans++聚类方法及基于其的用户会话聚类方法
CN115408618B (zh) 一种基于社交关系融合位置动态流行度和地理特征的兴趣点推荐方法
CN102053960B (zh) 依群需特征构建物联互联双网快准搜索引擎的方法及***
CN111191133B (zh) 业务搜索处理方法、装置及设备
Badis et al. P2PCF: A collaborative filtering based recommender system for peer to peer social networks
Li Design and implementation of intelligent travel recommendation system based on internet of things.
Knoch et al. A context-aware running route recommender learning from user histories using artificial neural networks

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant