CN107436930A - 资讯推荐方法及装置 - Google Patents

资讯推荐方法及装置 Download PDF

Info

Publication number
CN107436930A
CN107436930A CN201710580717.1A CN201710580717A CN107436930A CN 107436930 A CN107436930 A CN 107436930A CN 201710580717 A CN201710580717 A CN 201710580717A CN 107436930 A CN107436930 A CN 107436930A
Authority
CN
China
Prior art keywords
user
attribute
information
label
tally set
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201710580717.1A
Other languages
English (en)
Inventor
晋彤
李永康
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Special Road Mdt Infotech Ltd
Original Assignee
Guangzhou Special Road Mdt Infotech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Special Road Mdt Infotech Ltd filed Critical Guangzhou Special Road Mdt Infotech Ltd
Priority to CN201710580717.1A priority Critical patent/CN107436930A/zh
Publication of CN107436930A publication Critical patent/CN107436930A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种资讯推荐方法,包括步骤:实时收集用户的行为日志,通过标签引擎对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集;所述用户包括用户属性、习惯属性和兴趣属性;基于所述第一标签集获得所述用户的兴趣属性,并基于所述行为日志获得所述用户的习惯属性;根据所述用户的用户属性、兴趣属性和习惯属性进行特征提取,动态识别所述用户的类别,根据所述用户的类别向所述用户推荐相应的资讯,能实现基于用户Web日志进行资讯推荐,以及能根据用户兴趣度量完成个性化推荐。

Description

资讯推荐方法及装置
技术领域
本发明涉及计算机领域,尤其涉及一种资讯推荐方法及装置。
背景技术
随着互联网的迅猛发展,每天有大量网页在互联网上更新或者发布。对于广大用户来说在大量的信息中想找到自己满意的信息已经是越来越困难,从而导致了“信息过量”与“信息饥饿”的矛盾现象。为解决这一问题,提出了个性化信息服务,这是一种智能信息服务方式。可以根据用户的信息需求和个性化模式,主动搜寻相关信息,并且利用在线智能推荐服务或者推送技术,准确的将用户所需的信息传送到相应的用户。在个性化服务技术中,应用较成功的是协同过滤方法。该方法是指用户根据自身的需求,通过和其他用户进行合作,形成一定的协作规则,或利用多个信息使用者的倾向性来预测单个用户的兴趣,然后根据具有相同兴趣爱好的用户对信息进行评价,从而得到推荐结果。由于Web日志中记录了大量的用户行为信息,利用Web日志可以为个性化服务提供重要的数据支持。另外,在用户兴趣度量方面,目前存在的从访问日志文件中提取用户的访问模式进行推荐的方法,没有考虑到用户访问页面的时间特性。
发明内容
本发明实施例的目的是提供一种资讯推荐方法,能实现基于用户Web日志进行资讯推荐,以及能根据用户兴趣度量完成个性化推荐。
为实现上述目的,本发明实施例提供了一种资讯推荐方法,包括步骤:
实时收集用户的行为日志,通过标签引擎对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集;所述用户包括用户属性、习惯属性和兴趣属性;
基于所述第一标签集获得所述用户的兴趣属性,并基于所述行为日志获得所述用户的习惯属性;
根据所述用户的用户属性、兴趣属性和习惯属性进行特征提取,动态识别所述用户的类别,根据所述用户的类别向所述用户推荐相应的资讯。
与现有技术相比,本发明公开的资讯推荐方法通过实时收集用户的行为日志,通过标签引擎对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集,然后基于所述第一标签集获得所述用户的兴趣属性,并基于所述行为日志获得所述用户的习惯属性,再根据所述用户的用户属性、兴趣属性和习惯属性进行特征提取,动态识别所述用户的类别,根据所述用户的类别向所述用户推荐相应的资讯,能实现基于用户Web日志进行资讯推荐,以及能根据用户兴趣度量完成个性化推荐。
作为上述方案的改进,通过标签引擎对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集具体为:
收集第二标签集,通过文档主题生成模型识别所述第二标签集中每一标签的粒度属性;
识别所述第二标签集中的标签在大量文章中的特征,根据所述特征对对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集;
根据所述第二标签集中每一标签的粒度属性,获得所述第一标签集中每一标签的粒度属性。
作为上述方案的改进,还包括步骤:
根据第一标签集中的标签的粒度属性,向所述用户推荐不同粒度属性的资讯。
作为上述方案的改进,实时收集用户的行为日志具体为:
通过高负载的消息中间件进行数据传输以实时收集用户的行为日志。
作为上述方案的改进,基于所述行为日志获得所述用户的习惯属性具体为:
对所述行为日志的时间戳进行时间序列分析,从而获得用户的习惯属性。
本发明实施例还提供了一种资讯推荐装置,包括:
收集模块,用于实时收集用户的行为日志,通过标签引擎对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集;所述用户包括用户属性、习惯属性和兴趣属性;
属性获取模块,用于基于所述第一标签集获得所述用户的兴趣属性,并基于所述行为日志获得所述用户的习惯属性;
第一推荐模块,用于根据所述用户的用户属性、兴趣属性和习惯属性进行特征提取,动态识别用户的类别,根据所述用户的类别向所述用户推荐相应的资讯。
与现有技术相比,本发明公开的资讯推荐装置通过收集模块实时收集用户的行为日志,通过标签引擎对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集,然后通过属性获取模块基于所述第一标签集获得所述用户的兴趣属性,并基于所述行为日志获得所述用户的习惯属性,再通过第一推荐模块根据所述用户的用户属性、兴趣属性和习惯属性进行特征提取,动态识别所述用户的类别,根据所述用户的类别向所述用户推荐相应的资讯,能实现基于用户Web日志进行资讯推荐,以及能根据用户兴趣度量完成个性化推荐。
作为上述方案的改进,收集模块包括:
第一识别模块,用于收集第二标签集,通过文档主题生成模型识别所述第二标签集中每一标签的粒度属性;
第一标签集获取模块,用于识别所述第二标签集中的标签在大量文章中的特征,根据所述特征对对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集;
第二识别模块,用于根据所述第二标签集中每一标签的粒度属性,获得所述第一标签集中每一标签的粒度属性。
作为上述方案的改进,还包括:第二推荐模块,用于根据第一标签集中的标签的粒度属性,向所述用户推荐不同粒度属性的资讯。
作为上述方案的改进,所述收集模块具体用于通过高负载的消息中间件进行数据传输以实时收集用户的行为日志。
作为上述方案的改进,所述属性获取模块具体用于对所述行为日志的时间戳进行时间序列分析,从而获得用户的习惯属性。
附图说明
图1是本发明实施例1中一种资讯推荐方法的流程示意图。
图2是本发明实施例2中一种资讯推荐方法的流程示意图。
图3是本发明实施例3中一种资讯推荐装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,是本发明实施例1提供的一种资讯推荐方法的流程示意图,包括步骤:
S1、实时收集用户的行为日志,通过标签引擎对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集;所述用户包括用户属性、习惯属性和兴趣属性;
其中,海量用户行为日志的入库是通过高负载的消息中间件进行数据传输。
S2、基于所述第一标签集获得所述用户的兴趣属性,并基于所述行为日志获得所述用户的习惯属性;
S3、根据所述用户的用户属性、兴趣属性和习惯属性进行特征提取,动态识别所述用户的类别,根据所述用户的类别向所述用户推荐相应的资讯。
具体实施时,先实时收集用户的行为日志,通过标签引擎对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集,然后基于所述第一标签集获得所述用户的兴趣属性,并基于所述行为日志获得所述用户的习惯属性,再根据所述用户的用户属性、兴趣属性和习惯属性进行特征提取,动态识别所述用户的类别,根据所述用户的类别向所述用户推荐相应的资讯,能实现基于用户Web日志进行资讯推荐,以及能根据用户兴趣度量完成个性化推荐。
在一优选实施例中,步骤S1中通过标签引擎对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集具体包括步骤:
S11、收集第二标签集,通过文档主题生成模型识别所述第二标签集中每一标签的粒度属性;
S12、识别所述第二标签集中的标签在大量文章中的特征,根据所述特征对对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集;
S13、根据所述第二标签集中每一标签的粒度属性,获得所述第一标签集中每一标签的粒度属性。
其中,粒度划分是通过LDA(主题模型)实现的。
通过上述步骤,能实现自动化抽取和不同粒度的标签划分。
参见图2,是本发明实施例2提供的一种资讯推荐方法的流程示意图,在实施例1的基础上,还包括步骤:
S4、根据第一标签集中的标签的粒度属性,向所述用户推荐不同粒度属性的资讯。
不同粒度划分可根据用户行为,推荐不同粒度属性的文章,提高推荐精准度。
在一优选实施例中,步骤S2中基于所述行为日志获得所述用户的习惯属性具体为:
对所述行为日志的时间戳进行时间序列分析,从而获得用户的习惯属性。
参见图3,是本发明实施例3提供的一种资讯推荐装置的结构示意图,包括:
收集模块101,用于实时收集用户的行为日志,通过标签引擎对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集;所述用户包括用户属性、习惯属性和兴趣属性;
属性获取模块102,用于基于所述第一标签集获得所述用户的兴趣属性,并基于所述行为日志获得所述用户的习惯属性;
第一推荐模块103,用于根据所述用户的用户属性、兴趣属性和习惯属性进行特征提取,动态识别用户的类别,根据所述用户的类别向所述用户推荐相应的资讯。
具体实施时,通过收集模块101实时收集用户的行为日志,通过标签引擎对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集,然后通过属性获取模块102基于所述第一标签集获得所述用户的兴趣属性,并基于所述行为日志获得所述用户的习惯属性,再通过第一推荐模块103根据所述用户的用户属性、兴趣属性和习惯属性进行特征提取,动态识别所述用户的类别,根据所述用户的类别向所述用户推荐相应的资讯,能实现基于用户Web日志进行资讯推荐,以及能根据用户兴趣度量完成个性化推荐。
优选地,收集模块101包括:
第一识别模块,用于收集第二标签集,通过文档主题生成模型识别所述第二标签集中每一标签的粒度属性;
第一标签集获取模块,用于识别所述第二标签集中的标签在大量文章中的特征,根据所述特征对对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集;
第二识别模块,用于根据所述第二标签集中每一标签的粒度属性,获得所述第一标签集中每一标签的粒度属性。
在一优选实施例中,所述资讯推荐装置100还包括:第二推荐模块,用于根据第一标签集中的标签的粒度属性,向所述用户推荐不同粒度属性的资讯。
在另一优选实施例中,所述收集模块100具体用于通过高负载的消息中间件进行数据传输以实时收集用户的行为日志。
在一优选实施例中,所述属性获取模块102具体用于对所述行为日志的时间戳进行时间序列分析,从而获得用户的习惯属性。
综上,本发明实施例提供了一种资讯推荐方法及装置通过先实时收集用户的行为日志,通过标签引擎对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集,然后基于所述第一标签集获得所述用户的兴趣属性,并基于所述行为日志获得所述用户的习惯属性,再根据所述用户的用户属性、兴趣属性和习惯属性进行特征提取,动态识别所述用户的类别,根据所述用户的类别向所述用户推荐相应的资讯,能实现基于用户Web日志进行资讯推荐,以及能根据用户兴趣度量完成个性化推荐。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

Claims (10)

1.一种资讯推荐方法,其特征在于,包括步骤:
实时收集用户的行为日志,通过标签引擎对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集;所述用户包括用户属性、习惯属性和兴趣属性;
基于所述第一标签集获得所述用户的兴趣属性,并基于所述行为日志获得所述用户的习惯属性;
根据所述用户的用户属性、兴趣属性和习惯属性进行特征提取,动态识别所述用户的类别,根据所述用户的类别向所述用户推荐相应的资讯。
2.如权利要求1所述的资讯推荐方法,其特征在于,通过标签引擎对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集具体为:
收集第二标签集,通过文档主题生成模型识别所述第二标签集中每一标签的粒度属性;
识别所述第二标签集中的标签在大量文章中的特征,根据所述特征对对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集;
根据所述第二标签集中每一标签的粒度属性,获得所述第一标签集中每一标签的粒度属性。
3.如权利要求2所述的资讯推荐方法,其特征在于,还包括步骤:
根据第一标签集中的标签的粒度属性,向所述用户推荐不同粒度属性的资讯。
4.如权利要求1所述的资讯推荐方法,其特征在于,实时收集用户的行为日志具体为:
通过高负载的消息中间件进行数据传输以实时收集用户的行为日志。
5.如权利要求1所述的资讯推荐方法,其特征在于,基于所述行为日志获得所述用户的习惯属性具体为:
对所述行为日志的时间戳进行时间序列分析,从而获得用户的习惯属性。
6.一种资讯推荐装置,其特征在于,包括:
收集模块,用于实时收集用户的行为日志,通过标签引擎对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集;所述用户包括用户属性、习惯属性和兴趣属性;
属性获取模块,用于基于所述第一标签集获得所述用户的兴趣属性,并基于所述行为日志获得所述用户的习惯属性;
第一推荐模块,用于根据所述用户的用户属性、兴趣属性和习惯属性进行特征提取,动态识别用户的类别,根据所述用户的类别向所述用户推荐相应的资讯。
7.如权利要求6所述的资讯推荐装置,其特征在于,收集模块包括:
第一识别模块,用于收集第二标签集,通过文档主题生成模型识别所述第二标签集中每一标签的粒度属性;
第一标签集获取模块,用于识别所述第二标签集中的标签在大量文章中的特征,根据所述特征对对所述行为日志指向的资讯进行标签抽取,从而生成第一标签集;
第二识别模块,用于根据所述第二标签集中每一标签的粒度属性,获得所述第一标签集中每一标签的粒度属性。
8.如权利要求7所述的资讯推荐装置,其特征在于,所述装置还包括:
第二推荐模块,用于根据第一标签集中的标签的粒度属性,向所述用户推荐不同粒度属性的资讯。
9.如权利要求6所述的资讯推荐装置,其特征在于,所述收集模块具体用于通过高负载的消息中间件进行数据传输以实时收集用户的行为日志。
10.如权利要求6所述的资讯推荐装置,其特征在于,所述属性获取模块具体用于对所述行为日志的时间戳进行时间序列分析,从而获得用户的习惯属性。
CN201710580717.1A 2017-07-17 2017-07-17 资讯推荐方法及装置 Withdrawn CN107436930A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710580717.1A CN107436930A (zh) 2017-07-17 2017-07-17 资讯推荐方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710580717.1A CN107436930A (zh) 2017-07-17 2017-07-17 资讯推荐方法及装置

Publications (1)

Publication Number Publication Date
CN107436930A true CN107436930A (zh) 2017-12-05

Family

ID=60460292

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710580717.1A Withdrawn CN107436930A (zh) 2017-07-17 2017-07-17 资讯推荐方法及装置

Country Status (1)

Country Link
CN (1) CN107436930A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108133011A (zh) * 2017-12-22 2018-06-08 新奥(中国)燃气投资有限公司 一种资讯推送方法及装置
CN108269196A (zh) * 2017-12-01 2018-07-10 优视科技有限公司 加入网络社群的方法、装置及计算机设备
CN109684566A (zh) * 2018-11-08 2019-04-26 百度在线网络技术(北京)有限公司 标签引擎实现方法、装置、计算机设备及存储介质
CN111090815A (zh) * 2019-12-31 2020-05-01 恩亿科(北京)数据科技有限公司 一种标签的生成方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110191217A1 (en) * 2010-02-03 2011-08-04 Oracle International Corporation Approval workflow engine for services procurement timesheets, progress logs, and expenses
CN105976161A (zh) * 2016-04-29 2016-09-28 随身云(北京)信息技术有限公司 一种基于时间轴上的智能推荐日历及基于用户的呈现方法
CN106294730A (zh) * 2016-08-09 2017-01-04 百度在线网络技术(北京)有限公司 资讯信息的推荐方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110191217A1 (en) * 2010-02-03 2011-08-04 Oracle International Corporation Approval workflow engine for services procurement timesheets, progress logs, and expenses
CN105976161A (zh) * 2016-04-29 2016-09-28 随身云(北京)信息技术有限公司 一种基于时间轴上的智能推荐日历及基于用户的呈现方法
CN106294730A (zh) * 2016-08-09 2017-01-04 百度在线网络技术(北京)有限公司 资讯信息的推荐方法及装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108269196A (zh) * 2017-12-01 2018-07-10 优视科技有限公司 加入网络社群的方法、装置及计算机设备
CN108133011A (zh) * 2017-12-22 2018-06-08 新奥(中国)燃气投资有限公司 一种资讯推送方法及装置
CN108133011B (zh) * 2017-12-22 2022-05-24 新奥(中国)燃气投资有限公司 一种资讯推送方法及装置
CN109684566A (zh) * 2018-11-08 2019-04-26 百度在线网络技术(北京)有限公司 标签引擎实现方法、装置、计算机设备及存储介质
CN109684566B (zh) * 2018-11-08 2020-04-28 百度在线网络技术(北京)有限公司 标签引擎实现方法、装置、计算机设备及存储介质
CN111090815A (zh) * 2019-12-31 2020-05-01 恩亿科(北京)数据科技有限公司 一种标签的生成方法及装置

Similar Documents

Publication Publication Date Title
CN104239331B (zh) 一种用于实现评论搜索引擎排序的方法和装置
CN103678335B (zh) 商品标识标签的方法、装置及商品导航的方法
CN107436930A (zh) 资讯推荐方法及装置
CN103927309B (zh) 一种对业务对象标注信息标签的方法及装置
CN107894998B (zh) 视频推荐方法及装置
US20120072466A1 (en) Contents creating device and contents creating method
CN104866554B (zh) 一种基于社会化标注的个性化搜索方法及***
CN101853299A (zh) 一种基于感性认知的图像检索结果排序方法
CN104035927A (zh) 一种基于用户行为的搜索方法及***
CN107122467A (zh) 一种搜索引擎的检索结果评价方法及装置、计算机可读介质
CN104111941A (zh) 信息展示的方法及设备
CN105809464A (zh) 信息投放方法和装置
CN104317827A (zh) 一种商品的图片导航方法
CN104111939A (zh) 一种图书推荐方法和装置
CN102073641A (zh) 对消费者生成媒体信息进行处理的方法、装置和程序
CN106959998A (zh) 一种试题推荐方法及装置
CN106202391A (zh) 一种用户社群的自动分类方法及装置
CN107741958A (zh) 一种数据处理方法及***
CN107451216A (zh) 标签的粒度属性识别方法及装置
CN102043811A (zh) 一种医疗信息的评估方法及***
CN107025567A (zh) 一种数据处理方法和装置
CN103942233B (zh) 目录型网页的介绍页识别方法及装置
CN116304128B (zh) 基于大数据的多媒体资讯推荐***
Milicic et al. Live topic generation from event streams
CN111723273A (zh) 一种智慧云检索***及方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20171205