CN103399883B - 根据用户兴趣点/关注点进行个性化推荐的方法和*** - Google Patents

根据用户兴趣点/关注点进行个性化推荐的方法和*** Download PDF

Info

Publication number
CN103399883B
CN103399883B CN201310304671.2A CN201310304671A CN103399883B CN 103399883 B CN103399883 B CN 103399883B CN 201310304671 A CN201310304671 A CN 201310304671A CN 103399883 B CN103399883 B CN 103399883B
Authority
CN
China
Prior art keywords
user
block
session
focus
personalized recommendation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310304671.2A
Other languages
English (en)
Other versions
CN103399883A (zh
Inventor
徐倩
向伟
陈明星
詹金波
黄硕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201310304671.2A priority Critical patent/CN103399883B/zh
Publication of CN103399883A publication Critical patent/CN103399883A/zh
Application granted granted Critical
Publication of CN103399883B publication Critical patent/CN103399883B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

提供了一种根据用户兴趣点/关注点进行个性化推荐的方法和***。所述方法包括:(a)整合用户在多个产品线上的在预定时间段内的用户行为日志;(b)针对用户在预定时间段内的行为日志进行会话划分;(c)对划分的会话的用户行为日志进行同类需求行为信息整合并且挖掘用户关注点/兴趣点;(d)根据挖掘出的用户兴趣点/关注点通过推荐排序模型展示针对用户兴趣点/关注点的个性化推荐。

Description

根据用户兴趣点/关注点进行个性化推荐的方法和***
技术领域
本发明涉及网络通信,更具体地讲,涉及一种根据用户兴趣点进行个性化推荐的方法和***。
背景技术
随着电子信息技术的发展,网络已经改变了人们的生活方式。例如,人们可以利用网络获取自己感兴趣的书籍、电影、音乐、商品等,因此网络带给了人们高效快捷的生活。人们已经习惯利用计算机、手机等具有上网功能的设备,通过浏览自己感兴趣的网页进行学习、娱乐、购物等来满足自身多方位的需求。
一般,用户通过在网络的搜索引擎输入关键字来找到感兴趣的网页。然而通过这种搜索引擎的搜索,会呈现给用户非常多的网页,因此给用户找到自己期望的内容带来困难。
发明内容
本发明目的是实现从用户在多个产品线上的行为记录,挖掘用户的关注需求点来弥补单一产品线用户行为的稀疏性,从多个维度充分地了解和刻画用户,从而给用户提供更好的个性化的搜索和推荐服务。
本发明的目的在于提供一种根据用户兴趣点进行个性化推荐的方法和***。
根据本发明的一方面,提供了一种根据用户兴趣点/关注点进行个性化推荐的方法,该方法包括:(a)整合用户在多个产品线上的在预定时间段内的用户行为日志;(b)针对用户在预定时间段内的行为日志进行会话划分;(c)对划分的会话的用户行为日志进行同类需求行为信息整合并且挖掘用户关注点/兴趣点;(d)根据挖掘出的用户兴趣点/关注点通过推荐排序模型展示针对用户兴趣点/关注点的个性化推荐。
步骤(b)可包括以下子步骤:针对用户在预定时间段内的行为日志进行块划分;通过使用分类器来判断划分的块集合所在的会话。
所述块划分可基于以下规则中的至少一个来执行:规则1:时间完全相同的连续日志归为同一个块;规则2:如果连续的2条日志时间间隔大于一定时间,则归为不同的块;规则3:如果连续日志的产品线为特定产品线,则将之归为同一个块;规则4:对比当前日志中抽取的文本信息和上一条日志中抽取的文本信息是否相同,如果相同则归为同一个块,否则为新的一个块的开始。
判断划分的块集合所在的会话的步骤可包括:通过遍历划分的块集合,对于给定当前块,首先判断是否和上一个块同属于一个会话中;如果是,则将该块归入前一个块所在的会话;否则利用回溯策略,判断往前看预定时间内的所有块中是否有与当前块同属于一个会话的块,如果有,则将当前块归入找到的块所在的会话中,否则将当前块归入新的会话中。
步骤(c)可包括以下子步骤:通过提取划分的会话中的特定字段来计算目标数据;利用主题分类技术来计算每个目标的主题,并将每个主题分类相同的目标归并在一起以形成多个目标集合;对每个目标集合进行分词以建立术语共现图;通过应用图聚类算法来识别用户兴趣点/关注点。
展示针对用户兴趣点/关注点的个性化推荐的步骤可包括:当用户在搜索引擎中进行搜索时,基于用户输入的搜索词将符合用户兴趣点/关注点的个性化推荐显示在搜索结果的前面。
展示针对用户兴趣点/关注点的个性化推荐的步骤可包括:在用户浏览网页时,在除浏览的网页的主要区块的其余区块中显示符合用户兴趣点/关注点的个性化推荐。
根据本发明的另一方面,提供了一种根据用户兴趣点/关注点进行个性化推荐的***,该***包括:整合数据源模块,用于整合用户在多个产品线上的在预定时间段内的用户行为日志;会话划分模块,用于针对用户在预定时间段内的行为日志进行会话划分;关注点/兴趣点挖掘模块,用于对划分的会话的用户行为日志进行同类需求行为信息整合并且挖掘用户关注点/兴趣点;个性化推荐模块,用于根据挖掘出的用户兴趣点/关注点通过推荐排序模型展示针对用户兴趣点/关注点的个性化推荐。
会话划分模块可包括:块划分子模块,用于针对用户在预定时间段内的行为日志进行块划分;会话划分子模块,用于通过使用分类器来判断划分的块集合所在的会话。
块划分子模块可基于以下规则中的至少一个来执行块划分:规则1:时间完全相同的连续日志归为同一个块;规则2:如果连续的2条日志时间间隔大于一定时间,则归为不同的块;规则3:如果连续日志的产品线为特定产品线,则将之归为同一个块;规则4:对比当前日志中抽取的文本信息和上一条日志中抽取的文本信息是否相同,如果相同则归为同一个块,否则为新的一个块的开始。
会话划分子模块可通过以下步骤来判断划分的块集合所在的会话:通过遍历划分的块集合,对于给定当前块,首先判断是否和上一个块同属于一个会话中;如果是,则将该块归入前一个块所在的会话;否则利用回溯策略,判断往前看预定时间内的所有块中是否有与当前块同属于一个会话的块,如果有,则将当前块归入找到的块所在的会话中,否则将当前块归入新的会话中。
关注点/兴趣点挖掘模块可包括:目标数据计算子模块,用于通过提取划分的会话中的特定字段来计算目标数据;目标集合形成子模块,用于利用主题分类技术来计算每个目标的主题,并将每个主题分类相同的目标归并在一起以形成多个目标集合;术语共现图建立子模块,用于对每个目标集合进行分词以建立术语共现图;用户兴趣点/关注点识别子模块,用于通过应用图聚类算法来识别用户兴趣点/关注点。
当用户在搜索引擎中进行搜索时,可通过基于用户输入的搜索词将符合用户兴趣点/关注点的个性化推荐显示在搜索结果的前面,个性化推荐模块来展示针对用户兴趣点/关注点的个性化推荐。
在用户浏览网页时,可通过在除浏览的网页的主要区块的其余区块中显示符合用户兴趣点/关注点的个性化推荐,个性化推荐模块来展示针对用户兴趣点/关注点的个性化推荐。
将在接下来的描述中部分阐述本发明另外的方面和/或优点,还有一部分通过描述将是清楚的,或者可以经过本发明的实施而得知。
附图说明
通过下面结合附图进行的描述,本发明的上述和其他目的和特点将会变得更加清楚,其中:
图1是示出根据本发明实施例的根据用户兴趣点进行个性化推荐的方法的流程图;
图2是示出session划分的流程图;
图3是示出session划分的示例;
图4是示出对划分的session的用户行为日志进行同类需求行为信息整合并且挖掘用户关注点/兴趣点的过程的流程图;
图5是根据本发明实施例的根据用户兴趣点/关注点进行个性化推荐的***的框图。
具体实施方式
现在,详细描述本发明的实施例,其示例在附图中表示,其中,相同的标号始终表示相同的部件。以下通过参考附图描述实施例以解释本发明。
图1是示出根据本发明实施例的根据用户兴趣点/关注点进行个性化推荐的方法的流程图。
如图1所示,在步骤S101,整合多个数据源,即整合用户在多个产品线上的在预定时间段内的用户行为日志(例如,搜索点击行为日志)。这里的产品线可包括例如大搜索、贴吧、知道、文库等等。具体地讲,通过以用户身份(ID)为关键词依据时间顺序来组织用户在各个产品线上的搜索点击行为日志。
在步骤S102,针对用户在预定时间段内的行为日志进行会话(session)划分。
具体地讲,会话(session)是一个逻辑意义,它代表一个用户在某段时间内的一个意图,从用户的日志行为来看,会话具体可以规约成具有相关联的一组检索和点击。例如,一个用户连续搜索了“北京鲜花”“宝马”“鲜花快递”“奔驰”“别克”“鲜花购买”6个查询。其中我们可以看出<“北京鲜花”“鲜花快递”“鲜花购买”>和<“宝马”“奔驰”“别克”>这两组检索属于不同的行为意图,即为两个不同的session。因此,同一session可被定义为同一用户在一段连续时间内为满足某个单一信息需求的搜索点击行为。
图2是示出session划分的流程图。
在步骤S201,针对每个用户在预定时间段内的行为日志进行块(block)划分。所述block划分基于以下规则来执行:
规则1:时间完全相同的连续日志归为同一个block;
规则2:如果连续的2条日志时间间隔大于一定时间(例如,5分钟),则归为不同的block;
规则3:如果连续日志的产品线是为特定产品线(例如“news”、“ting”、“map”),则将之归为同一个block(常识上认为如果有人连续时间内在阅读新闻、听歌、或是浏览地图则认为是同一个意图,故归为同一个block);
规则4:对比当前日志中抽取的文本信息和上一条日志中抽取的文本信息是否相同,如果相同则归为同一个block,否则为新的一个block的开始。
应该理解,按照上述规则(规则1至规则4)的先后顺序来针对用户日志判断是否属于同一block,即先判断用户日志是否满足规则1,如果没有满足规则1,则继续判断规则2,以此类推。
在步骤S202,通过使用分类器来判断划分的block集合所在的session。由于分类器属于机器学习中的现有技术,因此不在此进行赘述。
具体地讲,通过遍历划分的block集合,对于给定当前block,首先判断是否和上一个block同属于一个session中。如果是,则将该block归入前一个block所在的session;否则利用回溯策略,判断往前看预定时间(例如一个小时)内的所有block中是否有与当前block同属于一个session的block,如果有则将当前block归入找到的block所在的session中,否则将当前block归入新的session中。更具体地讲,回溯策略主要在判断2个block是否属于同一个session之后,再往回看预定时间(例如一个小时)之内的block是否与当前block属于同一个session。如果没有则重新开启一个新的session,否则记录当前block和之前的block为相同的session id。
下面将参照图3给出的示例来详细描述session划分过程。
如图3所示,该用户在时间20:19:14进行“曼联”查询、在20:21:38进行“曼联直播”查询、在22:01:04进行“长痘痘的位置”查询、在22:11:51进行“如何改善员工不稳定性”查询、在22:19:11进行“长痘痘是吃什么”查询、在23:02:44进行“如何稳定员工队伍”查询。
根据上述block划分,可得到图3中间的6个block,然后遍历这6个block,对于当前的block利用分类器判断是否和上一个block属于同个session,用分类器判断block1(曼联)和block2(曼联直播)同属于一个session中。然后考虑block3和block2,根据分类器确定这两个block不属于同一个session,则接下来往回考虑block3和block1,由于这两个block的时间间隔大于预定时间(即1个小时),故block3属于新的session。同理当遍历到block5的时候,发现其和block4不属于同一个session,往回看一个小时内的block,发现和block4、block3的时间间隔均在一个小时之内,故把block5和block4、block3进行了判断,通过分类器发现block5和block4不在一个session中,而和block3同属一个session,则把block5归入block3所在的session中。以此类推,发现block6和block4同属一个session。当遍历完所有block之后,输出图3中右边的结果,而左边为不考虑回溯策略的session划分结果。
现回到图1,在步骤S103,对划分的session的用户行为日志进行同类需求行为信息整合并且挖掘用户关注点/兴趣点。
下面将参照图4对步骤S103进行详细描述。
在步骤S401,通过提取划分的会话(session)中的有用字段来计算目标(goal)数据。
具体地讲,针对不同数据源的特点,因为不同的产品线的日志不同,因此通过使用不同策略提取对计算兴趣点有用的字段来计算生成用户的目标数据,因此这里的有用字段可以指查询(Query)、标题(title)等。在计算目标时一般查询字段中的查询信息会两倍处理,其他都是一倍处理,这是由于我们认为查询更能表达用户兴趣,而标题字段(这里的标题是指用户搜索后点击的网页标题)等非查询信息字段只是对查询的有益补充。
在步骤S402,利用主题分类技术来计算每个目标的主题,并将每个用户主题分类相同的目标归并在一起以形成多个目标集合。主题分类技术是对用户搜索查询或者点击标题进行分类的机器学习技术。输入是一个查询或者标题文本,输出为该查询或者标题能分到的某一个类别,比如“娱乐人物”,“交通票务”,“教育培训”等等。该主题分类技术为机器学习中的常规技术,因此在此不再累述。
在步骤S403,对每个目标集合进行分词以建立术语(term)共现图。
具体地讲,对每个目标集合中的用户的查询和标题进行切词,根据术语共现建立术语共现图。图中每个术语共现图中的节点对应一个术语,节点的权重对应术语出现的频次。共现图的每条边对应两个术语的共现,连接的权重对应两个术语共现的频次。例如,以查询“我喜欢狗”为例,切词后变成“我”、“喜欢”、“狗”这几个词,那建立的图有三个节点,每个节点一个词,节点上的权重就是这几个词出现的频次,连接的边上的权重就是两个词共同出现的次数,比如说我和喜欢共同出现了1次。
在步骤S404,通过应用图聚类算法来识别用户兴趣点/关注点。
具体地讲,对术语共现图进行凝聚层次聚类,以识别出术语共现图中共有多少个Cluster(簇),这里认为每一个簇对应一个用户的兴趣点。
其后,通过下一步骤来分别输出各个聚类结果中的兴趣点:抽取用户兴趣点时,先选择在该簇中权重最大的节点作为该兴趣点的核心术语。然后选取连接权重乘以节点权重最大且与核心节点相连接的术语作为第一辅助术语。最后将所有与核心术语和第一辅助术语相连的术语都提取出来作为其他辅助术语。所以每个兴趣点的术语数量是不确定的,如果为非孤立节点,则术语数量一定大于等于2;若为孤立节点,则术语数量为1。
之后,回到原始Session中重新核对兴趣点是否可以输出:如果兴趣点在多天出现过或在单天出过3次以上,则认为行为够丰富,可以输出,否则不输出。
此外,输出的每个兴趣点包括核心术语,辅助术语等。每个兴趣点还输出来源的产品线,以辅助应用方部署策略过滤策略;同时还输出地名术语,从而识别兴趣的地域倾向;并且输出其末次出现日期和总出现天数,以辅助应用方判断兴趣点的时效性等。
接着,利用已经构建的词典,将已经输出的兴趣点过词典匹配模块,以对该兴趣点加标签(tag)。词典匹配策略只考虑核心术语和第一辅助术语,首先将这两个术语连接(包括正向和反向),进行词典匹配。若匹配成功,则输出匹配的标签;否则利用核心术语进行匹配,若匹配成功,则输出匹配的标签;否则利用第一辅助术语进行匹配,若匹配成功,则输出匹配的标签。
现在返回图1,在步骤S104,根据挖掘出的用户兴趣点/关注点通过推荐排序模型展示针对用户兴趣点/关注点的个性化推荐。
上述步骤S101、S102和S103可在用户终端中执行或者在服务器中执行。具体地讲,用户终端可从服务器上下载相应的用户兴趣点/关注点挖掘软件以便挖掘用户兴趣点/关注点。根据以上描述,用户兴趣点/关注点挖掘软件可根据用户的查询点击操作日志来不断地更新用户兴趣点/关注点。
上述步骤S104可在服务器上执行。上述推荐排序模型可由现有的推荐排序模型来实现,例如,现有的推荐排序模型可根据商家竞价、根据用户IP地址等等条件对搜索结果进行排序,因此在此不对其进行详细描述。
根据本发明的实施例,例如,当用户在搜索引擎中进行搜索时推荐排序模型可基于用户输入的搜索词将符合用户兴趣点/关注点的网站、文章、视频等列在搜索结果的前面。或者,可在用户浏览网页时,在除浏览的网页的主要区块的其余区块中显示根据用户兴趣点/关注点而推荐的网站、文章、视频等,例如,当用户兴趣点/关注点为股票时,可在用户浏览的网页的其余区块中为用户推荐与股票相关的网站、文章、视频等。
图5是根据本发明实施例的根据用户兴趣点/关注点进行个性化推荐的***的框图。
如图5所示,根据本发明的根据用户兴趣点进行个性化推荐的***包括:整合数据源模块501、会话划分模块502、关注点/兴趣点挖掘模块503和个性化推荐模块504。
整合数据源模块501用于整合用户在多个产品线上的在预定时间段内的用户行为日志。
会话划分模块502用于针对用户在预定时间段内的行为日志进行会话划分。
关注点/兴趣点挖掘模块503用于对划分的session的用户行为日志进行同类需求行为信息整合并且挖掘用户关注点/兴趣点。
个性化推荐模块504用于根据挖掘出的用户兴趣点/关注点通过推荐排序模型展示针对用户兴趣点/关注点的个性化推荐。
应该理解,整合数据源模块501、会话划分模块502、关注点/兴趣点挖掘模块503可被单独或集成实现在用户终端中或集成实现在服务器上。个性化推荐模块504可被实现在服务器上。
如图5所示,会话划分模块502包括块划分子模块5021和会话划分子模块5022。
其中,块划分子模块5021用于针对每个用户在预定时间段内的行为日志进行块(block)划分。所述block划分基于以下规则来执行:
规则1:时间完全相同的连续日志归为同一个block;
规则2:如果连续的2条日志时间间隔大于一定时间(例如,5分钟),则归为不同的block;
规则3:如果连续日志的产品线是为特定产品线(例如“news”、“ting”、“map”),则将之归为同一个block(常识上认为如果有人连续时间内在阅读新闻、听歌、或是浏览地图则认为是同一个意图,故归为同一个block);
规则4:对比当前日志中抽取的文本信息和上一条日志中抽取的文本信息是否相同,如果相同则归为同一个block,否则为新的一个block的开始。
会话划分子模块5022用于通过使用分类器来判断划分的block集合所在的session。
又如图5所示,关注点/兴趣点挖掘模块503包括目标数据计算子模块5031、目标集合形成子模块5032、术语共现图建立子模块5033和用户兴趣点/关注点识别子模块5034。
目标数据计算子模块5031用于通过提取划分的会话(session)中的有用字段来计算目标(goal)数据。
目标集合形成子模块5032用于利用主题分类技术来计算每个目标的主题,并将每个用户主题分类相同的目标归并在一起以形成多个目标集合。
术语共现图建立子模块5033用于对每个目标集合进行分词以建立术语共现图。
用户兴趣点/关注点识别子模块5034用于通过应用图聚类算法来识别用户兴趣点/关注点。
通过根据本发明的根据用户兴趣点/关注点进行个性化推荐的方法和***,通过判定出用户的兴趣点/关注点,从而向用户推荐更符合用户兴趣点/关注点的产品,从而提高用户的满意度。
尽管已经参照本发明实施例具体显示和描述了本发明,但是本领域的技术人员应该理解,在不脱离由权利要求限定的本发明的精神和范围的情况下,可以对其进行形式和细节上的各种改变。

Claims (8)

1.一种根据用户兴趣点/关注点进行个性化推荐的方法,该方法包括:
(a)整合用户在多个产品线上的在预定时间段内的用户行为日志,所述用户行为日志为用户搜索点击行为日志;
(b)针对用户在预定时间段内的行为日志进行会话划分,其中,同一会话是指用户在一段连续时间内为满足某个单一信息需求的搜索点击行为;
(c)对划分的会话的用户行为日志进行同类需求行为信息整合并且挖掘用户关注点/兴趣点;
(d)根据挖掘出的用户兴趣点/关注点通过推荐排序模型展示针对用户兴趣点/关注点的个性化推荐,
其中,步骤(b)包括以下子步骤:
针对用户在预定时间段内的行为日志进行块划分;
通过使用分类器来判断划分的块集合所在的会话,
其中,判断划分的块集合所在的会话的步骤包括:
通过遍历划分的块集合,对于给定当前块,首先判断是否和上一个块同属于一个会话中;
如果是,则将该块归入前一个块所在的会话;否则利用回溯策略,判断往前看预定时间内的所有块中是否有与当前块同属于一个会话的块,如果有,则将当前块归入找到的块所在的会话中,否则将当前块归入新的会话中,
其中,步骤(c)包括以下子步骤:
通过提取划分的会话中的特定字段来计算目标数据,其中,所述特定字段包括查询字段;
利用主题分类技术来计算每个目标的主题,并将每个主题分类相同的目标归并在一起以形成多个目标集合;
对每个目标集合进行分词以建立术语共现图;
通过应用图聚类算法来识别用户兴趣点/关注点。
2.如权利要求1所述的方法,其中,所述块划分基于以下规则中的至少一个来执行:
规则1:时间完全相同的连续日志归为同一个块;
规则2:如果连续的2条日志时间间隔大于一定时间,则归为不同的块;
规则3:如果连续日志的产品线为特定产品线,则将之归为同一个块;
规则4:对比当前日志中抽取的文本信息和上一条日志中抽取的文本信息是否相同,如果相同则归为同一个块,否则为新的一个块的开始。
3.如权利要求1所述的方法,其中,展示针对用户兴趣点/关注点的个性化推荐的步骤包括:
当用户在搜索引擎中进行搜索时,基于用户输入的搜索词将符合用户兴趣点/关注点的个性化推荐显示在搜索结果的前面。
4.如权利要求1所述的方法,其中,展示针对用户兴趣点/关注点的个性化推荐的步骤包括:
在用户浏览网页时,在除浏览的网页的主要区块的其余区块中显示符合用户兴趣点/关注点的个性化推荐。
5.一种根据用户兴趣点/关注点进行个性化推荐的***,该***包括:
整合数据源模块,用于整合用户在多个产品线上的在预定时间段内的用户行为日志,所述用户行为日志为用户搜索点击行为日志;
会话划分模块,用于针对用户在预定时间段内的行为日志进行会话划分,其中,同一会话是指用户在一段连续时间内为满足某个单一信息需求的搜索点击行为;
关注点/兴趣点挖掘模块,用于对划分的会话的用户行为日志进行同类需求行为信息整合并且挖掘用户关注点/兴趣点;
个性化推荐模块,用于根据挖掘出的用户兴趣点/关注点通过推荐排序模型展示针对用户兴趣点/关注点的个性化推荐,其中,会话划分模块包括:
块划分子模块,用于针对用户在预定时间段内的行为日志进行块划分;
会话划分子模块,用于通过使用分类器来判断划分的块集合所在的会话,
其中,会话划分子模块通过以下步骤来判断划分的块集合所在的会话:
通过遍历划分的块集合,对于给定当前块,首先判断是否和上一个块同属于一个会话中;
如果是,则将该块归入前一个块所在的会话;否则利用回溯策略,判断往前看预定时间内的所有块中是否有与当前块同属于一个会话的块,如果有,则将当前块归入找到的块所在的会话中,否则将当前块归入新的会话中,
其中,关注点/兴趣点挖掘模块包括:
目标数据计算子模块,用于通过提取划分的会话中的特定字段来计算目标数据,其中,所述特定字段包括查询字段;
目标集合形成子模块,用于利用主题分类技术来计算每个目标的主题,并将每个主题分类相同的目标归并在一起以形成多个目标集合;
术语共现图建立子模块,用于对每个目标集合进行分词以建立术语共现图;
用户兴趣点/关注点识别子模块,用于通过应用图聚类算法来识别用户兴趣点/关注点。
6.如权利要求5所述的***,其中,块划分子模块基于以下规则中的至少一个来执行块划分:
规则1:时间完全相同的连续日志归为同一个块;
规则2:如果连续的2条日志时间间隔大于一定时间,则归为不同的块;
规则3:如果连续日志的产品线为特定产品线,则将之归为同一个块;
规则4:对比当前日志中抽取的文本信息和上一条日志中抽取的文本信息是否相同,如果相同则归为同一个块,否则为新的一个块的开始。
7.如权利要求5所述的***,其中,当用户在搜索引擎中进行搜索时,通过基于用户输入的搜索词将符合用户兴趣点/关注点的个性化推荐显示在搜索结果的前面,个性化推荐模块来展示针对用户兴趣点/关注点的个性化推荐。
8.如权利要求5所述的***,其中,在用户浏览网页时,通过在除浏览的网页的主要区块的其余区块中显示符合用户兴趣点/关注点的个性化推荐,个性化推荐模块来展示针对用户兴趣点/关注点的个性化推荐。
CN201310304671.2A 2013-07-19 2013-07-19 根据用户兴趣点/关注点进行个性化推荐的方法和*** Active CN103399883B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310304671.2A CN103399883B (zh) 2013-07-19 2013-07-19 根据用户兴趣点/关注点进行个性化推荐的方法和***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310304671.2A CN103399883B (zh) 2013-07-19 2013-07-19 根据用户兴趣点/关注点进行个性化推荐的方法和***

Publications (2)

Publication Number Publication Date
CN103399883A CN103399883A (zh) 2013-11-20
CN103399883B true CN103399883B (zh) 2017-02-08

Family

ID=49563513

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310304671.2A Active CN103399883B (zh) 2013-07-19 2013-07-19 根据用户兴趣点/关注点进行个性化推荐的方法和***

Country Status (1)

Country Link
CN (1) CN103399883B (zh)

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103699630B (zh) * 2013-12-20 2017-05-03 北京奇虎科技有限公司 一种在浏览器中推荐信息的方法与装置
CN104750760B (zh) * 2013-12-31 2018-11-23 ***通信集团上海有限公司 一种推荐应用软件的实现方法及装置
CN103870541B (zh) * 2014-02-24 2017-05-31 微梦创科网络科技(中国)有限公司 社交网络用户兴趣挖掘方法和***
CN104933049B (zh) * 2014-03-17 2019-02-19 华为技术有限公司 生成数字人的方法及***
EP3163465A4 (en) 2014-06-25 2018-03-14 Beijing Baidupay Science And Technology Co., Ltd. Method and device for data mining based on user's search behaviour
CN104462248B (zh) * 2014-11-19 2019-05-24 北京奇虎科技有限公司 提供网页内容的方法、装置和服务器
CN105809464A (zh) * 2014-12-31 2016-07-27 中国电信股份有限公司 信息投放方法和装置
CN108197331B (zh) * 2015-01-21 2020-02-04 北京字节跳动科技有限公司 用户兴趣的探索方法和装置
CN105302879B (zh) * 2015-10-12 2019-03-08 百度在线网络技术(北京)有限公司 用于确定用户需求的方法与装置
CN105224807B (zh) * 2015-10-14 2018-09-14 东软集团股份有限公司 病例审核规则提取方法及装置,病例审核方法及***
CN105718545A (zh) * 2016-01-18 2016-06-29 合一网络技术(北京)有限公司 多媒体资源的推荐方法和装置
CN105868360A (zh) * 2016-03-29 2016-08-17 乐视控股(北京)有限公司 基于语音识别的内容推荐方法及装置
CN106021516A (zh) * 2016-05-24 2016-10-12 百度在线网络技术(北京)有限公司 搜索方法及装置
CN105956204B (zh) * 2016-07-01 2019-08-02 北京奇虎科技有限公司 会话Session满意度评估的方法及装置
WO2018018196A1 (zh) * 2016-07-24 2018-02-01 严映军 一种书籍兴趣判断的方法和判断***
CN106293119A (zh) * 2016-07-29 2017-01-04 百度在线网络技术(北京)有限公司 一种在输入法中进行信息推荐的方法与装置
CN107817976A (zh) * 2016-09-12 2018-03-20 阿里巴巴集团控股有限公司 页面信息处理***及页面生成、页面信息提供方法及装置
CN106339502A (zh) * 2016-09-18 2017-01-18 电子科技大学 一种基于用户行为数据分片聚类的建模推荐方法
CN107169014B (zh) * 2017-03-31 2021-03-19 百度在线网络技术(北京)有限公司 Poi推荐方法、装置、设备及计算机可读存储介质
CN107220312B (zh) * 2017-05-12 2020-08-14 华中科技大学 一种基于共现图的兴趣点推荐方法及***
CN107688600B (zh) * 2017-07-12 2021-06-25 百度在线网络技术(北京)有限公司 知识点挖掘方法及装置
CN107679079A (zh) * 2017-08-29 2018-02-09 重庆邮电大学 基于手机用户兴趣三维模型的个性化应用推荐方法
CN110022484A (zh) * 2018-01-08 2019-07-16 武汉斗鱼网络科技有限公司 一种展示方法、装置、服务器及介质
CN108335147B (zh) * 2018-02-28 2021-08-13 北京搜狐新媒体信息技术有限公司 一种基于用户行为的数据分析方法及***
CN108427756B (zh) * 2018-03-16 2021-02-12 中国人民解放军国防科技大学 基于同类用户模型的个性化查询词补全推荐方法和装置
CN108345698B (zh) * 2018-03-22 2022-03-11 北京百度网讯科技有限公司 文章关注点挖掘方法和装置
CN109214923A (zh) * 2018-08-02 2019-01-15 阿里巴巴集团控股有限公司 一种理财任务生成方法和装置
CN109902706B (zh) * 2018-11-09 2023-08-22 华为技术有限公司 推荐方法及装置
CN111475734A (zh) * 2018-12-25 2020-07-31 杭州铭智云教育科技有限公司 一种推送目标文献名录的方法
CN110209937A (zh) * 2019-05-31 2019-09-06 三角兽(北京)科技有限公司 基于用户行为的信息推送方法及装置
CN112148960B (zh) * 2019-06-27 2024-03-22 北京百度网讯科技有限公司 关注点的类别确定方法、装置、设备及存储介质
CN113111251A (zh) * 2020-01-10 2021-07-13 阿里巴巴集团控股有限公司 项目推荐方法、装置及***
CN111949865A (zh) * 2020-08-10 2020-11-17 杭州电子科技大学 基于图神经网络与用户长短期偏好的兴趣点推荐方法
CN112765400B (zh) * 2020-12-31 2024-04-23 上海众源网络有限公司 兴趣标签的权重更新方法、内容推荐方法、装置及设备
CN113761383B (zh) * 2021-10-13 2023-06-20 中国人民大学 一种基于统一用户行为建模的搜索和推荐融合***
CN114818643B (zh) * 2022-06-21 2022-10-04 北京必示科技有限公司 一种保留特定业务信息的日志模板提取方法及装置
CN114840486B (zh) * 2022-06-28 2022-09-16 广州趣米网络科技有限公司 用户行为数据采集方法、***及云平台

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6668278B1 (en) * 1996-12-20 2003-12-23 Liberate Technologies Information retrieval system using an internet multiplexer to focus user selection
CN102982042A (zh) * 2011-09-07 2013-03-20 ***通信集团公司 一种个性化内容推荐方法、平台以及***

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6668278B1 (en) * 1996-12-20 2003-12-23 Liberate Technologies Information retrieval system using an internet multiplexer to focus user selection
CN102982042A (zh) * 2011-09-07 2013-03-20 ***通信集团公司 一种个性化内容推荐方法、平台以及***

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
Web使用挖掘的个性化推荐***研究;苏欣;《中国优秀硕士学位论文全文数据库·信息科技辑》;20121015(第10期);参见3.2-3.4节,4.2节 *
WEB使用挖掘研究;黄浩 等;《计算机***应用》;20080131(第1期);全文 *
Web日志预处理中优化的会话识别方法;方元康 等;《计算机工程》;20090430;第35卷(第7期);全文 *
图聚类算法的评价模型;梅娟 等;《计算机工程与应用》;20121231(第14期);全文 *
基于词共现图的中文微博新闻话题识别;赵文清 等;《智能***学报》;20121031;第7卷(第5期);参见摘要,1.2-1.4节 *
数据挖掘技术在网站个性化推荐中的应用;彭建光;《中国优秀硕士学位论文全文数据库·信息科技辑》;20071015(第04期);全文 *

Also Published As

Publication number Publication date
CN103399883A (zh) 2013-11-20

Similar Documents

Publication Publication Date Title
CN103399883B (zh) 根据用户兴趣点/关注点进行个性化推荐的方法和***
Ingwersen et al. Smart city research 1990–2016
CN103491205B (zh) 一种基于视频搜索的关联资源地址的推送方法和装置
CN104063383B (zh) 信息推荐方法及装置
US8650198B2 (en) Systems and methods for facilitating the gathering of open source intelligence
CN103116657B (zh) 一种网络教学资源的个性化搜索方法
CN102968465B (zh) 网络信息服务平台及其基于该平台的搜索服务方法
CN102169503B (zh) 一种获取与用户查询序列相对应的搜索结果的方法与设备
CN103023714B (zh) 基于网络话题的活跃度与集群结构分析***及方法
CN107730343A (zh) 一种基于图片属性提取的用户商品信息推送方法及设备
CN104111941B (zh) 信息展示的方法及设备
CN104484431B (zh) 一种基于领域本体的多源个性化新闻网页推荐方法
CN104102639B (zh) 基于文本分类的推广触发方法和装置
CN111191044A (zh) 一种基于大数据的知识抽取与融合方法
CN103620583A (zh) 根据浏览活动显现应用
CN103914492A (zh) 查询词融合方法、商品信息发布方法和搜索方法及***
CN102663022B (zh) 一种基于url的分类识别方法
CN103390044B (zh) 一种连锁类兴趣点数据识别方法及装置
CN105794154A (zh) 用于分析传输社交通信数据的***和方法
CN103399855B (zh) 基于多数据源的行为意图确定方法及装置
CN102122291A (zh) 一种基于树形日志模式分析的博客好友推荐方法
CN103593474A (zh) 基于深度学习的图像检索排序方法
CN104794242A (zh) 一种搜索方法
CN103365904A (zh) 一种广告信息搜索方法和***
KR20120033821A (ko) 인맥에 기초한 검색 결과 제공 시스템 및 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant