一种基于大数据的资讯消息内容智能推送***及方法
技术领域
本发明涉及大数据技术领域,具体为一种基于大数据的资讯消息内容智能推送***及方法。
背景技术
随着网络技术的发展,互联网上的信息越来越多,用户往往通过搜索引擎来查阅相关信息。当用户在网络上观看连续上传的一些内容时,需要每次进入同一网页查看是否有更新,有的时候一些内容更新的时间不精确定时,从而导致用户需要经常查看网页,占用用户大量的时间,比较繁琐。
现有技术中,有针对用户关注的内容进行更新提醒的技术,但是对用户关注的内容采用统一的方式进行更新提醒,对于用户的个人针对性不强。
发明内容
本发明的目的在于提供一种基于大数据的资讯消息内容智能推送***及方法,以解决上述背景技术中提出的问题。
为了解决上述技术问题,本发明提供如下技术方案:一种基于大数据的资讯消息内容智能推送***,所述智能推送***包括用户订阅库、订阅监控模块、标识分析模块和标识获取模块,所述用户订阅库用于存储用户的订阅内容,所述订阅监控模块对用户订阅库的内容进行监控,当监控到用户订阅内容存在更新时,令标识分析模块分析用户对订阅内容的观看信息据此确定订阅内容的标识信息,所述标识获取模块获取订阅内容的标识信息,如果订阅内容的标识信息为第一标识,将订阅内容的更新内容推送给用户,如果订阅内容的标识信息为第二标识,那么生成订阅内容的更新信息推送给用户。
进一步的,所述标识分析模块包括初判指数计算模块、初判指数比较模块、候选时长分析模块、参照时长获取模块、关注指数计算模块和关注指数比较模块,所述初判指数计算模块设某个订阅内容为待分析订阅,获取待分析订阅的历史更新内容个数Uz以及用户待分析订阅观看过的更新内容个数Us,那么待分析订阅的初判指数V=Us/Uz,所述初判指数比较模块将待分析订阅的初判指数与初判阈值进行比较,如果待分析订阅的初判指数小于等于初判阈值,那么给该待分析订阅添加第二标识信息如果待分析订阅的初判指数大于初判阈值,所述关注指数计算模块获取用户最近看过的待分析订阅的k个更新信息,并据此计算待分析订阅的关注指数其中,hi为用户最近观看待分析订阅的第i个更新信息所花费的时间,H为用户最近观看待分析订阅的k个更新信息所花费的时间之和,Di为用户最近观看待分析订阅的第i个更新信息过程中的参照时长,所述候选时长分析模块在用户观看待分析订阅的某个更新信息时,获取用户在观看该个更新信息的某个页面的停留时长,如果某个页面的停留时长大于等于停留阈值,那么获取在该个页面停留之后第一次检测到页面滑动时页面滑动的速度,如果页面滑动速度小于速度阈值,那么该个停留时长为候选时长,所述参照时长获取模块获取用户观看待分析订阅的某个更新信息时的所有的候选时长,将该个更新信息的所有的候选时长按照从大到小的顺序排序,选取排序第一的候选时长为该个更新信息的参照时长,所述关注指数比较模块将待分析订阅的关注指数与关注阈值进行比较,如果待分析订阅的关注指数大于等于关注阈值,那么给该待分析订阅添加第一标识信息。
进一步的,所述智能推送***还包括关联订阅选取模块,所述关联订阅选取模块包括关联指数计算模块获取用户每次观看用户订阅内容的情况,设某一个订阅内容为基订阅,用户订阅库中除基订阅以外的订阅内容为候选订阅,那么某个候选订阅与基订阅的关联指数G=Rs/Rz,其中,Rz为历史观看基订阅的次数,Rs为历史观看基订阅的次数中也观看了候选订阅的次数,所述关联指数比较模块在存在某个候选订阅与基订阅的关联指数大于关联阈值,那么该个候选订阅为基订阅的关联订阅。
进一步的,所述标识分析模块还包括波及指数计算模块和波及指数比较模块,如果待分析订阅的关注指数小于关注阈值,所述波及指数计算模块获取待分析订阅的关联订阅的观看情况,计算待分析订阅的波及指数b=Qs/Qz,其中,Qz为待分析订阅的基订阅的个数,Qs为待分析的各个基订阅最近一次更新订阅信息时被观看的基订阅的个数,所述波及指数比较模块将待分析订阅的波及指数与波及阈值进行比较,如果待分析订阅的波及指数大于波及阈值,给该待分析订阅添加第一标识信息,如果待分析订阅的波及指数小于等于波及阈值,给该待分析订阅添加第二标识信息。
一种基于大数据的资讯消息内容智能推送方法,所述智能推送方法包括以下步骤:
建立用户订阅库,所述用户订阅库用于存储用户的订阅内容,
对用户订阅库的内容进行监控,当监控到用户订阅内容存在更新时,获取订阅内容的标识信息,其中,分析用户对订阅内容的观看信息据此确定订阅内容的标识信息,
如果订阅内容的标识信息为第一标识,将订阅内容的更新内容推送给用户;
如果订阅内容的标识信息为第二标识,那么生成订阅内容的更新信息推送给用户。
进一步的,所述分析用户对订阅内容的观看信息据此确定订阅内容的标识信息包括:
设某个订阅内容为待分析订阅,获取待分析订阅的历史更新内容个数Uz以及用户待分析订阅观看过的更新内容个数Us,那么待分析订阅的初判指数V=Us/Uz,
如果待分析订阅的初判指数小于等于初判阈值,那么给该待分析订阅添加第二标识信息,
如果待分析订阅的初判指数大于初判阈值,获取用户最近看过的待分析订阅的k个更新信息,其中,当用户观看待分析订阅的某个更新信息时,获取用户在观看该个更新信息的某个页面的停留时长,如果某个页面的停留时长大于等于停留阈值,那么获取在该个页面停留之后第一次检测到页面滑动时页面滑动的速度,如果页面滑动速度小于速度阈值,那么该个停留时长为候选时长,获取用户观看待分析订阅的某个更新信息时的所有的候选时长,将该个更新信息的所有的候选时长按照从大到小的顺序排序,选取排序第一的候选时长为该个更新信息的参照时长,
计算待分析订阅的关注指数其中,hi为用户最近观看待分析订阅的第i个更新信息所花费的时间,H为用户最近观看待分析订阅的k个更新信息所花费的时间之和,Di为用户最近观看待分析订阅的第i个更新信息过程中的参照时长,
将待分析订阅的关注指数与关注阈值进行比较,如果待分析订阅的关注指数大于等于关注阈值,那么给该待分析订阅添加第一标识信息。
进一步的,所述智能推送方法还包括:
获取用户每次观看用户订阅内容的情况,设某一个订阅内容为基订阅,用户订阅库中除基订阅以外的订阅内容为候选订阅,
那么某个候选订阅与基订阅的关联指数G=Rs/Rz,其中,Rz为历史观看基订阅的次数,Rs为历史观看基订阅的次数中也观看了候选订阅的次数,
如果存在某个候选订阅与基订阅的关联指数大于关联阈值,那么该个候选订阅为基订阅的关联订阅。
进一步的,所述将待分析订阅的关注指数与关注阈值进行比较还包括:
如果待分析订阅的关注指数小于关注阈值,获取待分析订阅的关联订阅的观看情况,
计算待分析订阅的波及指数b=Qs/Qz,其中,Qz为待分析订阅的基订阅的个数,Qs为待分析的各个基订阅最近一次更新订阅信息时被观看的基订阅的个数,
将待分析订阅的波及指数与波及阈值进行比较,
如果待分析订阅的波及指数大于波及阈值,给该待分析订阅添加第一标识信息。
进一步的,所述将待分析订阅的波及指数与波及阈值进行比较还包括:
如果待分析订阅的波及指数小于等于波及阈值,给该待分析订阅添加第二标识信息。
与现有技术相比,本发明所达到的有益效果是:本发明预先建立用户订阅库,当监控到用户订阅内容存在更新时,根据用户历史观看订阅内容的更新信息的情况来判断是将订阅内容的更新内容推送给用户还是仅仅生成订阅内容的更新信息推送给用户,不仅省去了用户自己去查看追踪订阅内容的更新情况,还针对不同的订阅内容推送不同的方式,用户针对性更强。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1是本发明基于大数据的资讯消息内容智能推送***的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,本发明提供技术方案:一种基于大数据的资讯消息内容智能推送***,所述智能推送***包括用户订阅库、订阅监控模块、标识分析模块和标识获取模块,所述用户订阅库用于存储用户的订阅内容,所述订阅监控模块对用户订阅库的内容进行监控,当监控到用户订阅内容存在更新时,令标识分析模块分析用户对订阅内容的观看信息据此确定订阅内容的标识信息,所述标识获取模块获取订阅内容的标识信息,如果订阅内容的标识信息为第一标识,将订阅内容的更新内容推送给用户,如果订阅内容的标识信息为第二标识,那么生成订阅内容的更新信息推送给用户。
所述标识分析模块包括初判指数计算模块、初判指数比较模块、候选时长分析模块、参照时长获取模块、关注指数计算模块和关注指数比较模块,所述初判指数计算模块设某个订阅内容为待分析订阅,获取待分析订阅的历史更新内容个数Uz以及用户待分析订阅观看过的更新内容个数Us,那么待分析订阅的初判指数V=Us/Uz,所述初判指数比较模块将待分析订阅的初判指数与初判阈值进行比较,如果待分析订阅的初判指数小于等于初判阈值,那么给该待分析订阅添加第二标识信息如果待分析订阅的初判指数大于初判阈值,所述关注指数计算模块获取用户最近看过的待分析订阅的k个更新信息,并据此计算待分析订阅的关注指数其中,hi为用户最近观看待分析订阅的第i个更新信息所花费的时间,H为用户最近观看待分析订阅的k个更新信息所花费的时间之和,Di为用户最近观看待分析订阅的第i个更新信息过程中的参照时长,所述候选时长分析模块在用户观看待分析订阅的某个更新信息时,获取用户在观看该个更新信息的某个页面的停留时长,如果某个页面的停留时长大于等于停留阈值,那么获取在该个页面停留之后第一次检测到页面滑动时页面滑动的速度,如果页面滑动速度小于速度阈值,那么该个停留时长为候选时长,所述参照时长获取模块获取用户观看待分析订阅的某个更新信息时的所有的候选时长,将该个更新信息的所有的候选时长按照从大到小的顺序排序,选取排序第一的候选时长为该个更新信息的参照时长,所述关注指数比较模块将待分析订阅的关注指数与关注阈值进行比较,如果待分析订阅的关注指数大于等于关注阈值,那么给该待分析订阅添加第一标识信息。
所述智能推送***还包括关联订阅选取模块,所述关联订阅选取模块包括关联指数计算模块获取用户每次观看用户订阅内容的情况,设某一个订阅内容为基订阅,用户订阅库中除基订阅以外的订阅内容为候选订阅,那么某个候选订阅与基订阅的关联指数G=Rs/Rz,其中,Rz为历史观看基订阅的次数,Rs为历史观看基订阅的次数中也观看了候选订阅的次数,所述关联指数比较模块在存在某个候选订阅与基订阅的关联指数大于关联阈值,那么该个候选订阅为基订阅的关联订阅。
所述标识分析模块还包括波及指数计算模块和波及指数比较模块,如果待分析订阅的关注指数小于关注阈值,所述波及指数计算模块获取待分析订阅的关联订阅的观看情况,计算待分析订阅的波及指数b=Qs/Qz,其中,Qz为待分析订阅的基订阅的个数,Qs为待分析的各个基订阅最近一次更新订阅信息时被观看的基订阅的个数,所述波及指数比较模块将待分析订阅的波及指数与波及阈值进行比较,如果待分析订阅的波及指数大于波及阈值,给该待分析订阅添加第一标识信息,如果待分析订阅的波及指数小于等于波及阈值,给该待分析订阅添加第二标识信息。
一种基于大数据的资讯消息内容智能推送方法,所述智能推送方法包括以下步骤:
建立用户订阅库,所述用户订阅库用于存储用户的订阅内容,
对用户订阅库的内容进行监控,当监控到用户订阅内容存在更新时,获取订阅内容的标识信息,其中,分析用户对订阅内容的观看信息据此确定订阅内容的标识信息,
所述分析用户对订阅内容的观看信息据此确定订阅内容的标识信息包括:
设某个订阅内容为待分析订阅,获取待分析订阅的历史更新内容个数Uz以及用户待分析订阅观看过的更新内容个数Us,那么待分析订阅的初判指数V=Us/Uz,比如用户订阅库中有一个博客,那么Us为用户观看过的这个博客中的博文的篇数,Uz为这个博客中的博文的总篇数,或者在实际中Uz也可以选取自用户将该个博客存入用户订阅库中博客的博文更新的总篇数;
如果待分析订阅的初判指数小于等于初判阈值,那么给该待分析订阅添加第二标识信息,当待分析订阅的初判指数比较小的时候,说明用户已经好久不看待分析订阅的更新内容了,对待分析订阅的更新内容没啥兴趣,
如果待分析订阅的初判指数大于初判阈值,说明用户对待分析订阅的更新内容可能兴趣较大,也有可能只是简单的过一下,扫一眼,
获取用户最近看过的待分析订阅的k个更新信息,其中,当用户观看待分析订阅的某个更新信息时,获取用户在观看该个更新信息的某个页面的停留时长,如果某个页面的停留时长大于等于停留阈值,那么获取在该个页面停留之后第一次检测到页面滑动时页面滑动的速度,如果页面滑动速度小于速度阈值,那么该个停留时长为候选时长,获取用户观看待分析订阅的某个更新信息时的所有的候选时长,将该个更新信息的所有的候选时长按照从大到小的顺序排序,选取排序第一的候选时长为该个更新信息的参照时长,
用户在观看待分析订阅的更新信息时,不一定每个地方用户都会仔细的看,可能会出现用户有的地方仔细看,有的地方粗略的看,也有可能出现用户直接都不是仔细看的情况,当用户对待分析订阅的更新信息仔细看的情况时,说明用户对待分析订阅的兴趣较大;本申请考虑到用户在观看过程中往往会有一个找寻是否存在自己想看或者感兴趣的内容的可知,在感兴趣的情况下,会慢慢滑动页面往下看,在不感兴趣的情况下,会直接快速的滑动页面找寻下一处感兴趣的地方,基于此来选取候选时长,当候选时长越长的情况下,说明用户对待分析订阅的更新信息越感兴趣;
计算待分析订阅的关注指数其中,hi为用户最近观看待分析订阅的第i个更新信息所花费的时间,H为用户最近观看待分析订阅的k个更新信息所花费的时间之和,Di为用户最近观看待分析订阅的第i个更新信息过程中的参照时长,
将待分析订阅的关注指数与关注阈值进行比较,如果待分析订阅的关注指数大于等于关注阈值,当待分析订阅的关注指数越大,说明用户在观看待分析订阅的更新内容过程对更新内容进行了仔细观看,那么给该待分析订阅添加第一标识信息;
如果待分析订阅的关注指数小于关注阈值,获取待分析订阅的关联订阅的观看情况,
计算待分析订阅的波及指数b=Qs/Qz,其中,Qz为待分析订阅的基订阅的个数,Qs为待分析的各个基订阅最近一次更新订阅信息时被观看的基订阅的个数,
将待分析订阅的波及指数与波及阈值进行比较,
如果待分析订阅的波及指数大于波及阈值,当待分析订阅的波及指数越大,说明有可能用户还对此有感兴趣的倾向,给该待分析订阅添加第一标识信息;
如果待分析订阅的波及指数小于等于波及阈值,当待分析订阅的波及指数越小,说明用户对于待分析订阅及其关联订阅的兴趣较小,给该待分析订阅添加第二标识信息。
所述智能推送方法还包括:
获取用户每次观看用户订阅内容的情况,设某一个订阅内容为基订阅,用户订阅库中除基订阅以外的订阅内容为候选订阅,
那么某个候选订阅与基订阅的关联指数G=Rs/Rz,其中,Rz为历史观看基订阅的次数,Rs为历史观看基订阅的次数中也观看了候选订阅的次数,
如果存在某个候选订阅与基订阅的关联指数大于关联阈值,那么该个候选订阅为基订阅的关联订阅。
如果订阅内容的标识信息为第一标识,说明用户比较重视该订阅内容,所以将订阅内容的更新内容推送给用户,便于用户观看订阅内容最新信息;
如果订阅内容的标识信息为第二标识,说明用户对于该订阅内容的观看兴趣没有那么大了,所以仅仅生成订阅内容的更新信息推送给用户,提醒一下用户。比如,当用户关注了一个博客,博主某天更新了一篇文章,如果这个博客在用户订阅数据库内的标识为第一标识,那就直接把这个更新的文章发给用户,如果这个博客在用户订阅数据库内的标识为第二标识,直接给用户发送这个博客更新了文章的信息。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。