CN108304428A - 信息推荐方法及装置 - Google Patents
信息推荐方法及装置 Download PDFInfo
- Publication number
- CN108304428A CN108304428A CN201710299871.1A CN201710299871A CN108304428A CN 108304428 A CN108304428 A CN 108304428A CN 201710299871 A CN201710299871 A CN 201710299871A CN 108304428 A CN108304428 A CN 108304428A
- Authority
- CN
- China
- Prior art keywords
- group
- information
- recommendation
- account number
- scoring
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/74—Browsing; Visualisation therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/735—Filtering based on additional data, e.g. user or group profiles
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种信息推荐方法及装置,属于计算机技术领域。所述方法包括:确定目标帐号加入的群组;根据每个群组中的群组成员查看过的历史信息,确定每个群组所对应的信息推荐列表;根据所述信息推荐列表向所述目标帐号推荐信息。解决了现有技术中在目标帐号为新注册的帐号时,服务器无法根据该目标帐号的历史浏览信息向该目标帐号发送推荐信息,也即此时服务器只会发送默认的推荐信息至目标帐号,发送的推荐信息的准确率较低的问题;达到了即使目标帐号为新帐号,服务器仍然可以根据该帐号所加入的群组来为该目标帐号发送推荐信息,提高了推荐的信息的准确率的效果。
Description
技术领域
本发明实施例涉及计算机技术领域,特别涉及一种信息推荐方法及装置。
背景技术
在视频播放客户端中,服务器可以向用户推荐用户可能感兴趣的视频。
现有的视频推荐方法包括:服务器获取目标帐号的历史观看记录;根据该历史观看记录向该目标帐号推荐相关的视频。比如,推荐与历史观看记录中同种类型的视频,如推荐搞笑视频。
如果目标帐号为新注册的帐号时,则历史观看记录中的内容可能很少,也即该历史观看记录并不能表征用户的兴趣,因此服务器根据该历史观看记录为该目标帐号推荐视频时,推荐的视频并不一定是用户感兴趣的视频,也即推荐的视频的准确率较低。
发明内容
为了解决现有技术中存在的问题,本发明实施例提供了一种信息推荐方法及装置。技术方案如下:
根据本发明实施例的第一方面,提供一种信息推荐方法,该方法包括:
确定目标帐号加入的群组;
根据每个群组中的群组成员查看过的历史信息,确定每个群组所对应的信息推荐列表;
根据所述信息推荐列表向所述目标帐号推荐信息。
根据本发明实施例的第二方面,提供一种信息推荐装置,该方法包括:
群组确定模块,用于确定目标帐号加入的群组;
列表确定模块,用于根据每个群组中的群组成员历史查看过的历史信息,确定每个群组所对应的信息推荐列表;
信息发送模块,用于根据所述列表确定模块确定的所述信息推荐列表向所述目标帐号推荐信息。
本发明实施例提供的技术方案带来的有益效果是:
通过确定目标帐号加入的群组,进而根据群组中的群组成员查看的历史信息来生成该群组的信息推荐列表,根据各个信息推荐列表向目标帐号推荐信息;解决了现有技术中在目标帐号为新注册的帐号时,服务器无法根据该目标帐号的历史浏览信息向该目标帐号发送推荐信息,也即此时服务器只会发送默认的推荐信息至目标帐号,发送的推荐信息的准确率较低的问题;达到了即使目标帐号为新帐号,服务器仍然可以根据该帐号所加入的群组来为该目标帐号发送推荐信息,提高了推荐的信息的准确率的效果。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明各个实施例所涉及的实施环境的示意图;
图2是本发明一个实施例提供的信息推荐方法的流程图;
图3是本发明一个实施例提供的发送推荐信息的流程图;
图4是本发明一个实施例提供的信息推荐方法的框图;
图5是本发明一个实施例提供的不同信息推荐方法推荐的信息的性能的示意图;
图6本发明一个实施例提供的不同信息推荐方法推荐的信息的性能的另一示意图;
图7是本发明一个实施例提供的信息推荐装置的示意图;
图8是本发明一个实施例提供的服务器的示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
请参考图1,其示出了本发明各个实施例所涉及的实施环境的示意图,如图1所示,该实施环境可以包括终端110和服务器120。
终端110可以登录目标帐号。实际实现时,终端110中可以运行有客户端,比如,可以运行有视频播放客户端、音频播放客户端或者新闻客户端,并在运行的客户端中登录目标帐号;可选地,终端110还可以在网页中登录该目标帐号,本实施例对此并不做限定。该目标帐号为支持群组功能的社交应用客户端的帐号,并且该社交应用客户端与上述所说的客户端可以为同一客户端,也可以为不同客户端,对此并不做限定。另外,本实施例所说的群组可以为通常意义上的群组也可以为多人聊天的讨论组,对此并不做限定。终端110可以为诸如手机、平板电脑、电子阅读器、台式电脑或者笔记本电脑之类的终端,对此并不做限定。
终端110可以通过有线或者无线网络与服务器120连接。
服务器120是用于为终端110提供后台服务的后台服务器,该服务器120可以为一台服务器,也可以为由多台服务器组成的服务器集群。比如,以终端110在网页中登录该目标帐号为例,对于此种情况,服务器120可以包括终端110中的搜索客户端所对应的后台服务器以及目标帐号所对应的社交应用客户端所对应的服务器。实际实现时,服务器120具备通过终端110中登录的目标帐号自动向终端110发送推荐信息的能力。
请参考图2,其示出了本发明一个实施例提供的信息推荐方法的方法流程图,本实施例以该信息推荐方法用于图1所示的服务器120中来举例说明。如图2所示,该信息推荐方法可以包括:
步骤201,确定目标帐号加入的群组。
服务器中可以存储有各个帐号的描述信息,该描述信息包括帐号的好友关系链、帐号加入的群组、帐号ID(Identification,身份标识)、帐号昵称等等,因此,服务器可以从目标帐号的描述信息中获取到目标帐号加入的群组。
可选地,服务器可以在接收到目标帐号的上线请求时,确定目标帐号加入的群组;或者,服务器可以定时确定处于在线状态的目标帐号加入的群组,比如,每天16:30确定在线的各个目标帐号加入的群组;又或者,在接收到来自目标帐号的打开预设界面的打开请求时,确定目标帐号加入的群组,比如,接收到目标帐号打开信息界面的打开请求时,确定目标帐号加入的群组。当然实际实现时,服务器还可以在其他场景下,执行确定目标帐号加入的群组的步骤,本实施例对此并不做限定。
本实施例以服务器向视频播放客户端推荐视频为例,服务器可以在视频播放客户端通过目标帐号登录时,确定该目标帐号加入的群组。
步骤202,获取每个群组中的群组成员查看过的历史信息的推荐指数。
历史信息是指群组中的群组成员历史查看过的历史信息,该历史信息可以为群组成员查看过的服务器推荐的信息,也可以为查看过的自己主动搜索的信息,对此并不做限定。并且实际实现时,该历史信息可以为视频信息、音频信息或者其它类型的信息。下述实施例除特殊说明外,以信息为视频信息,也即向目标帐号推荐视频来举例说明。
可选地,本步骤可以包括:
第一,获取每个群组中的各条历史信息的推荐因子,推荐因子包括历史信息的群内热度和/或历史信息的区分度。其中,群内热度用于表示该历史信息在群组内被查看的程度,区分度用于表示该历史信息区分其他历史信息的程度。
以推荐因子包括历史信息的群内热度为例,服务器获取群内热度的步骤包括:对于每个群组,服务器统计群组中查看该历史信息的群组成员的个数,将统计得到的个数作为该历史信息的群内热度。比如,群内热度其中,ηk,j表示视频j在群组k中的群内热度,i表示群组k中的一个群组成员,Uk表示群组k中的群组成员的集合,Vi表示目标帐号的视频查看记录。I(j∈Vi)为1表示视频j被群组成员i查看过,而I(j∈Vi)为0表示视频j未被群组成员i查看过。
以推荐因子包括历史信息的区分度为例,服务器获取区分度的步骤包括:根据有群组成员查看过历史信息的群组的个数以及群组的总个数计算区分度。其中,群组的总数是指目标帐号所对应的***中所有群组的总数,历史信息的区分度与目标比值呈负相关关系。目标比值为有群组成员查看过历史信息的群组的个数与群组的总数的比值。比如,区分度其中,G是***中群组的总数,I(j∈Pk)为1表示视频j被k群组中至少一个用户查看过,I(j∈Pk)为0表示视频j未被k群组中的任何用户查看过,g表示***中所有群组的集合,Pk表示群组k的视频池。
而当推荐因子同时包括上述两者时,服务器可以通过上述获取方法分别获取历史信息的群内热度和区分度,在此不再赘述。并且,本实施例也只是以推荐因子包括上述两者中的至少一种来举例,可选地,推荐因子还可以包括其他内容,对此并不做限定。
本实施例只是以通过上述获取方法获取推荐因子为例,实际实现时,还可以通过其他方法获取,本实施例对此并不做限定。
由于群组中的各个群组成员可能并未查看过任何信息,因此实际实现时本步骤可能不存在,在此不再赘述。
第二,根据每条历史信息的推荐因子计算历史信息的推荐指数。
可选地,若推荐因子只包括一种,则将计算得到的推荐因子作为该历史信息的推荐指数。
而若推荐因子包括至少两种,则服务器根据至少两个推荐因子计算该推荐指数。比如,推荐指数Wk,j=ηk,j*βj。可选地,服务器可以根据每个推荐因子的取值以及各个推荐因子的权重来计算该历史信息的推荐指数。其中,每个推荐因子的权重可以为服务器中预先设定的权重,也可以为用户预先自定义并存储至服务器中的权重,对此并不做限定。
实际实现时,在获取历史信息的推荐指数之前,服务器可以根据预设过滤规则过滤各个群组中的群组成员历史查看的历史信息。可选地,服务器可以过滤查看时长超过第一预设时长的信息。该第一预设时长可以为服务器中预先设定的时长,也可以是服务器根据各个用户查看该信息时所用的时长计算得到的时长,比如,服务器将各个用户查看该信息时所用时长的平均值作为该第一预设时长,对此并不做限定。当然在该信息为视频信息或者音频信息时,该第一预设时长还可以为视频信息或者音频信息的时长,本实施例对此并不做限定。可选地,服务器还可以过滤查看时长低于第二预设时长的信息。其中,第二预设时长可以是服务器中预先设定的时长,也可以为用户自定义的时长,对此并不做限定。由于信息的查看时长超过第一预设时长时,说明该信息被异常阅读,因此通过对该信息进行过滤保证了后续计算的准确度。同理,由于信息的查看时长低于第二预设时长时,说明该信息可能被虚假点击,此时并不能认为群组成员已经查看过该信息,因此通过对该信息进行过滤,保证了后续计算的准确度。可选地,服务器还可以过滤查看信息的总数量超过预设阈值的群组成员所查看的历史信息。由于查看信息的总数量超过预设阈值时,说明该帐号可能并非是人为操作,很可能是网络爬虫,因此通过对该类群组成员查看的信息进行过滤,保证了后续计算的准确度。
步骤203,根据每个群组中的各条历史信息的推荐指数生成每个群组所对应的信息推荐列表。
可选地,在计算得到每个群组中的各条历史信息的推荐指数之后,服务器可以根据各个推荐指数对各条历史信息进行排名,将排名得到的列表作为该群组的信息推荐列表。当然,实际实现时,服务器可以选择其中排名在前n位的信息,并将选择得到的各条历史信息的列表作为该群组的信息推荐列表。可选地,服务器还可以选择推荐指数超过预设阈值的各条历史信息,并将选择得到的各条历史信息作为该群组的信息推荐列表。
步骤204,根据信息推荐列表向目标帐号推荐信息。
在确定得到各个群组所对应的信息推荐列表之后,服务器向目标帐号推荐信息。可选地,服务器可以发送各个信息推荐列表中的信息至目标帐号,或者,服务器可以发送各个信息推荐列表中的各条信息的链接至目标帐号,本实施例对此并不做限定。
实际实现时,发送的推荐信息的条数可以为预设条数,此时,服务器可以从各个信息推荐列表中选择预设条数的信息,进而向目标帐号推荐选择得到的信息。比如,以预设条数为5条,信息推荐列表的个数为5个为例,服务器可以从每个信息推荐列表中选择一条信息,并向目标帐号推荐选择的信息。可选地,若预设条数与信息推荐列表的个数的比值不为整数,则服务器可以对各个信息推荐列表排序,并依次从各个信息推荐列表中选择一条信息进而最终得到预设条数的信息。比如,仍然以预设条数为5条为例,假设信息推荐列表的个数为3个,则此时,服务器可以依次从第一个信息推荐列表、第二个信息推荐列表、第三个信息推荐列表、第一个信息推荐列表以及第二个信息推荐列表中分别选择一条信息,向目标帐号推荐选择得到的5条信息。
可选地,在步骤201之前,服务器还可以对目标帐号进行建模,检测该目标帐号的注册时长是否超过预设时长,若该目标帐号为注册时长少于预设时长的账号,则服务器确定该目标帐号为新账号,此时,服务器可以执行确定目标帐号加入的群组的步骤;而若目标帐号为注册时长不少于预设时长的帐号,则此时服务器可以检测该目标帐号的历史查看记录的条数是否超过预设条数,若超过,则说明该目标帐号的历史查看记录足够多,此时可以根据历史查看记录为该目标帐号推荐信息,而若历史查看记录的条数不超过预设条件,则说明此时根据历史查看记录为目标帐号推荐时推荐的准确率可能较低,此时,服务器可以执行确定目标帐号加入的群组的步骤。
在本实施例的一个应用场景中,在视频播放客户端使用目标帐号登录之后,视频播放客户端的后台服务器可以确定该目标帐号加入的群组(后台服务器可以连接目标帐号的社交应用客户端所对应的社交应用服务器,并从该社交应用服务器中获取目标帐号加入的群组),确定的目标帐号加入的群组包括:家人群、同事群和大学同学群;获取群组中的群组成员历史查看过的历史信息的推荐指数;根据每个群组中的各条历史信息的推荐指数生成该群组的信息推荐列表,比如,对于家人群,后台服务器确定的信息推荐列表包括视频A、视频B和视频C,对于同事群,后台服务器确定的信息推荐列表包括视频A、视频C和视频E;对于大学同学群,后台服务器确定的信息推荐列表包括视频A、视频B、视频D、视频E和视频F;后台服务器根据确定的信息推荐列表向目标帐号推荐推荐信息,比如,后台服务器可以向目标帐号推荐视频A、视频B、视频C、视频D、视频E和视频F。
综上所述,本实施例提供的信息推荐方法,通过确定目标帐号加入的群组,进而根据群组中的群组成员历史查看的历史信息来生成该群组的信息推荐列表,根据各个信息推荐列表向目标帐号推荐信息;解决了现有技术中在目标帐号为新注册的帐号时,服务器无法根据该目标帐号的历史浏览信息向该目标帐号发送推荐信息,也即此时服务器只会发送默认的推荐信息至目标帐号,发送的推荐信息的准确率较低的问题;达到了即使目标帐号为新帐号,服务器仍然可以根据该帐号所加入的群组来为该目标帐号发送推荐信息,提高了推荐的信息的准确率的效果。
在上述实施例中,当目标帐号加入的群组有至少两个时,请参考图3,上述步骤204可以包括:
步骤204a,获取每个群组的评分。
本步骤可以包括:
第一,获取每个群组的群组评分因子,群组评分因子包括群组活跃度、社交相似度、兴趣活跃度和兴趣相似度中的至少一种。其中:
群组活跃度用于表示群组中的群组成员的活跃程度。实际实现时,服务器可以根据历史时间段内群组成员发送的群组消息的总数量以及群组中的群组成员的数量来计算该群组活跃度。比如,群组活跃度其中,Mk,i表示在历史时间段内用户i在群组k中发送的信息的总数量,|uk|表示群组k中的群组成员的数量。
社交相似度用于表示群组中的群组成员社交的相似程度。实际实现时,服务器可以根据群组中互为好友的群组成员的数量以及群组中的群组成员的总数量计算该社交相似度。比如,社交相似度其中,Iu,i是根据社交帐号u和社交帐号i是否是好友的标志计算得到的群组中两两好友的数量,|Uk|表示群组k中群组成员的数量。
兴趣活跃度用于表示群组中信息被查看的概率。实际实现时,服务器可以根据信息的推荐指数计算该兴趣活跃度。比如,兴趣活跃度其中,Wk,j为推荐指数,并且Wk,j的计算方式与上述实施例中的步骤202中的计算方式类似,在此不再赘述。
兴趣相似度用于表示群组成员历史行为的相似度。实际实现时,服务器可以根据群组内任意两个群组成员的兴趣相似度计算该群组的兴趣相似度。比如,群组内任意两个群组成员的兴趣相似度则该群组的兴趣相似度其中,u和i为群组k中的两个群组成员,Vu为群组成员u的历史操作记录,Vi为群组成员i的历史操作记录,Uk为群组k中的群组成员的数量。历史操作记录可以包括查看信息的查看记录、评论信息的评论记录、订阅信息的订阅行为等等,在此不再赘述。
上述只是以群组评分因子包括上述四种中的至少一种来举例说明,可选地,群组评分因子还可以包括其他内容,本实施例对此并不做限定。
第二,根据每个群组的群组评分因子计算群组的评分。
可选地,服务器可以根据每个群组评分因子以及每个群组评分因子所对应的权重计算该群组的评分,对此并不做限定。当然实际实现时,服务器还可以根据群组评分因子以及逻辑回归来计算该群组的评分,在此不再赘述。
本实施例只是以服务器通过获取群组评分因子来计算群组的评分为例,可选地,服务器还可以获取预先存储的评分,服务器预先存储的评分为服务器预先根据获取到的群组评分因子计算并保存的评分,在此不再赘述。
步骤204b,根据每个群组的评分以及每个群组的信息推荐列表确定需要推荐的信息。
可选地,本步骤可以包括:
第一,对于每个信息推荐列表中的每条信息,根据包含信息的各个信息推荐列表所对应的群组的评分计算信息的评分。
可选地,服务器可以根据所对应的群组的得分以及信息在信息推荐列表中的排名计算该信息的评分。比如,对于信息A来说,信息推荐列表1中的第一位、信息推荐列表3的第4位、信息推荐列表4的第2位中均包含该信息A,则该信息的评分=群组1的评分*0.4+群组3的评分*0.2+群组4的评分*0.1。
可选地,服务器还可以根据所对应的群组的得分以及该信息在该群组中的推荐指数来计算该信息的评分。其计算方法与上述根据排名的计算方法类似,在此不再赘述。
当然,实际实现时,服务器还可以通过其他方式计算得到各条信息的得分,本实施例对此并不做限定。
经过上述步骤之后,服务器可以计算得到各条信息的评分,如10条信息的得分由高到低分别为98、90、82、…、76。
第二,根据计算得到的各条信息的评分确定需要推荐的信息。
可选地,服务器可以选择评分超过预设分数的信息作为需要推荐的信息;或者,服务器可以按照评分由高到低的顺序进行排名,并选择其中排名在前n位的信息作为需要推荐的信息。当然,实际实现时,服务器还可以通过其他方式来确定需要推荐的信息,本实施例对此并不做限定。
实际实现时,在计算得到群组的评分之后,服务器还可以选择满足预设条件的群组,进而根据选择得到群组的评分以及该群组的信息推荐列表来确定需要推荐的信息,本实施例在此不再赘述。其中,满足预设条件的群组可以为评分高于预设分数的群组或者评分排名在前m位的群组,在此不再赘述。
步骤204c,向目标帐号推荐确定的信息。
在确定需要推荐的信息之后,服务器可以向目标帐号所对应的终端推荐确定的信息。相应的,终端可以通过该目标帐号接收到该信息。
请参考图4,其示出了上述实施例提供的信息推荐方法的完整的框图,如图4所示,在确定加入的群组之后,可以根据每个群组内的群组成员历史查看过的历史信息的群内热度和区分度计算该历史信息的推荐指数,进而得到每个群组的信息推荐列表。同时,还可以根据群组评分因子也即图中所示的兴趣活跃度、兴趣相似度、社交活跃度和社交相似度来计算每个群组的评分;根据各个群组的评分筛选出符合条件的群组,进而根据筛选得到的群组的评分以及该群组的信息推荐列表合并得到需要推荐的信息。在确定需要推荐的信息之后,还可以为确定的信息添加描述信息。如图4所示,在确定目标帐号加入的群组之前,服务器还可以先对目标帐号进行建模,若该目标帐号为注册时长少于预设时长的账号,则服务器确定该目标帐号为新账号,此时,服务器可以执行确定目标帐号加入的群组的步骤;而若目标帐号为注册时长不少于预设时长的帐号,则此时服务器可以检测该目标帐号的历史查看记录的条数是否超过预设条数,若超过,则说明该目标帐号的历史查看记录足够多,此时可以根据历史查看记录为该目标帐号推荐信息,而若历史查看记录的条数不超过预设条件,则说明此时根据历史查看记录为目标帐号推荐时推荐的准确率可能较低,此时,服务器可以执行确定目标帐号加入的群组的步骤。
为了衡量本实施例提供的信息推荐方法的准确度,可以通过A/B测试对其进行测试,在A/B测试中,测试用户被随机均匀分配到几个集合,每个集合采用一个特定的目标特性的设定,保持其他设定相同(类似控制变量法)。这些集合用一组预定义的评估指标相互比较。在本实施例中,目标特性为采用不同的算法。对照组算法:协同过滤、基于内容的推荐以及上述实施例所说的信息推荐方法。
为了衡量比较这些算法在相关性和多样性等方面的性能,本实施例使用了两个指标,即CTR(Click Through Rate,点击率)和Gini系数。
其中,“#of impression”表示推荐给用户的信息的数量,“#of click”表示推荐给用户信息后被点击的信息的数量。CTR越大,表示推荐越准确。
其中,n代表被推荐的信息的数量,dj是按照信息被推荐次数由高到低排名后排名在第j位的推荐次数。Gini系数越小,表示推荐结果具备越高的多样性。
因为数据敏感性,本实施例将第二大CTR值归一化为1,其他两个算法的CTR值根据与它的比例做相应的变化。归一化CTR值和Gini系数的结果如图5和图6所示,其中每个值是每天的平均结果。
在上述实施例中,在向目标帐号推荐信息时,服务器还可以为每条信息设置描述信息。该描述信息用于表示该信息被哪些群组的群组成员查看过。比如,对于信息A来说,该信息A被群组A和群组B中的群组成员查看,则此时,服务器在推荐该信息A至目标帐号时,服务器还可以发送内容为“信息A被群组A和群组B中的用户查看”的描述信息至目标帐号。
通过基于群组来推荐信息,使得在为信息设置描述信息之后,既可以通过设置的描述信息来提高用户查看该信息的概率,又能保证群组中的群组成员查看信息的隐私安全。
上述信息推荐算法的代码是由HIVE(基于Hadoop的数据仓库工具)SQL(Structured Query Language,结构化查询语言)以及python(面向对象的解释型计算机程序设计语言)编写。HIVE可以用类SQL语句编写代码,并自动将SQL语句转换为MapReduce任务进行运行。HIVE SQL部分负责数据准备,信息推荐列表的生成以及确定需要推荐的信息;python代码主要负责计算群组的评分中逻辑斯特回归部分以及例行化执行部分。
请参考图7,其示出了本发明一个实施例提供的信息推荐装置的结构示意图,如图7所示,该信息推荐装置可以包括:群组确定模块710、列表确定模块720和信息发送模块730。
群组确定模块710,用于确定目标帐号加入的群组;
列表确定模块720,用于根据每个群组中的群组成员查看过的历史信息,确定每个群组所对应的信息推荐列表;
信息发送模块730,用于根据所述列表确定模块720确定的所述信息推荐列表向所述目标帐号推荐信息。
综上所述,本实施例提供的信息推荐装置,通过确定目标帐号加入的群组,进而根据群组中的群组成员历史查看的历史信息来生成该群组的信息推荐列表,根据各个信息推荐列表向目标帐号推荐信息;解决了现有技术中在目标帐号为新注册的帐号时,服务器无法根据该目标帐号的历史浏览信息向该目标帐号发送推荐信息,也即此时服务器只会发送默认的推荐信息至目标帐号,发送的推荐信息的准确率较低的问题;达到了即使目标帐号为新帐号,服务器仍然可以根据该帐号所加入的群组来为该目标帐号发送推荐信息,提高了推荐的信息的准确率的效果。
基于上述实施例提供的信息推荐装置,可选的,所述列表确定模块720,包括:
指数获取单元,用于获取每个群组中的群组成员查看过的历史信息的推荐指数;
列表生成单元,用于根据每个群组中的各条历史信息的推荐指数生成每个群组所对应的信息推荐列表。
可选的,所述指数获取单元,包括:
第一获取子单元,用于获取每个群组中的各条历史信息的推荐因子,所述推荐因子包括所述历史信息的群内热度和/或所述历史信息的区分度;
指数计算子单元,用于根据所述第一获取子单元获取到的每条历史信息的所述推荐因子计算所述历史信息的推荐指数。
可选的,所述第一获取子单元,还用于根据所述目标帐号加入的群组的个数以及有群组成员查看过所述历史信息的群组的个数,计算所述区分度。
可选的,所述信息发送模块730,包括:
评分获取单元,用于在所述目标帐号加入的群组包括至少两个时,获取每个群组的评分;
信息确定单元,用于根据所述评分获取单元获取到的每个群组的评分以及每个群组的信息推荐列表确定需要推荐的信息;
信息发送单元,用于向所述目标帐号推荐确定的所述信息。
可选的,所述评分获取单元,包括:
第二获取子单元,用于获取每个群组的群组评分因子,所述群组评分因子包括群组活跃度、社交相似度、兴趣活跃度和兴趣相似度中的至少一种;
评分计算子单元,用于根据所述第二获取子单元获取到的每个群组的群组评分因子计算所述群组的评分。
可选的,所述信息确定单元,还用于:
对于每个信息推荐列表中的每条信息,根据包含所述信息的各个信息推荐列表所对应的群组的评分计算所述信息的评分;
根据计算得到的各条信息的评分确定所述需要推荐的信息。
需要说明的是:上述实施例提供的信息推荐装置,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将服务器的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的信息推荐装置和信息推荐方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质可以是存储器中所包含的计算机可读存储介质;也可以是单独存在,未装配入服务器中的计算机可读存储介质。该计算机可读存储介质存储有一个或者一个以上程序,该一个或者一个以上程序被一个或者一个以上的处理器用来执行上述信息推荐方法。
请参考图8,其示出了本发明一个实施例提供的服务器的结构示意图。该服务器用于实施上述实施例中提供的信息推荐方法。具体来讲:
所述服务器800包括中央处理单元(CPU)801、包括随机存取存储器(RAM)802和只读存储器(ROM)803的***存储器804,以及连接***存储器804和中央处理单元801的***总线805。所述服务器800还包括帮助计算机内的各个器件之间传输信息的基本输入/输出***(I/O***)806,和用于存储操作***813、应用程序814和其他程序模块815的大容量存储设备807。
所述基本输入/输出***806包括有用于显示信息的显示器808和用于用户输入信息的诸如鼠标、键盘之类的输入设备809。其中所述显示器808和输入设备809都通过连接到***总线805的输入输出控制器810连接到中央处理单元801。所述基本输入/输出***806还可以包括输入输出控制器810以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地,输入输出控制器810还提供输出到显示屏、打印机或其他类型的输出设备。
所述大容量存储设备808通过连接到***总线805的大容量存储控制器(未示出)连接到中央处理单元801。所述大容量存储设备807及其相关联的计算机可读介质为服务器800提供非易失性存储。也就是说,所述大容量存储设备808可以包括诸如硬盘或者CD-ROM驱动器之类的计算机可读介质(未示出)。
不失一般性,所述计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、EPROM、EEPROM、闪存或其他固态存储其技术,CD-ROM、DVD或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然,本领域技术人员可知所述计算机存储介质不局限于上述几种。上述的***存储器804和大容量存储设备808可以统称为存储器。
根据本发明的各种实施例,所述服务器800还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即服务器800可以通过连接在所述***总线805上的网络接口单元811连接到网络812,或者说,也可以使用网络接口单元811来连接到其他类型的网络或远程计算机***(未示出)。
所述存储器还包括一个或者一个以上的程序,所述一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行。上述一个或者一个以上程序包含用于执行上述信息推荐方法的指令。
应当理解的是,在本文中使用的,除非上下文清楚地支持例外情况,单数形式“一个”(“a”、“an”、“the”)旨在也包括复数形式。还应当理解的是,在本文中使用的“和/或”是指包括一个或者一个以上相关联地列出的项目的任意和所有可能组合。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (14)
1.一种信息推荐方法,其特征在于,所述方法包括:
确定目标帐号加入的群组;
根据每个群组中的群组成员查看过的历史信息,确定每个群组所对应的信息推荐列表;
根据所述信息推荐列表向所述目标帐号推荐信息。
2.根据权利要求1所述的方法,其特征在于,所述根据每个群组中的群组成员查看过的历史信息,确定每个群组所对应的信息推荐列表,包括:
获取每个群组中的群组成员查看过的历史信息的推荐指数;
根据每个群组中的各条历史信息的推荐指数生成每个群组所对应的信息推荐列表。
3.根据权利要求2所述的方法,其特征在于,所述获取每个群组中的群组成员查看过的历史信息的推荐指数,包括:
获取每个群组中的各条历史信息的推荐因子,所述推荐因子包括所述历史信息的群内热度和/或所述历史信息的区分度;
根据每条历史信息的所述推荐因子计算所述历史信息的推荐指数。
4.根据权利要求3所述的方法,其特征在于,所述获取每个群组中的各条历史信息的区分度,包括:
根据有群组成员查看过所述历史信息的群组的个数以及群组的总个数计算所述区分度。
5.根据权利要求1至4任一所述的方法,其特征在于,所述根据所述信息推荐列表向所述目标帐号推荐信息,包括:
若所述目标帐号加入的群组包括至少两个,则获取每个群组的评分;
根据每个群组的评分以及每个群组的信息推荐列表确定需要推荐的信息;
向所述目标帐号推荐确定的所述信息。
6.根据权利要求5所述的方法,其特征在于,所述获取每个群组的评分,包括:
获取每个群组的群组评分因子,所述群组评分因子包括群组活跃度、社交相似度、兴趣活跃度和兴趣相似度中的至少一种;
根据每个群组的群组评分因子计算所述群组的评分。
7.根据权利要求5所述的方法,其特征在于,所述根据每个群组的评分以及每个群组的信息推荐列表确定需要推荐的信息,包括:
对于每个信息推荐列表中的每条信息,根据包含所述信息的各个信息推荐列表所对应的群组的评分计算所述信息的评分;
根据计算得到的各条信息的评分确定所述需要推荐的信息。
8.一种信息推荐装置,其特征在于,所述装置包括:
群组确定模块,用于确定目标帐号加入的群组;
列表确定模块,用于根据每个群组中的群组成员查看过的历史信息,确定每个群组所对应的信息推荐列表;
信息发送模块,用于根据所述列表确定模块确定的所述信息推荐列表向所述目标帐号推荐信息。
9.根据权利要求8所述的装置,其特征在于,所述列表确定模块,包括:
指数获取单元,用于获取每个群组中的群组成员历史查看过的历史信息的推荐指数;
列表生成单元,用于根据每个群组中的各条历史信息的推荐指数生成每个群组所对应的信息推荐列表。
10.根据权利要求9所述的装置,其特征在于,所述指数获取单元,包括:
第一获取子单元,用于获取每个群组中的各条历史信息的推荐因子,所述推荐因子包括所述历史信息的群内热度和/或所述历史信息的区分度;
指数计算子单元,用于根据所述第一获取子单元获取到的每条历史信息的所述推荐因子计算所述历史信息的推荐指数。
11.根据权利要求10所述的装置,其特征在于,
所述第一获取子单元,还用于根据有群组成员查看过所述历史信息的群组的个数以及群组的总个数计算所述区分度。
12.根据权利要求8至11任一所述的装置,其特征在于,所述信息发送模块,包括:
评分获取单元,用于在所述目标帐号加入的群组包括至少两个时,获取每个群组的评分;
信息确定单元,用于根据所述评分获取单元获取到的每个群组的评分以及每个群组的信息推荐列表确定需要推荐的信息;
信息发送单元,用于向所述目标帐号推荐确定的所述信息。
13.根据权利要求12所述的装置,其特征在于,所述评分获取单元,包括:
第二获取子单元,用于获取每个群组的群组评分因子,所述群组评分因子包括群组活跃度、社交相似度、兴趣活跃度和兴趣相似度中的至少一种;
评分计算子单元,用于根据所述第二获取子单元获取到的每个群组的群组评分因子计算所述群组的评分。
14.根据权利要求12所述的装置,其特征在于,所述信息确定单元,还用于:
对于每个信息推荐列表中的每条信息,根据包含所述信息的各个信息推荐列表所对应的群组的评分计算所述信息的评分;
根据计算得到的各条信息的评分确定所述需要推荐的信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710299871.1A CN108304428A (zh) | 2017-04-27 | 2017-04-27 | 信息推荐方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710299871.1A CN108304428A (zh) | 2017-04-27 | 2017-04-27 | 信息推荐方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108304428A true CN108304428A (zh) | 2018-07-20 |
Family
ID=62872178
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710299871.1A Pending CN108304428A (zh) | 2017-04-27 | 2017-04-27 | 信息推荐方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108304428A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109756563A (zh) * | 2018-12-17 | 2019-05-14 | 平安科技(深圳)有限公司 | 信息推送方法、装置、计算机设备和存储介质 |
CN110929170A (zh) * | 2019-11-22 | 2020-03-27 | 腾讯科技(深圳)有限公司 | 社交群组的好友推荐方法、装置、设备及存储介质 |
CN110941756A (zh) * | 2018-09-25 | 2020-03-31 | 夏普株式会社 | 终端装置、信息处理***、方法以及记录介质 |
CN111130992A (zh) * | 2019-11-22 | 2020-05-08 | 北京达佳互联信息技术有限公司 | 群组推荐方法、装置、电子设备及存储介质 |
CN111523035A (zh) * | 2020-04-24 | 2020-08-11 | 上海异势信息科技有限公司 | App浏览内容的推荐方法、装置、服务器和介质 |
CN112769676A (zh) * | 2020-12-31 | 2021-05-07 | 上海掌门科技有限公司 | 一种用于提供群组内信息的方法与设备 |
CN112989276A (zh) * | 2019-12-12 | 2021-06-18 | 北京沃东天骏信息技术有限公司 | 信息推送***的评价方法和装置 |
CN114765624A (zh) * | 2020-12-31 | 2022-07-19 | 北京达佳互联信息技术有限公司 | 信息推荐方法、装置、服务器及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103391302A (zh) * | 2012-05-08 | 2013-11-13 | 阿里巴巴集团控股有限公司 | 一种信息发送的方法及*** |
CN103731738A (zh) * | 2014-01-23 | 2014-04-16 | 哈尔滨理工大学 | 基于用户群组行为分析的视频推荐方法及装置 |
CN104572889A (zh) * | 2014-12-24 | 2015-04-29 | 深圳市腾讯计算机***有限公司 | 一种搜索词推荐方法、装置和*** |
CN104573109A (zh) * | 2015-01-30 | 2015-04-29 | 深圳市中兴移动通信有限公司 | 一种基于群组关系的自动推荐方法、终端及*** |
CN105574045A (zh) * | 2014-10-17 | 2016-05-11 | 深圳市腾讯计算机***有限公司 | 一种视频推荐方法和服务器 |
-
2017
- 2017-04-27 CN CN201710299871.1A patent/CN108304428A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103391302A (zh) * | 2012-05-08 | 2013-11-13 | 阿里巴巴集团控股有限公司 | 一种信息发送的方法及*** |
CN103731738A (zh) * | 2014-01-23 | 2014-04-16 | 哈尔滨理工大学 | 基于用户群组行为分析的视频推荐方法及装置 |
CN105574045A (zh) * | 2014-10-17 | 2016-05-11 | 深圳市腾讯计算机***有限公司 | 一种视频推荐方法和服务器 |
CN104572889A (zh) * | 2014-12-24 | 2015-04-29 | 深圳市腾讯计算机***有限公司 | 一种搜索词推荐方法、装置和*** |
CN104573109A (zh) * | 2015-01-30 | 2015-04-29 | 深圳市中兴移动通信有限公司 | 一种基于群组关系的自动推荐方法、终端及*** |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110941756A (zh) * | 2018-09-25 | 2020-03-31 | 夏普株式会社 | 终端装置、信息处理***、方法以及记录介质 |
CN109756563A (zh) * | 2018-12-17 | 2019-05-14 | 平安科技(深圳)有限公司 | 信息推送方法、装置、计算机设备和存储介质 |
CN110929170A (zh) * | 2019-11-22 | 2020-03-27 | 腾讯科技(深圳)有限公司 | 社交群组的好友推荐方法、装置、设备及存储介质 |
CN111130992A (zh) * | 2019-11-22 | 2020-05-08 | 北京达佳互联信息技术有限公司 | 群组推荐方法、装置、电子设备及存储介质 |
CN110929170B (zh) * | 2019-11-22 | 2024-06-28 | 腾讯科技(深圳)有限公司 | 社交群组的好友推荐方法、装置、设备及存储介质 |
US11470032B2 (en) | 2019-11-22 | 2022-10-11 | Beijing Dajia Internet Information Technology Co., Ltd. | Method for recommending groups and related electronic device |
CN112989276A (zh) * | 2019-12-12 | 2021-06-18 | 北京沃东天骏信息技术有限公司 | 信息推送***的评价方法和装置 |
CN111523035B (zh) * | 2020-04-24 | 2023-04-18 | 上海异势信息科技有限公司 | App浏览内容的推荐方法、装置、服务器和介质 |
CN111523035A (zh) * | 2020-04-24 | 2020-08-11 | 上海异势信息科技有限公司 | App浏览内容的推荐方法、装置、服务器和介质 |
CN114765624A (zh) * | 2020-12-31 | 2022-07-19 | 北京达佳互联信息技术有限公司 | 信息推荐方法、装置、服务器及存储介质 |
CN112769676A (zh) * | 2020-12-31 | 2021-05-07 | 上海掌门科技有限公司 | 一种用于提供群组内信息的方法与设备 |
CN112769676B (zh) * | 2020-12-31 | 2022-12-30 | 上海掌门科技有限公司 | 一种用于提供群组内信息的方法与设备 |
CN114765624B (zh) * | 2020-12-31 | 2024-04-30 | 北京达佳互联信息技术有限公司 | 信息推荐方法、装置、服务器及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108304428A (zh) | 信息推荐方法及装置 | |
US10394953B2 (en) | Meme detection in digital chatter analysis | |
US9152969B2 (en) | Recommendation ranking system with distrust | |
CN103324636B (zh) | 在社交网络中推荐好友的***和方法 | |
TW202007178A (zh) | 用戶特徵的生成方法、裝置、設備及儲存介質 | |
US8615404B2 (en) | Self-describing data framework | |
US9436919B2 (en) | System and method of tuning item classification | |
US9230030B2 (en) | Method and system for mining websites | |
US20150032751A1 (en) | Methods and Systems for Utilizing Subject Matter Experts in an Online Community | |
US9152709B2 (en) | Cross-domain topic space | |
CN108431852A (zh) | 用于互连用户简档的计算机资源排名 | |
US20120059820A1 (en) | Aggregation, Organization and Provision of Professional and Social Information | |
MX2012003721A (es) | Sistemas y metodos para analitica de datos graficos sociales para determinar conectividad dentro de una comunidad. | |
Atzmueller et al. | Ubicon and its applications for ubiquitous social computing | |
US10795899B2 (en) | Data discovery solution for data curation | |
US9195962B2 (en) | Generating a subgraph of key entities in a network and categorizing the subgraph entities into different types using social network analysis | |
US11444909B2 (en) | Latent user communities | |
US9582835B2 (en) | Apparatus, system, and method for searching for power user in social media | |
US10769419B2 (en) | Disruptor mitigation | |
US10977677B2 (en) | Contact importer | |
CN108345601A (zh) | 搜索结果排序方法及装置 | |
US11036700B2 (en) | Automatic feature generation for machine learning in data-anomaly detection | |
US20230037222A1 (en) | Method, apparatus and computer program product for generating tiered search index fields in a group-based communication platform | |
CN107809370B (zh) | 用户推荐方法及装置 | |
US10733244B2 (en) | Data retrieval system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180720 |