CN109408703A - 信息推荐方法及其***、装置、电子设备、存储介质 - Google Patents
信息推荐方法及其***、装置、电子设备、存储介质 Download PDFInfo
- Publication number
- CN109408703A CN109408703A CN201811020544.9A CN201811020544A CN109408703A CN 109408703 A CN109408703 A CN 109408703A CN 201811020544 A CN201811020544 A CN 201811020544A CN 109408703 A CN109408703 A CN 109408703A
- Authority
- CN
- China
- Prior art keywords
- information
- service
- user
- result
- recommendation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开揭示了一种信息推荐方法、***、装置、电子设备和计算机可读存储介质,该方案包括:根据对用户触发进行的信息推荐,获取相应用户数据;通过获取的用户数据并行请求部署的多个信息召回服务触发进行信息召回;信息召回服务根据用户数据从所配置的正排数据集合为用户的信息推荐执行信息召回,获得信息召回服务的返回结果,正排数据集合是所有正排数据切分所形成的;将所有信息召回服务的返回结果进行汇总,形成信息推荐结果。该方案减少了完成信息召回任务的时间,提高了信息推荐的效率,支持数据量的大幅增加。
Description
技术领域
本公开涉及计算机技术领域,特别涉及一种信息推荐方法、信息推荐***、信息推荐装置、电子设备以及计算机可读存储介质。
背景技术
随着网络技术的飞速发展,在互联网上每天产生大量的信息,因此,如何为用户从海量的数据中快速找到用户想要或者适合用户的网络信息则成为技术人员迫切需要解决的技术问题。
目前,智能推荐***主要根据用户的一些基本属性(包括年龄、性别、喜好)和用户历史行为,向用户推送与其基础属性和历史行为相匹配的信息。例如,按照用户的阅读习惯、兴趣,为用户获取喜欢的文章。将同类用户中大家都喜欢的文章,推荐给未阅读过该文章的用户。或者,用同类型的文章推荐给未阅读过的用户。
由此可见,推荐***依赖的数据非常多,包括所有用户的历史行为以及基本属性,还有各种文章的细节数据,并且随着用户数量的增多,时间的积累,这些数据会越来越多,从而导致数据处理耗费时间较长,推荐***的响应缓慢。
发明内容
为了解决相关技术中存在的推荐***耗费时间较长,响应缓慢的问题,本公开提供了一种信息推荐方法。
一方面,本发明提供了一种信息推荐方法,包括:
根据对用户触发进行的信息推荐,获取相应用户数据;
通过获取的所述用户数据并行请求部署的多个信息召回服务触发进行信息召回;
所述信息召回服务根据所述用户数据从所配置的正排数据集合为用户的信息推荐执行信息召回,获得所述信息召回服务的返回结果,所述正排数据集合是所有正排数据切分所形成的;
将所有信息召回服务的返回结果进行汇总,形成信息推荐结果。
另一方面,本发明还提供了一种信息推荐***,包括:依次连接的代理服务器、调度服务器、融合服务器和多个召回服务器;
所述代理服务器用于接收向用户进行信息推荐的请求;
所述调度服务器用于根据所述请求指示的用户标识,获取相应的用户数据;
所述融合服务器用于通过所述用户数据并行请求多个召回服务器进行信息召回;
所述召回服务器用于运行信息召回服务,所述信息召回服务根据所述用户数据从所配置的正排数据集合为用户的信息推荐执行信息召回,获得所述信息召回服务的返回结果,所述正排数据集合是所有正排数据切分所形成的;
所述调度服务器还用于将所有信息召回服务的返回结果进行汇总,形成信息推荐结果。
此外,本发明还提供了一种信息推荐装置,包括:
数据获取模块,用于根据对用户触发进行的信息推荐,获取相应用户数据;
并行请求模块,用于通过获取的所述用户数据并行请求部署的多个信息召回模块触发进行信息召回;
信息召回模块,用于根据所述用户数据从所配置的正排数据集合为用户的信息推荐执行信息召回,获得所述信息召回模块的返回结果,所述正排数据集合是所有正排数据切分所形成的;
结果汇总模块,用于将所有信息召回模块的返回结果进行汇总,形成信息推荐结果。
进一步的,本发明还提供了一种电子设备,所述电子设备包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行完成上述信息推荐方法。
其中,本发明还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序可由处理器执行完成上述信息推荐方法。
本公开的实施例提供的技术方案可以包括以下有益效果:
本发明提供的技术方案,通过对所有正排数据进行切分形成多个正排数据集合,进而可以由多个信息召回服务并行对部署的正排数据集合执行信息召回,通过对所有信息召回服务的返回结果进行汇总,可以得到信息推荐结果。由此,可以减少每个信息召回服务加载的数据量,降低处理耗费的时间,多个信息召回服务并行进行信息召回,减少了完成信息召回任务的时间,提高了信息推荐的效率,支持数据量的大幅增加。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并于说明书一起用于解释本发明的原理。
图1是根据本公开所涉及的实施环境的示意图;
图2是根据一示例性实施例示出的一种服务器的框图;
图3是根据一示例性实施例示出的一种信息推荐方法的流程图;
图4是现有将召回服务按照功能进行分解的架构示意图;
图5是图3对应实施例中步骤350的细节流程图;
图6是图5对应实施例中步骤352的细节流程图;
图7是图3对应实施例中步骤370的细节流程图;
图8是根据一示例性实施例示出的服务器集群的架构示意图;
图9是根据一示例性实施例示出的单机服务器的结构示意图;
图10是根据一示例性实施例示出的信息推荐***的架构示意图;
图11是根据一示例性实施例示出的一种信息推荐装置的框图;
图12是图11对应实施例中信息召回模块的细节框图;
图13是图12对应实施例中结果获得单元的细节框图;
图14是图11对应实施例中结果汇总模块的细节框图。
具体实施方式
这里将详细地对示例性实施例执行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
图1是根据本公开所涉及的实施环境的示意图。该实施环境包括多台服务器110构成的服务器集群。多台服务器110之间采用有线或无线网络连接。该服务器集群可以采用本发明提供的信息推荐方法,生成信息推荐结果。
进一步的,该实施环境还可以包括移动终端130,移动终端130可以向服务器集群发送向用户进行信息推荐的请求,进而服务器集群响应请求,采用本发明提供的信息推荐方法向移动终端130返回信息推荐结果。
参见图2,图2是本发明实施例提供的一种服务器结构示意图。该服务器200可因配置或性能不同而产生比较大的差异,可以包括一个或一个以***处理器(centralprocessing units,CPU)222(例如,一个或一个以上处理器)和存储器232,一个或一个以上存储应用程序242或数据244的存储介质230(例如一个或一个以上海量存储设备)。其中,存储器232和存储介质230可以是短暂存储或持久存储。存储在存储介质230的程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括对服务器200中的一系列指令操作。更进一步地,中央处理器222可以设置为与存储介质230通信,在服务器200上执行存储介质230中的一系列指令操作。服务器200还可以包括一个或一个以上电源226,一个或一个以上有线或无线网络接口250,一个或一个以上输入输出接口258,和/或,一个或一个以上操作***241,例如Windows ServerTM,Mac OSXTM,UnixTM,LinuxTM,FreeBSDTM等等。下述图3、图5-图7所示实施例中所述的由服务器集群所执行的步骤可以是基于该图2所示的服务器结构。
本领域普通技术人员可以理解实现下述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
图3是根据一示例性实施例示出的一种信息推荐方法的流程图。该信息推荐方法的适用范围和执行主体,例如可以是图1所示实施环境中的服务器集群。如图3所示,该方法可以由服务器集群执行,可以包括以下步骤。
在步骤310中,根据对用户触发进行的信息推荐,获取相应用户数据;
其中,信息推荐是指向用户推荐其可能感兴趣的信息。举例来说,该信息可以是图像、文本、视频(包括直播视频)等形式。用户数据用于表征用户的基本特征。用户数据包括用户画像信息和用户行为数据。用户画像信息是根据用户社会属性、生活习惯和消费行为等信息而抽象出来的一个标签化的用户模型,也就是说,用户画像信息可以用于表征用户的喜好。而用户行为数据记录了用户已经点击过的信息,可以是历史浏览记录。
在一种实施例中,对用户触发进行的信息推荐可以是移动终端响应触发,向服务器集群发送的,用于指示向移动终端所属用户推荐信息的请求。服务器集群根据该请求所携带的用户标识,获取与该用户标识对应存储的用户数据。在另一实施例中,对用户触发进行的信息推荐可以是服务器集群检测到的向用户推荐信息的触发指令。服务器集群根据该触发指令所携带的用户标识,获取与该用户标识对应存储的用户数据。
在步骤330中,通过获取的用户数据并行请求部署的多个信息召回服务触发进行信息召回;
其中,信息召回服务是指部署在服务器上的,用于执行信息召回的程序。每台服务器可以部署一个或多个信息召回服务。多台服务器可以实现大量信息召回服务的分散部署。每台服务器可以通过运行自身部署的信息召回服务进行信息召回。需要解释的是,信息召回是指从信息集合中获取用户感兴趣进而点击可能性较大的信息。
在一种实施例中,服务器集群可以包括主服务器、多个从服务器。主服务器根据对用户触发的信息推荐,获取相应的用户数据,进而并行向多个从服务器发送携带用户数据的召回请求。召回请求向多个从服务器的发送,触发多个从服务器运行自身部署的信息召回服务,从自身配置的信息集合中获取用户感兴趣、点击可能性较大的信息。
在步骤350中,信息召回服务根据用户数据从所配置的正排数据集合为用户的信息推荐执行信息召回,获得信息召回服务的返回结果,正排数据集合是所有正排数据切分所形成的;
其中,正排数据是指信息(如文章)的细节数据,包括标题、时间、话题等内容。所有正排数据即所有信息的细节数据,所有正排数据可以切分形成多个正排数据集合。正排数据集合可以认为是多条信息构成的信息集合,由此,所有正排数据切分形成多个正排数据集合,可以认为是将所有信息切分成多个信息集合,每个信息集合包含若干条信息。
信息召回服务的返回结果是指信息召回服务从正排数据集合中获取到的,用户可能感兴趣的信息。根据实际情况,该返回结果可以包含多条信息。
需要说明的是,信息召回服务可以根据用户数据确定用户可能感兴趣的信息。在一种实施例中,所有正排数据切分得到的多个正排数据集合分散部署在多台从服务器,由此,每台从服务器可以通过运行信息召回服务,从配置的正排数据集合中根据用户数据获取用户可能感兴趣的信息。
在步骤370中,将所有信息召回服务的返回结果进行汇总,形成信息推荐结果。
其中,将所有信息召回服务的返回结果进行汇总可以是简单将所有的返回结果进行合并,也可以是根据配置的策略,将所有返回结果按照指定策略进行汇总。信息推荐结果是指最终向用户推送的信息。
在一种实施例中,服务器集群的每台从服务器将运行信息召回服务获取的用户可能感兴趣的信息(即返回结果)发送至主服务器,进而可以由服务器集群的主服务器将每台从服务器发送的返回结果进行汇总,也就是说将所有从服务器返回的用户可能感兴趣的信息进行汇总,得到最终向用户推送的信息。进而,服务器集群可以将确定的最终需要向用户推送的信息发送至用户所属的移动终端,由移动终端在指定位置进行所推送信息的展示。
需要说明的是,本发明将所有正排数据切分为多个正排数据集,并通过部署的多个信息召回服务并行从多个正排数据集中执行信息召回。每个信息召回服务执行相同的召回逻辑。由此,即使正排数据越来越多,可以进行信息召回服务的水平扩展,通过进一步增加信息召回服务,对新增加的正排数据集进行并行处理,由此可以不影响信息推荐的响应时间。
现有方案中主要是将召回服务按照功能模块进行分解,拆分成不同功能的服务,每个服务各自执行不同的召回逻辑。如图4所示,将召回服务按照功能模块分解为兴趣召回、协同召回、拓展召回以及其他召回。兴趣召回是指按照用户的阅读习惯兴趣,为用户召回用户喜欢的文章。协同召回是指将同类用户中大家都喜欢的文章,推荐给未阅读过该文章的用户。或者用同类型的文章推荐给未阅读过的用户。拓展召回是指召回用户兴趣之外的信息,对用户的兴趣进行拓展,以便于更加全面发现用户对各种信息的兴趣。兴趣召回、协同召回和拓展召回这几个服务分别执行不同的召回逻辑,所以开发成本较高。每个服务均从所有正排数据进行信息召回,在正排数据越来越多时,响应时间越来越慢。每个服务召回的信息出现不一致的概率较大,信息推荐容易出错。
本发明上述示例性实施例提供的技术方案,通过对所有正排数据进行切分形成多个正排数据集合,进而可以由多个信息召回服务并行对部署的正排数据集合执行信息召回,通过对所有信息召回服务的返回结果进行汇总,可以得到信息推荐结果。由此,可以减少每个信息召回服务加载的数据量,降低处理耗费的时间,多个信息召回服务并行进行信息召回,减少了完成信息召回任务的时间,提高了信息推荐的效率,支持数据量的大幅增加。
在一种示例性实施例中,上述步骤330具体包括:
将获取的用户数据并行发送至部署的多个信息召回服务,用户数据向信息召回服务的发送将触发信息召回服务为用户执行信息召回。
具体的,服务器集群包括主服务器和多台从服务器,主服务器获取用户数据,并行向多台从服务器发送携带该用户数据的请求。每台从服务器部署有信息召回服务,用户数据向从服务器的发送,触发从服务器运行信息召回服务,从自身部署的正排数据集合中获取与用户数据相关的信息。
在一种示例性实施例中,本发明信息推荐的进行部署了适应于若干推荐信息类型的若干垂直服务,且在垂直服务下游为相应推荐信息类型的信息召回部署了多个信息召回服务;上述步骤:将获取的用户数据并行发送至部署的多个信息召回服务,包括:通过调度若干垂直服务,将用户数据并行发送至每一垂直服务下游部署的多个信息召回服务。
其中,推荐信息类型是指信息的数据类型,推荐信息类型可以分为:图文、视频片段、直播视频等。垂直服务是指将用户数据发送至多个信息召回服务并对多个信息召回服务的返回结果按照指定调整策略进行融合的计算机程序。针对每种数据类型的信息,具有对应的垂直服务。例如对于图文信息具有图文融合服务。对于视频片段具有视频服务,对于直播视频具有直播服务等。若干垂直服务包括图文融合服务、视频服务、直播服务等。
每个垂直服务的下游部署了多个信息召回服务,例如图文融合服务下游部署了多个信息召回服务,用于对图文信息执行信息召回。视频服务下游部署了多个信息召回服务,用于对视频片段执行信息召回。直播服务的下游部署了多个信息召回服务,用于对直播视频执行信息召回。
具体的,每个垂直服务可以部署在一台或多台服务器上。为进行区分,部署了垂直服务的服务器称为调度服务器,调度服务器可以认为属于上述示例性中的主服务器,部署了信息召回服务的服务器称为召回服务器,即上述示例性实施例中的从服务器。调用服务器通过调度若干垂直服务,向每一垂直服务下游的多个信息召回服务发送包含用户数据的请求。举例来说,调度服务器调度图文服务,向图文服务下游的多个信息召回服务(用于图文信息的召回)发送携带用户数据的请求。调度服务器调度视频服务向视频服务下游的多个信息召回服务(用于视频片段的召回)发送携带用户数据的请求。同理,随着信息数据类型的增多,调度服务器还可以调度其他服务向下游的多个信息召回服务(用于其他信息的召回)发送携带用户数据的请求。
在一种是示例性实施例中,如图5所示,上述步骤350具体包括:
在步骤351中,信息召回服务根据用户数据,从所配置的正排数据集合中筛选出信息特征与用户数据匹配的目标信息;
其中,每个信息召回服务对应配置了正排数据集合。同一服务器内的信息召回服务加载同样的正排数据集合。正排数据集合是将所有正排数据根据信息召回服务的数量进行切分得到的。正排数据是指每条信息的细节数据,由此,正排数据集合是若干条信息的集合,包含若干条信息的细节数据。
需要说明的是,信息特征用于表征不同信息的特点,包括信息所属领域、面向人群特点、传播区域等。而用户数据用于指示用户的兴趣爱好以及历史行为。信息特征与用户数据匹配是指信息特征符合用户数据指示的要求。举例来说,信息特征指示信息所属领域是体育,而用户数据指示用户的兴趣爱好包括体育,可以认为信息特征与用户数据是匹配的。例如信息特征指示属于张某某的娱乐新闻,而用户数据指示用户的偶像属于张某某,则可以认为信息特征与用户数据是匹配的。目标信息是指从正排数据集合中筛选出来的,信息特征与用户数据匹配的信息。
具体的,每台召回服务器运行自身部署的信息召回服务,每个信息召回服务根据接收到的用户数据,可以从对应配置的正排数据集合中筛选出信息特征与用户数据匹配的信息,作为目标信息。目标信息可以是一条或多条信息。
在步骤352中,根据目标信息获得信息召回服务的返回结果。
具体的,信息召回服务根据从正排数据集合中获取的目标信息,可以对目标信息做进一步筛选处理,得到向上游垂直服务返回的信息,即返回结果。
在一种示例性实施例中,如图6所示,上述步骤352具体包括:
在步骤3521中,信息召回服务利用已构建的预测模型,计算用户数据所属用户对目标信息的点击率;
其中,预测模型可以是提前利用大量样本数据训练得到的。信息召回服务针对每条目标信息,将该目标信息的信息特征和用户数据进行组合,输入已构建的预测模型,输出用户数据所属用户对该目标信息的点击率。点击率用于表征该用户数据所属用户对该目标信息进行点击的可能性,也就是用户会阅读该目标信息的可能性。
在步骤3522中,按照点击率大小对目标信息进行排序,根据排序结果确定信息召回服务的返回结果。
具体的,信息召回服务根据用户对每条目标信息的点击率,按照点击率大小对所有目标信息进行排序。具体的,可以将所有目标信息按照点击率由大到小排序,将排序靠前的n条目标信息作为信息召回服务的返回结果。n可以根据实际需要进行设置。也就是说,将点击率最大的前n条目标信息作为信息召回服务的返回结果。
在一种实施例中,在步骤3521之前,本发明提供的信息推荐方法还包括以下步骤:
调用分布式存储的样本数据进行机器学习,构建预测模型。
其中,样本数据是指样本用户的用户数据以及样本信息的信息特征,且样本用户对样本信息的点击情况已知。样本用户的用户数据和样本信息的信息特征可以分散存储在多台召回服务器中,避免样本数据量过于庞大,影响单机运行。服务器集群可以调用多台召回服务器中分布式存储的样本数据进行机器学习,构建预测模型。举例来说,可以将大量样本数据输入逻辑回归模型,训练逻辑回归模型的参数,进而得到预测模型。
在上述示例性实施例的基础上,如图7所示,上述步骤370具体包括:
在步骤371中,根据用户的历史浏览记录,去除所有返回结果中的已浏览信息;
其中,历史浏览记录是指在对返回结果进行汇总之前,用户进行信息浏览留下的记录。历史浏览记录中记载了用户已浏览过的信息。具体的,每个垂直服务可以根据用户数据中所携带的历史浏览记录,去除下游多个信息召回服务所有返回结果中的已浏览信息。
在步骤372中,将剩余的返回结果按照配置的调整策略生成信息推荐结果。
其中,配置的调整策略可以是扩展用户数据中所记载兴趣以外的其他兴趣,获取其他兴趣相关的信息。配置的调整策略还可以实现信息的多样性推荐,避免推荐相同类型、相同领域、相同人物的信息。具体的,每个垂直服务,针对下游多个信息召回服务返回的信息,去除用户已浏览过的信息,并按照配置的调整策略,对剩余的信息经过兴趣扩展,多样性筛选以及用户数据之间的相关性排序,生成最终的信息推荐结果。之后,将所有垂直服务的信息推荐结果进行融合,得到向用户推荐的所有信息。
图8是本发明示例性示出的服务器集群的架构示意图。如图8所示,该服务器集群包括代理层801、结果融合层802、垂直服务层803、召回层804。其中,代理层801接收移动终端发送的携带用户标识的请求。结果融合层802通过运行Broker(调度)服务,接收代理层801下发的携带用户标识的请求,并获取与用户标识对应存储的用户数据。其中,用户标识与用户数据以键值对的形式进行存储。结果融合层802向垂直服务层803发送携带用户数据的请求。结果融合层803通过运行多个垂直服务(图文融合服务、视频服务、其他服务),并行请求下游召回层804的多个信息召回服务执行信息召回。其中,每个垂直服务对应下游的多个信息召回服务。所有正排数据被切分为多个正排数据集合,召回层804通过运行所有信息召回服务,对每个信息召回服务所配置的正排数据集合进行信息召回。并且在信息召回过程中,可以过滤掉与用户数据不匹配的信息,并利用预测模型预测用户对每条信息的点击率,按照点击率进行排序确定最终的返回结果。
垂直服务层803的每个垂直服务,可以接收下游召回层804中多个信息召回服务的返回结果,并对所有返回结果进行历史排重(即去掉已浏览信息),多样性调整、兴趣扩展以及重排序。结果融合层802可以将垂直服务层每个垂直服务重排序后的信息进行融合汇总,得到信息推荐结果,并将信息推荐结果发送至代理层801。之后,代理层801将信息推荐结果发送至移动终端。
服务器集群将所有正排数据切分为多个正排数据集合,并通过多个垂直服务并发,以及每个垂直服务下游的多个信息召回服务并发,对每个信息召回服务配置的正排数据集合执行信息召回,之后按照指定策略,对所有信息召回服务的返回结果进行汇总,对所有垂直服务的返回结果进行汇总,得到信息推荐结果。由此,信息推荐的处理过程演变成分布式服务的并行处理,单个服务加载的数据量减少,整体的处理时间大幅降低。
图9是单机执行信息推荐的架构示意图。如图9所示,单个服务器包括代理层和推荐***层,代理层接收移动终端发送的携带用户标识的请求。推荐***层运行推荐服务,获取与用户标识对应存储的用户数据,进而根据用户数据对所有正排数据执行信息召回,按照与用户数据之间的相关性对召回信息进行排序,按照指定策略(排重、多样性、兴趣扩展等策略)生成信息推荐结果。最后由代理层将信息推荐结果返回给移动终端。
经过图8与图9的对比可知,本发明的信息召回服务可以利用图8单机中的信息召回逻辑,并可以利用单机的策略,对所有信息召回服务的返回结果进行排重、兴趣扩展以及实现信息多样性。由此,本发明服务器集群对单机的改造成本小,但是数据处理速度相对单机大大提高。
图10是本发明示例性实施例示出的一种信息推荐***的示意图。如图10所示,该信息推荐***包括:依次连接的代理服务器1010、调度服务器1030、融合服务器1050和多个召回服务器1070;
代理服务器1010用于接收向用户进行信息推荐的请求;
如图10所示,该请求可以是移动终端130发送的,并且携带发送方的用户标识。代理服务器1010接收移动终端130发送的,向用户进行信息推荐的请求。
调度服务器1030用于根据请求指示的用户标识,获取相应的用户数据;
其中,调度服务器1030中以键值对的形式存储了每个用户标识对应的用户数据,由此,调度服务器1030根据请求所携带的用户标识,从自身存储中获取用户标识对应的用户数据。
融合服务器1050用于通过用户数据并行请求多个召回服务器1070进行信息召回;
其中,融合服务器1050包括一台或多台服务器,融合服务器1050并行向多个召回服务器1070发送信息召回请求,该信息召回请求携带用户数据,触发多个召回服务器1070运行自身部署的信息召回服务进行信息召回。
召回服务器1070用于运行信息召回服务,信息召回服务根据用户数据从所配置的正排数据集合为用户的信息推荐执行信息召回,获得信息召回服务的返回结果,正排数据集合是所有正排数据切分所形成的;
其中,每台召回服务器1070运行所部署的信息召回服务,根据信息召回请求所携带的用户数据,从所配置的正排数据集合中获取与用户数据匹配的信息,得到信息召回服务的返回结果。其中,所有正排数据被切分为多个正排数据集合,并被分散部署在每个召回服务器中。
调度服务器1030还用于将所有信息召回服务的返回结果进行汇总,形成信息推荐结果。
其中,融合服务器1050可以首先按照指定策略(排重、多样性、兴趣扩展等)对下游多个召回服务器1070的返回结果进行调整,进而由调度服务器1030将经过融合服务器1050调整后的返回结果进行汇总,得到信息推荐结果。调度服务器1030还可以将信息推荐结果发送至代理服务器1010,由代理服务器1010将信息推荐结果反馈至移动终端130。
上述信息推荐***中各个服务器的功能和作用的实现过程可以参照上述信息推荐方法实施例中的描述,在此不再赘述。
下述为本公开装置实施例,可以用于执行本公开上述服务器集群执行的信息推荐方法实施例。对于本公开装置实施例中未披露的细节,请参照本***息推荐方法实施例。
图11是根据一示例性实施例示出的一种信息推荐装置的框图,该信息推荐装置可以用于图1所示实施环境的服务器集群中,执行图3、图5-图7任一所示的信息推荐方法的全部或者部分步骤。如图11所示,该装置包括但不限于:数据获取模块1110、并行请求模块1130、信息召回模块1150以及结果汇总模块1170。其中,信息召回模块1150相当于上述方法实施例中的信息召回服务。
数据获取模块1110,用于根据对用户触发进行的信息推荐,获取相应用户数据;
并行请求模块1130,用于通过获取的所述用户数据并行请求部署的多个信息召回模块触发进行信息召回;
信息召回模块1150,用于根据所述用户数据从所配置的正排数据集合为用户的信息推荐执行信息召回,获得所述信息召回模块的返回结果,所述正排数据集合是所有正排数据切分所形成的;
结果汇总模块1170,用于将所有信息召回模块的返回结果进行汇总,形成信息推荐结果。
上述装置中各个模块的功能和作用的实现过程具体详见上述信息推荐方法中对应步骤的实现过程,在此不再赘述。
数据获取模块1110比如可以是图2中的某一个物理结构输入输出接口258。
并行请求模块1130、信息召回模块1150以及结果汇总模块1170也可以是功能模块,用于执行上述信息推荐方法中的对应步骤。可以理解,这些模块可以通过硬件、软件、或二者结合来实现。当以硬件方式实现时,这些模块可以实施为一个或多个硬件模块,例如一个或多个专用集成电路。当以软件方式实现时,这些模块可以实施为在一个或多个处理器上执行的一个或多个计算机程序,例如图2的中央处理器218所执行的存储在存储器232中的程序。
在一种示例性实施例中,所述并行请求模块1130包括:
数据发送单元,用于将获取的所述用户数据并行发送至部署的多个信息召回模块,所述用户数据向所述信息召回模块的发送将触发所述信息召回模块为所述用户执行信息召回。
在一种示例性实施例中,所述信息推荐的进行部署了适应于若干推荐信息类型的若干垂直服务,且在所述垂直服务下游为相应推荐信息类型的信息召回部署了多个信息召回模块;所述数据发送单元包括:
服务调度子单元,用于通过调度若干所述垂直服务,将所述用户数据并行发送至每一垂直服务下游部署的多个信息召回模块。
在一种示例性实施例中,如图12所示,所述信息召回模块1150包括:
信息筛选单元1151,用于根据所述用户数据,从所配置的正排数据集合中筛选出信息特征与所述用户数据匹配的目标信息;
结果获得单元1152,用于根据所述目标信息获得所述信息召回模块的返回结果。
在一种示例性实施例中,如图13所示,所述结果获得单元1152包括:
点击率预估子单元11521,用于利用已构建的预测模型,计算所述用户数据所属用户对所述目标信息的点击率;
点击率排序子单元11522,用于按照点击率大小对所述目标信息进行排序,根据排序结果确定所述信息召回模块的返回结果。
进一步的,本发明提供的信息推荐装置还包括:
模型构建模块,用于调用分布式存储的样本数据进行机器学习,构建所述预测模型。
在一种示例性实施例中,如图14所示,结果汇总模块1170包括:
历史排重单元1171,用于根据所述用户的历史浏览记录,去除所有返回结果中的已浏览信息;
策略推荐单元1172,用于将剩余的返回结果按照配置的调整策略生成所述信息推荐结果。
可选的,本公开还提供一种电子设备,该电子设备可以用于图1所示实施环境的服务器集群中,执行图3、图5-图7任一所示的信息推荐方法的全部或者部分步骤。所述电子设备包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行上述示例性实施例所述的信息推荐方法。
该实施例中电子设备的处理器执行操作的具体方式已经在有关该信息推荐方法的实施例中执行了详细描述,此处将不做详细阐述说明。
在示例性实施例中,还提供了一种存储介质,该存储介质为计算机可读存储介质,例如可以为包括指令的临时性和非临时性计算机可读存储介质。该存储介质存储有计算机程序,该计算机程序可由多个服务器200的中央处理器222执行以完成上述信息推荐方法。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围执行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
Claims (15)
1.一种信息推荐方法,其特征在于,包括:
根据对用户触发进行的信息推荐,获取相应用户数据;
通过获取的所述用户数据并行请求部署的多个信息召回服务触发进行信息召回;
所述信息召回服务根据所述用户数据从所配置的正排数据集合为用户的信息推荐执行信息召回,获得所述信息召回服务的返回结果,所述正排数据集合是所有正排数据切分所形成的;
将所有信息召回服务的返回结果进行汇总,形成信息推荐结果。
2.根据权利要求1所述的方法,其特征在于,所述通过获取的所述用户数据并行请求部署的多个信息召回服务触发进行信息召回,包括:
将获取的所述用户数据并行发送至部署的多个信息召回服务,所述用户数据向所述信息召回服务的发送将触发所述信息召回服务为所述用户执行信息召回。
3.根据权利要求2所述的方法,其特征在于,所述信息推荐的进行部署了适应于若干推荐信息类型的若干垂直服务,且在所述垂直服务下游为相应推荐信息类型的信息召回部署了多个信息召回服务;
所述将获取的所述用户数据并行发送至部署的多个信息召回服务,包括:
通过调度若干所述垂直服务,将所述用户数据并行发送至每一垂直服务下游部署的多个信息召回服务。
4.根据权利要求1所述的方法,其特征在于,所述信息召回服务根据所述用户数据从所配置的正排数据集合为用户的信息推荐执行信息召回,获得所述信息召回服务的返回结果,包括:
所述信息召回服务根据所述用户数据,从所配置的正排数据集合中筛选出信息特征与所述用户数据匹配的目标信息;
根据所述目标信息获得所述信息召回服务的返回结果。
5.根据权利要求4所述的方法,其特征在于,所述根据所述目标信息获得所述信息召回服务的返回结果,包括:
所述信息召回服务利用已构建的预测模型,计算所述用户数据所属用户对所述目标信息的点击率;
按照点击率大小对所述目标信息进行排序,根据排序结果确定所述信息召回服务的返回结果。
6.根据权利要求5所述的方法,其特征在于,所述信息召回服务利用已构建的预测模型,计算所述用户数据所属用户对所述目标信息的点击率之前,所述方法还包括:
调用分布式存储的样本数据进行机器学习,构建所述预测模型。
7.根据权利要求1-6任意一项所述的方法,其特征在于,所述将所有信息召回服务的返回结果进行汇总,形成信息推荐结果,包括:
根据所述用户的历史浏览记录,去除所有返回结果中的已浏览信息;
将剩余的返回结果按照配置的调整策略生成所述信息推荐结果。
8.一种信息推荐***,其特征在于,包括:依次连接的代理服务器、调度服务器、融合服务器和多个召回服务器;
所述代理服务器用于接收向用户进行信息推荐的请求;
所述调度服务器用于根据所述请求指示的用户标识,获取相应的用户数据;
所述融合服务器用于通过所述用户数据并行请求多个召回服务器进行信息召回;
所述召回服务器用于运行信息召回服务,所述信息召回服务根据所述用户数据从所配置的正排数据集合为用户的信息推荐执行信息召回,获得所述信息召回服务的返回结果,所述正排数据集合是所有正排数据切分所形成的;
所述调度服务器还用于将所有信息召回服务的返回结果进行汇总,形成信息推荐结果。
9.一种信息推荐装置,其特征在于,包括:
数据获取模块,用于根据对用户触发进行的信息推荐,获取相应用户数据;
并行请求模块,用于通过获取的所述用户数据并行请求部署的多个信息召回模块触发进行信息召回;
信息召回模块,用于根据所述用户数据从所配置的正排数据集合为用户的信息推荐执行信息召回,获得所述信息召回模块的返回结果,所述正排数据集合是所有正排数据切分所形成的;
结果汇总模块,用于将所有信息召回模块的返回结果进行汇总,形成信息推荐结果。
10.根据权利要求9所述的装置,其特征在于,所述并行请求模块包括:
数据发送单元,用于将获取的所述用户数据并行发送至部署的多个信息召回模块,所述用户数据向所述信息召回模块的发送将触发所述信息召回模块为所述用户执行信息召回。
11.根据权利要求10所述的装置,其特征在于,所述信息推荐的进行部署了适应于若干推荐信息类型的若干垂直服务,且在所述垂直服务下游为相应推荐信息类型的信息召回部署了多个信息召回模块;所述数据发送单元包括:
服务调度子单元,用于通过调度若干所述垂直服务,将所述用户数据并行发送至每一垂直服务下游部署的多个信息召回模块。
12.根据权利要求9所述的装置,其特征在于,所述信息召回模块包括:
信息筛选单元,用于根据所述用户数据,从所配置的正排数据集合中筛选出信息特征与所述用户数据匹配的目标信息;
结果获得单元,用于根据所述目标信息获得所述信息召回模块的返回结果。
13.根据权利要求12所述的装置,其特征在于,所述结果获得单元包括:
点击率预估子单元,用于利用已构建的预测模型,计算所述用户数据所属用户对所述目标信息的点击率;
点击率排序子单元,用于按照点击率大小对所述目标信息进行排序,根据排序结果确定所述信息召回模块的返回结果。
14.一种电子设备,其特征在于,所述电子设备包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行完成权利要求1-7任意一项所述的信息推荐方法。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序可由处理器执行完成权利要求1-7任意一项所述的信息推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811020544.9A CN109408703B (zh) | 2018-09-03 | 2018-09-03 | 信息推荐方法及其***、装置、电子设备、存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811020544.9A CN109408703B (zh) | 2018-09-03 | 2018-09-03 | 信息推荐方法及其***、装置、电子设备、存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109408703A true CN109408703A (zh) | 2019-03-01 |
CN109408703B CN109408703B (zh) | 2023-04-14 |
Family
ID=65463912
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811020544.9A Active CN109408703B (zh) | 2018-09-03 | 2018-09-03 | 信息推荐方法及其***、装置、电子设备、存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109408703B (zh) |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110221817A (zh) * | 2019-06-17 | 2019-09-10 | 北京酷我科技有限公司 | 一种数据召回模块及推荐*** |
CN110633760A (zh) * | 2019-09-25 | 2019-12-31 | 北京酷我科技有限公司 | 一种推荐***整合策略及推荐*** |
CN110909200A (zh) * | 2019-10-09 | 2020-03-24 | 上海麦克风文化传媒有限公司 | 一种离线与实时相结合的音频专辑推荐***召回方法及*** |
CN110990695A (zh) * | 2019-11-22 | 2020-04-10 | 厦门美柚股份有限公司 | 推荐***内容召回方法及装置 |
CN111177563A (zh) * | 2019-12-31 | 2020-05-19 | 北京顺丰同城科技有限公司 | 一种信息推荐方法、装置、电子设备和存储介质 |
CN111190815A (zh) * | 2019-12-19 | 2020-05-22 | 广州华多网络科技有限公司 | 召回测试方法、装置、电子设备及存储介质 |
CN111882399A (zh) * | 2020-07-31 | 2020-11-03 | 平安国际融资租赁有限公司 | 服务信息推荐方法、装置、计算机***及可读存储介质 |
CN111966908A (zh) * | 2020-08-25 | 2020-11-20 | 贝壳技术有限公司 | 推荐***和方法、电子设备和计算机可读存储介质 |
CN112131456A (zh) * | 2019-06-24 | 2020-12-25 | 腾讯科技(北京)有限公司 | 一种信息推送方法、装置、设备及存储介质 |
CN112182414A (zh) * | 2020-08-13 | 2021-01-05 | 亿存(北京)信息科技有限公司 | 文章推荐方法、装置及电子设备 |
CN112765241A (zh) * | 2021-02-04 | 2021-05-07 | 腾讯科技(深圳)有限公司 | 召回数据确定方法、装置及存储介质 |
CN113032588A (zh) * | 2019-12-25 | 2021-06-25 | 北京达佳互联信息技术有限公司 | 多媒体推荐***、方法、装置及设备 |
CN113032587A (zh) * | 2019-12-25 | 2021-06-25 | 北京达佳互联信息技术有限公司 | 多媒体信息推荐方法、***、装置、终端和服务器 |
CN113256393A (zh) * | 2021-06-20 | 2021-08-13 | 浙江口碑网络技术有限公司 | 一种服务信息处理***、方法、装置以及电子设备 |
CN113746913A (zh) * | 2021-08-31 | 2021-12-03 | 上海明略人工智能(集团)有限公司 | 一种信息推荐方法及***、设备和存储介质 |
CN113781146A (zh) * | 2020-11-17 | 2021-12-10 | 北京沃东天骏信息技术有限公司 | 产品信息的推荐方法、装置、设备和存储介质 |
CN113961792A (zh) * | 2020-07-15 | 2022-01-21 | 北京达佳互联信息技术有限公司 | 一种资源推荐***、方法、电子设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103778260A (zh) * | 2014-03-03 | 2014-05-07 | 哈尔滨工业大学 | 一种个性化微博信息推荐***和方法 |
CN103823805A (zh) * | 2012-11-16 | 2014-05-28 | 腾讯科技(深圳)有限公司 | 基于社区的相关帖推荐***及推荐方法 |
CN106777094A (zh) * | 2016-12-14 | 2017-05-31 | 大连大学 | 基于视觉词汇表与多特征匹配的Skyline的医学大数据检索*** |
-
2018
- 2018-09-03 CN CN201811020544.9A patent/CN109408703B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103823805A (zh) * | 2012-11-16 | 2014-05-28 | 腾讯科技(深圳)有限公司 | 基于社区的相关帖推荐***及推荐方法 |
CN103778260A (zh) * | 2014-03-03 | 2014-05-07 | 哈尔滨工业大学 | 一种个性化微博信息推荐***和方法 |
CN106777094A (zh) * | 2016-12-14 | 2017-05-31 | 大连大学 | 基于视觉词汇表与多特征匹配的Skyline的医学大数据检索*** |
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110221817A (zh) * | 2019-06-17 | 2019-09-10 | 北京酷我科技有限公司 | 一种数据召回模块及推荐*** |
CN110221817B (zh) * | 2019-06-17 | 2023-01-17 | 北京酷我科技有限公司 | 一种数据召回模块及推荐*** |
CN112131456A (zh) * | 2019-06-24 | 2020-12-25 | 腾讯科技(北京)有限公司 | 一种信息推送方法、装置、设备及存储介质 |
CN110633760A (zh) * | 2019-09-25 | 2019-12-31 | 北京酷我科技有限公司 | 一种推荐***整合策略及推荐*** |
CN110633760B (zh) * | 2019-09-25 | 2023-01-17 | 北京酷我科技有限公司 | 一种推荐***整合方法及推荐*** |
CN110909200A (zh) * | 2019-10-09 | 2020-03-24 | 上海麦克风文化传媒有限公司 | 一种离线与实时相结合的音频专辑推荐***召回方法及*** |
CN110990695A (zh) * | 2019-11-22 | 2020-04-10 | 厦门美柚股份有限公司 | 推荐***内容召回方法及装置 |
CN111190815B (zh) * | 2019-12-19 | 2023-03-10 | 广州方硅信息技术有限公司 | 召回测试方法、装置、电子设备及存储介质 |
CN111190815A (zh) * | 2019-12-19 | 2020-05-22 | 广州华多网络科技有限公司 | 召回测试方法、装置、电子设备及存储介质 |
CN113032587A (zh) * | 2019-12-25 | 2021-06-25 | 北京达佳互联信息技术有限公司 | 多媒体信息推荐方法、***、装置、终端和服务器 |
CN113032588A (zh) * | 2019-12-25 | 2021-06-25 | 北京达佳互联信息技术有限公司 | 多媒体推荐***、方法、装置及设备 |
CN113032588B (zh) * | 2019-12-25 | 2024-03-08 | 北京达佳互联信息技术有限公司 | 多媒体推荐***、方法、装置及设备 |
CN113032587B (zh) * | 2019-12-25 | 2023-07-28 | 北京达佳互联信息技术有限公司 | 多媒体信息推荐方法、***、装置、终端和服务器 |
CN111177563A (zh) * | 2019-12-31 | 2020-05-19 | 北京顺丰同城科技有限公司 | 一种信息推荐方法、装置、电子设备和存储介质 |
CN111177563B (zh) * | 2019-12-31 | 2023-06-27 | 北京顺丰同城科技有限公司 | 一种信息推荐方法、装置、电子设备和存储介质 |
CN113961792A (zh) * | 2020-07-15 | 2022-01-21 | 北京达佳互联信息技术有限公司 | 一种资源推荐***、方法、电子设备及存储介质 |
CN111882399A (zh) * | 2020-07-31 | 2020-11-03 | 平安国际融资租赁有限公司 | 服务信息推荐方法、装置、计算机***及可读存储介质 |
CN112182414A (zh) * | 2020-08-13 | 2021-01-05 | 亿存(北京)信息科技有限公司 | 文章推荐方法、装置及电子设备 |
CN111966908A (zh) * | 2020-08-25 | 2020-11-20 | 贝壳技术有限公司 | 推荐***和方法、电子设备和计算机可读存储介质 |
CN113781146A (zh) * | 2020-11-17 | 2021-12-10 | 北京沃东天骏信息技术有限公司 | 产品信息的推荐方法、装置、设备和存储介质 |
CN112765241A (zh) * | 2021-02-04 | 2021-05-07 | 腾讯科技(深圳)有限公司 | 召回数据确定方法、装置及存储介质 |
CN112765241B (zh) * | 2021-02-04 | 2024-06-11 | 腾讯科技(深圳)有限公司 | 召回数据确定方法、装置及存储介质 |
CN113256393A (zh) * | 2021-06-20 | 2021-08-13 | 浙江口碑网络技术有限公司 | 一种服务信息处理***、方法、装置以及电子设备 |
CN113746913A (zh) * | 2021-08-31 | 2021-12-03 | 上海明略人工智能(集团)有限公司 | 一种信息推荐方法及***、设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109408703B (zh) | 2023-04-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109408703A (zh) | 信息推荐方法及其***、装置、电子设备、存储介质 | |
CN107423355B (zh) | 信息推荐方法及装置、电子设备 | |
US10783151B1 (en) | Popularity-based content feed management system | |
US10380649B2 (en) | System and method for logistic matrix factorization of implicit feedback data, and application to media environments | |
US11055340B2 (en) | System and method for creating synopsis for multimedia content | |
US11816172B2 (en) | Data processing method, server, and computer storage medium | |
CN111680254B (zh) | 一种内容推荐方法及装置 | |
WO2017071251A1 (zh) | 信息推送方法和装置 | |
US9633371B1 (en) | System and method for targeting content based on identified audio and multimedia | |
CN110321422A (zh) | 在线训练模型的方法、推送方法、装置以及设备 | |
CN102054003B (zh) | 网络信息推荐、建立网络资源索引的方法及*** | |
US20120102121A1 (en) | System and method for providing topic cluster based updates | |
US11061957B2 (en) | System and method for searching multimedia | |
US20120296967A1 (en) | Bridging Social Silos for Knowledge Discovery and Sharing | |
WO2015017716A1 (en) | Pre-delivery of content to a user device | |
CN106331779A (zh) | 在播放视频过程中基于用户喜好推送主播的方法及*** | |
AU2006339995A1 (en) | Online syndicated content feed metrics | |
TW201227368A (en) | Recommendation of search keywords based on indication of user intention | |
CN106469151A (zh) | 应用服务信息关联的方法、应用关联平台服务器和客户端 | |
CN110659414B (zh) | 一种基于用户画像的个性化信息推送方法及用户端 | |
EP3414680A1 (en) | Text digest generation for searching multiple video streams | |
CN103997662A (zh) | 节目推送的方法及*** | |
CN104461702A (zh) | 业务处理方法及装置 | |
CN109245989A (zh) | 一种基于信息分享的处理方法、装置及计算机可读存储介质 | |
CN110532428A (zh) | 热词配置方法、装置、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20221111 Address after: 1402, Floor 14, Block A, Haina Baichuan Headquarters Building, No. 6, Baoxing Road, Haibin Community, Xin'an Street, Bao'an District, Shenzhen, Guangdong 518000 Applicant after: Shenzhen Yayue Technology Co.,Ltd. Address before: 518000 Tencent Building, No. 1 High-tech Zone, Nanshan District, Shenzhen City, Guangdong Province, 35 Floors Applicant before: TENCENT TECHNOLOGY (SHENZHEN) Co.,Ltd. |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant |