CN110069732A - 一种信息展示的方法、装置及设备 - Google Patents
一种信息展示的方法、装置及设备 Download PDFInfo
- Publication number
- CN110069732A CN110069732A CN201910250907.6A CN201910250907A CN110069732A CN 110069732 A CN110069732 A CN 110069732A CN 201910250907 A CN201910250907 A CN 201910250907A CN 110069732 A CN110069732 A CN 110069732A
- Authority
- CN
- China
- Prior art keywords
- information
- presented
- data
- factor
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/904—Browsing; Visualisation therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/957—Browsing optimisation, e.g. caching or content distillation
- G06F16/9577—Optimising the visualization of content, e.g. distillation of HTML documents
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及一种信息展示的方法、装置及设备,确定待展示信息的发布时间数据;根据用户对所述待展示信息的操作信息确定所述待展示信息热度数据;根据所述待展示信息的文本内容和发布帐号信息确定所述待展示信息的质量数据;基于所述发布时间数据、所述热度数据和所述质量数据展示所述待展示信息。能够提高用户对信息的点击率,增加优质信息传播的效率。
Description
技术领域
本发明涉及数据处理技术领域,具体涉及一种信息展示的方法、装置 及设备。
背景技术
金融、新闻等信息是人们日常生活中常常需要获取的资料。在金融、 新闻信息流等服务中,通常需要根据内容的时效性和热门性进行信息排序, 特别用于在没有用户数据(如用户行为数据和用户画像数据)的冷启动场 景下,以期能够将热门且较新发布的资讯优先展示给用户,获得在冷启动 过程中较高的点击率效果。但现有技术中,由于信息展示算法不够全面和 精确,导致用户对展示出来的信息不会给予较高的点击率。
因此,有待提出一种新的信息展示的方法,以提高用户对信息的点击 率。
发明内容
本发明提出了一种信息展示的方法、装置及设备,提供了一种新的展 示信息的方案,能够提高用户对信息的点击率,增加优质信息传播的效率。 本发明具体是以如下技术方案实现的:
一方面,本发明提供了一种信息展示的方法,包括:
确定待展示信息的发布时间数据;
根据用户对所述待展示信息的操作信息确定所述待展示信息热度数 据;
根据所述待展示信息的文本内容和发布帐号信息确定所述待展示信息 的质量数据;
基于所述发布时间数据、所述热度数据和所述质量数据展示所述待展 示信息。
另一方面,本发明提供了一种信息展示的装置,包括:
第一确定模块,用于确定待展示信息的发布时间数据;
第二确定模块,用于根据用户对所述待展示信息的操作信息确定所述 待展示信息热度数据;
第三确定模块,用于根据所述待展示信息的文本内容和发布帐号信息 确定所述待展示信息的质量数据;
展示模块,用于基于所述发布时间数据、所述热度数据和所述质量数 据展示所述待展示信息。
进一步的,所述展示模块还包括:
排序分值获取单元,用于将所述发布时间数据、所述热度数据和所述 质量数据输入到预设信息排序公式中,得到所述待展示信息的排序分值;
展示顺序确定单元,用于根据所述排序分值确定所述待展示信息的展 示顺序;
第一展示单元,用于根据所述展示顺序对所述待展示信息进行展示。
所述排序分值获取单元的所述预设信息排序公式如下:
其中,Qk为第k个待展示信息的质量数据,Pk为第k个待展示信息的 热度数据,Tk为第k个待展示信息的发布时间数据,k为待排序信息的序号, A为平衡发布时间数据和质量数据、热度数据的权重因子,α为质量数据 和热度数据所占权重的比例因子,I为预设时间窗口中待展示信息的集合,i为集合I中的某个信息的标号,Pi为第i个待展示信息的热度数据,为在预设时间窗口中待展示信息的热度数据开根号后的最大值。
进一步的,所述装置还包括第一因子确定模块:
所述第一因子确定模块,包括:
第一数量的样本数据获取单元,用于获取第一数量的信息样本数据, 所述信息样本数据包括:所述样本数据的质量数据、热度数据、发布时间 数据;
第二数量的因子对确定单元,用于确定第二数量的因子取值对,所述 因子取值对包括权重因子和比例因子;
第三数量的排序分值确定单元,用于将所述第一数量的信息样本数据 和所述第二数量的因子取值对输入到所述预设信息排序公式中,得到所述 第一数量的信息样本数据分别在所述第二数量的因子取值对下的第三数量 的排序分值;
区分度确定单元,用于根据机器学习的方法,利用分类指标获得所述 第三数量的排序分值的区分度;
第一因子确定单元,用于根据所述区分度确定所述权重因子和所述比 例因子。
进一步的,所述装置还包括第二因子确定模块:
所述第二因子确定模块,包括:
请求接收单元,用于接收用户的信息获取请求;
信息确定单元,用于根据所述信息获取请求确定与所述信息获取请求 相应的第四数量的信息;
第四数量的信息数据获取单元,用于获取所述第四数量的信息的质量 数据、热度数据、发布时间数据;
第五数量的因子确定单元,用于确定第五数量的因子取值对,所述因 子取值对包括权重因子和比例因子;
第六数量的排序分值确定单元,用于将所述第四数量的信息的质量数 据、热度数据、发布时间数据和所述第五数量的因子取值对输入到所述预 设信息排序公式中,得到所述第四数量的信息分别在所述第五数量的因子 取值对下的第六数量的排序分值;
排序单元,用于根据所述第六数量的排序分值对所述第四数量的信息 进行排序;
第二展示单元,用于按照所述排序的顺序展示所述第四数量的信息;
点击率获取单元,用于获取预设时间内所述第四数量的信息的用户点 击率;
第二因子确定单元,用于将用户点击率最高的信息所对应的因子取值 对作为所述预设信息排序公式中的所述权重因子和所述比例因子。
进一步的,所述第二确定模块,还包括:
操作信息获取单元,用于获取用户对所述待展示信息的操作信息;
操作数量确定单元,用于根据所述操作信息确定用户对所述待展示信 息进行操作的操作数量;
热度数据确定单元,用于根据所述操作数量确定所述待展示信息的热 度数据。
进一步的,所述第三确定模块,还包括:
文本内容和发布帐号类别信息获取单元,用于获取所述待展示信息的 文本内容和发布所述待展示信息的发布帐号的类别信息;
第一质量信息获取单元,用于获取所述文本内容的第一质量信息;
第二质量信息获取单元,用于根据所述发布帐号的类别信息确定所述 待展示信息的第二质量信息;
根据所述第一质量数据确定单元,用于质量信息和所述第二质量信息 确定所述待展示信息的质量数据。
另一方面,本发明提供了一种信息展示的设备,所述设备包括处理器 和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或 指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由 所述处理器加载并执行以实现如所述第一方面所述的信息展示的方法。
本发明提供了一种信息展示的方法、装置及设备,通过综合考虑待展 示信息的发布时间数据、热度数据、质量数据的因素确定最终信息如何展 示,提高了信息展示的准确性和用户的点击率,增加了优质信息转播的效 率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下 面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易 见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技 术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其 它附图。
图1是本发明实施例提供的一种信息展示方法的实际应用场景图;
图2是本发明实施例提供的一种信息展示的方法的流程示意图;
图3是本发明实施例提供的一种热度数据确定方法的流程示意图;
图4是本发明实施例提供的一种质量数据确定方法的流程示意图;
图5是本发明实施例提供的另一种信息展示的方法的流程示意图;
图6是本发明实施例提供的一种对于本发明提出的预设信息排序公式 中权重因子A和比例因子α的确定方法的示意图;
图7是本发明实施例提供的另一种对于本发明提出的预设信息排序公 式中权重因子A和比例因子α的确定方法的示意图;
图8是本发明实施例提供的一种金融资讯展示的用户界面图;
图9是本发明实施例提供的一种信息展示的装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进 行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例, 而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没 有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护 的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第 一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先 后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述 的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。 此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排 他的包含,例如,包含了一系列步骤或单元的过程、方法、***、产品或 服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列 出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
以下介绍本发明信息展示的方法,本说明书提供了如实施例或流程图 所述的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者 更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的 一种方式,不代表唯一的执行顺序。在实际中的***或服务器产品执行时, 可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处 理器或者多线程处理的环境)。
目前,业内常用的信息展示方法通常参考Reddit排序公式:
其中,H表示内容的热度,比如内容的浏览量、点赞数,也可以是经 过加权(降权)处理过的一些值,H的值越大,排名靠前。T表示内容的发 布时间;t表示一个时间的起始值,需要比发布的时间早。T-t用来衡量一 个内容的的新旧程度,T-t的值越大,表示内容越新。A表示一个系数,A 越大,T-t的影响力就越小,即按照时间进行排序的影响就越小,内容更新 的速度也越慢。一般来说,A的初始值为10个小时,即36000秒。
上述公式是一种重力排序方法,对于feed流(一般指简易信息聚合中 用来接收该信息来源更新的接口)内容,重力比喻为让内容持续向下的力, 通常以时间为参考,时间越久重力越大,物品排序越向下。
对于feed流内容,拉力比喻为让内容往前排的力,通常以内容热度、 点赞、阅读量等为参考,值越大排序越向上。
重力排序是综合feed流的时效性和热门性,对内容进行排序,以期尽 可能将热门且较新的内容排在前面。
上述公式的时效性通过考虑时间因素距离指定时间的长度,通常指定 为unix时间的年代初始值,但在实际业务中对于大量内容计算距离进行减 法运算累积起来较耗费时间。
现有重力排序算法在实际金融、新闻资讯feed流业务应用中的效果较 一般,需设计符合业务需求的重力排序方法。
相比同类重力排序算法,本说明书实施例提供了一种面向金融、新闻 等资讯feed流的重力排序方法,充分考虑了信息质量、信息热度以及信息 的时效性这三个关键因素,并基于实际业务数据进行参数探索以实现对冷 启动场景下资讯的排序效果优化,改善了用户体验。在金融、新闻等feed 流排序服务中,可以根据本方案生成的排序结果作为面向冷启动用户的资 讯排序列表,综合信息的热度、质量以及时效性因素。
图1是本说明书实施例提供的信息展示方法的实际应用场景图。如图1 所示,当一个冷启动用户的请求request到来时,服务器server将向重力排 序模块请求重力排序结果,重力排序模块综合获得信息的质量数据、信息 的热度数据以及信息的时效度数据,进入排序算法公式算得排序得分,最 终返回所约定数量的排序结果。
图2是本发明实施例提供的一种信息展示的方法的流程示意图,其是 图1中重力排序模块的方法流程,该重力排序模块可以是独立的设备,也 可以集成在其他设备中,例如集成在服务器中,本说明书对此不作具体限 定,如图2所示,所述方法具体包括:
S201:确定待展示信息的发布时间数据。
在本说明书实施例中,待展示信息的发布时间数据可以是***时间, 例如windows、Unix***的时间。
S203:根据用户对所述待展示信息的操作信息确定所述待展示信息热 度数据。
具体的,如图3所示,所述步骤S203还包括:
S301:获取用户对所述待展示信息的操作信息。
所述操作信息包括但不限于:阅读信息、点赞、转发、点击、评论等 信息。所述操作信息可以由服务器获取。
S303:根据所述操作信息确定用户对所述待展示信息进行操作的操作 数量。
相应的,所述操作信息对应的操作数量包括但不限于:浏览时长、点 赞量、转发量、点击量、评论数以及其他统计信息。
S305:根据所述操作数量确定所述待展示信息的热度数据。
可以规定,操作信息的时长越长、数量越多,则待展示信息热度越高。
S205:根据所述待展示信息的文本内容和发布帐号信息确定所述待展 示信息的质量数据。
需要说明的是,步骤S201-S205的执行顺序可以根据实际需要任意变 换。
具体的,如图4所示,所述步骤S205还包括:
S401:获取所述待展示信息的文本内容和发布所述待展示信息的发布 帐号的类别信息。
步骤S401中待展示信息的发布帐号的类别信息用于指示发布帐号的权 威性或者等级,例如可以包括会员、非会员,或者是初级、中级、高级。
S403:获取所述文本内容的第一质量信息。
文本内容的质量可以根据文本内容是否具有较强的逻辑性、是否能够 提供新知识或新观点、内容是否真诚等中的一个或多个角度进行确定,还 可以根据用户的需求实现对文本内容质量的确定。
S405:根据所述发布帐号的类别信息确定所述待展示信息的第二质量 信息。
根据步骤S401中发布帐号的类别信息可以为待展示信息确定相应的第 二质量信息,其具体可以是一种等级信息,例如,会员的质量等级高于非 会员的质量等级,初级、中级、高级的质量等级为依次升高。
S407:根据所述第一质量信息和所述第二质量信息确定所述待展示信 息的质量数据。
该步骤具体可以根据自然语言处理NLP工具根据所述第一质量信息和 第二质量信息输出相应待展示信息的质量信息数据,其具体可以是一种得 分数据,例如得分范围为1-5分,质量最高为5分,质量最低为1分。
S207:基于所述发布时间数据、所述热度数据和所述质量数据展示所 述待展示信息。
具体地,如图5所示,步骤S207包括:
S501:将所述发布时间数据、所述热度数据和所述质量数据输入到预 设信息排序公式中,得到所述待展示信息的排序参数。
步骤S501中所述预设信息排序公式如下:
其中,Qk为第k个待展示信息的质量数据,Pk为第k个待展示信息的 热度数据,Tk为第k个待展示信息的发布时间数据,k为待排序信息的序号, A为平衡发布时间数据和质量数据、热度数据的权重因子,α为质量数据 和热度数据所占权重的比例因子,I为预设时间窗口中待展示信息的集合, 预设时间窗口可以选择为N小时,例如可以是24小时、48小时、一周等。 i为集合I中的某个信息的标号,Pi为第i个待展示信息的热度数据,为在预设时间窗口中待展示信息的热度数据开根号后的最大值。通过 值做分母便于每个资讯除以最大值实现归一化。
对于Qk,我们可以取质量得分的范围是1分到5分,用1分代入即质 量分的归一化值为0,用5分代入则质量分归一化值为1分其目的是为了对 原始分值进行归一化处理。信息质量由NLP工具输出,具体可以根据文本 内容、媒体账号等信息确定信息质量得分。
对于Tk,我们可以取Unix时间戳,例如1552527744代表北京时间 2019/3/14 9:42:24,unix时间戳所表示信息发布时间在数值上较大,为了和 质量得分以及热度得分可以相比,使用了A作为权重因素。
时效方面不再计算当前时间距信息发布时间的时长距离,而采用信息 发布的***(如unix***)时间直接作为排序公式的变量是因为传统公式 通常采用的方式,需要选定参考时间t,例如指定2019年1月1日作为 参考点从而获得相对时间,这样会存在一些问题:第一实际工程实践中有 些信息可能出现发布时间早于参考时间点,第二每次运算都需要做减法和 除法增加工程计算量(对大量信息计算时),所以采用优化版本。
同时,考虑信息质量分值并进行归一化以和热度因素可以进行加和, 具体的,体现了对质量分的归一化。对热度的计算方面考虑了热度的 降权和归一化,具体的,体现了对热度的归一化,以体现热 度影响的同时对整个公式统一计算值的合理性和有效性。该方案可提升排 序输出给用户信息的质量、热度以及时效性。参数α和参数A体现了调权 和降权。
S503:根据所述排序参数确定所述待展示信息的展示顺序。
根据计算出的待排序信息输入到预设信息排序公式后得出的值确定待 排序信息的展示顺序,值越大展示顺序越靠前。
S505:根据所述展示顺序对所述待展示信息进行展示。
本说明书中技术方案面向用户冷启动场景,如未登录用户等,基于信 息热度、信息时效性和信息质量,综合考虑信息的受欢迎程度、发布时间 以及质量,实现将新热高质信息排在头部的目标。
本发明实施例还提供了一种对于本发明提出的预设信息排序公式中权 重因子A和比例因子α的确定方法,该方法是根据机器学习的方法,使用 分类指标分析在不同参数组合下重力排序结果的区分度(可以用AUC值表 示)。AUC(Area Under Curve)被定义为受试者工作特征曲线(receiver operating characteristic curve,简称ROC曲线)下与坐标轴围成的面积,显 然这个面积的数值不会大于1。又由于ROC曲线一般都处于y=x这条直线的上方,所以AUC的取值范围在0.5和1之间。使用AUC值作为评价标 准是因为很多时候ROC曲线并不能清晰的说明哪个分类器的效果更好,而 作为一个数值,对应AUC更大的分类器效果更好。如图6所示,具体可以 包括如下步骤:
S601:获取第一数量的信息样本数据,所述信息样本数据包括:所述 样本数据的质量数据、热度数据、发布时间数据。
第一数量的信息样本数据是诸如金融、新闻等信息服务***采集到的 用户上报数据。
S603:确定第二数量的因子取值对,所述因子取值对包括权重因子和 比例因子。
根据权重因子和比例因子的取值范围选取合适数量的因子取值对。
S605:将所述第一数量的信息样本数据和所述第二数量的因子取值对 输入到所述预设信息排序公式中,得到所述第一数量的信息样本数据分别 在所述第二数量的因子取值对下的第三数量的排序分值。
一个信息样本数据可以对应第二数量个因子取值对,从而可以得到第 二数量个排序分值。从而,第三数量=第一数量*第二数量。
S607:根据机器学习的方法,利用分类指标获得所述第三数量的排序 分值的区分度。
具体的,获取第三数量的排序分值的区分度,如表1:
上表表头横行表示为α参数取不同值,表头纵列表示权重参数A的探 索取不同值,对应某一格取值为对应参数α和参数A时的AUC结果,即表 示两维度参数探索的排序分类区分度结果,对应的含义为排序结果对用户 点击的影响,AUC值越高代表该组参数效果越好。该表为基于实践工程采 集到的海量数据离线探索分析的结果,可看做调参的依据。
表格里的数据是根据样本数据,把各组参数放入机器学习模型训练后 测得的结果,根据这个结果我们选择相应的参数。
S609:根据所述区分度确定所述权重因子和所述比例因子。
根据所述区分度值的大小确定参数效果,所述区分度值越大则参数效 果越好。根据所述参数效果确定所述α参数和A参数的调优值。
通过分析样本数据在不同因子对下的区分度,可以快速进行排序参数 调优,实现了排序效果的优化。
本发明实施例还提供了另一种对于本发明提出的预设信息排序公式中 权重因子A和比例因子α的确定方法,该方法是根据实际工程应用中统计 结果获得,举例:我们可以对α参数和A参数取不同值,在线上***中进 行A/B测试,以测试相应参数所对应的***表现结果(其实就是对模型线 上服务的效果评估,如点击率),将表现结果好的作为优化后参数。如图7 所示,具体包括如下步骤:
S701:接收用户的信息获取请求。
用户的信息获取请求可以是根据输入的关键词进行信息搜索的信息获 取请求,也可以是无搜索词的信息获取请求,例如,用户点击“热点新闻” 向服务器获取相关信息。
S703:根据所述信息获取请求确定与所述信息获取请求相应的第四数 量的信息。
第四数量的信息实可以是根据用户的信息获取请求在数据库或服务器 等存储信息的设备上搜索到的所有信息的数量,也可以是根据数据库或服 务器等存储信息的设备预设的信息推送数量,例如,预设的信息推送数量 为1000条,则所述第四数量的信息为1000条。
S705:获取所述第四数量的信息的质量数据、热度数据、发布时间数 据。
S707:确定第五数量的因子取值对,所述因子取值对包括权重因子和 比例因子。
该步骤与步骤603相同,均是根据权重因子和比例因子的取值范围选 取合适数量的因子取值对。
S709:将所述第四数量的信息的质量数据、热度数据、发布时间数据 和所述第五数量的因子取值对输入到所述预设信息排序公式中,得到所述 第四数量的信息分别在所述第五数量的因子取值对下的第六数量的排序分 值。
与步骤605类似,第六数量=第四数量*第五数量。
S711:根据所述第六数量的排序分值对所述第四数量的信息进行排序。
直接根据排序分值对所述第四数量的信息进行排序。
S713:按照所述排序的顺序展示所述第四数量的信息。
S715:获取预设时间内所述第四数量的信息的用户点击率。
点击率CTR(Click Through Rate):指某一资讯被点击的次数与被展示 次数之比。
用户点击率可以用于体现用户对金融、新闻等信息的感兴趣或认可程 度等信息。实际应用中,还可以将用户点击率换成其他用于体现用户对信 息的感兴趣或认可程度等信息的其他数据。
S717:将用户点击率最高的信息所对应的因子取值对作为所述预设信 息排序公式中的所述权重因子和所述比例因子。
通过A/B测试确定用户对实际信息排序结果的反应,将反应结果好的 因子对确定为优化调参结果,也实现了排序效果的优化。
请参考图8,其是本说明书实施例提供的一种金融资讯展示的用户界面 图。图8显示的是用户点击“要闻”选项卡时,用户界面显示的是经过信 息排序公式排序后的6条最新热高质的要闻资讯,当用户浏览5分钟后, 服务器又自动获取到10条新的资讯信息。若用户点击“又发现了10条新 内容”按钮,则用户界面会显示更新后的6条资讯。其中,每页显示资讯 信息的数量,可以是开发人员根据实际需要进行设置的。新资讯信息的更 新时间也可以根据需要进行设置,例如10分钟更新一次等。
本发明实施例还提供了一种信息展示的装置,如图9所示,所述装置 包括:
第一确定模块901,用于确定待展示信息的发布时间数据;
第二确定模块903,用于根据用户对所述待展示信息的操作信息确定所 述待展示信息热度数据;
第三确定模块905,用于根据所述待展示信息的文本内容和发布帐号信 息确定所述待展示信息的质量数据;
展示模块907,用于基于所述发布时间数据、所述热度数据和所述质量 数据展示所述待展示信息。
进一步的,所述展示模块还包括:
排序分值获取单元,用于将所述发布时间数据、所述热度数据和所述 质量数据输入到预设信息排序公式中,得到所述待展示信息的排序分值;
展示顺序确定单元,用于根据所述排序分值确定所述待展示信息的展 示顺序;
第一展示单元,用于根据所述展示顺序对所述待展示信息进行展示。
所述排序分值获取单元的所述预设信息排序公式如下:
其中,Qk为第k个待展示信息的质量数据,Pk为第k个待展示信息的 热度数据,Tk为第k个待展示信息的发布时间数据,k为待排序信息的序号, A为平衡发布时间数据和质量数据、热度数据的权重因子,α为质量数据 和热度数据所占权重的比例因子,I为预设时间窗口中待展示信息的集合, i为集合I中的某个信息的标号,Pi为第i个待展示信息的热度数据,为在预设时间窗口中待展示信息的热度数据开根号后的最大值。
进一步的,所述装置还包括第一因子确定模块:
所述第一因子确定模块,包括:
第一数量的样本数据获取单元,用于获取第一数量的信息样本数据, 所述信息样本数据包括:所述样本数据的质量数据、热度数据、发布时间 数据;
第二数量的因子对确定单元,用于确定第二数量的因子取值对,所述 因子取值对包括权重因子和比例因子;
第三数量的排序分值确定单元,用于将所述第一数量的信息样本数据 和所述第二数量的因子取值对输入到所述预设信息排序公式中,得到所述 第一数量的信息样本数据分别在所述第二数量的因子取值对下的第三数量 的排序分值;
区分度确定单元,用于根据机器学习的方法,利用分类指标获得所述 第三数量的排序分值的区分度;
第一因子确定单元,用于根据所述区分度确定所述权重因子和所述比 例因子。
进一步的,所述装置还包括第二因子确定模块:
所述第二因子确定模块,包括:
请求接收单元,用于接收用户的信息获取请求;
信息确定单元,用于根据所述信息获取请求确定与所述信息获取请求 相应的第四数量的信息;
第四数量的信息数据获取单元,用于获取所述第四数量的信息的质量 数据、热度数据、发布时间数据;
第五数量的因子确定单元,用于确定第五数量的因子取值对,所述因 子取值对包括权重因子和比例因子;
第六数量的排序分值确定单元,用于将所述第四数量的信息的质量数 据、热度数据、发布时间数据和所述第五数量的因子取值对输入到所述预 设信息排序公式中,得到所述第四数量的信息分别在所述第五数量的因子 取值对下的第六数量的排序分值;
排序单元,用于根据所述第六数量的排序分值对所述第四数量的信息 进行排序;
第二展示单元,用于按照所述排序的顺序展示所述第四数量的信息;
点击率获取单元,用于获取预设时间内所述第四数量的信息的用户点 击率;
第二因子确定单元,用于将用户点击率最高的信息所对应的因子取值 对作为所述预设信息排序公式中的所述权重因子和所述比例因子。
进一步的,所述第二确定模块,还包括:
操作信息获取单元,用于获取用户对所述待展示信息的操作信息;
操作数量确定单元,用于根据所述操作信息确定用户对所述待展示信 息进行操作的操作数量;
热度数据确定单元,用于根据所述操作数量确定所述待展示信息的热 度数据。
进一步的,所述第三确定模块,还包括:
文本内容和发布帐号类别信息获取单元,用于获取所述待展示信息的 文本内容和发布所述待展示信息的发布帐号的类别信息;
第一质量信息获取单元,用于获取所述文本内容的第一质量信息;
第二质量信息获取单元,用于根据所述发布帐号的类别信息确定所述 待展示信息的第二质量信息;
根据所述第一质量数据确定单元,用于质量信息和所述第二质量信息 确定所述待展示信息的质量数据。
所述的装置实施例中的装置与方法实施例基于同样的发明构思。
本发明还提供了一种信息展示的设备,所述设备包括处理器和存储器, 所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所 述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器 加载并执行以实现如前述的信息展示的方法。
本说明书实施例中,所述存储器可用于存储软件程序以及模块,处理 器通过运行存储在存储器的软件程序以及模块,从而执行各种功能应用以 及数据处理。存储器可主要包括存储程序区和存储数据区,其中,存储程 序区可存储操作***、功能所需的应用程序等;存储数据区可存储根据所 述设备的使用所创建的数据等。此外,存储器可以包括高速随机存取存储 器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器还可以包括存储器控制器, 以提供处理器对存储器的访问。
由上述本发明提供的信息展示的方法、装置及设备的实施例可见,本 方案提供的面向金融、新闻信息feed流的重力排序,综合考虑了信息的时 效性、热门性以及质量度,在用户冷启动场景下,可以有效适应并提供综 合信息热度、时效以及质量的排序结果,为金融、新闻信息feed流排序服 务提供较好效果支撑。
本技术方案在以下几点对输出结果有益:
排序参数的探索,基于实际业务的工程数据对信息质量和信息热度的 权重参数进行了探索调优。
信息质量的引入,对于重力排序结果综合考虑了信息质量的因素。
信息热度的降权归一化处理,对于信息热度两极分化情况较严重的场 景通过降权处理减少影响,同时归一化确保和质量因素比例一直综合考虑。
对信息发布时间减少了距离计算的时间处理,减少了对参考时间的选 定以及在大量信息进行排序时的减法计算部分。
取值范围自适应,尽可能根据实际业务统计数据自适应取值范围,根 据业务不同以及不同时间段业务表现不同时,可以自适应变化和调整。本 方案综合考虑了feed流信息的热度、质量和时效性,将高质、热门且较新 的信息排在前面,满足冷启动用户对金融、新闻等信息排序的需求,有助 于提升用户体验。
需要说明的是:上述本发明实施例先后顺序仅仅为了描述,不代表实 施例的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所 附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步 骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。 另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能 实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的 或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相 同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的 不同之处。尤其,对于装置、***和服务器实施例而言,由于其基本相似 于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说 明即可。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以 通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可 以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存 储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发 明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在 本发明的保护范围之内。
Claims (10)
1.一种信息展示的方法,其特征在于,所述方法包括:
确定待展示信息的发布时间数据;
根据用户对所述待展示信息的操作信息确定所述待展示信息热度数据;
根据所述待展示信息的文本内容和发布帐号信息确定所述待展示信息的质量数据;
基于所述发布时间数据、所述热度数据和所述质量数据展示所述待展示信息。
2.根据权利要求1所述的方法,其特征在于,所述基于所述发布时间数据、所述热度数据和所述质量数据展示所述待展示信息,包括:
将所述发布时间数据、所述热度数据和所述质量数据输入到预设信息排序公式中,得到所述待展示信息的排序参数;
根据所述排序参数确定所述待展示信息的展示顺序;
根据所述展示顺序对所述待展示信息进行展示。
3.根据权利要求2所述的方法,其特征在于,所述预设信息排序公式如下:
其中,Qk为第k个待展示信息的质量数据,Pk为第k个待展示信息的热度数据,Tk为第k个待展示信息的发布时间数据,k为待排序信息的序号,A为平衡发布时间数据和质量数据、热度数据的权重因子,α为质量数据和热度数据所占权重的比例因子,I为预设时间窗口中待展示信息的集合,i为集合I中的某个信息的标号,Pi为第i个待展示信息的热度数据,为在预设时间窗口中待展示信息的热度数据开根号后的最大值。
4.根据权利要求3所述的方法,其特征在于,所述预设信息排序公式中的所述权重因子和所述比例因子的确定过程包括:
获取第一数量的信息样本数据,所述信息样本数据包括:所述样本数据的质量数据、热度数据、发布时间数据;
确定第二数量的因子取值对,所述因子取值对包括权重因子和比例因子;
将所述第一数量的信息样本数据和所述第二数量的因子取值对输入到所述预设信息排序公式中,得到所述第一数量的信息样本数据分别在所述第二数量的因子取值对下的第三数量的排序分值;
根据机器学习的方法,利用分类指标获得所述第三数量的排序分值的区分度;
根据所述区分度确定所述权重因子和所述比例因子。
5.根据权利要求3所述的方法,其特征在于,所述预设信息排序公式中的所述权重因子和所述比例因子的确定过程还包括:
接收用户的信息获取请求;
根据所述信息获取请求确定与所述信息获取请求相应的第四数量的信息;
获取所述第四数量的信息的质量数据、热度数据、发布时间数据;
确定第五数量的因子取值对,所述因子取值对包括权重因子和比例因子;
将所述第四数量的信息的质量数据、热度数据、发布时间数据和所述第五数量的因子取值对输入到所述预设信息排序公式中,得到所述第四数量的信息分别在所述第五数量的因子取值对下的第六数量的排序分值;
根据所述第六数量的排序分值对所述第四数量的信息进行排序;
按照所述排序的顺序展示所述第四数量的信息;
获取预设时间内所述第四数量的信息的用户点击率;
将用户点击率最高的信息所对应的因子取值对作为所述预设信息排序公式中的所述权重因子和所述比例因子。
6.根据权利要求1所述的方法,其特征在于,所述根据用户对所述待展示信息的操作信息确定所述待展示信息热度数据,包括:
获取用户对所述待展示信息的操作信息;
根据所述操作信息确定用户对所述待展示信息进行操作的操作数量;
根据所述操作数量确定所述待展示信息的热度数据。
7.根据权利要求1所述的方法,其特征在于,所述根据所述待展示信息的文本内容和发布帐号信息确定所述待展示信息的质量数据,包括:
获取所述待展示信息的文本内容和发布所述待展示信息的发布帐号的类别信息;
获取所述文本内容的第一质量信息;
根据所述发布帐号的类别信息确定所述待展示信息的第二质量信息;
根据所述第一质量信息和所述第二质量信息确定所述待展示信息的质量数据。
8.一种信息展示的装置,其特征在于,所述装置包括:
第一确定模块,用于确定待展示信息的发布时间数据;
第二确定模块,用于根据用户对所述待展示信息的操作信息确定所述待展示信息热度数据;
第三确定模块,用于根据所述待展示信息的文本内容和发布帐号信息确定所述待展示信息的质量数据;
展示模块,用于基于所述发布时间数据、所述热度数据和所述质量数据展示所述待展示信息。
9.根据权利要求8所述的装置,其特征在于,所述展示模块,包括:
排序分值获取单元,用于将所述发布时间数据、所述热度数据和所述质量数据输入到预设信息排序公式中,得到所述待展示信息的排序分值;
展示顺序确定单元,用于根据所述排序分值确定所述待展示信息的展示顺序;
第一展示单元,用于根据所述展示顺序对所述待展示信息进行展示。
10.一种信息展示设备,其特征在于,所述设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1至7中任一权利要求所述的信息展示的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910250907.6A CN110069732B (zh) | 2019-03-29 | 2019-03-29 | 一种信息展示的方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910250907.6A CN110069732B (zh) | 2019-03-29 | 2019-03-29 | 一种信息展示的方法、装置及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110069732A true CN110069732A (zh) | 2019-07-30 |
CN110069732B CN110069732B (zh) | 2022-11-22 |
Family
ID=67366828
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910250907.6A Active CN110069732B (zh) | 2019-03-29 | 2019-03-29 | 一种信息展示的方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110069732B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110489525A (zh) * | 2019-08-09 | 2019-11-22 | 腾讯科技(深圳)有限公司 | 搜索结果的获取方法和装置、存储介质及电子装置 |
CN112597361A (zh) * | 2020-12-16 | 2021-04-02 | 北京五八信息技术有限公司 | 一种排序处理方法、装置、电子设备及存储介质 |
CN112905674A (zh) * | 2021-03-04 | 2021-06-04 | 北京小米移动软件有限公司 | 信息排序方法及装置 |
CN117478629A (zh) * | 2023-12-20 | 2024-01-30 | 福建省捷云软件股份有限公司 | 基层社区治理信息公开*** |
CN117596133A (zh) * | 2024-01-18 | 2024-02-23 | 山东中测信息技术有限公司 | 基于多维数据的业务画像及异常监测***及监测方法 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102819804A (zh) * | 2011-06-07 | 2012-12-12 | 阿里巴巴集团控股有限公司 | 一种商品信息的推送方法及设备 |
CN103324666A (zh) * | 2013-05-14 | 2013-09-25 | 亿赞普(北京)科技有限公司 | 一种基于微博数据的话题跟踪方法及装置 |
CN104348892A (zh) * | 2013-08-09 | 2015-02-11 | 阿里巴巴集团控股有限公司 | 一种信息展示方法和装置 |
US20150080063A1 (en) * | 2013-09-17 | 2015-03-19 | Parkervision, Inc. | Method, apparatus and system for rendering an information bearing function of time |
CN104657496A (zh) * | 2015-03-09 | 2015-05-27 | 杭州朗和科技有限公司 | 一种计算信息热度值的方法和设备 |
CN105095311A (zh) * | 2014-05-22 | 2015-11-25 | 阿里巴巴集团控股有限公司 | 推广信息的处理方法、装置及*** |
CN106156878A (zh) * | 2015-04-21 | 2016-11-23 | 深圳市腾讯计算机***有限公司 | 广告点击率矫正方法及装置 |
CN106339383A (zh) * | 2015-07-07 | 2017-01-18 | 阿里巴巴集团控股有限公司 | 一种搜索排序方法及*** |
CN107229754A (zh) * | 2017-06-30 | 2017-10-03 | 北京金山安全软件有限公司 | 信息排序方法、装置、电子设备及存储介质 |
CN108154379A (zh) * | 2016-12-06 | 2018-06-12 | 腾讯科技(深圳)有限公司 | 媒体信息的发布方法和装置 |
CN108363788A (zh) * | 2018-02-12 | 2018-08-03 | 广州市贝聊信息科技有限公司 | 帖子智能排位方法、装置以及计算机可读存储介质 |
CN108491135A (zh) * | 2018-03-14 | 2018-09-04 | 北京达佳互联信息技术有限公司 | 信息展示方法、装置、计算机设备和存储介质 |
-
2019
- 2019-03-29 CN CN201910250907.6A patent/CN110069732B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102819804A (zh) * | 2011-06-07 | 2012-12-12 | 阿里巴巴集团控股有限公司 | 一种商品信息的推送方法及设备 |
CN103324666A (zh) * | 2013-05-14 | 2013-09-25 | 亿赞普(北京)科技有限公司 | 一种基于微博数据的话题跟踪方法及装置 |
CN104348892A (zh) * | 2013-08-09 | 2015-02-11 | 阿里巴巴集团控股有限公司 | 一种信息展示方法和装置 |
US20150080063A1 (en) * | 2013-09-17 | 2015-03-19 | Parkervision, Inc. | Method, apparatus and system for rendering an information bearing function of time |
CN105095311A (zh) * | 2014-05-22 | 2015-11-25 | 阿里巴巴集团控股有限公司 | 推广信息的处理方法、装置及*** |
CN104657496A (zh) * | 2015-03-09 | 2015-05-27 | 杭州朗和科技有限公司 | 一种计算信息热度值的方法和设备 |
CN106156878A (zh) * | 2015-04-21 | 2016-11-23 | 深圳市腾讯计算机***有限公司 | 广告点击率矫正方法及装置 |
CN106339383A (zh) * | 2015-07-07 | 2017-01-18 | 阿里巴巴集团控股有限公司 | 一种搜索排序方法及*** |
CN108154379A (zh) * | 2016-12-06 | 2018-06-12 | 腾讯科技(深圳)有限公司 | 媒体信息的发布方法和装置 |
CN107229754A (zh) * | 2017-06-30 | 2017-10-03 | 北京金山安全软件有限公司 | 信息排序方法、装置、电子设备及存储介质 |
CN108363788A (zh) * | 2018-02-12 | 2018-08-03 | 广州市贝聊信息科技有限公司 | 帖子智能排位方法、装置以及计算机可读存储介质 |
CN108491135A (zh) * | 2018-03-14 | 2018-09-04 | 北京达佳互联信息技术有限公司 | 信息展示方法、装置、计算机设备和存储介质 |
Non-Patent Citations (1)
Title |
---|
曲克伟: "基于热点话题发现的BBS检索排序策略研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110489525A (zh) * | 2019-08-09 | 2019-11-22 | 腾讯科技(深圳)有限公司 | 搜索结果的获取方法和装置、存储介质及电子装置 |
CN112597361A (zh) * | 2020-12-16 | 2021-04-02 | 北京五八信息技术有限公司 | 一种排序处理方法、装置、电子设备及存储介质 |
CN112597361B (zh) * | 2020-12-16 | 2023-12-12 | 北京五八信息技术有限公司 | 一种排序处理方法、装置、电子设备及存储介质 |
CN112905674A (zh) * | 2021-03-04 | 2021-06-04 | 北京小米移动软件有限公司 | 信息排序方法及装置 |
CN117478629A (zh) * | 2023-12-20 | 2024-01-30 | 福建省捷云软件股份有限公司 | 基层社区治理信息公开*** |
CN117478629B (zh) * | 2023-12-20 | 2024-04-12 | 福建省捷云软件股份有限公司 | 基层社区治理信息公开*** |
CN117596133A (zh) * | 2024-01-18 | 2024-02-23 | 山东中测信息技术有限公司 | 基于多维数据的业务画像及异常监测***及监测方法 |
CN117596133B (zh) * | 2024-01-18 | 2024-04-05 | 山东中测信息技术有限公司 | 基于多维数据的业务画像及异常监测***及监测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110069732B (zh) | 2022-11-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110069732A (zh) | 一种信息展示的方法、装置及设备 | |
CN102053971B (zh) | 用于面向排序的协同过滤的推荐方法和设备 | |
Li et al. | An approach for combining content-based and collaborative filters | |
US8433705B1 (en) | Facet suggestion for search query augmentation | |
US8751322B2 (en) | Method, device, and system for analyzing and ranking web-accessible data targets | |
Agarwal et al. | Statistical methods for recommender systems | |
US7716218B1 (en) | Method and system for enhanced search engine tuning | |
JP2007172249A (ja) | 文書分類プログラム、文書分類装置、および文書分類方法 | |
CN106096047B (zh) | 基于熵值法的用户分区偏好计算方法及*** | |
CN110490625A (zh) | 用户偏好确定方法及装置、电子设备、存储介质 | |
CN107045533B (zh) | 基于标签的教育资源推荐方法及*** | |
CN105989056A (zh) | 一种汉语新闻推荐*** | |
CN103309869A (zh) | 数据对象的展示关键词推荐方法及*** | |
CN109857872A (zh) | 基于知识图谱的信息推荐方法和装置 | |
JP2005322165A (ja) | 検索キーワード提示方法及び装置及びプログラム | |
CN110490683A (zh) | 一种线下线上协同多模型混合推荐的方法及*** | |
CN110147514B (zh) | 一种资源展示方法、装置及其设备 | |
CN113535050B (zh) | 一种基于界面联动的多界面展示方法、***及设备 | |
KR102368043B1 (ko) | 사용자 정의 토픽 모델링을 활용한 사용자 관심 뉴스 추천 장치 및 그 방법 | |
CN103778169B (zh) | 信息排序方法 | |
JP2005267095A (ja) | 情報表示方法及び装置及び情報表示プログラム | |
CN113761084A (zh) | 一种poi搜索排序模型训练方法、排序装置与方法及介质 | |
Liang et al. | A utility-based recommendation approach for academic literatures | |
CN105335385B (zh) | 一种基于项目的协同过滤推荐方法及装置 | |
CN101770467A (zh) | 分析和排序可访问web的数据目标的方法、装置和*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |