CN110674412A - 资源的推荐信息推送方法及装置、电子设备 - Google Patents
资源的推荐信息推送方法及装置、电子设备 Download PDFInfo
- Publication number
- CN110674412A CN110674412A CN201910766710.8A CN201910766710A CN110674412A CN 110674412 A CN110674412 A CN 110674412A CN 201910766710 A CN201910766710 A CN 201910766710A CN 110674412 A CN110674412 A CN 110674412A
- Authority
- CN
- China
- Prior art keywords
- day
- attention
- increment
- resource
- resources
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 65
- 230000003203 everyday effect Effects 0.000 claims abstract description 29
- 230000006870 function Effects 0.000 claims description 46
- 238000004364 calculation method Methods 0.000 claims description 32
- 238000010606 normalization Methods 0.000 claims description 21
- 238000012545 processing Methods 0.000 claims description 19
- 230000002829 reductive effect Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 9
- 238000004422 calculation algorithm Methods 0.000 description 8
- 230000003993 interaction Effects 0.000 description 7
- 230000008859 change Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000002354 daily effect Effects 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 230000000670 limiting effect Effects 0.000 description 3
- 238000010438 heat treatment Methods 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 238000010792 warming Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种资源的推荐信息推送方法及装置、电子设备。本发明所述的资源的推荐信息推送方法包括步骤:获取统计周期内资源每天的关注量;根据资源每天的关注量和该资源该天的前一天的关注量获取资源每天的关注增量;根据统计周期内资源每天的关注增量大小,推送关注增量较大的资源的推荐信息。本发明所述的资源的推荐信息推送方法根据统计周期内资源每天的关注量与该天的前一天的关注量之间的差值即关注增量大小,向用户推送关注增量较大的资源的推荐信息,能够更准确的向用户推荐热门的资源,同时,在推荐持续热门的资源的同时,还能更多的推荐最近热门的资源。
Description
技术领域
本发明涉及信息处理技术领域,特别是涉及一种资源的推荐信息推送方法及装置、电子设备。
背景技术
基于热门的推荐的方法是一类典型的非个性化推荐,基于热门的推荐方法常见的实现方式有下述四种:单位时间的交互数、总交互数、评论数、时间排序。在工业界,大部分生产都会使用总交互数评判资源的热度,即统计资源一段时间内的总的交互数(点赞数、评论数、点击量等),根据资源的交互数进行排序取前几位的最具热度的资源针对匿名或者长时间未登录的用户进行推荐以刺激流量或者注册,这种基于总交互数的热度排序方法包括一些缺陷,例如如果有资源在近期时间点开始因为一些因素(资源自身口碑增长、外部因素的刺激等)热度突然持续上升,则基于总交互数的统计排序方式势必会削弱这部分资源在推荐结果中的存在,纳入热度统计的时间越长,对这部分资源越不利;最后,由于马太效应带来的重复并集中的推荐会造成热门推荐的资源倾斜。
发明内容
基于此,本发明的目的在于,提供一种资源的推荐信息推送方法及装置、电子设备,其不但能推荐持续热门的资源,还能更多的推荐最近热门的资源。
根据本公开实施例的第一方面,本发明实施例提供了一种资源的推荐信息推送方法,所述方法包括步骤:
获取统计周期内资源每天的关注量;
根据资源每天的关注量和该资源该天的前一天的关注量获取资源每天的关注增量;
根据统计周期内资源每天的关注增量大小,推送关注增量较大的资源的推荐信息。
本发明所述的资源的推荐信息推送方法,根据统计周期内资源每天的关注量与该天的前一天的关注量之间的差值即关注增量大小,向用户推送关注增量较大的资源的推荐信息,能够更准确的向用户推荐热门的资源,同时,在推荐持续热门的资源的同时,还能更多的推荐最近热门的资源。
进一步地,根据统计周期内资源每天的关注增量大小,推送关注增量较大的资源的推荐信息,包括:
对统计周期内资源每天的关注增量求和,获取总关注增量,推送总关注增量较大的资源的推荐信息;
或者,
对统计周期内资源每天的关注增量求和,根据统计周期内该资源的上架天数获取该资源在上架期间每天的平均关注增量,推送平均关注增量较大的资源的推荐信息。
进一步地,对统计周期内资源每天的关注增量求和,包括:
对统计周期内资源每天的关注增量加权求和。
进一步地,对统计周期内资源每天的关注增量加权求和,包括:
将统计周期内资源每天的关注增量乘以预设的衰减函数后求和,离统计周期的起始时间越近,所述衰减函数值越小,从而降低时间较远的天数的权重,更准确的反应资源当前的热度。
进一步地,对统计周期内资源每天的关注增量加权求和,包括:
对统计周期内第一天至该天的关注增量进行加权计算,得到该天的加权增量,计算公式为:
vd=vd-1+θd
其中,sd为该天的加权增量,vd为该天的中间计算量,vd-1为该天的前一天的中间计算量,θd该天的关注增量;
将统计周期内资源每天的加权增量乘以预设的衰减函数后求和,离统计周期的起始时间越近,所述衰减函数值越小。
进一步地,对统计周期内资源每天的关注增量加权求和,包括:
计算所述关注增量的指数加权平均值,其中,所述指数加权平均值的计算公式为:
wd=β·wd-1+(1-β)θd
其中,wd为截止统计周期最后一天的关注增量的指数加权平均值,wd-1为截止统计周期前一天的关注增量的指数加权平均值,β为可调节权重参数,θd该天的关注增量,从而降低时间较远的天数的权重,更准确的反应资源当前的热度。
进一步地,获取统计周期内资源每天的关注量,包括:
获取每天不同资源的关注量的平均值和标准差;
根据每天不同资源的关注量的平均值和标准差对不同资源每天的关注量进行数据标准化处理,计算公式为:
其中,ωd*为计算数据标准化后该天的关注量值,ωd为该天的关注量,为该天不同资源的关注量的平均值,δ为该天不同资源的关注量的标准差,通过对不同资源每天的关注量进行数据标准化处理一方面可以让让数据在相等规模内,减小数据处理量,另一方面可以消除天与天之间差异。
进一步地,根据资源每天的关注量和该资源该天的前一天的关注量获取资源每天的关注增量后,还包括:
获取每天不同资源的关注增量的平均值和标准差;
根据每天不同资源的关注增量的平均值和标准差对不同资源每天的关注增量进行数据标准化处理,计算公式为:
其中,θd*为计算数据标准化后该天的关注增量值,θd为该天的关注增量,为该天不同资源的关注增量的平均值,σ为该天不同资源的关注增量的标准差,通过对不同资源每天的关注增量进行数据标准化处理一方面可以让让数据在相等规模内,减小数据处理量,另一方面可以消除天与天之间差异。
进一步地,所述关注量包括以下任一:
点击量、评论数、点赞数。
根据本公开实施例的第二方面,还提供了一种资源的推荐信息推送装置,所述装置包括:
关注量获取模块,用于获取统计周期内资源每天的关注量;
关注增量获取模块,用于根据资源每天的关注量和该资源该天的前一天的关注量获取资源每天的关注增量;
推送模块,用于根据统计周期内资源每天的关注增量大小,推送关注增量较大的资源的推荐信息。
根据本公开实施例的第三方面,还提供了一种电子设备,所述电子设备包括:
存储器以及处理器;
所述存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本公开实施例第一方面所述的资源的推荐信息推送方法。
为了更好地理解和实施,下面结合附图详细说明本发明。
附图说明
图1为在一个示例性实施例中示出的本发明资源的推荐信息推送方法流程示意图;
图2为在一个示例性实施例中示出的本发明资源的推荐信息推送方法中关注增量加权求和的流程图;
图3为在一个示例性实施例中示出的本发明资源的推荐信息推送方法中对不同资源每天的关注量进行数据标准化处理的流程图;
图4为在一个示例性实施例中示出的本发明资源的推荐信息推送方法中不同资源每天的关注增量进行数据标准化的流程图;
图5为在一个示例性实施例中示出的本发明资源的推荐信息推送方法流程示意图;
图6为在一个示例性实施例中示出的本发明资源的推荐信息推送方法衰减函数red(d)的图像示意图;
图7a为在一个示例性实施例中示出的本发明资源的推荐信息推送方法近期开始热门资源30天的点击量示意图;
图7b为在一个示例性实施例中示出的本发明资源的推荐信息推送方法近期开始热门资源30天标准化后的Δcnt面积图;
图7c为在一个示例性实施例中示出的本发明资源的推荐信息推送方法曾经下架过的热门资源30天的点击量变化示意图;
图7d为在一个示例性实施例中示出的本发明资源的推荐信息推送方法曾经下架过的热门资源30天的点击量标准化后的Δcnt面积图;
图7e为在一个示例性实施例中示出的本发明资源的推荐信息推送方法持续热门资源30天的点击量变化示意图;
图7f为在一个示例性实施例中示出的本发明资源的推荐信息推送方法持续热门资源30天的点击量标准化后的Δcnt面积图;
图8为在一个示例性实施例中示出的使用TopN和本发明实施例的资源的推荐信息推送方法的推荐结果分布情况图;
图9为在一个示例性实施例中示出的本发明资源的推荐信息推送装置的结构框图;
图10为在一个示例性实施例中示出的本发明电子设备的结构框图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。
在本发明使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本发明可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本发明范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
本发明实施例的资源的推荐信息推送方法可以应用于电子商务网站、智能终端的软件程序等,所述资源可以是资源、服务,还可以是网络课程资源等。本发明实施例的资源的推荐信息推送方法所在的电子设备的工作环境优选为资源推荐服务器,该资源推荐服务器可包括多个数据库。但是该资源的推荐信息推送方法所在的电子设备也不限于个人计算机、多处理器***、消费型电子设备、小型计算机、大型计算机、包括上述任意***或设备的分布式计算环境,等等。
如图1所示,在一个示例性的实施例中,本发明资源的推荐信息推送方法包括如下步骤:
步骤S101:获取统计周期内资源每天的关注量。
所述统计周期为预先设定的当前时间之前的一段时间期间,通常为天的整数倍,例如可以是一个月或一个季度等。所述关注量表征用户对该资源的关注热度,关注量越大,则用户对该资源的关注热度越高。对于不同的资源,关注量可以有多种不同的具体表现形式,例如可以是点赞数、评论数或点击量等,也可以是点赞数、评论数或点击量中多个的组合,在一些注重评价的资源中,还可以是好评数、好评比例等。
步骤S102:根据资源每天的关注量和该资源该天的前一天的关注量获取资源每天的关注增量。
步骤S103:根据统计周期内资源每天的关注增量大小,推送关注增量较大的资源的推荐信息。
所述关注增量可以是通过该天的关注量减去该天的前一天的关注量获取,如果该天的关注量大于该天的前一天的关注量,即该天该资源的热度处于上升趋势,则所述关注增量为正值,反之,如果该天该资源的热度处于下降趋势,则所述关注增量为负值。
本发明实施例根据统计周期内资源每天的关注增量来反应该资源在当前时间之前的一段时间期间内的热度,并根据不同资源在统计周期内的热度大小,向用户推荐热度较大即关注增量较大的资源的推荐信息。
其中,推荐的依据可以是对资源每天的关注增量进行不同的运算,获取能反映该资源在整个统计周期内的热度的总关注增量,并根据总关注增量的大小排序向用户推送总关注增量较大的资源的推荐信息,在其他例子中,还可以是获取能反映该资源在整个统计周期内的热度的平均关注增量,并根据平均关注增量的大小排序向用户推送平均关注增量较大的资源的推荐信息。
推送关注增量较大的资源的推荐信息可以是在用户浏览网页或使用应用程序时在网页中或应用程序中向用户推送广告或向用户展示推荐资源列表的方式,还可以是向用户发送推荐短信等方式,所述推荐信息可以是该资源的带超链接的图标,或该资源的详细信息等。
本发明所述的资源的推荐信息推送方法,根据统计周期内资源每天的关注量与该天的前一天的关注量之间的差值即关注增量大小,向用户推送关注增量较大的资源的推荐信息,能够更准确的向用户推荐热门的资源,同时,在推荐持续热门的资源的同时,还能更多的推荐最近热门的资源。
在一个示例性的实施例中,步骤S103中,根据统计周期内资源每天的关注增量大小,推送关注增量较大的资源的推荐信息的一种具体实现方式可以是对统计周期内资源每天的关注增量求和,获取总关注增量,并向用户推送总关注增量较大的资源的推荐信息。
由于在统计周期内部分资源可能会中途下架,则在下架期间该部分资源的关注量和关注增量都为零,或者部分资源在统计周期期间上架,则该部分资源在未上架期间的关注量和关注增量也为零,为更好的体现这两部分资源的热度,提高这两部分资源的推送率,在一个示例性的实施例中,获取总关注增量后,还根据该资源在统计周期内的上架天数获取该资源在上架期间每天的平均关注增量,并向用户推送平均关注增量较大的资源的推荐信息。其中,平均关注增量可以是通过总关注增量除以上架天数获取。
资源在统计周期内的热门程度的表征方式通常包括以下几种形式:持续热门、热门程度下降、近期开始热门。在上述实施例体现出持续热门资源的基础上,为更好的体现出近期开始热门的资源,同时降低热门程度下降的资源的比重,在一个示例性的实施例中,在对关注增量进行求和时,可以根据离统计周期的起始时间的距离调整资源在统计周期内每天的关注增量的权重,即上述求和方式可以是对统计周期内资源每天的关注增量求和具体为对统计周期内资源每天的关注增量加权求和。
其中,加权求和的方式可以是在对每天的关注增量求和时,对每天的关注增量赋予不同的权重值,从而减弱低权重值对应该天的关注增量在总关注增量中的比重,增加高权重值对应该天的关注增量在总关注增量中的比重。所述权重值的大小确定方式可以是离统计周期的起始时间越近,则权重值越小,从而降低时间较为久远的资源热门程度的比重。
在一个例子中,所述权重值可以根据一预设的衰减函数确定,即加权求和的方式可以是将统计周期内资源每天的关注增量乘以预设的衰减函数后求和,离统计周期的起始时间越近,所述衰减函数值越小,其中,所述衰减函数值即为每天的关注增量所对应的权重值。
在一个示例性的实施例中,对统计周期内资源每天的关注增量加权求和还可以是通过如下步骤进行:
步骤S201:对统计周期内第一天至该天的关注增量进行加权计算,得到该天的加权增量,计算公式为:
vd=vd-1+θd (2)
其中,sd为该天的加权增量,vd为该天的中间计算量,vd-1为该天的前一天的中间计算量,θd该天的关注增量;
步骤S202:将统计周期内资源每天的加权增量乘以预设的衰减函数后求和,离统计周期的起始时间越近,所述衰减函数值越小。
将上述公式乘以预设的衰减函数后,公式如下:
其中,f(d)为衰减函数。从上述公式中可以看出,与上一实施例中对每天的关注增量的权重是以离统计周期的起始时间越近,权重值越小不同,本实施例的公式(1)和公式(2)中对每天的关注增量的权重是以离统计周期的起始时间越近,权重值越大,而本实施例的衰减函数f(d)与上一实施例的衰减函数相同,离统计周期的起始时间越近,衰减函数值越大。在本实施例最终的加权求和公式中,关注增量的权重值大小是以离统计周期的起始时间越近或越远,权重值越小,而统计周期中间时间段的权重值较大。从而本实施例更加关注在统计周期中期用户对资源的关注热度,能更好的体现出从统计周期中期开始热门的资源,同时降低热门程度下降的资源的比重。
上述的计算加权增量和乘以预设的衰减函数的步骤的顺序不做限定,在其他例子中,也可以是先乘以预设的衰减函数,再根据乘以预设的衰减函数后的关注增量计算加权增量。
在其他例子中,本实施例的关注增量的权重值大小是以离统计周期的起始时间越近或越远,权重值越小,而统计周期中间时间段的权重值较大,还可以是通过将统计周期内每天的关注增量乘以预设的衰减函数实现,其中,此处的衰减函数值离统计周期的起始时间越近或越远,衰减函数值越小。
在一个示例性的实施例中,离统计周期的起始时间越近,权重值越小,从而降低时间较为久远的资源热门程度的比重,还可以是通过如下方式实现对统计周期内资源每天的关注增量加权求和:
计算所述关注增量的指数加权平均值,其中,所述指数加权平均值的计算公式为:
wd=β·wd-1+(1-β)θd
其中,wd为截止统计周期最后一天的关注增量的指数加权平均值,wd-1为截止统计周期前一天的关注增量的指数加权平均值,β为可调节权重参数,θd该天的关注增量,其中,θ0为零。
将上述公式折算为根据该天的关注增量后,则公式为:
wn=(1-β)θn+β·(1-β)θn-1+β2·(1-β)θn-1+βn-1·(1-β)θ1
其中,n为统计周期的总天数,wn为统计周期内每天的关注增量的指数加权平均值,从上述公式可知,指数加权平均值wn由每一天的关注增量乘以指定的权值后求和得到,其中,离统计周期的起始时间越近,权值越小。
在一些场景中,同一资源提供方可能会同时提供多种类型的不同资源,不同资源由于针对不同的客户需求或面对不同种类的客户,曝光率相差较大,也即其关注量的差距有可能是很大的,如果仅是根据关注量进行统计,则有可能无法对面对小众消费群体的资源进行推送。为了更公平的向用户推送不同等级关注量的资源,还对不同资源每天的关注量进行数据标准化处理,步骤S101中获取统计周期内资源每天的关注量具体包括如下步骤:
步骤S301:获取每天不同资源的关注量的平均值和标准差。
步骤S302:根据每天不同资源的关注量的平均值和标准差对不同资源每天的关注量进行数据标准化处理,计算公式为:
在其他例子中,还可以是针对每天不同资源的关注增量进行数据标准化处理,根据资源每天的关注量和该资源该天的前一天的关注量获取资源每天的关注增量后,还包括:
步骤S401:获取每天不同资源的关注增量的平均值和标准差。
步骤S402:根据每天不同资源的关注增量的平均值和标准差对不同资源每天的关注增量进行数据标准化处理,计算公式为:
上述标准化处理的公式皆为z-score标准化公式,通过上述两个例子中的数据标准化处理,将不同资源每天的关注量或关注增量确定为统一数据标准,克服了由于面对不同的客户需求或面对不同种类的客户所造成的关注量偏差,同时还将关注量缩小为较小的数值,减少了数据的计算量。在其他的例子中,也可以不对上述数据进行标准化处理,针对资源量大,类型丰富并且各类型热度均匀(不同类型的资源的曝光率相差不大)的资源按照总关注增量或平均关注增量从大到小排列输出热门资源的排序结果进行推荐,针对资源量不大,类型不多且热度集中在某一类的资源,可以分组后取类型中的前几名做热门推荐。
如图5所示,在一个具体的实施例中,本发明实施例的资源的推荐信息推送方法包括如下步骤:
步骤S501:获取统计周期内资源每天的关注量cnt。
步骤S502:根据资源每天的关注量和该资源该天的前一天的关注量获取资源每天的关注增量Δcnt。
步骤S503:将每天的不同资源的关注增量Δcnt做标准化(normalization),得到Δzcnt,标准化方式为z-score标准化。
步骤S504:将标准化后的关注增量Δzcnt乘以预设的衰减函数red(d),其中,离统计周期的起始时间越近,衰减函数red(d)的值越小。
首先,使用映射函数index(d)对标准化后的关注增量Δzcnt按离统计周期的起始时间越近,值越小的方式削减,例如,统计周期为30天,那么第一天(d=1)的映射函数index(d)值可以是第二天(d=2)的映射函数index(d)值可以是则最后一天(d=30,也即离统计周期的起始时间最远的一天)的映射函数index(d)值为1。选择衰减函数red(d)为ex-3,其中,衰减函数red(d)的图像如图6所示。因为index(d)函数得到的结果的范围为为了能够将index(d)函数得到的值代入衰减函数,这里直接将该函数得到的值扩大3倍,范围变成将衰减函数ex-3和index(d)函数复合起来,得到衰减函数red(d)的公式如下:
red(Δzcnt)=Δzcnt·e(3·index(d)-3)
从图6中可以看出,离现在越近的天数的关注增量保留的影响会越大。
步骤S505:对统计周期内第一天至该天的关注增量进行加权计算,得到该天的加权增量,计算公式为:
vd=vd-1+θd
其中,sd为该天的加权增量,vd为该天的中间计算量,vd-1为该天的前一天的中间计算量,θd该天的关注增量,θd等于前一步骤中的red(d)。在一些例子中,如果资源在该天没有上架,可以将资源在该天的加权增量sd置为0,而vd则保持该天的前一天的值,从而减小资源未上架所造成的影响。
步骤S506:对每天的加权增量sd求和,获得统计期间内的总的加权增量total_s。计算公式如下:
其中,n为统计周期的天数。
步骤S507:根据统计周期内该资源的上架天数online_d获取该资源在上架期间每天的平均关注增量aver_s,对平均关注增量aver_s进行排序,推送平均关注增量aver_s较大的资源的推荐信息。计算公式为:
其中,针对资源量大,类型丰富并且各类型热度均匀(不同类型的资源的曝光率相差不大)的资源按照平均关注增量aver_s从大到小排列输出热门资源的排序结果进行推荐,针对资源量不大,类型不多且热度集中在某一类的资源,可以分组后取类型中的前几名做热门推荐。
在时间复杂度方面,设统计周期D,资源总数为N,那么算法的时间复杂度为O(DN),但是算法的复杂度可以通过维持一个历史计算表来降低,这个表会记录d-1天之前每天资源的标准化结果,这样在d天计算推荐结果的时候,只需要计算一次该天的所有资源的标准化结果以及每个资源新的平均关注增量aver_s,则时间复杂度降低为O(N),计算速度将会大大提升。
如图7a和图7b所示,图7a和图7b分别为一个例子中近期开始热门资源30天的关注量变化和标准化后的关注增量Δzcnt面积图,该资源于4月9日上线,上架后可以看到该资源一开始的关注量和关注增量Δzcnt面积并不大,从4月17日起资源开始出现关注量提升。如果使用传统的基于30天的关注量cnt总和的排序算法,这类资源和持续热门的资源(即资源从统计开始就一直处于比较高的关注量)相比,没有了前期的关注量积累优势,无法出现在推荐结果中。
如图7c和图7d所示,图7c和图7d分别为一个例子中曾经下架过的热门资源30天的关注量变化和标准化后的关注增量Δzcnt面积图,该资源于4月10日上线,4月13日至4月16这段时间曾经下架,如果使用传统的基于30天的关注量cnt总和的排序算法,这类资源大概率因为某段时间的关注量丢失而竞争推荐失败。
如图7e和图7f所示,图7e和图7f分别为一个例子中持续热门资源30天的关注量变化和标准化后的关注增量Δzcnt面积图,可以看到这部分资源每日的关注量cnt和关注增量Δzcnt稳定波动,说明算法对于持续热门这部分资源依然保持了筛选推荐。
如图8所示,图8为使用TopN(传统的基于30天的关注量cnt总和的排序算法)和本发明实施例的资源的推荐信息推送方法的推荐结果分布情况,可以看出来新的算法有效的抑制了持续热门的资源在推荐结果中的存在,给了最近热门和受到过曾经下架的资源的更多曝光机会。其中,持续热门:该资源从统计以来一直处于热门状态,即关注量一直较大且关注量总体呈上升趋势;2)最近热门:该资源以前一直处于低热度状态,最近一段时间开始流行起来,即关注量从最近一段时间开始持续增大;3)曾经下架:资源在上架之后曾经出现连续或者多次间断的下架,即在统计周期内关注量一段时间内为零。在图8的三组柱状图中,每组左侧的柱状图为使用传统的基于30天的cnt总和的排序算法的推荐结果,每组右侧的柱状图为使用本发明实施例的资源的推荐信息推送方法的推荐结果。
与前述资源的推荐信息推送方法相对应,本发明还提供一种资源的推荐信息推送装置,所述装置可以是安装于任何智能终端,例如,可以具体为计算机、服务器、手机、平板电脑、交互式智能平板、PDA(Personal Digital Assistant,个人数字助理)、电子书阅读器、多媒体播放器等。本发明实施例的资源的推荐信息推送装置,根据统计周期内资源每天的关注量与该天的前一天的关注量之间的差值即关注增量大小,向用户推送关注增量较大的资源的推荐信息,能够更准确的向用户推荐热门的资源,同时,在推荐持续热门的资源的同时,还能更多的推荐最近热门的资源。
在一个示例性的实施例中,如图9所示,所述资源的推荐信息推送装置900包括:
关注量获取模块901,用于获取统计周期内资源每天的关注量;
关注增量获取模块902,用于根据资源每天的关注量和该资源该天的前一天的关注量获取资源每天的关注增量;
推送模块903,用于根据统计周期内资源每天的关注增量大小,推送关注增量较大的资源的推荐信息。
在一个示例性的实施例中,推送模块903包括:
第一推送单元9031,用于对统计周期内资源每天的关注增量求和,获取总关注增量,推送总关注增量较大的资源的推荐信息。
或者,
第二推送单元9032,对统计周期内资源每天的关注增量求和,根据统计周期内该资源的上架天数获取该资源在上架期间每天的平均关注增量,推送平均关注增量较大的资源的推荐信息。
在一个示例性的实施例中,第一推送单元9031和/或第二推送单元9032还包括:
加权求和单元9033,用于对统计周期内资源每天的关注增量加权求和。
在一个示例性的实施例中,加权求和单元9033还包括:
第一衰减单元9034,用于将统计周期内资源每天的关注增量乘以预设的衰减函数后求和,离统计周期的起始时间越近,所述衰减函数值越小。
在一个示例性的实施例中,加权求和单元9033还包括:
加权增量获取单元9035,用于对统计周期内第一天至该天的关注增量进行加权计算,得到该天的加权增量,计算公式为:
vd=vd-1+θd
其中,sd为该天的加权增量,vd为该天的中间计算量,vd-1为该天的前一天的中间计算量,θd该天的关注增量;
第二衰减单元9035,用于将统计周期内资源每天的加权增量乘以预设的衰减函数后求和,离统计周期的起始时间越近,所述衰减函数值越小。
在一个示例性的实施例中,加权求和单元9033还包括:
指数加权平均值获取单元9036,用于计算所述关注增量的指数加权平均值,其中,所述指数加权平均值的计算公式为:
wd=β·wd-1+(1-β)θd
其中,wd为截止统计周期最后一天的关注增量的指数加权平均值,wd-1为截止统计周期前一天的关注增量的指数加权平均值,β为可调节权重参数,θd该天的关注增量。
在一个示例性的实施例中,关注量获取模块901还包括:
第一获取单元9011,用于获取每天不同资源的关注量的平均值和标准差。
第一标准化单元9012,用于根据每天不同资源的关注量的平均值和标准差对不同资源每天的关注量进行数据标准化处理,计算公式为:
在一个示例性的实施例中,关注增量获取模块902还包括:
第二获取单元9021,获取每天不同资源的关注增量的平均值和标准差。
第二标准化单元9022,根据每天不同资源的关注增量的平均值和标准差对不同资源每天的关注增量进行数据标准化处理,计算公式为:
在一个示例性的实施例中,所述关注量包括以下任一:
点击量、评论数、点赞数。
与前述资源的推荐信息推送方法相对应,本发明还提供一种资源的推荐信息推送装置应用的电子设备,所述电子设备可以是任何智能终端,例如,可以具体为计算机、服务器、手机、平板电脑、交互式智能平板、PDA(Personal Digital Assistant,个人数字助理)、电子书阅读器、多媒体播放器等。所述电子设备根据统计周期内资源每天的关注量与该天的前一天的关注量之间的差值即关注增量大小,向用户推送关注增量较大的资源的推荐信息,能够更准确的向用户推荐热门的资源,同时,在推荐持续热门的资源的同时,还能更多的推荐最近热门的资源。
所述电子设备包括:
处理器;
存储器,用于存储可由所述处理器执行的计算机程序;
其中,所述处理器执行所述程序时实现上述任一实施例所记载的资源的推荐信息推送方法。
如图10所示,图10是本发明根据一示例性实施例示出的一种电子设备的结构框图。
参照图10,电子设备1200包括处理组件1222,其进一步包括一个或多个处理器,以及由存储器1232所代表的存储器资源,用于存储可由处理部件1222的执行的指令,例如应用程序。存储器1232中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件1222被配置为执行指令,以执行上述任一实施例所记载的资源的推荐信息推送方法。
电子设备1200还可以包括一个电源组件1226被配置为执行装置1200的电源管理,一个有线或无线网络接口1250被配置为将装置1200连接到网络,和一个输入输出(I/O)接口1258。装置1200可以操作基于存储在存储器1232的操作***,例如Android、IOS、WindowsServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
上述设备中各个组件的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于设备实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的设备实施例仅仅是示意性的,其中所述作为分离部件说明的组件可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本公开方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。上述提供的电子设备可用于执行上述任意实施例提供的资源的推荐信息推送方法,具备相应的功能和有益效果。上述设备中各个组件的功能和作用的实现过程具体详见上述资源的推荐信息推送方法中对应步骤的实现过程,在此不再赘述。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。
Claims (11)
1.一种资源的推荐信息推送方法,其特征在于,所述方法包括步骤:
获取统计周期内资源每天的关注量;
根据资源每天的关注量和该资源该天的前一天的关注量获取资源每天的关注增量;
根据统计周期内资源每天的关注增量大小,推送关注增量较大的资源的推荐信息。
2.根据权利要求1所述的资源的推荐信息推送方法,其特征在于,根据统计周期内资源每天的关注增量大小,推送关注增量较大的资源的推荐信息,包括:
对统计周期内资源每天的关注增量求和,获取总关注增量,推送总关注增量较大的资源的推荐信息;
或者,
对统计周期内资源每天的关注增量求和,根据统计周期内该资源的上架天数获取该资源在上架期间每天的平均关注增量,推送平均关注增量较大的资源的推荐信息。
3.根据权利要求2所述的资源的推荐信息推送方法,其特征在于,对统计周期内资源每天的关注增量求和,包括:
对统计周期内资源每天的关注增量加权求和。
4.根据权利要求3所述的资源的推荐信息推送方法,其特征在于,对统计周期内资源每天的关注增量加权求和,包括:
将统计周期内资源每天的关注增量乘以预设的衰减函数后求和,离统计周期的起始时间越近,所述衰减函数值越小。
6.根据权利要求3所述的资源的推荐信息推送方法,其特征在于,对统计周期内资源每天的关注增量加权求和,包括:
计算所述关注增量的指数加权平均值,其中,所述指数加权平均值的计算公式为:
wd=β·wd-1+(1-β)θd
其中,wd为截止统计周期最后一天的关注增量的指数加权平均值,wd-1为截止统计周期前一天的关注增量的指数加权平均值,β为可调节权重参数,θd该天的关注增量。
9.根据权利要求1所述的资源的推荐信息推送方法,其特征在于,所述关注量包括以下任一:
点击量、评论数、点赞数。
10.一种资源的推荐信息推送装置,其特征在于,所述装置包括:
关注量获取模块,用于获取统计周期内资源每天的关注量;
关注增量获取模块,用于根据资源每天的关注量和该资源该天的前一天的关注量获取资源每天的关注增量;
推送模块,用于根据统计周期内资源每天的关注增量大小,推送关注增量较大的资源的推荐信息。
11.一种电子设备,其特征在于,包括:
存储器以及处理器;
所述存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-9中任一所述的资源的推荐信息推送方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910766710.8A CN110674412A (zh) | 2019-08-20 | 2019-08-20 | 资源的推荐信息推送方法及装置、电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910766710.8A CN110674412A (zh) | 2019-08-20 | 2019-08-20 | 资源的推荐信息推送方法及装置、电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110674412A true CN110674412A (zh) | 2020-01-10 |
Family
ID=69075413
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910766710.8A Pending CN110674412A (zh) | 2019-08-20 | 2019-08-20 | 资源的推荐信息推送方法及装置、电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110674412A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113824980A (zh) * | 2021-09-09 | 2021-12-21 | 广州方硅信息技术有限公司 | 视频推荐方法、***、装置及计算机设备 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103500213A (zh) * | 2013-09-30 | 2014-01-08 | 北京搜狗科技发展有限公司 | 基于预读取的页面热点资源更新方法和装置 |
CN107026892A (zh) * | 2016-11-03 | 2017-08-08 | 阿里巴巴集团控股有限公司 | 消息推荐方法和装置 |
CN107666516A (zh) * | 2017-09-20 | 2018-02-06 | 重庆邮电大学 | 一种基于消息热度保证kafka集群数据一致性的方法 |
CN108363788A (zh) * | 2018-02-12 | 2018-08-03 | 广州市贝聊信息科技有限公司 | 帖子智能排位方法、装置以及计算机可读存储介质 |
CN108710635A (zh) * | 2018-04-08 | 2018-10-26 | 达而观信息科技(上海)有限公司 | 一种内容推荐方法及装置 |
WO2019000782A1 (zh) * | 2017-06-30 | 2019-01-03 | 深圳创维数字技术有限公司 | 一种搜索词推荐方法、机顶盒和存储介质 |
CN109344316A (zh) * | 2018-08-14 | 2019-02-15 | 优视科技(中国)有限公司 | 新闻热度计算方法及装置 |
-
2019
- 2019-08-20 CN CN201910766710.8A patent/CN110674412A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103500213A (zh) * | 2013-09-30 | 2014-01-08 | 北京搜狗科技发展有限公司 | 基于预读取的页面热点资源更新方法和装置 |
CN107026892A (zh) * | 2016-11-03 | 2017-08-08 | 阿里巴巴集团控股有限公司 | 消息推荐方法和装置 |
WO2019000782A1 (zh) * | 2017-06-30 | 2019-01-03 | 深圳创维数字技术有限公司 | 一种搜索词推荐方法、机顶盒和存储介质 |
CN107666516A (zh) * | 2017-09-20 | 2018-02-06 | 重庆邮电大学 | 一种基于消息热度保证kafka集群数据一致性的方法 |
CN108363788A (zh) * | 2018-02-12 | 2018-08-03 | 广州市贝聊信息科技有限公司 | 帖子智能排位方法、装置以及计算机可读存储介质 |
CN108710635A (zh) * | 2018-04-08 | 2018-10-26 | 达而观信息科技(上海)有限公司 | 一种内容推荐方法及装置 |
CN109344316A (zh) * | 2018-08-14 | 2019-02-15 | 优视科技(中国)有限公司 | 新闻热度计算方法及装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113824980A (zh) * | 2021-09-09 | 2021-12-21 | 广州方硅信息技术有限公司 | 视频推荐方法、***、装置及计算机设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109274987B (zh) | 一种视频集合排序方法、服务器及可读存储介质 | |
CN109275031B (zh) | 一种视频的热度评估方法、装置及电子设备 | |
CN110796477A (zh) | 广告展示方法、装置、电子设备及可读存储介质 | |
CN109359217B (zh) | 一种用户兴趣度计算方法、服务器及可读存储介质 | |
US10559004B2 (en) | Systems and methods for establishing and utilizing a hierarchical Bayesian framework for ad click through rate prediction | |
CN108965951B (zh) | 广告的播放方法及装置 | |
CN111767429A (zh) | 一种视频推荐方法、装置及电子设备 | |
US11277352B2 (en) | Method, apparatus, and server for dynamically adjusting resource competition thresholds | |
CN110363580B (zh) | 信息推荐方法、装置、计算机设备及存储介质 | |
CN113422986B (zh) | 用于直播间推荐的方法、装置、设备、介质和程序产品 | |
CN110825977A (zh) | 一种数据推荐方法及相关设备 | |
CN108667877B (zh) | 确定推荐信息的方法及装置、计算机设备及存储介质 | |
CN112150182B (zh) | 多媒体文件推送方法和装置、存储介质及电子装置 | |
JP7085486B2 (ja) | ユーザ挙動データの処理方法及び装置 | |
CN112669091B (zh) | 数据处理方法、装置及存储介质 | |
CN110674412A (zh) | 资源的推荐信息推送方法及装置、电子设备 | |
CN109684546A (zh) | 推荐方法、装置、存储介质及终端 | |
CN108769107A (zh) | 一种视频调度方法、装置及电子设备 | |
CN109472455B (zh) | 活动评估方法、装置、电子设备及存储介质 | |
CN110020129B (zh) | 点击率校正方法、预估方法、装置、计算设备及存储介质 | |
CN113408817B (zh) | 流量分发方法、装置、设备及存储介质 | |
CN110717653A (zh) | 风险识别方法及装置和电子设备 | |
CN113038242B (zh) | 直播卡片展示位置的确定方法、装置、设备及存储介质 | |
CN114201696A (zh) | 一种消息推送方法及装置、存储介质、计算机设备 | |
US20170169456A1 (en) | Methods and systems of cost determination of computational resources |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200110 |