CN105282565A - 一种视频推荐方法和装置 - Google Patents

一种视频推荐方法和装置 Download PDF

Info

Publication number
CN105282565A
CN105282565A CN201510634329.8A CN201510634329A CN105282565A CN 105282565 A CN105282565 A CN 105282565A CN 201510634329 A CN201510634329 A CN 201510634329A CN 105282565 A CN105282565 A CN 105282565A
Authority
CN
China
Prior art keywords
video
score value
video features
item
list
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510634329.8A
Other languages
English (en)
Inventor
宋华
周燕红
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN201510634329.8A priority Critical patent/CN105282565A/zh
Publication of CN105282565A publication Critical patent/CN105282565A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/251Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4668Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/482End-user interface for program selection
    • H04N21/4826End-user interface for program selection using recommendation lists, e.g. of programs or channels sorted out according to their score

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Software Systems (AREA)
  • Human Computer Interaction (AREA)
  • Computing Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本发明实施例提供了一种视频推荐方法和装置,其中,所述方法包括:提取视频数据中的一个或多个视频特征项,将所述视频特征项写入视频特征库;获取某一推荐模式的配置文件,按照所述配置文件分别在所述视频特征库中确定对应的一个或多个视频特征项;分别计算与所确定的视频特征项一一对应的特征分值,获得所述视频数据的总分值;按照所述总分值对各视频数据进行排序,生成视频推荐列表;将所述推荐列表推荐给用户。本发明实施例推荐给用户的视频可以满足用户的偏好,用户想要观看自己偏好的视频时,可以快速地在推荐的视频中获取想要观看的视频,而无需通过大量的查找操作,进而避免了服务器资源和网络资源的大量耗费。

Description

一种视频推荐方法和装置
技术领域
本发明涉及多媒体技术领域,特别是涉及一种视频推荐方法和一种视频推荐装置。
背景技术
近年来,随着网络技术的日益普及,视频网站大规模出现,人们越来越多的选择在网上观看视频。
通常,大多数用户在视频网站观看视频时,都偏好于选择新上映和热度高的视频。在传统的视频网站中,当用户需要寻找新上映和热度高的视频时,往往需要输入关键词进行查找,当服务器接收到用户的查找请求时,需要在视频库中查找与关键词相对应的视频,并呈现给用户,用户需要在所呈现的众多视频中查找所需的视频,当所呈现的视频中并没有用户所需的视频时,用户还需要更换其他的关键词进行再次查找,直到查找到所需的视频。在查找视频的过程中,由于用户进行了大量的查找操作,服务器需要不断地响应用户的查找请求,这一过程耗费了大量的服务器资源和网络资源。
为了使用户能够快速地查找到需要观看的视频,避免服务器资源和网络资源的大量耗费,现有的视频网站主要通过统计视频的观看数量,利用大数据的方式,结合模型预测,在视频库中抽取部分视频推荐给用户。
一方面,观看数量需要历史数据的累积,只有当视频上映一段时间后才能获得,并且,模型预测在对海量视频数据进行计算时,会存在冷启动的问题,导致无法在第一时间将新上映的视频推荐给用户,另一方面,由于推荐给用户的视频只从观看数量的单一维度进行分析,推荐的视频往往无法满足用户的偏好,当用户需要在视频网站观看自己所偏好的视频时,仍然需要通过不断更换关键词,进行大量的查找操作,由服务器进行大量的视频查找和呈现操作,才能够获得所需的视频,仍然存在服务器资源和网络资源大量耗费的问题。
因此,目前迫切需要本领域技术人员解决的一个技术问题就是:如何将用户偏好的视频推荐给用户,使用户能够快速获得所需的视频,以避免服务器资源和网络资源的大量耗费。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种视频推荐方法和相应的一种视频推荐装置。
为了解决上述问题,本发明实施例公开了一种视频推荐方法,所述方法包括:
提取视频数据中的一个或多个视频特征项,将所述视频特征项写入视频特征库;
获取某一推荐模式的配置文件,按照所述配置文件分别在所述视频特征库中确定对应的一个或多个视频特征项;
分别计算与所确定的视频特征项一一对应的特征分值,获得所述视频数据的总分值;
按照所述总分值对各视频数据进行排序,生成视频推荐列表;
将所述推荐列表推荐给用户。
可选地,所述方法还包括:
更新所述视频特征库,具体包括,针对所述一个或多个视频特征项,按照不同的更新频率进行更新,其中,所述更新频率包括:按天级更新,按分钟级更新,或,实时更新。
可选地,所述分别计算与所确定的视频特征项一一对应的特征分值,获得所述视频数据的总分值的步骤包括:
按照当前推荐模式计算所提取的视频特征项的特征分值;
对所述特征分值分别进行加权,获得各个视频特征项加权后的特征分值;
累加所述加权后的特征分值,获得所述视频数据的总分值。
可选地,所述视频特征项包括:频道信息;视频新鲜度;全球上映时间;平均观看时长;观看次数;观看评价参数;上榜参数;点击率;和/或,重要度标记信息。
可选地,所述按照所述总分值对各视频数据进行排序,生成视频推荐列表的步骤包括:
基于所述频道信息,分别对相应频道的视频数据的总分值进行排序;
生成所述视频推荐列表。
可选地,所述视频特征库为基于列的分布式数据库HBASE。
为了解决上述问题,本发明实施例公开了一种视频装置,所述装置包括:
视频特征项写入模块,用于提取视频数据中的一个或多个视频特征项,将所述视频特征项写入视频特征库;
视频特征项确定模块,用于获取某一推荐模式的配置文件,按照所述配置文件分别在所述视频特征库中确定对应的一个或多个视频特征项;
视频特征项计算模块,用于分别计算与所确定的视频特征项一一对应的特征分值,获得所述视频数据的总分值;
视频推荐列表生成模块,用于按照所述总分值对各视频数据进行排序,生成视频推荐列表;
视频推荐模块,用于将所述推荐列表推荐给用户。
可选地,所述装置还包括:
视频特征库更新模块,用于更新所述视频特征库,具体包括,用于针对所述一个或多个视频特征项,按照不同的更新频率进行更新,其中,所述更新频率包括:按天级更新,按分钟级更新,或,实时更新。
可选地,所述视频特征项计算模块包括:
视频特征项计算子模块,用于按照当前推荐模式计算所提取的视频特征项的特征分值;
视频特征项加权子模块,用于对所述特征分值分别进行加权,获得各个视频特征项加权后的特征分值;
视频特征分值累加子模块,用于累加所述加权后的特征分值,获得所述视频数据的总分值。
可选地于,所述视频特征项包括:频道信息;视频新鲜度;全球上映时间;平均观看时长;观看次数;观看评价参数;上榜参数;点击率;和/或,重要度标记信息。
可选地,视频推荐列表生成模块包括:
视频数据排序子模块,用于基于所述频道信息,分别对相应频道的视频数据的总分值进行排序;
视频推荐列表生成子模块,用于生成所述视频推荐列表。
可选地,所述视频特征库为基于列的分布式数据库HBASE。
与背景技术相比,本发明实施例包括以下优点:
本发明实施例通过提取一个或多个视频特征项,写入视频特征库,在视频特征库中根据当前推荐模式确定需要计算的特征项,分别计算该特征项对应的特征分值,得到视频数据的总分值,从而生成视频推荐列表,推荐给用户。由于本发明实施例的推荐列表可以根据多个视频特征项的分值所生成,而多个视频特征项(频道信息;视频新鲜度;全球上映时间;平均观看时长;观看次数;观看评价参数;上榜参数;点击率;和/或,重要度标记信息)可以反映用户对该视频的偏好,因此,本发明实施例推荐给用户的视频可以满足用户的偏好,用户想要观看自己偏好的视频时,可以快速地在推荐的视频中获取想要观看的视频,而无需通过大量的查找操作,进而避免了服务器资源和网络资源的大量耗费。
再者,在本发明实施例中,采用基于列的分布式数据库HBASE作为视频特征库。由于HBASE基于列的存储特性,库中各存储项之间相互独立,因此在生成视频特征库时无需事先安排好视频特征库的表结构,可以根据用户偏好的不同,随时将所需的特征项添加进特征库,生成满足用户偏好的推荐列表;同时,HBASE中各个特征项的相互独立,使得各个特征项的更新互不影响,能够平衡不同频率产生的特征分值,实现视频特征库的实时更新,进而保证推荐列表能够实时更新,及时地将满足用户偏好的视频推荐给用户。
附图说明
图1是本发明的一种视频推荐方法实施例的步骤流程图;
图2是本发明的一种优选的视频特征库中所包括的视频特征项示意图;
图3是本发明的一种视频推荐装置实施例的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
参照图1,示出了本发明的一种视频推荐方法实施例的步骤流程图,具体可以包括如下步骤:
步骤101,提取视频数据中的一个或多个视频特征项,将所述视频特征项写入视频特征库;
视频数据一般具有多个视频特征项,如:
频道信息,表示该视频的频道分类,如电影频道、电视剧频道、纪录片频道等。一个视频进入视频库后,其频道信息一般都是固定的。
视频新鲜度,表示视频上线时间的长短,视频上线时间越短,则新鲜度越高。
全球上映时间,表示该视频在全球范围内的最早上映时间。
平均观看时长,表示用户观看该视频的时长,平均观看时长越长,说明该视频受用户认可度也就越高。
观看次数,表示视频被观看的次数,观看次数越多,说明该视频越流行。
观看评价参数,可以是用户观看视频后的评价,也可以是视频网站的工作人员观看视频后作出的评价。
上榜参数,表示该视频在各类榜单中的数据,如百度风云榜的搜索量、微博话题讨论量等。
点击率,表示视频被点击的次数与被显示次数之比,是视频热度非常重要的特征。
重要度标记信息,表示视频网站工作人员对该视频是否重要的一种评价。
以上列举了几种视频特征项的例子,但实际上,从不同的分析角度,一个视频往往有多个不同的视频特征项,本领域技术人员可以根据实际需要分析确定可以提取的视频特征项。
在本发明的一种实施例中,提取视频数据中的一个或多个视频特征项,将提取的一个或多个视频特征项写入视频特征库。
视频特征库可以是一种按列存储一个或多个视频特征项的数据库,在具体实现中,视频特征库可以是基于列的分布式数据存储库HBASE。由于HBASE是一个高可靠性、高性能、面向列、可伸缩的分布式存储***,因此不用事先安排好表结构,能够方便各特征项的随时更新和添加。本发明的一种实施例中,通过HBASE可以平衡不同更新频率的特征项,从而实现各种特征项按照各自的更新频率进行更新。
参照图2,示出了本发明的一种优选的视频特征库中所包括的视频特征项。在本发明的一种优选实施例中,可以提取视频的频道信息、视频新鲜度、全球上映时间、平均观看时长、观看次数、观看评价参数、上榜参数、点击率、重要度标记信息等视频特征项,写入视频特征库。
在本发明的一种优选实施例中,在步骤101,提取视频数据中的一个或多个视频特征项,将所述视频特征项写入视频特征库之后,还可以包括:
步骤101A,更新所述视频特征库;具体包括,针对所述一个或多个视频特征项,按照不同的更新频率进行更新;
在具体实现中,为了使视频数据及时地输出到视频推荐列表中,可以对视频特征库进行及时更新,针对一个或多个视频特征项,可以按照不同的更新频率进行更新。
在本发明的一种实施例中,更新频率可以包括:按天级更新,按分钟级更新,或,实时更新。
根据视频特征项对时间的敏感度,可以将视频特征分为静态特征和动态特征。静态特征指视频的固有属性特征,变化较慢,不需要及时更新;而动态特征指对时间敏感的特征,由于其动态特性需要及时更新。
比如,视频的频道信息属于静态特征,一个视频进入视频库后,其频道信息一般都是固定的。视频的时长几乎不会随时间的改变而改变,因此也属于静态特征。对于这一类变化较慢的特征项,可以选择按天级进行更新,如可以设为每一天更新一次,或每两天更新一次等;而针对一些对时间敏感的特征,可以选择按分钟级进行更新,如可以设为每10分钟更新一次,或每20分钟更新一次等,或,实时更新。
在本发明的一种优选实施例中,更新视频特征库可以包括更新视频的频道信息、视频新鲜度、全球上映时间、平均观看时长、观看次数、观看评价参数、上榜参数、点击率、和,重要度标记信息。
在具体实现中,各个视频特征项的更新频率可以为:
频道信息:由于一个视频进入视频库后,其频道信息一般都是固定的,因此,视频库中原始视频的频道信息特征项通过按天级更新即可,但对于进入视频库的新视频,则需要通过实时扫描视频库的方式,将发现的新视频的频道信息实时更新到视频特征库中。
视频新鲜度:对于视频库中的原始视频,可以按天级更新视频新鲜度特征项,而对于新发现的视频库中的新视频,则可以通过实时更新的方式更新到视频特征库中。
全球上映时间:对于视频库中的原始视频,可以按天级更新该特征项,而对于新进入视频库的视频,则可以按分钟级更新该特征项。
平均观看时长:对于新视频来说,一般是没有被用户观看过的,所以平均观看时长并没有统计数据,因此,对于该特征项,可以按天级更新。
观看次数:与平均观看时长类似,对于新视频来说,一般是没有被用户观看过的,所以观看次数为0,因此,对于该特征项,也可以按天级更新。
观看评价参数:对于新视频,一般是还未被用户观看过的,但可能被视频网站的工作人员观看,从而给出评价。因此,对于新视频,可以按分钟级对该特征项进行更新;而对于视频库中的原始视频,可以选择按天级进行更新。
上榜参数:对于视频库中的原始视频,可以按天级更新该特征项,而对于新进入视频库的视频,则可以按分钟级更新该特征项。
点击率:点击率是一个视频非常重要的特征,而且点击率的变化对时间非常敏感,点击率更新得越实时,结果就越准确,然而用户发生一个点击行为,到该行为数据被收集整理存在一定延迟,因此,为了尽量避免延迟,可以选择按分钟级更新该特征项。
重要度标记信息:对于视频库中的原始视频,可以按天级更新该特征项,而对于新进入视频库的视频,则可以按分钟级更新该特征项。
以上列举了在本发明的一种优选实施例中部分特征项的更新频率,本领域技术人员应该明白,根据实际需要的不同,可以对各个特征项的更新频率进行合理调整,本发明对此不作限定。
步骤102,获取某一推荐模式的配置文件,按照所述配置文件分别在所述视频特征库中确定对应的一个或多个视频特征项;
在具体实现中,配置文件可以表示当前推荐模式下需要确定的视频特征项有哪些。由于视频特征项表示了视频的不同特性,因此针对不同的推荐模式,可以有不同的配置文件。
比如,若当前推荐模式为需要向用户推荐最新上线的视频,则配置文件可以选择频道信息、视频新鲜度、全球上映时间等视频特征项。
若当前推荐模式为需要向用户推荐最热门的视频,则配置文件可以选择频道信息、观看次数、观看评价参数、上榜参数、点击率等视频特征项。
本领域技术人员可以根据实际推荐模式在视频特征库中确定对应的一个或多个视频特征项,本发明对此不作限定。
步骤103,分别计算与所确定的视频特征项一一对应的特征分值,获得所述视频数据的总分值;
根据推荐模式确定对应的一个或多个视频特征项,分别计算与所确定的视频特征项一一对应的特征分值。
若当前推荐模式为需要向用户推荐最新上线的视频,则根据该推荐模式,配置文件可以选择频道信息、视频新鲜度、全球上映时间等视频特征项,则分别计算各视频数据的频道信息、视频新鲜度和全球上映时间对应的特征分值,将各视频数据的频道信息、视频新鲜度和全球上映时间的特征分值加总,获得各视频数据的总分值。
若当前推荐模式为需要向用户推荐最热门的视频,则根据该推荐模式,配置文件可以选择频道信息、观看次数、观看评价参数、上榜参数、点击率等视频特征项,则分别计算各视频数据的频道信息、观看次数、观看评价参数、上榜参数、点击率对应的特征分值,将各视频数据的频道信息、观看次数、观看评价参数、上榜参数、点击率的特征分值加总,获得各视频数据的总分值。
在本发明的一种优选实施例中,各个视频特征项对应的特征分值可以按如下方式计算得到:
频道信息:
由于每个视频的频道信息基本是固定的,因此,可以直接将该特征项的特征分值设定为一个常数。
视频新鲜度:
每个视频的受欢迎程度是有生命周期的,一个视频刚上线时往往会受到人们的追捧,而一段时间后,当大量用户已经观看过该视频,该视频的内容就不那么流行了。所以在视频刚上线时期给予视频充分的展示往往带来更高的收益。在本发明的一种实施例中,可以通过分频道分段拟合的方式得到视频新鲜度的计算参数。首先通过大量历史数据绘制出各个频道的视频生命周期曲线,然后通过python自带的curve_fit函数拟合视频生命周期曲线得到各个频道的计算参数scale、offset、step、shif,按照如下公式计算出视频新鲜度的特征分值:
S f r e s h n e s s = s c a l e e x + o f f s e t s t e p + s h i f t ... ... ( 1 )
其中,
x = c u r _ t i m e - u p d a t e _ t i m e d e c a y ;
cur_time为当前时间,update_time为该视频上线时间,decay为更新频率。
全球上映时间:
一个视频的全球上映时间代表了视频的真实年龄,对于该特征项,有些用户可能喜欢年代较老的视频,而有些用户则可能更喜欢近期上映的作品,因此需要单独计算全球上映时间的特征分值。对于不同的国家的视频,对参数scale、offset、step、shif预设不同的参数值,然后按照公式(1)计算出视频全球上映时间的特征分值。
平均观看时长:
由于时长越长的视频的平均观看时长占总时长的比重越低,所以需要提高长视频的平均观看时长在总时长中的比重,可以对视频时长取sigmoid函数;而观看次数越多的视频平均观看时长会偏低,但该视频却可能更受用户关注,也需要对观看次数取sigmoid函数。
因此,平均观看时长的特征分值可以通过如下公式计算得到:
S a v g = Σ w a t c h _ t i m e Σ v v / t i m e _ l e n * s i g m o i d ( t i m e _ l e n ) * s i g m o i d ( v v ) ... ... ( 2 )
其中,Σwatch_time为总的观看时长,Σvv为总的观看次数,time_len为视频的时长。
观看次数:
观看次数的特征分值可以按如下公式通过对观看次数取对数得到:
SVV=log10Σvv*λ……(3)
其中,λ为调整结果范围的预设参数值,0<λ<1.
观看评价参数:
一个视频在进入视频库后,视频网站的工作人员一般会对该视频做出评价,对于该评价,可以通过如下公式计算观看评价参数的特征分值来体现。
Ses=Σwi*xidiff_time/step……(4)
其中,wi表示被评价为等级为i的值,α表示时间衰减比重,当该视频被评价为等级为i时,xi=1,当该视频被评价为等级不为i时,xi=0.
上榜参数:
视频库中新进入的视频很多热度的特征项由于没有历史数据导致不能计算,因此可以通过站外数据来作为补充。可以通过爬虫爬取站外数据,如百度风云榜的搜索量,和/或微博话题讨论量等实时热点数据,按照如下公式计算视频的上榜参数特征分值。
S h o t = s - m i n max - m i n ... ... ( 5 )
其中,s指爬虫爬取的站外数据,min指站外数据的最小值,max指站外数据的最大值。
在具体实现中,爬虫可以按照预设时间间隔爬取多次站外榜单数据,将视频库中的视频与榜单数据做比较,得到视频的站外数据。
点击率:
点击率的特征分值可以按如下公式计算得到:
Sctr=sigmoid(sigmoid(view)*boost*click/view)……(6)
其中,view为总的推荐展示次数,click为总的点击次数,boost为预设的平衡结果参数值。
重要度标记信息:
根据视频的重要程度,可以将视频标记为重要视频和非重要视频。对于重要视频,重要度标记信息的特征分值可以设定为常数1,而对于非重要视频,重要度标记信息的特征分值则可以设定为常数0.
在本发明的一种优选实施例中,步骤103,分别计算与所确定的视频特征项一一对应的特征分值,获得所述视频数据的总分值具体可以包括如下子步骤:
步骤1031,按照当前推荐模式计算所提取的视频特征项的特征分值;
步骤1032,对所述特征分值分别进行加权,获得各个视频特征项加权后的特征分值;
步骤1033,累加所述加权后的特征分值,获得所述视频数据的总分值。
在具体实现中,可以以1为基准,分别对每个视频特征项赋予不同的权重值,权重值越大,表示该特征项对于当前推荐模式越重要,如:
频道信息的权重为1、视频新鲜度的权重为3、全球上映时间的权重为1.5、平均观看时长的权重为2.5、观看次数的权重为4、观看评价参数的权重为2、上榜参数的权重为2.5、点击率的权重为4、重要度标记信息的权重为3.以上对每个视频特征项赋予不同的权重仅为一种示例,本领域技术也可以按照其他方式对每个视频特征项赋予权重,本发明对此不作限定。
按照当前推荐模式计算所提取的视频特征项的特征分值后,对所得到的特征分值分别乘以各自特征项的权重,获得各个视频特征项加权后的特征分值。将加权后的特征分值进行累加,获得该视频数据的总分值。
步骤104,按照所述总分值对各视频数据进行排序,生成视频推荐列表;
在获得各视频数据的总分值后,按照该总分值对各视频数据进行排序。在本发明的一种实施例中,可以选择总分值排序靠前的k个视频,生成视频推荐列表。本领域技术人员可以根据实际情况确定生成的视频推荐列表中具体的视频数量,本发明对此不作限定。
在本发明的一种优选实施例中,步骤104,按照所述总分值对各视频数据进行排序,生成视频推荐列表还可以包括如下子步骤:
步骤1041,基于所述频道信息,分别对相应频道的视频数据的总分值进行排序;
步骤1042,生成所述视频推荐列表。
一个视频进入视频库后,都有一个对应的频道信息,表示该视频的频道分类。在本发明的一种优选实施例中,可以基于频道信息,分别对相应频道的视频数据的总分值进行排序。
比如,如果用户希望观看电影,那么在获得各个视频数据的总分值后,可以单独选择所有频道信息为“电影频道”的视频数据,对所有电影的总分值进行排序,使得生成的推荐列表中只有电影,满足用户特定的观看需求。
步骤105,将所述推荐列表推荐给用户。
应用本发明的一种实施例,根据不同的推荐模式,在视频特征库中确定视频数据的一个或多个视频特征项,通过计算与确定的视频特征项一一对应的特征分值,获得各视频数据的总分值,生成视频推荐列表。由于本发明实施例的推荐列表可以根据多个视频特征项的分值所生成,而多个视频特征项(频道信息;视频新鲜度;全球上映时间;平均观看时长;观看次数;观看评价参数;上榜参数;点击率;和/或,重要度标记信息)可以反映用户对该视频的偏好,因此,本发明实施例推荐给用户的视频可以满足用户的偏好,用户想要观看自己偏好的视频时,可以快速地在推荐的视频中获取想要观看的视频,而无需通过大量的查找操作,进而避免了服务器资源和网络资源的大量耗费。
再者,在本发明实施例中,采用基于列的分布式数据库HBASE作为视频特征库。由于HBASE基于列的存储特性,库中各存储项之间相互独立,因此在生成视频特征库时无需事先安排好视频特征库的表结构,可以根据用户偏好的不同,随时将所需的特征项添加进特征库,生成满足用户偏好的推荐列表;同时,HBASE中各个特征项的更新互不影响,能够平衡不同频率产生的特征分值,实现视频特征库的实时更新,进而保证推荐列表能够实时更新,及时地将满足用户偏好的视频推荐给用户。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
参照图3,示出了本发明的一种视频推荐装置实施例的结构框图,具体可以包括如下模块:
视频特征项写入模块301,用于提取视频数据中的一个或多个视频特征项,将所述视频特征项写入视频特征库;
视频特征项确定模块302,用于获取某一推荐模式的配置文件,按照所述配置文件分别在所述视频特征库中确定对应的一个或多个视频特征项;
视频特征项计算模块303,用于分别计算与所确定的视频特征项一一对应的特征分值,获得所述视频数据的总分值;
视频推荐列表生成模块304,用于按照所述总分值对各视频数据进行排序,生成视频推荐列表;
视频推荐模块305,用于将所述推荐列表推荐给用户。
在本发明的一种优选实施例中,所述视频推荐装置还可以包括以下模块:
视频特征库更新模块306,用于更新所述视频特征库,具体包括,用于针对所述一个或多个视频特征项,按照不同的更新频率进行更新,其中,所述更新频率包括:按天级更新;按分钟级更新,或,实时更新。
在本发明的一种优选实施例中,所述视频特征项计算模块还可以包括以下子模块:
视频特征项计算子模块3031,用于按照当前推荐模式计算所提取的视频特征项的特征分值;
视频特征项加权子模块3032,用于对所述特征分值分别进行加权,获得各个视频特征项加权后的特征分值;
视频特征分值累加子模块3033,用于累加所述加权后的特征分值,获得所述视频数据的总分值。
在本发明的一种优选实施例中,所述视频特征项可以包括:频道信息;视频新鲜度;全球上映时间;平均观看时长;观看次数;观看评价参数;上榜参数;点击率;和/或,重要度标记信息。
在本发明的一种优选实施例中,所述视频列表生成模块还可以包括以下子模块:
视频数据排序子模块3041,用于基于所述频道信息,分别对相应频道的视频数据的总分值进行排序;
视频推荐列表生成子模块3042,用于生成所述视频推荐列表。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种视频推荐方法和一种视频推荐装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (12)

1.一种视频推荐方法,其特征在于,所述方法包括:
提取视频数据中的一个或多个视频特征项,将所述视频特征项写入视频特征库;
获取某一推荐模式的配置文件,按照所述配置文件分别在所述视频特征库中确定对应的一个或多个视频特征项;
分别计算与所确定的视频特征项一一对应的特征分值,获得所述视频数据的总分值;
按照所述总分值对各视频数据进行排序,生成视频推荐列表;
将所述推荐列表推荐给用户。
2.根据权利要求1所述的方法,其特征在于,还包括:
更新所述视频特征库,具体包括,针对所述一个或多个视频特征项,按照不同的更新频率进行更新,其中,所述更新频率包括:按天级更新,按分钟级更新,或,实时更新。
3.根据权利要求2所述的方法,其特征在于,所述分别计算与所确定的视频特征项一一对应的特征分值,获得所述视频数据的总分值的步骤包括:
按照当前推荐模式计算所提取的视频特征项的特征分值;
对所述特征分值分别进行加权,获得各个视频特征项加权后的特征分值;
累加所述加权后的特征分值,获得所述视频数据的总分值。
4.根据权利要求1或3所述的方法,其特征在于,所述视频特征项包括:频道信息;视频新鲜度;全球上映时间;平均观看时长;观看次数;观看评价参数;上榜参数;点击率;和/或,重要度标记信息。
5.根据权利要求4所述的方法,其特征在于,所述按照所述总分值对各视频数据进行排序,生成视频推荐列表的步骤包括:
基于所述频道信息,分别对相应频道的视频数据的总分值进行排序;
生成所述视频推荐列表。
6.根据权利要求1所述的方法,其特征在于,所述视频特征库为基于列的分布式数据库HBASE。
7.一种视频推荐装置,其特征在于,所述装置包括:
视频特征项写入模块,用于提取视频数据中的一个或多个视频特征项,将所述视频特征项写入视频特征库;
视频特征项确定模块,用于获取某一推荐模式的配置文件,按照所述配置文件分别在所述视频特征库中确定对应的一个或多个视频特征项;
视频特征项计算模块,用于分别计算与所确定的视频特征项一一对应的特征分值,获得所述视频数据的总分值;
视频推荐列表生成模块,用于按照所述总分值对各视频数据进行排序,生成视频推荐列表;
视频推荐模块,用于将所述推荐列表推荐给用户。
8.根据权利要求7所述的装置,其特征在于,还包括:
视频特征库更新模块,用于更新所述视频特征库,具体包括,用于针对所述一个或多个视频特征项,按照不同的更新频率进行更新,其中,所述更新频率包括:按天级更新,按分钟级更新,或,实时更新。
9.根据权利要求8所述的装置,其特征在于,所述视频特征项计算模块包括:
视频特征项计算子模块,用于按照当前推荐模式计算所提取的视频特征项的特征分值;
视频特征项加权子模块,用于对所述特征分值分别进行加权,获得各个视频特征项加权后的特征分值;
视频特征分值累加子模块,用于累加所述加权后的特征分值,获得所述视频数据的总分值。
10.根据权利要求8或9所述的装置,其特征在于,所述视频特征项包括:频道信息;视频新鲜度;全球上映时间;平均观看时长;观看次数;观看评价参数;上榜参数;点击率;和/或,重要度标记信息。
11.根据权利要求10所述的装置,其特征在于,视频推荐列表生成模块包括:
视频数据排序子模块,用于基于所述频道信息,分别对相应频道的视频数据的总分值进行排序;
视频推荐列表生成子模块,用于生成所述视频推荐列表。
12.根据权利要求7所述的装置,其特征在于,所述视频特征库为基于列的分布式数据库HBASE。
CN201510634329.8A 2015-09-29 2015-09-29 一种视频推荐方法和装置 Pending CN105282565A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510634329.8A CN105282565A (zh) 2015-09-29 2015-09-29 一种视频推荐方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510634329.8A CN105282565A (zh) 2015-09-29 2015-09-29 一种视频推荐方法和装置

Publications (1)

Publication Number Publication Date
CN105282565A true CN105282565A (zh) 2016-01-27

Family

ID=55150767

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510634329.8A Pending CN105282565A (zh) 2015-09-29 2015-09-29 一种视频推荐方法和装置

Country Status (1)

Country Link
CN (1) CN105282565A (zh)

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105828181A (zh) * 2016-04-14 2016-08-03 青岛海信传媒网络技术有限公司 基于视频点播量的视频排序方法及装置
CN105898294A (zh) * 2016-05-27 2016-08-24 乐视控股(北京)有限公司 一种视频质量评价方法及装置
CN106131601A (zh) * 2016-06-29 2016-11-16 乐视控股(北京)有限公司 视频推荐方法及装置
CN106227883A (zh) * 2016-08-05 2016-12-14 北京聚爱聊网络科技有限公司 一种多媒体内容的热度分析方法和装置
CN106303588A (zh) * 2016-08-22 2017-01-04 乐视控股(北京)有限公司 视频推荐方法、客户端以及服务器
CN106528813A (zh) * 2016-11-18 2017-03-22 腾讯科技(深圳)有限公司 一种多媒体推荐方法和装置
CN106604066A (zh) * 2016-12-13 2017-04-26 宁夏凯速德科技有限公司 改进的视频app中个性化推荐方法及***
CN106649655A (zh) * 2016-12-13 2017-05-10 宁夏宁信信息科技有限公司 视频app中个性化推荐方法及***
CN106897398A (zh) * 2017-02-08 2017-06-27 北京奇艺世纪科技有限公司 一种视频展示方法及装置
CN107193927A (zh) * 2017-05-17 2017-09-22 深圳市茁壮网络股份有限公司 信息推荐方法及装置
CN107491432A (zh) * 2017-06-20 2017-12-19 北京百度网讯科技有限公司 基于人工智能的低质量文章识别方法及装置、设备及介质
CN107707940A (zh) * 2017-10-25 2018-02-16 暴风集团股份有限公司 视频排序方法、装置、服务器及***
CN108153863A (zh) * 2017-12-25 2018-06-12 北京奇艺世纪科技有限公司 一种视频信息的表示方法及装置
CN108416446A (zh) * 2018-03-15 2018-08-17 北京奇艺世纪科技有限公司 一种视频满意度确定方法及装置
CN108614856A (zh) * 2018-03-21 2018-10-02 北京奇艺世纪科技有限公司 一种视频排序校准方法和装置
CN108769730A (zh) * 2018-05-21 2018-11-06 腾讯科技(深圳)有限公司 视频的播放方法、装置、计算设备以及存储介质
CN108833985A (zh) * 2018-07-09 2018-11-16 深圳市茁壮网络股份有限公司 一种多媒体节目评分方法、排行榜生成方法及装置
CN108932253A (zh) * 2017-05-25 2018-12-04 合网络技术(北京)有限公司 多媒体搜索结果展示方法及装置
CN109684513A (zh) * 2018-12-14 2019-04-26 北京奇艺世纪科技有限公司 一种低质量视频识别方法及装置
CN111324811A (zh) * 2020-02-20 2020-06-23 北京奇艺世纪科技有限公司 一种热点内容确认方法及装置
CN112019920A (zh) * 2019-05-31 2020-12-01 腾讯科技(深圳)有限公司 视频推荐方法、装置、***和计算机设备
CN112714359A (zh) * 2019-10-24 2021-04-27 北京达佳互联信息技术有限公司 视频推荐方法、装置、计算机设备及存储介质
CN113032588A (zh) * 2019-12-25 2021-06-25 北京达佳互联信息技术有限公司 多媒体推荐***、方法、装置及设备
CN114153884A (zh) * 2021-11-09 2022-03-08 安徽大学 一种基于区块链的智能档案管理利用***

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101237559A (zh) * 2007-01-31 2008-08-06 索尼株式会社 信息处理装置和方法以及程序
CN103620593A (zh) * 2011-04-19 2014-03-05 诺基亚公司 用于提供基于特征的协同过滤的方法和装置
CN104199896A (zh) * 2014-08-26 2014-12-10 海信集团有限公司 基于特征分类的视频相似度确定及视频推荐方法
CN104216960A (zh) * 2014-08-21 2014-12-17 北京奇艺世纪科技有限公司 一种视频推荐方法和装置
KR20150085234A (ko) * 2014-01-15 2015-07-23 에스케이텔레콤 주식회사 통화 대상 추천 기능을 가지는 단말장치

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101237559A (zh) * 2007-01-31 2008-08-06 索尼株式会社 信息处理装置和方法以及程序
CN103620593A (zh) * 2011-04-19 2014-03-05 诺基亚公司 用于提供基于特征的协同过滤的方法和装置
KR20150085234A (ko) * 2014-01-15 2015-07-23 에스케이텔레콤 주식회사 통화 대상 추천 기능을 가지는 단말장치
CN104216960A (zh) * 2014-08-21 2014-12-17 北京奇艺世纪科技有限公司 一种视频推荐方法和装置
CN104199896A (zh) * 2014-08-26 2014-12-10 海信集团有限公司 基于特征分类的视频相似度确定及视频推荐方法

Cited By (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105828181A (zh) * 2016-04-14 2016-08-03 青岛海信传媒网络技术有限公司 基于视频点播量的视频排序方法及装置
CN105898294A (zh) * 2016-05-27 2016-08-24 乐视控股(北京)有限公司 一种视频质量评价方法及装置
CN106131601A (zh) * 2016-06-29 2016-11-16 乐视控股(北京)有限公司 视频推荐方法及装置
CN106227883B (zh) * 2016-08-05 2019-09-13 北京数码视讯科技股份有限公司 一种多媒体内容的热度分析方法和装置
CN106227883A (zh) * 2016-08-05 2016-12-14 北京聚爱聊网络科技有限公司 一种多媒体内容的热度分析方法和装置
CN106303588A (zh) * 2016-08-22 2017-01-04 乐视控股(北京)有限公司 视频推荐方法、客户端以及服务器
CN106528813A (zh) * 2016-11-18 2017-03-22 腾讯科技(深圳)有限公司 一种多媒体推荐方法和装置
CN106604066A (zh) * 2016-12-13 2017-04-26 宁夏凯速德科技有限公司 改进的视频app中个性化推荐方法及***
CN106649655A (zh) * 2016-12-13 2017-05-10 宁夏宁信信息科技有限公司 视频app中个性化推荐方法及***
CN106897398A (zh) * 2017-02-08 2017-06-27 北京奇艺世纪科技有限公司 一种视频展示方法及装置
CN106897398B (zh) * 2017-02-08 2020-07-10 北京奇艺世纪科技有限公司 一种视频展示方法及装置
CN107193927A (zh) * 2017-05-17 2017-09-22 深圳市茁壮网络股份有限公司 信息推荐方法及装置
CN108932253A (zh) * 2017-05-25 2018-12-04 合网络技术(北京)有限公司 多媒体搜索结果展示方法及装置
CN107491432A (zh) * 2017-06-20 2017-12-19 北京百度网讯科技有限公司 基于人工智能的低质量文章识别方法及装置、设备及介质
US11645554B2 (en) 2017-06-20 2023-05-09 Beijing Baidu Netcom Science And Technology Co., Ltd. Method and apparatus for recognizing a low-quality article based on artificial intelligence, device and medium
CN107707940A (zh) * 2017-10-25 2018-02-16 暴风集团股份有限公司 视频排序方法、装置、服务器及***
CN108153863A (zh) * 2017-12-25 2018-06-12 北京奇艺世纪科技有限公司 一种视频信息的表示方法及装置
CN108153863B (zh) * 2017-12-25 2021-12-17 北京奇艺世纪科技有限公司 一种视频信息的表示方法及装置
CN108416446A (zh) * 2018-03-15 2018-08-17 北京奇艺世纪科技有限公司 一种视频满意度确定方法及装置
CN108416446B (zh) * 2018-03-15 2021-07-06 北京奇艺世纪科技有限公司 一种视频满意度确定方法及装置
CN108614856A (zh) * 2018-03-21 2018-10-02 北京奇艺世纪科技有限公司 一种视频排序校准方法和装置
CN108769730A (zh) * 2018-05-21 2018-11-06 腾讯科技(深圳)有限公司 视频的播放方法、装置、计算设备以及存储介质
CN108833985A (zh) * 2018-07-09 2018-11-16 深圳市茁壮网络股份有限公司 一种多媒体节目评分方法、排行榜生成方法及装置
CN109684513B (zh) * 2018-12-14 2021-08-24 北京奇艺世纪科技有限公司 一种低质量视频识别方法及装置
CN109684513A (zh) * 2018-12-14 2019-04-26 北京奇艺世纪科技有限公司 一种低质量视频识别方法及装置
CN112019920A (zh) * 2019-05-31 2020-12-01 腾讯科技(深圳)有限公司 视频推荐方法、装置、***和计算机设备
CN112714359A (zh) * 2019-10-24 2021-04-27 北京达佳互联信息技术有限公司 视频推荐方法、装置、计算机设备及存储介质
CN112714359B (zh) * 2019-10-24 2022-09-09 北京达佳互联信息技术有限公司 视频推荐方法、装置、计算机设备及存储介质
CN113032588A (zh) * 2019-12-25 2021-06-25 北京达佳互联信息技术有限公司 多媒体推荐***、方法、装置及设备
CN113032588B (zh) * 2019-12-25 2024-03-08 北京达佳互联信息技术有限公司 多媒体推荐***、方法、装置及设备
CN111324811A (zh) * 2020-02-20 2020-06-23 北京奇艺世纪科技有限公司 一种热点内容确认方法及装置
CN111324811B (zh) * 2020-02-20 2024-04-12 北京奇艺世纪科技有限公司 一种热点内容确认方法及装置
CN114153884A (zh) * 2021-11-09 2022-03-08 安徽大学 一种基于区块链的智能档案管理利用***
CN114153884B (zh) * 2021-11-09 2022-07-12 安徽大学 一种基于区块链的智能档案管理利用***

Similar Documents

Publication Publication Date Title
CN105282565A (zh) 一种视频推荐方法和装置
US11016638B2 (en) Interactive answer boxes for user search queries
US20190018900A1 (en) Method and Apparatus for Displaying Search Results
TWI636416B (zh) 內容個人化之多相排序方法和系統
KR101634773B1 (ko) 캘린더를 이용한 스케쥴 관리시스템 및 스케쥴 관리방법
TWI424369B (zh) 用於決定內容相關性的活動型使用者興趣模型化
CN108040294B (zh) 用于推荐视频的方法、***及计算机可读介质
CN110532479A (zh) 一种信息推荐方法、装置及设备
CN102054003B (zh) 网络信息推荐、建立网络资源索引的方法及***
US20090271391A1 (en) Method and apparatus for rating user generated content in seach results
CN105009103B (zh) 网页的显示时间
CN109522480B (zh) 一种信息推荐方法、装置、电子设备及存储介质
CN104216960A (zh) 一种视频推荐方法和装置
CN111680254B (zh) 一种内容推荐方法及装置
CN106131703A (zh) 一种视频推荐的方法和终端
CN104899315A (zh) 推送用户信息的方法和装置
US10552438B2 (en) Triggering method for instant search
CN111061954B (zh) 搜索结果排序方法、装置及存储介质
CN103309894A (zh) 基于用户属性的搜索实现方法及***
JP6203304B2 (ja) 情報処理装置、情報処理方法および情報処理プログラム
CN114329207A (zh) 多业务信息排序***、方法、存储介质及电子设备
CN113672793A (zh) 一种信息召回方法、装置、电子设备及存储介质
US8312011B2 (en) System and method for automatic detection of needy queries
US20220391459A1 (en) Identification and Issuance of Repeatable Queries
CN113343095A (zh) 一种模型训练以及信息推荐方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160127