CN106331778B - 视频推荐方法和装置 - Google Patents

视频推荐方法和装置 Download PDF

Info

Publication number
CN106331778B
CN106331778B CN201510392358.8A CN201510392358A CN106331778B CN 106331778 B CN106331778 B CN 106331778B CN 201510392358 A CN201510392358 A CN 201510392358A CN 106331778 B CN106331778 B CN 106331778B
Authority
CN
China
Prior art keywords
video
short
videos
long
watching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510392358.8A
Other languages
English (en)
Other versions
CN106331778A (zh
Inventor
谢怡然
张文郁
徐钊
向宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201510392358.8A priority Critical patent/CN106331778B/zh
Priority to PCT/CN2016/082336 priority patent/WO2017005054A1/zh
Priority to EP16820705.8A priority patent/EP3322194A4/en
Publication of CN106331778A publication Critical patent/CN106331778A/zh
Priority to US15/704,882 priority patent/US10575037B2/en
Application granted granted Critical
Publication of CN106331778B publication Critical patent/CN106331778B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/251Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/71Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/735Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/7867Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/258Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
    • H04N21/25866Management of end-user data
    • H04N21/25891Management of end-user data being end-user preferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44204Monitoring of content usage, e.g. the number of times a movie has been viewed, copied or the amount which has been watched
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44213Monitoring of end-user related data
    • H04N21/44222Analytics of user selections, e.g. selection of programs or purchase activity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4667Processing of monitored end-user data, e.g. trend analysis based on the log file of viewer selections
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4668Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/482End-user interface for program selection
    • H04N21/4826End-user interface for program selection using recommendation lists, e.g. of programs or channels sorted out according to their score
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/658Transmission by the client directed to the server
    • H04N21/6582Data stored in the client, e.g. viewing habits, hardware capabilities, credit card number
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors
    • H04N21/8405Generation or processing of descriptive data, e.g. content descriptors represented by keywords

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Social Psychology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computer Graphics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Human Computer Interaction (AREA)
  • Library & Information Science (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种视频推荐方法和装置,所述方法包括:获取视频,所述视频包括长视频和短视频;获取所述长视频中视频属性值大于相应属性阈值的长视频;获取用户的观看记录,获取所述短视频与所述观看记录中的视频之间的相似度,提取所述相似度最高的预设个短视频;向用户推荐所述长视频中视频属性值大于相应属性阈值的长视频,和/或向用户推荐所述相似度最高的预设个短视频。本发明提高了视频推荐的准确度。

Description

视频推荐方法和装置
技术领域
本发明涉及网络数据处理技术领域,特别是涉及一种视频推荐方法和装置。
背景技术
随着网络技术的发展,通过视频网站观看网络视频已经成为人们娱乐和学习的一种主流方式。为了帮助用户从百万计的网络视频中寻找自己喜欢的视频,各个视频网站都会通过各种呈现方式向用户进行视频推荐。
对于视频推荐,一般会用到视频标签(如电影的主演,导演,演员,简介等)和用户标的观看记录。传统的视频推荐方法中,一般通过用户的历史观看记录分析出用户的兴趣,并给用户做出视频推荐。或者,给用户推荐与历史观看记录中具有相同视频标签的其他视频,比如用户看过《两杆大烟枪》,则会向用户推荐盖里奇的其他作品。视频根据视频时长可以分为长视频和短视频。
然而,用户选择长视频和短视频的标准存在一定的差异,传统的视频推荐方法不会针对长视频和短视频分别进行处理再推荐,使得推荐的准确度不够高。
发明内容
基于此,有必要针对上述技术问题,提供一种能提高视频推荐的准确度的视频推荐方法和装置。
一种视频推荐方法,所述方法包括:
获取视频,所述视频包括长视频和短视频;
获取所述长视频中视频属性值大于相应属性阈值的长视频;
获取用户的观看记录,获取所述短视频与所述观看记录中的视频之间的相似度,提取所述相似度最高的预设个短视频;
向用户推荐所述长视频中视频属性值大于相应属性阈值的长视频,和/或向用户推荐所述相似度最高的预设个短视频。
一种视频推荐装置,所述装置包括:
第一获取模块,用于获取视频,所述视频包括长视频和短视频;
第二获取模块,用于获取所述长视频中视频属性值大于相应属性阈值的长视频;
第三获取模块,用于获取用户的观看记录及所述短视频与所述观看记录中的视频之间的相似度,提取所述相似度最高的预设个短视频;
推荐模块,向用户推荐所述长视频中视频属性值大于相应属性阈值的长视频,和/或向用户推荐所述相似度最高的预设个短视频。
上述视频推荐方法和装置,考虑到用户从网络视频中寻找长视频和寻找短视频的标准不一样,通过获取长视频中视频属性值大于相应属性阈值的长视频、获取用户的观看记录和获取所述短视频与所述观看记录中的视频之间的相似度,提取所述相似度最高的预设个短视频,向用户推荐所述长视频中视频属性值大于相应属性阈值的长视频,和/或向用户推荐所述相似度最高的预设个短视频,针对长视频和短视频的不同特征采用不同的推荐标准,提高了推荐的准确度。
附图说明
图1为一个实施例中视频推荐方法实现的应用环境图;
图2为一个实施例中服务器的内部结构示意图;
图3为一个实施例中视频推荐方法的流程示意图;
图4为另一个实施例中视频推荐方法的部分流程图;
图5为一个实施例中获取短视频与观看记录中的视频之间的相似度,提取相似度最高的预设个短视频的具体流程图;
图6为一个具体应用场景中视频推荐方法的用户终端界面图;
图7为一个具体应用场景中实现视频推荐过程的架构图;
图8为一个实施例中视频推荐装置的结构框图;
图9为另一个实施例中视频推荐装置的部分结构框图;
图10为一个实施例中第三获取模块的结构框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,为一个实施例中视频推荐方法实现的应用环境图,该应用环境包括用户终端102和服务器104。其中,用户终端102可以是手机、个人笔记本、平板电脑或者台式计算机等任何安装有视频应用的终端;服务器104可以是一个或多个服务器。用户终端102和服务器104之间通过网络进行通信。
在一个实施例中,上述图1中的服务器104的内部结构示意图如图2所示。该服务器104包括通过***总线连接的处理器、内存储器、非易失性存储介质、网络接口和输出设备。其中,该服务器的存储介质存储有操作***和一种视频推荐装置,该视频推荐装置用于实现一种视频推荐方法。该服务器104的处理器被配置为执行一种视频推荐方法,用于提供计算和控制能力,支撑整个服务器104的运行,该服务器104的内存储器为存储介质中的视频推荐装置的运行提供环境,该服务器104的网络接口用于与用户终端102进行网络通信。该输出设备包括显示屏。
如图3所示,在一个实施例中,提供了一种视频推荐方法,本实施例以该方法应用于上述图1中的服务器来举例说明。
该视频推荐方法具体包括如下步骤:
步骤S302:获取视频。
具体地,服务器可以从网络视频的数据源获取视频。数据源是提供所需要数据的器件或原始媒体。在数据源中存储了所有建立数据库连接的信息。就像通过指定文件名称可以在文件***中找到文件一样,通过提供正确的数据源名称,可以找到相应的数据库连接以获取视频。
每个视频都有相应的视频信息,如视频时长、视频标题等。视频时长是指正常情况下播完一个视频所花费的时间。视频根据视频时长可以分为长视频和短视频。视频时长可以是几秒钟,也可以是几个小时。预先设置一个时长分界点(如45分钟),像电视剧、卡通、电影等视频时长大于等于45分钟的视频为长视频,而广告、新闻等视频时长小于45分钟的视频为短视频。考虑到用户在选择长视频和短视频的标准不同,将视频分为长视频和短视频进行处理以更好地满足用户的需求。视频标题可以是包括名词、动词等不同词性的词语串。
进一步地,视频信息还包括专辑标识、视频标识、视频类型、视频子类型等。其中,专辑标识和视频标识为一串包含字母和数字的字符串,如专辑标识可以为r0154jba1kd,视频标识可以为3tvgfggkrubwssx等。视频类型一般采用数字表示,如1表示电影、2表示电视、3表示卡通、9表示记录、10表示表演视频等。
步骤S304:获取长视频中视频属性值大于相应属性阈值的长视频。
具体地,视频属性值一般包括视频点击量、观看次数及观看完成率等。其中,视频点击量是指该视频被点击的次数的总和,观看次数是指该视频被点击播放的时间超过预设时长(比如20分钟)的次数的总和,观看完成率是指将该视频每次的观看完成率相加再除以视频点击量而得到的平均值。其中,该视频每次的观看完成率等于每次的观看的时长除以视频时长。
举例说明,天天向上的第20150619期的视频标题为“风云毕业生上演戛纳花被单秀”,视频时长为80分钟。假设该视频被点击了10000次,其中有5000次被点击播放的时间为80分钟(超过预设时长),有5000次被点击播放的时间为1分钟(未超过预设时长),那么该视频的点击量为10000次,观看次数为5000次,观看完成率为0.50625。
通过设置相应的属性阈值以获取所述长视频中视频属性值大于相应属性阈值的长视频。
步骤S306:获取用户的观看记录,获取短视频与观看记录中的视频之间的相似度,提取相似度最高的预设个短视频。
具体地,用户通过用户终端进入视频应用时,可以以游客的身份或会员的身份观看视频,其中游客是指没有登录的用户,而会员则是登录的用户。用户通过用户终端进入视频应用时,服务器可以获取到对应的观看记录。如果用户为会员,服务器则会获取与会员的帐号对应的观看记录,如果用户为游客,服务器则会获取与游客使用的用户终端的IP地址对应的观看记录。用户的观看记录是指该用户已经观看过的视频所对应的视频信息。
举例说明,如果用户标识对应的A用户观看了电视剧“康熙王朝”,那么观看记录中就会存储有关“康熙王朝”的视频信息。
获取短视频与观看记录中的视频之间的相似度,并提取相似度最高的预设个短视频。比如,有10个短视频与观看记录中的视频之间的相似度分别为1、1、0.9、0.8、0.2、0.3、0.5、0.4、0.9、0.7,需要提取相似度最高的5个短视频,那么与观看记录中的视频之间的相似度为1、0.9、0.8的五个短视频会被提取。
步骤S306可以在步骤S304之前或之后执行。
步骤S308:向用户推荐长视频中视频属性值大于相应属性阈值的长视频,和/或向用户推荐相似度最高的预设个短视频。
视频属性值一般能够客观地反映该视频受用户喜欢的程度。视频属性值越高(如观看次数越多或观看完成率越高)说明越多的用户对该视频感兴趣。长视频的视频时长比较长,其视频标题并不能很好地反应出视频内容,因此,向用户推荐长视频中视频属性值大于相应属性阈值的视频。短视频的视频时长比较短,其对应的视频标题就可以很好地反应出视频内容,另外,观看记录可以反映出该用户比较感兴趣的视频内容,因此,向用户推荐短视频中与观看记录中的视频信息的相似度较高的预设数量的视频。
在一个实施例中,视频属性值和观看记录是实时更新的。
可以理解,在其他实施例中,还可以同时结合视频属性值和视频的相似度向用户推荐长视频或短视频。
上述视频推荐方法和装置,考虑到用户从网络视频中寻找长视频和寻找短视频的标准不一样,通过获取长视频中视频属性值大于相应属性阈值的长视频、获取用户的观看记录和获取所述短视频与所述观看记录中的视频之间的相似度,提取所述相似度最高的预设个短视频,向用户推荐所述长视频中视频属性值大于相应属性阈值的长视频,和/或向用户推荐所述相似度最高的预设个短视频,针对长视频和短视频的不同特征采用不同的推荐标准,提高了推荐的准确度。
在一个实施例中,获取长视频中视频属性值大于相应属性阈值的长视频的步骤包括:按照预先设置的优先级数据获取预设时间内更新的长视频中观看次数大于次数阈值的视频和/或获取预设时间内更新的长视频中观看完成率大于完成率阈值的视频。
具体地,考虑到每天更新的视频数量是非常多的,为了减少数据的计算量和复杂度,只获取预设时间内更新的长视频的观看次数和观看完成率。例如,设预设时间为15天,那么服务器在2015年7月1日进行数据统计时,只会统计2015年6月15日之后更新的长视频中每个视频的观看次数和观看完成率。
在一个实施例中,用户可以对预设时间进行自定义设置。
预先设置的优先级数据是指根据实际需要预先设置优先推荐长视频的条件,如设置观看次数优先或观看完成率优先等。该优先级数据可为优先向用户推荐观看次数大于次数阈值(如5000次)的长视频,或者优先向用户推荐观看完成率大于完成率阈值(如80%)的长视频。可以理解,还可以向用户推荐观看次数大于次数阈值(如5000次)且完成率大于完成率阈值(如80%)的长视频。
如图4所示,在一个实施例中,视频推荐方法还包括:
步骤S402:检测预设时间内更新的长视频中是否有曝光次数达到曝光阈值的视频或者是否有出现在观看记录中的视频。若是,则执行步骤S404,否则,返回继续执行步骤S402。
具体地,服务器向用户终端的用户推荐视频时是以视频推荐表的方式进行推荐。视频的曝光行为是指视频信息出现在视频推荐表中的行为,曝光次数则是指视频出现在视频推荐表中的次数,以用户进入视频应用的次数为基础。比如,用户今天两次进入了视频应用,且每次进入时某个视频都有出现在视频推荐表中,那么该视频的曝光次数为2。
步骤S404:将曝光次数达到曝光阈值的视频或出现在观看记录中的视频进行过滤。
当一个视频的曝光次数达到曝光阈值时,用户一直没有点击观看,说明用户可能对该视频并不感兴趣,则将该视频进行过滤,这样服务器下次就不会再向用户推荐该视频了。另外,如果一个视频出现在观看记录中,说明用户已经观看了该视频,这样服务器下次也不会再向用户推荐该视频了。这样可以及时过滤掉用户已经观看过和曝光次数较多的视频,提高视频推荐的准确度。
在过滤的过程中,有一个预先建立的过滤表,通过将过滤的视频放入过滤表中来进行过滤,过滤表的长度通过一个长度阈值来限制,且采用先进先出的存放方式。比如,过滤列表的长度为10,即只能存放10个过滤的视频信息,当第11个过滤的视频信息需要存入时,则会先将过滤列表中第1个视频信息删除,然后再存入第11个过滤的视频信息。
如图5所示,在一个实施例中,获取短视频与观看记录中的视频之间的相似度,提取所述相似度最高的预设个短视频的步骤包括:
步骤S502:对观看记录中最近观看的短视频的视频标题进行分词以得到单独的词。
具体地,分词是指将一个汉字序列切分成一个个单独的词的过程。对观看记录中最近观看的短视频的视频标题按词性进行分词,如一个短视频的视频标题为“智能机器等五只概念股涨停”,那么进行分词后会得到“智能”、“机器”、“等”、“五”、“只”、“概念股”、“涨停”七个单独的词,他们的词性分别为名词、名词、助词、数词、副词、名词及动词。
进一步地,针对不同的词性还可以设置不同的权值。如名词、形容词的权值设为1,助词、副词的权值设为0.5,动词的权值设为0.8,特殊名词1.5等。
步骤S504:将单独的词分别作为关键字在预先建立的视频倒排索引表中进行查询以获取对应的视频标识所构成的视频集合。
具体地,倒排索引也称反向索引,是一种索引方法,被用来存储某个词在一个文件或者一组文件中的存储位置的映射,是文件检索***中最常用的数据结构。通过倒排索引,可以快速获取包含这个词的所有文件。
在一个实施例中,以单独的词分别作为关键字查找倒排索引表时,如果能查到该关键字,则将该关键字对应的视频标识***到倒排索引表相应的位置,同时返回对应的视频标识所构成的视频集合。如果不能查到该关键字,则在倒排索引表中新建该关键字的表项,并将该关键字对应的视频标识***到倒排索引表相应的位置。
步骤S506:计算视频集合中每个短视频的视频标题与观看记录中最近观看的短视频的视频标题的相似度。
步骤S508:提取所述相似度最高的预设个短视频。
具体地,步骤S506中计算出了视频集合中每个短视频的视频标题与观看记录中最近观看的短视频的视频标题的相似度,但是只会向用户推荐相似度较高的预设数量(如5个)的视频。
如上例,用户观看了一个视频标题为“智能机器等五只概念股涨停”的短视频,通过计算得到了视频标题包含有“智能”、“机器”、“等”、“五”、“只”、“概念股”、“涨停”中至少一个词的所有短视频与“智能机器等五只概念股涨停”这个视频标题的相似度,相似度分别为1、0.8、0.9、0.5、2、0.9、1、1、0.5,如果预设数量为5,那么会向用户推荐3个相似度为1的短视频和2个相似度为0.9的短视频。
在一个实施例中,计算视频集合中每个短视频的视频标题与观看记录中最近观看的短视频的视频标题的相似度的步骤包括:获取视频集合中每个短视频的视频标题与观看记录中最近观看的短视频的视频标题的相同的词;将相同的词的权值中最大的权值作为所述相似度。
举例说明,用户最近观看的一个短视频的视频标识为“r001319tsdd”、视频标题为“智能机器等五只概念股涨停”,那么进行分词后会得到“智能”、“机器”、“等”、“五”、“只”、“概念股”、“涨停”七个单独的词,且他们的权值分别为1、1、0.5、0.05、0.5、1、0.8。分别以上述七个词作为关键字在预先建立的视频倒排索引表中进行查询,如以“智能”作为关键字查询获取对应的视频标识所构成的视频集合,该视频集合中有一个短视频的视频标识为“x0016wetcy5”、视频标题为“人工智能之父:图灵(五)”,那么在计算视频标识为“r001319tsdd”和视频标识为“x0016wetcy5”这两个短视频的相似度时,需要获取两者标题中相同的词“智能”和“五”,因“智能”的权值为1,“五”的权值为“0.05”,所以将1作为这两个短视频的相似度。
进一步地,在一个实施例中,还包括计算各个单独的词的权值与预设的时间衰减因子的乘积,并将所述乘积作为最终的权值来计算该相似度的步骤。
如上例,视频标识为“r001319tsdd”和视频标识为“x0016wetcy5”这两个短视频的发布时间差为十天,预设的时间衰减因子为0.4,那么“智能”的权值为1*0.4=0.4,“五”的权值为0.05*0.4=0.02,所以将0.4作为这两个短视频的相似度。
下面通过具体应用场景来说明上述视频推荐方法的原理,该应用场景以手机作为用户终端为例进行说明。
如图6所示,用户通过手机登录视频应用之后,即会进入设有视频推荐表602的用户页面。视频推荐表602是实时更新的。服务器针对每一个用户终端通过视频应用点击或观看视频所产生的数据都会进行实时处理。假设服务器获取的视频对应的视频信息和统计得到的视频属性值如表1所示,获取的用户观看记录如表2所示:
表1:
类型 视频标题 视频时长 观看次数 观看完成率
电影 爸爸去哪儿2 2小时 5000次 97%
电影 致青春 1.5小时 3000次 90%
电视 康熙王朝 45分钟 8000次 50%
综艺 快乐大本营 1小时 10000次 80%
动漫 网球王子 20分钟 1000次 95%
新闻 奥运准备工作 10分钟 6000次 100%
表2:
Figure BDA0000753907330000091
表1中的视频都是15天以内更新的视频,即15天以内新上线的视频,根据视频时长,表1中的视频分为长视频和短视频两类,其中视频时长大于等于45分钟的“爸爸去哪儿2”、“致青春”、“康熙王朝”、“快乐大本营”为长视频,而视频时长小于45分钟的“网球王子”、“奥运准备工作”为短视频。
假如服务器按照预先设置的优先级数据为向用户优先推荐观看次数大于等于7999次的视频,那么长视频中的“康熙王朝”和“快乐大本营”就会更新在视频推荐表602中以推荐给用户。
表2中的A用户最近观看的视频为“天天向上之风云毕业生上演戛纳花被单秀”,那么与该视频标题相关的短视频就会被更新在视频推荐表602中以推荐给用户。
图7所示为一个具体应用场景中实现视频推荐过程的架构图。长视频拉取节点和短视频拉取节点分别从数据源拉取数据进行处理,长视频有关数据经长视频信息获取节点、统计节点、过滤节点进行处理之后,会被更新到视频推荐表中以向用户进行推荐。短视频有关数据经分词节点、查询节点、计算节点及更新节点处理后,也会被更新到视频推荐表中以向用户进行推荐。
如图8所示,在一个实施例中,提供了一种视频推荐装置800,具有实现上述各个实施例的视频推荐方法的功能。该视频处理装置800包括第一获取模块802、第二获取模块804、第三获取模块806以及推荐模块808。
具体地,第一获取模块802用于获取视频,视频包括长视频和短视频。
第二获取模块804用于获取长视频中视频属性值大于相应属性阈值的长视频。
第三获取模块806用于获取用户的观看记录及短视频与观看记录中的视频之间的相似度,提取相似度最高的预设个短视频。
推荐模块808用于向用户推荐所述长视频中视频属性值大于相应属性阈值的长视频,和/或向用户推荐相似度最高的预设个短视频。
在一个实施例中,第二获取模块804包括获取单元,所述获取单元用于按照预先设置的优先级数据获取预设时间内更新的长视频中观看次数大于次数阈值的视频和/或获取预设时间内更新的长视频中观看完成率大于完成率阈值的视频。
请结合图9,在一个实施例中,提供了另一种视频推荐装置900,具有实现上述各个实施例的视频推荐方法的功能。该视频推荐装置900包括检测模块902和过滤模块904。
具体地,检测模块902用于检测预设时间内更新的长视频中是否有曝光次数达到曝光阈值的视频或者是否有出现在所述观看记录中的视频。
过滤模块904用于将曝光次数达到曝光阈值的视频或出现在观看记录中的视频进行过滤。
请结合图10,在一个实施例中,第三获取模块1000包括分词单元1002、查询单元1004、计算单元1006以及提取单元1008。
具体地,分词单元1002用于对观看记录中最近观看的短视频的视频标题进行分词以得到单独的词。
查询单元1004用于将单独的词分别作为关键字在预先建立的视频倒排索引表中进行查询以获取对应的视频标识所构成的视频集合。
计算单元1006用于计算视频集合中每个短视频的视频标题与观看记录中最近观看的短视频的视频标题的相似度。
提取单元1008用于提取相似度最高的预设个短视频。
在一个实施例中,计算单元1006用于获取视频集合中每个短视频的视频标题与观看记录中最近观看的短视频的视频标题的相同的词,并将相同的词的权值中最大的权值作为所述相似度。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等非易失性存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (12)

1.一种视频推荐方法,所述方法包括:
获取视频,所述视频包括长视频和短视频;
获取所述长视频中视频属性值大于相应属性阈值的长视频;所述视频属性值包括视频点击量、观看次数和观看完成率中的一种或多种;
获取用户的观看记录,获取所述短视频与所述观看记录中的一观看的短视频之间的标题的相似度,提取所述相似度最高的预设个短视频;
向用户推荐所述长视频中视频属性值大于相应属性阈值的长视频,和/或向用户推荐所述相似度最高的预设个短视频。
2.根据权利要求1所述的方法,其特征在于,所述获取所述长视频中视频属性值大于相应属性阈值的长视频的步骤,包括:
按照预先设置的优先级数据获取预设时间内更新的长视频中观看次数大于次数阈值的视频和/或获取预设时间内更新的长视频中观看完成率大于完成率阈值的视频。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
检测所述预设时间内更新的长视频中是否有曝光次数达到曝光阈值的视频或者是否有出现在所述观看记录中的视频;若是,
将所述曝光次数达到曝光阈值的视频或出现在所述观看记录中的视频进行过滤。
4.根据权利要求1所述的方法,其特征在于,所述获取所述短视频与所述观看记录中的视频之间的相似度,提取所述相似度最高的预设个短视频的步骤,包括:
对观看记录中最近观看的短视频的视频标题进行分词以得到单独的词;
将所述单独的词分别作为关键字在预先建立的视频倒排索引表中进行查询以获取对应的视频标识所构成的视频集合;
计算视频集合中每个短视频的视频标题与观看记录中最近观看的短视频的视频标题的相似度;
提取所述相似度最高的预设个短视频。
5.根据权利要求4所述的方法,其特征在于,所述计算视频集合中每个短视频的视频标题与观看记录中最近观看的短视频的视频标题的相似度的步骤,包括:
获取所述视频集合中每个短视频的视频标题与观看记录中最近观看的短视频的视频标题的相同的词,并将相同的词的权值中最大的权值作为所述相似度。
6.一种视频推荐装置,其特征在于,所述装置包括:
第一获取模块,用于获取视频,所述视频包括长视频和短视频;
第二获取模块,用于获取所述长视频中视频属性值大于相应属性阈值的长视频;所述视频属性值包括视频点击量、观看次数和观看完成率中的一种或多种;
第三获取模块,用于获取用户的观看记录及所述短视频与所述观看记录中的一观看的短视频之间的标题的相似度,提取所述相似度最高的预设个短视频;
推荐模块,用于向用户推荐所述长视频中视频属性值大于相应属性阈值的长视频,和/或向用户推荐所述相似度最高的预设个短视频。
7.根据权利要求6所述的装置,其特征在于,所述第二获取模块包括:
获取单元,用于按照预先设置的优先级数据获取预设时间内更新的长视频中观看次数大于次数阈值的视频和/或获取预设时间内更新的长视频中观看完成率大于完成率阈值的视频。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
检测模块,用于检测所述预设时间内更新的长视频中是否有曝光次数达到曝光阈值的视频或者是否有出现在所述观看记录中的视频;
过滤模块,用于将所述曝光次数达到曝光阈值的视频或出现在所述观看记录中的视频进行过滤。
9.根据权利要求6所述的装置,其特征在于,所述第三获取模块包括:
分词单元,用于对观看记录中最近观看的短视频的视频标题进行分词以得到单独的词;
查询单元,用于将所述单独的词分别作为关键字在预先建立的视频倒排索引表中进行查询以获取对应的视频标识所构成的视频集合;
计算单元,用于计算视频集合中每个短视频的视频标题与观看记录中最近观看的短视频的视频标题的相似度;
提取单元,用于提取所述相似度最高的预设个短视频。
10.根据权利要求9所述的装置,其特征在于,所述计算单元用于获取所述视频集合中每个短视频的视频标题与观看记录中最近观看的短视频的视频标题的相同的词,并将相同的词的权值中最大的权值作为所述相似度。
11.一种存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时可实现如权利要求1-5中任一项所述的视频推荐方法。
12.一种终端,包括存储介质,处理器及存储在存储介质上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1-5中任一项所述的视频推荐方法。
CN201510392358.8A 2015-07-06 2015-07-06 视频推荐方法和装置 Active CN106331778B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201510392358.8A CN106331778B (zh) 2015-07-06 2015-07-06 视频推荐方法和装置
PCT/CN2016/082336 WO2017005054A1 (zh) 2015-07-06 2016-05-17 视频推荐方法、服务器和存储介质
EP16820705.8A EP3322194A4 (en) 2015-07-06 2016-05-17 Video recommendation method, server and storage medium
US15/704,882 US10575037B2 (en) 2015-07-06 2017-09-14 Video recommending method, server, and storage media

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510392358.8A CN106331778B (zh) 2015-07-06 2015-07-06 视频推荐方法和装置

Publications (2)

Publication Number Publication Date
CN106331778A CN106331778A (zh) 2017-01-11
CN106331778B true CN106331778B (zh) 2020-08-14

Family

ID=57684727

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510392358.8A Active CN106331778B (zh) 2015-07-06 2015-07-06 视频推荐方法和装置

Country Status (4)

Country Link
US (1) US10575037B2 (zh)
EP (1) EP3322194A4 (zh)
CN (1) CN106331778B (zh)
WO (1) WO2017005054A1 (zh)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10433015B2 (en) 2017-11-16 2019-10-01 Rovi Guides, Inc. Systems and methods for providing recommendations based on short-media viewing profile and long-media viewing profile
US10506202B2 (en) 2017-11-20 2019-12-10 Cisco Technology, Inc. System and method for protecting critical data on camera systems from physical attack
TWI658726B (zh) * 2018-01-04 2019-05-01 中華電信股份有限公司 基於時事推廣影片的方法及其裝置
CN108197336B (zh) * 2018-03-15 2022-04-22 北京奇艺世纪科技有限公司 一种视频查找的方法及装置
CN108632670B (zh) * 2018-03-15 2021-03-26 北京奇艺世纪科技有限公司 一种视频满意度确定方法及装置
CN108810573B (zh) * 2018-06-14 2022-01-04 广东互通宽带网络服务有限公司 一种支持向量机进行智能流量缓存预测的方法及***
CN108921221B (zh) * 2018-07-04 2022-11-18 腾讯科技(深圳)有限公司 用户特征的生成方法、装置、设备及存储介质
CN109104620B (zh) * 2018-07-26 2020-05-19 腾讯科技(深圳)有限公司 一种短视频推荐方法、装置和可读介质
CN109245989A (zh) * 2018-08-15 2019-01-18 咪咕动漫有限公司 一种基于信息分享的处理方法、装置及计算机可读存储介质
CN109040775A (zh) * 2018-08-24 2018-12-18 深圳创维-Rgb电子有限公司 视频关联方法、装置及计算机可读存储介质
CN109255035B (zh) * 2018-08-31 2024-03-26 北京字节跳动网络技术有限公司 用于构建知识图谱的方法和装置
CN110059221B (zh) * 2019-03-11 2023-10-20 咪咕视讯科技有限公司 视频推荐方法、电子设备及计算机可读存储介质
CN110046303B (zh) * 2019-04-09 2022-05-17 有光创新(北京)信息技术有限公司 一种基于需求匹配平台实现的信息推荐方法及装置
CN110809177B (zh) * 2019-10-22 2021-11-05 腾讯科技(深圳)有限公司 内容的处理方法、装置、服务器及存储介质
CN110996142B (zh) * 2019-11-08 2021-12-07 北京奇艺世纪科技有限公司 视频召回方法及装置、电子设备及存储介质
CN111079016A (zh) * 2019-12-17 2020-04-28 北京奇艺世纪科技有限公司 一种短视频推荐方法、装置及电子设备
US11640370B2 (en) * 2019-12-18 2023-05-02 Sap Se Data migration using transactional data as primary object
CN111212303B (zh) * 2019-12-30 2022-05-10 咪咕视讯科技有限公司 视频推荐方法、服务器和计算机可读存储介质
CN111476198B (zh) * 2020-04-24 2023-09-26 广西安良科技有限公司 基于人工智能的步态识别方法、装置、***、存储介质和服务器
CN111339355A (zh) * 2020-05-21 2020-06-26 北京搜狐新媒体信息技术有限公司 一种视频推荐方法及***
CN112153423A (zh) * 2020-09-15 2020-12-29 济南雪景网络技术有限公司 用户自驱动的短视频智能推荐方法、电子设备和存储介质
CN112929725B (zh) * 2021-01-21 2023-03-14 网易(杭州)网络有限公司 视频发布方法、视频播放方法、电子设备和存储介质
CN115278326A (zh) * 2021-04-29 2022-11-01 腾讯科技(深圳)有限公司 视频展示方法、装置、计算机可读介质及电子设备
CN113688260A (zh) * 2021-08-31 2021-11-23 维沃移动通信有限公司 视频推荐方法和装置
CN113873330B (zh) * 2021-08-31 2023-03-10 武汉卓尔数字传媒科技有限公司 视频推荐方法、装置、计算机设备和存储介质
CN113645488B (zh) * 2021-10-18 2021-12-21 南京聚通时讯科技有限公司 一种基于用户数据的互联网电视视频推荐***及方法
CN114222150A (zh) * 2021-11-19 2022-03-22 北京达佳互联信息技术有限公司 数据处理方法、装置、电子设备及存储介质
CN114007103B (zh) * 2021-12-30 2022-04-26 飞狐信息技术(天津)有限公司 在线视频播放的方法及装置、电子设备、存储介质
CN114443896B (zh) * 2022-01-25 2023-09-15 百度在线网络技术(北京)有限公司 数据处理方法和用于训练预测模型的方法
CN114615525B (zh) * 2022-03-18 2023-07-18 抖音视界有限公司 一种视频推送的方法、装置、设备及存储介质
CN115529501A (zh) * 2022-09-19 2022-12-27 深圳市和讯华谷信息技术有限公司 一种短视频推荐方法、装置、***以及存储介质
CN116541432B (zh) * 2023-05-22 2023-10-17 杭州精英在线教育科技股份有限公司 一种基于教育机器人的在线课堂智能推荐方法
CN117459798B (zh) * 2023-12-22 2024-03-08 厦门众联世纪股份有限公司 一种基于大数据的信息展示方法、装置、设备及存储介质

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8087057B2 (en) * 2004-04-28 2011-12-27 Echostar Technologies L.L.C. Television converter device including an internet protocol interface
US9032430B2 (en) * 2006-08-24 2015-05-12 Rovi Guides, Inc. Systems and methods for providing blackout support in video mosaic environments
US8745647B1 (en) * 2006-12-26 2014-06-03 Visible Measures Corp. Method and system for internet video and rich media behavioral measurement
US7908303B2 (en) * 2007-04-10 2011-03-15 Intellectual Ventures Holding 32 Llc Integrated digital media projection and personal digital data processing system
US9654721B2 (en) * 2007-07-10 2017-05-16 Verizon Patent And Licensing Inc. System and method for providing personal content recommendations
US8489515B2 (en) * 2009-05-08 2013-07-16 Comcast Interactive Media, LLC. Social network based recommendation method and system
US8365227B2 (en) * 2009-12-02 2013-01-29 Nbcuniversal Media, Llc Methods and systems for online recommendation
US9021395B2 (en) * 2011-10-19 2015-04-28 Panasonic Intellectual Property Corporation Of America Display control device, integrated circuit, and display control method
CN103136275A (zh) * 2011-12-02 2013-06-05 盛乐信息技术(上海)有限公司 个性化视频推荐***及方法
CN102957950A (zh) * 2012-07-23 2013-03-06 华东师范大学 一种用于视频推荐的用户隐式评分方法
CN103631823B (zh) * 2012-08-28 2017-01-18 腾讯科技(深圳)有限公司 一种媒体内容推荐方法及设备
CN102970605B (zh) * 2012-11-21 2017-10-31 Tcl集团股份有限公司 一种节目推荐方法
US20140149424A1 (en) * 2012-11-23 2014-05-29 Mobitv, Inc Time weighted content recommendation
US20140215506A1 (en) * 2013-01-25 2014-07-31 Mobitv, Inc. Time context weighted content recommendation
US20160071170A1 (en) * 2013-02-08 2016-03-10 Thomson Licensing Method of creating content recommendations based on user ratings of content with improved user privacy
US9955231B2 (en) * 2013-03-14 2018-04-24 DISH Technologies L.L.C. Relevant video content pushed to a mobile phone
US10025861B2 (en) * 2013-08-28 2018-07-17 Oath Inc. Prioritizing items from different categories in a news stream
CN104219575B (zh) * 2013-05-29 2020-05-12 上海连尚网络科技有限公司 相关视频推荐方法及***
CN103473273B (zh) * 2013-08-22 2019-01-18 百度在线网络技术(北京)有限公司 信息搜索方法、装置和服务器
US20150066583A1 (en) * 2013-09-04 2015-03-05 Google Inc. Content discovery with friend and analytic data
CN103491441B (zh) * 2013-09-09 2017-02-01 东软集团股份有限公司 直播电视节目推荐方法及***
CN104699696B (zh) * 2013-12-05 2018-12-28 深圳市腾讯计算机***有限公司 文件推荐方法和装置
CN104598505B (zh) * 2014-06-03 2018-09-18 腾讯科技(深圳)有限公司 多媒体资源推荐方法及装置
CN104156472B (zh) * 2014-08-25 2018-05-08 北京四达时代软件技术股份有限公司 一种视频推荐方法及***
US20160182955A1 (en) * 2014-12-23 2016-06-23 Rovi Guides, Inc. Methods and systems for recommending media assets

Also Published As

Publication number Publication date
US10575037B2 (en) 2020-02-25
EP3322194A1 (en) 2018-05-16
CN106331778A (zh) 2017-01-11
US20180007409A1 (en) 2018-01-04
EP3322194A4 (en) 2018-05-30
WO2017005054A1 (zh) 2017-01-12

Similar Documents

Publication Publication Date Title
CN106331778B (zh) 视频推荐方法和装置
US9471936B2 (en) Web identity to social media identity correlation
US9253511B2 (en) Systems and methods for performing multi-modal video datastream segmentation
US8145648B2 (en) Semantic metadata creation for videos
US7620551B2 (en) Method and apparatus for providing search capability and targeted advertising for audio, image, and video content over the internet
KR101999389B1 (ko) 현재 재생되는 텔레비젼 프로그램들과 연관된 인터넷-액세스가능 컨텐츠의 식별 및 제시
US11734289B2 (en) Methods, systems, and media for providing a media search engine
US20160014482A1 (en) Systems and Methods for Generating Video Summary Sequences From One or More Video Segments
US8478759B2 (en) Information presentation apparatus and mobile terminal
US20130216203A1 (en) Keyword-tagging of scenes of interest within video content
CN111274442B (zh) 确定视频标签的方法、服务器及存储介质
KR20160104661A (ko) 온-디맨드 미디어 컨텐츠에 대응하는 보충적인 정보를 제시하기 위한 방법들, 시스템들 및 매체들
US20130007057A1 (en) Automatic image discovery and recommendation for displayed television content
US20150128186A1 (en) Mobile Multimedia Terminal, Video Program Recommendation Method and Server Thereof
CN110674345A (zh) 一种视频搜索方法、装置及服务器
CN109933691B (zh) 用于内容检索的方法、装置、设备和存储介质
CN109063080B (zh) 一种视频推荐方法及装置
CN106462618B (zh) 用于第二设备的动态当前结果
JP2010218385A (ja) コンテンツ検索装置及びコンピュータプログラム
CN110942070B (zh) 内容展示方法、装置、电子设备及计算机可读存储介质
US12008036B2 (en) Methods and apparatuses for preventing spoilers in autocompleted search queries
JP5757886B2 (ja) テレビ放送録画予約方法、装置およびシステム
JP2018081389A (ja) 分類検索システム
WO2015121277A1 (en) Method for enriching a description of an audiovisual file and corresponding device and terminal

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant