CN104008139A - 视频索引表的创建方法和装置,视频的推荐方法和装置 - Google Patents

视频索引表的创建方法和装置,视频的推荐方法和装置 Download PDF

Info

Publication number
CN104008139A
CN104008139A CN201410193565.6A CN201410193565A CN104008139A CN 104008139 A CN104008139 A CN 104008139A CN 201410193565 A CN201410193565 A CN 201410193565A CN 104008139 A CN104008139 A CN 104008139A
Authority
CN
China
Prior art keywords
video
ugc
cluster
recommendation list
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410193565.6A
Other languages
English (en)
Other versions
CN104008139B (zh
Inventor
王敏
傅一峰
周燕红
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing QIYI Century Science and Technology Co Ltd
Original Assignee
Beijing QIYI Century Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing QIYI Century Science and Technology Co Ltd filed Critical Beijing QIYI Century Science and Technology Co Ltd
Priority to CN201410193565.6A priority Critical patent/CN104008139B/zh
Publication of CN104008139A publication Critical patent/CN104008139A/zh
Application granted granted Critical
Publication of CN104008139B publication Critical patent/CN104008139B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/71Indexing; Data structures therefor; Storage structures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种视频索引表的创建方法和装置,视频的推荐方法和装置,以解决由于推荐的视频无序、缺失、不准确的问题。视频索引表的创建方法包括:获取多个UGC视频及各UGC视频的视频ID;对UGC视频进行聚类,针对各个聚类分配视频聚类ID;针对各个聚类中的UGC视频生成描述信息,对描述信息进行排序;采用排序后的描述信息生成UGC视频推荐列表;采用视频ID和对应的视频聚类ID创建第一级索引表,采用视频聚类ID和对应的UGC视频推荐列表创建第二级索引表。由于视频推荐列表中包括进行聚类后的UGC视频的描述信息,因此描述信息更加全面,解决了缺少某些集数的问题,对描述信息进行了排序,解决了顺序混乱的问题。

Description

视频索引表的创建方法和装置,视频的推荐方法和装置
技术领域
本发明涉及多媒体技术领域,特别是涉及一种视频索引表的创建方法和装置,以及一种视频的推荐方法和装置。
背景技术
UGC全称为User Generated Content,也就是用户生成内容的意思。UGC的概念最早起源于互联网领域,即用户将自己原创的内容通过互联网平台进行展示或者提供给其他用户共享。UGC是伴随着以提倡个性化为主要特点的Web2.0概念兴起的。UGC并不是某一种具体的业务,而是一种用户使用互联网的新方式,即由原来的以下载为主变成下载和上传并重。好友社交网络、视频分享网络、知识分享网络、社区、论坛、微博等都是UGC的主要应用形式。
UGC视频是指用户自己生成的,并且通过互联网技术上传到各大视频分享网站的视频内容。UGC视频具有海量的特征,用户可以通过在视频分享网站中搜索观看其他用户上传的UGC视频。在用户观看某一个UGC视频时,该视频分享网站可以向用户推荐一些与当前观看的UGC视频相关的视频。
但是,目前各大视频分享网站中大量用户上传的UGC视频非常扁平化,缺少严谨的信息结构。因此,在向用户推荐相关UGC视频时,所推荐的视频顺序混乱,并且可能会缺少某些视频,甚至所推荐的视频与当前观看的视频不属于同一个类别。例如,针对某一个电视剧类的UGC视频,在推荐时展现的剧集顺序混乱、缺少某些集数等,从而使得用户需要繁杂的借助搜索引擎进行剧集定位。
因此,目前的UGC视频推荐技术中存在推荐的视频无序、缺失、视频不准确等缺陷,导致繁琐地进行搜索定位过程,无形中增加用户的流失率。
发明内容
本发明提供了一种视频索引表的创建方法和装置,以及一种视频的推荐方法和装置,以解决目前的UGC视频推荐技术中存在推荐的视频无序、缺失、视频不准确等缺陷,导致繁琐地进行搜索定位过程,无形中增加用户的流失率的问题。
为了解决上述问题,本发明公开了一种视频索引表的创建方法,其特征在于,包括:
获取客户端上传的多个用户生成内容UGC视频及各个UGC视频的视频ID;
对所述多个UGC视频进行聚类,并针对各个聚类分配视频聚类ID;
针对所述各个聚类中的UGC视频分别生成描述信息,并对所述描述信息进行排序;
采用所述排序后的描述信息生成UGC视频推荐列表;
采用所述视频ID和对应的视频聚类ID创建第一级索引表,以及,采用所述视频聚类ID和对应的UGC视频推荐列表创建第二级索引表。
优选地,在所述获取客户端上传的多个UGC视频及各个UGC视频的视频ID的步骤之后,还包括:
分别抽取各个UGC视频的视频元数据。
优选地,所述对所述多个UGC视频进行聚类的步骤包括:
分别对每两个UGC视频的视频元数据进行相似度计算;
将相似度位于预设的相似度区间之内的视频元数据对应的UGC视频确定为属于同一个聚类。
优选地,所述视频元数据包括视频标题;所述针对所述各个聚类中的UGC视频分别生成描述信息,并对所述描述信息进行排序的步骤包括:
针对所述各个聚类中的UGC视频分别按照预设规则从视频标题中提取视频集数;
将UGC视频的视频集数确定为该UGC视频的描述信息;
针对所述各个聚类中的UGC视频的视频集数分别进行升序排序或降序排序。
优选地,所述视频元数据包括视频时长;在所述对所述多个UGC视频进行聚类的步骤之后,还包括:
针对所述各个聚类中的UGC视频分别获取视频时长;
当某个UGC视频的视频时长位于预设的时长区间之外时,将该UGC视频从其所属的聚类中删除。
优选地,所述方法还包括:
采用所述视频ID和对应的视频元数据创建第三级索引表。
根据本发明的另一方面,还公开了一种视频的推荐方法,其特征在于,包括:
接收客户端发送的用户生成内容UGC视频播放请求,所述播放请求包括目标UGC视频ID;
在预先创建的第一级索引表中查找所述目标UGC视频ID对应的视频聚类ID;所述第一级索引表包括视频ID和对应的视频聚类ID;
在预先创建的第二级索引表中查找所述视频聚类ID对应的UGC视频推荐列表,作为目标UGC视频推荐列表;所述第二级索引表包括视频聚类ID和对应的UGC视频推荐列表;其中,所述视频聚类ID用于表征UGC视频的聚类,所述UGC视频推荐列表由各个聚类中的UGC视频排序后的描述信息生成;
将所述目标UGC视频推荐列表下发至所述客户端。
优选地,所述UGC视频的描述信息为视频集数;
在所述将所述目标UGC视频推荐列表下发至所述客户端的步骤之前,还包括:
在预先创建的第三级索引表中查找所述目标UGC视频ID对应的视频元数据;所述第三级索引表包括视频ID和对应的视频元数据,所述视频元数据包括视频标题;
按照预设规则从所述视频标题中提取视频集数;
从所述目标UGC视频推荐列表中截取所述视频集数之前或之后的部分UGC视频推荐列表;
所述将所述目标UGC视频推荐列表下发至所述客户端的步骤包括:将所述部分UGC视频推荐列表下发至所述客户端。
优选地,所述排序为升序排序或降序排序;所述从所述目标UGC视频推荐列表中截取所述视频集数之前或之后的部分UGC视频推荐列表的步骤包括:
如果所述排序为升序排序,则从所述目标UGC视频推荐列表中截取所述视频集数之后的部分UGC视频推荐列表;
如果所述排序为降序排序,则从所述目标UGC视频推荐列表中截取所述视频集数之前的部分UGC视频推荐列表。
根据本发明的另一方面,还公开了一种视频索引表的创建装置,其特征在于,包括:
视频获取模块,用于获取客户端上传的多个用户生成内容UGC视频及各个UGC视频的视频ID;
聚类模块,用于对所述多个UGC视频进行聚类,并针对各个聚类分配视频聚类ID;
排序模块,用于针对所述各个聚类中的UGC视频分别生成描述信息,并对所述描述信息进行排序;
生成模块,用于采用所述排序后的描述信息生成UGC视频推荐列表;
第一创建模块,用于采用所述视频ID和对应的视频聚类ID创建第一级索引表;
第二创建模块,用于采用所述视频聚类ID和对应的UGC视频推荐列表创建第二级索引表。
优选地,所述装置还包括:
抽取模块,用于在所述视频获取模块获取客户端上传的多个UGC视频及各个UGC视频的视频ID之后,分别抽取各个UGC视频的视频元数据。
优选地,所述聚类模块包括:
计算子模块,用于分别对每两个UGC视频的视频元数据进行相似度计算;
聚类确定子模块,用于将相似度位于预设的相似度区间之内的视频元数据对应的UGC视频确定为属于同一个聚类。
优选地,所述排序模块包括:
提取子模块,用于针对所述各个聚类中的UGC视频分别按照预设规则从视频标题中提取视频集数;
信息确定子模块,用于将UGC视频的视频集数确定为该UGC视频的描述信息;
排序子模块,用于针对所述各个聚类中的UGC视频的视频集数分别进行升序排序或降序排序。
优选地,所述视频元数据包括视频时长;所述装置还包括:
时长获取模块,用于在所述聚类模块对所述多个UGC视频进行聚类之后,针对所述各个聚类中的UGC视频分别获取视频时长;
视频删除模块,用于当某个UGC视频的视频时长位于预设的时长区间之外时,将该UGC视频从其所属的聚类中删除。
优选地,所述装置还包括:
第三创建模块,用于采用所述视频ID和对应的视频元数据创建第三级索引表。
根据本发明的另一方面,还公开了一种视频的推荐装置,其特征在于,包括:
接收模块,用于接收客户端发送的用户生成内容UGC视频播放请求,所述播放请求包括目标UGC视频ID;
第一查找模块,用于在预先创建的第一级索引表中查找所述目标UGC视频ID对应的视频聚类ID;所述第一级索引表包括视频ID和对应的视频聚类ID;
第二查找模块,用于在预先创建的第二级索引表中查找所述视频聚类ID对应的UGC视频推荐列表,作为目标UGC视频推荐列表;所述第二级索引表包括视频聚类ID和对应的UGC视频推荐列表;其中,所述视频聚类ID用于表征UGC视频的聚类,所述UGC视频推荐列表由各个聚类中的UGC视频排序后的描述信息生成;
下发模块,用于将所述目标UGC视频推荐列表下发至所述客户端。
优选地,所述UGC视频的描述信息为视频集数;所述装置还包括:
第三查找模块,用于在所述下发模块将所述目标UGC视频推荐列表下发至所述客户端之前,在预先创建的第三级索引表中查找所述目标UGC视频ID对应的视频元数据;所述第三级索引表包括视频ID和对应的视频元数据,所述视频元数据包括视频标题;
提取模块,用于按照预设规则从所述视频标题中提取视频集数;
截取模块,用于从所述目标UGC视频推荐列表中截取所述视频集数之前或之后的部分UGC视频推荐列表;
所述下发模块,具体用于将所述部分UGC视频推荐列表下发至所述客户端。
优选地,所述排序为升序排序或降序排序;所述截取模块包括:
第一截取子模块,用于在所述排序为升序排序时,从所述目标UGC视频推荐列表中截取所述视频集数之后的部分UGC视频推荐列表;
第二截取子模块,用于在所述排序为降序排序时,从所述目标UGC视频推荐列表中截取所述视频集数之前的部分UGC视频推荐列表。
与现有技术相比,本发明包括以下优点:
本发明中首先可以对客户端上传的多个UGC视频进行聚类,并针对各个聚类分配视频聚类ID;然后针对各个聚类中的UGC视频分别生成描述信息,并对描述信息进行排序,采用排序后的描述信息生成UGC视频推荐列表;最后采用UGC视频的视频ID和对应的视频聚类ID创建第一级索引表,以及,采用视频聚类ID和对应的UGC视频推荐列表创建第二级索引表。在接收到UGC视频播放请求后,即可在第一级索引表和第二级索引表中查找到目标UGC视频ID对应的目标UGC视频推荐列表,并将其下发至客户端。由于视频推荐列表中包括了进行聚类之后的UGC视频的描述信息,因此这些描述信息更加全面,解决了缺少某些集数的问题;并且对这些描述信息进行了排序,因此解决了顺序混乱的问题。
附图说明
图1是本发明实施例一的一种视频索引表的创建方法的流程图;
图2是本发明实施例一的一种视频的推荐方法的流程图;
图3是本发明实施例二的一种视频索引表的创建方法的流程图;
图4是本发明实施例二的一种视频的推荐方法的流程图;
图5是本发明实施例三的一种视频索引表的创建装置的结构框图;
图6是本发明实施例三的一种视频的推荐装置的结构框图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
用户在视频分享网站观看某个UGC视频时,该网站可以向用户推荐一些与当前观看的UGC视频相关的视频。但是,目前的视频推荐技术所推荐的视频顺序混乱,并且可能会缺少某些视频,甚至所推荐的视频与当前观看的视频不属于同一个类别,导致需要繁琐地进行搜索定位过程,无形中增加用户的流失率。针对上述问题,本发明提出了一种视频索引表的创建方法和装置,以及一种视频的推荐方法和装置,从而保证推荐给用户的视频更加全面、有序,提高用户体验。
下面,通过以下各个实施例对视频索引表的创建方法和装置,以及视频的推荐方法和装置分别进行详细介绍。
实施例一:
参照图1,示出了本发明实施例一的一种视频索引表的创建方法的流程图,该方法具体可以包括以下步骤:
步骤101,获取客户端上传的多个UGC视频及各个UGC视频的视频ID。
UGC视频是指用户自己生成的,并且通过互联网技术上传到各大视频分享网站的视频内容。UGC视频具有海量的特征,用户可以通过在视频分享网站中搜索观看自己或其他用户上传的UGC视频。在用户通过客户端上传UGC视频后,服务器即可保存这些UGC视频,并且,每个UGC视频还具有一个唯一的视频标识(ID)。本发明实施例中,可以对服务器中保存的UGC视频进行整合,从而为视频推荐过程提供条件,首先可以获取客户端上传的多个UGC视频及各个UGC视频的视频ID。
步骤102,对所述多个UGC视频进行聚类,并针对各个聚类分配视频聚类ID。
在获取到客户端上传的多个UGC视频之后,即可对所述多个UGC视频进行聚类,因此即可生成至少一个聚类,每个聚类里都包括有属于同一类别的至少一个UGC视频,然后还可以针对各个聚类分配视频聚类ID,以标识各个聚类。
步骤103,针对所述各个聚类中的UGC视频分别生成描述信息,并对所述描述信息进行排序。
在生成上述至少一个聚类之后,还可以进一步针对各个聚类中的UGC视频分别生成描述信息,所述描述信息用于描述对应的UGC视频的特征,根据该描述信息可以将某个UGC视频与其他的UGC视频进行区分。
步骤104,采用所述排序后的描述信息生成UGC视频推荐列表。
针对所述各个聚类中的UGC视频分别生成描述信息之后,可以对所述描述信息进行排序,排序后的描述信息即可表征对应的UGC视频的顺序,然后即可采用所述排序后的描述信息生成UGC视频推荐列表。即针对一个聚类,可以将其中的UGC视频的描述信息进行排序,并生成一个对应的UGC视频推荐列表。
所述UGC推荐视频列表由进行聚类之后的UGC视频的描述信息生成,因此所包括的UGC视频更加全面,并且对描述信息进行了排序,因此生成的即为有序UGC推荐视频列表。
步骤105,采用所述视频ID和对应的视频聚类ID创建第一级索引表,以及,采用所述视频聚类ID和对应的UGC视频推荐列表创建第二级索引表。
根据上述各个步骤,将UGC视频进行聚类,每个聚类中可以包括至少一个UGC视频,每个UGC视频都具有一个视频ID,每个聚类被分配一个视频聚类ID。因此,可以采用所述视频ID和对应的视频聚类ID创建第一级索引表,一个视频ID可以对应一个视频聚类ID,该视频聚类ID即为该视频ID对应的UGC视频所属聚类的视频聚类ID;一个视频聚类ID可以对应一个或多个视频ID,该视频ID即为该视频聚类ID对应的聚类中的UGC视频的视频ID。
针对每个聚类,还将其中的UGC视频的描述信息进行排序,并采用排序后的描述信息生成UGC视频推荐列表。因此,可以采用所述视频聚类ID和对应的UGC视频推荐列表创建第二级索引表,一个视频聚类ID可以对应一个UGC视频推荐列表,该UGC视频推荐列表即为该视频聚类ID对应的聚类中的UGC视频的描述信息生成的UGC视频推荐列表。
在生成上述UGC视频推荐列表,并创建第一级索引表和第二级索引表之后,即可在进行UGC视频推荐时,根据第一级索引表和第二级索引表查找对应的UGC视频推荐列表,并显示给用户。
下面,介绍根据上述图1所示的视频索引表的创建方法所创建的视频索引表进行视频推荐的方法。
参照图2,示出了本发明实施例一的一种视频的推荐方法的流程图,该方法具体可以包括以下步骤:
步骤201,接收客户端发送的UGC视频播放请求,所述播放请求包括目标UGC视频ID。
用户在访问视频分享网站时,可以请求播放该视频分享网站的服务器中所保存的UGC视频,此时可以通过该视频分享网站的客户端向服务器发送UGC视频播放请求,该播放请求中可以包括用户想要播放的目标UGC视频的视频ID,即目标UGC视频ID。
步骤202,在预先创建的第一级索引表中查找所述目标UGC视频ID对应的视频聚类ID。
在接收到上述UGC视频播放请求后,即可在预先创建的第一级索引表中查找播放请求中所包括的目标UGC视频ID对应的视频聚类ID。所述第一级索引表即可以为上述图1所示的视频索引表的创建方法中所创建的第一级索引表,该第一级索引表可以包括视频ID和对应的视频聚类ID,因此,根据所述目标UGC视频ID即可查找到其对应的视频聚类ID。
步骤203,在预先创建的第二级索引表中查找所述视频聚类ID对应的UGC视频推荐列表,作为目标UGC视频推荐列表。
在查找到所述目标UGC视频ID对应的视频聚类ID后,还可以在预先创建的第二级索引表中查找所述视频聚类ID对应的UGC视频推荐列表。所述第一级索引表即可以为上述图1所示的视频索引表的创建方法中所创建的第二级索引表,该第二级索引表可以包括视频聚类ID和对应的UGC视频推荐列表;其中,所述视频聚类ID用于表征UGC视频的聚类,所述UGC视频推荐列表由各个聚类中的UGC视频排序后的描述信息生成。因此,根据所述视频聚类ID即可查找到其对应的UGC视频推荐列表,所查找到的UGC视频推荐列表即为所述目标UGC视频ID对应的UGC视频推荐列表,因此作为目标UGC视频推荐列表。
步骤204,将所述目标UGC视频推荐列表下发至所述客户端。
查找到目标UGC视频推荐列表后,即可将该目标UGC视频推荐列表下发至所述客户端,因此在客户端的显示界面上即可显示该目标UGC视频推荐列表,用户可以根据该目标UGC视频推荐列表播放相应的推荐视频。
本发明实施例中的视频推荐列表中包括了进行聚类之后的UGC视频的描述信息,因此这些描述信息更加全面,解决了缺少某些集数的问题;并且对这些描述信息进行了排序,因此解决了顺序混乱的问题。
下面,通过实施例二具体描述一种视频索引表的创建方法和一种视频的推荐方法。
实施例二:
参照图3,示出了本发明实施例二的一种视频索引表的创建方法的流程图,该方法具体可以包括以下步骤:
步骤301,获取客户端上传的多个UGC视频及各个UGC视频的视频ID。
用户通过客户端将UGC视频上传至服务器中,服务器可以对这些UGC视频进行保存,其中,每个UGC视频都对应有一个视频ID。首先,服务器可以获取其所保存的UGC视频及各个UGC视频的视频ID,然后对其进行相关处理,以生成对应的视频索引表。
步骤302,分别抽取各个UGC视频的视频元数据。
在获取到上述多个UGC视频后,分别抽取各个UGC视频的视频元数据,然后根据这些视频元数据可以对所述多个UGC视频进行聚类。
步骤303,对所述多个UGC视频进行聚类,并针对各个聚类分配视频聚类ID。
本发明实施例中,所述视频元数据可以包括视频标题、视频时长、视频上传者、视频类型等信息,可以根据这些视频元数据对所述多个UGC视频进行聚类,从而将属于同一类别的UGC视频聚集在一起。例如,如果UGC视频为电视剧类的UGC视频,则可以将同一部电视剧的各集聚集在一起;如果UGC视频为综艺节目类的UGC视频,则可以将同一个综艺节目的各期节目聚集在一起,等等。
由于对于某些UGC视频,仅通过其视频标题、视频时长、视频上传者、视频类型这些信息无法准确地进行聚类。例如,对于电视剧类的UGC视频,同一个标题的电视剧可能包括多个版本,如对于标题为“射雕英雄传”的这一电视剧而言,其可能包括83版、94版、03版、08版等多个版本,如果仅通过上述视频标题等信息无法将同一版本的“射雕英雄传”电视剧的各集准确地聚集在一起。因此,本发明实施例中,所述视频元数据还可以包括视频导演、视频演员等信息,不同版本的电视剧的视频导演、视频演员是不同的,因此根据这些视频信息即可唯一标识某一版本的电视剧,从而提高视频聚类的准确性。
在本发明的一种优选实施例中,该步骤303具体可以包括以下子步骤:
子步骤a1,分别对每两个UGC视频的视频元数据进行相似度计算;
子步骤a2,将相似度位于预设的相似度区间之内的视频元数据对应的UGC视频确定为属于同一个聚类。
分别对每两个UGC视频的视频元数据进行相似度计算,如果相似度位于预设的相似度区间之内,则可以说明对应的两个UGC视频属于同一个聚类。对于所述相似度区间的设置,要保证属于同一个聚类的UGC视频的视频元数据的相似度既不能太小,也不能太大,如果太大,则说明两个UGC视频的相关信息差别很大,不属于同一个类别,如果太小,则说明两个UGC视频的相关信息差别很小,其可能属于相同的UGC视频。本领域技术人员可以根据实际经验设置相似度区间的对应数值,本发明实施例对具体的数值并不加以限制。
在本发明的一种优选实施例中,在判断出两个UGC视频的视频元数据的相似度位于预设的相似度区间之外,并且小于该区间的较小边界值时,例如相似度区间为[a,b],当判断出相似度小于边界值a时,由于该种情况下这两个UGC视频可以认为是相同的UGC视频,因此还可以进一步删除属于相同的UGC视频中的一个,从而避免视频重复,占用视频资源的问题。
本发明实施例中,上述子步骤a1可以包括以下子步骤:
子步骤a11,将每个所述UGC视频的元数据转换成一个对应的向量;
子步骤a12,分别根据对应的向量对每两个UGC视频的视频元数据进行相似度计算。
本发明实施例中,子步骤a12可以通过计算两个向量的欧氏距离、曼哈顿距离、夹角余弦值等方法对每两个UGC视频的视频元数据进行相似度计算。例如,可以计算每两个向量之间的欧氏距离,当所述欧氏距离位于预设的第一距离区间之内时,确定该两个向量对应的视频元数据的相似度位于预设的相似度区间之内;还可以计算每两个向量之间的曼哈顿距离,当所述曼哈顿距离位于预设的第二距离区间之内时,确定该两个向量对应的视频元数据的相似度位于预设的相似度区间之内;还可以计算每两个向量的夹角的余弦值,当所述夹角的余弦值位于预设的余弦值区间之内时,确定该两个向量对应的视频元数据的相似度位于预设的相似度区间之内。对于其中第一距离区间、第二距离区间和余弦值区间的具体数值,被利用技术人员根据实际经验进行相关设定即可,本发明实施例对具体的数值并不加以限制。
欧氏距离是最易于理解的一种距离计算方法,源自欧氏空间中两点间的距离公式。两个n维向量a(x11,x12,…,x1n)与b(x21,x22,…,x2n)间的欧氏距离为:也可以用表示成向量运算的形式: d 12 = ( a - b ) ( a - b ) T .
曼哈顿距离也称为城市街区距离。两个n维向量a(x11,x12,…,x1n)与b(x21,x22,…,x2n)间的曼哈顿距离为:
几何中夹角余弦可用来衡量两个向量方向的差异,机器学习中借用这一概念来衡量样本向量之间的差异。对于两个n维向量a(x11,x12,…,x1n)与b(x21,x22,…,x2n),可以使用类似于夹角余弦的概念来衡量它们间的相似程度: cos ( θ ) = a · b | a | | b | , cos ( θ ) = Σ k = 1 n x 1 k x 2 k Σ k = 1 n x 1 k 2 Σ k = 1 n x 2 k 2 . 夹角余弦取值范围为[-1,1]。夹角余弦越大表示两个向量的夹角越小,夹角余弦越小表示两向量的夹角越大,当两个向量的方向重合时夹角余弦取最大值1,当两个向量的方向完全相反夹角余弦取最小值-1。
经过上述过程,可以将属于同一类别的UGC视频聚集在一起,因此处理之后即可生成多个聚类,然后针对每个聚类可以分配一个视频聚类ID,以唯一标识一个聚类。
步骤304,针对所述各个聚类中的UGC视频分别获取视频时长,当某个UGC视频的视频时长位于预设的时长区间之外时,将该UGC视频从其所属的聚类中删除。
在本发明的一种优选实施例中,在获取到各个聚类之后,还可以针对所述各个聚类中的UGC视频进行去噪声处理。首先分别获取视频时长,并且判断视频时长是否位于预设的时长区间之内,例如,对于某一部电视剧“神探狄仁杰”的聚类,其中的每一集(即每个UGC视频)的时长都在40分钟左右,因此此时可以设置时长区间为(35,45),如果某一个UGC视频的时长位于该区间之外,则该UGC视频可能并不是该电视剧中的某一集,例如某个UGC视频的时长为10分钟,则该UGC视频可能为片花,此时则可以将该UGC视频删除。因此,当某个UGC视频的视频时长位于预设的时长区间之外时,可以将该UGC视频从其所属的聚类中删除,从而进一步提高各个聚类中UGC视频的准确性。
步骤305,针对所述各个聚类中的UGC视频分别生成描述信息,并对所述描述信息进行排序。
在对各个聚类进行上述处理之后,则可以针对所述各个聚类中的UGC视频分别生成描述信息,并对所述描述信息进行排序,以生成该聚类对应的UGC视频推荐列表。
在本发明的一种优选实施例中,该步骤305可以包括以下子步骤:
子步骤b1,针对所述各个聚类中的UGC视频分别按照预设规则从视频标题中提取视频集数;
子步骤b2,将UGC视频的视频集数确定为该UGC视频的描述信息;
子步骤b3,针对所述各个聚类中的UGC视频的视频集数分别进行升序排序或降序排序。
在本发明的一种优选实施例中,所述视频标题中可以包括视频名称和视频集数,可以根据预先建立的有序模式库从视频标题中提取视频集数。模式是指能够将视频标题进行切割的一套准则,一般是根据数据分析来形成的,并且不断添加和维护。根据数据分析,大部分的剧集类视频会有如“xxx第yy集”、或者“xxxyy”的命名方式,“xxx”为文字,“yy”为数字或日期,因此可以将其中的“xxx”认定为视频名称,将其中的“yy”认定为视频集数。因此,本发明实施例中可以根据该方式从视频标题中提取数字或日期“yy”,即作为视频集数。
在视频标题中提取出视频集数之后,即可将该视频集数确定为对应UGC视频的描述信息,该描述信息既能够将该UGC视频与其所属聚类中的其他UGC视频进行区分,还可以表征UGC视频的对应顺序。因此,还可以针对所述各个聚类中的UGC视频的视频集数分别进行升序排序或降序排序。
本发明实施例中,可以根据聚类中UGC视频的视频类型确定是进行升序排序还是降序排序。例如,如果某个聚类中的UGC视频为电视剧类,则对该聚类中的UGC视频的视频集数进行升序排序,例如排序后的描述信息为第1集、第2集、第3集……。如果某个聚类中的UGC视频为综艺节目类,则对该聚类中的UGC视频的视频集数进行降序排序,例如排序后的描述信息为2013年10月、2013年9月、2013年8月……。当然,对于电视剧类的UGC视频的视频集数也可以进行降序排序,对于综艺节目类UGC视频的视频集数也可以进行升序排序,本发明实施例对此并不加以限制。
步骤306,采用所述排序后的描述信息生成UGC视频推荐列表。
在针对各个聚类中的UGC视频的描述信息进行排序之后,即可采用所述排序后的描述信息生成该剧类对应的UGC视频推荐列表。UGC视频推荐列表可以被展示给用户,用户根据该UGC视频推荐列表可以选择其中的视频进行播放。
步骤307,采用所述视频ID和对应的视频聚类ID创建第一级索引表,采用所述视频聚类ID和对应的UGC视频推荐列表创建第二级索引表,采用所述视频ID和对应的视频元数据创建第三级索引表。
将UGC视频进行聚类,每个聚类中可以包括至少一个UGC视频,每个UGC视频都具有一个视频ID,每个聚类被分配一个视频聚类ID,因此,可以采用所述视频ID和对应的视频聚类ID创建第一级索引表。一个视频ID可以对应一个视频聚类ID,一个视频聚类ID可以对应一个或多个视频ID。
针对每个聚类,还将其中的UGC视频的描述信息进行排序,并采用排序后的描述信息生成UGC视频推荐列表,因此,可以采用所述视频聚类ID和对应的UGC视频推荐列表创建第二级索引表。一个视频聚类ID可以对应一个UGC视频推荐列表。
每个UGC视频都具有一个视频ID,每个UGC视频还具有对应的视频元数据,因此,可以采用所述视频ID和对应的视频元数据创建第三级索引表。一个视频ID可以对应一个视频元数据。
在创建第一级索引表、第二级索引表和第三级索引表之后,即可在进行UGC视频推荐时,根据第一级索引表第二级索引表和第三级索引表查找对应的UGC视频推荐列表,并显示给用户。
下面,介绍根据上述图3所示的视频索引表的创建方法所创建的视频索引表进行视频推荐的方法。
参照图4,示出了本发明实施例二的一种视频的推荐方法的流程图,其中的第一级索引表、第二级索引表和第三级索引表可以为通过上述图1或图3所示的方法所建立的索引表,UGC视频推荐列表可以为通过上述图1或图3所示的方法所生成的视频推荐列表。该方法具体可以包括以下步骤:
步骤401,接收客户端发送的UGC视频播放请求,所述播放请求包括目标UGC视频ID。
用户在访问视频分享网站时,可以请求播放该视频分享网站的服务器中所保存的UGC视频,所请求的UGC视频可以为当前用户自己上传的视频,也可以为其他用户上传的视频。例如,用户可以在视频分享网站界面中的搜索框内输入目标UGC视频的名称,并点击搜索,此时则可以发送UGC视频播放请求至服务器,该播放请求中可以包括目标UGC视频ID。
步骤402,在预先创建的第一级索引表中查找所述目标UGC视频ID对应的视频聚类ID。
由于第一级索引表中包括视频ID和对应的视频聚类ID,因此在接收到上述UGC视频播放请求后,即可在预先创建的第一级索引表中查找播放请求中所包括的目标UGC视频ID对应的视频聚类ID。
步骤403,在预先创建的第二级索引表中查找所述视频聚类ID对应的UGC视频推荐列表,作为目标UGC视频推荐列表。
由于第二级索引表中包括视频聚类ID和对应的UGC视频推荐列表,因此在查找到所述目标UGC视频ID对应的视频聚类ID后,还可以在预先创建的第二级索引表中查找所述视频聚类ID对应的UGC视频推荐列表。
步骤404,在预先创建的第三级索引表中查找所述目标UGC视频ID对应的视频元数据。
在本发明的一种优选实施例中,还可以进一步在预先创建的第三级索引表中查找所述目标UGC视频ID对应的视频元数据。所述第三级索引表中包括视频ID和对应的视频元数据。
步骤405,按照预设规则从所述视频标题中提取视频集数;从所述目标UGC视频推荐列表中截取所述视频集数之前或之后的部分UGC视频推荐列表。
所述视频元数据中可以包括视频标题,在查找到目标UGC视频ID对应的视频元数据后,按照预设规则从该视频标题中提取视频集数,该视频集数即为用户所请求的目标UGC视频的视频集数。本发明实施例中,为了进一步降低对于推荐位的占用率,节省推荐位资源,还可以从所述目标UGC视频推荐列表中截取所述视频集数之前或之后的部分UGC视频推荐列表。
所述从所述目标UGC视频推荐列表中截取所述视频集数之前或之后的部分UGC视频推荐列表的步骤可以包括:如果所述排序为升序排序,则从所述目标UGC视频推荐列表中截取所述视频集数之后的部分UGC视频推荐列表;如果所述排序为降序排序,则从所述目标UGC视频推荐列表中截取所述视频集数之前的部分UGC视频推荐列表。
上述截取方式只是根据用户的观看习惯设置的截取方式,例如,如果用户当前请求的为某一个电视剧的第4集,则该用户后续可能会观看第4集之后的剧集,而对于电视剧类的视频对应的UGC视频推荐列表通常会进行升序排序,因此即可截取第4集之后的部分UGC视频推荐列表;如果用户当前请求的为某一个综艺节目的2013年4月这一期,则该用户后续可能会观看2013年4月这一期之后的剧集,而对于综艺节目类的视频对应的UGC视频推荐列表通常会进行降序排序,因此即可截取2013年4月之前的部分UGC视频推荐列表。
当然,本发明实施例中,在排序为升序排序时,也可以从所述目标UGC视频推荐列表中截取所述视频集数之前的部分UGC视频推荐列表;在排序为降序排序时,也可以从所述目标UGC视频推荐列表中截取所述视频集数之后的部分UGC视频推荐列表,本领域技术人员根据实际经验进行相关处理即可,本发明实施例对此并不加以限制。
步骤406,将所述部分UGC视频推荐列表下发至所述客户端。
在截取到上述部分UGC视频推荐列表之后,即可仅将该部分UGC视频推荐列表下发至所述客户端,从而降低客户端上推荐位的占用率,节省推荐位资源。当然,为了将全面的UGC视频推荐给用户,也可以将所查找到的整个目标UGC视频推荐列表下发至所述客户端,本发明实施例对此并不加以限制。
客户端在接收到UGC视频推荐列表之后,即可选择UGC视频推荐列表中的UGC视频进行播放,每个UGC视频还对应一个播放地址,客户端按照该播放地址进行播放即可,对于具体的播放过程,本发明实施例不再详细论述。
本发明实施例改变了原本在互联网中无序的信息组织形式,将海量信息尽可能结构化、有序化,最终自然的展现给用户,减少用户交互,增强用户体验,对于视频网站而言,可以有效的减少因为内容缺失、无序等缺陷而导致的用户流失。
对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
实施例三:
参照图5,示出了本发明实施例三的一种视频索引表的创建装置的结构框图,该装置具体可以包括以下模块:
视频获取模块501,用于获取客户端上传的多个用户生成内容UGC视频及各个UGC视频的视频ID;
聚类模块502,用于对所述多个UGC视频进行聚类,并针对各个聚类分配视频聚类ID;
排序模块503,用于针对所述各个聚类中的UGC视频分别生成描述信息,并对所述描述信息进行排序;
生成模块504,用于采用所述排序后的描述信息生成UGC视频推荐列表;
第一创建模块505,用于采用所述视频ID和对应的视频聚类ID创建第一级索引表;
第二创建模块506,用于采用所述视频聚类ID和对应的UGC视频推荐列表创建第二级索引表。
在本发明的一种优选实施例中,所述装置还可以包括以下模块:
抽取模块,用于在所述视频获取模块获取客户端上传的多个UGC视频及各个UGC视频的视频ID之后,分别抽取各个UGC视频的视频元数据;
所述视频元数据可以包括视频标题、视频时长、视频上传者、视频类型、视频导演、视频演员等信息。
时长获取模块,用于在所述聚类模块对所述多个UGC视频进行聚类之后,针对所述各个聚类中的UGC视频分别获取视频时长;
视频删除模块,用于当某个UGC视频的视频时长位于预设的时长区间之外时,将该UGC视频从其所属的聚类中删除;
第三创建模块,用于采用所述视频ID和对应的视频元数据创建第三级索引表。
在本发明的一种优选实施例中,所述聚类模块可以包括以下子模块:
计算子模块,用于分别对每两个UGC视频的视频元数据进行相似度计算;
聚类确定子模块,用于将相似度位于预设的相似度区间之内的视频元数据对应的UGC视频确定为属于同一个聚类。
所述排序模块可以包括以下子模块:
提取子模块,用于针对所述各个聚类中的UGC视频分别按照预设规则从视频标题中提取视频集数;
信息确定子模块,用于将UGC视频的视频集数确定为该UGC视频的描述信息;
排序子模块,用于针对所述各个聚类中的UGC视频的视频集数分别进行升序排序或降序排序。
本发明实施例中,还可以根据上述创建的第一级索引表、第二级索引表和第三级索引表,进行UGC视频推荐。参照图6,示出了本发明实施例三的一种视频的推荐装置的结构框图,该装置具体可以包括以下模块:
接收模块601,用于接收客户端发送的用户生成内容UGC视频播放请求,所述播放请求包括目标UGC视频ID;
第一查找模块602,用于在预先创建的第一级索引表中查找所述目标UGC视频ID对应的视频聚类ID;所述第一级索引表包括视频ID和对应的视频聚类ID;
第二查找模块603,用于在预先创建的第二级索引表中查找所述视频聚类ID对应的UGC视频推荐列表,作为目标UGC视频推荐列表;所述第二级索引表包括视频聚类ID和对应的UGC视频推荐列表;其中,所述视频聚类ID用于表征UGC视频的聚类,所述UGC视频推荐列表由各个聚类中的UGC视频排序后的描述信息生成;所述UGC视频的描述信息为视频集数;
下发模块604,用于将所述目标UGC视频推荐列表下发至所述客户端。
在本发明的一种优选实施例中,所述装置还可以包括以下模块:
第三查找模块,用于在所述下发模块将所述目标UGC视频推荐列表下发至所述客户端之前,在预先创建的第三级索引表中查找所述目标UGC视频ID对应的视频元数据;所述第三级索引表包括视频ID和对应的视频元数据,所述视频元数据包括视频标题;
提取模块,用于按照预设规则从所述视频标题中提取视频集数;
截取模块,用于从所述目标UGC视频推荐列表中截取所述视频集数之前或之后的部分UGC视频推荐列表;
所述下发模块,具体用于将所述部分UGC视频推荐列表下发至所述客户端。
本发明实施例中,所述排序可以为升序排序或降序排序;所述截取模块可以包括以下子模块:
第一截取子模块,用于在所述排序为升序排序时,从所述目标UGC视频推荐列表中截取所述视频集数之后的部分UGC视频推荐列表;
第二截取子模块,用于在所述排序为降序排序时,从所述目标UGC视频推荐列表中截取所述视频集数之前的部分UGC视频推荐列表。
本发明实施例中首先可以对客户端上传的多个UGC视频进行聚类,并针对各个聚类分配视频聚类ID;然后针对各个聚类中的UGC视频分别生成描述信息,并对描述信息进行排序,采用排序后的描述信息生成UGC视频推荐列表;最后采用UGC视频的视频ID和对应的视频聚类ID创建第一级索引表,以及,采用视频聚类ID和对应的UGC视频推荐列表创建第二级索引表。在接收到UGC视频播放请求后,即可在第一级索引表和第二级索引表中查找到目标UGC视频ID对应的目标UGC视频推荐列表,并将其下发至客户端。由于视频推荐列表中包括了进行聚类之后的UGC视频的描述信息,因此这些描述信息更加全面,解决了缺少某些集数的问题;并且对这些描述信息进行了排序,因此解决了顺序混乱的问题。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本发明,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上对本发明所提供的一种视频索引表的创建方法和装置,以及一种视频的推荐方法和装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (18)

1.一种视频索引表的创建方法,其特征在于,包括:
获取客户端上传的多个用户生成内容UGC视频及各个UGC视频的视频ID;
对所述多个UGC视频进行聚类,并针对各个聚类分配视频聚类ID;
针对所述各个聚类中的UGC视频分别生成描述信息,并对所述描述信息进行排序;
采用所述排序后的描述信息生成UGC视频推荐列表;
采用所述视频ID和对应的视频聚类ID创建第一级索引表,以及,采用所述视频聚类ID和对应的UGC视频推荐列表创建第二级索引表。
2.根据权利要求1所述的方法,其特征在于,在所述获取客户端上传的多个UGC视频及各个UGC视频的视频ID的步骤之后,还包括:
分别抽取各个UGC视频的视频元数据。
3.根据权利要求2所述的方法,其特征在于,所述对所述多个UGC视频进行聚类的步骤包括:
分别对每两个UGC视频的视频元数据进行相似度计算;
将相似度位于预设的相似度区间之内的视频元数据对应的UGC视频确定为属于同一个聚类。
4.根据权利要求2所述的方法,其特征在于,所述视频元数据包括视频标题;所述针对所述各个聚类中的UGC视频分别生成描述信息,并对所述描述信息进行排序的步骤包括:
针对所述各个聚类中的UGC视频分别按照预设规则从视频标题中提取视频集数;
将UGC视频的视频集数确定为该UGC视频的描述信息;
针对所述各个聚类中的UGC视频的视频集数分别进行升序排序或降序排序。
5.根据权利要求2所述的方法,其特征在于,所述视频元数据包括视频时长;在所述对所述多个UGC视频进行聚类的步骤之后,还包括:
针对所述各个聚类中的UGC视频分别获取视频时长;
当某个UGC视频的视频时长位于预设的时长区间之外时,将该UGC视频从其所属的聚类中删除。
6.根据权利要求2所述的方法,其特征在于,还包括:
采用所述视频ID和对应的视频元数据创建第三级索引表。
7.一种视频的推荐方法,其特征在于,包括:
接收客户端发送的用户生成内容UGC视频播放请求,所述播放请求包括目标UGC视频ID;
在预先创建的第一级索引表中查找所述目标UGC视频ID对应的视频聚类ID;所述第一级索引表包括视频ID和对应的视频聚类ID;
在预先创建的第二级索引表中查找所述视频聚类ID对应的UGC视频推荐列表,作为目标UGC视频推荐列表;所述第二级索引表包括视频聚类ID和对应的UGC视频推荐列表;其中,所述视频聚类ID用于表征UGC视频的聚类,所述UGC视频推荐列表由各个聚类中的UGC视频排序后的描述信息生成;
将所述目标UGC视频推荐列表下发至所述客户端。
8.根据权利要求7所述的方法,其特征在于,所述UGC视频的描述信息为视频集数;
在所述将所述目标UGC视频推荐列表下发至所述客户端的步骤之前,还包括:
在预先创建的第三级索引表中查找所述目标UGC视频ID对应的视频元数据;所述第三级索引表包括视频ID和对应的视频元数据,所述视频元数据包括视频标题;
按照预设规则从所述视频标题中提取视频集数;
从所述目标UGC视频推荐列表中截取所述视频集数之前或之后的部分UGC视频推荐列表;
所述将所述目标UGC视频推荐列表下发至所述客户端的步骤包括:将所述部分UGC视频推荐列表下发至所述客户端。
9.根据权利要求8所述的方法,其特征在于,所述排序为升序排序或降序排序;所述从所述目标UGC视频推荐列表中截取所述视频集数之前或之后的部分UGC视频推荐列表的步骤包括:
如果所述排序为升序排序,则从所述目标UGC视频推荐列表中截取所述视频集数之后的部分UGC视频推荐列表;
如果所述排序为降序排序,则从所述目标UGC视频推荐列表中截取所述视频集数之前的部分UGC视频推荐列表。
10.一种视频索引表的创建装置,其特征在于,包括:
视频获取模块,用于获取客户端上传的多个用户生成内容UGC视频及各个UGC视频的视频ID;
聚类模块,用于对所述多个UGC视频进行聚类,并针对各个聚类分配视频聚类ID;
排序模块,用于针对所述各个聚类中的UGC视频分别生成描述信息,并对所述描述信息进行排序;
生成模块,用于采用所述排序后的描述信息生成UGC视频推荐列表;
第一创建模块,用于采用所述视频ID和对应的视频聚类ID创建第一级索引表;
第二创建模块,用于采用所述视频聚类ID和对应的UGC视频推荐列表创建第二级索引表。
11.根据权利要求10所述的装置,其特征在于,所述装置还包括:
抽取模块,用于在所述视频获取模块获取客户端上传的多个UGC视频及各个UGC视频的视频ID之后,分别抽取各个UGC视频的视频元数据。
12.根据权利要求11所述的装置,其特征在于,所述聚类模块包括:
计算子模块,用于分别对每两个UGC视频的视频元数据进行相似度计算;
聚类确定子模块,用于将相似度位于预设的相似度区间之内的视频元数据对应的UGC视频确定为属于同一个聚类。
13.根据权利要求11所述的装置,其特征在于,所述排序模块包括:
提取子模块,用于针对所述各个聚类中的UGC视频分别按照预设规则从视频标题中提取视频集数;
信息确定子模块,用于将UGC视频的视频集数确定为该UGC视频的描述信息;
排序子模块,用于针对所述各个聚类中的UGC视频的视频集数分别进行升序排序或降序排序。
14.根据权利要求11所述的装置,其特征在于,所述视频元数据包括视频时长;所述装置还包括:
时长获取模块,用于在所述聚类模块对所述多个UGC视频进行聚类之后,针对所述各个聚类中的UGC视频分别获取视频时长;
视频删除模块,用于当某个UGC视频的视频时长位于预设的时长区间之外时,将该UGC视频从其所属的聚类中删除。
15.根据权利要求11所述的装置,其特征在于,所述装置还包括:
第三创建模块,用于采用所述视频ID和对应的视频元数据创建第三级索引表。
16.一种视频的推荐装置,其特征在于,包括:
接收模块,用于接收客户端发送的用户生成内容UGC视频播放请求,所述播放请求包括目标UGC视频ID;
第一查找模块,用于在预先创建的第一级索引表中查找所述目标UGC视频ID对应的视频聚类ID;所述第一级索引表包括视频ID和对应的视频聚类ID;
第二查找模块,用于在预先创建的第二级索引表中查找所述视频聚类ID对应的UGC视频推荐列表,作为目标UGC视频推荐列表;所述第二级索引表包括视频聚类ID和对应的UGC视频推荐列表;其中,所述视频聚类ID用于表征UGC视频的聚类,所述UGC视频推荐列表由各个聚类中的UGC视频排序后的描述信息生成;
下发模块,用于将所述目标UGC视频推荐列表下发至所述客户端。
17.根据权利要求16所述的装置,其特征在于,所述UGC视频的描述信息为视频集数;所述装置还包括:
第三查找模块,用于在所述下发模块将所述目标UGC视频推荐列表下发至所述客户端之前,在预先创建的第三级索引表中查找所述目标UGC视频ID对应的视频元数据;所述第三级索引表包括视频ID和对应的视频元数据,所述视频元数据包括视频标题;
提取模块,用于按照预设规则从所述视频标题中提取视频集数;
截取模块,用于从所述目标UGC视频推荐列表中截取所述视频集数之前或之后的部分UGC视频推荐列表;
所述下发模块,具体用于将所述部分UGC视频推荐列表下发至所述客户端。
18.根据权利要求17所述的装置,其特征在于,所述排序为升序排序或降序排序;所述截取模块包括:
第一截取子模块,用于在所述排序为升序排序时,从所述目标UGC视频推荐列表中截取所述视频集数之后的部分UGC视频推荐列表;
第二截取子模块,用于在所述排序为降序排序时,从所述目标UGC视频推荐列表中截取所述视频集数之前的部分UGC视频推荐列表。
CN201410193565.6A 2014-05-08 2014-05-08 视频索引表的创建方法和装置,视频的推荐方法和装置 Active CN104008139B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410193565.6A CN104008139B (zh) 2014-05-08 2014-05-08 视频索引表的创建方法和装置,视频的推荐方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410193565.6A CN104008139B (zh) 2014-05-08 2014-05-08 视频索引表的创建方法和装置,视频的推荐方法和装置

Publications (2)

Publication Number Publication Date
CN104008139A true CN104008139A (zh) 2014-08-27
CN104008139B CN104008139B (zh) 2017-09-22

Family

ID=51368796

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410193565.6A Active CN104008139B (zh) 2014-05-08 2014-05-08 视频索引表的创建方法和装置,视频的推荐方法和装置

Country Status (1)

Country Link
CN (1) CN104008139B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104333813A (zh) * 2014-08-28 2015-02-04 无锡天脉聚源传媒科技有限公司 一种视频播放方法、装置及***
CN105373600A (zh) * 2015-10-30 2016-03-02 北京奇艺世纪科技有限公司 视频播单排序方法及装置
CN105786857A (zh) * 2014-12-24 2016-07-20 Tcl集团股份有限公司 一种提高视频聚合效率的方法及***
CN106649740A (zh) * 2016-12-23 2017-05-10 北京奇虎科技有限公司 基于搜索的3c类ugc数据的推荐方法及装置
CN108205557A (zh) * 2016-12-19 2018-06-26 顺丰科技有限公司 检索终端、服务端以及信息通讯检索方法和***
WO2018113673A1 (zh) * 2016-12-23 2018-06-28 北京奇虎科技有限公司 针对综艺类query的搜索结果的推送方法及装置
CN109388729A (zh) * 2017-08-14 2019-02-26 阿里巴巴集团控股有限公司 音频子指纹的检索方法、装置以及音频查询***
CN110020145A (zh) * 2017-11-23 2019-07-16 北京搜狗科技发展有限公司 一种信息推荐方法及装置
CN110633379A (zh) * 2019-08-29 2019-12-31 北京睿企信息科技有限公司 一种基于gpu并行运算的以图搜图***及方法
CN111294636A (zh) * 2020-01-21 2020-06-16 北京字节跳动网络技术有限公司 视频数据的调整方法、装置、电子设备及计算机可读介质
WO2021175040A1 (zh) * 2020-03-02 2021-09-10 Oppo广东移动通信有限公司 视频处理方法及相关装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080244681A1 (en) * 2007-03-30 2008-10-02 Gossweiler Richard C Conversion of Portable Program Modules for Constrained Displays
US20090019149A1 (en) * 2005-08-02 2009-01-15 Mobixell Networks Content distribution and tracking
CN103186550A (zh) * 2011-12-27 2013-07-03 盛乐信息技术(上海)有限公司 一种视频的相关视频列表的生成方法及***

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090019149A1 (en) * 2005-08-02 2009-01-15 Mobixell Networks Content distribution and tracking
US20080244681A1 (en) * 2007-03-30 2008-10-02 Gossweiler Richard C Conversion of Portable Program Modules for Constrained Displays
CN103186550A (zh) * 2011-12-27 2013-07-03 盛乐信息技术(上海)有限公司 一种视频的相关视频列表的生成方法及***

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104333813A (zh) * 2014-08-28 2015-02-04 无锡天脉聚源传媒科技有限公司 一种视频播放方法、装置及***
CN105786857B (zh) * 2014-12-24 2019-12-10 Tcl集团股份有限公司 一种提高视频聚合效率的方法及***
CN105786857A (zh) * 2014-12-24 2016-07-20 Tcl集团股份有限公司 一种提高视频聚合效率的方法及***
CN105373600B (zh) * 2015-10-30 2019-02-22 北京奇艺世纪科技有限公司 视频播单排序方法及装置
CN105373600A (zh) * 2015-10-30 2016-03-02 北京奇艺世纪科技有限公司 视频播单排序方法及装置
CN108205557A (zh) * 2016-12-19 2018-06-26 顺丰科技有限公司 检索终端、服务端以及信息通讯检索方法和***
WO2018113673A1 (zh) * 2016-12-23 2018-06-28 北京奇虎科技有限公司 针对综艺类query的搜索结果的推送方法及装置
CN106649740A (zh) * 2016-12-23 2017-05-10 北京奇虎科技有限公司 基于搜索的3c类ugc数据的推荐方法及装置
CN109388729A (zh) * 2017-08-14 2019-02-26 阿里巴巴集团控股有限公司 音频子指纹的检索方法、装置以及音频查询***
CN110020145A (zh) * 2017-11-23 2019-07-16 北京搜狗科技发展有限公司 一种信息推荐方法及装置
CN110633379A (zh) * 2019-08-29 2019-12-31 北京睿企信息科技有限公司 一种基于gpu并行运算的以图搜图***及方法
CN110633379B (zh) * 2019-08-29 2023-04-28 北京睿企信息科技有限公司 一种基于gpu并行运算的以图搜图***及方法
CN111294636A (zh) * 2020-01-21 2020-06-16 北京字节跳动网络技术有限公司 视频数据的调整方法、装置、电子设备及计算机可读介质
WO2021175040A1 (zh) * 2020-03-02 2021-09-10 Oppo广东移动通信有限公司 视频处理方法及相关装置

Also Published As

Publication number Publication date
CN104008139B (zh) 2017-09-22

Similar Documents

Publication Publication Date Title
CN104008139A (zh) 视频索引表的创建方法和装置,视频的推荐方法和装置
JP6855595B2 (ja) ライブストリームコンテンツを推奨するための機械学習の使用
US10311478B2 (en) Recommending content based on user profiles clustered by subscription data
CN108197331B (zh) 用户兴趣的探索方法和装置
CN101981574B (zh) 分布式媒体指纹储存库
CN1716255B (zh) 通过使用页类别信息分散搜索引擎结果
CN106326391B (zh) 多媒体资源推荐方法及装置
KR20210040891A (ko) 정보 추천 방법과 장치, 전자 장비, 컴퓨터 판독가능 저장 매체 및 컴퓨터 프로그램
US20170193075A1 (en) System and method for aggregating, classifying and enriching social media posts made by monitored author sources
US20120317085A1 (en) Systems and methods for transmitting content metadata from multiple data records
CN104462573A (zh) 一种视频搜索结果展示方法及装置
CN104160712A (zh) 计算媒体节目之间的相似度
US11423096B2 (en) Method and apparatus for outputting information
CN104751354B (zh) 一种广告人群筛选方法
US20110320442A1 (en) Systems and Methods for Semantics Based Domain Independent Faceted Navigation Over Documents
CN103207917A (zh) 标注多媒体内容的方法、生成推荐内容的方法及***
CN110046278B (zh) 视频分类方法、装置、终端设备及存储介质
CN105916032A (zh) 视频推荐的方法及视频推荐的终端设备
CN107105349A (zh) 一种视频推荐方法
Fletcher A quality-based web api selection for mashup development using affinity propagation
Hauger et al. Exploring geospatial music listening patterns in microblog data
Hashemzadeh et al. Using a data mining tool and fp-growth algorithm application for extraction of the rules in two different dataset
US20140380146A1 (en) Creating playlist from web page
Havolli et al. Building a content-based recommendation engine model using Adamic Adar Measure; A Netflix case study
Sahu et al. Personalized recommendation engine using HADOOP

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant