CN110337012B - 基于互联网电视平台的智能推荐方法和装置 - Google Patents
基于互联网电视平台的智能推荐方法和装置 Download PDFInfo
- Publication number
- CN110337012B CN110337012B CN201910387677.8A CN201910387677A CN110337012B CN 110337012 B CN110337012 B CN 110337012B CN 201910387677 A CN201910387677 A CN 201910387677A CN 110337012 B CN110337012 B CN 110337012B
- Authority
- CN
- China
- Prior art keywords
- user
- video
- algorithm
- program
- pool
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 123
- 238000012163 sequencing technique Methods 0.000 claims description 26
- 238000012216 screening Methods 0.000 claims description 16
- 238000001914 filtration Methods 0.000 claims description 9
- 230000009471 action Effects 0.000 claims description 6
- 230000009193 crawling Effects 0.000 claims description 6
- 238000007873 sieving Methods 0.000 claims description 4
- 230000006399 behavior Effects 0.000 description 33
- 238000004590 computer program Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 2
- 238000013075 data extraction Methods 0.000 description 2
- 230000001502 supplementing effect Effects 0.000 description 2
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- 244000046052 Phaseolus vulgaris Species 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/735—Filtering based on additional data, e.g. user or group profiles
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/251—Learning process for intelligent management, e.g. learning user preferences for recommending movies
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/258—Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
- H04N21/25866—Management of end-user data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/4508—Management of client data or end-user data
- H04N21/4532—Management of client data or end-user data involving end-user characteristics, e.g. viewer profile, preferences
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/466—Learning process for intelligent management, e.g. learning user preferences for recommending movies
- H04N21/4668—Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Computer Graphics (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了基于互联网电视平台的智能推荐方法和装置,包括:获取基本数据集;将基本数据集输入智能推荐算法池中的每个算法中,得到多个节目筛选集;将多个节目筛选集生成节目待选集;获取用户历史行为信息;根据用户历史行为信息得到智能推荐算法池中每个算法对应的权重;根据每个算法对应的权重和节目待选集中的节目点击率,得到排序点击率;根据排序点击率、用户历史行为信息和每个算法对应的权重,得到用户偏好特征;根据用户偏好特征向用户推荐偏好视频信息,可以根据偏好推荐相关的视频,提高用户体验。
Description
技术领域
本发明涉及互联网电视平台技术领域,尤其是涉及基于互联网电视平台的智能推荐方法和装置。
背景技术
随着互联网应用的普及,海量信息资源的***性增长,当今的世界正处在信息过载的时代。互联网电视是一种新兴的互联网产品,它是通过公共互联网面向电视机传输的由国有广播电视机构提供视频内容的可控可管服务。在业务发展过程中,随着视频资源数量的指数型增长,内容日趋多样,面对海量的视频资源,用户想找到自己需要的内容变得越来越困难。
目前的互联网电视产品搭载的智能推荐算法多为基于内容类型相似的推荐算法,即根据用户观看的视频类型,推荐给用户与此视频类型相似的其他视频,但是,该算法是基于视频属性进行的推荐,无法根据用户的偏好推荐相关的视频。
发明内容
有鉴于此,本发明的目的在于提供基于互联网电视平台的智能推荐方法和装置,可以根据偏好推荐相关的视频,提高用户体验。
第一方面,本发明实施例提供了基于互联网电视平台的智能推荐方法,所述方法包括:
获取外部数据和内部数据,从所述外部数据和所述内部数据中进行数据提取,得到基本数据集;
将所述基本数据集输入智能推荐算法池中的每个算法中,得到多个节目筛选集;
将所述多个节目筛选集生成节目待选集;
获取用户历史行为信息;
根据所述用户历史行为信息得到所述智能推荐算法池中每个算法对应的权重;
根据所述每个算法对应的权重和所述节目待选集中的节目点击率,得到排序点击率;
根据所述排序点击率、所述用户历史行为信息和所述每个算法对应的权重,得到用户偏好特征;
根据所述用户偏好特征向用户推荐偏好视频信息。
进一步的,所述智能推荐算法池包括最新上线池,所述将所述基本数据集输入智能推荐算法池中的每个算法中,得到多个节目筛选集,包括:
将所述基本数据集按照上线时间的先后进行排序,得到排序后的视频;
根据所述排序后的视频构成所述节目筛选集。
进一步的,所述智能推荐算法池包括本地平台热度池,所述将所述基本数据集输入智能推荐算法池中的每个算法中,得到多个节目筛选集,包括:
获取所述基本数据集中每个视频当日的收视综合指数;
根据所述每个视频当日的收视综合指数,得到所述每个视频对应的收视热度;
将所述每个视频对应的收视热度按照从高到低的顺序进行排序,得到排序后的视频;
根据所述排序后的视频构成所述节目筛选集。
进一步的,所述智能推荐算法池包括外部节目热度池,所述将所述基本数据集输入智能推荐算法池中的每个算法中,得到多个节目筛选集,包括:
爬取第三方平台的视频的热度;
从所述基本数据集中获取本地平台的视频,将所述本地平台的视频按照所述第三方平台的视频的热度进行排序,得到排序后的本地平台的视频;
爬取所述第三方平台的视频对应的标签,并对所述第三方平台的视频对应的标签赋予标签分值;
根据所述标签分值将所述第三方平台的视频按照从大到小的顺序进行排序,得到排序后的第三方平台的视频;
将所述排序后的本地平台的视频与所述排序后的第三方平台的视频进行匹配,选取N个按相似度排序的视频,其中,N为正整数;
当所述排序后的本地平台的视频与所述排序后的第三方平台的视频的相似度相同时,从除所述第三方平台以外的平台中选取评分最高的视频;
将所述N个按相似度排序的视频构成所述节目筛选集。
进一步的,所述智能推荐算法池包括基于用户的协同过滤池,所述将所述基本数据集输入智能推荐算法池中的每个算法中,得到多个节目筛选集,包括:
根据所述基本数据集获取用户行为信息;
根据所述用户行为信息构建用户对视频或视频集的偏好模型;
根据所述偏好模型,计算所述用户之间的相似度;
根据所述用户之间的相似度和所述偏好模型,计算所述视频对所述用户的推荐度;
根据所述推荐度进行排序,得到所述节目筛选集。
进一步的,所述智能推荐算法池包括关联规则推荐池,所述将所述基本数据集输入智能推荐算法池中的每个算法中,得到多个节目筛选集,包括:
分别计算两两视频之间的支持度、可信度和作用度;
当所述支持度达到第一预设阈值,所述可信度达到第二预设阈值,所述作用度大于1时,确定所述两两视频相关成立;
根据所述支持度进行排序,得到所述节目筛选集。
进一步的,所述智能推荐算法池包括基于内容标签的推荐池,所述将所述基本数据集输入智能推荐算法池中的每个算法中,得到多个节目筛选集,包括:
根据所述基本数据集获取本地视频信息;
将所述本地视频信息中的两两视频信息进行标签匹配,得到标签重合度;
根据所述标签重合度,计算所述两两视频信息的相似度;
根据所述两两视频信息的相似度,按照从大小到的顺序进行排序,得到所述节目筛选集。
进一步的,所述方法还包括:
根据所述节目待选集中推荐的节目信息和非推荐的节目信息,得到节目扩展集;
根据下式计算所述节目扩展集:
其中,P{i,j}为所述节目扩展集,ai为所述节目待选集中推荐的节目信息,fj为所述节目待选集中非推荐的节目信息,conf(ai)为与所述推荐的节目信息相匹配的节目集合,conf(fj)为与所述非推荐的节目信息相匹配的节目集合,C为计数。
进一步的,所述根据所述每个算法对应的权重和所述节目待选集中的节目点击率,得到排序点击率,包括:
根据下式计算排序点击率:
Pi=∑di·Lof(Ii)
其中,Pi为所述排序点击率,di为所述每个算法对应的权重,Ii为从所述节目待选集中推荐给第i个用户的一部分或整个视频,Lof(Ii)为所述节目待选集中的节目点击率。
第二方面,本发明实施例提供了基于互联网电视平台的智能推荐装置,所述装置包括:
基本数据集获取单元,用于获取外部数据和内部数据,从所述外部数据和所述内部数据中进行数据提取,得到基本数据集;
节目筛选集获取单元,用于将所述基本数据集输入智能推荐算法池中的每个算法中,得到多个节目筛选集;
生成单元,用于将所述多个节目筛选集生成节目待选集;
历史行为信息获取单元,用于获取用户历史行为信息;
权重获取单元,用于根据所述用户历史行为信息得到所述智能推荐算法池中每个算法对应的权重;
排序点击率获取单元,用于根据所述每个算法对应的权重和所述节目待选集中的节目点击率,得到排序点击率;
用户偏好特征获取单元,用于根据所述排序点击率、所述用户历史行为信息和所述每个算法对应的权重,得到用户偏好特征;
偏好视频信息获取单元,用于根据所述用户偏好特征向用户推荐偏好视频信息。
本发明实施例提供了基于互联网电视平台的智能推荐方法和装置,包括:获取外部数据和内部数据,从外部数据和内部数据中进行数据提取,得到基本数据集;将基本数据集输入智能推荐算法池中的每个算法中,得到多个节目筛选集;将多个节目筛选集生成节目待选集;获取用户历史行为信息;根据用户历史行为信息得到智能推荐算法池中每个算法对应的权重;根据每个算法对应的权重和节目待选集中的节目点击率,得到排序点击率;根据排序点击率、用户历史行为信息和每个算法对应的权重,得到用户偏好特征;根据用户偏好特征向用户推荐偏好视频信息,从而可以根据偏好推荐相关的视频,提高用户体验。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一提供的基于互联网电视平台的智能推荐方法流程图;
图2为本发明实施例二提供的基于互联网电视平台的智能推荐方法示意图;
图3为本发明实施例三提供的基于互联网电视平台的智能推荐装置示意图。
图标:
10-基本数据集获取单元;20-节目筛选集获取单元;30-生成单元;40-历史行为信息获取单元;50-权重获取单元;60-排序点击率获取单元;70-用户偏好特征获取单元;80-偏好视频信息获取单元。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为便于对本实施例进行理解,下面对本发明实施例进行详细介绍。
实施例一:
图1为本发明实施例一提供的基于互联网电视平台的智能推荐方法流程图。
参照图1,该方法包括以下步骤:
步骤S101,获取外部数据和内部数据,从外部数据和内部数据中进行数据提取,得到基本数据集;
这里,外部数据包括但不限于,具体为百度、豆瓣等网站的评论内容、排名数据、标签数据和介绍数据(编目数据)。内部数据包括但不限于,具体为用户基础信息数据、用户行为数据、内容编目数据和用户选择数据。在抓取外部数据后,与内部数据进行检索,找到对应的内部数据,以字典形式组织外部数据到数据库,从而形成基本数据集。
步骤S102,将基本数据集输入智能推荐算法池中的每个算法中,得到多个节目筛选集;
这里,通过智能推荐算法池,多种算法独立进行运算,可以直观地得到各个算法得到的节目筛选集,避免各个算法之间的干扰。
智能推荐算法池依托本地平台海量用户行为数据及第三方互联网平台大数据计算结果,通过建立用户和视频、视频与视频之间的二元关系,利用已有的相似性或选择性关系挖掘每个用户可能感兴趣的视频。主要是根据用户的历史行为,包括:打分、观看时长比、收藏、搜索和订阅等,推断出用户的兴趣点,并据此向用户推荐可能最感兴趣的视频。
步骤S103,将多个节目筛选集生成节目待选集;
具体地,将节目待选集和节目扩展集通过字典模式进行去重合并,生成节目列表,其中,节目列表包括去重后的节目信息和原始的节目信息等。其中,字典模式:{节目名称=***,推荐来源={from(原始排序)…}}。
步骤S104,获取用户历史行为信息;
这里,用户历史行为信息是从内部数据中获取的。
步骤S105,根据用户历史行为信息得到智能推荐算法池中每个算法对应的权重;
这里,所有权重的和为1,即∑di=1,其中,di为智能推荐算法池中的每个算法对应的权重。
步骤S106,根据每个算法对应的权重和节目待选集中的节目点击率,得到排序点击率;
步骤S107,根据排序点击率、用户历史行为信息和每个算法对应的权重,得到用户偏好特征;
这里,在***中,当用户为初始用户时,排序点击率为收视用户占总用户的比例;当用户为收视用户时,可以根据用户的实际点击计算排序点击率。根据每个算法对应的权重和节目待选集中的节目点击率,得到排序点击率。
步骤S108,根据用户偏好特征向用户推荐偏好视频信息。
具体地,根据公式(1)计算用户偏好特征:
基础数据集中的节目属性,即节目标签、节目类型和用户历史行为信息等。观看时长、演员的特征信息组成了原始节目信息,另外,用户对某个节目的观看次数、用户的历史行为信息和用户的收视信息都属于原始节目信息的一部分。
对于初始用户,在排序过程中,通过推荐原始得分累计后,综合所有用户的点击次数,进行排序;根据节目特征(原始节目信息与生成推荐的信息)、排序得分和排序点击率,得到用户偏好特征。因为用户为初始用户,用户偏好特征为初始偏好,根据用户登陆的特点,每个用户的初始偏好均不同。
对于收视用户,依据真实数据计算对应的用户偏好特征。当节目扩展集与节目待选集有重合的时,可增加排序得分,按照一个排序得分标准差来增加;当用户反馈操作后,根据反馈操作,即可调整排序与这个用户的偏好矩阵。
需要说明的是,初始用户和收视用户,使用有效观看次数进行区分,有效观看定义为收看节目超过这个节目10%节目时长的收视,即初始用户为有效观看次数为0次的用户;收视用户为用户发生了有效观看,则用户为收视用户。
进一步的,智能推荐算法池包括最新上线池,步骤S102包括:
将基本数据集按照上线时间的先后进行排序,得到排序后的视频;
根据排序后的视频构成节目筛选集。
进一步的,智能推荐算法池包括本地平台热度池,步骤S102包括:
获取基本数据集中每个视频当日的收视综合指数;
根据每个视频当日的收视综合指数,得到每个视频对应的收视热度;
将每个视频对应的收视热度按照从高到低的顺序进行排序,得到排序后的视频;
根据排序后的视频构成节目筛选集。
进一步的,智能推荐算法池包括外部节目热度池,步骤S102包括:
爬取第三方平台的视频的热度;
从基本数据集中获取本地平台的视频,将本地平台的视频按照第三方平台的视频的热度进行排序,得到排序后的本地平台的视频;
爬取第三方平台的视频对应的标签,并对第三方平台的视频对应的标签赋予标签分值;
根据标签分值将第三方平台的视频按照从大到小的顺序进行排序,得到排序后的第三方平台的视频;
将排序后的本地平台的视频与排序后的第三方平台的视频进行匹配,选取N个按相似度排序的视频,其中,N为正整数;
当排序后的本地平台的视频与排序后的第三方平台的视频的相似度相同时,从除第三方平台以外的平台中选取评分最高的视频;
将N个按相似度排序的视频构成节目筛选集。
进一步的,智能推荐算法池包括基于用户的协同过滤池,步骤S102包括:
根据基本数据集获取用户行为信息;
根据用户行为信息构建用户对视频或视频集的偏好模型;
根据偏好模型,计算所述用户之间的相似度;
根据用户之间的相似度和偏好模型,计算视频对用户的推荐度;
根据推荐度进行排序,得到节目筛选集。
进一步的,智能推荐算法池包括关联规则推荐池,步骤S102包括:
分别计算两两视频之间的支持度、可信度和作用度;
当支持度达到第一预设阈值,可信度达到第二预设阈值,作用度大于1时,确定两两视频相关成立;
根据支持度进行排序,得到节目筛选集。
进一步的,智能推荐算法池包括基于内容标签的推荐池,步骤S102包括:
根据基本数据集获取本地视频信息;
将本地视频信息中的两两视频信息进行标签匹配,得到标签重合度;
根据标签重合度,计算两两视频信息的相似度;
根据两两视频信息的相似度,按照从大小到的顺序进行排序,得到节目筛选集。
进一步的,该方法还包括:
根据节目待选集中推荐的节目信息和非推荐的节目信息,得到节目扩展集;
根据公式(2)计算节目扩展集:
其中,P{i,j}为节目扩展集,ai为节目待选集中推荐的节目信息,fj为节目待选集中非推荐的节目信息,conf(ai)为与推荐的节目信息相匹配的节目集合,conf(fj)为与非推荐的节目信息相匹配的节目集合,C为计数。其中,取公式(2)中具有最大值的节目加入到节目扩展集中。
进一步的,步骤S106包括:
根据公式(3)计算排序点击率:
Pi=∑di·Lof(Ii) (3)
其中,Pi为排序点击率,di为每个算法对应的权重,Ii为从节目待选集中推荐给第i个用户的一部分或整个视频,Lof(Ii)为多个节目待选集中的节目点击率。
实施例二:
图2为本发明实施例二提供的基于互联网电视平台的智能推荐方法示意图。
参照图2,将外部数据和内部数据进行数据提取,得到基本数据集;将基本数据集分别作为智能推荐算法池中的每个算法的输入,得到每个算法输出的节目筛选集;将多个节目筛选集生成节目待选集;获取用户历史行为信息;根据用户历史行为信息得到智能推荐算法池中每个算法对应的权重;根据权重进行排序。按照不同权重,依次从智能推荐算法池中选取若干算法,并从中抓取若干视频进行排序,排序过程可参照下面的应用场景。
在订阅频道场景中,将全平台视频两两进行标签匹配,利用标签重合度计算两视频集间的相似度。用户可在产品页面上选择偏好标签,订阅带有所选标签的视频,生成视频推荐页面。
针对第一类用户,即初始用户,有效观看次数为0次。
未订阅标签:按照不同权重,依次从“本地平台热度池”、“外部节目热度池”和“最新上线池”中按各池顺序抓取若干视频,记为第1组。视频抓取方式以此类推,在各视频池中抓取并分组。将已分组视频按照抓取先后顺序(第一组、第二组…)排序。组内视频随机排序。当视频重合时,保留排名靠前的视频,排名靠后的自动删除,由下一顺序视频补完。
订阅标签:筛选含有用户所选标签视频。具体为:在“本地平台热度池”、“外部节目热度池”和“最新上线池”中筛选含有用户所选标签的视频,并保持原排序。
按照不同权重,依次从经过标签筛选的“本地平台热度池”、“外部节目热度池”和“最新上线池”中按各池顺序抓取若干视频,记为第1组。视频抓取方式以此类推,在各视频池中抓取并分组。将已分组视频按照抓取先后顺序(第一组、第二组…)排序。组内视频随机排序。当视频重合时,保留排名靠前的视频,排名靠后的自动删除,由下一顺序视频补完。不含用户所选标签的视频,按照视频池原排序,排在全部带有用户所选标签的视频之后。
针对第二类用户,即为收视用户,有效观看次数大于或等于1次。
未订阅标签:按照不同权重,依次从“本地平台热度池”、“外部节目热度池”、“最新上线池”和“基于用户的协同过滤池”中按各池顺序抓取若干视频,记为第1组。视频抓取方式以此类推,在各视频池中抓取并分组。将已分组视频按照抓取先后顺序(第一组、第二组…)排序。组内视频随机排序。当视频重合时,保留排名靠前的视频,排名靠后的自动删除,由下一顺序视频补完。
订阅标签:筛选含有用户所选标签视频,具体为:在“本地平台热度池”、“外部节目热度池”、“最新上线池”和“基于用户的协同过滤池”中筛选含有用户所选标签的视频,并保持原排序。
按照不同权重,依次从已经过标签筛选的“本地平台热度池”、“外部节目热度池”、“最新上线池”和“基于用户的协同过滤池”中按各池顺序抓取若干视频,记为第1组。视频抓取方式以此类推,在各视频池中抓取并分组。
将已分组视频按照抓取先后顺序(第一组、第二组…)排序。组内视频随机排序。当视频重合时,保留排名靠前的视频,排名靠后的自动删除,由下一顺序视频补完。
不含用户所选标签的视频,按照视频池原排序,排在全部带有用户所选标签的视频之后。
在视频专区(电影频道、电视剧频道和体育频道等)场景中,针对初始用户,从“本地平台热度池”、“外部节目热度池”和“最新上线池”中,筛选带有专区标签的视频并保持原排序。按照不同权重,依次从已经过标签筛选的“本地平台热度池”、“外部节目热度池”和“最新上线池”中按各池顺序抓取若干视频,记为第1组。视频抓取方式以此类推,在各视频池中抓取并分组。将已分组视频按照抓取先后顺序(第一组、第二组…)排序。组内视频随机排序。当视频重合时,保留排名靠前的视频,排名靠后的自动删除,由下一顺序视频补完。
针对收视用户,在“本地平台热度池”、“外部节目热度池”、“最新上线池”和“基于用户的协同过滤池”中筛选带有专区标签的视频并保持原排序。按照不同权重,依次从已经过标签筛选的“本地平台热度池”、“外部节目热度池”、“最新上线池”和“基于用户的协同过滤池”中按各池顺序抓取若干视频,记为第1组。视频抓取方式以此类推,在各视频池中抓取并分组。将已分组视频按照抓取先后顺序(第一组、第二组…)排序。组内视频随机排序。当视频重合时,保留排名靠前的视频,排名靠后的自动删除,由下一顺序视频补完。
在相关视频推荐场景中,针对初始用户,按照不同权重,从“本地平台热度池”、“外部节目热度池”中选取热度阈值达到一定标准的视频。将选好的视频与目标视频的标签做相似度匹配,按照标签相似度排序。在计算标签相似度时,不同类型标签的影响权重不同。当计算输出的视频数量不足时,用“基于内容标签的推荐池”按顺序补完。
针对收视用户,按照不同权重,从“基于用户的协同过滤池”、“本地平台热度池”、“外部节目热度池”中选取热度阈值达到一定标准的视频。将选好的视频与目标视频的标签做相似度匹配,按照标签相似度排序。在计算标签相似度时,不同类型标签的影响权重不同。当计算输出的视频数量不足时,用“基于内容标签的推荐池”按顺序补完。
在视频退出推荐应用场景中,从“关联规则推荐池”中按池中顺序选取视频,当计算输出的视频数量不足时,用“本地平台热度池”按顺序补完。
在本实施例中,将用户分为初始用户和收视用户,在不同的应用场景中,根据不同的用户类型选择不同的算法,每个算法都是相互独立的,从而输出相应的节目筛选集。
实施例三:
图3为本发明实施例三提供的基于互联网电视平台的智能推荐装置示意图。
参照图3,该装置包括:
基本数据集获取单元10,用于获取外部数据和内部数据,从外部数据和内部数据中进行数据提取,得到基本数据集;
节目筛选集获取单元20,用于将基本数据集输入智能推荐算法池中的每个算法中,得到多个节目筛选集;
生成单元30,用于将多个节目筛选集生成节目待选集;
历史行为信息获取单元40,用于获取用户历史行为信息;
权重获取单元50,用于根据用户历史行为信息得到智能推荐算法池中每个算法对应的权重;
排序点击率获取单元60,用于根据每个算法对应的权重和节目待选集中的节目点击率,得到排序点击率;
用户偏好特征获取单元70,用于根据排序点击率、用户历史行为信息和每个算法对应的权重,得到用户偏好特征;
偏好视频信息获取单元80,用于根据用户偏好特征向用户推荐偏好视频信息。
本发明实施例提供了基于互联网电视平台的智能推荐方法和装置,包括:获取外部数据和内部数据,从外部数据和内部数据中进行数据提取,得到基本数据集;将基本数据集输入智能推荐算法池中的每个算法中,得到多个节目筛选集;将多个节目筛选集生成节目待选集;获取用户历史行为信息;根据用户历史行为信息得到智能推荐算法池中每个算法对应的权重;根据每个算法对应的权重和节目待选集中的节目点击率,得到排序点击率;根据排序点击率、用户历史行为信息和每个算法对应的权重,得到用户偏好特征;根据用户偏好特征向用户推荐偏好视频信息,从而可以根据偏好推荐相关的视频,提高用户体验。
本发明实施例还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例提供的基于互联网电视平台的智能推荐方法的步骤。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器运行时执行上述实施例的基于互联网电视平台的智能推荐方法的步骤。
本发明实施例所提供的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
另外,在本发明实施例的描述中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (10)
1.一种基于互联网电视平台的智能推荐方法,其特征在于,所述方法包括:
获取外部数据和内部数据,从所述外部数据和所述内部数据中进行数据提取,得到基本数据集;
将所述基本数据集输入智能推荐算法池中的每个算法中,得到多个节目筛选集;
将所述多个节目筛选集生成节目待选集;
获取用户历史行为信息;
根据所述用户历史行为信息得到所述智能推荐算法池中每个算法对应的权重;
根据所述每个算法对应的权重和所述节目待选集中的节目点击率,得到排序点击率;
根据所述排序点击率、所述用户历史行为信息和所述每个算法对应的权重,得到用户偏好特征;
根据所述用户偏好特征向用户推荐偏好视频信息;
所述外部数据包括网站的评论内容、排名数据、标签数据和介绍数据,所述内部数据包括用户基础信息数据、用户行为数据、内容编目数据和用户选择数据;
所述从所述外部数据和所述内部数据中进行数据提取,得到基本数据集,包括:
在抓取所述外部数据后,对所述内部数据进行检索,找到对应的内部数据,以字典形式组织所述外部数据到数据库,从而形成所述基本数据集。
2.根据权利要求1所述的基于互联网电视平台的智能推荐方法,其特征在于,所述智能推荐算法池包括最新上线池,所述将所述基本数据集输入智能推荐算法池中的每个算法中,得到多个节目筛选集,包括:
将所述基本数据集按照上线时间的先后进行排序,得到排序后的视频;
根据所述排序后的视频构成所述节目筛选集。
3.根据权利要求1所述的基于互联网电视平台的智能推荐方法,其特征在于,所述智能推荐算法池包括本地平台热度池,所述将所述基本数据集输入智能推荐算法池中的每个算法中,得到多个节目筛选集,包括:
获取所述基本数据集中每个视频当日的收视综合指数;
根据所述每个视频当日的收视综合指数,得到所述每个视频对应的收视热度;
将所述每个视频对应的收视热度按照从高到低的顺序进行排序,得到排序后的视频;
根据所述排序后的视频构成所述节目筛选集。
4.根据权利要求1所述的基于互联网电视平台的智能推荐方法,其特征在于,所述智能推荐算法池包括外部节目热度池,所述将所述基本数据集输入智能推荐算法池中的每个算法中,得到多个节目筛选集,包括:
爬取第三方平台的视频的热度;
从所述基本数据集中获取本地平台的视频,将所述本地平台的视频按照所述第三方平台的视频的热度进行排序,得到排序后的本地平台的视频;
爬取所述第三方平台的视频对应的标签,并对所述第三方平台的视频对应的标签赋予标签分值;
根据所述标签分值将所述第三方平台的视频按照从大到小的顺序进行排序,得到排序后的第三方平台的视频;
将所述排序后的本地平台的视频与所述排序后的第三方平台的视频进行匹配,选取N个按相似度排序的视频,其中,N为正整数;
当所述排序后的本地平台的视频与所述排序后的第三方平台的视频的相似度相同时,从除所述第三方平台以外的平台中选取评分最高的视频;
将所述N个按相似度排序的视频构成所述节目筛选集。
5.根据权利要求1所述的基于互联网电视平台的智能推荐方法,其特征在于,所述智能推荐算法池包括基于用户的协同过滤池,所述将所述基本数据集输入智能推荐算法池中的每个算法中,得到多个节目筛选集,包括:
根据所述基本数据集获取用户行为信息;
根据所述用户行为信息构建用户对视频或视频集的偏好模型;
根据所述偏好模型,计算所述用户之间的相似度;
根据所述用户之间的相似度和所述偏好模型,计算所述视频对所述用户的推荐度;
根据所述推荐度进行排序,得到所述节目筛选集。
6.根据权利要求1所述的基于互联网电视平台的智能推荐方法,其特征在于,所述智能推荐算法池包括关联规则推荐池,所述将所述基本数据集输入智能推荐算法池中的每个算法中,得到多个节目筛选集,包括:
分别计算两两视频之间的支持度、可信度和作用度;
当所述支持度达到第一预设阈值,所述可信度达到第二预设阈值,所述作用度大于1时,确定所述两两视频相关成立;
根据所述支持度进行排序,得到所述节目筛选集。
7.根据权利要求1所述的基于互联网电视平台的智能推荐方法,其特征在于,所述智能推荐算法池包括基于内容标签的推荐池,所述将所述基本数据集输入智能推荐算法池中的每个算法中,得到多个节目筛选集,包括:
根据所述基本数据集获取本地视频信息;
将所述本地视频信息中的两两视频信息进行标签匹配,得到标签重合度;
根据所述标签重合度,计算所述两两视频信息的相似度;
根据所述两两视频信息的相似度,按照从大到小的顺序进行排序,得到所述节目筛选集。
9.根据权利要求1所述的基于互联网电视平台的智能推荐方法,其特征在于,所述根据所述每个算法对应的权重和所述节目待选集中的节目点击率,得到排序点击率,包括:
根据下式计算所述排序点击率:
Pi=∑di·Lof(Ii)
其中,Pi为所述排序点击率,di为所述每个算法对应的权重,Ii为从所述节目待选集中推荐给第i个用户的一部分或整个视频,Lof(Ii)为所述节目待选集中的节目点击率。
10.一种基于互联网电视平台的智能推荐装置,其特征在于,所述装置包括:
基本数据集获取单元,用于获取外部数据和内部数据,从所述外部数据和所述内部数据中进行数据提取,得到基本数据集;
节目筛选集获取单元,用于将所述基本数据集输入智能推荐算法池中的每个算法中,得到多个节目筛选集;
生成单元,用于将所述多个节目筛选集生成节目待选集;
历史行为信息获取单元,用于获取用户历史行为信息;
权重获取单元,用于根据所述用户历史行为信息得到所述智能推荐算法池中每个算法对应的权重;
排序点击率获取单元,用于根据所述每个算法对应的权重和所述节目待选集中的节目点击率,得到排序点击率;
用户偏好特征获取单元,用于根据所述排序点击率、所述用户历史行为信息和所述每个算法对应的权重,得到用户偏好特征;
偏好视频信息获取单元,用于根据所述用户偏好特征向用户推荐偏好视频信息;
所述外部数据包括网站的评论内容、排名数据、标签数据和介绍数据,所述内部数据包括用户基础信息数据、用户行为数据、内容编目数据和用户选择数据;
所述基本数据集获取单元包括:
在抓取所述外部数据后,对所述内部数据进行检索,找到对应的内部数据,以字典形式组织所述外部数据到数据库,从而形成所述基本数据集。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910387677.8A CN110337012B (zh) | 2019-05-08 | 2019-05-08 | 基于互联网电视平台的智能推荐方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910387677.8A CN110337012B (zh) | 2019-05-08 | 2019-05-08 | 基于互联网电视平台的智能推荐方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110337012A CN110337012A (zh) | 2019-10-15 |
CN110337012B true CN110337012B (zh) | 2021-07-20 |
Family
ID=68140010
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910387677.8A Active CN110337012B (zh) | 2019-05-08 | 2019-05-08 | 基于互联网电视平台的智能推荐方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110337012B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110996177B (zh) * | 2019-11-27 | 2022-04-22 | 北京爱奇艺智慧娱乐科技有限公司 | 面向点播影院的视频推荐方法、装置及设备 |
CN111881341B (zh) * | 2020-06-15 | 2022-11-25 | 合肥美的电冰箱有限公司 | 饮食信息推荐方法及装置、电子设备及介质 |
CN111984869A (zh) * | 2020-08-25 | 2020-11-24 | 北京每日优鲜电子商务有限公司 | 物品信息推送方法、装置、电子设备和计算机可读介质 |
CN112364248A (zh) * | 2020-11-20 | 2021-02-12 | 北京达佳互联信息技术有限公司 | 推荐信息列表的生成方法、装置、服务器及存储介质 |
CN115379117B (zh) * | 2022-08-22 | 2023-05-23 | 天翼数字生活科技有限公司 | 一种旧视频片源修复筛选方法、装置、终端及介质 |
CN116304351B (zh) * | 2023-03-29 | 2024-02-02 | 陕西维纳数字科技股份有限公司 | 一种基于大数据的智能数据信息统计管理***及方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102088626A (zh) * | 2009-12-02 | 2011-06-08 | Tcl集团股份有限公司 | 一种在线视频推荐方法及视频门户服务*** |
CN102685565A (zh) * | 2012-05-18 | 2012-09-19 | 合一网络技术(北京)有限公司 | 一种点击反馈式个性化推荐*** |
CN106028071A (zh) * | 2016-05-17 | 2016-10-12 | Tcl集团股份有限公司 | 一种视频推荐方法及*** |
CN106878772A (zh) * | 2017-02-27 | 2017-06-20 | Ut斯达康(深圳)技术有限公司 | 一种节目推荐方法及装置 |
CN106919651A (zh) * | 2017-01-22 | 2017-07-04 | 北京奇艺世纪科技有限公司 | 外部网站视频的搜索排序方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8572097B1 (en) * | 2013-03-15 | 2013-10-29 | FEM, Inc. | Media content discovery and character organization techniques |
-
2019
- 2019-05-08 CN CN201910387677.8A patent/CN110337012B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102088626A (zh) * | 2009-12-02 | 2011-06-08 | Tcl集团股份有限公司 | 一种在线视频推荐方法及视频门户服务*** |
CN102685565A (zh) * | 2012-05-18 | 2012-09-19 | 合一网络技术(北京)有限公司 | 一种点击反馈式个性化推荐*** |
CN106028071A (zh) * | 2016-05-17 | 2016-10-12 | Tcl集团股份有限公司 | 一种视频推荐方法及*** |
CN106919651A (zh) * | 2017-01-22 | 2017-07-04 | 北京奇艺世纪科技有限公司 | 外部网站视频的搜索排序方法及装置 |
CN106878772A (zh) * | 2017-02-27 | 2017-06-20 | Ut斯达康(深圳)技术有限公司 | 一种节目推荐方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110337012A (zh) | 2019-10-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110337012B (zh) | 基于互联网电视平台的智能推荐方法和装置 | |
CN106326391B (zh) | 多媒体资源推荐方法及装置 | |
CN108829764B (zh) | 推荐信息获取方法、装置、***、服务器及存储介质 | |
CN104462573B (zh) | 一种视频搜索结果展示方法及装置 | |
US8204878B2 (en) | System and method for finding unexpected, but relevant content in an information retrieval system | |
US8869205B2 (en) | Method and system for video collection management, invalid video replacement and continuous video replay | |
CN107038213B (zh) | 一种视频推荐的方法及装置 | |
CN107273489B (zh) | 内容推送方法、电子设备及计算机存储介质 | |
US9978093B2 (en) | Method and system for pushing mobile application | |
Cami et al. | A content-based movie recommender system based on temporal user preferences | |
US20070078849A1 (en) | System and method for recommending items of interest to a user | |
CN108650532B (zh) | 有线电视点播节目推荐方法及*** | |
CN106878405B (zh) | 一种调整推送项目的方法及装置 | |
CN109168047B (zh) | 视频推荐方法、装置、服务器及存储介质 | |
CN104899306B (zh) | 信息处理方法、信息显示方法及装置 | |
CN105574030B (zh) | 一种信息搜索方法及装置 | |
JP6280323B2 (ja) | キャプチャしたイメージを用いた動画分析装置、方法およびコンピュータ読み取り可能な記録媒体 | |
Braun et al. | Enhanced prediction of user-preferred YouTube videos based on cleaned viewing pattern history | |
CN112235614A (zh) | 电视节目排行榜数据的个性化推荐方法及*** | |
CN111435371A (zh) | 视频推荐方法及其***、计算机程序产品、可读存储介质 | |
CN112464100A (zh) | 信息推荐模型训练方法、信息推荐方法、装置及设备 | |
CN113873330A (zh) | 视频推荐方法、装置、计算机设备和存储介质 | |
CN111241381A (zh) | 信息推荐方法、装置、电子设备及计算机可读存储介质 | |
CN110297967B (zh) | 兴趣点确定方法、装置、设备及计算机可读存储介质 | |
CN111581435A (zh) | 一种视频封面图像生成方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |