CN109561350A - 用户兴趣度的评价方法和*** - Google Patents
用户兴趣度的评价方法和*** Download PDFInfo
- Publication number
- CN109561350A CN109561350A CN201710888524.2A CN201710888524A CN109561350A CN 109561350 A CN109561350 A CN 109561350A CN 201710888524 A CN201710888524 A CN 201710888524A CN 109561350 A CN109561350 A CN 109561350A
- Authority
- CN
- China
- Prior art keywords
- program
- label
- user
- index parameter
- under
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/466—Learning process for intelligent management, e.g. learning user preferences for recommending movies
- H04N21/4662—Learning process for intelligent management, e.g. learning user preferences for recommending movies characterized by learning algorithms
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/4508—Management of client data or end-user data
- H04N21/4532—Management of client data or end-user data involving end-user characteristics, e.g. viewer profile, preferences
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/45—Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
- H04N21/466—Learning process for intelligent management, e.g. learning user preferences for recommending movies
- H04N21/4667—Processing of monitored end-user data, e.g. trend analysis based on the log file of viewer selections
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种用户兴趣度的评价方法和***,通过建立兴趣标签库,兴趣标签库包括节目标签,以及节目标签下的各个节目参数;基于节目标签计算用户在各节目标签上的节目指标参数;归一化处理当前用户在每个节目标签下的节目指标参数不相对于全部用户的相对值,得到各个节目指标参数对应的归一化值;加权计算当前用户对应的每个节目标签下的各个节目指标参数对应的归一化值,得到当前用户对每个节目标签对应的节目的兴趣度。通过上述公开方法,对于兴趣度的计算是基于预先建立的节目标签上的节目指标参数得到,过程简洁。因此,通过本发明公开的用户兴趣度的评价方法能够快速且准确的得到用户对各个节目标签的兴趣度。
Description
技术领域
本发明涉及新媒体技术领域,更具体地说涉及一种用户兴趣度的评价方法和***。
背景技术
随着新媒体行业的快速发展,针对不同的用户画像做不同的推送已经成为其重要的业务之一。其中,用户的收视偏好又是其进行用户画像过程中重要组成部分。用户的收视偏好主要通过用户兴趣度进行衡量。用户兴趣度则指用户对各兴趣标签感兴趣的程度。
对于用户兴趣度的计算,现有技术中,主要基于主题模型对不同用户在不同时段收视兴趣偏好的概率值进行计算。该主题模型主要通过训练的方式实现对用户兴趣度的计算。但是,主题模型在计算用户兴趣度时,复杂度高,通用性差,且主题模型训练出的主题较为抽象,解释性不强,且不同主题模型之间也存在一定的差异。因此,基于现有技术获得用户兴趣度不仅过程复杂,且不准确。
发明内容
有鉴于此,本申请提供了一种用户兴趣度的评价方法和***,以实现快速得到准确的用户兴趣度的目的。
为了实现上述目的,现提出的方案如下:
本发明第一方面公开了一种用户兴趣度的评价方法,包括:
建立兴趣标签库,所述兴趣标签库包括节目标签,以及所述节目标签下的各个节目参数,所述节目标签包括节目所属类别;
基于所述节目标签计算用户在各节目标签上的节目指标参数;
归一化处理当前所述用户在每个所述节目标签下的节目指标参数相对于全部用户的相对值,得到各个所述节目指标参数对应的归一化值;
加权计算当前所述用户对应的每个所述节目标签下的各个所述节目指标参数对应的归一化值,得到当前所述用户对每个所述节目标签对应的节目的兴趣度。
优选的,所述节目参数至少包括:节目名称和节目自身的时长;
所述节目所属类别至少包括:按照内容划分的类别和/或按照节目题材划分的类别,所述按照内容划分的类别包括:剧情、喜剧或真人秀,所述按照节目题材划分的类别包括:电视剧、电影或综艺。
优选的,所述节目指标参数包括:收视时长、收看完成率、节目数以及收看天数。
优选的,若所述节目指标参数包括收视时长,则基于所述节目标签计算用户在各节目标签上的节目指标参数,包括:
确定每一节目标签;
获取所述用户收看每一所述节目标签下的节目的时长
其中,ti表示所述用户每次收看当前节目标签下的节目的时长,i和n表示所述用户在某标签下收看的次数,i大于等于1,n大于i。
优选的,若所述节目指标参数包括:收看完成率,则基于所述节目标签计算用于在各节目标签上的节目指标参数,包括:
确定每一节目标签;
获取所述用户在所述节目标签下收看各个节目的次数,每一次的收看时长和各个节目的原始时长,得到收看完成率
其中,ti表示所述用户每次收看当前节目标签下的节目的时长,i和n表示所述用户在某标签下收看的次数,i大于等于1,n大于i,pi表示用户每次收看当前节目标签下的节目的预告播放时长。
优选的,归一化处理当前用户在每个所述节目标签的所述节目指标参数相对于全部用户的相对值,得到对应的归一化值,包括:
获取收看每个所述节目标签下的节目对应的全部用户的个数,以及每个节目标签下各个所述用户对应的节目指标参数;
确定当前所述用户在每个所述节目标签的所述节目指标参数相对于全部用户的相对值;
基于最大值最小值归一化的计算方法和所述各个用户对应的节目指标参数,获得当前所述用户在每个所述节目标签的所述节目指标参数收看天数相对于全部用户的相对值,将得到的各个相对值作为各自对应节目标签下的节目指标参数的归一化值。
优选的,若所述节目指标参数包括:收视时长、收看完成率、节目数以及收看天数;则所述加权计算当前所述用户对应的每个所述节目标签下的各节目指标参数对应的归一化值,得到当前所述用户对每个所述节目标签对应的节目的兴趣度,包括:
获取当前所述用户对应的每个所述节目标签下的各所述收视时长、所述收看完成率、所述节目数以及所述收看天数对应的归一化值;
针对每一所述节目标签,基于H=aT′+bP′+cR′+dD′,得到当前所述用户对每一所述节目标签对应的节目的兴趣度H,其中,T′为当前节目标签下所述收视时长对应的归一化值,P′为当前节目标签下所述节目数对应的归一化值,R′为当前节目标签下所述收看完成率对应的归一化值,D′为当前节目标签下所述收看天数对应的归一化值,a,b,c,d为预先分配的权重值,且a+b+c+d=1。
本发明第二方面公开了一种用户兴趣度的评价***,包括:
预处理单元,用于建立兴趣标签库,所述兴趣标签库包括节目标签,以及所述节目标签下的各个节目参数,所述节目标签包括节目所属类别;
指标计算单元,用于基于所述节目标签计算用户在各节目标签上的节目指标参数;
归一化处理单元,用于归一化处理当前所述用户在每个所述节目标签下的节目指标参数相对于全部用户的相对值,得到各个所述节目指标参数对应的归一化值;
兴趣度计算单元,用于加权计算当前所述用户对应的每个所述节目标签下的各个所述节目指标参数对应的归一化值,得到当前所述用户对每个所述节目标签对应的节目的兴趣度。
本发明第三方面公开了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行如本发明第一方面公开的用户兴趣度的评价方法。
本发明第四方面公开了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行如本发明第一方面公开的用户兴趣度的评价方法。
经由上述技术方案可知,本发明公开一种用户兴趣度的评价方法和***,通过建立兴趣标签库,兴趣标签库包括节目标签,以及节目标签下的各个节目参数,节目标签包括节目所属类别;基于节目标签计算用户在各节目标签上的节目指标参数;归一化处理当前用户在每个节目标签下的节目指标参数不相对于全部用户的相对值,得到各个节目指标参数对应的归一化值;加权计算当前用户对应的每个节目标签下的各个节目指标参数对应的归一化值,得到当前用户对每个节目标签对应的节目的兴趣度。通过上述公开的用户兴趣度的评价方法,得到的兴趣度在用户数上近似服从高斯分布,且得到的兴趣度的大小可以真实的反映用户对该节目标签下的节目的兴趣度,且上述计算基于预先建立的节目标签上的节目指标参数得到,过程简洁。因此,通过本发明公开的用户兴趣度的评价方法能够快速且准确的得到用户对各个节目标签的兴趣度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例公开的一种用户兴趣度的评价方法的流程示意图;
图2为本发明实施例公开的归一化处理的流程示意图;
图3为本发明实施例公开的一种用户兴趣度的评价***的结构示意图;
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
由背景技术可知,现有技术中,主要基于主题模型对不同用户在不同时段收视兴趣偏好的概率值进行计算。但是,主题模型在计算用户兴趣度时,复杂度高,通用性差,且主题模型训练出的主题较为抽象,解释性不强,不同主题模型之间也存在一定的差异,导致获得用户兴趣度不仅过程复杂,且不准确。因此,本发明公开了一种用户兴趣度的评价方法,以实现快速得到准确的用户兴趣度的目的。
如图1所示,为本发明实施例公开的一种用户兴趣度的评价方法的流程示意图。
步骤S101:建立兴趣标签库,所述兴趣标签库包括节目标签,以及所述节目标签下的各个节目参数,所述节目标签包括节目所属类别。
执行步骤S101建立兴趣标签库的过程中,主要是按照节目所属类别对各个节目进行分类,并建立对应的节目标签。且在划分后的节目标签下包含各个的节目参数。
需要说明的是,节目所属类别指按照内容划分的类别和/或按照节目题材划分的类别,所述按照内容划分的类别包括:剧情、喜剧或真人秀,所述按照节目题材划分的类别包括:电视剧、电影或综艺。当然,本发明实施例对于上述类别中所包含的内容并不仅限于,如按照内容划分的类别还可以包括亲子类、教育类等等。如按照节目题材划分的类别中还可以包括动漫、音乐等等。
进一步的,本发明实施例对于节目所属类别并不仅限于以上几种,还可以包含其他类别等等,如按照节目时长划分的类别包括:短视频和长视频。
需要说明的是,节目参数包括节目名称和节目自身的时长。进一步的,还可以包括用户每次收看该节目的收看时长、时间段等等内容。
优选的,基于节目标签构建的兴趣标签库,可以通过将已有的节目的标签映射到所构建的兴趣标签库中。
需要说明的是,每一个节目参数里可以包含多个节目所属类别,所构建的兴趣标签库中的对应关系,例如:人民的名义:电视剧/剧情;我是歌手:综艺/选秀等等。
步骤S102:基于所述节目标签计算用户在各节目标签上的节目指标参数。
在执行步骤S102进行节目指标参数的计算时,在本发明实施例中可以计算的节目指标参数的可以预先进行设置。该节目指标参数包括:收视时长、收看完成率、节目数以及收看天数等等,但是本发明实施例并不限定仅具有以上四种节目指标参数。
需要说明的是,在具体进行计算节目指标参数的过程中,至少需要计算上述四种节目指标参数中的两种节目指标参数,但并不设上限。
步骤S103:归一化处理当前所述用户在每个所述节目标签下的节目指标参数相对于全部用户的相对值,得到各个所述节目指标参数对应的归一化值。
在执行步骤S103的过程中,计算用户在每个节目标签下的节目指标参数相对于每个节目标签下的全部用户的该节目指标参数的相对情况。
具体过程如图2所示,包括:
步骤S201:获取收看每个所述节目标签下的节目对应的全部用户的个数,以及每个节目标签下各个用户对应的节目指标参数。
步骤S202:确定当前所述用户在每个所述节目标签的所述节目指标参数相对于全部用户的相对值。
步骤S203:基于最大值最小值归一化的计算方法和所述各个用户对应的节目指标参数,获得当前所述用户在每个所述节目标签的所述节目指标参数收看天数相对于全部用户的相对值,将得到的各个相对值作为各自对应节目标签下的节目指标参数的归一化值。
基于上述具体实现过程,这里举例进行说明:
当节目标签为电视剧,节目指标参数为收视时长,收看过该电视剧的用户总数总共有5个,包括当前需要计算的用户。分别获取5个用户收看电视剧的收视时长为:20分钟、30分钟、45分钟、15分钟和60分钟。则对当前需要计算的用户(第一个用户)的收视时长进行归一化处理,得到的收视时长的归一化值为:(20-15)/(60-15)=0.11。
其他的节目指标参数的归一化也采用该种最大值最小值的归一化方式进行计算。将节目指标参数都归一化至[0,1]区间内。更利于后续的兴趣度的评价。
步骤S104:加权计算当前所述用户对应的每个所述节目标签下的各个所述节目指标参数对应的归一化值,得到当前所述用户对每个所述节目标签对应的节目的兴趣度。
在执行步骤S104的过程中,对得到的当前所述用户对应的每个节目标签下的各个节目指标参数对应的归一化值进行加权计算。具体各个节目指标参数对应的归一化值所加的权重可以根据业务类型进行调整,也可以预先进行设置。即根据实际情况为不同的节目指标参数对应的归一化值分配不同的权重,但是需要满足各个节目指标参数对应的归一化值所加的权重的总和为1。
进一步,需要说明的是,在进行加权计算的过程中,可以删选多个节目指标参数对应的归一化值进行加权计算,并不需要全部的。
本发明实施例通过建立兴趣标签库,兴趣标签库包括节目标签,以及节目标签下的各个节目参数,节目标签包括节目所属类别;基于节目标签计算用户在各节目标签上的节目指标参数;归一化处理当前用户在每个节目标签下的节目指标参数不相对于全部用户的相对值,得到各个节目指标参数对应的归一化值;加权计算当前用户对应的每个节目标签下的各个节目指标参数对应的归一化值,得到当前用户对每个节目标签对应的节目的兴趣度。通过上述公开的用户兴趣度的评价方法,得到的兴趣度在用户数上近似服从高斯分布,且得到的兴趣度的大小可以真实的反映用户对该节目标签下的节目的兴趣度,且上述计算基于预先建立的节目标签上的节目指标参数得到,过程简洁。因此,通过本发明公开的用户兴趣度的评价方法能够快速且准确的得到用户对各个节目标签的兴趣度。
基于上述本发明实施例公开的用户兴趣度的评价方法,在执行步骤S102中计算用户在各节目标签上的节目指标参数的过程中,不同的节目指标参数,计算方式不同,这里举例说明。
若所述节目指标参数包括收视时长,则基于所述节目标签计算用户在各节目标签上的节目指标参数,具体过程包括:
首先,确定每一节目标签。
然后,获取用户收看每一所述节目标签下的节目的时长T。
其中,公式(1)中的ti表示用户每次收看当前节目标签下的节目的时长,i和n表示用户在某标签下收看的次数,i大于等于1,n大于i。
若所述节目指标参数包括节目数,则基于所述节目标签计算用户在各节目标签上的节目指标参数,具体过程包括:
首先,确定每一节目标签。
然后,确定每一节目标签下用户收看的不同的节目,该不同的节目可通过节目名称或者节目主题进行确定,其中,具有相同或相似的节目名称或节目主题的节目,节目数P记为1个。
例如,确定节目标签为综艺,以及该节目标签下用户所收看的节目包括:爸爸去哪儿1和爸爸去哪儿2。因节目名称相似,则用户在节目标签为综艺下所收看的节目数为1。
例如,确定节目标签为综艺,以及该节目标签下用户所收看的节目包括:爸爸去哪儿1、爸爸去哪儿2和我是歌手3。因爸爸去哪儿1和爸爸去哪儿2节目名称相似,则记为1个。我是歌手3则单独记为1个。因此,该用户在节目标签为综艺下所收看的节目数为2。
若所述节目指标参数包括:收看完成率,则基于所述节目标签计算用于在各节目标签上的节目指标参数,具体过程包括:
首先,确定每一节目标签。
然后,获取用户在所述节目标签下收看各个节目的次数,每一次的收看时长和各个节目的原始时长,得到收看完成率R。
其中,公式(2)中的ti表示用户每次收看当前节目标签下的节目的时长,,i和n表示用户在某标签下收看的次数,i大于等于1,n大于i,pi表示用户每次收看当前节目标签下的节目的预告播放时长。
例如:确定一节目标签为电视剧,且用户在电视剧标签上收看了3次人民的名义。且收看人民的名义第一集的时长为20分钟,收看人民的名义第二集的时长为40分钟,收看军师联盟第五集的时长为20分钟。其中,人民的名义的总时长为50分钟,军师联盟的总时长为45分钟。基于上述公式(2),可以得到该节目标签下用户的收看节目的完成率为:(20/50+40/50+20/45)/3=0.55。
若所述节目指标参数包括收看天数,则基于所述节目标签计算用户在各节目标签上的节目指标参数,具体过程包括:
首先,确定每一节目标签。
然后,确定每一节目标签下用户收看过的天数D。
例如,节目标签为电视剧,用户有3天看过电视剧,则用户在节目标签为电视剧上的收看天数为3。
进一步的,基于上述确定的节目标签参数,执行上述归一化处理的步骤,分别得到收视时长对应的归一化值T′,节目数对应的归一化值P′,收看完成率对应的归一化值R′,收看天数对应的归一化值D′。
进一步的,基于上述归一化后的收视时长、收看完成率、节目数以及收看天数,则所述加权计算当前用户对应的每个所述节目标签下的各节目指标参数对应的归一化值,得到当前用户对每个所述节目标签对应的节目的兴趣度,具体过程包括:
首先,获取当前所述用户对应的每个所述节目标签下的各所述收视时长、所述收看完成率、所述节目数以及所述收看天数对应的归一化值;
然后,针对每一所述节目标签,基于公式(3)进行加权计算,得到当前所述用户对每一所述节目标签对应的节目的兴趣度H。
H=aT′+bP′+cR′+dD′ (3)
其中,T′为当前节目标签下所述收视时长对应的归一化值,P′为当前节目标签下所述节目数对应的归一化值,R′为当前节目标签下所述收看完成率对应的归一化值,D′为当前节目标签下所述收看天数对应的归一化值,a,b,c,d为预先分配的权重值,且a+b+c+d=1。
本发明实施例通过上述公开的用户兴趣度的评价方法,基于预先按照兴趣建立的各节目标签计算用户在各节目标签上的节目指标参数,并对得到的每个节目标签下的节目指标参数分别进行归一化处理,最终得到以归一化处理后的节目指标参数的加权结果作为各自对应的节目标签的用户的兴趣度。
基于上述本发明实施例公开的用户兴趣度的评价方法,本发明实施例还对应公开了一种用户兴趣度的评价***,如图3所示,该用户兴趣度的评价***300主要包括:
预处理单元301,用于建立兴趣标签库,所述兴趣标签库包括节目标签,以及所述节目标签下的各个节目参数,所述节目标签包括节目所属类别。
指标计算单元302,用于基于所述节目标签计算用户在各节目标签上的节目指标参数。
归一化处理单元303,用于归一化处理当前所述用户在每个所述节目标签下的节目指标参数相对于全部用户的相对值,得到各个所述节目指标参数对应的归一化值。
兴趣度计算单元304,用于加权计算当前所述用户对应的每个所述节目标签下的各个所述节目指标参数对应的归一化值,得到当前所述用户对每个所述节目标签对应的节目的兴趣度。
进一步的,该指标计算单元302中包括:
时长计算模块,用于确定每一节目标签;获取用户收看每一所述节目标签下的节目的时长其中,ti表示用户每次收看当前节目标签下的节目的时长,i和n表示用户在某标签下收看的次数,i大于等于1,n大于i。
和/或,
收看完成率计算模块,用于确定每一节目标签;获取所述用户在所述节目标签下收看各个节目的次数,每一次的收看时长和各个节目的原始时长,得到收看完成率其中,ti表示用户每次收看当前节目标签下的节目的时长,,i和n表示用户在某标签下收看的次数,i大于等于1,n大于i,pi表示用户每次收看当前节目标签下的节目的预告播放时长。
和/或,
节目数计算模块,用于确定所述用户在每一节目标签下所收看的节目数,其中,相同节目主题的节目记为1个。
和/或,
收看天数计算模块,用于确定所述用户在每一节目标签下所收看过的天数。
进一步的,该兴趣度计算单元304中包括:
获取模块,用于获取当前所述用户对应的每个所述节目标签下的各所述收视时长、所述收看完成率、所述节目数以及所述收看天数对应的归一化值;
兴趣度计算模块,用于针对每一所述节目标签,基于H=aT′+bP′+cR′+dD′,得到当前所述用户对每一所述节目标签对应的节目的兴趣度H,其中,T′为当前节目标签下所述收视时长对应的归一化值,P′为当前节目标签下所述节目数对应的归一化值,R′为当前节目标签下所述收看完成率对应的归一化值,D′为当前节目标签下所述收看天数对应的归一化值,a,b,c,d为预先分配的权重值,且a+b+c+d=1。
上述本发明实施例公开的用户兴趣度的评价***中的各个单元和模块具体的原理和执行过程,与上述本发明实施例公开的用户兴趣度的评价方法相同,可参见上述本发明实施例公开的用户兴趣度的评价方法中相应的部分,这里不再进行赘述。
基于上述本发明实施例公开的用户兴趣度的评价***,上述各个单元和模块可以通过一种由处理器和存储器构成的硬件设备实现。具体为:上述各个单元和模块作为程序单元存储于存储器中,由处理器执行存储在存储器中的上述程序单元来实现用户兴趣度的评价。
其中,处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来实现对用户兴趣度的评价。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
进一步的,本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述用户兴趣度的评价方法。
进一步的,本发明实施例提供了一种设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:建立兴趣标签库,所述兴趣标签库包括节目标签,以及所述节目标签下的各个节目参数,所述节目标签包括节目所属类别;基于所述节目标签计算用户在各节目标签上的节目指标参数;归一化处理当前用户在每个所述节目标签下的节目指标参数相对于全部用户的相对值,得到各个所述节目指标参数对应的归一化值;加权计算当前用户对应的每个所述节目标签下的各个所述节目指标参数对应的归一化值,得到当前用户对每个所述节目标签对应的节目的兴趣度。
其中,若所述节目指标参数包括收视时长,则基于所述节目标签计算用户在各节目标签上的节目指标参数,包括:确定每一节目标签;获取用户收看每一所述节目标签下的节目的时长其中,ti表示用户每次收看当前节目标签下的节目的时长,i和n表示用户在某标签下收看的次数,i大于等于1,n大于i。
若所述节目指标参数包括:收看完成率,则基于所述节目标签计算用于在各节目标签上的节目指标参数,包括:确定每一节目标签;获取用户在所述节目标签下收看各个节目的次数,每一次的收看时长和各个节目的原始时长,得到收看完成率其中,ti表示用户每次收看当前节目标签下的节目的时长,,i和n表示用户在某标签下收看的次数,i大于等于1,n大于i,pi表示用户每次收看当前节目标签下的节目的预告播放时长。
其中,归一化处理当前用户在每个所述节目标签的所述节目指标参数相对于全部用户的相对值,得到对应的归一化值,包括:获取收看每个所述节目标签下的节目对应的全部用户的个数,以及每个节目标签下各个用户对应的节目指标参数;确定当前用户在每个所述节目标签的所述节目指标参数相对于全部用户的相对值;基于最大值最小值归一化的计算方法和所述各个用户对应的节目指标参数,获得当前用户在每个所述节目标签的所述节目指标参数收看天数相对于全部用户的相对值,将得到的各个相对值作为各自对应节目标签下的节目指标参数的归一化值。
其中,若所述节目指标参数包括:收视时长、收看完成率、节目数以及收看天数;则所述加权计算当前用户对应的每个所述节目标签下的各节目指标参数对应的归一化值,得到当前用户对每个所述节目标签对应的节目的兴趣度,包括:获取当前用户对应的每个所述节目标签下的各所述收视时长、所述收看完成率、所述节目数以及所述收看天数对应的归一化值;针对每一所述节目标签,基于H=aT′+bP′+cR′+dD′,得到当前用户对每一所述节目标签对应的节目的兴趣度H,其中,T′为当前节目标签下所述收视时长对应的归一化值,P′为当前节目标签下所述节目数对应的归一化值,R′为当前节目标签下所述收看完成率对应的归一化值,D′为当前节目标签下所述收看天数对应的归一化值,a,b,c,d为预先分配的权重值,且a+b+c+d=1。
本发明实施例中公开的设备可以是服务器、PC、PAD、手机等。
进一步的,本发明实施例还提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述用户兴趣度的评价方法。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:建立兴趣标签库,所述兴趣标签库包括节目标签,以及所述节目标签下的各个节目参数,所述节目标签包括节目所属类别;基于所述节目标签计算用户在各节目标签上的节目指标参数;归一化处理当前用户在每个所述节目标签下的节目指标参数相对于全部用户的相对值,得到各个所述节目指标参数对应的归一化值;加权计算当前用户对应的每个所述节目标签下的各个所述节目指标参数对应的归一化值,得到当前用户对每个所述节目标签对应的节目的兴趣度。
其中,若所述节目指标参数包括收视时长,则基于所述节目标签计算用户在各节目标签上的节目指标参数,包括:确定每一节目标签;获取用户收看每一所述节目标签下的节目的时长其中,ti表示用户每次收看当前节目标签下的节目的时长,i和n表示用户在某标签下收看的次数,i大于等于1,n大于i。
若所述节目指标参数包括:收看完成率,则基于所述节目标签计算用于在各节目标签上的节目指标参数,包括:确定每一节目标签;获取用户在所述节目标签下收看各个节目的次数,每一次的收看时长和各个节目的原始时长,得到收看完成率其中,ti表示用户每次收看当前节目标签下的节目的时长,,i和n表示用户在某标签下收看的次数,i大于等于1,n大于i,pi表示用户每次收看当前节目标签下的节目的预告播放时长。
其中,归一化处理当前用户在每个所述节目标签的所述节目指标参数相对于全部用户的相对值,得到对应的归一化值,包括:获取收看每个所述节目标签下的节目对应的全部用户的个数,以及每个节目标签下各个用户对应的节目指标参数;确定当前用户在每个所述节目标签的所述节目指标参数相对于全部用户的相对值;基于最大值最小值归一化的计算方法和所述各个用户对应的节目指标参数,获得当前用户在每个所述节目标签的所述节目指标参数收看天数相对于全部用户的相对值,将得到的各个相对值作为各自对应节目标签下的节目指标参数的归一化值。
其中,若所述节目指标参数包括:收视时长、收看完成率、节目数以及收看天数;则所述加权计算当前用户对应的每个所述节目标签下的各节目指标参数对应的归一化值,得到当前用户对每个所述节目标签对应的节目的兴趣度,包括:获取当前用户对应的每个所述节目标签下的各所述收视时长、所述收看完成率、所述节目数以及所述收看天数对应的归一化值;针对每一所述节目标签,基于H=aT′+bP′+cR′+dD′,得到当前用户对每一所述节目标签对应的节目的兴趣度H,其中,T′为当前节目标签下所述收视时长对应的归一化值,P′为当前节目标签下所述节目数对应的归一化值,R′为当前节目标签下所述收看完成率对应的归一化值,D′为当前节目标签下所述收看天数对应的归一化值,a,b,c,d为预先分配的权重值,且a+b+c+d=1。
本领域内的技术人员应明白,本申请的实施例可提供为方法、***、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、***或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (10)
1.一种用户兴趣度的评价方法,其特征在于,包括:
建立兴趣标签库,所述兴趣标签库包括节目标签,以及所述节目标签下的各个节目参数,所述节目标签包括节目所属类别;
基于所述节目标签计算用户在各节目标签上的节目指标参数;
归一化处理当前所述用户在每个所述节目标签下的节目指标参数相对于全部用户的相对值,得到各个所述节目指标参数对应的归一化值;
加权计算当前所述用户对应的每个所述节目标签下的各个所述节目指标参数对应的归一化值,得到当前所述用户对每个所述节目标签对应的节目的兴趣度。
2.根据权利要求1所述的方法,其特征在于,所述节目参数至少包括:节目名称和节目自身的时长;
所述节目所属类别至少包括:按照内容划分的类别和/或按照节目题材划分的类别,所述按照内容划分的类别包括:剧情、喜剧或真人秀,所述按照节目题材划分的类别包括:电视剧、电影或综艺。
3.根据权利要求1所述的方法,其特征在于,所述节目指标参数包括:收视时长、收看完成率、节目数以及收看天数。
4.根据权利要求1所述的方法,其特征在于,若所述节目指标参数包括收视时长,则基于所述节目标签计算用户在各节目标签上的节目指标参数,包括:
确定每一节目标签;
获取所述用户收看每一所述节目标签下的节目的时长
其中,ti表示所述用户每次收看当前节目标签下的节目的时长,i和n表示所述用户在某标签下收看的次数,i大于等于1,n大于i。
5.根据权利要求1中任意一项所述的方法,其特征在于,若所述节目指标参数包括:收看完成率,则基于所述节目标签计算用于在各节目标签上的节目指标参数,包括:
确定每一节目标签;
获取所述用户在所述节目标签下收看各个节目的次数,每一次的收看时长和各个节目的原始时长,得到收看完成率
其中,ti表示所述用户每次收看当前节目标签下的节目的时长,,i和n表示所述用户在某标签下收看的次数,i大于等于1,n大于i,pi表示用户每次收看当前节目标签下的节目的预告播放时长。
6.根据权利要求1-5中任意一项所述的方法,其特征在于,归一化处理当前用户在每个所述节目标签的所述节目指标参数相对于全部用户的相对值,得到对应的归一化值,包括:
获取收看每个所述节目标签下的节目对应的全部用户的个数,以及每个节目标签下各个所述用户对应的节目指标参数;
确定当前所述用户在每个所述节目标签的所述节目指标参数相对于全部用户的相对值;
基于最大值最小值归一化的计算方法和所述各个用户对应的节目指标参数,获得当前所述用户在每个所述节目标签的所述节目指标参数收看天数相对于全部用户的相对值,将得到的各个相对值作为各自对应节目标签下的节目指标参数的归一化值。
7.根据权利要求1-5中任意一项所述的方法,其特征在于,若所述节目指标参数包括:收视时长、收看完成率、节目数以及收看天数;则所述加权计算当前所述用户对应的每个所述节目标签下的各节目指标参数对应的归一化值,得到当前所述用户对每个所述节目标签对应的节目的兴趣度,包括:
获取当前所述用户对应的每个所述节目标签下的各所述收视时长、所述收看完成率、所述节目数以及所述收看天数对应的归一化值;
针对每一所述节目标签,基于H=aT′+bP′+cR′+dD′,得到当前所述用户对每一所述节目标签对应的节目的兴趣度H,其中,T′为当前节目标签下所述收视时长对应的归一化值,P′为当前节目标签下所述节目数对应的归一化值,R′为当前节目标签下所述收看完成率对应的归一化值,D′为当前节目标签下所述收看天数对应的归一化值,a,b,c,d为预先分配的权重值,且a+b+c+d=1。
8.一种用户兴趣度的评价***,其特征在于,包括:
预处理单元,用于建立兴趣标签库,所述兴趣标签库包括节目标签,以及所述节目标签下的各个节目参数,所述节目标签包括节目所属类别;
指标计算单元,用于基于所述节目标签计算用户在各节目标签上的节目指标参数;
归一化处理单元,用于归一化处理当前所述用户在每个所述节目标签下的节目指标参数相对于全部用户的相对值,得到各个所述节目指标参数对应的归一化值;
兴趣度计算单元,用于加权计算当前所述用户对应的每个所述节目标签下的各个所述节目指标参数对应的归一化值,得到当前所述用户对每个所述节目标签对应的节目的兴趣度。
9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行如权利要求1-7中任一项所述的用户兴趣度的评价方法。
10.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行如权利要求1-7中任一项所述的用户兴趣度的评价方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710888524.2A CN109561350B (zh) | 2017-09-27 | 2017-09-27 | 用户兴趣度的评价方法和*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710888524.2A CN109561350B (zh) | 2017-09-27 | 2017-09-27 | 用户兴趣度的评价方法和*** |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109561350A true CN109561350A (zh) | 2019-04-02 |
CN109561350B CN109561350B (zh) | 2021-06-29 |
Family
ID=65863917
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710888524.2A Active CN109561350B (zh) | 2017-09-27 | 2017-09-27 | 用户兴趣度的评价方法和*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109561350B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111858564A (zh) * | 2019-04-28 | 2020-10-30 | 腾讯科技(深圳)有限公司 | 数据处理方法、业务处理方法、装置、终端及存储介质 |
CN113590926A (zh) * | 2020-04-30 | 2021-11-02 | 北京爱笔科技有限公司 | 用户兴趣的识别方法、装置、设备及计算机可读介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008129879A1 (ja) * | 2007-04-18 | 2008-10-30 | Panasonic Corporation | デジタル放送受信装置およびデジタル放送受信方法 |
US20090328105A1 (en) * | 2008-06-27 | 2009-12-31 | Guideworks, Llc | Systems and methods for ranking assets relative to a group of viewers |
CN102263992A (zh) * | 2011-08-08 | 2011-11-30 | 上海文广互动电视有限公司 | 基于用户收视记录的节目推荐度估计方法 |
CN103686236A (zh) * | 2013-11-19 | 2014-03-26 | 乐视致新电子科技(天津)有限公司 | 推荐视频资源的方法及*** |
CN104935970A (zh) * | 2015-07-09 | 2015-09-23 | 三星电子(中国)研发中心 | 进行电视内容推荐的方法及电视客户端 |
CN105095516A (zh) * | 2015-09-16 | 2015-11-25 | 中国传媒大学 | 基于谱聚类集成的广播电视用户分群***及方法 |
CN106802956A (zh) * | 2017-01-19 | 2017-06-06 | 山东大学 | 一种基于加权异构信息网络的电影推荐方法 |
CN107113466A (zh) * | 2014-06-12 | 2017-08-29 | 慧与发展有限责任合伙企业 | 向用户推荐项目 |
-
2017
- 2017-09-27 CN CN201710888524.2A patent/CN109561350B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008129879A1 (ja) * | 2007-04-18 | 2008-10-30 | Panasonic Corporation | デジタル放送受信装置およびデジタル放送受信方法 |
US20090328105A1 (en) * | 2008-06-27 | 2009-12-31 | Guideworks, Llc | Systems and methods for ranking assets relative to a group of viewers |
CN102263992A (zh) * | 2011-08-08 | 2011-11-30 | 上海文广互动电视有限公司 | 基于用户收视记录的节目推荐度估计方法 |
CN103686236A (zh) * | 2013-11-19 | 2014-03-26 | 乐视致新电子科技(天津)有限公司 | 推荐视频资源的方法及*** |
CN107113466A (zh) * | 2014-06-12 | 2017-08-29 | 慧与发展有限责任合伙企业 | 向用户推荐项目 |
CN104935970A (zh) * | 2015-07-09 | 2015-09-23 | 三星电子(中国)研发中心 | 进行电视内容推荐的方法及电视客户端 |
CN105095516A (zh) * | 2015-09-16 | 2015-11-25 | 中国传媒大学 | 基于谱聚类集成的广播电视用户分群***及方法 |
CN106802956A (zh) * | 2017-01-19 | 2017-06-06 | 山东大学 | 一种基于加权异构信息网络的电影推荐方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111858564A (zh) * | 2019-04-28 | 2020-10-30 | 腾讯科技(深圳)有限公司 | 数据处理方法、业务处理方法、装置、终端及存储介质 |
CN113590926A (zh) * | 2020-04-30 | 2021-11-02 | 北京爱笔科技有限公司 | 用户兴趣的识别方法、装置、设备及计算机可读介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109561350B (zh) | 2021-06-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105898420B (zh) | 一种视频推荐方法、装置以及电子设备 | |
TWI777004B (zh) | 營銷資訊的推送設備、裝置及儲存媒體 | |
CN110012302A (zh) | 一种网络直播监测方法及装置、数据处理方法 | |
CN108537568A (zh) | 一种信息推荐方法和装置 | |
CN109600345A (zh) | 异常数据流量检测方法及装置 | |
CN104506894A (zh) | 多媒体资源评估方法及其装置 | |
CN106846094A (zh) | 一种基于已安装应用来推荐应用信息的方法和装置 | |
CN104106040B (zh) | 图表缩放的视觉表示 | |
CN109903065A (zh) | 一种确定候选点的候选分值的方法和装置 | |
CN106033510A (zh) | 一种用户设备识别方法及*** | |
CN107967173A (zh) | 一种资源调度的方法、装置和*** | |
CN109978642A (zh) | 一种信息推荐方法、装置和通信设备 | |
CN109583921A (zh) | 广告预算获取方法、装置、存储介质及处理器 | |
CN110502665A (zh) | 视频处理方法和装置 | |
CN109242288A (zh) | 绩效数据匹配方法及*** | |
CN110458615A (zh) | 通过互联网信息测评客户满意度的方法及装置 | |
CN109598171A (zh) | 一种基于二维码的数据处理方法、装置及*** | |
CN109561350A (zh) | 用户兴趣度的评价方法和*** | |
CN110334013A (zh) | 决策引擎的测试方法、装置及电子设备 | |
CN108322819A (zh) | 预测用户行为的方法及装置 | |
CN109710410A (zh) | 一种互联网信息资源分配方法及装置 | |
Cerit et al. | Quality function deployment and its application on a smartphone design | |
Lasagni | Agglomeration economies and employment growth: New evidence from the information technology sector in Italy | |
CN109614548B (zh) | 基于业务用户数变化率的信息展示方法、装置及存储介质 | |
CN106658183B (zh) | 弹出视频登陆对话框的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 100080 No. 401, 4th Floor, Haitai Building, 229 North Fourth Ring Road, Haidian District, Beijing Applicant after: Beijing Guoshuang Technology Co.,Ltd. Address before: 100086 Beijing city Haidian District Shuangyushu Area No. 76 Zhichun Road cuigongfandian 8 layer A Applicant before: Beijing Guoshuang Technology Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |